智谱的AI 院--多模态团队--多模态理解算法研究员-强化学习方向薪资是多少？

该职位薪资范围为 25k–40k（人民币/月）。

AI 院--多模态团队--多模态理解算法研究员-强化学习方向的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求硕士学历及初级经验工作经验。

🤖 AI 估测：¥25K-40K

发布时间：19 天前

这是一个专注于多模态大模型强化学习方向的算法研究员岗位

你将加入智谱AI的多模态团队，负责视觉语言模型（VLM）在学科解题方向上的训练优化，特别是通过强化学习（如RLHF/DPO）和人类偏好学习来提升模型的对齐与推理能力

核心工作涉及数据处理、模型训练及前沿技术探索

学科解题方向，负责VLM的混合SFT/RL训练优化及RL训练的数据处理，通过人类偏好学习提升多模态大模型的对齐和推理能力

统招硕士及以上学历，计算机科学/机器学习/人工智能相关专业

0-3年工作经验，在NLP/CV/RL等至少一个AI领域有过深入的研究经历

熟悉主流的多模态大模型，能持续跟进学术界和工业界的最新研究和产品

熟悉强化学习，有RLHF/DPO训练经验者优先

熟悉Linux,Python,Pytorch和Transformer，了解分布式训练框架如Deepspeed,Megatron-LM等

了解对多模态数据（如文本、图像、视频、音频等）的基本处理，能够独立完成数据收集、清洗和构造的pipeline

有RLHF/DPO训练经验者优先

AI 院--多模态团队--多模态理解算法研究员-强化学习方向

🤖 AI 估测：¥25K-40K

发布时间：19 天前