智谱的AutoGLM-强化学习工程师薪资是多少？

该职位薪资范围为 35k–60k（人民币/月）。

AutoGLM-强化学习工程师的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-60K

发布时间：19 天前

这是一个专注于大语言模型（LLM）强化学习算法研发与优化的前沿技术岗位

你将负责利用强化学习技术提升LLM智能体（如GUI/API Agent）的能力，涉及数据增强、奖励模型优化、策略迭代等核心工作

同时，你还需要探索离线强化学习、环境模型学习等前沿方向，并优化大规模分布式训练框架，以解决大模型能力提升中的实际难题

负责 LLM 强化学习用于大模型智能体 GUI/API Agent 的模型整体优化，包括数据探索与增强、奖励模型优化、RL策略迭代及效果评估等，持续提升算法的效率与效果

强化学习技术前瞻探索，包括但不限于离线强化学习、环境模型学习、约束强化学习等方向

改进和完善大语言模型的强化学习的分布式工程框架，实现更高效的模型训练

扎实的算法基础，熟悉强化学习、自然语言处理和机器学习技术，对技术开发及应用有热情

具备RL算法优化和工程项目实践经验，在ICML、NeurIPS、ICLR、JMLR、ACL、KDD等顶级会议或期刊上发表过论文，或在RL应用相关的大型比赛中获得名次

了解 Agent 相关的前沿进展，并对于将强化学习应用在LLM Agent训练中感兴趣

良好的沟通能力和跨团队协作能力，能够梳理繁杂的工作并建立有效机制，推动上下游配合完成目标

有大语言模型算法优化和大规模分布式RL框架优化经验优先

AutoGLM-强化学习工程师

🤖 AI 估测：¥35K-60K

发布时间：19 天前