Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/AutoGLM-强化学习工程师
GLM logo
G
智谱 (GLM)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

机器学习强化学习自然语言处理LLM算法优化大语言模型分布式训练智能体Pytorch/Tensorflow
💡

核心评价

前沿AI技术核心岗,成长空间巨大,薪资竞争力强,但工作地点和强度可能带来生活化挑战。

AutoGLM-强化学习工程师

🤖 AI 估测:¥35K-60K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大语言模型(LLM)强化学习算法研发与优化的前沿技术岗位
你将负责利用强化学习技术提升LLM智能体(如GUI/API Agent)的能力,涉及数据增强、奖励模型优化、策略迭代等核心工作
同时,你还需要探索离线强化学习、环境模型学习等前沿方向,并优化大规模分布式训练框架,以解决大模型能力提升中的实际难题

✓工作职责

负责 LLM 强化学习用于大模型智能体 GUI/API Agent 的模型整体优化,包括数据探索与增强、奖励模型优化、RL策略迭代及效果评估等,持续提升算法的效率与效果
强化学习技术前瞻探索,包括但不限于离线强化学习、环境模型学习、约束强化学习等方向
改进和完善大语言模型的强化学习的分布式工程框架,实现更高效的模型训练

⭐最低要求

扎实的算法基础,熟悉强化学习、自然语言处理和机器学习技术,对技术开发及应用有热情
具备RL算法优化和工程项目实践经验,在ICML、NeurIPS、ICLR、JMLR、ACL、KDD等顶级会议或期刊上发表过论文,或在RL应用相关的大型比赛中获得名次
了解 Agent 相关的前沿进展,并对于将强化学习应用在LLM Agent训练中感兴趣
良好的沟通能力和跨团队协作能力,能够梳理繁杂的工作并建立有效机制,推动上下游配合完成目标

👍优先资格

有大语言模型算法优化和大规模分布式RL框架优化经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公