Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/AI院-GLM团队-后训练 RLHF 算法工程师(26届校招)
GLM logo
G
智谱 (GLM)

职位信息

北京市
无经验要求
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

NLPPyTorch强化学习大语言模型RLHFHuggingFaceMegatron并行训练
💡

核心评价

顶尖AI公司核心团队校招,技术前沿成长性极佳,薪资竞争力强,但需现场办公。

AI院-GLM团队-后训练 RLHF 算法工程师(26届校招)

🤖 AI 估测:¥25K-35K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个面向2026届毕业生的校招算法工程师岗位,专注于大语言模型的后训练阶段,特别是RLHF(人类反馈强化学习)方向
你将负责优化对齐数据、探索强化学习算法,并参与构建业内领先的后训练技术栈,以提升GLM系列大模型的生成质量和稳定性

✓工作职责

对齐数据优化
包括针对模型特定能力进行数据构造、筛选和优化,特定领域(如指令遵循、逻辑性、角色扮演)等数据筛选和合成
对齐数据的质量和多样性控制等
后训练扩展性:探索模型如何通过思维链推理,在“通用领域”的任务上取得更优的效果
强化学习算法优化:提升后训练 scaling 性能
多目标奖励模型优化
生成式奖励模型
过程监督奖励模型
对齐范式探索:结合 RLHF、RLAIF、self-improve 等进行训练优化探索

⭐最低要求

2026届毕业,自然语言处理、机器学习、人工智能、软件工程等相关专业,硕士及以上学历
较强的算法开发能力,熟悉常用的机器学习、深度学习算法
熟练使用Pytorch、Huggingface、Megatron等框架
对Transformer的架构有较为深入的理解,了解Transformer的各种变体,有相关的研究经验者优先
具备优秀的代码能力和基础算法功底,有较为丰富的工程经验,有大规模训练经验或大规模数据处理经验

👍优先资格

在ACL,NeurIPS,ICLR,EMNLP,ICML等顶级会议或期刊上发表过论文者优先
熟悉并行训练框架,有多机多卡训练经验者优先
熟悉大模型预训练 / SFT / RL 者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公