Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/月之暗面/大模型后训练算法实习生(RL & Agent方向)
Moonshot AI logo
M
月之暗面 (Moonshot AI)

职位信息

北京市
无经验要求
实习生
仅现场办公
学历未注明
实习/见习

标签

强化学习数据处理数据管道算法优化大模型RLHF
💡

核心评价

前沿大模型技术实习,成长空间巨大,WLB预期一般,适合技术驱动型人才。

大模型后训练算法实习生(RL & Agent方向)

🤖 AI 估测:¥6K-12K

发布时间:6 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型后训练阶段的算法实习岗位,方向为强化学习(RL)与智能体(Agent)
你将参与实际的后训练流程,包括自动化挖掘模型缺陷数据、使用RLHF进行偏好对齐优化、搭建数据处理与评估的工程基建,以及设计数据增强策略来提升模型的泛化能力
这是一个强调工程实践与问题解决能力的实干型岗位

✓工作职责

挖数据:自动化找模型 worse cases,定位问题,提升模型能力
调偏好:用RLHF做preference优化,提升模型对齐效果
搞基建:搭后训练数据 pipeline,建质量评估工具
提泛化:设计数据增强策略,针对性补模型短板

⭐最低要求

相关专业背景,聪明且努力,持续迭代自己和模型,有技术追求
工程扎实(Python/数据处理),特别欢迎代码洁癖和竞赛选手
逻辑清晰,能从数据里挖问题,善于思考
能上手、肯折腾,主动push结果,欢迎实干派加入!

👍优先资格

做过相关项目or实习
搞过开源
强烈的motivation想搞点出色的工作
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

月之暗面 的其他在招职位

  • 资深系统开发工程师

    月之暗面

    北京市 · 仅现场办公

  • Infra 系统工程师 - 训练平台

    月之暗面

    北京市 · 仅现场办公

  • 资深后端工程师-商业化

    月之暗面

    北京市 · 仅现场办公

  • Agent Engineer / Agent 工程师

    月之暗面

    北京市 · 仅现场办公

  • API解决方案架构师

    月之暗面

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公