Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/月之暗面/RL Infra 研究工程师
Moonshot AI logo
M
月之暗面 (Moonshot AI)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch强化学习多模态性能调试Megatron-LMvLLM大模型训练Rl Infra
💡

核心评价

前沿AI大模型核心基础设施岗,技术成长性极佳,薪资竞争力强,但需现场办公且工作模式未明确。

RL Infra 研究工程师

🤖 AI 估测:¥45K-80K

发布时间:6 天前

立即应聘

ℹ️关于这个职位

该职位是月之暗面公司的RL Infra研究工程师,主要负责开发和维护公司内部的强化学习后训练框架,以支持万亿参数大模型在推理、智能体等方向的文本与多模态训练
你将与训练推理引擎团队紧密合作,探索算法、框架与硬件的协同设计,致力于提升大规模强化学习训练的稳定性和效率
这是一个专注于AI基础设施前沿、技术挑战性高的核心研发岗位

✓工作职责

主要负责维护和开发Moonshot内部的强化学习后训练框架,支持万亿参数模型reasoning、agentic等方向的文本&多模态RL后训练
与训练推理引擎方向的团队合作,探索算法、框架、硬件的协同设计,提升大规模强化学习训练的稳定性和效率

⭐最低要求

有扎实的工程算法基础和工程实现能力,熟悉Python等语言,熟练掌握Pytorch等深度学习框架和常见性能调试/分析工具
对Megatron-LM/vLLM等主流训推引擎有深入的了解,对大模型RL训练中的实际问题(如训推不一致、Rollout长尾等)排查和解决有经验
有扎实的强化学习算法基础和实际RL训练经验

👍优先资格

有出色的开源项目经历(如为vLLM、VeRL等框架提交过重要PR)、对口的顶会发表者(如RL稳定性、环境scaling、长尾问题解决等Paper)优先
业界知名RL框架经验(如verl、roll、slime等) / 开源项目贡献者 / 顶会paper
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

月之暗面 的其他在招职位

  • 资深系统开发工程师

    月之暗面

    北京市 · 仅现场办公

  • Infra 系统工程师 - 训练平台

    月之暗面

    北京市 · 仅现场办公

  • 资深后端工程师-商业化

    月之暗面

    北京市 · 仅现场办公

  • Agent Engineer / Agent 工程师

    月之暗面

    北京市 · 仅现场办公

  • API解决方案架构师

    月之暗面

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公