Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

MiniMax logo
稀宇科技
大模型训练框架工程师(训练框架 & RL 方向)- 2027届
立即应聘

大模型训练框架工程师(训练框架 & RL 方向)- 2027届

发布于 大约 16 小时前

普通员工/个人贡献者

北京市 / 上海市
无经验要求
全职员工
仅现场办公
学历未注明
分布式系统
系统设计
PyTorch
GPU优化
Megatron-LM
SGLang
RLHF
大模型训练
Rl工程

AI 估算 · 30k–60k

大模型训练框架方向技术难度高,人才稀缺,薪资有竞争力,B轮初创通常16薪。

职位详情

关于这个职位

该职位负责设计和优化大模型训练基础设施,包括分布式训练框架和自研强化学习框架Forge

你需要与算法团队深度合作,解决万卡集群上的效率与稳定性问题,将前沿算法转化为工程实践
适合对系统优化和AI训练有热情的技术高手

最低要求

编程能力扎实,有清晰的系统设计思路,有强烈的工程品味和责任心

对 AI 训练系统或 RL 工程某一方向有深入理解,能独立发现问题、提出方案并推动落地
主动追踪算法与系统前沿,能将论文洞见转化为工程判断

工作职责

设计并优化大规模分布式训练框架,提升万卡集群的训练效率与稳定性

参与自研强化学习框架Forge的开发和迭代,推动RL训练流水线的改进
与算法团队紧密合作,从架构设计阶段介入,确保系统与算法协同优化

优先资格

对主流开源框架(PyTorch、Megatron-LM、SGLang 等)有深入了解,并有实质性贡献

有万卡规模训练系统或大规模 RLHF/RLVR 工程的实战经验

AI 洞察

优缺点分析

优点

  • 站在AI最前沿,参与顶尖大模型训练,技术影响力大
  • 公司B轮,发展空间大,与算法团队直接合作,学习曲线陡峭
  • 自研框架Forge在业界有广泛影响力,个人成长快
  • 技术难度极高,需要深厚的系统知识和持续学习新知识
  • 工作强度可能较大,涉及紧急问题排查和快速迭代
  • 竞争激烈,需要快速产出可量化的成果

缺点 / 挑战

  • 适合对分布式系统和AI训练有深度热情、敢于挑战顶尖技术难题、追求技术成长的工程师

角色解读

  • 成为大模型基础设施领域的专家,掌握最前沿的分布式训练和RL技术
  • 向系统架构师或技术负责人发展,主导关键技术决策
  • 有机会接触顶尖大模型和RL技术,建立行业影响力
  • 设计和优化大规模分布式训练框架,解决万卡集群上的效率与稳定性问题
  • 参与自研强化学习框架Forge的开发与迭代,推动RL训练流水线的改进
  • 与算法团队紧密协作,从架构设计阶段介入,确保系统与算法协同优化
  • 扎实的编程能力(C++/Python)和系统设计能力
  • 深入理解分布式训练系统、GPU性能优化或RL工程
  • 对前沿算法保持好奇,能将论文转化为工程实践

申请策略

  • 关注MiniMax的技术博客或开源项目,展示对其技术栈的了解
  • 准备一个系统设计或优化案例,在面试中体现深度思考和动手能力
  • 突出相关项目经验,如分布式训练、RL框架开发或大规模系统优化
  • 展示对开源框架(PyTorch、Megatron-LM等)的贡献或深入理解
  • 用具体案例体现解决复杂系统问题的能力,如性能调优、故障排查
  • 补充分布式系统理论知识,如一致性哈希、通信拓扑、并行策略
  • 实践GPU性能优化技术,如CUDA编程、NCCL调优
  • 熟悉RLHF/RLVR流程及其工程实现

面试指南

  • 使用STAR方法描述项目经历:情境、任务、行动、结果,突出量化成果
  • 从系统层面分析问题,分点说明解决方案,体现分层思维
  • 结合具体技术细节(如通信库、并行策略、memory优化)展示深度
  • 请描述一个你优化过的分布式训练系统的架构,遇到了哪些挑战?
  • 如何解决大规模训练中的通信瓶颈?请举例说明
  • 解释RLHF训练流程及其工程实现中的关键难点
  • 假如在万卡集群上出现训练不稳定,如何系统性地排查?
  • 复习分布式训练相关论文(如Megatron-LM、DeepSpeed)和技术博客

匹配度报告

68
综合匹配度

前沿大模型训练框架岗位,技术成长快,薪资有竞争力,但工作强度未知。

适合人群
适合追求技术成长、愿意接受高强度挑战、不畏辛苦的求职者
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展90
工作生活40
使命价值70

薪资福利匹配

70中等

薪资未在JD中披露,但B轮初创公司为吸引顶尖人才通常提供有竞争力的薪酬,不过稳定性稍弱。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

岗位涉及大模型训练和RL框架,技术前沿,成长空间极大,与算法团队紧密合作能快速积累经验。

技术前沿前沿/新兴技术
技术栈分布式系统、GPU优化、RL工程、PyTorch、Megatron-LM、SGLang
业务类型profit_center

工作生活匹配

40较低

要求现场办公,未提及远程或弹性工作,且大模型训练工作强度可能较高,WLB不明确。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

大模型是高速增长赛道,岗位技术影响力大,但社会价值中性,主要服务于商业目标。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

稀宇科技 的其他在招职位

  • 服务器运维实习生

    稀宇科技 · 北京市
    AI 估算 · 6k-10k
  • 智能交互体验设计师(AI产品方向)-实习

    稀宇科技 · 上海市
    AI 估算 · 6k-10k
  • 大模型产品经理-实习-Top Talent

    稀宇科技 · 北京市
    AI 估算 · 8k-15k
  • 服务器系统实习生

    稀宇科技 · 北京市
    AI 估算 · 6k-12k
  • 算法工程研发工程师-2026届

    稀宇科技 · 北京市
    AI 估算 · 18k-28k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 大模型推理调度编排专家-Seed

    字节跳动 · 上海市
    AI 估算 · 50k-80k

稀宇科技 的其他在招职位

  • 服务器运维实习生

    稀宇科技 · 北京市
    AI 估算 · 6k-10k
  • 智能交互体验设计师(AI产品方向)-实习

    稀宇科技 · 上海市
    AI 估算 · 6k-10k
  • 大模型产品经理-实习-Top Talent

    稀宇科技 · 北京市
    AI 估算 · 8k-15k
  • 服务器系统实习生

    稀宇科技 · 北京市
    AI 估算 · 6k-12k
  • 算法工程研发工程师-2026届

    稀宇科技 · 北京市
    AI 估算 · 18k-28k

相似职位推荐

  • 广告算法工程师-【海外算法中心】

    快手 · 北京市
    AI 估算 · 30k-60k
  • 高级数据研发工程师-【可灵AI专项】

    快手 · 北京市
    AI 估算 · 30k-50k
  • Java技术专家(架构)-【商业化】

    快手 · 北京市
    AI 估算 · 50k-80k
  • 高级C++开发工程师 - 飞书视频会议

    字节跳动 · 杭州市
    AI 估算 · 30k-50k
  • 大模型推理调度编排专家-Seed

    字节跳动 · 上海市
    AI 估算 · 50k-80k