稀宇科技的大模型训练框架工程师（训练框架 & RL 方向）- 2027届薪资是多少？

该职位薪资范围为 30k–60k（人民币/月）。

大模型训练框架工程师（训练框架 & RL 方向）- 2027届的工作地点在哪里？

该职位工作地点位于北京市、上海市。工作形式为仅现场办公。

稀宇科技的大模型训练框架工程师（训练框架 & RL 方向）- 2027届有什么任职要求？

该职位要求学历未注明学历及无经验要求工作经验。

稀宇科技

大模型训练框架工程师（训练框架 & RL 方向）- 2027届

立即应聘

大模型训练框架工程师（训练框架 & RL 方向）- 2027届

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

无经验要求

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

系统设计

PyTorch

GPU优化

Megatron-LM

SGLang

RLHF

大模型训练

Rl工程

AI 估算 · 30k–60k

大模型训练框架方向技术难度高，人才稀缺，薪资有竞争力，B轮初创通常16薪。

职位详情

关于这个职位

该职位负责设计和优化大模型训练基础设施，包括分布式训练框架和自研强化学习框架Forge

你需要与算法团队深度合作，解决万卡集群上的效率与稳定性问题，将前沿算法转化为工程实践

适合对系统优化和AI训练有热情的技术高手

最低要求

编程能力扎实，有清晰的系统设计思路，有强烈的工程品味和责任心

对 AI 训练系统或 RL 工程某一方向有深入理解，能独立发现问题、提出方案并推动落地

主动追踪算法与系统前沿，能将论文洞见转化为工程判断

工作职责

设计并优化大规模分布式训练框架，提升万卡集群的训练效率与稳定性

参与自研强化学习框架Forge的开发和迭代，推动RL训练流水线的改进

与算法团队紧密合作，从架构设计阶段介入，确保系统与算法协同优化

优先资格

对主流开源框架（PyTorch、Megatron-LM、SGLang 等）有深入了解，并有实质性贡献

有万卡规模训练系统或大规模 RLHF/RLVR 工程的实战经验

AI 洞察

优缺点分析

优点

站在AI最前沿，参与顶尖大模型训练，技术影响力大
公司B轮，发展空间大，与算法团队直接合作，学习曲线陡峭
自研框架Forge在业界有广泛影响力，个人成长快
技术难度极高，需要深厚的系统知识和持续学习新知识
工作强度可能较大，涉及紧急问题排查和快速迭代
竞争激烈，需要快速产出可量化的成果

缺点 / 挑战

适合对分布式系统和AI训练有深度热情、敢于挑战顶尖技术难题、追求技术成长的工程师

角色解读

成为大模型基础设施领域的专家，掌握最前沿的分布式训练和RL技术
向系统架构师或技术负责人发展，主导关键技术决策
有机会接触顶尖大模型和RL技术，建立行业影响力
设计和优化大规模分布式训练框架，解决万卡集群上的效率与稳定性问题
参与自研强化学习框架Forge的开发与迭代，推动RL训练流水线的改进
与算法团队紧密协作，从架构设计阶段介入，确保系统与算法协同优化
扎实的编程能力（C++/Python）和系统设计能力
深入理解分布式训练系统、GPU性能优化或RL工程
对前沿算法保持好奇，能将论文转化为工程实践

申请策略

关注MiniMax的技术博客或开源项目，展示对其技术栈的了解
准备一个系统设计或优化案例，在面试中体现深度思考和动手能力
突出相关项目经验，如分布式训练、RL框架开发或大规模系统优化
展示对开源框架（PyTorch、Megatron-LM等）的贡献或深入理解
用具体案例体现解决复杂系统问题的能力，如性能调优、故障排查
补充分布式系统理论知识，如一致性哈希、通信拓扑、并行策略
实践GPU性能优化技术，如CUDA编程、NCCL调优
熟悉RLHF/RLVR流程及其工程实现

面试指南

使用STAR方法描述项目经历：情境、任务、行动、结果，突出量化成果
从系统层面分析问题，分点说明解决方案，体现分层思维
结合具体技术细节（如通信库、并行策略、memory优化）展示深度
请描述一个你优化过的分布式训练系统的架构，遇到了哪些挑战？
如何解决大规模训练中的通信瓶颈？请举例说明
解释RLHF训练流程及其工程实现中的关键难点
假如在万卡集群上出现训练不稳定，如何系统性地排查？
复习分布式训练相关论文（如Megatron-LM、DeepSpeed）和技术博客

职位点评

综合评分

前沿大模型训练框架岗位，技术成长快，薪资有竞争力，但工作强度未知。

更适合这类人

适合追求技术成长、愿意接受高强度挑战、不畏辛苦的求职者

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展90

工作生活40

使命价值70

薪资福利

70中等

薪资未在JD中披露，但B轮初创公司为吸引顶尖人才通常提供有竞争力的薪酬，不过稳定性稍弱。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

90较高

岗位涉及大模型训练和RL框架，技术前沿，成长空间极大，与算法团队紧密合作能快速积累经验。

技术前沿前沿/新兴技术

技术栈分布式系统、GPU优化、RL工程、PyTorch、Megatron-LM、SGLang

业务类型profit_center

工作生活

40较低

要求现场办公，未提及远程或弹性工作，且大模型训练工作强度可能较高，WLB不明确。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

70中等

大模型是高速增长赛道，岗位技术影响力大，但社会价值中性，主要服务于商业目标。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

稀宇科技

大模型训练框架工程师（训练框架 & RL 方向）- 2027届

立即应聘

大模型训练框架工程师（训练框架 & RL 方向）- 2027届

发布于大约 2 个月前

普通员工/个人贡献者

北京市 / 上海市

无经验要求

全职员工

仅现场办公

学历未注明

软件工程

分布式系统

系统设计

PyTorch

GPU优化

Megatron-LM

SGLang

RLHF

大模型训练

Rl工程

AI 估算 · 30k–60k

大模型训练框架方向技术难度高，人才稀缺，薪资有竞争力，B轮初创通常16薪。

职位详情

关于这个职位

该职位负责设计和优化大模型训练基础设施，包括分布式训练框架和自研强化学习框架Forge

你需要与算法团队深度合作，解决万卡集群上的效率与稳定性问题，将前沿算法转化为工程实践

适合对系统优化和AI训练有热情的技术高手

最低要求

编程能力扎实，有清晰的系统设计思路，有强烈的工程品味和责任心

对 AI 训练系统或 RL 工程某一方向有深入理解，能独立发现问题、提出方案并推动落地

主动追踪算法与系统前沿，能将论文洞见转化为工程判断

工作职责

设计并优化大规模分布式训练框架，提升万卡集群的训练效率与稳定性

参与自研强化学习框架Forge的开发和迭代，推动RL训练流水线的改进

与算法团队紧密合作，从架构设计阶段介入，确保系统与算法协同优化

优先资格

对主流开源框架（PyTorch、Megatron-LM、SGLang 等）有深入了解，并有实质性贡献

有万卡规模训练系统或大规模 RLHF/RLVR 工程的实战经验

AI 洞察

优缺点分析

优点

站在AI最前沿，参与顶尖大模型训练，技术影响力大
公司B轮，发展空间大，与算法团队直接合作，学习曲线陡峭
自研框架Forge在业界有广泛影响力，个人成长快
技术难度极高，需要深厚的系统知识和持续学习新知识
工作强度可能较大，涉及紧急问题排查和快速迭代
竞争激烈，需要快速产出可量化的成果

缺点 / 挑战

适合对分布式系统和AI训练有深度热情、敢于挑战顶尖技术难题、追求技术成长的工程师

角色解读

成为大模型基础设施领域的专家，掌握最前沿的分布式训练和RL技术
向系统架构师或技术负责人发展，主导关键技术决策
有机会接触顶尖大模型和RL技术，建立行业影响力
设计和优化大规模分布式训练框架，解决万卡集群上的效率与稳定性问题
参与自研强化学习框架Forge的开发与迭代，推动RL训练流水线的改进
与算法团队紧密协作，从架构设计阶段介入，确保系统与算法协同优化
扎实的编程能力（C++/Python）和系统设计能力
深入理解分布式训练系统、GPU性能优化或RL工程
对前沿算法保持好奇，能将论文转化为工程实践

申请策略

关注MiniMax的技术博客或开源项目，展示对其技术栈的了解
准备一个系统设计或优化案例，在面试中体现深度思考和动手能力
突出相关项目经验，如分布式训练、RL框架开发或大规模系统优化
展示对开源框架（PyTorch、Megatron-LM等）的贡献或深入理解
用具体案例体现解决复杂系统问题的能力，如性能调优、故障排查
补充分布式系统理论知识，如一致性哈希、通信拓扑、并行策略
实践GPU性能优化技术，如CUDA编程、NCCL调优
熟悉RLHF/RLVR流程及其工程实现

面试指南

使用STAR方法描述项目经历：情境、任务、行动、结果，突出量化成果
从系统层面分析问题，分点说明解决方案，体现分层思维
结合具体技术细节（如通信库、并行策略、memory优化）展示深度
请描述一个你优化过的分布式训练系统的架构，遇到了哪些挑战？
如何解决大规模训练中的通信瓶颈？请举例说明
解释RLHF训练流程及其工程实现中的关键难点
假如在万卡集群上出现训练不稳定，如何系统性地排查？
复习分布式训练相关论文（如Megatron-LM、DeepSpeed）和技术博客

职位点评

综合评分

前沿大模型训练框架岗位，技术成长快，薪资有竞争力，但工作强度未知。

更适合这类人

适合追求技术成长、愿意接受高强度挑战、不畏辛苦的求职者

表现最好

成长发展

相对薄弱

工作生活

薪资福利70

成长发展90

工作生活40

使命价值70

薪资福利

70中等

薪资未在JD中披露，但B轮初创公司为吸引顶尖人才通常提供有竞争力的薪酬，不过稳定性稍弱。

薪资信号未披露（AI估算：30K-60K/月）

成长发展

90较高

岗位涉及大模型训练和RL框架，技术前沿，成长空间极大，与算法团队紧密合作能快速积累经验。

技术前沿前沿/新兴技术

技术栈分布式系统、GPU优化、RL工程、PyTorch、Megatron-LM、SGLang

业务类型profit_center

工作生活

40较低

要求现场办公，未提及远程或弹性工作，且大模型训练工作强度可能较高，WLB不明确。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

70中等

大模型是高速增长赛道，岗位技术影响力大，但社会价值中性，主要服务于商业目标。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

大模型训练框架工程师（训练框架 & RL 方向）- 2027届

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

大模型训练框架工程师（训练框架 & RL 方向）- 2027届

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

稀宇科技 的其他在招职位

资产与资源运营实习生（基础设施方向）

大模型数据算法实习生-视频&声音

MaaS 平台研发实习生

智能交互体验设计师（AI产品）

服务端研发实习生（AI Agent方向）

相似职位推荐

Backend Developer - AI & Agentic Applications

Data Engineer

（高级）安卓应用开发工程师

Specialist, ML Engineer

VP, Engineering Lead, AI Wealth

稀宇科技 的其他在招职位

资产与资源运营实习生（基础设施方向）

大模型数据算法实习生-视频&声音

MaaS 平台研发实习生

智能交互体验设计师（AI产品）

服务端研发实习生（AI Agent方向）

相似职位推荐

Backend Developer - AI & Agentic Applications

Data Engineer

（高级）安卓应用开发工程师

Specialist, ML Engineer

VP, Engineering Lead, AI Wealth

稀宇科技的其他在招职位

稀宇科技的其他在招职位