小米的顶尖应届-机器人强化学习算法工程师-机器人事业部薪资是多少？

该职位薪资范围为 25k–35k（人民币/月）。

顶尖应届-机器人强化学习算法工程师-机器人事业部的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

小米的顶尖应届-机器人强化学习算法工程师-机器人事业部有什么任职要求？

该职位要求本科学历及无经验要求工作经验。

小米

顶尖应届-机器人强化学习算法工程师-机器人事业部

立即应聘

顶尖应届-机器人强化学习算法工程师-机器人事业部

发布于大约 2 个月前

普通员工/个人贡献者

北京市

无经验要求

全职员工

仅现场办公

本科

研究与开发 (研发)

强化学习

机器人

PPO

PyTorch

ROS

SAC

sim2real

AI 估算 · 25k–35k

人工智能/机器人方向热门，小米大厂，顶尖应届岗薪资竞争力强，技术壁垒高，中位数约30k/月。

职位详情

关于这个职位

该职位专注于开发人形机器人的强化学习控制策略，涉及全身运动与操作任务的算法设计、仿真训练及实物部署

你将紧跟学术界前沿，快速复现并创新算法，积累论文与专利成果

适合对机器人、强化学习有浓厚兴趣，且愿意深入工程落地的顶尖应届生

最低要求

本科及以上学历，机器人、计算机、人工智能、机器学习、应用数学等专业，理论功底深厚，有相关人形机器人传统控制经验更优

具有强化学习相关项目研究经验，熟悉Mujoco、Pybullet、Isaac Gym等机器人仿真平台，熟悉Linux、ROS等操作系统

掌握主流强化学习算法如DQN、PPO、DDPG、SAC等主流算法，熟悉Pytorch、TensorFlow机器学习框架

扎实的C++、python编程能力

数学基础扎实，具有较强的学习与研究能力

熟悉大模型理论者优先

工作职责

开发基于机器学习的人形机器人全身控制策略，并应用于机器人loco-manipulation任务

负责算法策略的训练与移植部署，实现算法sim2real在机器人实机上落地应用

紧跟最新技术进展，将学术界前沿创新内容进行快速复现并创新，参与相关方向的论文与专利积累

优先资格

熟悉大模型理论者优先

AI 洞察

优缺点分析

优点

聚焦人形机器人这一前沿赛道，技术天花板高，行业需求爆发期入局价值大
小米平台资源丰富，有机会接触从算法研发到产品落地的完整链条
鼓励学术创新，支持论文与专利产出，利于提升个人技术品牌
算法从仿真到真实机器人部署存在大量工程难题，调试周期长，需要较强耐心
机器人硬件成本高，实验机会有限，试错成本较大
适合热爱强化学习与机器人技术、具备扎实数理和编程功底、渴望在AI前沿领域做出硬核成果的顶尖应届生

缺点 / 挑战

岗位对数学和编程基础要求极高，持续学习压力大，需紧跟最新论文

角色解读

从算法工程师向机器人领域专家发展，深入掌握全身控制、灵巧操作等核心技术
可晋升为技术负责人或团队骨干，带领项目攻克复杂机器人任务
后续可向感知、规划等方向拓展，成为机器人全栈研发人才
设计并训练强化学习算法，实现人形机器人全身运动与操作任务的自主控制
将仿真环境中的策略（sim）迁移到真实机器人（real），完成实机部署与调试
跟踪学术前沿，快速复现并创新算法，输出论文与专利
扎实的强化学习理论基础，熟悉DQN、PPO、SAC等主流算法原理及调优
熟练使用Mujoco、Isaac Gym等仿真平台，具备sim2real实践经验
精通Python和C++编程，能高效实现算法并集成到机器人系统
熟悉Linux/ROS生态系统，具备机器人软硬件联调能力

申请策略

在简历中用量化结果说明算法效果（如成功率、训练效率提升），体现工程思维
面试前准备一段sim2real或loco-manipulation相关的小项目演示，能极大提升竞争力
突出强化学习相关项目经历，尤其是仿真平台（如Isaac Gym）和sim2real实践
展示C++/Python编程能力，可附上GitHub开源项目或技术博客
强调数学建模与论文经历，若有机器人控制相关竞赛或论文更佳
提前熟悉Isaac Gym或Mujoco，动手复现一个经典强化学习算法（如PPO）
了解大模型基础（如Transformer），作为加分项
补充机器人运动学/动力学知识，阅读相关经典论文

面试指南

对于算法原理问题：先清晰阐述数学基础（如策略梯度、重要性采样），再结合实际调参经验（如clip范围、学习率）
对于系统设计问题：遵循“定义问题-选择方案-分析瓶颈-迭代优化”的框架，强调仿真与实际结合
对于调试问题：采用“数据驱动”思路，从reward曲线、状态分布、硬件反馈等多个维度排查
请简述PPO算法的原理，并说明在实际机器人训练中如何调参？
如何解决sim2real中的动力学差异问题？列举至少三种方法
设计一个基于强化学习的人形机器人物体搬运任务，从状态、动作、奖励函数到训练流程
你如何评估一个强化学习策略的稳定性？如果机器人摔倒，你会如何诊断？
系统复习强化学习经典算法（DQN、PPO、SAC、DDPG），并理解它们在连续控制中的差异

职位点评

综合评分

前沿机器人算法岗，技术成长极高，但工作强度可能较大，生活平衡一般。

从起薪待遇、成长路径、工作节奏和岗位方向综合评估，方便比较职业起点。

更适合这类人

最适合追求技术成长和前沿创新的求职者，对薪资和生活节奏有一定容忍度。

表现最好

成长发展

相对薄弱

工作生活

薪资福利65

成长发展88

工作生活40

使命价值78

薪资福利

65中等

小米作为上市公司，薪资福利在业内有一定竞争力，但JD未明确提及具体待遇与福利，需面试时确认。

薪资信号未披露（AI估算：25K-35K/月）

成长发展

88较高

岗位聚焦人形机器人强化学习前沿，技术含量极高，鼓励论文与专利，成长空间大，但未明确提及内部培训或晋升通道。

技术前沿前沿/新兴技术

技术栈强化学习、机器人、sim2real、PPO、SAC、Mujoco、Isaac Gym

业务类型ambiguous

工作生活

40较低

北京现场办公，JD未提及弹性工作或WLB，且机器人研发实验节奏可能较快，生活化动机满足度较低。

工作模式仅现场办公

办公地点未明确

加班情况未提及（无法判断）

使命价值

78中等

人形机器人是科技前沿，对社会进步有积极意义，但JD未强调具体使命，动机满足偏中上。

行业发展高速增长赛道

社会影响中性/一般

创新程度开拓性创新（行业首创）

小米的其他在招职位

相似职位推荐

Watch Jobs

顶尖应届-机器人强化学习算法工程师-机器人事业部

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

国际业务部大家电GTM

零售顾问实习生-东莞

交付保障专员

座舱车载测试架构师（AI测试方向）

零售顾问-澎程-昆明

【REDstar】基础模型算法工程师-Post-training

【REDstar】大模型应用算法工程师- rednote国际化

【REDstar】视觉与多模态算法工程师

算法技术顾问

机器人-算法工程师-机器视觉3D-杭州*

小米的其他在招职位

国际业务部大家电GTM

零售顾问实习生-东莞

交付保障专员

座舱车载测试架构师（AI测试方向）

零售顾问-澎程-昆明

相似职位推荐

【REDstar】基础模型算法工程师-Post-training

【REDstar】大模型应用算法工程师- rednote国际化

【REDstar】视觉与多模态算法工程师

算法技术顾问

机器人-算法工程师-机器视觉3D-杭州*

顶尖应届-机器人强化学习算法工程师-机器人事业部

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

小米 的其他在招职位

国际业务部大家电GTM

零售顾问实习生-东莞

交付保障专员

座舱车载测试架构师（AI测试方向）

零售顾问-澎程-昆明

相似职位推荐

【REDstar】基础模型算法工程师-Post-training

【REDstar】大模型应用算法工程师- rednote国际化

【REDstar】视觉与多模态算法工程师

算法技术顾问

机器人-算法工程师-机器视觉3D-杭州*

小米的其他在招职位