Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-机器人强化学习算法工程师-机器人事业部
立即应聘

顶尖应届-机器人强化学习算法工程师-机器人事业部

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
本科
研究与开发 (研发)
PyTorch
强化学习
机器人
SAC
ROS
PPO
sim2real

AI 估算 · 25k–35k

人工智能/机器人方向热门,小米大厂,顶尖应届岗薪资竞争力强,技术壁垒高,中位数约30k/月。

职位详情

关于这个职位

该职位专注于开发人形机器人的强化学习控制策略,涉及全身运动与操作任务的算法设计、仿真训练及实物部署

你将紧跟学术界前沿,快速复现并创新算法,积累论文与专利成果
适合对机器人、强化学习有浓厚兴趣,且愿意深入工程落地的顶尖应届生

最低要求

本科及以上学历,机器人、计算机、人工智能、机器学习、应用数学等专业,理论功底深厚,有相关人形机器人传统控制经验更优

具有强化学习相关项目研究经验,熟悉Mujoco、Pybullet、Isaac Gym等机器人仿真平台,熟悉Linux、ROS等操作系统
掌握主流强化学习算法如DQN、PPO、DDPG、SAC等主流算法,熟悉Pytorch、TensorFlow机器学习框架
扎实的C++、python编程能力
数学基础扎实,具有较强的学习与研究能力
熟悉大模型理论者优先

工作职责

开发基于机器学习的人形机器人全身控制策略,并应用于机器人loco-manipulation任务

负责算法策略的训练与移植部署,实现算法sim2real在机器人实机上落地应用
紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累

优先资格

熟悉大模型理论者优先

AI 洞察

优缺点分析

优点

  • 聚焦人形机器人这一前沿赛道,技术天花板高,行业需求爆发期入局价值大
  • 小米平台资源丰富,有机会接触从算法研发到产品落地的完整链条
  • 鼓励学术创新,支持论文与专利产出,利于提升个人技术品牌
  • 算法从仿真到真实机器人部署存在大量工程难题,调试周期长,需要较强耐心
  • 机器人硬件成本高,实验机会有限,试错成本较大
  • 适合热爱强化学习与机器人技术、具备扎实数理和编程功底、渴望在AI前沿领域做出硬核成果的顶尖应届生

缺点 / 挑战

  • 岗位对数学和编程基础要求极高,持续学习压力大,需紧跟最新论文

角色解读

  • 从算法工程师向机器人领域专家发展,深入掌握全身控制、灵巧操作等核心技术
  • 可晋升为技术负责人或团队骨干,带领项目攻克复杂机器人任务
  • 后续可向感知、规划等方向拓展,成为机器人全栈研发人才
  • 设计并训练强化学习算法,实现人形机器人全身运动与操作任务的自主控制
  • 将仿真环境中的策略(sim)迁移到真实机器人(real),完成实机部署与调试
  • 跟踪学术前沿,快速复现并创新算法,输出论文与专利
  • 扎实的强化学习理论基础,熟悉DQN、PPO、SAC等主流算法原理及调优
  • 熟练使用Mujoco、Isaac Gym等仿真平台,具备sim2real实践经验
  • 精通Python和C++编程,能高效实现算法并集成到机器人系统
  • 熟悉Linux/ROS生态系统,具备机器人软硬件联调能力

申请策略

  • 在简历中用量化结果说明算法效果(如成功率、训练效率提升),体现工程思维
  • 面试前准备一段sim2real或loco-manipulation相关的小项目演示,能极大提升竞争力
  • 突出强化学习相关项目经历,尤其是仿真平台(如Isaac Gym)和sim2real实践
  • 展示C++/Python编程能力,可附上GitHub开源项目或技术博客
  • 强调数学建模与论文经历,若有机器人控制相关竞赛或论文更佳
  • 提前熟悉Isaac Gym或Mujoco,动手复现一个经典强化学习算法(如PPO)
  • 了解大模型基础(如Transformer),作为加分项
  • 补充机器人运动学/动力学知识,阅读相关经典论文

面试指南

  • 对于算法原理问题:先清晰阐述数学基础(如策略梯度、重要性采样),再结合实际调参经验(如clip范围、学习率)
  • 对于系统设计问题:遵循“定义问题-选择方案-分析瓶颈-迭代优化”的框架,强调仿真与实际结合
  • 对于调试问题:采用“数据驱动”思路,从reward曲线、状态分布、硬件反馈等多个维度排查
  • 请简述PPO算法的原理,并说明在实际机器人训练中如何调参?
  • 如何解决sim2real中的动力学差异问题?列举至少三种方法
  • 设计一个基于强化学习的人形机器人物体搬运任务,从状态、动作、奖励函数到训练流程
  • 你如何评估一个强化学习策略的稳定性?如果机器人摔倒,你会如何诊断?
  • 系统复习强化学习经典算法(DQN、PPO、SAC、DDPG),并理解它们在连续控制中的差异

匹配度报告

68
综合匹配度

前沿机器人算法岗,技术成长极高,但工作强度可能较大,生活平衡一般。

适合人群
最适合追求技术成长和前沿创新的求职者,对薪资和生活节奏有一定容忍度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展88
工作生活40
使命价值78

薪资福利匹配

65中等

小米作为上市公司,薪资福利在业内有一定竞争力,但JD未明确提及具体待遇与福利,需面试时确认。

薪资信号未披露(AI估算:25K-35K/月)

成长发展匹配

88较高

岗位聚焦人形机器人强化学习前沿,技术含量极高,鼓励论文与专利,成长空间大,但未明确提及内部培训或晋升通道。

技术前沿前沿/新兴技术
技术栈强化学习、机器人、sim2real、PPO、SAC、Mujoco、Isaac Gym
业务类型ambiguous

工作生活匹配

40较低

北京现场办公,JD未提及弹性工作或WLB,且机器人研发实验节奏可能较快,生活化动机满足度较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

78中等

人形机器人是科技前沿,对社会进步有积极意义,但JD未强调具体使命,动机满足偏中上。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k