Samsung logo
三星
人形机器人全身运动控制算法工程师(强化学习方向)

人形机器人全身运动控制算法工程师(强化学习方向)

发布于 大约 8 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
研究与开发 (研发)
PyTorch
强化学习
人形机器人
SAC
ROS
PPO
Td3

AI 估算 · 35k–55k

人形机器人+强化学习是前沿技术方向,三星研究院北京,高级算法工程师薪资竞争力强,参考一线大厂硕士资深岗。

职位详情

关于这个职位

该职位专注于人形机器人的全身运动控制算法研发,利用深度强化学习技术解决行走、跑跳、平衡等核心问题

你将负责从仿真验证到真机部署的完整流程,与感知、硬件团队协作推动机器人运动能力的落地
适合对机器人学和DRL有深厚功底、热衷于攻克高自由度运动控制难题的研究型工程师

最低要求

硕士及以上学历,计算机科学与技术、人工智能、自动化、控制工程、机器人工程等相关专业,具备扎实的自动控制理论、刚体动力学与机器学习理论基础

精通深度强化学习算法原理与工程落地,熟悉PPO、SAC、TD3、DQN等主流DRL算法,具备基于强化学习的机器人运动控制算法完整研发与落地经验
精通人形机器人正逆运动学、刚体动力学建模,熟悉高自由度机器人全身运动控制相关理论,具备人形机器人全身运动控制项目研发经验者优先
熟练使用PyTorch/TensorFlow等主流深度学习框架,精通Python/C++编程语言,熟悉ROS/ROS2等机器人软件框架,掌握Isaac Lab、Isaac Gym、MuJoCo、Gazebo等主流机器人仿真环境
熟悉模仿学习、逆强化学习、sim-to-real迁移、模型预测控制(MPC)、最优控制、数值优化等相关技术,具备多模态感知与运动控制融合开发经验者优先
具备良好的科研能力、工程落地能力与跨团队协作能力,在机器人、强化学习相关领域顶会顶刊(RSS、CoRL、ICRA、IROS、NeurIPS、ICML、ICLR等)发表过论文者优先

工作职责

负责基于强化学习的人形机器人全身运动控制算法研发,涵盖行走、跑跳、平衡控制、复杂地形适配、动态抗扰动、全身协同运动规划等核心场景的算法设计、迭代与优化

设计适配人形机器人高自由度特性的强化学习算法框架与深度网络架构,解决全身运动的稳定性、泛化性、实时性与安全性核心问题,持续提升机器人在复杂动态环境下的运动性能上限
负责算法的仿真验证、sim-to-real迁移优化与人形机器人真机部署调试,结合视觉、力觉、IMU等多模态传感器反馈完成闭环控制优化,完成算法性能指标的评估、迭代与落地
与感知、硬件、任务规划等跨团队紧密协作,推动算法与人形机器人本体、多模态感知系统的深度适配与集成,支撑整机运动能力的落地与产品化迭代
持续跟踪人形机器人全身运动控制、深度强化学习领域的国际前沿研究与技术动态,引入顶会顶刊的创新方法,推动核心技术的突破与技术壁垒构建

优先资格

具备人形机器人全身运动控制项目研发经验者优先

具备多模态感知与运动控制融合开发经验者优先
在机器人、强化学习相关领域顶会顶刊(RSS、CoRL、ICRA、IROS、NeurIPS、ICML、ICLR等)发表过论文者优先

AI 洞察

优缺点分析

优点

  • 前沿技术方向,人形机器人处于爆发前期,积累经验价值极高
  • 三星研究院平台大,资源充足,有充足的计算资源和真机实验条件
  • 可接触到从仿真到真机的完整研发链路,技术深度和广度兼得
  • 技术难度极高,需要同时精通DRL和机器人学,对学习能力要求严苛
  • 适合对人形机器人运动控制有强烈兴趣、具备扎实DRL和机器人学背景、乐于攻克高难度技术问题的研究型工程师

缺点 / 挑战

  • 研究成果转化周期长,需要承受试错压力和交付节点
  • 跨团队协作频繁,沟通成本较高

角色解读

  • 可向首席科学家或技术专家方向发展,专注算法突破并发表顶会论文
  • 也可转向技术管理,带领团队攻关整机运动能力,推动产品落地
  • 设计和优化基于强化学习的运动控制算法,让人形机器人实现稳定行走、跑跳和复杂地形适应
  • 在仿真环境中(如Isaac Gym)训练策略,并通过sim-to-real技术迁移到真机
  • 与感知和硬件团队协作,整合多模态传感反馈,提升机器人动态性能
  • 扎实的深度强化学习理论基础,熟练使用PPO、SAC等主流算法
  • 精通人形机器人运动学和动力学建模,掌握Python/C++及PyTorch/TensorFlow
  • 熟悉机器人仿真环境(Isaac Gym、MuJoCo)和ROS/ROS2框架

申请策略

  • 关注三星研究院在人形机器人方面的公开动态,面试中展现对技术路线的理解
  • 突出强化学习在机器人控制上的完整项目经历,包括仿真和真机
  • 强调顶会论文发表(NeurIPS、ICRA等),体现科研能力
  • 详细描述解决运动稳定性、sim-to-real等具体问题的技术方案
  • 复习人形机器人运动学和动力学,学习MPC和最优控制相关知识
  • 动手搭建一个小型DRL运动控制项目(如四足机器人仿真),熟悉Isaac Gym

面试指南

  • 对于算法原理题,先阐述核心思想,再说明工程实现中的关键决策(如奖励设计、状态空间选择)
  • 对于开放式设计题,采用分层思考:感知→规划→控制,并说明每一步的挑战和解决方案
  • 请详细讲解PPO算法的原理和实现细节,以及在人形机器人中的应用难点
  • 如何解决sim-to-real迁移中的动力学差异问题?请举例
  • 设计一个人形机器人在不平路面稳定行走的控制方案
  • 你在之前项目中如何调试DRL训练不收敛的问题?
  • 复习经典DRL论文并熟读人形机器人运动控制相关的顶会论文
  • 准备一个你主导的机器人控制项目案例,从问题定义、方法到结果完整陈述

职位点评

69
综合评分

前沿人形机器人DRL控制岗,技术天花板高,薪资有竞争力,但WLB一般。

更适合这类人
该职位最适合追求技术深度和前沿发展的求职者,愿意投入高强度研究以换取高速成长。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利

75中等

三星作为大厂提供有竞争力的薪资和福利,但JD未明确具体范围;奖金和股票可能较高。

薪资信号未披露(AI估算:35K-55K/月)

成长发展

90较高

该职位处于人形机器人技术前沿,深度强化学习+机器人学是高价值技能,且有发表顶会的机会,成长空间极大。

技术前沿前沿/新兴技术
技术栈强化学习、PPO、SAC、Isaac Gym、sim-to-real、人形机器人
成长机会持续跟踪国际前沿研究、顶会顶刊论文
业务类型profit_center

工作生活

40较低

仅现场办公,未提及弹性或远程;研究院通常有一定加班,但未明确。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

人形机器人是AI重要落地方向,三星的研发投入大,对社会有潜在正面影响,但JD未强调使命。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs