Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-具身大模型算法研究员-机器人事业部
立即应聘

顶尖应届-具身大模型算法研究员-机器人事业部

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
博士
研究与开发 (研发)
PyTorch
分布式训练
机器人
VLA
多模态大模型
diffusion
3D视觉
World Model
Embodied Vlm

AI 估算 · 25k–40k

小米大厂,具身智能前沿方向,博士起薪高,市场竞争力强。

职位详情

关于这个职位

作为小米机器人事业部的具身大模型算法研究员,你将专注于VLA、具身VLM和世界模型的前沿研究,利用海量互联网数据和机器人数据,提升机器人在零样本场景下的任务泛化能力

你将参与从算法设计到真机闭环验证的全流程,推动具身智能在真实物理世界的落地

最低要求

CV / ML / 机器人 / AI 相关方向博士,或同等研究能力的硕士

在 VLM / 多模态大模型 / 视频理解 / 3D 视觉 / VLN / Embodied Agent / RL / 视频生成 / 世界模型 任一方向有扎实基础
至少在 CVPR / ICCV / ECCV / NeurIPS / ICML / ICLR / ACL / RSS / CoRL / ICRA / IROS 等顶会以一作发表过相关工作
熟练 PyTorch,熟悉 Transformer、Diffusion、CLIP / SigLIP / Qwen-VL 等主流架构,具备分布式训练 / 大规模数据处理经验者优先
系统思维强,对"什么是真正重要的具身问题"有自己的判断,能独立 own 一个研究方向,具备极强的自驱力,能够从 0 到 1 推动前沿技术在真实物理世界落地

工作职责

设计并实现 VLA / Embodied VLM / World Model 的训练目标、分布式训练方案与数据 recipe,融合互联网图文、视频、3D / 仿真、真机轨迹等多源数据

设计并实现融合视频生成与动作控制的多模态大模型架构,探索大规模数据缩放定律,利用海量互联网视频数据及机器人采集数据,提升模型在零样本场景下的任务泛化能力
研发基于 VLM 的端到端导航与具身 Agent 算法
构建具身大模型的评测基准与真机闭环验证 pipeline
跟踪并复现 SOTA 工作,与训练 / 推理 / 数据 / 硬件团队协同迭代

AI 洞察

优缺点分析

优点

  • 小米大厂平台,资源丰富,具身智能是当前AI热门赛道,发展前景广阔
  • 直接从事VLA、世界模型等前沿研究,技术含量高,能快速积累核心竞争力
  • 团队有真机验证闭环,研究能快速落地,产出影响力大
  • 对学术背景要求极高,需顶会一作论文,竞争激烈
  • 工作涉及多源数据融合和分布式训练,技术复杂度高,需要较强的工程能力
  • 适合在具身智能、多模态大模型方向有深厚积累且渴望前沿研究的博士或优秀硕士,自驱力强,愿意将研究成果落地到真实机器人

缺点 / 挑战

  • 研究节奏快,需要持续跟踪SOTA并自驱推进,压力较大

角色解读

  • 在具身智能前沿领域深耕,成为VLA/世界模型方向的专家
  • 可向技术Leader或架构师方向发展,带领团队攻关核心算法
  • 有机会参与顶会论文发表与行业影响力构建,未来可转向创业或大厂高阶岗位
  • 设计并实现VLA、具身VLM和世界模型的训练目标与架构,融合多源数据提升泛化能力
  • 研发端到端导航与具身Agent算法,构建评测基准并完成真机闭环验证
  • 跟踪顶会SOTA工作,与多团队协作推动技术迭代与落地
  • 扎实的CV/ML/机器人/AI博士或硕士背景,在VLM、多模态大模型等方向有顶会一作论文
  • 熟练PyTorch,熟悉Transformer、Diffusion等主流架构,有分布式训练经验
  • 强系统思维和自驱力,能独立推进前沿研究到物理世界落地

申请策略

  • 在简历中清晰表达你对“重要具身问题”的判断和独立思考
  • 了解小米机器人事业部的研究方向,在面试中展示与团队需求的契合度
  • 突出顶会一作论文,尤其是VLM、多模态、机器人相关方向
  • 强调分布式训练、大规模数据处理经验,以及具体项目中的技术贡献
  • 展示系统思维和独立研究能力,例如own一个课题从0到1的经历
  • 补充Transformer、Diffusion等主流架构的深入理解,熟悉CLIP/SigLIP等
  • 积累分布式训练经验,如使用PyTorch DDP/FSDP

面试指南

  • STAR法则:情境、任务、行动、结果,清晰展示研究贡献
  • 先给出核心观点,再用具体技术细节支撑,体现深度思考
  • 展示系统思维:不仅讲算法,还要考虑数据、算力、落地等全局因素
  • 请详细介绍一下你的一作论文,特别是其中最具创新性的部分
  • VLA和世界模型有哪些关键挑战?你如何设计缩放定律实验?
  • 如何处理互联网数据和真机轨迹数据之间的分布差异?
  • 你认为当前具身智能最亟待解决的问题是什么?
  • 描述一次你从0到1推动一个研究项目落地的经历

匹配度报告

68
综合匹配度

小米大厂,具身智能前沿方向,技术成长极高,但WLB一般。

适合人群
适合追求技术前沿和学术成长的求职者,愿意在高强度研发环境中突破自我。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展90
工作生活40
使命价值75

薪资福利匹配

65中等

薪资未明确披露,但小米大厂和博士岗位通常提供有竞争力的薪酬;福利未提及,但大厂一般较完善。总体补偿性中等偏上。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

90较高

职位涉及VLA、世界模型等前沿技术,具备极高的技能成长性;要求独立own研究方向,有明确的学术和职业发展空间。

技术前沿前沿/新兴技术
技术栈VLA、Embodied VLM、World Model、多模态大模型、分布式训练、Transformer、Diffusion、3D视觉、CLIP
业务类型ambiguous

工作生活匹配

40较低

工作地点北京,需现场办公;未提及WLB相关福利,研发岗通常强度较高。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

75中等

具身智能是推动机器人落地的前沿领域,具有明显的社会价值和行业前景;JD强调“真实物理世界落地”,使命感强。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k