Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-具身大模型训练推理工程师-机器人事业部
立即应聘

顶尖应届-具身大模型训练推理工程师-机器人事业部

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
学历未注明
软件工程
GPU
PyTorch
分布式训练
推理优化
DeepSpeed
Flashattention
Megatron
混合精度
具身大模型

AI 估算 · 25k–40k

顶尖应届技术岗,北京大厂算法校招薪资竞争力强,月薪中位数约3.2万,14薪

职位详情

关于这个职位

这是小米机器人事业部面向顶尖应届生的具身大模型训练推理工程师岗位

你将参与设计并实现分布式训练方案,优化混合精度和算子融合,进行模型推理加速与部署,同时构建自蒸馏/自进化框架,与算法团队协同推动模型高效迭代
该岗位聚焦前沿的具身智能与大模型技术,提供一流的 GPU 集群资源和研究氛围

最低要求

扎实的 Python / C++ 基础,熟悉 Linux

深入理解 PyTorch 分布式训练,熟悉至少一种分布式训练优化框架(FSDP / DeepSpeed / Megatron-LM)
深入理解 GPU / CPU / 内存 / 网络 基本原理
理解 Transformer / Diffusion / MoE 等主流结构的性能瓶颈与优化方法

工作职责

基于 PyTorch 生态(FSDP / DeepSpeed / Megatron 等)设计并实现具身大模型分布式训练方案(DP / TP / PP / MoE)

推动混合精度(BF16 / FP8)与算子融合(FlashAttention / Triton kernel)等性能优化,构建高吞吐数据 pipeline 与 shard 策略
负责模型推理加速与部署优化,设计 Causal-DiT / MoE-DiT / AR-Diffusion 等混合架构提升吞吐与生成质量
构建模型数据的自蒸馏 / 自进化框架,让模型能高效输出数据并持续优化
支持大规模实验追踪、管理、指标可视化,与算法团队协同完成模型高效迭代

优先资格

多模态 / VLA / 世界模型 / 视频生成 大规模训练经验

熟悉 NCCL / RDMA / InfiniBand 调优
有自定义 CUDA / Triton kernel 经验
熟悉 TensorRT / ONNX Runtime / Triton 等推理框架,具备量化、算子融合、显存优化实践经验
在 NeurIPS / ICLR / ICML / CVPR / ICCV / ECCV / RSS / CoRL / ICRA 等顶会有相关成果

AI 洞察

优缺点分析

优点

  • 接触前沿的具身智能与大模型技术,参与小米机器人核心研发,技术积累价值高
  • 公司提供充足的 GPU 资源和顶尖研究氛围,成长空间大
  • 作为校招岗,对新人友好,有完善的导师和培训体系
  • 技术栈较深且更新快,需要持续跟进分布式训练、推理框架的最新进展

缺点 / 挑战

  • 工作强度较高,涉及大规模分布式训练和推理优化,需要较强的自驱力和学习能力
  • 适合对具身智能、大模型训练推理有浓厚兴趣,具备扎实系统编程和分布式经验,且愿意挑战高难度技术问题的顶尖应届生

角色解读

  • 可向具身智能大模型专家或分布式系统架构师方向发展,参与前沿模型研发
  • 有机会接触大规模集群管理和跨团队协作,晋升为技术组长或项目经理
  • 设计并实现具身大模型的分布式训练方案,包括数据并行、模型并行、专家并行等策略
  • 推动混合精度训练和算子融合等性能优化,构建高效的数据流水线和分片策略
  • 负责模型推理加速与部署,优化混合架构以提升吞吐量和生成质量
  • 扎实的 Python/C++ 基础,熟悉 Linux 环境
  • 深入理解 PyTorch 分布式训练,熟悉 FSDP、DeepSpeed 或 Megatron-LM 之一
  • 理解 GPU/CPU/内存/网络原理,掌握 Transformer、Diffusion、MoE 等的性能瓶颈与优化方法

申请策略

  • 面试前最好能复现一个小规模的分布式训练 demo,并思考如何优化性能
  • 关注小米机器人事业部的技术博客或开源项目,了解其技术方向
  • 突出分布式训练相关项目经验,如使用 DeepSpeed 或 Megatron 训练过大规模模型
  • 展示对 Transformer、Diffusion 等模型结构的深入了解,以及性能优化实践经验
  • 如有 CUDA/Triton kernel 开发或推理框架(TensorRT/ONNX)经验,务必强调
  • 提前熟悉 FSDP、DeepSpeed 或 Megatron-LM 的源码和使用方法
  • 补充学习混合精度训练(BF16/FP8)和算子融合(FlashAttention)的基本原理

面试指南

  • 从原理出发:先说明基本概念和数学原理,再结合实际场景给出优化思路
  • 用 STAR 法则描述项目经历:情境、任务、行动、结果,突出自己的贡献
  • 遇到优化问题,分层思考:模型层(架构、算子)、系统层(通信、内存)、硬件层(GPU、带宽)
  • 解释 PyTorch 分布式训练中 DP、DDP、FSDP 的区别和适用场景
  • 谈谈如何优化 Transformer 的训练速度,从模型结构、算子、通信等方面
  • 描述一个你使用过 or 设计过的分布式训练系统,遇到了什么挑战,如何解决?
  • 混合精度训练中 BF16 和 FP16 的优缺点是什么?如何避免精度损失?
  • 如果一个推理任务部署到线 latency 过高,你会从哪些方面排查和优化?

匹配度报告

71
综合匹配度

前沿技术方向、高发展空间、薪资有竞争力,但工作节奏可能紧张,WLB一般。

适合人群
该职位最适合追求顶尖技术成长、能接受高强度工作的应届生,对薪资稳定性和 WLB 要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活40
使命价值80

薪资福利匹配

70中等

该职位薪资在大厂校招中属于较高水平,且有小米上市公司的稳定性,但 JD 未明确福利,补偿性动机满足程度中等偏上。

薪资信号未披露(AI估算:25K-40K/月)

成长发展匹配

95较高

该职位技术前沿,涉及具身大模型、分布式训练、混合精度等最新方向,成长空间极大,发展性动机满足度非常高。

技术前沿前沿/新兴技术
技术栈PyTorch、FSDP、DeepSpeed、Megatron、FlashAttention、Triton、MoE、具身大模型
业务类型profit_center

工作生活匹配

40较低

仅现场办公,北京核心地段,但 JD 未提及弹性工作或 WLB,可能工作强度较大,生活化动机满足度偏低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

该职位属于高速增长的具身智能赛道,社会影响力中等,但技术前瞻性强,能参与改变未来的产品研发,意义感较强。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k