Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-大模型训练框架优化工程师-自动驾驶
立即应聘

顶尖应届-大模型训练框架优化工程师-自动驾驶

发布于 大约 3 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
本科
软件工程
PyTorch
性能优化
GPU优化
自动驾驶
CUDA
分布式训练
Megatron-LM
DeepSpeed
大模型训练

AI 估算 · 25k–35k

北京大厂应届生大模型方向,技术门槛高,薪资具竞争力,属热门稀缺岗位。

职位详情

关于这个职位

作为顶尖应届生加入小米自动驾驶团队,你将专注于大模型训练框架的优化工作,分析并解决自动驾驶和机器人模型训练中的性能瓶颈,通过分布式策略、算子融合和CUDA优化等技术手段提升训练吞吐和GPU利用率,推动训练周期缩短和成本下降

这是一个深度参与前沿技术、与顶尖工程师协作的成长机会

最低要求

本科及以上学历,扎实的编程基础(Python/C++)与良好的工程习惯

精通深度学习框架底层原理(PyTorch 核心机制如 torch.compile、Autograd、TorchScript、XLA)
熟悉分布式训练框架(Horovod、Megatron-LM、DeepSpeed 等)的实现逻辑
熟悉 CUDA 编程及 GPU 架构,能独立开发高性能自定义算子(CUDA、CUTLASS、TileLang、Triton)
理解大模型训练框架工程化实践,具备在现有框架基础上进行性能分析、模块扩展或业务适配的能力

工作职责

负责基于现有大模型训练框架分析自动驾驶与机器人模型训练链路,包括数据加载、分布式并行、显存占用、通信开销和算子执行等环节,定位性能瓶颈

围绕训练吞吐、GPU 利用率和模型迭代效率开展优化,推动训练周期缩短和训练资源成本下降
结合 PyTorch、Megatron-LM、DeepSpeed 等技术栈,开展分布式训练策略、混合精度、算子融合、通信优化和 CUDA 高性能算子优化
推进训练框架与 AI 平台、调度系统和监控体系协同,建立训练效率、集群算力利用率和任务稳定性的评估机制
探索 AI Agent 在自动化 profiling、瓶颈定位和代码优化建议中的应用,沉淀可复用的训练优化工具链

优先资格

有深度学习编译技术栈(TVM、MLIR 等)、AI 开源社区贡献、训练性能优化或大规模模型训练经验者优先

AI 洞察

优缺点分析

优点

  • 深度参与大模型训练框架优化,技术栈前沿(PyTorch、Megatron、CUDA),技能积累价值高
  • 小米自动驾驶业务处于快速发展期,落地场景明确,能接触真实大规模训练任务
  • 顶尖应届生专项培养,有导师指导和核心项目机会,成长速度较快
  • 薪资待遇优厚,大厂福利完善,且为热门AI方向,职业前景广阔
  • 技术难度高,需要同时掌握分布式系统、GPU优化、深度学习框架等多个深度领域,学习曲线陡峭
  • 适合编程基础扎实、对底层技术充满热情、渴望在大模型分布式训练领域深耕的顶尖应届生

缺点 / 挑战

  • 训练优化工作可能涉及高强度压力,需要快速定位和解决性能问题,对问题排查能力要求高
  • 作为应届生需要快速融入团队并承担重要模块,初期可能面临较大挑战

角色解读

  • 从训练优化工程师起步,深入大模型基础设施领域,成长为分布式训练架构师或AI平台核心开发者
  • 可向自动驾驶算法方向拓展,结合业务理解优化模型训练链路,成为复合型技术专家
  • 未来可晋升为技术负责人或AI基础设施团队Leader,引领大规模训练优化方向
  • 分析自动驾驶和机器人模型训练链路,定位性能瓶颈,包括数据加载、分布式并行、显存占用、通信开销等环节
  • 围绕训练吞吐、GPU利用率和迭代效率开展优化,缩短训练周期并降低成本
  • 基于PyTorch、Megatron-LM、DeepSpeed等技术栈,实施分布式训练策略、混合精度、算子融合和CUDA算子优化
  • 协同AI平台与调度系统,建立训练效率与稳定性的评估机制,并探索AI Agent在自动化优化中的应用
  • 精通Python/C++编程,具备扎实的工程能力与深度学习框架底层原理理解(PyTorch、torch.compile、Autograd等)
  • 熟悉分布式训练框架(Horovod、Megatron-LM、DeepSpeed)的实现逻辑,能进行性能分析与扩展
  • 掌握CUDA编程及GPU架构,能独立开发高性能自定义算子(CUDA、CUTLASS、Triton等)
  • 理解大模型训练框架工程化实践,具备性能分析和模块适配能力

申请策略

  • 提前了解小米自动驾驶的技术路线和业务方向,在面试中展示对场景的理解
  • 准备一个完整的技术项目,从问题定义、优化方案到效果评估,体现系统思考能力
  • 突出深度学习框架底层理解,如PyTorch源码分析、自定义算子开发、分布式训练相关项目
  • 展示性能优化经历,如训练吞吐提升、显存优化、通信延迟降低等具体案例和数据
  • 强调C++/Python工程能力,如有高性能计算、CUDA编程或开源贡献经历更佳
  • 若有自动驾驶或机器人相关项目经验,可重点说明与训练优化的结合
  • 深入学习Megatron-LM和DeepSpeed源码,理解分布式并行策略(DP/TP/PP)实现
  • 动手实践CUDA算子优化,尝试用Triton编写简单算子并对比性能

面试指南

  • 对于技术原理类问题,从核心概念入手,结合源码或底层实现,用具体例子说明
  • 对于优化方案类问题,先明确问题范围(计算/通信/存储),再提出分步骤的优化策略,并考虑权衡
  • 对于系统设计类问题,从监控、分析、迭代的角度构建闭环,强调量化评估
  • 请解释PyTorch的Autograd机制和torch.compile的工作原理
  • 描述Megatron-LM中的模型并行策略(张量并行、流水线并行)以及各自的优缺点
  • 如何优化一个分布式训练任务中的通信瓶颈?请给出具体方案
  • CUDA编程中,shared memory和global memory的使用有哪些优化技巧?
  • 给定一个训练性能问题,如何系统性地定位瓶颈并制定优化计划?

职位点评

75
综合评分

大厂顶尖应届项目,前沿技术栈,高成长高薪资,但办公灵活性和WLB一般。

更适合这类人
适合追求技术成长、渴望挑战前沿领域、对薪资有一定要求但能接受一定工作强度的应届生。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展95
工作生活50
使命价值70

薪资福利

85较高

小米作为上市大厂,薪资福利有竞争力,该岗位为顶尖应届生项目,薪酬水平偏高,且有完善福利。但薪资面议,具体数字未披露。

薪资信号偏高 (25K-35K/月)

成长发展

95较高

该岗位技术前沿,涉及大模型训练框架、CUDA优化等新兴技术,有明确的导师制和课题培养,成长空间极大。

技术前沿前沿/新兴技术
技术栈PyTorch、Megatron-LM、DeepSpeed、CUDA、Triton、分布式训练、GPU优化
成长机会顶尖应届、课题
业务类型ambiguous

工作生活

50较低

工作地点在北京小米园区,属于科技园/产业园,现场办公,未明确提及弹性工作或远程。互联网大厂通常有一定加班文化,但JD未明确。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值

70中等

自动驾驶属于高速增长赛道,对社会有正向影响(提升出行安全),但岗位侧重内部优化,社会影响力间接。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 专卖店店长-无锡

    小米 · 无锡市
    AI 估算 · 8k-15k
  • 小米汽车-发动机旋转往复系统高级工程师

    小米 · 北京市
    AI 估算 · 25k-45k
  • 专卖店店长(宜兴)

    小米 · 无锡市
    AI 估算 · 6k-10k
  • 法务专员实习生

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-测试工程师-热管理系统测试

    小米 · 南京市
    AI 估算 · 15k-25k

相似职位推荐

  • 无线固件集成工程师Wireless Firmware Integration Engineer

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • 自动化控制工程师,软件

    特斯拉 · 上海市
    AI 估算 · 20k-35k

小米 的其他在招职位

  • 专卖店店长-无锡

    小米 · 无锡市
    AI 估算 · 8k-15k
  • 小米汽车-发动机旋转往复系统高级工程师

    小米 · 北京市
    AI 估算 · 25k-45k
  • 专卖店店长(宜兴)

    小米 · 无锡市
    AI 估算 · 6k-10k
  • 法务专员实习生

    小米 · 北京市
    AI 估算 · 3k-5k
  • 小米汽车-测试工程师-热管理系统测试

    小米 · 南京市
    AI 估算 · 15k-25k

相似职位推荐

  • 无线固件集成工程师Wireless Firmware Integration Engineer

    特斯拉 · 上海市
    AI 估算 · 20k-35k
  • 自动化控制工程师,软件

    特斯拉 · 上海市
    AI 估算 · 20k-35k