Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Xiaomi logo
小米
训练平台性能优化工程师实习生
立即应聘

训练平台性能优化工程师实习生

发布于 大约 18 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
学历未注明
实习与临时职位
PyTorch
CUDA
GPU性能优化
模型压缩
NCCL
分布式训练
DeepSpeed
混合精度训练
Megatron

AI 估算 · 4k–8k

实习岗位薪资通常在4-8k/月,含餐补等福利,技术含量高但竞争激烈。

职位详情

关于这个职位

该实习职位专注于深度学习训练平台的性能优化,你将参与模型训练全链路的分析与加速,研发混合精度训练、梯度压缩等前沿技术,并构建自动化训练工具链

适合对系统性能优化有浓厚兴趣的同学

最低要求

精通深度学习训练加速技术,熟悉分布式训练框架设计

掌握CUDA编程及GPU性能分析工具(nsys/torch profiler)
熟练使用PyTorch框架,具备训练流程优化实战经验
熟悉常见模型压缩技术(量化/剪枝/蒸馏)及落地应用

工作职责

深度优化训练流程

主导模型训练全链路性能分析与优化,设计GPU资源弹性调度策略
开发自动化训练加速工具链,构建可扩展的云端训练框架
研发混合精度训练、梯度压缩等前沿技术,突破训练吞吐瓶颈
构建训练优化体系
制定标准化训练效能评估体系,建立成本-效率量化模型
设计可复用的训练加速组件库,沉淀最佳实践方法论
开发训练过程性能分析平台,实现性能问题智能诊断
赋能业务研发
优化多任务资源调度策略,提升GPU集群整体利用率
为算法团队提供训练加速解决方案,缩短模型迭代周期

优先资格

有mmcv/deepspeed/megatron/ray等训练框架开发经验

算子优化经验,triton/cuda等开发经验.
熟悉MPI/NCCL等分布式通信协议
在MLSys/ICLR等顶会发表过训练优化相关论文

AI 洞察

优缺点分析

优点

  • 接触前沿训练优化技术,积累高性能计算经验
  • 小米平台资源丰富,可参与大规模集群优化项目
  • 团队技术氛围浓厚,有导师指导,成长快
  • 需要扎实的底层基础和系统编程能力,学习曲线陡峭
  • 实习期可能面临高压项目交付,加班较多

缺点 / 挑战

  • 对数学和分布式系统理解要求较高
  • 适合对GPU底层优化充满热情、喜欢挑战性能极限、有较强自驱力的同学

角色解读

  • 从训练优化实习生向高级性能工程师发展,深入GPU底层优化
  • 可转向AI infra、MLSys等方向,成为系统架构师
  • 发表顶会论文,进入学术界或顶级研究院
  • 负责模型训练全链路的性能分析,定位瓶颈并设计优化方案
  • 开发自动化训练加速工具,如混合精度训练、梯度压缩等模块
  • 优化GPU集群资源调度策略,提升整体利用率和训练吞吐
  • 精通PyTorch和分布式训练框架,熟悉CUDA编程及性能分析工具
  • 掌握模型压缩技术(量化、剪枝、蒸馏)并有实战经验
  • 了解大规模集群调度系统(如Kubernetes、Slurm)优先

申请策略

  • 关注小米AI infra团队的博客或技术分享,展示对业务的了解
  • 准备一个训练优化的案例,表明你如何解决实际瓶颈
  • 突出深度学习训练加速项目,如混合精度、分布式训练等
  • 展示CUDA编程或算子优化经验,附上GitHub链接
  • 强调模型压缩或系统调优的量化成果(如吞吐提升X倍)
  • 系统学习CUDA和GPU架构,熟悉nsys、NVIDIA Nsight等工具
  • 阅读DeepSpeed、Megatron等开源框架源码,尝试贡献

面试指南

  • 从原理入手,结合实践经验,使用STAR法则描述项目
  • 先分析问题,再提出方案,最后量化效果
  • 请解释分布式训练中AllReduce的原理和优化方法
  • 如何分析PyTorch训练过程中的性能瓶颈?
  • 简述混合精度训练的实现流程和注意事项
  • 有没有做过CUDA算子优化?请举例
  • 如何提高GPU集群的利用率?
  • 复习分布式训练论文,如Ring AllReduce、ZeRO系列

职位点评

62
综合评分

大厂实习,技术前沿,成长快,但薪资一般且需现场办公。

更适合这类人
适合追求技术成长、愿意投入时间学习前沿技能的同学。
表现最好
成长发展
相对薄弱
工作生活
薪资福利50
成长发展90
工作生活40
使命价值70

薪资福利

50较低

实习生薪资相对较低,但小米提供餐补和实习证明,福利一般。

薪资信号未披露(AI估算:4K-8K/月)

成长发展

90较高

职位涉及前沿训练优化技术,有导师指导,成长空间极大。

技术前沿前沿/新兴技术
技术栈CUDA、PyTorch、混合精度训练、梯度压缩、分布式训练
成长机会导师制
业务类型ambiguous

工作生活

40较低

仅现场办公,北京通勤强度大,实习可能加班。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

70中等

训练优化是AI基础设施的核心,推动行业效率提升,但短期社会影响力有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 党工团干事实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-4k
  • 小米汽车-零售顾问-泰州

    小米 · 泰州市
    AI 估算 · 7k-11k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • AI硬件实习生

    小米 · 北京市
    AI 估算 · 4k-8k
  • 产品运营实习生-2027届

    小米 · 南京市
    AI 估算 · 4k-5k

相似职位推荐

  • 酒店业务实习生(广西)(MJ035140)

    携程 · 南宁市
    AI 估算 · 2k-3k
  • rednote AI Native实习生(Web / Android / iOS方向)

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 新媒体实习生

    顺丰速运 · 深圳市
    AI 估算 · 3k-5k
  • 实习生

    希音 · 广州市
    AI 估算 · 3k-5k
  • 自动驾驶QA实习生

    美团 · 深圳市
    AI 估算 · 5k-7k

小米 的其他在招职位

  • 党工团干事实习生-2027届

    小米 · 北京市
    AI 估算 · 3k-4k
  • 小米汽车-零售顾问-泰州

    小米 · 泰州市
    AI 估算 · 7k-11k
  • 运动健康算法工程师-实习-2027届

    小米 · 深圳市
    AI 估算 · 5k-8k
  • AI硬件实习生

    小米 · 北京市
    AI 估算 · 4k-8k
  • 产品运营实习生-2027届

    小米 · 南京市
    AI 估算 · 4k-5k

相似职位推荐

  • 酒店业务实习生(广西)(MJ035140)

    携程 · 南宁市
    AI 估算 · 2k-3k
  • rednote AI Native实习生(Web / Android / iOS方向)

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 新媒体实习生

    顺丰速运 · 深圳市
    AI 估算 · 3k-5k
  • 实习生

    希音 · 广州市
    AI 估算 · 3k-5k
  • 自动驾驶QA实习生

    美团 · 深圳市
    AI 估算 · 5k-7k