Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖应届-大模型训练框架研发工程师-基础技术平台
立即应聘

顶尖应届-大模型训练框架研发工程师-基础技术平台

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
无经验要求
全职员工
仅现场办公
硕士
软件工程
GPU
深度学习
PyTorch
CUDA
分布式训练
Megatron-LM
DeepSpeed

AI 估算 · 25k–35k

北京大厂AI核心岗位,硕士应届薪资具有竞争力,大模型方向人才稀缺,综合市场水平估算。

职位详情

关于这个职位

该职位是小米基础技术平台的大模型训练框架研发工程师,面向顶尖应届生

你将参与设计和优化基于 PyTorch、DeepSpeed 等框架的大模型训练系统,解决分布式通信、显存优化等关键技术问题,支撑大规模高效训练
岗位技术深度高,涉及深度学习系统底层优化,适合对 AI 基础设施有强烈兴趣的应届硕士或博士

最低要求

硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验

熟悉 C++ / Python,掌握至少一种深度学习框架(如 PyTorch),理解 Transformer 等深度学习原理算法
熟悉 GPU 和其他加速硬件的使用,有基本的性能调优经验
有良好团队协作与沟通能力,有强烈的上进心和自我驱动,学习适应能力强,乐观自信,能挑战自我不断追求卓越

工作职责

基于 PyTorch、DeepSpeed、Megatron-LM 等,设计、优化大模型训练框架,提升效率、稳定性与扩展性,支撑大规模高效训练与部署

攻克分布式通信、内存显存优化、数据加载加速等关键技术,保障高效稳定训练,降低资源消耗
开展性能评估与调优,构建监控体系,实时定位瓶颈并提出优化方案,确保跨硬件最优性能

优先资格

有 CUDA 优化、Triton 经验优先

了解大模型训练框架,熟悉分布式训练原理和技术,能针对大模型训练性能瓶颈进行优化优先

AI 洞察

优缺点分析

优点

  • 接触大模型训练最前沿技术,技术深度和广度兼备
  • 小米平台资源丰富,项目规模大,成长空间广阔
  • 薪资待遇在应届生中具有很强竞争力,且公司品牌背书好
  • 技术门槛高,需要对深度学习系统和底层优化有深入理解
  • 工作强度可能较大,需应对复杂问题和快速迭代
  • 竞争激烈,需要持续学习和自我驱动

缺点 / 挑战

  • 适合对 AI 底层技术有浓厚兴趣、追求技术深度、乐于挑战的顶尖应届生

角色解读

  • 成为大模型训练框架领域的专家,主导底层架构设计与优化
  • 横向拓展至 AI 基础设施、分布式系统架构师等方向
  • 随着经验积累,可转向技术管理或高级研究员岗位
  • 设计和优化大模型训练框架,基于 PyTorch、DeepSpeed 等工具提升训练效率与稳定性
  • 攻克分布式通信、显存优化、数据加载加速等底层技术难题,降低资源消耗
  • 开展性能评估与调优,构建监控体系,定位瓶颈并提出优化方案
  • 扎实的 C++/Python 编程能力,深入理解深度学习原理和 Transformer 模型
  • 熟练使用 PyTorch 等深度学习框架,掌握 GPU 编程和性能调优基础
  • 了解分布式训练原理和技术,如模型并行、数据并行、通信优化等

申请策略

  • 了解小米的基础技术平台和 AI 战略,在面试中展现对齐
  • 准备一个完整的项目案例,从问题到方案再到效果,展示系统性思考
  • 突出大模型相关的项目经验,如训练框架搭建、性能优化等
  • 强调分布式训练、CUDA 编程或 Triton 等底层优化技能
  • 展示编程能力和算法理解,如 C++/Python 项目或竞赛经历
  • 深入学习 CUDA 编程和 GPU 架构,尝试优化简单算子
  • 熟悉 DeepSpeed、Megatron-LM 等框架的源码和原理
  • 阅读分布式训练相关论文,理解通信拓扑和并行策略

面试指南

  • 对于原理类问题,先清晰定义问题,再分层解释底层机制,最后结合实际应用
  • 对于优化类问题,使用 STAR 方法(情境-任务-行动-结果),突出分析过程和量化收益
  • 如何减少大模型训练中的显存占用?请介绍几种方法
  • 解释 All-Reduce 的原理,并说明其在分布式训练中的作用
  • 你对 PyTorch DDP 和 DeepSpeed ZeRO 的理解是什么?
  • 请描述一次你优化深度学习训练性能的经历
  • Transformer 模型为什么需要 Layer Normalization?
  • 复习分布式训练的核心概念和常见框架(PyTorch DDP、DeepSpeed、Megatron-LM)

匹配度报告

70
综合匹配度

顶尖应届,前沿大模型框架研发,技术成长快、薪资高,但工作强度可能较大。

适合人群
适合追求技术深度和薪酬回报,对工作生活平衡要求不高的顶尖应届生。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

该岗位属于大厂核心研发,薪资水平在应届生中具有很强竞争力,福利体系完善,补偿性动机满足较好。

薪资信号未披露(AI估算:25K-35K/月)

成长发展匹配

90较高

岗位涉及大模型训练前沿技术,技术栈新、挑战大,能快速积累底层系统能力,发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈PyTorch、DeepSpeed、Megatron-LM、CUDA、Triton、GPU
业务类型ambiguous

工作生活匹配

40较低

现场办公且未提及弹性工作制,大厂强度可能较高,生活化动机满足有限。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI 基础设施对技术进步有推动作用,但岗位不直接面向用户价值,意义感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k