Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/MiMo-大模型训练框架开发工程师
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch高性能计算模型优化NCCL分布式训练Megatron-LMDeepSpeed
💡

核心评价

技术顶尖的大厂核心研发岗,成长空间巨大,薪资竞争力强,但对工作地点和投入度要求明确。

MiMo-大模型训练框架开发工程师

🤖 AI 估测:¥35K-65K

发布时间:29 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型训练框架开发的核心技术岗位
你将基于PyTorch、DeepSpeed、Megatron-LM等主流框架,参与设计和优化支撑万卡集群高效训练的系统,解决分布式通信、内存优化等关键难题,确保大规模AI模型训练的稳定性和性能

✓工作职责

基于 PyTorch、DeepSpeed、Megatron-LM 等技术,参与大模型训练框架的设计、开发与优化,提升模型训练的效率、稳定性与扩展性,支撑大规模模型的高效训练和部署
解决万卡集群中大模型训练中的关键技术难题,包括分布式训练通信、内存显存优化、数据加载与预处理加速等,保障训练高效稳定,降低资源消耗
开展大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能

⭐最低要求

1–5 年高性能计算 / 分布式训练 / 深度学习系统研发经验
熟练阅读并修改 PyTorch/DeepSpeed/Megatron-LM 核心源码,有线上调优案例
熟练使用 nsight/NCCL profiler 分析任务训练性能瓶颈
熟悉 InfiniBand/RoCEv2 网络拓扑,能独立调优 DP/TP/PP/EP 切分策略,解决大规模下通信-计算重叠问题
具备 Python/C++ 混合开发能力,代码洁癖+CI/CD 意识
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公