Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/训练平台性能优化工程师实习生
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市
初级经验
实习生
仅现场办公
学历未注明
实习/见习

标签

PyTorchCUDAGPU性能分析模型压缩分布式训练资源调度云端训练框架深度学习训练加速
💡

核心评价

技术前沿的大厂核心实习,成长空间巨大,是积累硬核AI系统经验的黄金跳板。

训练平台性能优化工程师实习生

🤖 AI 估测:¥8K-15K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于深度学习训练平台性能优化的实习岗位
你将负责分析和优化模型训练全链路的性能,开发自动化训练加速工具链,并构建可扩展的云端训练框架
同时,你需要研发混合精度训练、梯度压缩等前沿技术,并构建训练效能评估体系与性能分析平台,以提升GPU集群的整体利用率和模型迭代效率

✓工作职责

深度优化训练流程
主导模型训练全链路性能分析与优化,设计GPU资源弹性调度策略
开发自动化训练加速工具链,构建可扩展的云端训练框架
研发混合精度训练、梯度压缩等前沿技术,突破训练吞吐瓶颈
构建训练优化体系
制定标准化训练效能评估体系,建立成本-效率量化模型
设计可复用的训练加速组件库,沉淀最佳实践方法论
开发训练过程性能分析平台,实现性能问题智能诊断
赋能业务研发
优化多任务资源调度策略,提升GPU集群整体利用率
为算法团队提供训练加速解决方案,缩短模型迭代周期

⭐最低要求

精通深度学习训练加速技术,熟悉分布式训练框架设计
掌握CUDA编程及GPU性能分析工具(nsys/torch profiler)
熟练使用PyTorch框架,具备训练流程优化实战经验
熟悉常见模型压缩技术(量化/剪枝/蒸馏)及落地应用
具备大规模集群资源调度系统开发经验者优先

👍优先资格

【技术加分项】
有mmcv//deepspeed/megatron/ray等训练框架开发经验
算子优化经验,triton/cuda等开发经验.
熟悉MPI/NCCL等分布式通信协议
在MLSys/ICLR等顶会发表过训练优化相关论文
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公