Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/小米/顶尖实习- 大模型训练推理方向-Mi claw
Xiaomi logo
X
小米 (Xiaomi)

职位信息

北京市 / 江苏省-南京市 / 广东省-深圳市
无经验要求
实习生
仅现场办公
本科
实习/见习

标签

AI加速器高性能计算CUDA系统性能优化模型量化大模型推理算子优化
💡

核心评价

顶尖大厂实习,技术栈前沿,成长性极佳,适合技术驱动型人才。

顶尖实习- 大模型训练推理方向-Mi claw

🤖 AI 估测:¥8K-15K

发布时间:29 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型推理优化的顶尖实习岗位
你将研究并应用业界前沿的推理加速技术(如量化、注意力优化),探索端侧场景下的高效模型结构与推理策略,并参与模型与芯片的协同设计
最终目标是将研究成果转化为可落地的工程方案,实现性能的量化提升

✓工作职责

研究并复现业界与学术界 SOTA 的大模型推理优化技术,包括但不限于极低比特量化、FlashAttention、投机解码(Speculative Decoding)、KV Cache 优化等关键方向,并在真实端侧场景中进行性能评估与对比分析
面向端侧算力与内存受限场景,探索高效的大模型结构与推理策略,如端侧友好的 MoE 方案、稀疏与线性注意力、长上下文推理优化等,推动模型在性能、效果与资源消耗之间的最优权衡
参与大模型与芯片协同设计(Model–Chip Co-design),从模型结构、算子设计到推理系统层面进行联合优化,深入理解端侧 NPU / GPU / CPU 架构对模型推理性能的影响
与模型、系统、芯片团队深度协作,将研究成果转化为可落地的工程方案,并有机会参与核心模块的设计与实现,产生可量化的性能提升结果

⭐最低要求

计算机科学、人工智能、电子工程或相关专业在读本科 / 硕士 / 博士,对大模型、系统或芯片方向有强烈兴趣
具备扎实的算法与系统基础,对复杂系统的性能瓶颈具有较强分析能力,愿意深入到实现细节解决“难而重要”的问题
至少在以下一个或多个方向具备良好基础或实践经验:
大模型推理与优化(Attention、KV Cache、并行推理等)
模型压缩与量化(INT8 / INT4 / 更低比特)
高性能计算、并行计算或系统性能优化
编译器、算子优化或 AI 加速器相关经验
具备良好的代码能力(C++ / Python / CUDA 等至少一种),能够独立完成实验、分析性能数据并清晰总结结论
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 材料及轻量化实习生

    小米

    上海市 · 仅现场办公

  • 安全事务经理(网安)

    小米

    北京市 · 仅现场办公

  • 大模型技术专家(Agent方向)

    小米

    北京市 · 仅现场办公

  • 参控股公司管理实习生-2027届

    小米

    北京市 · 仅现场办公

  • 小米汽车-自动驾驶行车产品经理实习生

    小米

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公