Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Xiaomi logo
小米
顶尖实习-大模型推理加速研究员-AI平台-实习
立即应聘

顶尖实习-大模型推理加速研究员-AI平台-实习

发布于 大约 14 小时前

实习/见习

北京市
无经验要求
实习生
仅现场办公
硕士
软件工程
PyTorch
GPU优化
CUDA
系统性能优化
模型量化
SGLang
vLLM
大模型推理

AI 估算 · 6k–10k

小米实习薪资通常在6000-10000元/月,加上大模型热点,有一定竞争力。

职位详情

关于这个职位

这是一个面向在校硕士/博士的大模型推理加速实习岗位

你将参与开源推理引擎vLLM/SGLang的核心功能开发,负责大语言模型线上推理框架的性能优化,解决高并发、低延迟问题,并探索模型量化、蒸馏等前沿技术
适合对系统性能优化和AI推理感兴趣的同学

最低要求

学历背景:计算机/电子/数学等相关专业硕士及以上学历

编程能力:精通C/C++,熟悉Python,具备扎实的数据结构与算法基础
GPU与CUDA:熟悉NVIDIA GPU架构及编程模型,掌握CUDA核函数优化、显存管理、多流并发等技术,有实际性能调优经验

工作职责

参与和负责开源vLLM/SGLang推理引擎核心功能开发

负责大语言模型线上推理框架的性能优化,解决高并发、低延迟、高可靠性等核心问题,提升服务吞吐量与稳定性
调研并引入前沿技术,包括模型量化、蒸馏等轻量化开发

优先资格

ACM/ICPC、NOI等竞赛获奖者优先

熟悉PyTorch、Megatron、vLLM/SGLang等深度学习训练和推理框架优先

AI 洞察

优缺点分析

优点

  • 大模型推理是当前AI领域最热门的方向之一,技术积累含金量高
  • 小米AI平台资源丰富,有机会接触大规模线上系统,锻炼工程能力
  • 开源社区贡献机会,提升个人技术影响力
  • 涉及底层系统优化,需要较强的C++和CUDA功底,学习曲线陡峭
  • 线上高并发场景对系统的稳定性要求极高,调试和排查问题可能耗时
  • 适合对系统性能优化充满热情、有较强C++和CUDA基础、希望深入大模型推理领域的计算机或相关专业硕士/博士生

缺点 / 挑战

  • 实习期较短,需要快速产出成果,压力较大

角色解读

  • 实习表现优秀可转正为正式员工,进入小米AI平台核心研发团队
  • 可向大模型推理架构师或AI系统专家方向发展,成为行业稀缺人才
  • 积累前沿技术经验(如模型量化、蒸馏),为后续学术研究或工业界深造打下基础
  • 参与开源推理引擎vLLM/SGLang的核心功能开发,编写高性能C++和CUDA代码
  • 负责大模型推理系统的性能调优,解决高并发、低延迟场景下的系统瓶颈
  • 调研并实现模型量化、蒸馏等轻量化技术,提升推理效率
  • 精通C/C++和Python,具备扎实的数据结构与算法基础
  • 熟悉NVIDIA GPU架构和CUDA编程,有实际性能优化经验
  • 了解深度学习推理框架(如vLLM、TensorRT)或训练框架(PyTorch)者优先

申请策略

  • 在简历中强调对大规模分布式系统或GPU编程的热情,可附上技术博客链接
  • 投递前可尝试提交一些vLLM的小修复或功能PR,增加通过率
  • 突出C++和CUDA项目经验,尤其是性能优化相关(如矩阵乘优化、显存优化等)
  • 如果有开源项目贡献(尤其vLLM、PyTorch等),务必列出
  • 量化展示调优成果,如延迟降低X%、吞吐量提升Y%
  • 提前学习vLLM或SGLang的源码结构,理解推理引擎的核心流程
  • 熟悉NVIDIA Nsight等性能分析工具,练习CUDA内核编写与优化

面试指南

  • 对于性能优化问题,可套用'测量-定位-优化-验证'的框架,结合具体工具(如nvidia-smi、Nsight)和数据
  • 对于系统设计问题,先阐述核心概念,再讨论trade-off,最后给出实际案例
  • 请解释CUDA中grid、block、thread的层次结构,并举例如何优化内存访问
  • 描述你在项目中遇到过的一个性能瓶颈,你是如何分析和解决它的?
  • 简述vLLM的PagedAttention原理,以及它如何减少显存浪费?
  • 如何在推理过程中实现动态batch(continuous batching)?
  • 复习CUDA内存模型、共享内存、流并行等概念,并准备手写简单的kernel
  • 阅读vLLM论文和代码,理解PagedAttention、continuous batching等关键技术

匹配度报告

71
综合匹配度

顶尖大厂实习,前沿大模型推理技术栈,技能成长极快,但工作强度可能较大。

适合人群
最适合强烈追求技术成长和前沿领域经验的求职者,对薪资和WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利65
成长发展95
工作生活50
使命价值75

薪资福利匹配

65中等

小米作为上市大厂,实习薪资在行业中有竞争力,但作为实习生,薪资并非核心吸引力。福利方面JD未提及具体项目,因此分数中等。

薪资信号未披露(AI估算:6K-10K/月)

成长发展匹配

95较高

该岗位提供前沿的大模型推理技术栈(vLLM、CUDA优化、模型量化),高强度技能成长,团队为AI平台核心,发展空间极大。

技术前沿前沿/新兴技术
技术栈vLLM、SGLang、CUDA、GPU优化、模型量化、蒸馏、大模型推理
业务类型profit_center

工作生活匹配

50较低

实习通常为现场办公,北京办公室,具体WLB未提及,但互联网实习强度可能较高,因此分数一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

大模型推理优化对于推动AI效能有积极意义,属于技术驱动价值,行业处于高速增长期。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

小米 的其他在招职位

  • 【小米汽车】零售实习生

    小米 · 郑州市
    AI 估算 · 2k-3k
  • 韩国电商销售经理

    小米 · 武汉市
    AI 估算 · 15k-25k
  • 小米汽车-充电功能开发工程师

    小米 · 南京市
    AI 估算 · 30k-50k
  • 顶尖实习-全模态理解和推理大模型算法研究员-大模型-实习

    小米 · 北京市
    AI 估算 · 5k-8k
  • 智能客服负责人

    小米 · 北京市
    AI 估算 · 40k-70k

相似职位推荐

  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k
  • 智能体测评开发工程师-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 25k-45k

小米 的其他在招职位

  • 【小米汽车】零售实习生

    小米 · 郑州市
    AI 估算 · 2k-3k
  • 韩国电商销售经理

    小米 · 武汉市
    AI 估算 · 15k-25k
  • 小米汽车-充电功能开发工程师

    小米 · 南京市
    AI 估算 · 30k-50k
  • 顶尖实习-全模态理解和推理大模型算法研究员-大模型-实习

    小米 · 北京市
    AI 估算 · 5k-8k
  • 智能客服负责人

    小米 · 北京市
    AI 估算 · 40k-70k

相似职位推荐

  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k
  • 智能体测评开发工程师-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 25k-45k