Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
Solution Architecture Intern, AI Infra - 2026
立即应聘

Solution Architecture Intern, AI Infra - 2026

发布于 大约 2 小时前

实习/见习

北京市 / 上海市
无经验要求
实习生
仅现场办公
本科
研究与开发 (研发)
LLM
CUDA
SGLang
vLLM
GEMM
Attention
Kv-Cache
Performance Optimization
Distributed Training

AI 估算 · 6k–12k

英伟达全球顶尖AI公司,实习薪资竞争力强,北京/上海生活成本高,参考行业水平估算月薪范围。

职位详情

关于这个职位

作为AI基础设施解决方案架构实习生,你将加入英伟达的尖端AI计算团队,深入参与开源推理框架(如SGLang、vLLM)的优化,设计CUDA内核,开发KV-cache卸载方案,并研究分布式训练中的计算性能问题

你将与全球顶尖工程师合作,接触最前沿的AI加速技术,为大型模型的部署和推理提供创新解决方案

最低要求

正在攻读电气工程、自动化、计算机科学、计算数学或相关专业的学士、硕士或博士学位

对加速计算、并行计算和异构计算有浓厚兴趣,并愿意深入钻研
扎实的编程能力,良好的数据结构和计算机系统概念理解
较强的学习和适应能力,善于分析和解决问题,能独立探索解决方案

工作职责

深入了解开源推理框架(如SGLang和vLLM),并与社区合作开发新功能和算子,进行性能优化和模型适配

设计和实现CUDA内核/算子(例如GEMM、attention及相关原语),用于高效可扩展的LLM推理和训练
开发并优化LLM场景下的KV-cache卸载框架,支持在CPU/SSD/远程存储上的多级KV-cache卸载和重用,以加速推理(团队项目:https://github.com/taco-project/FlexKV)
负责分布式训练中计算性能相关的研发工作,持续探索性能优化的方法和技术
深入研究机器学习中的计算问题,总结常见计算模式与需求,并开发示例代码、加速库或框架组件

优先资格

熟悉异构计算、分布式训练、并行计算或其他高性能计算领域

有性能分析、性能建模或性能优化经验,以及开源框架贡献经历
具备定义新问题和探索解决方案空间的强大能力
熟练使用AI辅助编程工具

AI 洞察

优缺点分析

优点

  • 英伟达作为AI硬件和软件领导者,提供顶级技术平台和导师资源
  • 接触最前沿的AI基础设施技术(LLM推理、分布式训练、CUDA优化)
  • 开源社区贡献机会,提升行业影响力
  • 位于北京/上海核心科技区,实习津贴具有竞争力
  • 技术难度高,需要深入理解GPU架构和并行计算,学习曲线陡峭

缺点 / 挑战

  • 工作强度可能较高,项目节奏快,需主动探索和解决问题
  • 与其他顶尖实习生竞争,压力较大
  • 适合对系统编程和AI加速有浓厚兴趣、喜欢挑战技术难题的计算机/电子相关专业学生,尤其是希望从事AI基础设施或高性能计算方向的求职者

角色解读

  • 技术深潜:成为高性能计算和AI系统优化专家,未来可从事AI编译器、分布式系统等方向
  • 架构转型:积累系统级设计经验,转向AI解决方案架构师或系统架构师
  • 学术衔接:实习经历为攻读更高学位或进入顶级AI实验室奠定基础
  • 你将深入开源推理框架(SGLang、vLLM)的底层,贡献代码并优化算子性能
  • 设计和实现CUDA内核(如GEMM、attention),提升LLM推理和训练的效率
  • 开发KV-cache卸载框架,突破显存限制,加速大模型推理
  • 研究分布式训练中的计算瓶颈,提出并实施性能优化方案
  • 扎实的编程基础(C/C++、Python),熟悉数据结构和计算机体系结构
  • 对GPU编程和并行计算有深入理解,CUDA编程经验为重要加分项
  • 熟悉机器学习框架(PyTorch等)和常见模型结构(Transformer)
  • 具备性能分析和调优经验,能使用工具定位瓶颈

申请策略

  • 在简历和面试中展现对英伟达技术的热情,提及具体使用过的工具或参与过的社区
  • 提前了解英伟达在AI基础设施领域的最新动态(如DGX Cloud、AI Enterprise)
  • 突出高性能计算或GPU编程相关项目经验,如CUDA优化、并行算法实现
  • 强调开源贡献经历,如向vLLM、PyTorch等提交过PR
  • 展示对LLM推理系统的理解,包括KV-cache、批处理等优化技术
  • 附上GitHub链接或技术博客,证明编程和解决问题的能力
  • 系统学习CUDA编程和GPU架构(如NVIDIA官方课程)
  • 动手实践开源推理框架,尝试复现或改进其优化策略

面试指南

  • 结构化回答:先概述原理,再结合项目经验,最后总结收获
  • 采用STAR法则(情境、任务、行动、结果)描述项目经历
  • 对不确定的问题,坦诚承认并展示推理过程,体现学习能力
  • 请解释CUDA中warp和thread block的关系,以及如何优化全局内存访问
  • 你如何优化一个LLM推理的attention计算?FlashAttention的原理是什么?
  • 描述一个你参与的性能优化项目,用了哪些工具和方法?结果如何?
  • 你对vLLM或SGLang的架构了解多少?它们如何实现高效推理?
  • 如何理解分布式训练中的all-reduce?有实际调优经验吗?

匹配度报告

74
综合匹配度

顶级AI公司实习,前沿技术深度实践,薪资良好但需现场办公,成长机会极大。

适合人群
最适合以技术成长为核心驱动、愿意投入高强度学习的学生,对工作生活平衡要求较低的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利70
成长发展95
工作生活50
使命价值80

薪资福利匹配

70中等

实习薪资在行业内属于中上水平,但相比全职岗位偏低;福利如餐补、交通等未明确。总体补偿性满足度中等偏上。

薪资信号未披露(AI估算:6K-12K/月)

成长发展匹配

95较高

该实习提供了前沿技术栈(LLM、CUDA、分布式训练)的深度实践机会,并有导师和开源社区成长路径,发展性动机得到极大满足。

技术前沿前沿/新兴技术
技术栈SGLang、vLLM、CUDA、KV-cache、LLM、Distributed Training
成长机会导师制(隐含)
业务类型profit_center

工作生活匹配

50较低

要求现场办公,未提及弹性工作或远程选项;北京/上海通勤压力大,但实习周期较短。生活化动机满足度中等偏下。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

80较高

英伟达推动AI加速技术发展,对社会有显著正向影响;AI基础设施是高速增长赛道,工作内容具有开拓性。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号重新定义行业
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Senior Supply Base Engineer

    英伟达 · 深圳市
    AI 估算 · 25k-45k
  • Senior Developer Relations Manager for DataBase and Data Processing

    英伟达 · 北京市
    AI 估算 · 40k-60k
  • Senior Developer Relations Manager - AI Algorithms, Datasets, and Benchmarks

    英伟达 · 北京市
    AI 估算 · 35k-55k
  • Solution Architect - ISV for AI Infra

    英伟达 · 北京市
    AI 估算 · 35k-60k
  • AI Computing Software Development Engineer, TensorRT

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 运筹优化算法工程师(实习生)

    顺丰速运 · 深圳市
    AI 估算 · 4k-6k
  • 算法工程师(医疗数据)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • Manager, Evaluation & Validation, MCICC

    默沙东 · 上海市
    AI 估算 · 35k-55k
  • Principal Scientist

    强生 · 上海市
    AI 估算 · 40k-65k
  • Lab Research& Development Intern

    国际香精香料公司 · 上海市
    AI 估算 · 3k-5k

英伟达 的其他在招职位

  • Senior Supply Base Engineer

    英伟达 · 深圳市
    AI 估算 · 25k-45k
  • Senior Developer Relations Manager for DataBase and Data Processing

    英伟达 · 北京市
    AI 估算 · 40k-60k
  • Senior Developer Relations Manager - AI Algorithms, Datasets, and Benchmarks

    英伟达 · 北京市
    AI 估算 · 35k-55k
  • Solution Architect - ISV for AI Infra

    英伟达 · 北京市
    AI 估算 · 35k-60k
  • AI Computing Software Development Engineer, TensorRT

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 运筹优化算法工程师(实习生)

    顺丰速运 · 深圳市
    AI 估算 · 4k-6k
  • 算法工程师(医疗数据)

    中国平安 · 深圳市
    AI 估算 · 20k-35k
  • Manager, Evaluation & Validation, MCICC

    默沙东 · 上海市
    AI 估算 · 35k-55k
  • Principal Scientist

    强生 · 上海市
    AI 估算 · 40k-65k
  • Lab Research& Development Intern

    国际香精香料公司 · 上海市
    AI 估算 · 3k-5k