Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Nvidia logo
英伟达
Deep Learning Performance Software Engineer
立即应聘

Deep Learning Performance Software Engineer

发布于 大约 11 小时前

普通员工/个人贡献者

上海市
高级经验
全职员工
仅现场办公
硕士
软件工程
GPU
XLA
CUDA
LLVM
MLIR
TVM
Performance Optimization

AI 估算 · 35k–65k

外企巨头,上海硕士+3年经验,深度学习性能优化稀缺岗位,薪资竞争力强。

职位详情

关于这个职位

该职位主要面向深度学习领域的性能软件工程师,负责开发GPU加速的深度学习软件,包括编译器、DSL和高性能核函数

您将参与前沿AI工作负载的性能分析,并与AI框架集成
工作地点在上海,团队专注于推动深度学习技术的边界

最低要求

计算机工程、计算机科学与工程、计算机科学、人工智能等相关专业硕士或博士学位(或同等经验)

优秀的C/C++编程和软件设计能力
有XLA、TVM、MLIR、LLVM、深度学习模型和算法经验
年以上相关工作经验

工作职责

为深度学习工作负载开发编译器和领域特定语言(DSL)

设计和实现高度优化的深度学习内核
持续改进当前和下一代芯片的编译器架构
对新兴AI工作负载进行性能分析,并与AI框架集成

AI 洞察

优缺点分析

优点

  • 英伟达是GPU计算和AI领域的领导者,技术积累深厚,品牌影响力强
  • 接触最前沿的深度学习技术和下一代芯片架构,技能成长空间大
  • 外企文化通常注重工作生活平衡,福利完善,薪资待遇有竞争力
  • 对技术水平要求高,需要同时掌握编译器、GPU编程和深度学习知识
  • 技术迭代快,需要持续学习以保持竞争力
  • 适合对底层性能优化充满热情、有编译器或高性能计算背景、希望在AI基础设施领域深耕的技术型人才

缺点 / 挑战

  • 工作强度可能较高,尤其是项目交付期或新芯片发布前

角色解读

  • 技术专家路线:成为深度学习编译器或GPU性能优化领域的顶尖专家
  • 架构师路线:参与下一代芯片和编译器架构的设计与决策
  • 跨团队影响力:与全球AI研究团队合作,推动技术标准
  • 开发深度学习编译器(如XLA、TVM)和领域特定语言,优化模型部署效率
  • 设计并实现高度优化的GPU内核,针对英伟达最新芯片架构进行性能调优
  • 对新型AI工作负载进行性能分析,找出瓶颈并集成到主流深度学习框架中
  • 精通C/C++,具备扎实的软件工程和系统设计能力
  • 深入理解深度学习模型和算法,熟悉常见框架(TensorFlow/PyTorch)
  • 掌握编译器技术(LLVM、MLIR)或GPU编程(CUDA)经验
  • 具备性能分析和优化能力,了解计算机体系结构

申请策略

  • 英伟达非常看重技术深度和热情,可以在面试中主动分享自己的技术博客或开源项目
  • 了解公司最新的产品(如H100、Blackwell)和深度学习技术路线,展现对公司的关注
  • 突出编译器项目经验:如参与过LLVM、TVM、MLIR的贡献或二次开发
  • 展示深度学习优化案例:如通过CUDA将模型推理速度提升数倍
  • 强调C/C++编程能力:包括内存管理、多线程、SIMD等底层优化技巧
  • 如有开源贡献,务必列出,尤其是深度学习或编译器相关项目
  • 深入学习MLIR和LLVM框架,尝试编写简单的pass或dialect
  • 复习计算机体系结构知识,尤其是GPU架构(如CUDA core、Tensor Core)

面试指南

  • 结构化回答:先给出核心概念,再结合实际项目经验,最后总结收获和影响
  • 例:'TVM的核心思想是通过层次化IR进行优化
  • 我在xx项目中使用了TVM,通过自动调优将模型推理速度提升了30%...'
  • 深入原理:对于性能优化问题,要体现对底层原理的理解(如内存层次、计算吞吐),并用具体数据或案例支撑
  • 展现热情:可以分享个人兴趣,如'我经常关注NVIDIA的GTC演讲,对最新的Tensor Core特性很感兴趣
  • '
  • 请解释TVM的工作原理,以及它如何优化深度学习模型?
  • 如何手动优化一个矩阵乘法?请描述关键优化技巧(如tiling、向量化、共享内存)

职位点评

82
综合评分

技术领先外企,深度学习编译器核心岗位,薪资高、成长快,但需现场办公。

更适合这类人
最适合追求技术成长、热爱底层优化和前沿技术的求职者,对薪资和职业发展有较高期望。
表现最好
成长发展
相对薄弱
工作生活
薪资福利90
成长发展95
工作生活70
使命价值75

薪资福利

90较高

薪资处于行业高端,外企福利完善(如补充医疗、股票期权),但JD未明确具体薪资和福利,但基于公司和岗位可判断补偿性很强。

薪资信号未披露(AI估算:35K-65K/月)

成长发展

95较高

深度学习编译器是前沿技术领域,工作内容涉及最新芯片架构和AI框架,技能成长空间极大,且公司内部技术交流丰富。

技术前沿前沿/新兴技术
技术栈Deep Learning、Compiler、GPU、XLA、TVM、MLIR、LLVM、CUDA
业务类型ambiguous

工作生活

70中等

JD未明确远程或弹性工作,但英伟达中国通常要求坐班,属于仅现场办公,但对于资深员工可能有灵活安排。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

75中等

深度学习技术推动AI发展,具有较高的社会价值,但JD未直接提及使命或社会影响。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Deep Learning Compiler CI/Infrastructure Engineer

    英伟达 · 上海市
    AI 估算 · 30k-60k
  • Senior MLOps Manager

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Software Architect, Autonomous Vehicles - Backend and AI Agents

    英伟达 · 深圳市
    AI 估算 · 40k-70k
  • Applied Research Intern, Robotics - 2026

    英伟达 · 上海市
    AI 估算 · 6k-10k
  • Simulation Engineer, Industrial Physics and Robotics

    英伟达 · 上海市
    AI 估算 · 40k-70k

相似职位推荐

  • Assoc, FrontEnd Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 15k-25k
  • 算法专家TL(广告商业化-投放算法)

    希音 · 广州市
    AI 估算 · 50k-80k
  • Java开发专家

    网易 · 杭州市
    AI 估算 · 35k-55k
  • Java开发工程师(营销活动方向)-【游戏事业部】

    快手 · 杭州市
    AI 估算 · 30k-50k
  • Section Lead, OTA Onboard Development (RD4.0 B3)

    奔驰 · 上海市
    AI 估算 · 40k-60k

英伟达 的其他在招职位

  • Deep Learning Compiler CI/Infrastructure Engineer

    英伟达 · 上海市
    AI 估算 · 30k-60k
  • Senior MLOps Manager

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Software Architect, Autonomous Vehicles - Backend and AI Agents

    英伟达 · 深圳市
    AI 估算 · 40k-70k
  • Applied Research Intern, Robotics - 2026

    英伟达 · 上海市
    AI 估算 · 6k-10k
  • Simulation Engineer, Industrial Physics and Robotics

    英伟达 · 上海市
    AI 估算 · 40k-70k

相似职位推荐

  • Assoc, FrontEnd Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 15k-25k
  • 算法专家TL(广告商业化-投放算法)

    希音 · 广州市
    AI 估算 · 50k-80k
  • Java开发专家

    网易 · 杭州市
    AI 估算 · 35k-55k
  • Java开发工程师(营销活动方向)-【游戏事业部】

    快手 · 杭州市
    AI 估算 · 30k-50k
  • Section Lead, OTA Onboard Development (RD4.0 B3)

    奔驰 · 上海市
    AI 估算 · 40k-60k