Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
Deep Learning Performance Software Engineer
立即应聘

Deep Learning Performance Software Engineer

发布于 大约 16 小时前

普通员工/个人贡献者

上海市
中级经验
全职员工
仅现场办公
硕士
软件工程
GPU
XLA
LLVM
MLIR
TVM

AI 估算 · 35k–55k

AI领域核心岗位,英伟达上海薪资竞争力强,硕士+3年经验对标一线大厂高级工程师水平

职位详情

关于这个职位

这是一个深度学习性能软件工程师岗位,加入英伟达上海团队,专注于开发 GPU 加速的深度学习软件

你将参与编译器、领域特定语言和深度学习内核的开发与优化,并分析新兴 AI 工作负载的性能
职位要求扎实的 C/C++ 编程能力以及编译器相关经验,适合有技术追求的软件工程师

最低要求

Master's or Ph.D degree (or equivalent experience) in relevant discipline (CE, CS&E, CS, AI)

Excellent C/C++ programming and software design skills
Experience with XLA, TVM, MLIR, LLVM, deep learning models and algorithms
+ years of relevant work experience

工作职责

Develop compilers and DSLs for deep learning workloads

Design and implement highly optimized deep learning kernels
Continuously improve the compiler architecture for current and next generation chips
Perform performance analysis on emerging AI workloads and integrate with AI frameworks

AI 洞察

优缺点分析

优点

  • 身处 AI 核心赛道,英伟达是行业领导者,技术影响力大,产品广泛应用于各大企业
  • 接触前沿编译器技术(MLIR、LLVM)和高性能计算,技能积累价值高
  • 薪资福利优厚,外企文化相对平衡,工作环境精英化
  • 有机会与全球顶尖研究人员合作,参与开源项目并推动技术发展
  • 技术门槛高,需要同时掌握编译原理、深度学习、 GPU 架构等多领域知识
  • 工作强度较大,尤其是产品迭代期和项目攻坚阶段,可能需应对快节奏
  • 竞争激烈,团队内牛人众多,需要持续学习以保持优势
  • 适合具备扎实系统编程基础、对编译器和高性能计算有浓厚兴趣,并且希望在深度学习底层技术领域深耕的技术型人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深度方向:成为编译器或深度学习系统领域的资深专家,主导核心组件架构
  • 管理方向:从技术骨干转为技术团队负责人,带领团队攻克高性能计算难题
  • 跨领域发展:可转向 AI 框架开发、芯片软件栈设计或通用计算优化等方向
  • 开发深度学习编译器与领域特定语言,如 XLA、TVM、MLIR 等,用于高效执行深度学习模型
  • 设计并实现高度优化的深度学习内核(kernel),利用 GPU 硬件特性最大化性能
  • 持续改进编译器架构,适配当前及下一代芯片,提升整体计算效率
  • 对新兴 AI 工作负载进行性能分析,并与主流 AI 框架(如 TensorFlow、PyTorch)集成
  • 精通 C/C++ 编程与软件设计能力,具备扎实的底层系统开发经验
  • 深入了解编译器技术栈,如 XLA、TVM、MLIR、LLVM 等
  • 熟悉深度学习模型与算法,理解计算图优化、算子融合等概念
  • 具备 GPU 编程经验(CUDA 或 OpenCL)及性能调优能力

申请策略

  • 在简历中明确写出你在编译器或深度学习系统方向的具体贡献,避免泛泛而谈
  • 了解英伟达最新的 GPU 架构(如 Hopper、Blackwell)以及相关软件栈,面试中展现热情和见识
  • 重点突出编译器或 DSL 相关项目经验,如参与过 TVM、MLIR 或类似框架的开发
  • 展示 C/C++ 编码能力,可附上开源贡献或性能优化成果(如加速比、延迟降低等)
  • 强调对深度学习算法的理解,例如实现过并优化过经典模型
  • 若有 CUDA 编程经验或 GPU 性能调优案例,务必突出
  • 深入阅读 XLA 或 TVM 源码,尝试提交 patch 或完成小项目来积累实战经验
  • 系统学习 LLVM 和 MLIR 框架,理解 IR、pass、降级等概念

面试指南

  • 对于技术原理类问题,先阐述核心概念,再结合具体实现细节,最后对比不同方案优缺点
  • 对于项目经验类问题,采用 STAR 原则(情境、任务、行动、结果),量化成效
  • 对于开放设计类问题,先明确约束条件,然后提出多种候选方案并评估,最后给出推荐
  • 请解释一下 MLIR 的基本设计架构以及它如何解决传统编译器中的问题?
  • 如何优化一个卷积层在 GPU 上的性能?请从数据布局、线程配置、共享内存等角度阐述
  • 描述一个你曾经参与的性能优化项目,包括遇到的挑战、解决方案和最终效果
  • TVM 中的 AutoTVM 是如何工作的?与 XLA 的优化策略有何不同?
  • C++ 中虚函数、模板和 SFINAE 在实际编译器开发中的应用场景有哪些?

匹配度报告

79
综合匹配度

顶级外企、前沿编译器与高性能计算技术栈、薪资优厚,但工作强度可能较高

适合人群
适合追求技术深度、渴望在 AI 基础设施领域成为专家的技术驱动型求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活60
使命价值80

薪资福利匹配

85较高

英伟达作为顶级外企,薪资水平处于市场高端,且提供完善的福利待遇,补偿性动机满足度高。

薪资信号未披露(AI估算:35K-55K/月)

成长发展匹配

90较高

职位涉及编译器、高性能计算等前沿技术,成长空间极大,且公司鼓励技术创新和学习,发展性动机很强。

技术前沿前沿/新兴技术
技术栈C/C++、XLA、TVM、MLIR、LLVM、Deep Learning、GPU
业务类型profit_center

工作生活匹配

60中等

外企通常有相对灵活的工作模式,但职位未明确提及远程或弹性,且作为核心研发岗位可能面临一定强度,生活化动机满足度一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

深度学习是推动 AI 发展的关键力量,英伟达的产品广泛应用于科学研究与产业变革,职位对科技进步有直接贡献,意义感强。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号revolution in deep learning、enabling breakthroughs
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Arch Intern, CPU - 2026

    英伟达 · 上海市
    AI 估算 · 6k-12k
  • Deep Learning Performance Architect, CUTLASS DSL

    英伟达 · 上海市
    AI 估算 · 35k-65k
  • Senior Product Engineer

    英伟达 · 深圳市
    AI 估算 · 30k-50k
  • Solution Architect ISV - Robotics

    英伟达 · 深圳市
    AI 估算 · 35k-65k
  • Deep Learning Performance Architect

    英伟达 · 上海市
    AI 估算 · 40k-60k

相似职位推荐

  • 顶尖应届-大模型训练框架研发工程师-基础技术平台

    小米 · 北京市
    AI 估算 · 25k-35k
  • 顶尖应届-智能体研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-车机OS性能优化工程师(智能平台方向)-智能座舱

    小米 · 北京市
    AI 估算 · 25k-40k
  • 顶尖应届-智能体工程师-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-大模型算法工程师-软件

    小米 · 北京市
    AI 估算 · 20k-30k

英伟达 的其他在招职位

  • Arch Intern, CPU - 2026

    英伟达 · 上海市
    AI 估算 · 6k-12k
  • Deep Learning Performance Architect, CUTLASS DSL

    英伟达 · 上海市
    AI 估算 · 35k-65k
  • Senior Product Engineer

    英伟达 · 深圳市
    AI 估算 · 30k-50k
  • Solution Architect ISV - Robotics

    英伟达 · 深圳市
    AI 估算 · 35k-65k
  • Deep Learning Performance Architect

    英伟达 · 上海市
    AI 估算 · 40k-60k

相似职位推荐

  • 顶尖应届-大模型训练框架研发工程师-基础技术平台

    小米 · 北京市
    AI 估算 · 25k-35k
  • 顶尖应届-智能体研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-车机OS性能优化工程师(智能平台方向)-智能座舱

    小米 · 北京市
    AI 估算 · 25k-40k
  • 顶尖应届-智能体工程师-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-大模型算法工程师-软件

    小米 · 北京市
    AI 估算 · 20k-30k