Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
Deep Learning Performance Architect
立即应聘

Deep Learning Performance Architect

发布于 大约 13 小时前

普通员工/个人贡献者

上海市 / 北京市
高级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
PyTorch
性能建模
TensorFlow
硬件架构
LLM
JAX
CUDA
TensorRT
AIGC

AI 估算 · 50k–80k

英伟达是全球AI芯片领导者,该职位要求5年以上经验且技术前沿,薪资竞争力强,参照一线大厂高级技术岗水平。

职位详情

关于这个职位

该职位是英伟达深度学习性能架构师,负责分析前沿LLM等深度学习模型,开发性能模型与优化方案,并与硬件、软件团队协作,影响下一代AI处理器架构

适合有深厚DL框架和硬件架构经验、热衷性能优化的资深技术专家

最低要求

BS, MS or PhD in relevant discipline (CS, EE, Math, etc.) or equivalent experience.

+ years work experience.
Experience with popular AI models (e.g., LLM and AIGC models).
Be familiar with typical deep learning SW framework (e.g., Torch/JAX/TensorFlow/TensorRT).
Knowledge and experience on hardware architectures for deep learning applications.

工作职责

Analyze state of the art DL networks (LLM etc.), identify and prototype performance opportunities to influence SW and Architecture team for NVIDIA's current and next gen inference products.

Develop analytical models for the state of the art deep learning networks and algorithm to innovate processor and system architectures design for performance and efficiency.
Specify hardware/software configurations and metrics to analyze performance, power, and accuracy in existing and future uni-processor and multiprocessor configurations.
Collaborate across the company to guide the direction of next-gen deep learning HW/SW by working with architecture, software, and product teams.

AI 洞察

优缺点分析

优点

  • 技术领先性:接触最前沿的AI模型和硬件架构,持续站在技术浪潮之巅
  • 平台影响力:英伟达在AI芯片领域全球领先,你的工作直接作用于旗舰产品
  • 学习资源:与全球顶尖的架构师和软件工程师合作,内部技术积累深厚
  • 薪资福利:具有竞争力的薪酬和股权,以及良好的职业发展空间
  • 理论深度要求:不仅需要工程实现能力,还需深入理解硬件原理和算法理论
  • 适合5年以上深度学习或高性能计算经验、对硬件架构有浓厚兴趣、乐于攻克性能极限的资深工程师

缺点 / 挑战

  • 高期望值:需要快速掌握最新模型并产出优化方案,技术更新迭代快,压力较大
  • 跨部门协作多:需要与多个团队沟通,协调不同目标,沟通成本较高

角色解读

  • 技术纵深发展:成为深度学习性能优化领域的顶级专家,主导关键项目
  • 跨团队影响力:从性能建模扩展到架构设计,参与定义下一代AI芯片
  • 管理路径:未来可晋升为技术主管或架构师团队负责人,指导初级工程师
  • 分析最新的深度学习模型(如LLM、AIGC),识别性能瓶颈并设计优化方案,推动软硬件团队改进
  • 开发深度学习网络的性能分析模型,用于指导未来处理器和系统架构的设计,兼顾性能和能效
  • 定义硬件/软件配置和指标,评估现有和未来系统的性能、功耗和精度,为产品迭代提供数据支持
  • 精通深度学习框架(PyTorch、JAX、TensorFlow、TensorRT),能够进行模型分析和优化
  • 深入了解GPU或AI加速器的硬件架构,熟悉计算核心、内存层次、互连等对性能的影响
  • 具备扎实的编程能力(C++/Python),能够快速原型化性能改进方案
  • 有LLM或AIGC模型的实践经验,理解Transformer、分布式推理等技术

申请策略

  • 在面试中准备一个你主导的性能优化案例,从问题分析到方案落地,量化成果
  • 提前了解NVIDIA最新的GPU架构(如Blackwell)和软件栈,展示你对公司产品的热情
  • 突出在LLM或AIGC模型上的性能优化项目经验,包括使用的框架、硬件平台和量化结果
  • 展示对GPU/TPU等硬件架构的理解,如内存带宽、计算利用率、通信开销等优化案例
  • 强调与硬件或系统团队协作的经历,以及跨团队推动技术方案的能力
  • 列出相关论文、专利或开源贡献,证明技术深度
  • 深入学习TensorRT或NVIDIA推理优化工具,掌握模型压缩、量化等实用技能
  • 补充GPU体系结构知识(如CUDA核心、内存层次、NVLink),可通过NVIDIA官方课程

面试指南

  • 结构化分析:先从计算、内存、通信三个维度分解问题,再针对性提出硬件或软件优化方案,并用数据支撑
  • 案例驱动:用具体项目经验回答,展示从发现问题到验证效果的全过程,突出量化结果
  • 技术分层:区分算法层、框架层、硬件层的优化机会,体现系统化思维
  • 针对一个主流LLM(如LLaMA),你会如何分析其推理性能瓶颈?请给出具体方法
  • 解释Transformer模型中Self-Attention的计算模式和内存访问模式,如何优化?
  • 你如何用分析模型预测一个深度学习工作负载在下一代硬件上的性能?
  • 在跨团队推动优化方案时,遇到了不同意见怎么办?举例说明
  • 复习前沿LLM架构(如GPT-4、Llama 2)的推理优化技术,包括KV Cache、FlashAttention等

匹配度报告

69
综合匹配度

前沿技术、高薪、强积累,但现场办公且没有WLB保障。

适合人群
最适合发展性动机强的求职者,追求技术前沿和职业成长,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

英伟达薪资竞争力强,福利优厚,但JD未披露具体数字,仅提及competitive salaries,因此补偿性动机得到较好满足但不够透明。

薪资信号未披露(AI估算:50K-80K/月)

成长发展匹配

90较高

该职位处于AI最前沿,涉及LLM、AIGC和下一代硬件,技能成长空间极大;但JD未明确提及晋升路径或培训。

技术前沿前沿/新兴技术
技术栈Deep Learning、LLM、AIGC、PyTorch、JAX、TensorFlow、TensorRT、硬件架构、性能建模
业务类型ambiguous

工作生活匹配

40较低

仅现场办公,未提及灵活工作制或WLB,地点为上海/北京市区,通勤可能较长,生活化动机满足有限。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI芯片行业高速增长,英伟达技术领先,推动AI应用发展,但使命感和直接社会影响力信号不显著。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Developer Technology Engineer – AI

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Security and Safety Circuit Engineer

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • CPU Performance Developer Technology Engineer

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • AI Computing Development Engineer, TensorRT and TensorRT-LLM AIGV

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Senior System Software Engineer - GPU Performance Profiling Tools

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 自动驾驶测试实习生-2027届

    小米 · 武汉市
    AI 估算 · 4k-6k
  • Intern- Application Specialist

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 游戏模型数据专家-研发数据

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 游戏模型评测专家

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 模型数据算法专家/负责人-数据方向

    腾讯 · 深圳市
    AI 估算 · 40k-80k

英伟达 的其他在招职位

  • Developer Technology Engineer – AI

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Security and Safety Circuit Engineer

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • CPU Performance Developer Technology Engineer

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • AI Computing Development Engineer, TensorRT and TensorRT-LLM AIGV

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Senior System Software Engineer - GPU Performance Profiling Tools

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 自动驾驶测试实习生-2027届

    小米 · 武汉市
    AI 估算 · 4k-6k
  • Intern- Application Specialist

    沃特世 · 上海市
    AI 估算 · 4k-6k
  • 游戏模型数据专家-研发数据

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 游戏模型评测专家

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 模型数据算法专家/负责人-数据方向

    腾讯 · 深圳市
    AI 估算 · 40k-80k