Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
Deep Learning Performance Architect
立即应聘

Deep Learning Performance Architect

发布于 大约 4 小时前

普通员工/个人贡献者

上海市 / 北京市
高级经验
全职员工
仅现场办公
硕士
GPU
CUDA
Tensor-RT
Gpu Architecture
Performance Optimization
Performance Modeling
Cpu Architecture

AI 估算 · 30k–60k

AI芯片巨头高级岗位,技术壁垒高,上海/北京一线城市,薪资竞争力强,预计月薪30-60K。

职位详情

关于这个职位

该职位专注于深度学习推理性能优化,负责开发GPU加速的高性能内核,并与跨团队协作解决前沿AI应用中的性能瓶颈

你将使用C/C++和CUDA等工具,与全球顶尖工程师一起推动深度学习技术的落地

最低要求

硕士或博士或同等学历(CE、CS&E、CS、AI等相关专业)

优秀的C/C++编程和软件设计能力
性能建模、分析、调试和代码优化经验,或CPU/GPU架构知识
年以上相关工作经验

工作职责

开发高度优化的深度学习推理内核

进行性能优化、分析和调优
与汽车、图像理解、语音理解等跨团队合作,开发创新解决方案
偶尔出差参加技术咨询和培训

优先资格

Python经验

GPU编程经验(CUDA或OpenCL)
敏捷软件开发技能

AI 洞察

优缺点分析

优点

  • 接触最前沿的AI加速技术和NVIDIA GPU架构,技术积累含金量高
  • 与全球顶尖工程师和研究团队合作,快速提升专业视野和影响力
  • 英伟达作为AI芯片领导者,职业品牌背书强劲,内部晋升和跳槽前景广阔
  • 工作强度较大,需要快速迭代和解决复杂的性能问题,对技术深度要求极高
  • 需要同时掌握底层硬件知识和上层算法,学习曲线陡峭
  • 偶尔出差参与客户沟通,需要较强的人际和沟通能力
  • 适合热爱底层性能优化、对GPU架构和深度学习有浓厚兴趣,并希望在高技术壁垒领域深耕的工程师

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术专家路径:从性能工程师逐步成长为深度学习推理领域的架构师或首席工程师
  • 管理路径:带领团队负责特定产品线的性能优化,晋升为技术经理或总监
  • 跨领域发展:基于对AI硬件和算法的深刻理解,转向系统架构或产品规划岗位
  • 开发并优化深度学习推理内核,确保在NVIDIA GPU上达到最高性能
  • 进行性能分析、瓶颈定位和代码调优,结合硬件特性提升计算效率
  • 与跨团队合作(如自动驾驶、图像识别、语音识别),将新算法落地到Tensor-RT等推理引擎中
  • 精通C/C++编程和软件设计,能够编写高性能、可维护的代码
  • 深入理解计算机体系结构,特别是CPU和GPU的并行计算模型
  • 掌握性能建模、剖析和优化工具,有GPU编程经验(CUDA/OpenCL)更佳

申请策略

  • 提前了解NVIDIA Tensor-RT的架构和最新特性,面试时展现对产品的热情
  • 关注自动驾驶、语音、图像等应用场景的性能挑战,准备相关项目案例
  • 突出C/C++项目经验和性能优化成果,例如具体提升多少倍性能、解决哪些难题
  • 展示GPU编程经历(CUDA、OpenCL、cudnn等),尤其是深度学习相关优化案例
  • 强调参与过的跨团队协作项目或开源贡献,体现沟通与合作能力
  • 深入学习GPU架构(如NVIDIA的Turing、Ampere、Hopper)和CUDA优化技巧
  • 熟悉深度学习推理框架(Tensor-RT、ONNX Runtime)的优化原理
  • 补强Python和深度学习理论基础,以便更好理解算法需求

面试指南

  • STAR法则:描述情境、任务、行动和结果,重点突出量化指标和优化技术
  • 从系统角度分析:从算法、内存、计算、并行度等多个层面系统性地优化,避免只关注单一因素
  • 结合硬件特性:强调对GPU架构(如SM、warp、memory hierarchy)的理解,并展示使用profiling工具(如nsys、ncu)的经验
  • 介绍一下你做过的一个GPU性能优化项目,如何分析瓶颈并提升性能?
  • 解释CUDA中的warp调度和共享内存使用,如何优化访存模式?
  • 如何针对深度学习推理场景设计一个高效的卷积内核?
  • 你如何理解和优化Tensor-RT中的int8量化?
  • 当遇到一个复杂的性能问题时,你的排查思路是什么?

匹配度报告

78
综合匹配度

顶级AI芯片公司,技术前沿、薪资丰厚,但工作强度较大,WLB一般。

适合人群
最适合追求技术极致成长、愿意为顶尖平台投入时间的工程师。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值80

薪资福利匹配

85较高

该职位薪资处于行业高位,英伟达福利完善,具有强大经济回报和稳定性,但具体薪资未明确,需面议。

薪资信号面议 (30K-60K/月)

成长发展匹配

95较高

接触最前沿的GPU技术和深度学习推理优化,技术成长空间极大,且有机会参与全球顶尖项目,未来发展潜力巨大。

技术前沿前沿/新兴技术
技术栈Deep Learning、GPU、CUDA、Tensor-RT、Performance Optimization、CPU/GPU Architecture、Performance Modeling
成长机会research and development、latest algorithms、innovative solutions
业务类型ambiguous

工作生活匹配

50较低

必须现场办公,未提及弹性工作或远程选项,且可能出差,工作强度较大,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

参与AI革命底层技术,助力各行业智能化转型,社会价值高,且英伟达技术领导力带来使命感和成就感。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号enable breakthroughs in numerous areas、power a revolution in deep learning
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Senior Software Engineer, Driving Behavior and Multi-Vehicle Adaptation – Autonomous Vehicles

    英伟达 · 上海市
    AI 估算 · 35k-55k
  • Software Manager, Planning and Control - Autonomous Vehicles

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Senior Software Engineer, Context Fusion and Multi-Vehicle Adaptation - Autonomous Vehicles

    英伟达 · 北京市
    AI 估算 · 30k-60k
  • Perception Engineer - Autonomous Driving

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Senior Technical Support Engineer

    英伟达 · 北京市
    AI 估算 · 30k-45k

相似职位推荐

  • Unity客户端开发工程师-抖音直播(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • Camera软件开发工程师-移动OS

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 网络接入平台研发工程师/专家-基础设施

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 推荐算法工程师-抖音投稿

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 豆包语音大模型后端工程师(模型推理)-Data语音

    字节跳动 · 上海市
    AI 估算 · 20k-40k

英伟达 的其他在招职位

  • Senior Software Engineer, Driving Behavior and Multi-Vehicle Adaptation – Autonomous Vehicles

    英伟达 · 上海市
    AI 估算 · 35k-55k
  • Software Manager, Planning and Control - Autonomous Vehicles

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Senior Software Engineer, Context Fusion and Multi-Vehicle Adaptation - Autonomous Vehicles

    英伟达 · 北京市
    AI 估算 · 30k-60k
  • Perception Engineer - Autonomous Driving

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Senior Technical Support Engineer

    英伟达 · 北京市
    AI 估算 · 30k-45k

相似职位推荐

  • Unity客户端开发工程师-抖音直播(北京/上海/深圳)

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • Camera软件开发工程师-移动OS

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 网络接入平台研发工程师/专家-基础设施

    字节跳动 · 深圳市
    AI 估算 · 30k-60k
  • 推荐算法工程师-抖音投稿

    字节跳动 · 北京市
    AI 估算 · 35k-65k
  • 豆包语音大模型后端工程师(模型推理)-Data语音

    字节跳动 · 上海市
    AI 估算 · 20k-40k