Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
CPU Performance Developer Technology Engineer
立即应聘

CPU Performance Developer Technology Engineer

发布于 大约 13 小时前

普通员工/个人贡献者

上海市 / 北京市
高级经验
全职员工
仅现场办公
本科
软件工程
HPC
性能分析
CPU微架构
SIMD
开源贡献
并行计算
向量化
Ai数据预处理

AI 估算 · 30k–50k

NVIDIA作为国际顶尖芯片公司,薪资竞争力强;CPU优化专家稀缺,且要求5年以上经验,预计月薪在3-5万之间,含年终奖约为13薪。

职位详情

关于这个职位

作为CPU性能开发技术工程师,你将加入NVIDIA的Compute Developer Technology团队,专注于优化Grace/Vera CPU上的AI、HPC及数据密集型工作负载

你需要与全球开发者合作,通过性能分析、调优和开源贡献释放CPU潜力,并直接影响未来CPU架构设计
该职位要求深厚的C/C++/Python编程能力和CPU微架构知识,适合拥有5年以上经验的性能工程专家

最低要求

计算机科学、计算机工程或相关领域的学士、硕士或博士学位

年以上性能工程或CPU优化相关经验
精通C/C++和/或Python,对算法和软件架构有深刻理解
扎实掌握CPU微架构、性能分析工具和优化方法
有CPU基准测试和瓶颈驱动性能调优的实践记录
优秀的沟通和组织能力,能够跨团队协作并管理多个优先级

工作职责

与各行业的开发者和研究人员合作,识别并解决AI、数据分析、仿真和数值计算等多样化工作负载中的性能挑战

从应用级算法到低级微架构,对CPU性能进行剖析、分析和优化
贡献于开源框架、关键软件栈、参考实现和性能库,以充分发挥CPU潜力
与NVIDIA的架构、研究、库、工具和系统软件团队紧密合作,提升整体平台性能
提供洞察,塑造下一代CPU设计、编译器工具链和开发工作流,以提高开发人员生产力和吞吐量

优先资格

在CPU上优化AI或数据预处理管道的经验

熟悉HPC应用、并行计算和分布式运行时环境
具有SIMD指令集、低级内联或向量化的实践经验
对开源性能工具或HPC框架有贡献

AI 洞察

优缺点分析

优点

  • 加入NVIDIA意味着处于AI和计算浪潮的核心,接触最前沿的CPU技术,如Grace Hopper超级芯片
  • 公司文化鼓励创新和开源,员工可参与顶级开源项目,个人技能与行业声誉快速提升
  • 薪资福利极具竞争力,且作为行业标杆,职业跳板价值极高
  • 对技术深度要求极高,需要同时掌握应用层和硬件层知识,学习曲线陡峭
  • 需与分布全球的团队协作,时差沟通可能频繁,工作强度较大
  • 公司内部人才密度高,竞争激烈,需要持续保持技术领先
  • 适合拥有扎实计算机体系结构背景、热爱底层性能优化、享受从细微处榨取极致性能的技术极客,同时不畏惧高强度学习和跨团队协作

缺点 / 挑战

  • 工作内容高度挑战且富有影响力,优化成果直接惠及全球科研和工业界

角色解读

  • 技术专家路线:成为CPU性能优化领域权威,负责关键项目的性能突破,带领技术攻关
  • 架构师路线:深入参与下一代CPU架构设计,从软件视角推动硬件创新
  • 团队领导路线:随着项目扩大,可晋升为Devtech团队的技术主管或经理,带领团队服务客户
  • 与全球开发者合作,分析并优化AI、HPC及数据密集型应用在NVIDIA Grace/Vera CPU上的性能
  • 使用性能剖析工具从应用层到微架构层定位瓶颈,并通过代码优化、算法改进提升效率
  • 贡献开源框架和性能库,如优化TensorFlow数据处理或HPC库,推动社区共同进步
  • 为NVIDIA的CPU架构团队提供反馈,影响下一代芯片设计方向
  • 深度掌握C/C++/Python,能编写高性能代码并理解底层优化细节
  • 精通CPU微架构知识,如流水线、缓存层次、分支预测,以及性能分析工具(如perf、VTune)
  • 熟悉并行计算(MPI、OpenMP)、SIMD向量化以及HPC领域常用优化方法
  • 具备跨团队协作和沟通能力,能将复杂技术问题清晰传达给多方利益相关者

申请策略

  • 在求职信或面试中表达对NVIDIA技术路线的理解,特别是Grace CPU的定位和AI/HPC融合趋势
  • 可以准备一个简短的PPT或文档,展示你过去一个优化项目的完整思路,给面试官留下深刻印象
  • 重点突出CPU性能优化的具体案例,包括使用什么工具、发现什么瓶颈、最终性能提升多少(最好有量化数据)
  • 强调C/C++/Python编程能力,特别是底层代码优化经验,如使用SIMD内联或调整缓存友好的数据结构
  • 列出对开源项目(如TensorFlow、PyTorch、HPC框架)的贡献,体现影响力
  • 如有HPC或AI负载优化经历,单独板块展示项目背景和成果
  • 深入学习ARM架构(NVIDIA Grace基于ARM),熟悉其微架构特性
  • 实践使用性能剖析工具(如perf、Linux trace、NVIDIA Nsight)分析真实负载

面试指南

  • 对于性能优化问题,遵循:定义问题 -> 量化基线 -> 剖析定位瓶颈 -> 提出假设 -> 实施优化 -> 验证并迭代
  • 对于架构理解类问题,结合具体例子解释概念,例如用伪代码展示缓存友好访问模式
  • 请描述一次你从底层优化CPU性能的经历,你用了哪些工具,发现了什么瓶颈?
  • 解释CPU缓存一致性协议(如MESI)如何影响多线程性能?
  • 给定一个矩阵乘法任务,你如何利用SIMD和缓存分块进行优化?
  • 如何评估一个AI预处理管道的CPU性能瓶颈?你会优先优化哪些部分?
  • 你如何与不熟悉性能优化的开发人员协作,让他们采纳你的优化建议?
  • 复习CPU微架构核心知识,包括流水线、分支预测、缓存层次、NUMA等

匹配度报告

70
综合匹配度

NVIDIA CPU优化岗位,前沿技术栈、极高成长性,但WLB较差。

适合人群
最适合追求技术成长和行业影响力的求职者,愿意为前沿挑战投入时间和精力。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活30
使命价值70

薪资福利匹配

85较高

NVIDIA提供极具竞争力的薪资和全面福利,作为上市公司财务稳健,补偿性动机满足度较高。但JD未明确薪资数字,需面议。

薪资信号面议 (30K-50K/月)
福利待遇comprehensive benefits package

成长发展匹配

95较高

该职位处于技术最前沿(Grace CPU、AI/HPC),每日与顶尖架构师合作,高度驱动技能成长和职业发展。

技术前沿前沿/新兴技术
技术栈CPU微架构、SIMD、HPC、AI数据预处理、并行计算、向量化、性能分析、C/C++、Python
成长机会research、design、implement、contribute、shape next-generation
业务类型ambiguous

工作生活匹配

30较低

职位要求现场办公,未提及弹性工时或远程选项,且NVIDIA以高强度和加班文化著称,WLB较有限。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

NVIDIA在AI和计算领域推动技术革命,工作成果有巨大社会效应,但JD未强调具体使命,行业增长确定性强。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号breakthrough performance、efficiency、improve our overall platform performance
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Developer Technology Engineer – AI

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Security and Safety Circuit Engineer

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • AI Computing Development Engineer, TensorRT and TensorRT-LLM AIGV

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Deep Learning Performance Architect

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Senior System Software Engineer - GPU Performance Profiling Tools

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 系统软件研发实习生

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 实习生-软件测试开发实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 混元训练 Infra 工程师-Dataloader/Checkpoint 方向-(北京/深圳/上海/杭州)

    腾讯 · 北京市
    AI 估算 · 30k-55k
  • 推荐算法实习生(MJ035505)

    携程 · 上海市
    AI 估算 · 4k-6k
  • FDE工程师(苏州)

    中国机械工业集团有限公司 · 苏州市
    AI 估算 · 12k-20k

英伟达 的其他在招职位

  • Developer Technology Engineer – AI

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Security and Safety Circuit Engineer

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • AI Computing Development Engineer, TensorRT and TensorRT-LLM AIGV

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • Deep Learning Performance Architect

    英伟达 · 上海市
    AI 估算 · 50k-80k
  • Senior System Software Engineer - GPU Performance Profiling Tools

    英伟达 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • 系统软件研发实习生

    小米 · 武汉市
    AI 估算 · 4k-6k
  • 实习生-软件测试开发实习生

    阅文集团 · 上海市
    AI 估算 · 4k-6k
  • 混元训练 Infra 工程师-Dataloader/Checkpoint 方向-(北京/深圳/上海/杭州)

    腾讯 · 北京市
    AI 估算 · 30k-55k
  • 推荐算法实习生(MJ035505)

    携程 · 上海市
    AI 估算 · 4k-6k
  • FDE工程师(苏州)

    中国机械工业集团有限公司 · 苏州市
    AI 估算 · 12k-20k