Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Nvidia logo
英伟达
Deep Learning Performance Architect, CUTLASS DSL Testing
立即应聘

Deep Learning Performance Architect, CUTLASS DSL Testing

发布于 大约 14 小时前

普通员工/个人贡献者

上海市 / 北京市
中级经验
全职员工
仅现场办公
硕士
GPU
自动化测试
回归检测
MLIR
代码覆盖率
AI Agent
DSL

AI 估算 · 30k–50k

GPU软件测试专家,英伟达行业领先,薪资竞争力强,硕士+3年经验市场估值较高。

职位详情

关于这个职位

该职位负责为英伟达的CUTLASS DSL(领域特定语言)开发测试框架,确保MLIR编译管线的端到端代码质量

你将与多团队合作,构建自动化测试、回归检测和代码覆盖率系统,推动GPU软件的质量保证
适合有Python和GPU测试背景的工程师

最低要求

MS, PhD, or equivalent experience in Computer Science, Software Engineering, or a related field

+ years of relevant work experience
Excellent Python and scripting skills
Strong experience developing and using test tools, with a solid understanding of software testing best practices
Hands-on experience with automated testing in GPU environments, including correctness testing, code coverage improvements, and regression detection
Strong communication skills and proven ability to collaborate effectively across teams

工作职责

Develop and evolve the NVIDIA CUTLASS DSL testing framework for next-generation GPU software

Define, refine, and execute robust product test strategies for shipping to the open-source community
Ensure end-to-end code quality across the MLIR-based compilation pipeline and related functional coverage infrastructure
Build automated testing, code coverage measurement, and regression detection workflows at scale
Partner with multiple teams to make sure every operator change meets a high bar for correctness, quality, and performance

优先资格

Familiarity with common AI agent technologies and applications

Experience in quality assurance of open-source products

AI 洞察

优缺点分析

优点

  • 英伟达在GPU和AI领域的领导者地位,技术上接触前沿的MLIR和CUTLASS
  • 工作内容偏测试框架和自动化,可培养系统工程和质量管理能力
  • 开源项目经历,提升行业影响力
  • 上海/北京核心城市,团队专业,薪资有竞争力
  • 需要对GPU底层和编译器有一定理解,学习曲线较陡
  • 跨团队协作频繁,需较强的沟通能力和责任感
  • 适合热爱质量保障、善于自动化、对GPU软件栈感兴趣的中级测试工程师

缺点 / 挑战

  • 测试工作有时重复性高,需要耐心和细致

角色解读

  • 向高级测试架构师方向发展,主导更大范围的GPU软件质量体系
  • 横向拓展至编译器、高性能计算等相邻领域,成为全栈GPU软件专家
  • 在英伟达内部可转岗至编译器开发、算子优化等核心研发岗位
  • 开发和迭代CUTLASS DSL的测试框架,确保GPU编译器(MLIR)和算子代码的正确性
  • 设计并执行产品测试策略,推动自动化测试、代码覆盖率和回归检测流程
  • 与多个团队(如编译器、算子开发)协作,验证每次代码变更的质量
  • 确保开源产品随时可发布,维护高质量的持续集成流程
  • 精通Python及脚本编程,能编写测试框架和自动化工具
  • 扎实的软件测试理论,熟悉GPU环境的自动化测试(如正确性、覆盖率、回归)
  • 良好的沟通能力,能跨团队协作推动质量改进
  • 对AI agent技术或开源项目QA有了解更佳

申请策略

  • 在简历和面试中突出对质量体系的系统性思考,而不仅仅是测试执行
  • 了解英伟达开源项目(如CUTLASS, TensorRT-LLM),提前试用并反馈改进建议
  • 突出Python测试框架开发经验(如pytest, unittest)和自动化CI/CD搭建
  • 展示GPU相关项目经验,特别是CUDA、TensorRT或编译器测试
  • 强调代码覆盖率和回归检测的实际案例及量化结果
  • 如有开源项目贡献或AI agent经验,单独列出
  • 学习MLIR和LLVM的基础知识,了解编译器测试方法
  • 熟悉CUTLASS库的底层原理,能编写自定义算子测试

面试指南

  • STAR法则:情境→任务→行动→结果,特别强调量化结果(如覆盖率提升X%,回归检测时间缩短Y%)
  • 系统思维:从测试金字塔(单元/集成/E2E)角度阐述测试策略,体现层次性
  • 技术深挖:对GPU相关术语(如warp, shared memory)要准确,展示底层理解
  • 请描述你如何为GPU软件设计一个自动化测试框架?
  • 如何检测代码改动引入的性能回归?举例说明
  • 你对MLIR或编译器测试有什么了解?
  • 如何处理跨团队协作中的测试优先级冲突?
  • 请解释CUTLASS DSL中一个典型算子的测试覆盖策略

匹配度报告

66
综合匹配度

前沿GPU测试架构岗,高薪高成长,但需要现场办公且WLB不确定。

适合人群
适合追求技术成长、乐于接触前沿GPU/编译器技术的中级测试工程师,对现场办公和WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展80
工作生活50
使命价值60

薪资福利匹配

75中等

英伟达作为上市巨头,薪资和福利在行业中处于领先水平,且上海/北京岗位有竞争力。但JD未明确薪资,整体属中上水平。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

80较高

技术栈前沿(MLIR、CUTLASS、GPU),有开源项目经验,成长空间大。但JD未提及晋升或培训。

技术前沿前沿/新兴技术
技术栈MLIR、CUTLASS、GPU、Python、DSL
业务类型ambiguous

工作生活匹配

50较低

上海/北京现场办公,但英伟达可能提供一定弹性,JD未明确说明工作模式或WLB。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

GPU软件质量保障,推动AI基础设施发展,有技术社会价值。但JD未强调使命,行业增长稳定。

行业发展稳定成熟行业
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

英伟达 的其他在招职位

  • Full-Stack Solution Engineer: Humanoid Whole-Body Control and Loco-manipulation

    英伟达 · 上海市
    AI 估算 · 40k-65k
  • Electrical Solution Engineer – Humanoid Robotics

    英伟达 · 上海市
    AI 估算 · 40k-70k
  • AI Computing Development Engineer, TensorRT and TensorRT-LLM

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Power Integrity Co-Design Engineer

    英伟达 · 上海市
    AI 估算 · 35k-55k
  • Developer Technology Engineer, AI

    英伟达 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 云资源管理经理/专家-Data

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 机器学习平台 SRE 工程师

    月之暗面 · 深圳市
    AI 估算 · 30k-50k
  • 数据仓库资深开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 运维智能化应用研发

    中国移动 · 长沙市
    AI 估算 · 8k-15k
  • 数据治理(业务)

    中国移动 · 长沙市
    AI 估算 · 4k-8k

英伟达 的其他在招职位

  • Full-Stack Solution Engineer: Humanoid Whole-Body Control and Loco-manipulation

    英伟达 · 上海市
    AI 估算 · 40k-65k
  • Electrical Solution Engineer – Humanoid Robotics

    英伟达 · 上海市
    AI 估算 · 40k-70k
  • AI Computing Development Engineer, TensorRT and TensorRT-LLM

    英伟达 · 上海市
    AI 估算 · 25k-45k
  • Power Integrity Co-Design Engineer

    英伟达 · 上海市
    AI 估算 · 35k-55k
  • Developer Technology Engineer, AI

    英伟达 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • 云资源管理经理/专家-Data

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 机器学习平台 SRE 工程师

    月之暗面 · 深圳市
    AI 估算 · 30k-50k
  • 数据仓库资深开发工程师

    字节跳动 · 北京市
    AI 估算 · 25k-45k
  • 运维智能化应用研发

    中国移动 · 长沙市
    AI 估算 · 8k-15k
  • 数据治理(业务)

    中国移动 · 长沙市
    AI 估算 · 4k-8k