Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

AMD logo
超威半导体
Senior Staff AI Software System Design Engineer
立即应聘

Senior Staff AI Software System Design Engineer

发布于 大约 17 小时前

普通员工/个人贡献者

上海市
专家级经验
全职员工
仅现场办公
本科
软件工程
CUDA
TensorRT
分布式训练
推理优化
Megatron-LM
DeepSpeed
SGLang
vLLM
Gpu Kernel

AI 估算 · 50k–80k

高级AI工程师在GPU领域稀缺,AMD作为行业巨头薪资有竞争力,结合上海市场水平估算。

职位详情

关于这个职位

作为AMD的高级AI软件系统设计工程师,您将负责机器学习软件在AMD服务器GPU上的定制开发、调试、优化和技术支持

该职位专注于AI推理与训练的性能优化,涉及vLLM、Megatron-LM等前沿框架,需要深厚的C++/Python编程能力和GPU编程经验
您将与顶级客户合作,推动技术方案落地

最低要求

THE PERSON:

在机器学习领域拥有专家级知识,如框架(例如vLLM、Sglang、Megatron-LM、Deepspeed、TensorRT等)、分布式、内核算子、编译器、运行时、驱动、推理或训练的性能优化
强大的C++和Python编程技能
具备行业AI使用场景、解决方案、端到端流水线、框架或SDK的实践经验
强大的调试和开发技能
ACADEMIC CREDENTIALS:
计算机科学、计算机工程、电气工程或同等学历的学士或硕士学位

工作职责

KEY RESPONSIBILITIES:

向顶级客户提出技术方案并提供支持
为客户PoC成功做出重大贡献
推动AI软件的定制需求,包括从POC需求到POR发布,从GPU内核到框架和分布式解决方案
与不同团队协作,分析和优化训练和推理工作负载及解决方案
分析竞争解决方案,识别优势和劣势,明确价值主张
应用软件工程最佳实践

优先资格

PREFERRED EXPERIENCE:

能够独立工作,定义项目目标和范围,并主导自己的开发工作
良好的中英文沟通能力
优秀的AI框架技能(如vLLM、Sglang、Megatron-LM、Deepspeed、TensorRT、TensorRT-LLM)
优秀的Python、C++编程和软件技能,包括调试和性能分析
具有AI分布式解决方案经验(如EP/CP/TP/PP/DP、DeepEp、DualPipe、PD聚合等,以及KV缓存传输和存储)
具有多GPU和多节点集合通信原语(NCCL/RCCL)、NIC/GPU驱动(RDMA/GDR)和高速网络等AI分布式网络通信经验
具有GPU内核原语(如FA、PA、MOE、MLA)的集成和开发经验,包括torch、triton、CUDA、CK、ASM等
了解并行编程,最好是CUDA C/C++、HIP或计算机着色器
了解模型推理优化过程,如gemm/卷积调优、图优化和算子融合
了解Linux OS/驱动、CI和工具链(profiler/DCGM)开发与调试
了解Linux DRM、HSA、ROCm KMD/UMD驱动者优先
了解编译器(triton/TVM)者优先

AI 洞察

优缺点分析

优点

  • 技术前沿:接触最先进的AI框架和GPU计算技术,提升核心竞争力
  • 平台优势:AMD在GPU领域增长迅速,职业发展空间大
  • 薪资丰厚:高级职位薪资和福利具有竞争力
  • 技术深度要求高:需要同时掌握框架、内核、分布式等多个层面的知识
  • 适合有深厚AI系统背景、热爱底层优化、希望在GPU计算领域深耕的技术专家

缺点 / 挑战

  • 工作强度可能较大:涉及客户支持和PoC,可能面临项目压力

角色解读

  • 技术专家路线:深耕AI系统软件栈,成为GPU计算领域的顶尖专家
  • 架构师路线:负责大型AI系统的架构设计与技术决策
  • 管理路线:可向技术管理方向发展,带领团队解决复杂问题
  • 为顶级客户提供AI软件技术方案,并推动客户概念验证(PoC)成功
  • 定制开发并优化机器学习软件,涉及从GPU内核到框架的整个软件栈
  • 分析并优化训练/推理工作负载,提升AMD GPU上的AI性能
  • 精通主流AI框架如vLLM、Megatron-LM、TensorRT等,并能进行底层的性能优化
  • 具备强大的C++和Python编程能力,熟悉GPU编程(CUDA/HIP)和并行计算
  • 了解分布式训练与推理的解决方案,包括集合通信、模型并行等

申请策略

  • 了解AMD ROCm生态和GPU架构,展示对AMD平台的理解
  • 准备一个端到端的AI系统优化案例,体现系统思维
  • 突出在AI框架(如vLLM、TensorRT)上的优化经验和成果
  • 展示性能调优案例,如推理/训练加速的具体数据和方案
  • 强调C++/Python和GPU编程(CUDA)的项目经验
  • 如果欠缺分布式训练经验,可学习DeepSpeed、Megatron-LM等框架
  • 加强GPU内核编程能力,如CUDA kernel优化、triton使用

面试指南

  • 先明确问题核心,再分步骤展示优化思路,最后总结效果
  • 结合具体项目案例,从问题现象、分析工具、解决方案、收益四个维度回答
  • 请解释vLLM的PagedAttention机制及其对推理性能的影响
  • 如何优化一个Transformer模型在GPU上的推理延迟?
  • 描述您在过去项目中遇到的分布式训练通信瓶颈及解决方案
  • 如何调试CUDA kernel中的性能问题?请举例
  • 复习主流AI框架的架构和优化技术(vLLM、TensorRT-LLM等)
  • 准备2-3个GPU性能优化的深度项目案例

匹配度报告

69
综合匹配度

前沿AI GPU系统岗,薪资高、技术深,但WLB一般。

适合人群
最适合追求技术深度和前沿发展的求职者,愿意为职业成长接受一定的工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值60

薪资福利匹配

85较高

该职位薪资水平偏高,AMD作为上市大公司福利完善,补偿性动机得到较好满足。

薪资信号偏高 (50K-80K/月)

成长发展匹配

90较高

职位涉及前沿AI技术和GPU计算,技术成长空间大,但JD未明确提及晋升路径。

技术前沿前沿/新兴技术
技术栈vLLM、Megatron-LM、TensorRT、CUDA、分布式训练、GPU
业务类型ambiguous

工作生活匹配

40较低

办公地点在上海,要求现场办公,JD未提WLB,可能面临项目压力。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

60中等

AI行业高速增长,AMD在GPU领域影响力大,但社会影响偏中性。

行业发展高速增长赛道
社会影响中性/一般
使命信号build great products that accelerate next-generation computing experiences
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

超威半导体 的其他在招职位

  • Systems Design Eng.

    超威半导体 · 上海市
    AI 估算 · 35k-55k
  • AI Software System Design Engineer

    超威半导体 · 上海市
    AI 估算 · 40k-60k
  • AI Framework Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k
  • Manager Software Development

    超威半导体 · 上海市
    AI 估算 · 35k-50k
  • PMTS Product Application Engineer

    超威半导体 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • Electron 技术专家-MiMo

    小米 · 北京市
    AI 估算 · 35k-55k
  • 高级后端开发工程师-MiMo

    小米 · 北京市
    AI 估算 · 30k-50k
  • 高级客户端研发工程师-MiMo

    小米 · 北京市
    AI 估算 · 25k-45k
  • 推荐算法工程师-海外电商(redshop)方向

    小红书 · 北京市
    AI 估算 · 30k-50k
  • AI Agent 开发工程师

    小红书 · 上海市
    AI 估算 · 30k-50k

超威半导体 的其他在招职位

  • Systems Design Eng.

    超威半导体 · 上海市
    AI 估算 · 35k-55k
  • AI Software System Design Engineer

    超威半导体 · 上海市
    AI 估算 · 40k-60k
  • AI Framework Engineer

    超威半导体 · 上海市
    AI 估算 · 30k-50k
  • Manager Software Development

    超威半导体 · 上海市
    AI 估算 · 35k-50k
  • PMTS Product Application Engineer

    超威半导体 · 上海市
    AI 估算 · 35k-55k

相似职位推荐

  • Electron 技术专家-MiMo

    小米 · 北京市
    AI 估算 · 35k-55k
  • 高级后端开发工程师-MiMo

    小米 · 北京市
    AI 估算 · 30k-50k
  • 高级客户端研发工程师-MiMo

    小米 · 北京市
    AI 估算 · 25k-45k
  • 推荐算法工程师-海外电商(redshop)方向

    小红书 · 北京市
    AI 估算 · 30k-50k
  • AI Agent 开发工程师

    小红书 · 上海市
    AI 估算 · 30k-50k