Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/超威半导体/Software Development Eng.
AMD logo
A
超威半导体 (AMD)

职位信息

上海市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

分布式系统GPU深度学习PyTorch性能优化TensorFlowLLMHip/Cuda
💡

核心评价

技术顶尖、成长性极强、意义感足的AI硬件软件优化岗,位于上海跨国巨头,WLB情况未知。

Software Development Eng.

🤖 AI 估测:¥45K-80K

发布时间:14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于为AMD GPU优化深度学习框架和大型语言模型(LLM)的高性能软件工程师职位
你将负责开发和调优GPU内核、优化模型架构(如Llama, Qwen),并进行端到端的性能分析,以提升多GPU和多节点系统的训练与推理效率
职位要求与内部GPU库团队及开源社区紧密合作,将优化成果集成到主流框架中

✓工作职责

深度学习与LLM框架优化:为主要DL/LLM框架(TensorFlow, PyTorch, vLLM, SGLang)在AMD GPU上进行优化,并将改进贡献到上游
GPU内核与算子优化:开发和调优GPU内核及性能关键算子,以最大化吞吐量并最小化延迟
模型与架构优化:适配和优化LLM架构(例如Llama, Qwen, DeepSeek),并应用FlashAttention、PagedAttention和量化等先进技术
端到端性能工程:进行全面性能分析以识别瓶颈,并在多GPU和多节点设置中实施系统、内存和通信优化
编译器与流水线加速:利用先进的编译器技术和图编译器来增强完整的深度学习和推理流水线
研究与先进技术:将推测解码和仅权重量化等新兴优化方法原型化并集成到生产系统中
跨团队与开源协作:与内部GPU库团队和开源维护者合作,协调改进并确保无缝的上游集成
软件工程卓越:应用稳健的工程实践,交付可维护、可靠且达到生产质量标准的性能优化

⭐最低要求

推理框架、模型架构与优化专长:具备vLLM或SGLang的深厚实践经验,精通现代LLM(如DeepSeek, Qwen),对Transformer/Attention/MoE/KV Cache有扎实的理论基础,并实际应用过FlashAttention、PagedAttention、连续批处理和量化(INT8/INT4/GPTQ/AWQ)等高级推理优化技术
端到端LLM性能工程:具备在多GPU和多节点环境中分析、诊断和优化计算、内存及通信瓶颈的能力
高性能计算:有在异构集群上运行和优化大规模工作负载的经验,关注效率、可靠性和可扩展性
深度学习框架集成:能够将优化的GPU内核集成到TensorFlow/PyTorch中,以加速大规模训练和推理,并实现强大的扩展性和吞吐量
软件工程卓越与社区贡献:具备强大的Python/C++编码技能,有效的调试和测试实践,能够交付可维护的性能关键型软件,并有开源贡献记录和强烈的自我驱动力

👍优先资格

GPU内核开发与优化(加分项):有使用HIP、CUDA、ASM以及CK、CUTLASS、Triton等工具为AMD GPU设计和调优高性能GPU内核的实践经验,并对GCN/RDNA架构有深入了解
编译器与系统级优化(加分项):对LLVM、ROCm以及用于提升内核和系统性能的编译器驱动技术有扎实的基础知识
学术与优选资质:计算机科学、计算机工程、电气工程或相关领域的硕士或博士学位
底层开发技能:有使用CUDA C++编程编写和调试高性能GPU内核的经验
或具备使用Triton开发和优化深度学习算子的实践经验
编译器知识:了解或具有TVM或MLIR等编译器技术的实践经验是显著优势
分布式系统经验:具有大规模模型(如张量并行、流水线并行)分布式推理的实践经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

超威半导体 的其他在招职位

  • Sr. Manager Systems Design Eng.

    超威半导体

    深圳市 · 仅现场办公

  • PMTS Systems Design Engineer

    超威半导体

    上海市 · 仅现场办公

  • Sr. Silicon Design Engineer

    超威半导体

    上海市 · 仅现场办公

  • Systems Design Engineer

    超威半导体

    北京市 · 仅现场办公

  • SW Solution Engineer-AI

    超威半导体

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公