Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/超威半导体/AI Compiler Development Engineer
AMD logo
A
超威半导体 (AMD)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

GPULLVMROCmMLIRPytorch/TensorflowPerformance OptimizationAi Compiler
💡

核心评价

技术顶尖、发展前景广阔的AI编译器核心岗,位于高速增长赛道,薪资竞争力强,但WLB信号不明确。

AI Compiler Development Engineer

🤖 AI 估测:¥45K-80K

发布时间:17 天前

立即应聘

ℹ️关于这个职位

该职位是AMD的AI编译器开发工程师,主要负责为AMD GPU和异构加速器设计和开发高性能的AI编译器栈
你将负责编译器流程的架构设计,涵盖从前端IR构建、中端优化到后端代码生成的完整链路,并与算法、框架、运行时等团队紧密合作,将AI模型高效部署到硬件上执行
这是一个技术深度高、影响力大的核心研发岗位

✓工作职责

拥有面向GPU的AI编译器栈主要组件的架构和设计,包括针对AMD GPU和异构加速器的前端IR构建、中端优化、后端Lowering和代码生成,并与AMD的ROCm™和更广泛的GPU软件方向保持一致
设计和实现基于MLIR和LLVM的编译器Pass:IR转换、适用的方言设计、优化、调度和分块策略,以及针对GPU硬件的端到端Lowering流水线
为AI模型、内核和算子提供高性能编译流程,优化在现代GPU上的执行
采用数据驱动的方法——对关键工作负载进行基准测试、性能分析和调优,并在图、IR和内核级别调查正确性和性能回归
使用LLVM、Clang和现代C++工具链(MSVC/GCC/Clang)构建和优化后端代码生成,针对与AMD技术栈相关的GPU运行时和设备执行环境
与AI框架、运行时和系统团队紧密合作,提供从模型导入和图Lowering到设备执行的端到端GPU编译器解决方案
与GPU/硬件架构团队合作,进行功能启用、性能上限分析和软硬件协同规划
与量化团队合作,处理数值、精度模式(例如PTQ/QAT及相关流程),并在适用时通过编译器栈表示量化操作
与算法和框架相关方合作,处理算子覆盖、融合机会、自动调优/调度权衡以及模型驱动的性能目标
分析GPU性能瓶颈,并在图级、IR级和内核级转换(包括适当的向量化和内存层次结构感知策略)中实施高级优化
提供技术领导力:指导初级和高级工程师,领导设计和代码审查,并帮助建立编译器和GPU性能工程的最佳实践
根据需要领导多工程师或跨团队计划
影响长期编译器架构和GPU软件栈战略,以支持下一代AI硬件生态系统
参与跨越编译器、运行时和驱动程序边界的启动和生产问题解决
改进工具、CI、测试和工作流程,以实现可扩展的开发

⭐最低要求

计算机科学、软件工程、电气工程或相关领域的学士或硕士学位(或同等深度的教育和经验)
5年以上编译器开发、编译器基础设施或AI系统软件的专业经验,深度足以胜任SMTS级别的工作范围和职责
精通LLVM、MLIR、Clang或类似在生产或大规模研究环境中使用的编译器框架
深入理解IR设计、IR分析与优化、IR转换、Lowering以及面向GPU的代码生成
具备强大的C++编程技能(例如C++17/20风格和实践),并有构建大规模、高性能系统的经验
熟悉编译器工具链和构建系统,如MSVC、GCC、Clang和CMake
扎实的计算机体系结构基础,包括指令集、寄存器分配、控制和数据流分析,以及SSA风格的表示和转换
积极主动的协作者,具备强大的沟通和技术领导能力,包括在不依赖职权的情况下跨团队施加影响力
能够在快速变化、技术深度高的跨团队环境中工作(涉及硬件、运行时、量化、算法、框架、产品)
强大的解决问题能力、主人翁精神和责任感
能够适应模糊性并基于数据进行优先级排序

👍优先资格

具备GPU编程模型和工具链的实践经验——强烈优先:具有编译器相关工作经验的AMD ROCm™(HIP、hipcc、Clang GPU offload、LLVM AMDGPU或密切相关的代码生成)
优先:NVIDIA CUDA编译器工作流(NVCC或Clang CUDA、PTX、NVVM/libNVVM、LLVM NVPTX)
同样有价值:Vulkan、OpenCL、SYCL或与编译器集成相关的自定义加速器/NPU栈
有与AI框架和生态系统集成的经验,如PyTorch、TensorFlow、JAX、ONNX、TVM、XLA/OpenXLA/StableHLO或Triton
对于涉及跨平台工具链和客户环境的职位,Windows开发或产品发布经验是强烈优先项
构建AI编译器解决方案的实践经验,包括:MLIR方言设计
内核融合和量化流水线
内核自动调优和调度
分块、向量化和GPU内存层次结构优化
具备领导技术架构开发并影响长期编译器和运行时战略的能力
在编译器项目或大规模工程系统中拥有强大的生产影响力记录
熟悉git、CI、调试器和性能分析器
了解conda或Docker是加分项
博士学位
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

超威半导体 的其他在招职位

  • Sr. Manager Systems Design Eng.

    超威半导体

    深圳市 · 仅现场办公

  • PMTS Systems Design Engineer

    超威半导体

    上海市 · 仅现场办公

  • Sr. Silicon Design Engineer

    超威半导体

    上海市 · 仅现场办公

  • Systems Design Engineer

    超威半导体

    北京市 · 仅现场办公

  • SW Solution Engineer-AI

    超威半导体

    上海市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公