超威半导体的AI Compiler Development Engineer薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

AI Compiler Development Engineer的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

超威半导体的AI Compiler Development Engineer有什么任职要求？

该职位要求本科学历及高级经验工作经验。

AI Compiler Development Engineer

🤖 AI 估测：¥45K-80K

发布时间：17 天前

立即应聘

ℹ️关于这个职位

该职位是AMD的AI编译器开发工程师，主要负责为AMD GPU和异构加速器设计和开发高性能的AI编译器栈

你将负责编译器流程的架构设计，涵盖从前端IR构建、中端优化到后端代码生成的完整链路，并与算法、框架、运行时等团队紧密合作，将AI模型高效部署到硬件上执行

这是一个技术深度高、影响力大的核心研发岗位

✓工作职责

拥有面向GPU的AI编译器栈主要组件的架构和设计，包括针对AMD GPU和异构加速器的前端IR构建、中端优化、后端Lowering和代码生成，并与AMD的ROCm™和更广泛的GPU软件方向保持一致

设计和实现基于MLIR和LLVM的编译器Pass：IR转换、适用的方言设计、优化、调度和分块策略，以及针对GPU硬件的端到端Lowering流水线

为AI模型、内核和算子提供高性能编译流程，优化在现代GPU上的执行

采用数据驱动的方法——对关键工作负载进行基准测试、性能分析和调优，并在图、IR和内核级别调查正确性和性能回归

使用LLVM、Clang和现代C++工具链（MSVC/GCC/Clang）构建和优化后端代码生成，针对与AMD技术栈相关的GPU运行时和设备执行环境

与AI框架、运行时和系统团队紧密合作，提供从模型导入和图Lowering到设备执行的端到端GPU编译器解决方案

与GPU/硬件架构团队合作，进行功能启用、性能上限分析和软硬件协同规划

与量化团队合作，处理数值、精度模式（例如PTQ/QAT及相关流程），并在适用时通过编译器栈表示量化操作

与算法和框架相关方合作，处理算子覆盖、融合机会、自动调优/调度权衡以及模型驱动的性能目标

分析GPU性能瓶颈，并在图级、IR级和内核级转换（包括适当的向量化和内存层次结构感知策略）中实施高级优化

提供技术领导力：指导初级和高级工程师，领导设计和代码审查，并帮助建立编译器和GPU性能工程的最佳实践

根据需要领导多工程师或跨团队计划

影响长期编译器架构和GPU软件栈战略，以支持下一代AI硬件生态系统

参与跨越编译器、运行时和驱动程序边界的启动和生产问题解决

改进工具、CI、测试和工作流程，以实现可扩展的开发

⭐最低要求

计算机科学、软件工程、电气工程或相关领域的学士或硕士学位（或同等深度的教育和经验）

5年以上编译器开发、编译器基础设施或AI系统软件的专业经验，深度足以胜任SMTS级别的工作范围和职责

精通LLVM、MLIR、Clang或类似在生产或大规模研究环境中使用的编译器框架

深入理解IR设计、IR分析与优化、IR转换、Lowering以及面向GPU的代码生成

具备强大的C++编程技能（例如C++17/20风格和实践），并有构建大规模、高性能系统的经验

熟悉编译器工具链和构建系统，如MSVC、GCC、Clang和CMake

扎实的计算机体系结构基础，包括指令集、寄存器分配、控制和数据流分析，以及SSA风格的表示和转换

积极主动的协作者，具备强大的沟通和技术领导能力，包括在不依赖职权的情况下跨团队施加影响力

能够在快速变化、技术深度高的跨团队环境中工作（涉及硬件、运行时、量化、算法、框架、产品）

强大的解决问题能力、主人翁精神和责任感

能够适应模糊性并基于数据进行优先级排序

👍优先资格

具备GPU编程模型和工具链的实践经验——强烈优先：具有编译器相关工作经验的AMD ROCm™（HIP、hipcc、Clang GPU offload、LLVM AMDGPU或密切相关的代码生成）

优先：NVIDIA CUDA编译器工作流（NVCC或Clang CUDA、PTX、NVVM/libNVVM、LLVM NVPTX）

同样有价值：Vulkan、OpenCL、SYCL或与编译器集成相关的自定义加速器/NPU栈

有与AI框架和生态系统集成的经验，如PyTorch、TensorFlow、JAX、ONNX、TVM、XLA/OpenXLA/StableHLO或Triton

对于涉及跨平台工具链和客户环境的职位，Windows开发或产品发布经验是强烈优先项

构建AI编译器解决方案的实践经验，包括：MLIR方言设计

内核融合和量化流水线

内核自动调优和调度

分块、向量化和GPU内存层次结构优化

具备领导技术架构开发并影响长期编译器和运行时战略的能力

在编译器项目或大规模工程系统中拥有强大的生产影响力记录

熟悉git、CI、调试器和性能分析器

了解conda或Docker是加分项

博士学位

AI Compiler Development Engineer

🤖 AI 估测：¥45K-80K

发布时间：17 天前

核心评价