超威半导体的Software Development Engineer薪资是多少？

该职位薪资范围为 25k–45k（人民币/月）。

Software Development Engineer的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求本科学历及初级经验工作经验。

🤖 AI 估测：¥25K-45K

发布时间：12 天前

这是一个专注于AI推理系统优化的软件工程师职位

你将负责优化大型语言模型和多模态模型在AMD多GPU系统上的高性能执行，工作涉及深度学习框架优化、模型感知实现和端到端性能工程

这是一个面向早期职业工程师、强调全栈开发和前沿AI技术实践的机会

深度学习与LLM框架优化：具备优化主流DL/LLM框架（PyTorch、vLLM、SGLang）以适配AMD GPU并向上游贡献改进的经验

模型感知实现：构建与LLM和多模态架构（例如Llama、Qwen-VL、Wan）紧密交互的功能，需要理解注意力机制、跨模态融合、KV缓存和量化

性能意识编码：编写高效、可扩展的代码，同时考虑多GPU环境中的内存使用、并发性和瓶颈

性能分析：使用性能分析工具评估更改的影响，识别性能回退，并在开发周期内验证性能改进

端到端性能工程：进行全面性能分析以识别瓶颈，并在多GPU和多节点设置中实施系统、内存和通信优化

编译器与流水线加速：利用编译器技术和图编译器来增强完整的深度学习和推理流水线

研究与先进技术：将推测解码和仅权重量化等新兴优化方法原型化并集成到生产系统中

跨团队与开源协作：与内部GPU库团队和开源维护者合作，协调改进并确保无缝的上游集成

软件工程卓越性：应用稳健的工程实践，交付可维护、可靠且具备生产质量的性能优化

软件工程技能：熟悉Python

熟悉C++或异步编程是加分项

理解LLM或多模态模型概念：了解Transformer架构、注意力机制、视觉语言对齐和推理流程（例如图像+文本输入处理）

具备Transformer/Attention/MoE/KV Cache和量化（FP8/FP4）的理论基础

Linux开发环境：熟练使用命令行工具、Git和标准调试/性能分析工具

端到端LLM性能工程：具备在多GPU和多节点环境中分析和诊断计算、内存及通信瓶颈的经验

软件工程卓越性与社区贡献是加分项：扎实的Python/C++编码技能和调试测试实践经验，具备交付可维护的性能关键软件的能力，以及有开源贡献记录和强烈的自我驱动力

GPU内核开发与优化是加分项：了解使用HIP、CUDA、ASM以及CK、CUTLASS、Triton等工具为AMD GPU进行高性能GPU内核调优

编译器与系统级优化是加分项：具备LLVM、ROCm以及通过编译器驱动技术提升内核和系统性能的基础知识

模型架构与优化专业知识：熟悉多模态模型（例如Qwen-VL、Qwen-Image-Edit、Wan）或基于扩散的生成模型

开发技能：接触过GPU计算（ROCm、CUDA）或性能分析工具（例如PyTorch Profiler）

分布式系统经验：具备大规模模型分布式推理经验（例如张量并行、流水线并行）

Software Development Engineer

🤖 AI 估测：¥25K-45K

发布时间：12 天前