超威半导体的Software Development Eng.薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

Software Development Eng.的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

超威半导体的Software Development Eng.有什么任职要求？

该职位要求硕士学历及高级经验工作经验。

Software Development Eng.

🤖 AI 估测：¥45K-80K

发布时间：14 天前

立即应聘

ℹ️关于这个职位

这是一个专注于为AMD GPU优化深度学习框架和大型语言模型（LLM）的高性能软件工程师职位

你将负责开发和调优GPU内核、优化模型架构（如Llama, Qwen），并进行端到端的性能分析，以提升多GPU和多节点系统的训练与推理效率

职位要求与内部GPU库团队及开源社区紧密合作，将优化成果集成到主流框架中

✓工作职责

深度学习与LLM框架优化：为主要DL/LLM框架（TensorFlow, PyTorch, vLLM, SGLang）在AMD GPU上进行优化，并将改进贡献到上游

GPU内核与算子优化：开发和调优GPU内核及性能关键算子，以最大化吞吐量并最小化延迟

模型与架构优化：适配和优化LLM架构（例如Llama, Qwen, DeepSeek），并应用FlashAttention、PagedAttention和量化等先进技术

端到端性能工程：进行全面性能分析以识别瓶颈，并在多GPU和多节点设置中实施系统、内存和通信优化

编译器与流水线加速：利用先进的编译器技术和图编译器来增强完整的深度学习和推理流水线

研究与先进技术：将推测解码和仅权重量化等新兴优化方法原型化并集成到生产系统中

跨团队与开源协作：与内部GPU库团队和开源维护者合作，协调改进并确保无缝的上游集成

软件工程卓越：应用稳健的工程实践，交付可维护、可靠且达到生产质量标准的性能优化

⭐最低要求

推理框架、模型架构与优化专长：具备vLLM或SGLang的深厚实践经验，精通现代LLM（如DeepSeek, Qwen），对Transformer/Attention/MoE/KV Cache有扎实的理论基础，并实际应用过FlashAttention、PagedAttention、连续批处理和量化（INT8/INT4/GPTQ/AWQ）等高级推理优化技术

端到端LLM性能工程：具备在多GPU和多节点环境中分析、诊断和优化计算、内存及通信瓶颈的能力

高性能计算：有在异构集群上运行和优化大规模工作负载的经验，关注效率、可靠性和可扩展性

深度学习框架集成：能够将优化的GPU内核集成到TensorFlow/PyTorch中，以加速大规模训练和推理，并实现强大的扩展性和吞吐量

软件工程卓越与社区贡献：具备强大的Python/C++编码技能，有效的调试和测试实践，能够交付可维护的性能关键型软件，并有开源贡献记录和强烈的自我驱动力

👍优先资格

GPU内核开发与优化（加分项）：有使用HIP、CUDA、ASM以及CK、CUTLASS、Triton等工具为AMD GPU设计和调优高性能GPU内核的实践经验，并对GCN/RDNA架构有深入了解

编译器与系统级优化（加分项）：对LLVM、ROCm以及用于提升内核和系统性能的编译器驱动技术有扎实的基础知识

学术与优选资质：计算机科学、计算机工程、电气工程或相关领域的硕士或博士学位

底层开发技能：有使用CUDA C++编程编写和调试高性能GPU内核的经验

或具备使用Triton开发和优化深度学习算子的实践经验

编译器知识：了解或具有TVM或MLIR等编译器技术的实践经验是显著优势

分布式系统经验：具有大规模模型（如张量并行、流水线并行）分布式推理的实践经验

Software Development Eng.

🤖 AI 估测：¥45K-80K

发布时间：14 天前

核心评价