超威半导体的AI Software Development Eng.薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

AI Software Development Eng.的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：10 天前

这是一个专注于为AMD GPU优化和开发深度学习框架的高级软件工程师职位

你将负责从端到端优化分布式推理和强化学习解决方案，与内部GPU库团队及开源社区紧密合作，利用前沿的编译器技术提升深度学习模型在异构计算集群上的训练和推理性能

端到端优化：在主流框架（如vLLM和SGlang）上构建和优化端到端分布式推理（例如，P/D解耦和Large-EP）和强化学习解决方案

与GPU库团队协作：与内部团队密切合作，分析和改进AMD GPU上的训练和推理性能

与开源维护者协作：与框架维护者合作，确保代码更改符合要求并集成到上游

在分布式计算环境中工作：在横向扩展（多GPU）和纵向扩展（多节点）系统上优化深度学习性能

利用尖端编译器技术：利用先进的编译器技术来提高深度学习性能

优化深度学习流水线：增强整个流水线，包括集成图编译器

软件工程最佳实践：应用合理的工程原理以确保稳健、可维护的解决方案

硕士或博士学位，专业为计算机科学、计算机工程、电气工程或相关领域

拥有5年以上专注于GPU优化、性能工程和框架开发的技术软件开发专业经验

GPU内核开发与优化：在AMD GPU上使用HIP、CUDA和汇编（ASM）为深度学习设计和优化GPU内核的深厚经验

深入了解AMD架构（GCN， RDNA）和底层编程，以最大化AI操作的性能，利用Compute Kernel (CK)、CUTLASS和Triton等工具实现多GPU和多平台性能

深度学习集成：将优化的GPU性能集成到机器学习和LLM框架（如vLLM， SGlang，TensorFlow， PyTorch）中以加速模型训练和推理的丰富经验，重点关注扩展性和吞吐量

端到端解决方案优化：了解LLM和多模态的最新市场趋势，在分布式推理（例如，P/D解耦和Large-EP）和强化学习方面拥有扎实的端到端性能调优实践经验

有文本到视频或图像到视频经验者优先

软件工程：熟练掌握Python和C++，具有调试、性能调优和测试设计经验，以确保高质量、可维护的软件解决方案

高性能计算：在异构计算集群上运行大规模工作负载、优化效率和可扩展性的专家经验

编译器优化：对编译器理论以及用于内核和系统性能优化的LLVM和ROCm等工具有扎实的理解

AI Software Development Eng.

🤖 AI 估测：¥45K-80K

发布时间：10 天前