英伟达的Developer Technology Engineer - AI薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

Developer Technology Engineer - AI的工作地点在哪里？

该职位工作地点位于上海市、北京市、深圳市。工作形式为仅现场办公。

该职位要求硕士学历及中级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：13 天前

这是一个面向AI领域的开发者技术工程师岗位，你将加入英伟达的计算开发者技术团队

主要工作是与顶尖的AI应用开发者合作，深入优化大型语言模型（LLM）的训练与推理性能，并参与GPU核心算法、高性能算子及分布式通信的优化，以推动下一代NVIDIA软硬件平台的发展

直接与关键应用开发者合作，理解他们当前和未来要解决的问题

构建和优化核心并行算法与数据结构，通过库开发和直接贡献应用程序，利用GPU提供最有效的解决方案

这包括大型语言模型的训练和推理优化，为大型语言模型生态系统中的框架和开源项目（如Megatron、TRTLLM、SGLang、vLLM）做出贡献

与NVIDIA的架构、研究、库、工具和系统软件团队紧密合作，影响下一代架构、软件平台和编程模型的构建

这包括研究对应用程序性能和开发效率的影响，并将真实世界的开发者反馈转化为可操作的平台改进

参与高性能算子的深度优化，涉及但不限于GPU内核优化、指令级调优和编译器优化

这些优化将直接支持客户，或在社区的计算库和开源项目（如cuDNN、cuBLAS、CUTLASS以及DeepGEMM、FlashMLA、FlashAttention、Flashinfer等开源库）中进行协调

改进广泛分布式大型语言模型工作负载的通信

通过优化通信库（NCCL、NCCL GIN、NVSHMEM）并参与开源通信库（如DeepEP、NCCL EP），引领分布式训练和推理的进步

这需要深入研究互连拓扑（NVLINK）和网络协议（InfiniBand/RoCE），以设计高效的数据传输策略和计算-通信重叠方法

工程或计算机科学相关领域的学位或同等经验，硕士或博士学位优先

两年或以上工作经验

扎实的C、C++、Python或Fortran编程能力

扎实的软件开发、编程技术和算法知识

扎实的数学基础，包括线性代数和数值方法

并行编程和加速计算背景，具备并行架构和性能分析调优的综合知识

在以下至少一个领域具备全栈性能分析和优化经验：大型语言模型和高性能计算

扎实的软件工程基础和系统架构思维，能够在复杂系统中构建模块并推动工程实践

强大的沟通与合作能力，能够与架构、研究和软件产品团队高效协作

持续学习的心态，积极跟进创新技术并适应快速发展的环境

具备GPU编程经验者优先

拥有从算子级、框架级到算法级的优化专长者优先

具备分布式通信优化经验者优先，涉及远程直接内存访问、GPU互连、集体通信算法及相关开源库

Developer Technology Engineer - AI

🤖 AI 估测：¥45K-80K

发布时间：13 天前