精通cpp语言编程,熟悉Python编程,具备优秀的系统开发、调试,优化能力和经验
具备扎实的计算机理论基础,对数据结构和算法有较强的技术功底,有高性能通信相关经验优先
有开发/优化集合通信库(如NCCL、DeepEP)、分布式并行优化相关经验,熟悉NvLink、Infiniband、RoCEv2等高性能通信技术
熟悉Cuda开发,了解GPU工作原理,有kernel开发优化经验
了解主流模型及模型框架,熟悉开源常见训练/推理框架(如vLLM、SGLang、Megatron-LM)
优秀的问题分析和解决能力,勇于挑战
良好的沟通能力和团队合作精神,有比较强的推动能力