编程能力 :精通C/C++,熟悉Python,具备扎实的数据结构与算法基础,ACM/ICPC、NOI等竞赛获奖者优先
GPU与CUDA :熟悉NVIDIA GPU架构及编程模型,掌握CUDA核函数优化、显存管理、多流并发等技术,有实际性能调优经验
框架与工具 :熟悉PyTorch、Megatron、vLLM/SGLang等深度学习训练和推理框架
工程经验 :有分布式系统开发经验,熟悉MPI、NCCL等通信库,或参与过大模型训练/推理项目者优先
学历背景 :计算机/电子/数学等相关专业硕士及以上学历(优秀本科生可放宽)