硕士及以上学历,具有扎实的计算机基础,熟悉操作系统和计算机体系结构等,熟练掌握 C++/Python,对数据结构与算法设计有较深刻的理解
熟悉至少一种主流的深度学习框架(如 PyTorch)和至少一种主流的训练框架(如 Megatron/Deepspeed/FSDP)
熟练掌握 CUDA 相关编程,有内核级优化经验者优先
了解大模型训练基本范式,熟悉 Transformer 架构及其优化方法(如 FlashAttention、GQA/MLA 等)者优先
责任心强,思路清晰,技术视野开阔,对业界新技术敏感,喜欢钻研,具有良好的学习能力并注重团队合作