计算机科学、计算机体系结构、软件工程、人工智能等相关专业的博士及优秀硕士
具有大规模分布式训练系统、高性能计算或 MLSys 方向研究与工程背景者优先
深入理解大规模分布式训练系统,熟悉 DeepSpeed、Megatron-LM、PyTorch FSDP 等主流框架原理
熟悉张量并行、流水线并行、序列并行等并行策略
精通 Python 与 C++,熟悉 CUDA 编程及高性能算子开发
在 MLSys、SC、EuroSys、OSDI、ATC 等系统顶会或 CVPR/NeurIPS/ICML 系统方向有相关成果者优先
对底层系统与 AI 交叉方向有浓厚兴趣,具备从系统视角分解和量化性能瓶颈的能力
工程严谨性强,能在超大规模训练环境中快速定位和解决复杂系统问题
沟通协作能力强,能与算法、硬件、平台等多方团队高效协同推进