计算机科学、数学、人工智能等相关专业硕士及以上学历
具备良好的数理基础和 NLP 技术基础,能够熟练使用 Megatron,HuggingFace,DeepSpeed,PyTorch 等框架至少一种,深入理解 Transformer、GPT 等模型架构
在 Post-training 方向有一定研究基础,熟悉 SFT/DPO/PPO/GRPO/Reward Model 等
具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用
对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力