计算机科学、数学、人工智能等相关专业硕士及以上学历
具备良好的数理基础和 NLP 技术基础,能够熟练使用 HuggingFace,Megatron,DeepSpeed,PyTorch 等框架至少一种,深入理解Transformer、GPT等模型架构
在Post-training方向有一定研究基础,熟悉SFT/DPO/PPO/GRPO/Reward Model等
具备良好的分析和解决问题的能力,针对具体的应用场景能合理设计和优化算法并应用
对于探索前沿技术有很好的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力