计算机科学、数学、人工智能等相关专业硕士及以上学历,具备良好的数理基础
具备良好的工程实现能力,熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架
具备良好的技术视野,深入理解大模型相关技术原理,熟悉大模型 SFT、RL 及 reward 建模等训练范式,对 RL/OPD 等有深入的实践和研究经验
具备良好的数据 sense 和问题分析能力,作风严谨细致,善于借助大模型及相关工具解决问题和提升效率
对大模型及相关前沿技术和产品具有极强的热情,具备独立探索前沿技术的能力,有良好的团队协作和沟通能力