本科及以上学历,计算机、人工智能和数学等相关专业
熟练掌握扩散模型设计和使用技巧
有丰富的大模型预训练和后训练数据处理经验,熟练掌握数据收集、数据清洗、数据去重和数据合成等流程,能针对数据质量制定出评估指标和方法
MoE/Dense模型训练实战经验,包括模型预训练、RL Reasoning、SFT和RLHF等,熟练掌握各种模型训练和推理技巧
熟悉大模型训练和推理框架,熟练掌握模型并行、数据并行和流水线设计等技巧
熟悉各类评测基准和构造技巧,熟练掌握大模型客观评测和主观评测方法
有良好代码能力,熟练掌握Python、C++和JAVA等编程技能