硕士及以上学历,计算机科学、人工智能、自动化、数学等相关专业优先
精通多模态任务设计范式(如视觉思维链、跨模态推理链),具备CoT提示工程、Reward Model设计经验,掌握合成数据生成、多模态数据清洗、数据质量评估工具开发
熟练应用PyTorch+DeepSpeed、Megatron-LM等分布式框架,精通QLoRA、DPO、RLHF以及PPO/GRPO/DAPO等后训练技术
主导过千亿级模型的后训练全流程,包括SFT数据构建、RM训练、RLHF/DPO对齐优化、端侧量化部署
具备丰富的多模态数据治理经验,如构建百万级图文对齐数据集,或设计视频-文本跨模态评测基准
热衷于推动多模态大模型、生成式AI、Agent等前沿技术在快手生态中的发展与应用,能系统性拆解业务需求为并制定可量化的任务目标
具备跨团队协同能力,能够有效推动算法、数据、工程团队建立标准化数据交付流程