负责大模型后训练(SFT+RL)阶段长文与复杂指令类数据的全链路研发,围绕长篇幅内容生成、多约束/多步骤复杂指令遵循等核心场景,设计并落地覆盖数据生产、自动化质检与定向修复的端到端方案,确保数据在长程连贯性、结构完整性、指令遵循精度等维度的稳定、高标准交付
深度参与Rubrics评分标准体系的设计、生产与质检,针对长文与复杂指令场景,构建原子化、可量化的多维评价体系,搭建从标准生成到评分验证的自动化 pipeline
建立多层质量校验机制 ,实现“评测发现问题—数据定向补强—配方迭代优化—效果闭环提升”
深度追踪并研究支撑大模型后训练和复杂指令能力提升的前沿数据技术,重点关注长上下文数据构建、复杂指令自动生成、Rubric-based Evaluation、自动化质检、错误归因与数据修复等方向,能够将最新数据方法快速转化为业务价值,持续驱动模型在长文与复杂任务场景下的能力演进