负责大模型数据生产体系构建,从大规模的数据合成到HITL的世界知识精华注入,深入研究大模型工作原理,助力大模型效果迭代
推动数据平台的智能化演进,搭建AI辅助的智能标注、质量校验与数据迭代闭环系统,实现任务的自动分配、错误智能修正、数据价值自动评估,降低人力成本并提升数据生产的标准化与规模化
主导大模型数据构建的全流程,从模型效果分析到数据策略迭代,确保数据的高效性与准确性,持续调优模型性能
通过数据分析与算法改进,优化大模型数据供应链,提升模型效果和用户体验,并与跨部门团队协作推动项目落地
关注行业前沿技术,引入创新技术,为数据生产系统的技术发展提供前瞻性建议,特别是在Coding、多模态等领域的应用突破