计算机科学、人工智能或相关专业硕士及以上学历,深入理解 Transformer 架构及 LLM 训练原理,能针对 SFT、RLHF/DPO 等后训练场景设计并落地高标准数据方案
在以下一个或多个方向有深入实践经验:角色扮演/开放域对话数据构建与多轮一致性优化、文本创作数据质量提升、知识问答事实性校验、推理与理科数据的正确性验证、长程记忆数据设计等
具备 Rubrics 评价体系的设计与质检经验,能推动人工标注、模型打分与规则校验等多种质检手段协同落地
熟练掌握 Python 及 PyTorch 等深度学习框架,善于利用 Cursor、Claude Code 等 AI 辅助工具提升数据生产与自动化分析效率
具备强烈的数据敏感度与洞察力,善于从海量数据与评测结果中发现隐含模式、定位模型能力瓶颈,并主动推动从 insight 到落地的完整闭环
拥有优秀的跨团队协作与沟通能力,能将数据发现清晰传达给算法、产品等上下游团队