数据挖掘与构建: 设计并维护高质量训练数据集,构建数据飞轮机制,利用大模型辅助数据生成与清洗,沉淀领域知识
大模型训练: 负责领域大模型post-training技术(不限于SFT、RL、GRM构建),提升模型在交互场景的表现
大模型评测: 构建自动化评测体系,设计skills评估方案,探索self-generated skills 与 human-designed skills 的差距,构建更完善的skills creator
设计基于模型与人工的评估方案,制定业务指标,驱动模型持续迭代优化
多智能体架构: 设计并开发多智能体协作框架,包括多轮交互 Agent、主动服务 Agent、意图理解 Agent 等,实现复杂任务的分治与协同
Co-work Agent: 熟练使用openclaw、claude code等提升工作效率、实现更多场景需求