策略设计与迭代: 深度参与DeepSeek模型在搜索、内容创作(创意/实用写作)、多模态、Agent等场景的应用
通过数据分析与用户行为洞察,制定模型优化策略,定义数据生产标准(SFT/RL),驱动模型效果(如准确性、有用性、安全性)持续提升
评测体系构建: 设计科学、多维度的模型评测体系
主导构建内部测试集,制定人工评估与自动化评估标准,量化模型能力边界,对模型上线后的核心指标负责
高质量数据建设: 负责后训练阶段的高质量语料挖掘与构建
针对特定领域(如医学、法律、小说创作)建立专家级的数据标注,确保训练数据的高质量供给