负责 Agent 评估框架(Harness Engineering)的设计与开发,构建覆盖任务完成度、对话质量、工具调用准确性等多维度的自动化评测体系
负责 Agent 自进化(Self-Evolution)方向的研究与落地,基于评估信号驱动 Agent 自动优化、自我纠错与能力迭代,探索无人工干预下的持续进化闭环
负责基于 Agent 的用户主动感知与推荐系统研究,包括用户意图建模、跨会话记忆利用、主动提问策略与个性化推荐,提升 Agent 的主动服务能力
基于 Agent 记忆系统,负责多模态感知应用能力的研究与落地,包括图像、人脸、声纹等识别能力与用户记忆的深度结合,实现跨会话的人物识别、声纹记忆与个性化感知应用,提升 Agent 对用户的长期理解与主动服务能力
与产品和工程团队紧密合作,推进评估与自进化能力在相关业务中的部署和落地