主要研究方向:
AI 智能体 (AI Agent)
Agent 基础能力:研发大规模、高质量的 Agent 数据合成管线,提升模型在 Code、Search 及 General Tool Use 使用等场景下的能力
高级 Agent 系统:探索多智能体协作、长时记忆系统及交互环境的构建,提升模型解决复杂任务能力
大语言模型推理 (LLM Reasoning)
强化学习与推理:探索高效、稳定的强化学习算法
推理能力提升:增强模型在数学、代码与逻辑等复杂任务中的推理能力,提升模型的智能上限
可扩展对齐 (Scalable Alignment)
模型对齐与 RLHF:持续提升模型的指令遵循度、有用性与诚实性
AI 安全与价值观:为大模型构建可靠、可信的行为准则,提升 AI 安全性