Agentic RL
面向长时序任务的强化学习
Agent 在交互环境中的探索与策略优化
多目标、多约束条件下大模型Agent的决策稳定性与泛化性
Test-time的数据高效Agentic RL
Agent reward model的系统性学习问题
大模型智能体的MARL
Agentic Memory
短期 / 中期 / 长期记忆架构设计
可演化、可压缩、可检索的Memory 系统
经验、技能、失败案例的结构化沉淀
Memory 与 Planning / RL / Tool 之间的协同机制
Agent Workflow
Task Decomposition / Planning / Re-planning
多 Agent 协作与角色分工
反思、自我修正、策略升级
工具集和技能库自演进
自适应和可学习的Agent 工作流
Agent Application
GUI Agent:跨应用、多模态界面下的操作与理解
OS Agent:文件系统、进程、命令、自动化工作流
Deep Research Agent:复杂研究任务、信息整合、假设验证
通用 Agent :跨时间跨任务跨领域的自主学习Agent