围绕这一目标,课题从三个方向展开:
1)构建统一的工具使用“语言体系”:围绕“统一协议下的工具调用”进行建模与训练,通过抽象不同 API 的输入输出结构与调用逻辑,让模型学会用一种通用方式理解和使用各类工具,而不是依赖针对单一接口的定制化适配
目标是让工具调用像“说话”一样自然,而不是一段段硬编码的规则
2)提升跨任务、跨领域的泛化调用能力:基于大规模异构任务的数据构造与指令微调,强化模型在 Zero-shot 场景下对新工具的理解与调用能力
即使面对从未见过的 API,模型也能够通过接口描述与上下文信息,快速完成参数推断与调用决策,实现从“见过才会用”到“没见过也能用”的跃迁
3)增强未知环境下的逻辑迁移与决策稳定性:重点解决 Agent 在面对新工具、新任务组合时的推理与决策问题,包括调用顺序规划、异常处理以及多工具协同,使模型在复杂业务流程中能够稳定完成任务闭环,而不是在中间步骤出现偏移或失败