Agent 决策引擎研发:负责基于 LLM 的规划(Planning)与决策算法,优化 ReAct、CoT、ToT 等框架,提升 Agent 在复杂、多步骤业务场景下的成功率与鲁棒性
RAG 与知识工程:研发高性能的检索增强生成(RAG)系统,优化向量检索、重排序(Rerank)及长文本处理算法,确保 Agent 具备精准的业务知识边界
工具学习与调用(Function Calling):优化模型对 API 调用的理解与参数提取能力,解决多工具组合下的冲突与幻觉问题,提升 Agent 对复杂外部系统的操控精度
模型微调与蒸馏:针对 Agent 场景进行 SFT、RLHF 或 DPO 微调,提升模型在特定任务(如代码生成、逻辑推理、指令遵循)上的表现,并实现高性能推理部署
评估与自进化体系:构建 Agent 自动评估框架,利用模拟器(Simulator)或 LLM-as-a-judge 机制实现算法的快速迭代与线上自演化