跟踪并探索LLM/Agent/多语言等前沿方向,面向真实生产力场景(如:信息分析与处理、客服与销售、搜索与推荐、办公自动化等)提升效果,沉淀通用可规模化的方法论与系统能力
围绕LLM/Agent/多语言能力与训练范式开展探索与优化,包括但不限于:LLM能力优化:指令遵循、复杂推理、长上下文、生成质量与幻觉治理等
Agent能力提升:规划与决策、工具调用与推理、上下文管理与记忆、长程任务和多Agent等
多语言能力建设:多语言指令遵循与复杂推理、多语言检索与知识增强、小语种与跨语言一致性等
训练与优化方法:大规模数据与环境扩展、奖励/偏好建模(生成式奖励、RLAIF/RLHF等)、端到端强化学习等
挖掘现实世界高价值任务,设计科学严谨的量化评测体系,推动模型智能持续提升,为广大企业和开发者提供顶级的大模型服务