工作职责
构建可运行的 Agent 核心链路:围绕社区新交互场景,设计并实现 Agent 的核心能力,你需要把一个“看起来可行的想法”,真正落成可以跑、可以测、可以复盘的系统
端到端负责从想法到验证的完整闭环:你需要从 0 到 1 推动一条探索链路,我们希望你不是只完成开发任务,而是能对“这个方向是否成立”给出工程化判断
设计并实现 Agent Runtime:为智能体在线运行提供稳定的系统支撑,你需要把模型能力变成真正稳定、可维护、可演进的系统能力
设计并实现 Agent Harness:除了让 Agent 跑起来,我们也重视让 Agent 可测试、可评估、可回放、可比较
我们希望把一次次探索,沉淀成可重复验证、可持续优化的实验能力,而不是一次性 demo
与多角色协作,把模型能力做成产品能力:把需求变成可执行的 agent spec,把模型能力变成稳定的系统能力
推动 agent 技术路线图与关键架构决策:工具协议、记忆方案、评测口径、发布与灰度机制