负责将业界领先的 Agent 开发工具集成到内部强化学习(RL)基础设施中,打通外部工具与内部训练体系的链路
负责 Agent 容器服务的日常维护,包括框架版本同步、依赖管理、环境稳定性保障等运维工作
搭建并完善 Agent 评测平台,开发轨迹查看、调试分析等可视化工具,提升模型迭代效率
维护和优化内部 Agent 集成框架,支持便捷对接 RL 训练框架及外部 Agent Scaffold(如 LangChain、OpenAI Agents SDK 等),降低研发接入成本
与算法团队紧密协作,参与 Agent 能力的工程化落地,推动 Agent 系统的可靠性与可扩展性提升