工作职责:
Agent 核心架构建设:负责通用 Agent 框架的设计与研发,包括意图识别(Router)、任务编排(Planning)、工具调用(Function Calling)及多轮对话状态管理(Memory),构建支持高并发、低延迟的在线智能分发系统
大模型调优与对齐:基于开源或自研基座模型,利用 SFT、RL 等技术进行垂直领域微调
增强模型的小红书风格化表达(社区感)、复杂指令遵循能力及工具调用准确率等
垂类智能体落地:深入旅游、美妆、装修、法律等核心垂类,设计专有的 Workflow,打通笔记、商卡、POI 等结构化数据,提升用户从“搜索”到“决策”的转化效率
评测与迭代体系:建设 Agent 自动化评测平台(LLM-as-a-Judge),制定涵盖准确性、相关性、有用性及安全性的多维评估指标,通过离线评测与在线 A/B 实验持续驱动效果优化