负责建设小红书社区原生的Agent平台
利用LLM、RAG、Multi-Agent等前沿技术,深度理解用户复杂的非结构化Query(如旅游攻略、装修避坑、穿搭建议),调度全站笔记、商品与工具资源,为用户提供能够直接解决问题的“智能方案”
Agent核心架构建设:负责通用Agent框架的设计与研发,包括意图识别(Router)、任务编排(Planning)、工具调用(Function Calling)及多轮对话状态管理(Memory),构建支持高并发、低延迟的在线智能分发系统
大模型调优与对齐:基于开源或自研基座模型,利用SFT、RL等技术进行垂直领域微调
增强模型的小红书风格化表达(社区感)、复杂指令遵循能力及工具调用准确率等
垂类智能体落地:深入旅游、美妆、装修、法律等核心垂类,设计专有的Workflow,打通笔记、商卡、POI等结构化数据,提升用户从“搜索”到“决策”的转化效率
评测与迭代体系:建设Agent自动化评测平台(LLM-as-a-Judge),制定涵盖准确性、相关性、有用性及安全性的多维评估指标,通过离线评测与在线A/B实验持续驱动效果优化