研究方向一:下一代端到端生成式 广告大模型系统
生成式广告大模型架构设计:基于前沿大模型(如时空Transformer、MLA、MoE等),设计适配广告场景的生成式决策框架,支持根据“用户行为、实时位置、商户出价”端到端生成最优的广告商家、展示创意、相应计费
多阶段的训练范式设计:借鉴LLM的分阶段训练技术(如PT、SFT、RLHF等),设计“基于海量交互的 pre-training 和 基于业务目标的 post-training ”的分阶段训练范式,提升广告大模型效果
广告大模型的Scaling规律探索:探索广告场景下,生成式大模型“算力->效果”的转化规律,驱动推广搜迭代范式实现由“人工设计迭代”到“算力堆叠迭代”的跃迁
研究方向二:基于大模型重构广告系统
领域LLM 构建:基于sota 基座模型,系统性整合美团用商双端数据,通过PT、SFT、RLHF等方式构建适配外卖/到餐领域的垂直领域LLM,快速支持商业广告系统多大模型应用落地
基于强化学习+领域LLM 的通用广告解决方案:基于领域LLM,结合GRPO等强化学习技术,探索广告召回、粗排、精排建模的新范式,探索广告领域建模的scaling law
结合广告业务场景与大模型前沿技术,探索改造广告算法链路的创新方向,实现广告算法链路的大规模升级及核心指标的显著提升