模型 Scaling Up 与底层架构重构: 深入参与广告精排大模型的演进,告别传统冗余的交叉结构,探索如 Token Mixer 等 Hardware-aligned 的极简网络拓扑
在严格的在线 P99 延迟约束下,优化 GPU MFU,实现参数量级的有效跃迁
2.端到端超长序列建模: 依托全域(推荐/搜索/广告)大一统的特征基建,参与 1K 乃至 10 万级超长泛行为序列的端到端入图
突破传统 Attention 复杂度墙,利用目标感知与分段压缩机制,挖掘长尾用户的巨大商业价值
3.多模态表征与生成式召回: 结合 最新最潮的 Qwen 等MLLM基座,打通“内容语义”与“用户行为”的隐式关联,产出多模态表征
探索并落地基于以上表征的生成式召回,拓展广告商业流量边界
4.跨场域 OneModel 融合探索: 参与构建连接搜索、推荐、广告的统一基座模型(OneModel),打通多场景实时流序列特征,优化全链路漏斗(CTR/CVR)的匹配精度与转化效率