负责携程搜索、推荐、广告全链路业务模型的工程化落地与性能优化,覆盖酒店、火车票、度假、内容营销等核心旅游场景,保障亿级 DAU 下高并发、低延迟的在线推理服务稳定运行
负责模型推理架构搭建、优化与维护,基于 TensorRT/Triton/ONNX 技术栈,结合 GPU 算力特性完成模型量化、算子优化、批处理调度与服务部署,持续提升服务性能与 GPU 资源利用率、控制算力成本
参与 CTR/CVR 预估、多目标排序、召回粗排等核心模型的 GPU 训练架构迭代与优化,推进 GPU 分布式训练、显存优化、训练稳定性提升等工作
同时参与搜广推大模型工程化落地,负责混合式与生成式大模型的架构设计、工程实现及全链路部署难题攻坚
跟踪业界搜广推与大模型工程化前沿技术,结合携程旅游业务特点完成技术选型、方案落地与技术沉淀,形成可复用的平台化能力