负责先进大模型在搜索业务中的应用,设计并建设超大规模在线模型推理系统,实现数万张XPU卡的高效调度与管理,支持百万级QPS的实时推理请求
负责研究并落地大模型预训练、量化、蒸馏、稀疏化等最新技术,持续优化业务模型训练、推理成本,支持大模型分布式高效训练与推理等
负责面向搜索的一站式机器学习平台的设计和研发,支持从数据处理、模型训练、推理优化到上线部署的全流程自动化,不断提升模型迭代效率
紧跟业界大模型技术发展动态与业务应用情况,积极参与并打造行业领先的智能化搜索新产品,共同推动百度搜索技术不断创新、完成变革