参与大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务
参与设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制
负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块
参与系统架构的设计、优化及核心模块的代码实现(Java为主)
与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地
负责系统的日常维护、监控、故障排查和性能调优