系统设计与研发: 负责设计、实现并运维支撑智能运维智能体平台的大规模、高可用分布式系统,处理PB级的实时日志&监控等数据
核心功能开发: 端到端地负责AI Agent核心功能的研发,包括异常检测、根因分析、任务规划(Planning)及智能修复建议等模块,将前沿概念转化为可靠的线上服务
算法工程化落地: 与算法科学家紧密合作,负责将前沿的大语言模型(LLM)及其他机器学习模型产品化,构建高效的数据处理管道、模型推理服务与反馈闭环
技术战略与卓越工程: 参与制定团队的技术路线图,驱动软件工程、系统架构与运维卓越的最佳实践,持续提升系统的扩展性与鲁棒性
技术攻坚与指导: 解决系统中最具挑战性的技术难题,并乐于指导团队其他工程师,共同营造追求技术卓越的工程师文化