负责部门内AI语音对话、智能体和具身智能系统的高可用性、可靠性和性能设计
开发和维护监控基础设施,及时发现并解决潜在问题,确保相关系统的正常运行
开发和优化自动化工具,以提高系统的配置、部署和监控效率,支持AI语音和智能系统的快速迭代和性能优化
快速响应生产环境中的故障,通过分析系统资源使用情况,进行容量规划和性能优化,以满足业务增长和智能应用需求
与产研团队密切合作,共同推动技术创新和系统稳定性提升,支持AI解决方案的可扩展性和可靠性改进
提升系统在故障情况下的恢复能力
制定和实施容灾方案,确保智能系统的稳健运行