学习并了解火山引擎观测组件、系统、基础设施等各层技术的调用关系
负责设计、落地各类业务及基础设施系统的稳定性保障解决方案,包含但不限于线上问题管理、全维度全链路监控管理、线上生产变更管理、故障容灾演练管理、重大活动管理及稳定性文化建设
深入支撑火山引擎观测系统的所有技术类问题,包括应急响应、应急调度、协同处理和整体业务保障,并持续优化该体系的质量、效率、成本,提升整体服务品质
主导并推进标准稳定性保障解决方案落地到产品工具中,通过产品工具降低成本、提升服务效率,实现高效自动化且可扩展的技术服务运行模式
基于对行业内业务形态的了解,为业务团队提供稳定性保障服务支撑,并能够基于产品工具结合业务痛点输出稳定性保障解决方案
参与并推进观测业务质量工程及稳定性能力建设,支撑观测业务质量体系的落地