负责TOC相关业务的稳定性建设,包括但不限于Web服务、APP后端、API网关
负责Kubernetes集群的建设与稳定性保障,包括版本升级、故障排查、资源利用率优化
设计高可用架构,解决APIServer性能瓶颈、etcd存储压力等大规模集群特有问题
主导容器化架构调优(如Pod调度策略、网络插件选型、存储方案设计),优化资源请求/限制配置以减少资源争用
建立容器安全防护体系,包括漏洞扫描、运行时安全监控(如Falco)、合规审计
深度参与自动化运维工具链建设,CI/CD流水线混沌工程测试、智能扩缩容(HPA/VPA) 推动Al0ns落地,其于时字数据合析预洲售群负裁并实现自愈
解决生产环境疑难问题(如 OOM、网络延迟、存储性能瓶颈),输出标准化SOP文档车
协同研发团队优化微服务架构,推动ServiceMesh等新技术落地