运维平台开发:负责公司运维自动化平台、监控告警系统、CI/CD流水线的设计、开发与迭代,提升运维效率与交付稳定性
自动化建设:主导服务器部署、配置管理、服务发布、故障自愈等运维流程的自动化落地,减少人工干预成本
监控与故障处理:搭建完善的监控体系(系统、服务、业务指标),快速定位并解决线上故障,建立故障复盘与优化机制
云原生/基础架构支持:负责Kubernetes集群、容器化应用的运维开发支撑,配合完成云资源规划、扩容与成本优化
脚本与工具开发:编写Shell、Python等脚本工具,解决运维实际问题,沉淀可复用的技术组件与解决方案