负责公司100台以上服务器的日常运维工作,涵盖物理机、虚拟化平台(VMware/KVM等)的部署、监控、故障排查与性能优化,保障业务系统7×24小时稳定运行
主导或参与系统迁移项目,包括服务器迁移、应用系统迁移、数据迁移等,制定详细迁移方案、风险预案,确保迁移过程零停机或最小化业务影响
负责虚拟化环境的全生命周期管理,包括虚拟机的创建、配置、克隆、快照与备份,优化虚拟化资源分配,提升资源利用率,解决虚拟化集群中的网络、存储及兼容性问题
参与应用系统的发布、部署与版本回滚工作,制定标准化运维流程(SOP),推进运维工作的自动化、规范化建设
搭建和维护服务器监控告警体系,及时发现并处理服务器硬件故障、系统漏洞、应用异常等问题,定期输出运维报告与优化建议
配合开发团队完成环境搭建、问题定位与调试工作,提供技术支持,保障研发与生产环境的一致性
负责运维文档的编写与更新,包括服务器配置清单、运维手册、应急预案等,沉淀运维知识与经验