系统运维工程师

🤖 AI 估测:¥35K-55K

发布时间:大约 18 小时前

立即应聘

ℹ️关于这个职位

作为系统运维工程师,你将负责带领运维团队,设计高可用系统架构,推动自动化运维和云原生技术落地,保障系统稳定性和安全性
这个职位适合有10年以上经验、精通Linux、Kubernetes和自动化工具链的技术管理者

工作职责

岗位职责:
核心职责:
一、团队管理与建设
负责运维团队的日常管理、工作安排、绩效评估和人才培养
打造高效、协作、有战斗力的运维团队,建立团队技术成长体系
制定和优化运维团队的工作流程、规范与制度
二、系统架构与稳定性保障
负责设计、规划和落地高可用、可扩展、安全的系统架构,并持续优化
建立并完善全方位的监控、告警、日志和性能分析体系,实现故障的快速发现、定位与恢复
主导制定和演练灾备、容灾方案,确保核心业务的高可用性
负责重大故障的应急响应、处理、复盘及后续改进措施的跟进
三、运维体系建设与自动化
主导运维自动化体系的建设,通过CI/CD、自动化运维平台等工具,提升运维和研发效率
推动容器化(如 Docker/K8s)和云原生技术的落地与实践
管理和优化运维工具体系,包括但不限于配置管理、发布系统、监控平台等
四、安全与成本控制
负责网络、系统和数据的安全,制定安全策略,定期进行安全审计和漏洞扫描,防范安全风险
管理和优化云上及数据中心的资源,控制成本,提升资源利用率
负责运维预算的制定和控制
五、跨部门协作

最低要求

一、必备条件:
学历与经验:计算机相关专业本科及以上学历,10年以上运维经验,其中至少3年以上中大型互联网企业运维团队管理经验
技术广度与深度:
(1)精通 Linux 操作系统原理、网络技术(TCP/IP, HTTP, DNS等)及常见中间件
精通至少一种云服务平台(如阿里云,华为云、腾讯云等)的产品和服务
(2)精通容器化技术(Docker)和容器编排系统(Kubernetes),并有大规模集群管理经验
(3)精通自动化运维工具链(如 Ansible/Puppet, Terraform, Prometheus, ELK, Jaeger 等)
(4)熟练掌握至少一门脚本语言(Shell/Python/Go),具备自动化工具开发能力
管理能力:具备优秀的团队领导能力,能够激发团队成员潜力
出色的项目管理和跨部门沟通协调能力
具备良好的战略思维和规划能力,能够制定团队技术发展方向
问题解决能力:具备复杂系统问题分析和解决能力,有处理过大规模系统故障的经验
对系统高可用、容灾、性能调优有深刻理解和实践经验