网络运维工程师(DCN)
🤖 AI 估测:¥35K-60K
发布时间:18 天前
ℹ️关于这个职位
该职位是网易的网络运维工程师,主要负责大型数据中心(IDC)网络架构的设计、建设与稳定运维
你将负责网络故障的快速响应与根因分析,并利用Python等工具开发自动化运维脚本以提升效率
同时,需要深入理解AI训练/推理等业务场景,将业务需求转化为网络优化方案
✓工作职责
网络运维与保障:
负责网易IDC网络架构设计与重大项目建设,保持技术领先性,确保高效稳定的网络交付
制定网络设备配置规范,推动版本标准化管理,避免配置不规范带来的运维
负责网络架构升级、设备扩容、线路割接等重大变更的方案设计、评审与执行
快速响应网络故障等突发事件,恢复网络服务,主导重大故障的根因分析(RCA),输出改进方案并推动落地
业务沟通与需求落地 :
主动对接业务部门,深入理解业务场景与网络需求,将业务指标转化为网络架构设计方案
向业务团队清晰传递网络技术方案价值,推动跨部门协作,确保网络资源配置与业务发展节奏匹配
自动化与运维体系建设:
基于 Python、Ansible等工具开发运维脚本,实现设备巡检、配置备份、故障自愈等自动化能力,降低人工操作成本
维护网络拓扑图、设备档案、应急预案等技术文档,推动AI知识库建设,提升团队协作效率
⭐最低要求
教育背景:本科及以上学历,计算机科学、通信工程、信息工程等相关专业
工作经验:具有10年以上大型网络规划、设计及运维经验,有大型企业网络资源规划经验者优先
技术能力:
精通TCP/IP协议栈,熟悉IDC场景下的BGP多线接入、VXLAN/SDN等技术的实际应用
精通智算网络核心技术,例如Clos/Fat-Tree 架构设计、RDMA/RoCEv2 协议,DCQCN算法原理,熟悉 华三/思科等厂商的智算网络设备
深入理解 AI 训练 / 推理的网络特性:如分布式训练的通信模式、推理服务的流量特征,能针对性设计网络优化方案
了解智算网络虚拟化技术:Kubernetes CNI 插件(如 Calico、Flannel)在 AI 场景的适配、容器与 RDMA 的融合方案
熟悉Cisco/Juniper/H3C等厂商设备配置,具备CCIE/HCIE或同等级别认证者优先
了解服务器硬件架构(RAID、网卡Teaming)、操作系统网络配置及常见服务(Nginx/HAProxy)的部署调优
软性要求:
责任心强:能独立承担值班压力,对故障闭环有强烈责任感,杜绝“踢皮球”行为
纪律性高:严格遵守变更规范、变更窗口期及操作审计要求,无违规操作记录
具备优秀的逻辑分析能力,熟练使用Wireshark、tcpdump、Zabbix等工具进行流量抓包及性能分析
经验与学历:
计算机/通信相关专业本科及以上学历,5年以上IDC网络运维经验
大型互联网公司运维工程师或大型服务集成商交付工程师优先
👍优先资格
有大型企业网络资源规划经验者优先
具备CCIE/HCIE或同等级别认证者优先
大型互联网公司运维工程师或大型服务集成商交付工程师优先