Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Tencent logo
腾讯
AI数据中⼼⽹络运营⼯程师
立即应聘

AI数据中⼼⽹络运营⼯程师

发布于 大约 14 小时前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
本科
信息技术与基础设施
BGP
RDMA
RoCE
SONiC
ECN
PFC
Dcqcn
Gnmi
Spine-Leaf

AI 估算 · 20k–35k

腾讯大厂,技术难度高,AI基础设施方向薪资竞争力强,2年经验对应中级工程师水平。

职位详情

关于这个职位

作为腾讯AI数据中心的网络运营工程师,你将负责大规模RoCE网络的日常运维、故障处理和性能优化,确保AI业务的高可用与低延迟

你将接触到前沿的无损网络技术,与团队协作推动自动化运维工具的建设,并持续积累网络运营知识体系

最低要求

一、基本要求

计算机科学、通信工程、电子信息或相关专业本科及以上学历
年以上数据中心网络运维/运营经验
熟悉数据中心网络架构(Spine-Leaf / Clos / Fat-Tree),有大规模(千台交换机以上)网络运营经验优先
二、专业技能
路由与交换:熟练掌握 BGP(eBGP/iBGP)、ECMP、VLAN、LACP / MLAG(M-LAG)等协议的原理与配置
RoCE 网络:理解 RoCEv2 协议栈、无损以太网设计原则,熟悉 PFC / ECN 机制与 DCQCN 算法参数调优
交换机操作:熟悉至少一种主流数据中心交换机平台(如 SONiC、Cumulus、NX-OS、EOS、CloudEngine)的配置与故障排查
网卡与驱动:了解 RDMA 网卡(如 NVIDIA ConnectX 系列)的基本配置,包括 QoS 映射、PFC 配置、固件升级等
监控与遥测:了解网络遥测技术(gNMI Streaming Telemetry、INT 带内遥测)及流采样(sFlow / NetFlow),能基于计数器与时序数据进行根因分析
三、能力素质
较强的逻辑分析能力和故障排查思维,能在压力下快速定位复杂网络问题
良好的沟通协作能力,能与开发、架构、业务团队高效配合
责任心强,能接受 oncall 轮值,保障关键业务的网络可用性
持续学习意愿,关注业界 RoCE/无损网络/AI 网络的技术演进

工作职责

网络运营保障:负责数据中心 RoCE 网络的日常运维,包括网络监控、告警处理、变更管理,保障网络高可用和低延迟

故障诊断与应急:主导网络故障的快速定位与恢复,尤其是 PFC Storm / PFC Deadlock、丢包、链路降级、拥塞扩散等无损以太网典型问题的诊断处理
性能调优:根据业务负载特征,调整拥塞控制策略(PFC 阈值 / ECN 标记 / DCQCN 算法参数)、交换机 Buffer 策略(Headroom / Shared Buffer / α 值)、ECMP 负载均衡策略等,持续优化网络吞吐和延迟表现
容量规划:参与网络架构评审和容量规划,评估现网瓶颈,为扩容/新建集群提供技术方案
自动化运维:协同开发团队,推动网络运维工具和自动化平台的需求定义与落地,提升运维效率
文档与知识沉淀:建设网络运营知识库,输出最佳实践、故障案例库和操作手册

优先资格

有大规模(千台交换机以上)网络运营经验优先

AI 洞察

优缺点分析

优点

  • 腾讯大平台,接触超大规模AI网络,技术积累深厚
  • 涉及RoCE/无损网络等前沿技术,保持行业竞争力
  • 团队专业,有完善的导师和培训体系
  • 技术深度高,要求持续学习,学习曲线较陡
  • 适合有2年以上网络运维经验、对AI和数据中心网络有浓厚兴趣、能接受高强度工作的技术人才

缺点 / 挑战

  • 需要oncall轮值,工作压力大,可能影响生活平衡

角色解读

  • 向网络架构专家方向发展,深入理解大规模数据中心网络设计
  • 可向AI基础设施技术管理岗位转型,结合业务需求推动网络创新
  • 积累故障处理经验后,成为团队技术骨干或负责人
  • 负责AI数据中心RoCE网络的日常运维,包括监控、告警处理和变更管理,保障网络高可用与低延迟
  • 主导网络故障的快速定位与恢复,特别是PFC死锁、丢包等无损网络典型问题的诊断
  • 根据业务负载调整拥塞控制参数和交换机Buffer策略,持续优化网络吞吐和延迟
  • 精通BGP、RoCEv2、PFC/ECN等协议原理及配置
  • 熟悉至少一种主流数据中心交换机平台(如SONiC、NX-OS)的故障排查
  • 了解RDMA网卡配置和网络遥测技术,具备根因分析能力

申请策略

  • 了解腾讯云AI业务方向,在面试中体现对业务的理解
  • 准备好实际故障案例,展示逻辑分析和解决问题能力
  • 突出RoCE相关项目经验,如PFC调优或故障处理案例
  • 强调大规模网络运维经历,展示故障排查和自动化能力
  • 列出掌握的交换机平台和脚本语言(如Python),体现技术广度
  • 补充对SONiC、gNMI等新技术的了解,可提前学习
  • 复习无损网络理论(DCQCN、ECN),准备技术面试

面试指南

  • 技术问题:从原理到实践,先解释机制,再结合自己的经验
  • 故障案例:采用STAR法则,强调排查逻辑和最终效果
  • 开放问题:展示学习能力和团队协作意识
  • 请解释RoCEv2的工作原理以及PFC和ECN的作用
  • 如何处理PFC死锁?描述排查步骤
  • 你过去处理过的最复杂的网络故障是什么?如何解决的?
  • 如何优化数据中心网络的延迟和吞吐?
  • 你对自动化运维有什么看法?如何推动工具落地?

职位点评

71
综合评分

腾讯大厂,前沿技术栈,薪资优厚,但工作强度大且需oncall。

更适合这类人
适合极度看重技术成长和薪资、能接受较高工作强度的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利

85较高

腾讯大厂薪资福利优厚,但JD未明确数字,整体竞争力强。

薪资信号未披露(AI估算:20K-35K/月)

成长发展

90较高

涉及RoCE/无损网络等前沿技术,有知识库建设和最佳实践输出,成长空间大。

技术前沿前沿/新兴技术
技术栈RoCE、PFC、ECN、DCQCN、BGP、SONiC、RDMA、Spine-Leaf、gNMI、sFlow
成长机会建设网络运营知识库、输出最佳实践
业务类型cost_center

工作生活

40较低

现场办公且要求oncall轮值,WLB较差,但深圳核心地段办公。

工作模式仅现场办公
办公地点市区核心地段
加班情况明确要求弹性/高强度

使命价值

70中等

AI基础设施支撑行业发展,但网络运营对社会直接影响有限。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • AI ⽹络集合通信库运营⼯程师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 腾讯云全球CDN后台开发工程师(深圳)

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 《使命召唤手游》-音频策划

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • AI数据中⼼⽹络运营⼯程师

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • PUBG Mobile-安全运营-新星引力计划

    腾讯 · 深圳市
    AI 估算 · 20k-35k

相似职位推荐

  • Transition Mgmt: Technology Platform & Production Support, AVP

    道富公司 · 杭州市
    AI 估算 · 30k-50k
  • 安全管理工程师

    中国平安 · 上海市
    AI 估算 · 15k-25k
  • SRE运维工程师(基础架构)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • SRE运维工程师(企业效能)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • 基础环境专员-苏州/上海

    富士胶片 · 上海市
    AI 估算 · 10k-18k

腾讯 的其他在招职位

  • AI ⽹络集合通信库运营⼯程师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 腾讯云全球CDN后台开发工程师(深圳)

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 《使命召唤手游》-音频策划

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • AI数据中⼼⽹络运营⼯程师

    腾讯 · 北京市
    AI 估算 · 25k-45k
  • PUBG Mobile-安全运营-新星引力计划

    腾讯 · 深圳市
    AI 估算 · 20k-35k

相似职位推荐

  • Transition Mgmt: Technology Platform & Production Support, AVP

    道富公司 · 杭州市
    AI 估算 · 30k-50k
  • 安全管理工程师

    中国平安 · 上海市
    AI 估算 · 15k-25k
  • SRE运维工程师(基础架构)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • SRE运维工程师(企业效能)

    米哈游 · 上海市
    AI 估算 · 25k-40k
  • 基础环境专员-苏州/上海

    富士胶片 · 上海市
    AI 估算 · 10k-18k