ByteDance logo
字节跳动
AI网络架构工程师-基础架构

AI网络架构工程师-基础架构

发布于 大约 17 小时前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
学历未注明
BGP
RDMA
VXLAN
TCP
AR
QoS
ACL
ECN
PFC
Srv6

AI 估算 · 30k–60k

大厂高级网络架构师,技术门槛高,北京市场薪资高,预估月薪3-6万

职位详情

关于这个职位

作为AI网络架构工程师,你将负责设计和优化字节跳动AI训练与推理的高速网络,确保大规模分布式训练的高效稳定

需要精通RDMA、TCP/IP等网络技术,参与HPN网络方案设计与落地

最低要求

精通RDMA PFC、ECN、DLB、GLB、QoS、AR等高性能网络优化技术

精通TCP、BGP、SRv6、VXLAN、ACL等经典网络技术
熟悉AI训练、推理业务模型
熟悉集合通信原理
熟悉Perftest、NCCL test等常用测试工具使用

工作职责

负责AI训练、推理网络需求分析,行业趋势分析

负责HPN网络方案设计
负责HPN网络架构测试验证、协助建设团队完成新架构平稳落地

优先资格

有HPN网络设计经验者优先

AI 洞察

优缺点分析

优点

  • 参与全球领先的AI基础设施网络建设,接触HPN等前沿技术,技术积累价值高
  • 大厂平台提供完善的福利和薪酬体系,职业发展空间广阔
  • AI网络对性能和稳定性要求极高,工作强度大,可能需要应对紧急故障
  • 技术栈深且更新快,需要持续学习,保持对RDMA等底层技术的深入理解
  • 北京互联网公司集中,竞争激烈,需要过硬的技术实力

缺点 / 挑战

  • 字节跳动业务规模大,项目挑战性强,能够极大提升复杂系统设计能力
  • 适合热爱底层网络技术、对高性能计算有浓厚兴趣、愿意挑战大规模系统难题的工程师

角色解读

  • 从网络架构工程师成长为AI基础设施专家,深入参与超大规模数据中心网络设计
  • 可向技术专家或架构师方向发展,主导HPN等前沿网络技术的研究与落地
  • 也可横向扩展至系统架构、计算平台等相邻领域,成为综合性技术人才
  • 分析AI训练和推理的网络需求,跟踪行业趋势,确保网络架构满足大规模分布式计算需求
  • 设计HPN高性能网络方案,优化RDMA、TCP/IP等协议栈,提升网络吞吐和延迟
  • 负责网络架构的测试验证,与建设团队协作推动新架构平稳落地
  • 精通RDMA系列技术(PFC、ECN等)和经典网络协议(TCP、BGP、VXLAN等),具备扎实的网络调优能力
  • 熟悉AI训练和推理的业务模型,理解集合通信原理,能够针对模型特点优化网络
  • 掌握Perftest、NCCL test等测试工具,具备网络性能分析和问题排查能力

申请策略

  • 准备一个你主导的网络优化案例,详细说明问题、方案和效果
  • 了解字节跳动AI基础设施的公开技术博客(如火山引擎),展示对公司的了解
  • 突出RDMA、TCP/IP等网络协议的实际调优经验,用具体数据(如延迟降低、吞吐提升)展示成果
  • 强调参与过AI训练/推理网络架构设计或维护的经历,说明对业务模型的理解
  • 列出HPN、RoCEv2等高性能网络相关项目,体现技术深度
  • 深入学习NCCL、集合通信库原理,动手搭建小规模RDMA测试环境
  • 补充AI训练框架(如PyTorch、TensorFlow)的分布式通信机制,理解网络对训练效率的影响
  • 掌握云网络(如VPC、负载均衡)与数据中心网络的区别,增强综合网络设计能力

面试指南

  • 对于技术原理题:先给出定义,再说明工作机制,最后结合实际场景举例
  • 对于设计题:从需求分析入手,列出约束条件,逐步提出方案并权衡利弊
  • 请解释RDMA中PFC和ECN的工作原理,以及它们如何避免网络丢包?
  • 如何设计一个支持千卡规模AI训练的HPN网络?需要考虑哪些关键因素?
  • 在AI训练中,集合通信(如AllReduce)如何影响网络负载?如何优化?
  • 描述一次你解决网络性能瓶颈的经历,用了什么工具和方法?
  • 你对SRv6和VXLAN的理解?在数据中心网络中如何选择?
  • 复习RDMA协议栈和拥塞控制算法,准备手绘数据流图

匹配度报告

70
综合匹配度

顶尖大厂AI网络架构师,前沿技术栈,薪资竞争力强,但工作强度大且需北京现场办公。

适合人群
最适合看重技术成长和前沿领域发展的求职者,愿意接受高强度工作换取顶尖技术积累。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

字节跳动作为上市大厂,薪资和福利在行业中具有较强竞争力,但JD未明确薪资,需面议确认。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

职位聚焦HPN、RDMA等前沿技术,技术成长空间大,但JD未提及晋升或培训机制。

技术前沿前沿/新兴技术
技术栈RDMA、HPN、PFC、ECN、SRv6、NCCL
业务类型profit_center

工作生活匹配

40较低

北京现场办公,未提及弹性工作或远程,大厂互联网公司通常有加班文化,WLB一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施属于高速增长赛道,对社会AI发展有积极影响,但JD未突出使命价值观。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs