
字节跳动
AI网络架构工程师-基础架构
AI网络架构工程师-基础架构
发布于 大约 17 小时前普通员工/个人贡献者
北京市
高级经验
全职员工
仅现场办公
学历未注明
BGP
RDMA
VXLAN
TCP
AR
QoS
ACL
ECN
PFC
Srv6
AI 估算 · 30k–60k
大厂高级网络架构师,技术门槛高,北京市场薪资高,预估月薪3-6万
职位详情
关于这个职位
作为AI网络架构工程师,你将负责设计和优化字节跳动AI训练与推理的高速网络,确保大规模分布式训练的高效稳定
需要精通RDMA、TCP/IP等网络技术,参与HPN网络方案设计与落地
最低要求
精通RDMA PFC、ECN、DLB、GLB、QoS、AR等高性能网络优化技术
精通TCP、BGP、SRv6、VXLAN、ACL等经典网络技术
熟悉AI训练、推理业务模型
熟悉集合通信原理
熟悉Perftest、NCCL test等常用测试工具使用
工作职责
负责AI训练、推理网络需求分析,行业趋势分析
负责HPN网络方案设计
负责HPN网络架构测试验证、协助建设团队完成新架构平稳落地
优先资格
有HPN网络设计经验者优先
AI 洞察
优缺点分析
优点
- 参与全球领先的AI基础设施网络建设,接触HPN等前沿技术,技术积累价值高
- 大厂平台提供完善的福利和薪酬体系,职业发展空间广阔
- AI网络对性能和稳定性要求极高,工作强度大,可能需要应对紧急故障
- 技术栈深且更新快,需要持续学习,保持对RDMA等底层技术的深入理解
- 北京互联网公司集中,竞争激烈,需要过硬的技术实力
缺点 / 挑战
- 字节跳动业务规模大,项目挑战性强,能够极大提升复杂系统设计能力
- 适合热爱底层网络技术、对高性能计算有浓厚兴趣、愿意挑战大规模系统难题的工程师
角色解读
- 从网络架构工程师成长为AI基础设施专家,深入参与超大规模数据中心网络设计
- 可向技术专家或架构师方向发展,主导HPN等前沿网络技术的研究与落地
- 也可横向扩展至系统架构、计算平台等相邻领域,成为综合性技术人才
- 分析AI训练和推理的网络需求,跟踪行业趋势,确保网络架构满足大规模分布式计算需求
- 设计HPN高性能网络方案,优化RDMA、TCP/IP等协议栈,提升网络吞吐和延迟
- 负责网络架构的测试验证,与建设团队协作推动新架构平稳落地
- 精通RDMA系列技术(PFC、ECN等)和经典网络协议(TCP、BGP、VXLAN等),具备扎实的网络调优能力
- 熟悉AI训练和推理的业务模型,理解集合通信原理,能够针对模型特点优化网络
- 掌握Perftest、NCCL test等测试工具,具备网络性能分析和问题排查能力
申请策略
- 准备一个你主导的网络优化案例,详细说明问题、方案和效果
- 了解字节跳动AI基础设施的公开技术博客(如火山引擎),展示对公司的了解
- 突出RDMA、TCP/IP等网络协议的实际调优经验,用具体数据(如延迟降低、吞吐提升)展示成果
- 强调参与过AI训练/推理网络架构设计或维护的经历,说明对业务模型的理解
- 列出HPN、RoCEv2等高性能网络相关项目,体现技术深度
- 深入学习NCCL、集合通信库原理,动手搭建小规模RDMA测试环境
- 补充AI训练框架(如PyTorch、TensorFlow)的分布式通信机制,理解网络对训练效率的影响
- 掌握云网络(如VPC、负载均衡)与数据中心网络的区别,增强综合网络设计能力
面试指南
- 对于技术原理题:先给出定义,再说明工作机制,最后结合实际场景举例
- 对于设计题:从需求分析入手,列出约束条件,逐步提出方案并权衡利弊
- 请解释RDMA中PFC和ECN的工作原理,以及它们如何避免网络丢包?
- 如何设计一个支持千卡规模AI训练的HPN网络?需要考虑哪些关键因素?
- 在AI训练中,集合通信(如AllReduce)如何影响网络负载?如何优化?
- 描述一次你解决网络性能瓶颈的经历,用了什么工具和方法?
- 你对SRv6和VXLAN的理解?在数据中心网络中如何选择?
- 复习RDMA协议栈和拥塞控制算法,准备手绘数据流图
匹配度报告
70
综合匹配度
顶尖大厂AI网络架构师,前沿技术栈,薪资竞争力强,但工作强度大且需北京现场办公。
适合人群
最适合看重技术成长和前沿领域发展的求职者,愿意接受高强度工作换取顶尖技术积累。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70
薪资福利匹配
80较高
字节跳动作为上市大厂,薪资和福利在行业中具有较强竞争力,但JD未明确薪资,需面议确认。
薪资信号未披露(AI估算:30K-60K/月)
成长发展匹配
90较高
职位聚焦HPN、RDMA等前沿技术,技术成长空间大,但JD未提及晋升或培训机制。
技术前沿前沿/新兴技术
技术栈RDMA、HPN、PFC、ECN、SRv6、NCCL
业务类型profit_center
工作生活匹配
40较低
北京现场办公,未提及弹性工作或远程,大厂互联网公司通常有加班文化,WLB一般。
工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)
使命价值匹配
70中等
AI基础设施属于高速增长赛道,对社会AI发展有积极影响,但JD未突出使命价值观。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
字节跳动 的其他在招职位
相似职位推荐
Watch Jobs