Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业购买与订阅
我的收藏免费试用登录注册

Baidu logo
百度
AI 通信研发工程师(J100998)
立即应聘

AI 通信研发工程师(J100998)

发布于 大约 3 小时前

普通员工/个人贡献者

北京市 / 深圳市
中级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
GPU通信
NCCL
Megatron-LM
DeepSpeed
SGLang
vLLM
MoE
集合通信
Pytorch Distributed

AI 估算 · 25k–45k

AI通信研发属高端技术岗位,百度大厂薪资竞争力强,结合北京深圳地域溢价,月薪2.5-4.5万合理。

职位详情

关于这个职位

该职位主要负责AI训练/推理场景下通信系统的性能分析与优化,涉及NCCL、DeepEP等主流通信栈,以及MoE架构的通信链路优化

你将与模型、框架、硬件等多团队协作,推动AI基础设施全链路性能提升和稳定性建设,适合对分布式系统和高性能计算有深入理解的研发人才

最低要求

本科及以上学历,计算机、软件工程、通信等相关专业,具备扎实的数据结构、操作系统、计算机网络基础

熟练掌握 C/C++ 开发,具备 Linux 环境下复杂系统开发与调试经验
深入理解 GPU 通信与集合通信原理,熟悉 NCCL/RCCL、MPI、Gloo 等通信框架中的至少一种
熟悉 Transformer 与 MoE 架构,理解 TP/PP/DP/EP/CP 等并行策略及其通信特点
熟悉 PyTorch Distributed、Megatron-LM、DeepSpeed、vLLM、SGLang 等框架中的至少一种,并具备实际调优经验
有大规模 GPU 集群训练/推理经验,能够独立分析并解决通信性能与稳定性问题

工作职责

负责 AI 训练/推理场景下通信系统的性能分析与优化,覆盖 NCCL、DeepEP、Mooncake 等主流通信栈

负责 MoE 架构通信链路优化,设计并落地高性能 All-to-All、Token Dispatch/Combine、KV 交换等方案,提升集群整体吞吐与稳定性
深入分析大规模分布式训练、推理中的系统级问题,包括训练 hang、慢节点、任务异常中断等问题,并推动系统级优化
参与自研 AI 通信框架与运行时系统建设,包括通信调度、拓扑优化、异构网络支持、故障恢复等核心能力研发
与模型、框架、调度、网络、硬件团队协作,推动 AI Infra 全链路性能优化与稳定性建设
建立通信性能基线与评测体系,输出系统化性能分析报告与优化方案

AI 洞察

优缺点分析

优点

  • 接触AI通信前沿技术(如MoE、NCCL优化),技能壁垒高,市场稀缺性强
  • 与顶尖模型、框架团队协作,能构建全链路视野,职业发展空间广阔
  • 技术深度要求极高,需要同时掌握通信、系统、AI模型等多领域知识,学习曲线陡峭
  • 技术迭代快,需要持续跟进新框架和通信技术,保持学习状态
  • 适合对高性能计算、分布式系统有浓厚兴趣,且具备扎实C/C++功底和GPU通信经验的资深研发人员,追求技术极致和行业影响力

缺点 / 挑战

  • 百度作为AI巨头,提供丰富的GPU集群资源和真实大规模训练场景,技术挑战大,成长极快
  • 大规模集群问题排查难度大,可能面临高强度工作节奏和线上问题应急压力

角色解读

  • 在AI基础设施领域深耕,可发展成为通信系统架构师或技术专家,主导下一代通信方案设计
  • 横向扩展至AI全栈,如模型优化、系统调度等,成为AI Infra综合型人才
  • 凭借百度平台,有机会参与业界前沿项目,未来可晋升为技术负责人或方向负责人
  • 深入分析AI训练/推理中的通信瓶颈,优化NCCL等通信库,解决集群大规模并行训练的通信延迟和吞吐问题
  • 针对MoE架构设计高效的All-to-All、Token调度等通信方案,提升模型训练和推理的整体效率
  • 参与自研通信框架的开发,包括通信调度、拓扑优化、故障恢复等,并与多团队协作推动全链路性能优化
  • 精通C/C++和Linux系统编程,能够进行底层性能调优和复杂调试
  • 深入理解GPU通信和集合通信原理,熟悉至少一种主流通信框架(NCCL/RCCL/MPI等)
  • 熟悉大规模分布式训练框架(如PyTorch Distributed、Megatron-LM、DeepSpeed等),并有实际优化经验

申请策略

  • 研究百度AI基础设施的技术博客或公开演讲,在面试中展现对百度技术栈的了解
  • 准备一个系统性案例分析,展示你从性能瓶颈定位到方案落地、效果验证的完整思路
  • 重点突出GPU通信优化经验,如NCCL调优、集合通信性能提升的具体案例和量化成果
  • 展示大规模分布式训练经验,包括集群规模、解决过的通信瓶颈或稳定性问题
  • 强调对PyTorch Distributed或Megatron-LM等框架的深入理解和使用优化经历
  • 若有开源贡献(如向NCCL或框架提PR)或相关技术博客,务必列出
  • 补充MoE架构和并行策略(TP/PP/EP)的通信特性,阅读相关论文或源码
  • 动手实践LLM训练框架(如vLLM、SGLang)的通信部署,理解其通信模式

面试指南

  • 对于原理类问题:先阐述核心概念,再对比优劣,最后结合实践场景说明选择
  • 对于问题排查类:先明确现象,再分层分析(网络、通信库、框架、模型),结合工具定位根因,最后给出优化方案
  • 对于项目经历类:按照STAR原则(情境、任务、行动、结果)结构化陈述,突出量化成果和技术挑战
  • 请详细解释NCCL的ring算法和tree算法,并对比其适用场景
  • 如何诊断大规模分布式训练中的慢节点问题?请给出排查思路
  • MoE架构中All-to-All通信的挑战有哪些?你会如何优化?
  • 请描述一次你实际优化通信性能的经历,从问题定义到最终效果
  • 在你熟悉的通信框架中,如何实现故障恢复?

职位点评

71
综合评分

顶级AI大厂,前沿技术栈(AI通信/MoE),发展空间大,但WLB一般。

更适合这类人
适合追求技术极致和职业成长的求职者,对薪资和发展有较高期待,能接受高强度工作节奏。
表现最好
成长发展
相对薄弱
工作生活
薪资福利80
成长发展95
工作生活40
使命价值70

薪资福利

80较高

百度为上市大厂,薪资福利具有市场竞争力,提供五险一金和补充福利,但JD中未明确具体薪资和奖金,薪酬信号为未披露,整体偏中上水平。

薪资信号未披露(AI估算:25K-45K/月)

成长发展

95较高

该职位技术前沿(AI通信、MoE、NCCL优化),涉及多种现代框架和大规模集群,成长空间极大,但JD中未提及晋升通道或培训。

技术前沿前沿/新兴技术
技术栈NCCL、MoE、GPU通信、PyTorch Distributed、Megatron-LM、DeepSpeed、vLLM、SGLang、集合通信
业务类型profit_center

工作生活

40较低

工作地点为北京和深圳的现场办公,未提及弹性工作或远程,且AI大模型研发通常强度较高,预计WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

AI基础设施对推动技术进步有间接社会价值,但JD未明确使命或社会影响,行业处于高速增长期,创新性强。

行业发展高速增长赛道
社会影响中性/一般
创新程度开拓性创新(行业首创)
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • AI研发工程师(J100861)

    百度 · 北京市
    AI 估算 · 30k-50k
  • 财务分析师(J100973)

    百度 · 北京市
    AI 估算 · 15k-25k
  • AMU&BMU核算(J100908)

    百度 · 北京市
    AI 估算 · 10k-15k
  • YY-公会运营(J100854)

    百度 · 广州市
    AI 估算 · 8k-15k
  • Iaas计算产品经理(J100956)

    百度 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • 算法工程师-SA1

    普华永道 · 成都市
    AI 估算 · 12k-20k
  • 风电结构工程师(工业服务部)

    南德意志 · 上海市
    AI 估算 · 20k-40k
  • R&D Engineer (Development-HP)

    威能 · 无锡市
    AI 估算 · 20k-30k
  • Test Engineer

    南德意志 · 宁波市
    AI 估算 · 6k-10k
  • 高级测试工程师(有机化学)-常州

    南德意志 · 常州市
    AI 估算 · 10k-15k

百度 的其他在招职位

  • AI研发工程师(J100861)

    百度 · 北京市
    AI 估算 · 30k-50k
  • 财务分析师(J100973)

    百度 · 北京市
    AI 估算 · 15k-25k
  • AMU&BMU核算(J100908)

    百度 · 北京市
    AI 估算 · 10k-15k
  • YY-公会运营(J100854)

    百度 · 广州市
    AI 估算 · 8k-15k
  • Iaas计算产品经理(J100956)

    百度 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • 算法工程师-SA1

    普华永道 · 成都市
    AI 估算 · 12k-20k
  • 风电结构工程师(工业服务部)

    南德意志 · 上海市
    AI 估算 · 20k-40k
  • R&D Engineer (Development-HP)

    威能 · 无锡市
    AI 估算 · 20k-30k
  • Test Engineer

    南德意志 · 宁波市
    AI 估算 · 6k-10k
  • 高级测试工程师(有机化学)-常州

    南德意志 · 常州市
    AI 估算 · 10k-15k