Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
2027AIDU-大模型Infra工程师(J99967)
立即应聘

2027AIDU-大模型Infra工程师(J99967)

发布于 1 天前

普通员工/个人贡献者

北京市
高级经验
全职员工
仅现场办公
硕士
分布式系统
GPU
CUDA
RDMA
LLVM
NCCL
异构计算
大模型

AI 估算 · 30k–60k

大模型Infra是当前热门方向,百度作为头部大厂薪资竞争力强,硕士学历加上高性能计算技能溢价明显。

职位详情

关于这个职位

该职位属于百度AI计算部的核心团队,专注于大模型底层基础设施的研发与优化

你将参与构建AI异构计算加速引擎,面向GPU/FPGA/ASIC等架构进行性能调优,并设计自适应分布式系统以提升大模型训练与推理效率
适合对高性能计算、系统性能优化有浓厚兴趣的技术人才

最低要求

计算机、电子等相关专业硕士及以上学历

精通C++/Python,熟悉计算机体系结构
有GPU/ARM/MIPS/DSP等异构计算平台开发经验
熟悉MPI、NCCL、RDMA等通信技术
有CUDA/OpenCL编程或LLVM经验者优先

工作职责

构建AI异构计算加速引擎,负责底层算子、通信库、编译系统开发与优化

面向CPU/GPU/FPGA/ASIC等架构进行性能调优
设计自适应分布式系统,优化大模型训练与推理效率
探索算法与算力协同优化,降低大模型成本

优先资格

有大规模AI集群或超算系统软件开发经验者优先

AI 洞察

优缺点分析

优点

  • 百度大厂平台,接触前沿大模型技术,技术积累深厚
  • AI计算部核心岗位,参与高影响力的底层基础设施研发
  • 技能成长快,覆盖GPU、分布式、编译器等多个高端领域
  • 薪酬福利优厚,百度16薪制+其他补贴
  • 技术难度高,需要同时掌握体系结构、并行计算和分布式系统
  • 大模型迭代快,工作节奏可能较快,需持续学习
  • 竞争激烈,同为顶尖人才,需要不断突破

缺点 / 挑战

  • 适合对底层系统性能优化有狂热兴趣、乐于挑战技术难题的硬核工程师,尤其是具备CUDA/GPU编程经验的硕士及以上学历者

角色解读

  • 技术深耕:成为异构计算或大模型Infra领域的专家,主导核心组件研发
  • 架构转型:向系统架构师方向发展,负责大规模AI集群的设计与优化
  • 技术管理:随团队扩展,可晋升为技术Leader,带领团队攻克技术难题
  • 构建AI异构计算加速引擎,开发底层算子、通信库和编译系统
  • 面向CPU/GPU/FPGA/ASIC等不同架构进行深度性能调优
  • 设计自适应分布式系统,优化大规模模型的训练和推理效率
  • 探索算法与算力协同优化,降低大模型部署成本
  • 精通C++和Python,深入理解计算机体系结构
  • 有GPU/ARM等异构计算平台开发经验,熟悉CUDA或OpenCL
  • 掌握MPI、NCCL、RDMA等高性能通信技术
  • 了解LLVM编译器框架者优先

申请策略

  • 提前了解百度AI计算部的技术方向,如飞桨框架、昆仑芯片等
  • 准备1-2个深度技术项目案例,能清晰讲解设计思路与优化效果
  • 突出异构计算项目经验,如GPU算子优化、分布式训练框架等
  • 强调C++/Python编程能力,并附上高性能代码示例或开源贡献
  • 展示通信库(NCCL/RDMA)或编译器(LLVM)相关的实践经验
  • 如有大规模集群调优经历,详细描述规模、难点和成果
  • 系统学习CUDA编程和GPU架构,最好有实际优化项目
  • 了解大模型分布式训练框架(如PyTorch DDP、Megatron-LM)

面试指南

  • 从问题拆解、现有方案分析、优化思路、实验验证四步回答
  • 结合具体项目经验,量化优化效果(如吞吐提升、延迟降低)
  • 展示对体系结构、并行计算和系统设计的综合理解
  • 如何优化一个GPU kernel以达到最高性能?
  • 请解释NCCL中AllReduce的原理,如何实现带宽最优?
  • 在大模型训练中,如何解决通信瓶颈?
  • 请介绍你使用LLVM进行编译优化的经历
  • 如何设计一个分布式系统来支持千卡规模的模型训练?

匹配度报告

78
综合匹配度

百度大厂核心Infra岗位,前沿大模型技术栈,薪资优厚,但工作强度较大。

适合人群
最看重技术成长和前沿挑战的求职者,对WLB要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值80

薪资福利匹配

85较高

薪资处于行业偏高水准,百度大厂福利完善,稳定性强,但JD未明确提及具体福利。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

95较高

岗位聚焦前沿大模型与异构计算技术,技能成长空间巨大,但JD未提及晋升通道。

技术前沿前沿/新兴技术
技术栈C++、Python、GPU、CUDA、异构计算、大模型、分布式系统、NCCL、RDMA、LLVM
业务类型ambiguous

工作生活匹配

50较低

仅现场办公,未提及弹性工作或WLB,推测为高强度研发岗位。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

80较高

大模型是高速增长赛道,有助于推动AI技术发展,社会影响力较高。

行业发展高速增长赛道
社会影响正向社会影响力较高
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 平台研发工程师(智能体安全方向)(J99917)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 风控策略分析师(J99935)

    百度 · 北京市
    AI 估算 · 20k-35k
  • 虚拟网络产品研发工程师(J99931)

    百度 · 北京市
    AI 估算 · 30k-50k
  • 千帆桌面端Agent引擎开发(J99937)

    百度 · 北京市
    AI 估算 · 25k-50k
  • OPC 业务创新孵化实习生(J99910)

    百度 · 北京市
    AI 估算 · 4k-6k

相似职位推荐

  • 客户端开发实习生-【回森】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 客户端实习生(快影)-【主站】

    快手 · 北京市
    AI 估算 · 6k-10k
  • 服务端开发实习生(影像)-【主站】

    快手 · 北京市
    AI 估算 · 4k-8k
  • Java开发实习生(回森方向)-【主站】

    快手 · 北京市
    AI 估算 · 4k-6k
  • Senior Software Engineer - Tech Foundations

    锐完游戏 · 上海市
    AI 估算 · 25k-45k

百度 的其他在招职位

  • 平台研发工程师(智能体安全方向)(J99917)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 风控策略分析师(J99935)

    百度 · 北京市
    AI 估算 · 20k-35k
  • 虚拟网络产品研发工程师(J99931)

    百度 · 北京市
    AI 估算 · 30k-50k
  • 千帆桌面端Agent引擎开发(J99937)

    百度 · 北京市
    AI 估算 · 25k-50k
  • OPC 业务创新孵化实习生(J99910)

    百度 · 北京市
    AI 估算 · 4k-6k

相似职位推荐

  • 客户端开发实习生-【回森】

    快手 · 北京市
    AI 估算 · 5k-8k
  • 客户端实习生(快影)-【主站】

    快手 · 北京市
    AI 估算 · 6k-10k
  • 服务端开发实习生(影像)-【主站】

    快手 · 北京市
    AI 估算 · 4k-8k
  • Java开发实习生(回森方向)-【主站】

    快手 · 北京市
    AI 估算 · 4k-6k
  • Senior Software Engineer - Tech Foundations

    锐完游戏 · 上海市
    AI 估算 · 25k-45k