Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
GPU镜像高级研发工程师(J100462)
立即应聘

GPU镜像高级研发工程师(J100462)

发布于 大约 14 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
本科
软件工程
GPU
Linux内核
CI/CD
CUDA
性能调优
NVIDIA
NCCL
eBPF

AI 估算 · 30k–50k

百度高级研发岗,3-5年经验,北京/上海薪资水平较高,GPU和AI领域技术稀缺,月薪30k-50k合理,14薪常见。

职位详情

关于这个职位

该职位负责GPU镜像的全生命周期管理,包括多操作系统基础镜像的GPU驱动深度集成、镜像自动化构建与质量保障

同时需要面向大模型训练等AI场景,进行内核层参数的系统性调优和诊断工具开发
你将深度接触NVIDIA驱动栈、CUDA工具链和eBPF可观测技术,是AI基础设施的核心技术岗位

最低要求

本科及以上学历,计算机、软件工程或电子信息相关专业,3-5 年以上系统软件开发经验

熟悉 C/C++ 系统编程,具备 Shell/Python 脚本工程化能力,能独立开发运维工具链
具备跨架构(x86/ARM)系统适配经验,熟悉多架构镜像构建(multi-arch manifest)

工作职责

GPU 镜像生命周期管理与质量保障

主导多 OS 基础镜像(Ubuntu/CentOS/Rocky等)的 GPU 驱动深度集成,负责公共镜像(训练镜像/推理镜像/沙箱基础镜像)的研发全流程,维护镜像版本规范
负责 NVIDIA、昆仑芯等GPU驱动的多版本并存管理,维护内核态模块与用户态库的版本矩阵及兼容性档案,设计并实现 GPU驱动版本管理工具链,支持多版本驱动切换与灰度升级
建设镜像自动化构建 CI/CD 流水线(多架构并行构建),制定并执行镜像质量标准测试与端到端性能基准回归,例如CUDA 工具链(cuDNN/NCCL/cuBLAS)集成验证
建立镜像安全扫描机制(CVE 漏洞检测 + 驱动签名校验),保障面向用户交付镜像的安全合规
追踪上游 NVIDIA 开源驱动(nvidia-open-gpu-kernel-modules)及GPU驱动社区动态,评估补丁并推进关键修复的内核 backport
AI 场景OS自助调优与诊断
面向大模型训练、推理、精调等典型 AI 工作负载,建立内核层参数的系统性调优知识库,覆盖CPU 亲和性、PCIe P2P 带宽、NCCL 网络栈(RoCE/IB)等关键维度
设计并开发内核参数自助调优工具/平台:根据用户提交的工作负载画像(模型规模/GPU 拓扑/通信模式),自动推荐并下发最优参数组合
建立调优效果评估闭环体系:A/B 对比测试框架 + 性能基线库,量化各参数组合对训练吞吐(token/s)、推理延迟(TTFT/TBT)的影响
参与研究eBPF 可观测工具链,实现对 GPU 内核驱动调用链路、PCIe 总线利用率、CPU-GPU 协同调度的细粒度监控与剖析

优先资格

熟悉内核模块开发、设备驱动框架(PCIe/DMA/interrupt)、内存管理子系统(mmap/huge pages/NUMA)者优先

深入理解 NVIDIA CUDA 驱动栈(用户态 Runtime 与内核态 UVM/GSP 模块),熟悉 GPU 显存管理机制(UVM、NVLink/P2P),有驱动级问题定位或定制开发经验者优先
了解 NCCL/集合通信原理,有过 GPU 训练性能调优(通信/计算 overlap、显存碎片优化等)实践者优先
熟悉 eBPF,具备 GPU 驱动调用链路追踪或内核性能剖析能力,参与过 Linux 内核、NVIDIA 开源驱动或 QEMU/KVM 上游社区贡献者优先

AI 洞察

优缺点分析

优点

  • 技术深度高:可深入接触NVIDIA GPU驱动栈、内核开发和eBPF等前沿技术,积累稀缺经验
  • 平台影响力强:百度AI基础设施支撑众多产品,你的工作将直接影响大模型训练效率
  • 薪资竞争力强:AI大模型热潮下,GPU相关人才需求旺盛,百度提供有竞争力的薪酬
  • 成长空间大:有机会参与开源社区贡献,与行业顶尖工程师合作,技术视野开阔
  • 技术门槛高:需要对系统编程、内核驱动和GPU架构有深入了解,学习曲线陡峭
  • 工作强度大:作为核心基础设施,需要应对线上故障和紧急修复,可能面临高压
  • 技术迭代快:NVIDIA驱动和AI框架更新频繁,需持续跟踪新技术,保持知识更新

缺点 / 挑战

  • 适合热爱系统底层技术、对GPU和内核驱动有浓厚兴趣的工程师,能接受从构建工具到性能优化全方位的挑战,并希望在AI基础设施领域深耕的硬核技术人

角色解读

  • 技术纵深发展:成为GPU虚拟化、驱动优化或内核性能调优领域的专家
  • 架构师方向:负责AI基础设施整体方案设计,从计算、网络到存储的全栈优化
  • 管理路线:带领团队负责百度AI算力平台的核心组件,向技术经理或总监发展
  • 负责GPU镜像的构建、集成和版本管理,确保多架构多驱动版本的兼容性和稳定性
  • 建设自动化CI/CD流水线,实施镜像质量测试和安全扫描,保障交付的镜像安全合规
  • 针对大模型训练等AI场景,进行内核参数调优和诊断工具开发,量化性能影响
  • 追踪上游GPU驱动社区动态,评估并回传关键补丁,保持技术栈的前沿性
  • 精通C/C++和脚本语言,具备系统级软件开发能力,能独立构建运维工具链
  • 深入理解Linux内核驱动框架、GPU驱动栈和CUDA运行时,有驱动问题定位经验
  • 熟悉容器镜像技术、CI/CD工具和多架构构建,有镜像生命周期管理经验
  • 了解NCCL集合通信和GPU性能调优,具备eBPF或内核性能剖析能力

申请策略

  • 关注百度昆仑芯和NVIDIA的最新动态,在面试中展现对AI算力基础设施的深入思考
  • 准备一个完整的性能调优案例,从问题定位到优化方案到效果量化,展示系统性能力
  • 突出系统编程经验:具体列出C/C++项目,尤其是与内核、驱动程序或性能优化相关的经历
  • 强调GPU相关项目:如CUDA开发、驱动集成、NCCL调优等,最好有量化性能提升的数据
  • 展示自动化能力:描述CI/CD流水线、镜像构建或自动化测试工具的开发经验
  • 体现开源贡献:如果有Linux内核、OpenStack或GPU相关开源社区的patch或PR,重点标注
  • 系统学习Linux内核驱动开发,特别是PCIe、DMA和内存管理相关模块
  • 动手实践NVIDIA CUDA驱动栈,熟悉UVM和GSP模块,尝试编写简单的驱动测试程序

面试指南

  • STAR法则:从场景、任务、行动、结果维度结构化描述项目经验
  • 分层分析:从应用层、内核层、硬件层逐层拆解问题,展示系统性思考
  • 实验驱动:强调通过A/B测试、性能基线量化效果的思路
  • 请描述一次你优化GPU训练性能的具体案例,用了哪些方法?效果如何?
  • Linux内核中,驱动模块加载时如何与设备匹配?简述PCIe枚举过程
  • 如何设计一个多版本GPU驱动管理工具?考虑哪些兼容性问题?
  • 解释NCCL通信中NVLink和PCIe的不同,如何优化通信与计算overlap?
  • eBPF如何追踪GPU驱动调用?描述一个你可能用eBPF解决的性能问题

匹配度报告

69
综合匹配度

AI大厂核心基础设施岗位,前沿GPU技术栈,发展空间极大,但工作强度高,WLB一般。

适合人群
适合将技术成长和技能积累放在首位的工程师,愿意在高压力高回报的环境中深耕AI底层技术,对薪资和工作强度有较高包容度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

百度作为上市大厂,薪资福利有竞争力,但未在JD中提及具体薪资和福利,薪酬信号为未披露。整体补偿性中等偏上。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

该职位涉及GPU驱动、内核、eBPF等前沿技术,且明确要求跟进开源社区动态,技术深度和成长空间极大。发展性动机满足度高。

技术前沿前沿/新兴技术
技术栈GPU、NVIDIA、CUDA、eBPF、Linux内核、NCCL、RoCE/IB
业务类型profit_center

工作生活匹配

40较低

JD未提及远程办公或弹性工作,且大厂基础设施团队通常要求现场办公,工作强度可能较高。生活方式满足度较低。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

职位属AI基础设施,推动大模型训练效率,具有一定技术社会价值。行业处于高速增长期,但JD未提及使命或社会影响。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 测试开发实习生(J100849)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 内容效率产品经理(J97444)

    百度 · 北京市
    AI 估算 · 20k-40k
  • AI工作流研发实习生(J100906)

    百度 · 北京市
    AI 估算 · 4k-7k
  • 医生培训运营实习生(J100884)

    百度 · 北京市
    AI 估算 · 3k-5k
  • 商业分析师(J97429)

    百度 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k

百度 的其他在招职位

  • 测试开发实习生(J100849)

    百度 · 北京市
    AI 估算 · 4k-8k
  • 内容效率产品经理(J97444)

    百度 · 北京市
    AI 估算 · 20k-40k
  • AI工作流研发实习生(J100906)

    百度 · 北京市
    AI 估算 · 4k-7k
  • 医生培训运营实习生(J100884)

    百度 · 北京市
    AI 估算 · 3k-5k
  • 商业分析师(J97429)

    百度 · 北京市
    AI 估算 · 20k-35k

相似职位推荐

  • 顶尖实习-大模型推理加速研究员-AI平台-实习

    小米 · 北京市
    AI 估算 · 6k-10k
  • (实习生) 媒体引擎与高性能计算工程师

    小红书 · 北京市
    AI 估算 · 4k-8k
  • 系统架构师(城配)

    顺丰速运 · 上海市
    AI 估算 · 30k-50k
  • 大模型算法工程师(销服)

    顺丰速运 · 深圳市
    AI 估算 · 30k-50k
  • 测试开发工程师

    知乎 · 武汉市
    AI 估算 · 15k-25k