Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Baidu logo
百度
GPU虚拟化高级研发工程师(J100463)
立即应聘

GPU虚拟化高级研发工程师(J100463)

发布于 大约 15 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
本科
系统与安全工程
Linux内核
NCCL
GPU虚拟化
eBPF
KVM
vLLM
Sr-Iov
Nvidia驱动

AI 估算 · 40k–70k

高级GPU虚拟化研发属于稀缺技能,百度云作为一线大厂,薪资具有竞争力,结合北京上海水平和公司福利,月薪中位数约55K。

职位详情

关于这个职位

该职位是百度云GPU虚拟化方向的高级研发岗位,主要工作是开发底层GPU虚拟化内核模块,优化KVM/QEMU虚拟化层,定制NVIDIA显卡驱动,构建GPU实例的在线诊断和性能调优工具

你需要深入Linux内核和GPU驱动架构,解决AI训练/推理场景下的算力隔离、显存管理和性能优化问题

最低要求

本科及以上学历,精通 C/C++ 语言,熟悉 Shell、Python 等脚本语言

扎实掌握 Linux 内核基础,理解内存管理、进程调度、设备驱动、中断处理等核心子系统
具备内核模块开发与调试能力,熟悉 ftrace、perf、eBPF 等内核诊断工具

工作职责

负责公有云 GPU 虚拟化底层内核模块的研发,包括 KVM/QEMU 虚拟化层优化、GPU 驱动内核态适配与改造,推动 GPU 虚拟化产品(sGPU/vGPU/cGPU/MIG)的技术演进

参与 GPU 实例运行时在线诊断体系建设,研发面向 GPU 卡、NVSwitch、驱动、NCCL 通信等各层的健康检测、故障自愈与根因定位工具
负责 GPU 实例全栈性能调优,覆盖 IOMMU/SR-IOV 直通、P2P 通信、NVLink 拓扑、大页内存、NUMA 亲和等关键路径,驱动端到端性能提升
负责内核态 GPU 驱动开发与定制,包括驱动重构、驱动热升级、多版本驱动管理框架建设
负责 GPU 虚拟化场景下的算力隔离与混部调度,研究显存隔离、算力切分等关键机制
面向 LLM 推理场景,研究 KVCache 分层存储与虚拟化支撑:设计 GPU 显存 → CPU 内存 → NVMe 的 KVCache 分级 offloading 机制(参考 LMCache/vLLM L2 Cache),支持跨推理实例的 P2P KVCache 共享与迁移,减少显存碎片化,提升高并发推理下的显存利用率与 TTFT 延迟
面向 Agentic AI 场景,探索多 Agent 并发下的 GPU 资源隔离与沙箱安全方案:基于 MPS/MIG/SR-IOV 实现 Agent 间 GPU 算力与显存的强隔离,防范 Agent 间显存越界与信息泄露,支撑 AI 平台代码执行沙箱的 GPU 安全访问
跟踪内核社区(lore.kernel.org/kvm)、NVIDIA 开源驱动及 GPU 虚拟化领域最新技术进展,推动关键技术在产品中落地

优先资格

核心优先:

熟悉 KVM/QEMU 虚拟化框架,有设备直通(SR-IOV/VFIO)开发经验
熟悉 NVIDIA GPU 驱动架构(用户态 + 内核态),了解 nvidia.ko 模块、UVM 驱动、NVSwitch/NVLink 工作机制
有 GPU 在线诊断工具研发经验(DCGM、健康检查、故障根因分析)
有 GPU 性能调优经验(NCCL 通信调优、P2P 性能分析、PCIe/NVLink 拓扑优化、大页/NUMA 调优)
熟悉 CUDA、cuDNN、NCCL 等异构计算软件栈,理解 AI 训练/推理场景的资源使用模式
加分项:
有 GPU 显存隔离(UVM、MPS、MIG)或算力混部调度相关开发经验
熟悉 eBPF/ftrace 在 GPU 驱动层的性能分析应用
有 K8s GPU 插件(device-plugin)或 AI 计算调度相关经验
了解 LLM 推理框架(vLLM/TensorRT-LLM/SGLang)的 KVCache 管理机制,包括 PagedAttention、Chunked Prefill、Disaggregated Prefill/Decode 架构
有显存碎片优化、KVCache offloading(GPU→CPU→NVMe)或跨节点 KVCache P2P 共享实践经验
了解 Agentic AI 平台架构(工具调用、多步推理、代码解释器等场景),有多 Agent 并发 GPU 资源隔离、GPU 沙箱安全设计或推理加速框架集成经验

AI 洞察

优缺点分析

优点

  • 深度技术积累:接触最底层的内核虚拟化、GPU驱动和AI基础设施,技术壁垒高,核心竞争力强
  • 行业前景广阔:AI大模型和云原生热潮下,GPU虚拟化是算力调度的核心,需求持续增长
  • 大厂平台资源:百度云提供丰富的GPU集群和真实业务场景,能够快速验证技术方案
  • 薪资福利优厚:高级研发岗位薪资具有竞争力,加上百度股票和福利,整体回报可观
  • 技术复杂度高:需要同时掌握Linux内核、虚拟化、GPU驱动、网络通信等多领域知识,学习曲线陡峭
  • 知识更新快:GPU虚拟化和AI框架迭代迅速,需要持续跟踪社区最新进展,保持技术敏锐度

缺点 / 挑战

  • 工作强度较大:作为核心基础设施研发,可能面临上线压力、故障应急和技术攻坚,加班在所难免
  • 适合对底层系统技术有浓厚兴趣、喜欢挑战复杂内核问题、希望在AI基础设施领域深耕的技术型人才

角色解读

  • 技术专家路线:深耕GPU虚拟化内核领域,成为Linux内核社区贡献者或NVIDIA驱动生态专家
  • 架构师路线:负责下一代GPU虚拟化产品的架构设计,推动AI基础设施的技术演进
  • 管理路线:带领GPU虚拟化团队,从核心研发走向技术管理,统筹多个技术方向
  • 开发公有云GPU虚拟化底层内核模块,优化KVM/QEMU虚拟化层和GPU驱动,提升虚拟化性能和稳定性
  • 构建GPU实例的在线诊断体系,研发健康检测、故障自愈和根因定位工具,保障云上GPU服务的高可用
  • 负责GPU性能全栈调优,从IOMMU直通、NVLink拓扑到NCCL通信,驱动端到端的性能提升
  • 面向LLM推理和Agentic AI场景,设计KVCache分层存储和Agent间GPU资源隔离方案,支撑新型AI负载
  • 精通C/C++和Linux内核开发,具备内核模块编写和调试能力,熟悉ftrace、eBPF等工具
  • 深入理解KVM/QEMU虚拟化框架,掌握SR-IOV、VFIO等设备直通技术
  • 熟悉NVIDIA GPU驱动架构(nvidia.ko、UVM、NVSwitch),有GPU性能调优和诊断经验
  • 了解LLM推理框架(vLLM等)的KVCache管理机制和Agentic AI平台架构

申请策略

  • 提前了解百度云GPU虚拟化产品线(如sGPU、cGPU),思考其技术实现与业界竞品(如Amazon Nitro、Google vGPU)的差异
  • 在面试中展现对技术趋势的热情,比如讨论Agentic AI场景下GPU隔离的新挑战,可以加分
  • 突出内核开发经验:详细描述参与过的Linux内核模块或驱动开发项目,展示对内存管理、设备驱动等子系统的理解
  • 展示虚拟化相关成果:如有KVM、QEMU、Xen等虚拟化技术经验,重点说明在设备直通、IOMMU方面的实践
  • 强调GPU相关技能:如熟悉NVIDIA驱动、CUDA编程、NCCL调优等,附上具体性能优化数据和案例
  • 体现AI基础设施认知:如果了解LLM推理框架或K8s GPU调度,务必提及,显示出对业务场景的理解
  • 复习Linux内核核心知识,特别是设备驱动模型、内存管理、中断处理,可通过阅读LDD或内核源码
  • 实验室搭建KVM+GPU直通环境,动手实践SR-IOV、VFIO配置,并尝试使用eBPF进行性能分析

面试指南

  • 对于原理性问题:先给出核心概念,然后细化到具体机制,最后结合自己的实践经验举例说明
  • 对于诊断问题:遵循“现象→初步排查→工具使用→根因定位→修复方案”的逻辑,强调系统性思维和工具熟练度
  • 对于设计问题:先明确需求背景,列出约束条件,对比不同方案的优缺点,最后给出推荐方案及理由
  • 请解释KVM中设备直通(PCI passthrough)的原理,以及如何解决IOMMU相关问题
  • 如何诊断一个NVIDIA GPU驱动的内核态崩溃?请说出你的排查步骤和工具
  • 你在项目中如何优化GPU虚拟化场景下的显存利用率?有没有处理过显存泄漏或碎片化?
  • 描述一下你理解中的KVCache offloading机制,以及在vLLM中是如何实现的?
  • 如果你需要设计一个多Agent共享GPU资源的隔离方案,你会考虑哪些关键技术点?

匹配度报告

70
综合匹配度

前沿GPU虚拟化研发,技术成长天花板高,但工作强度较大,适合技术深耕型人才。

适合人群
最适合注重技术成长和发展机会的求职者,愿意投入时间钻研前沿技术,对薪资和平台有期待,能接受一定的工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

薪资水平在北京上海处于市场偏高位置,百度提供五险一金、补充医疗等福利,补偿性满足较好。

薪资信号偏高 (40K-70K/月)

成长发展匹配

90较高

该职位涉及前沿GPU虚拟化技术、AI场景创新,有明确的成长路径,技术学习机会非常多。

技术前沿前沿/新兴技术
技术栈GPU虚拟化、KVM、eBPF、KVCache、vLLM、Agentic AI
成长机会跟踪内核社区最新技术进展
业务类型profit_center

工作生活匹配

40较低

工作地点在北上核心区域,但未提及远程或弹性办公,且互联网大厂研发岗通常加班较多,生活化满足较弱。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施属于高速增长赛道,对社会效率提升有积极意义,但职位本身更偏技术实现,使命感中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • 广告策略实习生(J100450)

    百度 · 深圳市
    AI 估算 · 4k-6k
  • 解决方案架构师(J100414)

    百度 · 北京市
    AI 估算 · 35k-55k
  • Java工程师实习生(J100470)

    百度 · 上海市
    AI 估算 · 4k-6k
  • Golang后端研发工程师(J100443)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 广告算法工程师(J100446)

    百度 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Test Engineer

    高通 · 上海市
    AI 估算 · 15k-25k
  • 安防专家

    顺丰速运 · 上海市
    AI 估算 · 15k-25k
  • 高级渗透测试工程师

    京东 · 北京市
    AI 估算 · 25k-45k
  • 成都,安全运营工程师Tier 2

    毕马威 · 成都市
    AI 估算 · 15k-25k
  • TC- Cyber Security- 汽车网络安全与数据合规测试-All Rank

    安永 · China
    AI 估算 · 15k-25k

百度 的其他在招职位

  • 广告策略实习生(J100450)

    百度 · 深圳市
    AI 估算 · 4k-6k
  • 解决方案架构师(J100414)

    百度 · 北京市
    AI 估算 · 35k-55k
  • Java工程师实习生(J100470)

    百度 · 上海市
    AI 估算 · 4k-6k
  • Golang后端研发工程师(J100443)

    百度 · 北京市
    AI 估算 · 25k-45k
  • 广告算法工程师(J100446)

    百度 · 北京市
    AI 估算 · 25k-45k

相似职位推荐

  • Test Engineer

    高通 · 上海市
    AI 估算 · 15k-25k
  • 安防专家

    顺丰速运 · 上海市
    AI 估算 · 15k-25k
  • 高级渗透测试工程师

    京东 · 北京市
    AI 估算 · 25k-45k
  • 成都,安全运营工程师Tier 2

    毕马威 · 成都市
    AI 估算 · 15k-25k
  • TC- Cyber Security- 汽车网络安全与数据合规测试-All Rank

    安永 · China
    AI 估算 · 15k-25k