Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/百度公有云异构加速工程师(J91679)
Baidu logo
B
百度 (Baidu)

职位信息

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch高性能计算CUDA多模态模型大语言模型分布式训练Megatron-LMDeepSpeed算子优化异构硬件
💡

核心评价

百度高级技术岗,深耕大模型与异构计算前沿,技术成长性极佳,薪资竞争力强,但工作地点固定且可能强度不低。

百度公有云异构加速工程师(J91679)

🤖 AI 估测:¥45K-80K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

该职位是百度公有云团队的高级技术岗位,专注于大语言模型与多模态模型的训练框架二次开发、推理加速与性能调优
你将负责基于主流框架进行并行策略、显存优化,并针对新的异构硬件进行算子开发与适配,旨在提升大规模AI模型的训练效率和推理性能

✓工作职责

工作内容: 训练框架二次开发与优化(大语言模型与多模态模型)
基于 Megatron-LM / DeepSpeed / Verl 等框架,进行并行策略及显存的优化
集群化的 SFT、RLHF 等训练稳定性与吞吐优化
多模态图文/视频/音频数据跨模态对齐训练
推理加速与集群化部署(大语言模型与多模态模型)
PD 分离框架开发与优化
落地量化、投机解码等优化策略
基于新的异构硬件做算子开发适配与算子性能优化
性能观测与调优
利用 PyTorch Profiler、Nsight Systems 等工具定位分析性能瓶颈并产出优化方案

⭐最低要求

基础
计算机相关专业,5 年以上高性能计算/深度学习系统经验
精通 PyTorch / CUDA,精通 Megatron-LM / Deepspeed / Verl 或 sglang / vllm,熟悉 C++/Python 混合开发,熟悉 Ray 等分布式框架
深入理解 Transformer、Diffusion、MoE 等模型结构

👍优先资格

加分项
主导过大模型训练或千卡级训推集群性能调优
开源训推框架的贡献者
对 TPU、Ascend、AMD MI300 等异构芯片有移植经验
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公