Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/大模型平台策略算法工程师(J97419)
Baidu logo
B
百度 (Baidu)

职位信息

北京市 / 上海市
中级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

PyTorch平台开发SFT分布式训练大模型训练强化学习 (Rl)Zero微调框架
💡

核心评价

百度核心AI平台岗,技术前沿成长快,薪资竞争力强,但需现场办公且WLB未明。

大模型平台策略算法工程师(J97419)

🤖 AI 估测:¥35K-60K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

该职位是百度千帆MaaS平台的大模型平台策略算法工程师
主要负责大模型后训练(SFT、蒸馏、强化学习)工具链的开发与优化,并参与实现‘强化学习即服务(RLaaS)’方案,旨在提升平台训练效率、稳定性和易用性
你将有机会将前沿的后训练技术转化为平台核心能力,保持产品的技术领先性

✓工作职责

负责Post-training工具链开发: 负责千帆MAAS平台大模型SFT、蒸馏、强化学习(RL)等后训练环节的工具链开发,提升大规模训练的稳定性与执行效率
负责RLaaS能力落地: 参与“强化学习即服务(RLaaS)”的方案调研与实现,通过解耦算力资源与算法逻辑,让内外部客户能够高效低成本在自身业务数据上启动高效率的 RL 训练
提升平台易用性与扩展性: 快速定位并解决用户线上问题,将高频业务需求沉淀为平台通用功能,通过组件化设计优化工具链的复用性
前沿技术落地: 跟踪调研业内主流后训练技术,负责将其转化为平台核心能力,保持产品的技术领先性

⭐最低要求

教育背景: 计算机、人工智能等相关专业本科及以上学历
编程功底: 熟练掌握 Python、 PyTorch,具备扎实的数据结构与算法基础,具备良好的工程实现能力
大模型经验: 熟悉 Transformer 架构及大模型训练原理、熟悉后训练常用技术(SFT、 DPO、 RFT)、熟悉分布式并行策略(ZeRO、TP、PP、EP)

👍优先资格

深度参与过开源或者闭源大模型的post-training项目
熟悉 verl、llamafactory、ms-swift、slime、openrlhf等微调框架,理解后训练技术原理
具备大规模集群(如千卡以上)训练优化经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公