Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/北京-大模型RLHF强化学习算法工程师(文心一言)(J86751)
Baidu logo
B
百度 (Baidu)

职位信息

北京市
中级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorch强化学习自然语言处理算法研发大语言模型分布式训练RLHF
💡

核心评价

百度核心AI岗,聚焦大模型RLHF前沿技术,成长性与意义感突出,对工作生活平衡的预期需适度调整。

北京-大模型RLHF强化学习算法工程师(文心一言)(J86751)

🤖 AI 估测:¥35K-60K

发布时间:21 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型后训练与强化学习的算法工程师职位
你将负责研发大模型(文本、多模态)的Post-training算法,特别是SFT、RLHF等前沿技术,并构建高质量的RLHF训练集与评估体系
同时,你需要开发和优化大规模分布式强化学习训练框架,以提升模型的训练与推理效率

✓工作职责

工作内容:
负责大模型Post-training(文本、多模态)的算法研发工作
创新大模型后训练算法(包括SFT/RLHF/RM等方向),研究大模型对齐人类偏好前瞻技术和趋势
构建高质量RLHF训练集和评估方式,深入大模型能力分析,制定系统性高效优化方案
负责大规模分布式RL训练框架开发优化,提升训练和推理效率

⭐最低要求

任职资格:
硕士以上学历,具备自然语言处理/计算机视觉的理论背景和实践经验,在AI顶会发表LLM相关论文者优先
深入理解大模型后训练相关技术并有一定实践经验,包括SFT/RLHF/RAILF/RM等,有强化学习相关工作经验者优先
熟练掌握Python编程语言以及Pytorch、Tensorflow、PaddlePaddle等其中一项深度学习开发框架,有OpenRL、Verl等开源RL框架使用经验者优先
有较强的学术比赛经验或者在知名数据集的 Leaderboard 上排名靠前优先
有较强的代码能力,有高质量的中大型项目或个人开源项目的经验优先

👍优先资格

优先资质:
在AI顶会发表LLM相关论文者优先
有强化学习相关工作经验者优先
有OpenRL、Verl等开源RL框架使用经验者优先
有较强的学术比赛经验或者在知名数据集的 Leaderboard 上排名靠前优先
有高质量的中大型项目或个人开源项目的经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公