Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/百度/北京-强化学习架构研发工程师(J86773)
Baidu logo
B
百度 (Baidu)

职位信息

北京市
中级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorch强化学习自然语言处理算法研发分布式训练大模型RLHF
💡

核心评价

百度核心AI研发岗,技术前沿(RLHF/大模型),成长性极佳,薪资竞争力强,但WLB可能需平衡。

北京-强化学习架构研发工程师(J86773)

🤖 AI 估测:¥35K-60K

发布时间:22 天前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型后训练算法研发的强化学习架构工程师职位
你将负责创新SFT/RLHF等对齐算法,构建高质量训练集与评估体系,并开发优化大规模分布式强化学习训练框架,以提升大模型的训练与推理效率

✓工作职责

工作内容: -负责大模型Post-training(文本、多模态)的算法研发工作 -创新大模型后训练算法(包括SFT/RLHF/RM等方向),研究大模型对齐人类偏好前瞻技术和趋势 -构建高质量RLHF训练集和评估方式,深入大模型能力分析,制定系统性高效优化方案
-负责大规模分布式RL 训练框架开发优化,提升训练和推理效率

⭐最低要求

任职资格 -硕士以上学习,具备自然语言处理/计算机视觉视觉的理论背景和实践经验,在AI顶会发表LLM相关论文者优先
-深入理解大模型后训练相关技术并有一定实践经验,包括SFT/RLHF/RAILF/RM等,有强化学习相关工作经验者优先
-熟练掌握Python编程语言以及Pytorch、Tensorflow、PaddlePaddle等其中一项深度学习开发框架,有OpenRL、Verl等开源RL框架使用经验者优先 -有较强的学术比赛经验或者在知名数据集的 Leaderboard 上排名靠前优先
-有较强的代码能力,有高质量的中大型项目或个人开源项目的经验优先

👍优先资格

在AI顶会发表LLM相关论文者优先
有强化学习相关工作经验者优先
有OpenRL、Verl等开源RL框架使用经验者优先
有较强的学术比赛经验或者在知名数据集的 Leaderboard 上排名靠前优先
有高质量的中大型项目或个人开源项目的经验优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

百度 的其他在招职位

  • Agent产品经理(J99599)

    百度

    北京市 · 仅现场办公

  • 开发测试工程师(实习生)(J99576)

    百度

    北京市 · 仅现场办公

  • Agent产品经理(J99563)

    百度

    北京市 · 仅现场办公

  • 平台产品经理(J99562)

    百度

    北京市 · 仅现场办公

  • Agent工程架构师(J99561)

    百度

    北京市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公