Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/智谱/AI 院--多模态团队--多模态理解算法研究员-强化学习方向
GLM logo
G
智谱 (GLM)

职位信息

北京市
初级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

PyTorch强化学习视觉语言模型分布式训练多模态大模型RLHFDPO多模态数据处理
💡

核心评价

顶尖AI公司的前沿算法岗,技术成长空间巨大,行业意义强,但需接受现场办公及可能的快节奏。

AI 院--多模态团队--多模态理解算法研究员-强化学习方向

🤖 AI 估测:¥25K-40K

发布时间:19 天前

立即应聘

ℹ️关于这个职位

这是一个专注于多模态大模型强化学习方向的算法研究员岗位
你将加入智谱AI的多模态团队,负责视觉语言模型(VLM)在学科解题方向上的训练优化,特别是通过强化学习(如RLHF/DPO)和人类偏好学习来提升模型的对齐与推理能力
核心工作涉及数据处理、模型训练及前沿技术探索

✓工作职责

学科解题方向,负责VLM的混合SFT/RL训练优化及RL训练的数据处理,通过人类偏好学习提升多模态大模型的对齐和推理能力

⭐最低要求

统招硕士及以上学历,计算机科学/机器学习/人工智能相关专业
0-3年工作经验,在NLP/CV/RL等至少一个AI领域有过深入的研究经历
熟悉主流的多模态大模型,能持续跟进学术界和工业界的最新研究和产品
熟悉强化学习,有RLHF/DPO训练经验者优先
熟悉Linux,Python,Pytorch和Transformer,了解分布式训练框架如Deepspeed,Megatron-LM等
了解对多模态数据(如文本、图像、视频、音频等)的基本处理,能够独立完成数据收集、清洗和构造的pipeline

👍优先资格

有RLHF/DPO训练经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

智谱 的其他在招职位

  • 大模型交付工程师/架构师-北京

    智谱

    北京市 · 仅现场办公

  • 业务拓展实习生

    智谱

    北京市 · 仅现场办公

  • 安卓开发工程师

    智谱

    北京市 · 仅现场办公

  • MaaS-SRE/DBA

    智谱

    北京市 · 仅现场办公

  • 解决方案架构师-深圳

    智谱

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公