Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/混元多模态强化学习(RL)算法研究员(北京/上海)
Tencent logo
T
腾讯 (Tencent)

职位信息

广东省-深圳市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

深度学习强化学习GPU加速扩散模型多模态模型算法研究分布式训练Pytorch/Tensorflow自回归模型
💡

核心评价

腾讯核心AI团队的前沿算法研究岗,技术顶尖、成长性极强,薪资竞争力高,但需专注现场工作。

混元多模态强化学习(RL)算法研究员(北京/上海)

🤖 AI 估测:¥45K-80K

发布时间:16 天前

立即应聘

ℹ️关于这个职位

这是一个专注于前沿人工智能算法研究的岗位
你将负责针对多模态模型(如图像、视频生成和理解)开展强化学习算法研究,设计并开发高效的训练框架与奖励建模策略
该职位旨在探索下一代强化学习范式,使其能更直接、更高效地从环境反馈中学习,是腾讯在AI前沿领域布局的关键技术岗位

✓工作职责

针对多模态模型开展强化学习算法研究,包括面向图像、视频生成的扩散模型,面向多模态理解的自回归模型,以及前沿统一多模态框架
设计并开发强化学习训练框架与奖励建模策略,实现高效的大规模训练,提升训练稳定性,并解决奖励作弊等相关问题
探索下一代强化学习范式,使其能更直接、更高效地从环境反馈中学习

⭐最低要求

本科及以上学历,计算机科学或相关专业
具备出色的科研能力,在ICML、NeurIPS、ICLR、CVPR、ICCV、ECCV、SIGGRAPH等顶级会议发表过论文
扎实的工程与编程能力,具备深度学习系统实现、模型训练与推理优化、CPU/GPU 加速、分布式训练与推理经验

👍优先资格

有扩散模型、自回归模型、文生图 / 文生视频生成相关经验者优先
有 ACM/NOIP(信息学竞赛)参赛经历者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 多模态实习生

    叠纸游戏

    上海市 · 仅现场办公

  • 大模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 图形图像算法实习生

    叠纸游戏

    图形图像算法实习生 · 仅现场办公

  • 算法工程师(武汉)

    多点数智

    武汉市 · 仅现场办公

  • 算法工程师(北京)

    多点数智

    北京市 · 仅现场办公