腾讯的混元多模态强化学习（RL）算法研究员（北京/上海）薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

混元多模态强化学习（RL）算法研究员（北京/上海）的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

该职位要求本科学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：16 天前

这是一个专注于前沿人工智能算法研究的岗位

你将负责针对多模态模型（如图像、视频生成和理解）开展强化学习算法研究，设计并开发高效的训练框架与奖励建模策略

该职位旨在探索下一代强化学习范式，使其能更直接、更高效地从环境反馈中学习，是腾讯在AI前沿领域布局的关键技术岗位

针对多模态模型开展强化学习算法研究，包括面向图像、视频生成的扩散模型，面向多模态理解的自回归模型，以及前沿统一多模态框架

设计并开发强化学习训练框架与奖励建模策略，实现高效的大规模训练，提升训练稳定性，并解决奖励作弊等相关问题

探索下一代强化学习范式，使其能更直接、更高效地从环境反馈中学习

本科及以上学历，计算机科学或相关专业

具备出色的科研能力，在ICML、NeurIPS、ICLR、CVPR、ICCV、ECCV、SIGGRAPH等顶级会议发表过论文

扎实的工程与编程能力，具备深度学习系统实现、模型训练与推理优化、CPU/GPU 加速、分布式训练与推理经验

有扩散模型、自回归模型、文生图 / 文生视频生成相关经验者优先

有 ACM/NOIP（信息学竞赛）参赛经历者优先

混元多模态强化学习（RL）算法研究员（北京/上海）

🤖 AI 估测：¥45K-80K

发布时间：16 天前