Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
混元强化训练框架研发工程师(深圳/北京/上海)
立即应聘

混元强化训练框架研发工程师(深圳/北京/上海)

发布于 大约 2 小时前

普通员工/个人贡献者

深圳市 / 北京市
中级经验
全职员工
仅现场办公
学历未注明
软件工程
强化学习
容器化
异步编程
大模型
RLHF
Agent框架
Ai编程工具
Asyncio

AI 估算 · 25k–50k

腾讯大厂AI核心岗位,技术要求高,薪资竞争力强,一线城市平均月薪在25k-50k之间。

职位详情

关于这个职位

该职位负责腾讯混元大模型场景下的强化训练框架研发,主要涉及Agent框架的构建与优化,支持强化学习、数据生成和自动化评估等核心业务

你将与算法团队紧密合作,推动新Agent范式的工程化落地,解决性能瓶颈,提升框架的易用性和稳定性
适合对大模型、强化学习和分布式系统有浓厚兴趣的工程师

最低要求

具备扎实的Python编程能力,熟悉异步编程(Asyncio)及并发处理的最佳实践,有良好的代码规范意识

熟悉大模型与Agent相关应用技术,熟练使用AI编程工具并理解其工作原理
熟悉K8S及容器化技术,具备相关环境下的开发或部署经验
了解大模型训练全流程(如预训练、SFT、RLHF)及基本原理
具备良好的问题分析及解决能力、沟通合作能力,有较强的Owner意识

工作职责

参与Research场景下Agent框架的研发与维护,支持强化学习、数据生成及自动化评估等业务需求

负责优化框架的易用性与稳定性,解决实际运行中的性能瓶颈,保障实验流程的高效执行
支持各类外部Agent策略及评估逻辑的接入,维护相关接口与组件,确保系统的兼容性与扩展性
结合大模型训练视角,配合算法团队进行新Agent范式的工程化落地与探索

AI 洞察

优缺点分析

优点

  • 腾讯大平台,技术和资源丰富,有机会接触最前沿的大模型和强化学习技术
  • 职位处于AI核心赛道,行业前景广阔,技能积累价值高
  • 团队技术氛围浓厚,能与算法和工程高手协作,快速成长
  • 技术栈深度大,需要同时掌握分布式系统、大模型训练和Agent框架
  • 涉及研究场景,需求可能快速变化,对问题解决和Owner意识要求高
  • 工作节奏可能较快,需要适应高强度研发
  • 适合有大模型或强化学习背景的工程师,渴望深入AI基础设施的研发,愿意在快速变化的领域中持续学习

缺点 / 挑战

暂无明显挑战项

角色解读

  • 可以成长为强化学习框架方向的专家,深入大模型训练底层技术
  • 向AI Infra或算法工程方向拓展,成为团队的技术骨干
  • 有机会参与前沿研究,推动Agent技术在产业中的应用
  • 负责开发和维护用于强化学习的Agent框架,支持数据生成、自动评估等流程
  • 优化框架的易用性和稳定性,解决性能瓶颈,确保实验高效运行
  • 与算法团队合作,将新的Agent范式工程化落地,探索大模型应用
  • 精通Python,熟悉异步编程(Asyncio)和并发处理
  • 熟悉大模型和Agent技术,熟练使用AI编程工具
  • 掌握K8S和容器化技术,有相关开发或部署经验

申请策略

  • 关注腾讯混元的技术博客或开源项目,了解团队技术方向
  • 面试前准备好一个完整的项目案例,强调技术深度和工程解决方案
  • 突出Python编程能力,特别是异步编程和并发处理的项目经验
  • 强调在大模型或Agent相关项目中的实际贡献,包括框架开发、性能优化等
  • 展示K8S容器化部署经验,以及在大规模分布式环境下的工作成果
  • 如果对RLHF或分布式训练不熟,建议快速学习相关原理和工具
  • 可以尝试开源Agent框架(如LangChain)的实践,加深理解

面试指南

  • 对于性能问题,使用STAR法(情况-任务-行动-结果),量化改进效果
  • 对于技术原理问题,先讲整体流程,再深入细节,展示系统性理解
  • 对于架构设计问题,从需求出发,对比不同方案,给出权衡
  • 请描述一个你优化过的异步系统或框架,遇到了什么性能瓶颈?如何解决的?
  • 你对RLHF训练流程的理解是什么?Agent在其中的作用是什么?
  • 在K8S集群中如何部署一个需要分布式通信的强化学习任务?
  • 大模型训练中,如何保证数据生成和评估的稳定性和一致性?
  • 如果你要设计一个通用的Agent框架,你会考虑哪些扩展点和接口?

匹配度报告

70
综合匹配度

腾讯AI核心岗位,前沿技术栈,薪资中上,WLB一般,发展空间大。

适合人群
适合追求技术成长、愿意投入AI前沿领域、对薪资和WLB要求适中的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活40
使命价值70

薪资福利匹配

80较高

腾讯大厂,薪资在行业内具有竞争力,且有稳定的福利体系。但JD未提及具体薪资和福利,所以分数中等偏上。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

90较高

该职位处于AI前沿技术领域,使用大模型、强化学习等新兴技术,有巨大的成长空间。但JD未明确提及培训或晋升通道。

技术前沿前沿/新兴技术
技术栈Python、Asyncio、K8S、大模型、Agent、强化学习、RLHF
业务类型profit_center

工作生活匹配

40较低

工作地点在北京/深圳/上海,需现场办公,未提及弹性工作或远程。互联网大厂工作强度通常较大,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

70中等

该职位属于高速增长的大模型赛道,对社会影响力有积极贡献(推动AI技术发展),但JD未直接提及使命或社会价值。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 混元沙盒平台工程师(北京/深圳/上海)

    腾讯 · 北京市
    AI 估算 · 40k-70k
  • 灰境行者-系统策划-新星引力计划

    腾讯 · 上海市
    AI 估算 · 15k-25k
  • 混元Agent数据与环境平台工程师(深圳/北京/上海)

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 腾讯游戏-高级产品经理-游戏AIGC工具产品

    腾讯 · 深圳市
    AI 估算 · 25k-40k
  • 游戏AI-高性能推理系统研发工程师

    腾讯 · 深圳市
    AI 估算 · 30k-60k

相似职位推荐

  • AI Native 全栈开发实习生-电商-北京

    小红书 · 北京市
    AI 估算 · 4k-7k
  • Sr. Assoc, BackEnd Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 25k-40k
  • Full-Stack Solution Engineer - Sensorized Human

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • iOS研发工程师-TikTok社交

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 服务端研发Leader(房产-用户与AI方向)-中国交易与广告

    字节跳动 · 杭州市
    AI 估算 · 35k-60k

腾讯 的其他在招职位

  • 混元沙盒平台工程师(北京/深圳/上海)

    腾讯 · 北京市
    AI 估算 · 40k-70k
  • 灰境行者-系统策划-新星引力计划

    腾讯 · 上海市
    AI 估算 · 15k-25k
  • 混元Agent数据与环境平台工程师(深圳/北京/上海)

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 腾讯游戏-高级产品经理-游戏AIGC工具产品

    腾讯 · 深圳市
    AI 估算 · 25k-40k
  • 游戏AI-高性能推理系统研发工程师

    腾讯 · 深圳市
    AI 估算 · 30k-60k

相似职位推荐

  • AI Native 全栈开发实习生-电商-北京

    小红书 · 北京市
    AI 估算 · 4k-7k
  • Sr. Assoc, BackEnd Eng, WRB Tech

    渣打银行 · 天津市
    AI 估算 · 25k-40k
  • Full-Stack Solution Engineer - Sensorized Human

    英伟达 · 上海市
    AI 估算 · 30k-50k
  • iOS研发工程师-TikTok社交

    字节跳动 · 北京市
    AI 估算 · 20k-35k
  • 服务端研发Leader(房产-用户与AI方向)-中国交易与广告

    字节跳动 · 杭州市
    AI 估算 · 35k-60k