Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
混元Agent强化学习框架工程师(深圳/北京/上海)
立即应聘

混元Agent强化学习框架工程师(深圳/北京/上海)

发布于 大约 16 小时前

普通员工/个人贡献者

北京市 / 上海市
高级经验
全职员工
仅现场办公
学历未注明
软件工程
强化学习
容器化
SFT
自动化评估
大模型
RLHF
Asyncio

AI 估算 · 30k–60k

腾讯大厂高级技术岗,AI方向人才稀缺,薪资竞争力强,考虑深圳/北京/上海高消费,月薪3-6万合理。

职位详情

关于这个职位

该职位负责腾讯混元大模型Agent强化学习框架的研发与维护,需要设计可复用的组件,支持模型调用、工具调用、任务执行等核心链路

你将与算法团队紧密协作,推动新策略和训练方法的工程化落地,提升实验效率
适合具备扎实Python功底、熟悉大模型和Kubernetes的工程师

最低要求

具备扎实的 Python 编程能力,熟悉异步编程(Asyncio)、并发处理和工程化最佳实践

熟悉大模型与 Agent 相关应用技术,理解模型调用、工具调用、上下文管理、任务执行、日志 Trace 和结果评估等核心链路
熟悉 Kubernetes 和容器化技术,具备在集群环境下进行开发、部署、排障或性能优化的经验
了解大模型训练流程和基本原理,包括预训练、SFT、RLHF、强化学习训练或自动化评估中的至少一类
具备良好的软件工程能力,重视模块化设计、测试、日志、性能和稳定性治理
具备良好的问题分析及解决能力、沟通合作能力和 owner 意识,能高频承接算法团队需求并持续迭代

工作职责

参与 Research 场景下 Agent 框架的研发与维护,支持强化学习、数据生成、自动化评估和实验复现等业务需求

统一封装模型调用、工具调用、任务执行、上下文管理、日志 Trace、结果收集和评估逻辑,沉淀稳定可复用的框架组件
支持各类 Agent 策略及评估逻辑接入,维护相关接口、组件和验证机制
优化框架易用性、稳定性和性能表现,解决实际运行中的并发、资源、链路和行为一致性问题,保障实验流程高效执行
结合大模型训练视角,与算法团队共同推进新 Agent 范式、强化学习训练链路和评测方法的工程化落地

AI 洞察

优缺点分析

优点

  • 深度参与前沿大模型和Agent技术,技术成长快,简历含金量高
  • 腾讯大平台,资源丰富,团队技术氛围浓厚,有充足的计算资源和数据支持
  • 薪资待遇具有竞争力,股票期权等福利完善
  • 技术栈复杂,需要同时掌握工程化、分布式系统和AI训练知识,学习曲线陡峭
  • 业务方向属于研究前沿,不确定性高,需要较强的自主探索和问题解决能力

缺点 / 挑战

  • 工作强度较大,需高频承接算法团队需求,可能面临迭代压力
  • 适合具备扎实工程背景、对AI底层技术有强烈兴趣、喜欢挑战复杂系统的中高级工程师

角色解读

  • 可向AI基础设施架构师或技术专家发展,深耕强化学习框架与训练系统
  • 或转型为算法研究员,结合工程经验深入模型训练和策略优化
  • 在腾讯内部可横向迁移至其他AI中台团队,或晋升为技术Leader
  • 负责研发和维护混元大模型的Agent框架,支持强化学习、数据生成、自动化评估等实验场景
  • 统一封装模型调用、工具调用、上下文管理等核心模块,沉淀可复用的组件
  • 优化框架的稳定性与性能,解决并发、资源等实际问题,并与算法团队协作推动新策略工程化
  • 扎实的Python编程能力,精通异步编程和工程化实践
  • 深入理解大模型与Agent技术栈,熟悉模型调用、工具调用、日志Trace等链路
  • 熟练使用Kubernetes和容器化技术进行集群开发与运维
  • 了解大模型训练流程(预训练/SFT/RLHF等),具备强化学习或自动化评估经验

申请策略

  • 提前了解腾讯混元团队的公开技术博客和开源项目,面试时展现对业务的深入理解
  • 准备一个完整的Agent系统设计案例,包括组件划分、并发处理、容错等
  • 突出Python异步编程、高性能服务、框架设计等工程化项目经验
  • 展示Kubernetes集群部署、性能优化、故障排查的实际案例
  • 强调大模型或强化学习相关经历,尤其是Agent系统、RLHF、SFT等
  • 体现跨团队协作能力和owner意识,比如主导过复杂系统的模块设计
  • 强化Kubernetes和容器化技术的实战经验,可学习Kubeflow等MLOps工具
  • 补充大模型训练和强化学习理论,了解PPO、GRPO等算法

面试指南

  • 采用STAR法则:背景-任务-行动-结果,强调系统设计和工程化思维
  • 对于框架设计问题,从模块化、抽象接口、扩展性、可测试性等角度论述
  • 对于性能优化,先分析瓶颈再针对性优化,并对比不同方案的利弊
  • 请描述一个你设计过的复杂系统中,如何处理高并发和资源竞争问题?
  • 谈谈你对强化学习训练中Reward模型的理解,以及如何将RLHF工程化?
  • 如何设计一个可复用的Agent框架,使其支持多种工具调用和策略的灵活接入?
  • 在Kubernetes集群中,如何优化一个深度学习训练任务的性能?
  • 当你需要同时满足多个算法团队的接口需求时,如何平衡通用性和性能?

匹配度报告

78
综合匹配度

腾讯大厂AI前沿岗位,技术栈新、成长快,但薪资面议且现场办公,工作节奏可能较快。

适合人群
适合强烈追求技术成长和个人能力提升的求职者,不介意工作强度。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值80

薪资福利匹配

85较高

腾讯作为头部大厂,薪资福利在行业处于领先水平,但具体薪资面议,实际package依赖面试定级。

薪资信号面议 (30K-60K/月)

成长发展匹配

95较高

该职位处于AI最前沿领域,技术栈先进(大模型、强化学习、Kubernetes),成长空间极大,且团队协作紧密,有利于技能快速提升。

技术前沿前沿/新兴技术
技术栈Python、Asyncio、大模型、Agent、强化学习、Kubernetes、容器化、SFT、RLHF
成长机会与算法团队共同推进、持续迭代
业务类型profit_center

工作生活匹配

50较低

多个城市可选,但大厂通常要求现场办公,且涉及研究型工作可能加班较多,WLB一般。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

80较高

推动大模型Agent发展具有较高技术价值,但社会影响力中立偏正向。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 游戏AI-高性能推理系统研发工程师

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 《元梦之星》-资深关卡策划

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯云-上海泛企业销售经理-公有云

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • 腾讯云语音大模型算法工程师(TTS)

    腾讯 · 北京市
    AI 估算 · 35k-55k
  • 《洛克王国:世界》-技术美术-特效向

    腾讯 · 深圳市
    AI 估算 · 25k-40k

相似职位推荐

  • 顶尖应届-大模型训练框架研发工程师-基础技术平台

    小米 · 北京市
    AI 估算 · 25k-35k
  • 顶尖应届-智能体研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-车机OS性能优化工程师(智能平台方向)-智能座舱

    小米 · 北京市
    AI 估算 · 25k-40k
  • 顶尖应届-智能体工程师-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-大模型算法工程师-软件

    小米 · 北京市
    AI 估算 · 20k-30k

腾讯 的其他在招职位

  • 游戏AI-高性能推理系统研发工程师

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 《元梦之星》-资深关卡策划

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯云-上海泛企业销售经理-公有云

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • 腾讯云语音大模型算法工程师(TTS)

    腾讯 · 北京市
    AI 估算 · 35k-55k
  • 《洛克王国:世界》-技术美术-特效向

    腾讯 · 深圳市
    AI 估算 · 25k-40k

相似职位推荐

  • 顶尖应届-大模型训练框架研发工程师-基础技术平台

    小米 · 北京市
    AI 估算 · 25k-35k
  • 顶尖应届-智能体研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-车机OS性能优化工程师(智能平台方向)-智能座舱

    小米 · 北京市
    AI 估算 · 25k-40k
  • 顶尖应届-智能体工程师-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-大模型算法工程师-软件

    小米 · 北京市
    AI 估算 · 20k-30k