Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/微信秒剪-agent强化学习训练框架开发工程师-(广州)
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

PyTorch分布式训练模型推理优化大模型强化学习 (Rl)
💡

核心评价

腾讯前沿AI框架岗,技术顶尖成长快,薪资竞争力强,但需专注现场攻坚。

微信秒剪-agent强化学习训练框架开发工程师-(广州)

🤖 AI 估测:¥35K-65K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于大模型与智能体(Agent)强化学习训练框架开发的高级技术岗位
你将负责搭建和优化高性能的Agent RL训练与推理框架,以提升在超长上下文(如工具调用)场景下的训练效率和稳定性
同时,你需要深入参与大模型推理性能优化、分布式训练性能调优以及模型后训练流程的链路分析,致力于解决前沿AI技术落地中的核心工程挑战

✓工作职责

参与开发优化大模型推理性能,提升长调用链 Agent 推理效果和推理性能
搭建高性能的 Agent RL训练和推理框架,满足超长上下文(工具调用)场景下 Agent RL的训练效率以及训练稳定性
参与大窗口、分布式训练的性能优化,持续跟进大模型训练框架前沿技术,进行关键技术预研以及落地验证
深入分析模型后训练过程中的链路流程,包括数据加载、通信效率等,提升训练速度以及训练吞吐

⭐最低要求

精通Python及PyTorch等框架,具备Qwen、Deepseek等模型的二次训练经验者优先
深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解Claude Code等Agent开发框架,有完整智能体系统搭建经验者优先
熟悉常用的RL训练框架和训练技巧,有Verl、Slime、AReal等强化学习训练框架使用经验者优先
深入理解分布式框架的底层通信机制、内存管理策略与并行调度等逻辑,能够精准定位核心优化方向
熟悉主流推理框架,掌握 kvcache、量化、算子优化等推理优化方法,并且有落地经验者优先

👍优先资格

具备Qwen、Deepseek等模型的二次训练经验者优先
有完整智能体系统搭建经验者优先
有Verl、Slime、AReal等强化学习训练框架使用经验者优先
掌握 kvcache、量化、算子优化等推理优化方法,并且有落地经验者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公