Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/微信-AI Infra工程师-大模型训练与RL方向
Tencent logo
T
腾讯 (Tencent)

职位信息

北京市
高级经验
全职员工
仅现场办公
本科
普通员工/个人贡献者

标签

系统架构分布式训练Megatron-LMDeepSpeedvLLM强化学习 (Rl)Ppo/Grpo/DpoPytorch Fsdp
💡

核心评价

腾讯微信AI核心岗,挑战前沿大模型与RL Infra工程,技术成长性极佳,薪资竞争力强。

微信-AI Infra工程师-大模型训练与RL方向

🤖 AI 估测:¥45K-80K

发布时间:30 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI基础设施建设的核心工程岗位
你将负责开发和优化支撑千亿级大模型训练与强化学习的底层框架,解决分布式训练、资源调度等核心工程难题,并与算法团队紧密合作,推动前沿AI技术在微信海量业务场景中的规模化落地

✓工作职责

核心训练框架开发与优化: 负责大模型分布式训练框架(基于Megatron-LM / DeepSpeed等)的底层架构设计与核心代码开发
支撑千亿/万亿模型的高效、稳定训练
RL Infra 系统建设与协同优化: 负责强化学习(PPO/GRPO/DPO等)训练框架的开发和优化
深度解决 Actor 生成(结合 vLLM/SGlang 等推理引擎)与 Critic/Reward 训练阶段的资源调度、状态流转及通信瓶颈,实现 Training 与 Inference 的极致协同
算法与系统协同设计 (Co-design): 与前沿算法团队紧密合作,追踪并引入业界最新开源生态(如 Verl, Slime, ROLL, AReal 等),快速完成技术原型验证,加速前沿大模型对齐算法在微信海量业务场景的规模化落地

⭐最低要求

计算机相关专业,具备较强的动手能力
熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力
训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验
RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点
综合素质: 具备极强的技术好奇心与自驱力,面对业界无先例的技术难题,能独立思考并推动解决
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公