Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/AI Infra强化学习工程师​-(深圳)or(北京)or
Tencent logo
T
腾讯 (Tencent)

职位信息

上海市 / 北京市 / 广东省-深圳市
中级经验
全职员工
仅现场办公
学历未注明
普通员工/个人贡献者

标签

系统设计PyTorch强化学习LLM分布式训练Megatron-LMPPO
💡

核心评价

腾讯AI基础设施核心岗,技术前沿挑战大,薪资竞争力强,成长空间广阔。

AI Infra强化学习工程师​-(深圳)or(北京)or

🤖 AI 估测:¥35K-60K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

这是一个专注于AI基础设施领域的强化学习工程师岗位
你将负责设计和开发支撑大规模强化学习算法(如PPO、DQN)的训练框架,并构建分布式训练体系以优化GPU利用率和训练吞吐
核心工作包括解决RL训练中的工程瓶颈,并开发全流程工具链,与算法团队紧密协作,将前沿技术落地到实际系统中

✓工作职责

负责LLM RL、Agentic RL强化学习训练框架的设计、开发与性能优化,支撑大规模 RL 算法(如 PPO、DQN、GRPO等)的高效落地
构建分布式训练体系,优化训推异步、partial rollout、数据并行、模型并行、Replay Buffer分布式存储与调度策略,提升 GPU 利用率与训练吞吐
设计并实现 RL 训练全流程工具链:包括环境封装、数据预处理、模型版本管理、训练日志监控、指标可可视化(TensorBoard/Weights & Biases)等
解决 RL 训练中的工程瓶颈:如样本传输延迟、GPU 显存溢出、训练稳定性(梯度爆炸 / 消失)等问题,提供工程化解决方案
与 RL 算法团队紧密协作,理解算法需求并迭代基础设施,适配多场景的训练需求
跟进强化学习与分布式训练领域的前沿技术(如 VERL、rllm、Agentlightning、Ray、Megatron-LM等),并落地到实际系统中

⭐最低要求

计算机科学、软件工程、人工智能等相关专业,3 年以上工程化开发经验(含 1 年以上 RL 或深度学习基础设施相关经验)
熟练掌握 Python 编程,具备扎实的工程编码能力,熟悉 C/C++ 者优先(底层优化场景)
深入理解深度学习框架(PyTorch),精通分布式训练原理与实践(FSDP/DeepSpeed/Megatron/Ray 等工具使用经验)
具备强化学习基础,理解 RL 训练流程(智能体、环境、奖励机制、经验回放等核心组件),熟悉主流 RL 框架(Ray、VERL、rllm、Agentlightning)者优先
具备复杂系统设计能力,能独立负责基础设施模块的从 0 到 1 搭建
强问题排查能力,能快速定位训练过程中的工程问题(性能、稳定性、资源瓶颈)
良好的跨团队沟通能力,能准确理解算法需求并转化为工程方案
自驱力强,乐于跟进前沿技术,具备快速学习与落地能力

👍优先资格

熟悉 C/C++(底层优化场景)
熟悉主流 RL 框架(Ray、VERL、rllm、Agentlightning)
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公