Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/大模型训练框架研发工程师-强化学习/精调/蒸馏方向
Tencent logo
T
腾讯 (Tencent)

职位信息

上海市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

强化学习CUDA框架开发NCCL分布式训练大模型Megatron-LMDeepSpeed
💡

核心评价

腾讯顶尖技术岗,专注前沿大模型框架研发,成长空间巨大,薪资竞争力强,工作地点固定。

大模型训练框架研发工程师-强化学习/精调/蒸馏方向

🤖 AI 估测:¥45K-80K

发布时间:大约 1 个月前

立即应聘

ℹ️关于这个职位

该职位是腾讯的大模型训练框架研发工程师,专注于强化学习、模型精调和知识蒸馏方向
你将负责核心模块的开发与优化,提升框架的训练效率和易用性,并基于Megatron-LM、DeepSpeed等工具优化大模型的分布式训练策略
同时,你需要跟踪前沿学术动态,将最新研究成果转化为框架功能,并与产品团队协作提供解决方案

✓工作职责

框架开发与优化:负责强化学习、模型精调、知识蒸馏等核心模块的设计与开发,提升框架的训练效率与易用性
分布式训练支持:基于Megatron-LM、DeepSpeed等工具,优化大模型分布式训练策略(数据并行/张量并行/流水并行/专家并行等),解决显存、通信与计算瓶颈
工具链构建:参与开发轻量化训练框架(如LLama-Factory、swift),支持快速模型微调、部署及多硬件平台适配
前沿技术探索:跟踪学术动态(如RLHF、MoE架构、FlashMLA、EPLB、DualPipe等),将最新研究成果转化为框架功能,提升产品竞争力
协作与文档:与产品团队紧密配合,提供框架级解决方案
编写技术文档与案例,赋能公有云客户

⭐最低要求

计算机科学、数学、电子工程等相关专业硕士及以上学历,3年以上深度学习框架或工具链开发经验,精通Python,熟练使用C++
有Megatron-LM、DeepSpeed等开源框架使用或二次开发经验,理解分布式训练、显存优化技术
工程经验上具备大型项目架构设计能力,能独立解决性能调优、多节点调试等复杂问题
综合素养
强烈的技术热情,良好的沟通能力与团队协作精神

👍优先资格

熟悉 GRPO/PPO 等 RL 算法、veRL/Slime/AReaL等强化学习框架者优先
熟悉CUDA编程、高性能计算优化(如算子融合、通信优化)者优先
熟悉NCCL、MPI等集合通信算法者优先
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公