Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
GPU训练工程师
立即应聘

GPU训练工程师

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
PyTorch
TensorFlow
CUDA
GPU编程
通信优化
编译优化
低精度训练
Torchrec

AI 估算 · 30k–50k

需要掌握GPU编程与深度学习框架,技术门槛较高,大厂薪资有竞争力,且通常有年终奖

职位详情

关于这个职位

该职位负责构建腾讯营销业务的机器学习平台,重点优化GPU训练性能与框架易用性

你将参与高性能训练系统的开发,需要扎实的编程基础和GPU编程能力,适合对深度学习系统优化感兴趣的技术人员

最低要求

掌握数据结构、算法等相关专业知识

熟练使用C/C++、Python语言编程,具备GPU编程能力,掌握CUDA编程能力
熟悉 Pytorch/TensorFlow/TorchRec 等框架者优先

工作职责

负责构建面向腾讯营销业务的机器学习平台

优化GPU训练平台的训练性能,打造高吞吐高性能的训练系统
优化GPU训练框架,提高训练平台易用性

优先资格

具备编译优化、通信优化、低精度训练能力者优先

AI 洞察

优缺点分析

优点

  • 接触前沿的GPU优化技术,如编译优化、低精度训练等,技能稀缺性强
  • 团队技术氛围浓厚,可与业内顶尖工程师交流学习
  • 技术深度大,需要同时掌握系统编程、GPU架构和深度学习框架,学习曲线陡峭
  • 工作强度可能较大,需要快速解决线上训练性能问题
  • 需要紧跟硬件和框架更新,持续学习新技术

缺点 / 挑战

  • 腾讯大平台,项目影响力大,技术挑战高,有利于积累深度学习系统经验
  • 适合对高性能计算和深度学习系统有浓厚兴趣、愿意深入底层技术、享受攻克性能瓶颈的工程师

角色解读

  • 可以成长为分布式训练系统架构师,负责设计大规模机器学习基础设施
  • 也可转向AI平台研发专家,参与深度学习框架底层开发
  • 未来可向AI技术管理方向晋升,带领团队构建核心系统
  • 负责构建面向腾讯营销业务的机器学习平台,涉及模型训练与推理基础设施
  • 优化GPU训练平台的性能,通过编译器优化、通信优化等手段提高训练吞吐量
  • 改进GPU训练框架,提升易用性,降低算法工程师的使用门槛
  • 精通C/C++和Python,具备扎实的数据结构与算法基础
  • 熟练掌握CUDA编程,能够进行GPU性能调优
  • 熟悉PyTorch、TensorFlow等主流深度学习框架,了解其底层实现
  • 理解分布式训练原理,有通信优化或编译优化经验者更佳

申请策略

  • 关注腾讯广告业务的技术挑战,在面试中展现对业务场景的理解
  • 准备一两个深入的系统优化案例,能够用系统思维阐述问题与解决方案
  • 突出CUDA编程项目经验,展示具体的性能优化成果(如加速比、吞吐量提升)
  • 强调分布式训练经验,包括数据并行、模型并行或流水线并行
  • 如有开源贡献(如PyTorch、TensorFlow等),务必列出
  • 提前学习NVIDIA Nsight等性能分析工具,掌握CUDA内核调优方法
  • 了解通信优化技术(如NCCL、Gloo)和编译优化技术(如TVM、XLA)

面试指南

  • 采用STAR法则:情境、任务、行动、结果,重点突出量化指标
  • 对于原理类问题,先解释基本概念,再结合实际工程经验展开
  • 请描述一次你优化GPU训练性能的经历,具体做了什么?
  • 如何分析PyTorch训练过程中的瓶颈?
  • CUDA共享内存和全局内存的区别及使用场景?
  • 为什么需要混合精度训练?它如何提升性能?
  • 在分布式训练中,数据并行和模型并行各有什么优缺点?
  • 复习CUDA编程模型、内存层次结构、线程调度等核心知识

匹配度报告

70
综合匹配度

技术前沿、平台优越,但工作强度较大且需现场办公。

适合人群
适合追求技术深度和职业发展、愿意投入时间精力攻克难题的求职者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利80
成长发展90
工作生活50
使命价值60

薪资福利匹配

80较高

腾讯作为上市巨头,薪资福利在行业内有竞争力,但JD未明确具体数字,整体补偿性动机较好。

薪资信号未披露(AI估算:30K-50K/月)

成长发展匹配

90较高

职位涉及GPU训练系统优化,技术前沿且挑战性高,有利于技能深度成长和职业发展。

技术前沿前沿/新兴技术
技术栈CUDA、C++、Python、PyTorch、TensorFlow、TorchRec、编译优化
业务类型profit_center

工作生活匹配

50较低

明确要求北京现场办公,且未提及弹性工作或WLB信息,生活化动机满足程度一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

服务于腾讯营销业务,属于高速增长赛道,但社会影响力中性,意义感动机中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《灰境行者》-战斗策划-3C及射击方向

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯游戏-游戏通用智能体算法研究员

    腾讯 · 深圳市
    AI 估算 · 45k-65k
  • 微信小店-电商带货短视频产品运营-治理方向

    腾讯 · 广州市
    AI 估算 · 15k-30k
  • 腾讯游戏品质管理部-AI测试平台产品负责人-高级技术产品经理

    腾讯 · 深圳市
    AI 估算 · 35k-55k
  • 品质管理部-客户端高级开发工程师

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 数据开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 软件开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 自动化测试工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 资深unity客户端开发工程师(影之诗)

    网易 · 广州市
    AI 估算 · 20k-35k
  • 资深全栈开发工程师

    网易 · 杭州市
    AI 估算 · 30k-45k

腾讯 的其他在招职位

  • 《灰境行者》-战斗策划-3C及射击方向

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯游戏-游戏通用智能体算法研究员

    腾讯 · 深圳市
    AI 估算 · 45k-65k
  • 微信小店-电商带货短视频产品运营-治理方向

    腾讯 · 广州市
    AI 估算 · 15k-30k
  • 腾讯游戏品质管理部-AI测试平台产品负责人-高级技术产品经理

    腾讯 · 深圳市
    AI 估算 · 35k-55k
  • 品质管理部-客户端高级开发工程师

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 数据开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 软件开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 自动化测试工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 资深unity客户端开发工程师(影之诗)

    网易 · 广州市
    AI 估算 · 20k-35k
  • 资深全栈开发工程师

    网易 · 杭州市
    AI 估算 · 30k-45k