Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
GPU训练工程师
立即应聘

GPU训练工程师

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
机器学习
GPU
深度学习
PyTorch
TensorFlow
CUDA
大模型
长序列

AI 估算 · 30k–60k

AI方向热门,大厂薪资竞争力强,GPU优化稀缺,故预估较高

职位详情

关于这个职位

该职位主要负责腾讯营销业务的长序列机器学习平台建设,优化GPU训练性能,打造高性能训练系统

需要具备C++、CUDA、深度学习框架(TensorFlow/PyTorch)等技能,适合追求技术极致、热爱GPU优化的工程师

最低要求

熟悉Linux开发环境,良好的系统编程、数据结构、算法基础、熟悉C++语言开发

熟悉GPU优化手段,熟悉CUDA等异构硬件开发技术栈
至少熟悉一种主流深度学习框架TensorFlow/Pytorch等,熟悉深度模型算法优先
对追求极致高性能充满热情,具有优秀的分析问题和解决问题能力,良好的团队合作意识和沟通能力

工作职责

负责构建面向腾讯营销业务的机器学习平台,打造业界领先的长序列基础设施建设

优化GPU训练平台的训练性能,打造高吞吐高性能的训练系统
优化GPU训练框架,提高训练平台易用性

优先资格

具备长序列相关经验优先,具有搜广推/LLM大模型推理优化经历优先

AI 洞察

优缺点分析

优点

  • 参与腾讯核心AI平台建设,接触前沿的GPU优化和长序列技术,技术积累扎实
  • 大厂平台资源丰富,有机会与顶尖工程师协作,学习业界最佳实践
  • AI领域持续热门,GPU训练工程师稀缺,职业发展空间大
  • 技术栈要求高,需要同时掌握系统编程、GPU优化和深度学习,学习曲线陡峭
  • 互联网行业竞争激烈,需要持续学习跟进技术迭代
  • 适合热爱底层性能优化、追求极致技术、有较强抗压能力,并希望深耕AI基础设施的工程师

缺点 / 挑战

  • 业务场景复杂(长序列、大模型),性能优化挑战大,工作强度可能较高

角色解读

  • 纵向深入GPU优化和分布式训练,成为高性能计算专家
  • 横向扩展至AI基础设施架构设计,承担更大规模的系统设计
  • 结合业务理解,向技术管理或技术项目经理方向发展
  • 构建面向腾讯营销业务的机器学习平台,专注长序列基础设施建设,提升模型效果
  • 优化GPU训练平台性能,设计高性能训练系统,提高吞吐和效率
  • 改进GPU训练框架,降低使用门槛,提升训练任务易用性
  • 参与团队技术沉淀和架构设计,与协作团队共同推动产品迭代
  • 精通C++和Linux开发,具备扎实的系统编程、数据结构和算法基础
  • 深入掌握GPU优化技术,熟悉CUDA、cuDNN等异构计算栈
  • 熟练使用TensorFlow或PyTorch等深度学习框架,了解深度模型原理
  • 具备长序列模型或搜广推、大模型推理优化经验者优先

申请策略

  • 在面试中展示对高性能计算的热情和深入思考,可准备一个具体的优化项目复盘
  • 了解腾讯营销业务场景(广告推荐、用户增长),思考GPU优化如何带来业务价值
  • 突出GPU优化项目经验,如CUDA编程、训练加速、混合精度训练等
  • 展示大规模分布式训练或长序列模型的实际案例,体现工程能力
  • 强调C++和Linux系统编程功底,以及TensorFlow/PyTorch框架使用深度
  • 如果有搜广推或大模型推理优化经历,务必重点呈现
  • 深入学习CUDA优化技巧,如内存访问模式、算子融合、多流并行等
  • 熟悉长序列模型(如Transformer-XL、Longformer)及分布式训练框架(如Megatron-LM、DeepSpeed)

面试指南

  • 对于优化类问题,采用“现状-瓶颈-方案-效果”的结构,先说明背景,再分析关键瓶颈,给出具体优化措施(如算子融合、数据流水线、混合精度),最后用数据量化效果
  • 对于框架对比类问题,从易用性、性能、生态、分布式支持等维度进行客观比较,并表达自己的偏好及理由
  • 对于系统设计类问题,先明确目标(吞吐、延迟、显存),再自顶向下分析计算、通信、IO各环节的优化点
  • 请介绍你做过的一个GPU训练优化项目,具体采取了哪些优化手段?
  • CUDA中如何高效地读写显存?请举例说明
  • 如何处理长序列训练中的梯度爆炸或显存不足问题?
  • TensorFlow和PyTorch在分布式训练上的区别是什么?你更倾向哪个?
  • 如果一个训练任务吞吐量低,你会从哪些方面进行排查和优化?

匹配度报告

70
综合匹配度

腾讯AI核心岗位,前沿技术栈,高发展潜力,但工作强度可能大,WLB一般。

适合人群
该职位最适合以技术成长和职业发展为核心动机的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值75

薪资福利匹配

75中等

大厂薪资福利有竞争力,但JD未明确具体薪酬和福利,补偿性动机满足度中等偏上。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

该职位涉及前沿的GPU优化和长序列技术,技术成长空间大,属于利润中心业务,发展前景好。

技术前沿前沿/新兴技术
技术栈GPU、CUDA、TensorFlow、PyTorch、长序列、大模型
业务类型profit_center

工作生活匹配

40较低

职位要求现场办公,未提及弹性工作或WLB信号,大厂高强度工作可能性大,生活化动机满足度低。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值匹配

75中等

AI赛道高速增长,但职位本身社会影响力中性,创新水平积极,意义感动机有一定满足。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《灰境行者》-战斗策划-3C及射击方向

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯游戏-游戏通用智能体算法研究员

    腾讯 · 深圳市
    AI 估算 · 45k-65k
  • 微信小店-电商带货短视频产品运营-治理方向

    腾讯 · 广州市
    AI 估算 · 15k-30k
  • 腾讯游戏品质管理部-AI测试平台产品负责人-高级技术产品经理

    腾讯 · 深圳市
    AI 估算 · 35k-55k
  • 品质管理部-客户端高级开发工程师

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 数据开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 软件开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 自动化测试工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 资深unity客户端开发工程师(影之诗)

    网易 · 广州市
    AI 估算 · 20k-35k
  • 资深全栈开发工程师

    网易 · 杭州市
    AI 估算 · 30k-45k

腾讯 的其他在招职位

  • 《灰境行者》-战斗策划-3C及射击方向

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯游戏-游戏通用智能体算法研究员

    腾讯 · 深圳市
    AI 估算 · 45k-65k
  • 微信小店-电商带货短视频产品运营-治理方向

    腾讯 · 广州市
    AI 估算 · 15k-30k
  • 腾讯游戏品质管理部-AI测试平台产品负责人-高级技术产品经理

    腾讯 · 深圳市
    AI 估算 · 35k-55k
  • 品质管理部-客户端高级开发工程师

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 数据开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 软件开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 自动化测试工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 资深unity客户端开发工程师(影之诗)

    网易 · 广州市
    AI 估算 · 20k-35k
  • 资深全栈开发工程师

    网易 · 杭州市
    AI 估算 · 30k-45k