Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
GPU推理工程师
立即应聘

GPU推理工程师

发布于 大约 16 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
学历未注明
深度学习
PyTorch
TensorFlow
GPU优化
LLM
CUDA
推理优化

AI 估算 · 30k–50k

GPU推理优化为稀缺技能,腾讯平台加持,薪资竞争力强。

职位详情

关于这个职位

作为腾讯营销业务的GPU推理工程师,你将负责Co-Scaling推理架构升级与性能优化,开发GPU算子和计算图编译,跟进异构硬件前沿技术,支撑大模型推理加速

这是一个技术深度高、面向核心业务的前沿岗位,适合对高性能计算充满热情的同学

最低要求

熟悉Linux开发环境,良好的系统编程、数据结构、算法基础、熟悉C++语言开发

熟悉GPU优化手段,熟悉CUDA等异构硬件开发技术栈
至少熟悉一种主流深度学习框架TensorFlow/Pytorch等,熟悉深度模型算法优先
对追求极致高性能充满热情,具有优秀的分析问题和解决问题能力,良好的团队合作意识和沟通能力
具备长序列相关经验优先,具有搜广推/LLM大模型推理优化经历优先

工作职责

负责营销业务中Co-Scaling推理架构升级与性能优化,支持Seq Scaling 持续提升

负责营销业务中GPU算子,计算图编译优化等业务开发,支撑业务迭代升级
积极跟进GPU等异构硬件的业内前沿技术,持续完善异构推理加速框架

优先资格

具备长序列相关经验优先,具有搜广推/LLM大模型推理优化经历优先

AI 洞察

优缺点分析

优点

  • 大厂平台,参与核心营销业务,技术影响力大
  • 前沿技术栈,GPU推理优化是稀缺高薪技能
  • 团队注重技术沉淀,有良好的成长空间和资源支持
  • 技术难度高,需持续学习CUDA和模型优化方法
  • 行业竞争激烈,需要深厚的技术积累和创新思维

缺点 / 挑战

  • 业务压力大,可能需要应对高并发场景和紧急需求
  • 适合对高性能计算充满热情,追求极致性能,愿意深耕GPU优化领域并挑战技术难点的工程师

角色解读

  • 从GPU算子优化到推理架构设计,成为高性能计算专家
  • 深入大模型推理优化,参与行业前沿技术探索
  • 发展到技术Leader或架构师方向,主导团队技术规划
  • 负责营销业务中Co-Scaling推理架构升级与性能优化,支持大模型序列扩展
  • 开发GPU算子和计算图编译优化,提升模型推理效率
  • 跟进GPU等异构硬件前沿技术,持续完善推理加速框架
  • 精通C++和Linux系统编程,具备扎实的数据结构与算法基础
  • 熟练使用CUDA进行GPU性能优化,熟悉异构硬件开发
  • 熟悉PyTorch/TensorFlow等深度学习框架,了解模型推理优化技巧

申请策略

  • 关注腾讯的营销技术博客或开源项目,展示技术热情
  • 准备一个GPU优化案例分享,体现分析问题和解决问题的能力
  • 突出GPU相关的项目经验,包括CUDA编程和性能调优案例
  • 展示使用PyTorch/TensorFlow进行模型部署和优化的具体项目
  • 强调长序列或大模型推理优化经验,如推理加速框架使用
  • 深入学习CUDA编程模型和GPU架构细节
  • 掌握计算图编译工具如TVM或XLA
  • 了解最新的大模型推理框架如vLLM、TensorRT

面试指南

  • 结合实际项目数据,展示分析与优化过程,量化性能提升
  • 比较不同方案,说明选择某种技术的理由
  • 体现系统思维,考虑上下游影响
  • 请介绍一个你优化GPU算子的项目,包括遇到的问题和解决方案
  • 如何在Transformer解码中优化内存带宽和计算效率?
  • 对比TensorRT和OpenVINO的优缺点,并说明适用场景
  • 解释CUDA中的warp划分和bank conflict,如何避免?
  • 如何实现长序列推理的高效缓存和显存管理?

匹配度报告

71
综合匹配度

大厂核心营销业务,前沿GPU推理技术,薪资优厚但WLB一般。

适合人群
该职位最适合追求技术成长和高薪资的求职者,对工作生活平衡要求不高。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活40
使命价值70

薪资福利匹配

85较高

薪资估算偏高,大厂福利全面,但JD未明确具体薪酬。

薪资信号偏高 (30K-50K/月)

成长发展匹配

90较高

技术栈前沿,涉及GPU优化和大模型推理,成长空间大。

技术前沿前沿/新兴技术
技术栈CUDA、PyTorch、TensorFlow、LLM、推理优化
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作,北京通勤可能较长。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI大模型赛道高速增长,但社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《灰境行者》-战斗策划-3C及射击方向

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯游戏-游戏通用智能体算法研究员

    腾讯 · 深圳市
    AI 估算 · 45k-65k
  • 微信小店-电商带货短视频产品运营-治理方向

    腾讯 · 广州市
    AI 估算 · 15k-30k
  • 腾讯游戏品质管理部-AI测试平台产品负责人-高级技术产品经理

    腾讯 · 深圳市
    AI 估算 · 35k-55k
  • 品质管理部-客户端高级开发工程师

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 数据开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 软件开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 自动化测试工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 资深unity客户端开发工程师(影之诗)

    网易 · 广州市
    AI 估算 · 20k-35k
  • 资深全栈开发工程师

    网易 · 杭州市
    AI 估算 · 30k-45k

腾讯 的其他在招职位

  • 《灰境行者》-战斗策划-3C及射击方向

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯游戏-游戏通用智能体算法研究员

    腾讯 · 深圳市
    AI 估算 · 45k-65k
  • 微信小店-电商带货短视频产品运营-治理方向

    腾讯 · 广州市
    AI 估算 · 15k-30k
  • 腾讯游戏品质管理部-AI测试平台产品负责人-高级技术产品经理

    腾讯 · 深圳市
    AI 估算 · 35k-55k
  • 品质管理部-客户端高级开发工程师

    腾讯 · 上海市
    AI 估算 · 30k-50k

相似职位推荐

  • 数据开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 软件开发

    京东 · 北京市
    AI 估算 · 25k-45k
  • 自动化测试工程师

    顺丰速运 · 深圳市
    AI 估算 · 15k-25k
  • 资深unity客户端开发工程师(影之诗)

    网易 · 广州市
    AI 估算 · 20k-35k
  • 资深全栈开发工程师

    网易 · 杭州市
    AI 估算 · 30k-45k