Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
游戏AI-高性能推理系统研发工程师
立即应聘

游戏AI-高性能推理系统研发工程师

发布于 大约 16 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
研究与开发 (研发)
GPU
HPC
CUDA
ROCm
PTX
Megatron-LM
DeepSpeed
SGLang
vLLM

AI 估算 · 30k–60k

AI大模型高性能计算岗,技术壁垒高,腾讯大厂平台加成,资深岗位薪资有竞争力。

职位详情

关于这个职位

该职位负责腾讯“开悟”平台的AI大模型训练与推理系统优化,专注于GPU高性能计算和底层性能调优

你将参与vLLM、SGLang等框架的核心模块开发,深入优化NVIDIA/AMD GPU的算力效率,探索MoE、动态计算图等前沿技术,推动AI工程化落地
适合具备CUDA/ROCm编程经验、熟悉分布式训练框架的资深工程师

最低要求

熟悉NVIDIA CUDA/AMD ROCm编程,具备GPU内核优化经验(如PTX指令调优、显存带宽优化)

精通Megatron-LM、DeepSpeedI等分布式训练框架,有千亿参数模型并行训练实战经验
熟悉大模型训练全流程优化(数据加载、梯度累积、通信压缩等),能通过Profiling工具定位性能瓶颈

工作职责

负责腾讯“开悟”平台的AIGC及LLM的训练/推理支持,参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA/AMD等)的底层性能优化与调优

针对大模型推理、训练等场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率
深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法
探索前沿技术方向(如混合专家模型MoE、动态计算图优化等),推动AI工程化落地的效率提升

优先资格

有DeepSeek系列模型优化经验(如DualPipe调度、MLA注意力优化)或参与过相关开源项目贡献

AI 洞察

优缺点分析

优点

  • 深度参与前沿AI技术(大模型、GPU优化),技术成长空间大
  • 腾讯大厂平台,资源丰富,有影响力项目加持
  • 与顶尖AI研究团队协作,接触行业最新实践
  • 技术门槛高,需要扎实的GPU底层知识和分布式系统经验
  • 工作强度可能较大,涉及复杂的性能调优和debug
  • 大模型领域更新快,需要持续学习新技术
  • 适合有3-5年GPU开发经验、热爱底层性能优化、渴望在大模型基础设施领域深耕的技术型人才

缺点 / 挑战

暂无明显挑战项

角色解读

  • 技术深耕:成为AI系统优化专家,领导更大规模的高性能计算项目
  • 架构升级:转向AI基础设施架构师,设计下一代训练/推理平台
  • 管理方向:带领高性能计算团队,负责技术方向与团队建设
  • 负责腾讯开悟平台的AI模型训练与推理系统的底层优化,提升GPU计算效率
  • 优化vLLM、SGLang等推理框架的核心模块,实现高性能算子与算法
  • 深入分析GPU硬件架构,利用CUDA/ROCm进行内核调优,解决性能瓶颈
  • 探索MoE、动态计算图等前沿技术,推动AI工程化落地
  • 精通CUDA/ROCm编程和GPU底层优化,包括PTX指令调优、显存带宽优化
  • 熟悉Megatron-LM、DeepSpeed等分布式训练框架,具备千亿参数模型并行经验
  • 掌握大模型训练全流程优化,能使用Profiling工具定位性能瓶颈
  • 了解vLLM、SGLang等推理框架原理,有扩展和优化经验者优先

申请策略

  • 在面试中展示对性能调优的实战案例,包括定性和定量分析
  • 了解腾讯开悟平台的应用场景,思考如何提升其AI推理效率
  • 突出GPU内核优化项目经验,量化性能提升(如吞吐量、延迟改善百分比)
  • 详细描述参与过的大模型训练/推理优化工作,包括使用的框架和具体优化点
  • 展示对NVIDIA/AMD硬件架构的理解,如Tensor Core、显存带宽等
  • 如果有开源贡献(如vLLM、DeepSpeed),重点列出
  • 深入复习CUDA编程模型,包括PTX指令和内存管理
  • 学习Megatron-LM和DeepSpeed的源码,理解并行策略

面试指南

  • STAR法则:描述情境、任务、行动、结果,重点突出量化的性能提升
  • 对比分析法:在解释优化技术时,对比优化前后的效果,说明原理
  • 系统思维:从硬件、框架、算法等多维度综合回答性能问题
  • 请详细描述一次GPU内核优化的经历,你如何识别和解决性能瓶颈?
  • 解释Megatron-LM中的张量并行和流水线并行是如何工作的?
  • 在大模型训练中,如何处理显存不足的问题?请列出至少三种技术
  • 你对vLLM的PagedAttention了解多少?它与传统attention相比有哪些优势?
  • 如何优化大模型的推理延迟?请从系统和算法层面分别讨论

匹配度报告

69
综合匹配度

大厂AI基础设施核心岗,技术前沿、薪资优厚,但工作强度和WLB一般。

适合人群
最适合以技术成长和前沿探索为核心动机的求职者,对薪资和WLB要求适中即可。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展90
工作生活40
使命价值70

薪资福利匹配

75中等

腾讯为已上市巨头,薪资水平处于行业头部,该岗位技术门槛高,预计薪酬竞争力强。但JD未明确具体薪资福利,需面试确认。

薪资信号未披露(AI估算:30K-60K/月)

成长发展匹配

90较高

岗位聚焦AI大模型前沿技术,涉及GPU底层优化、分布式训练、推理框架等,技术成长空间极大。腾讯内部有丰富的技术分享和晋升通道。

技术前沿前沿/新兴技术
技术栈CUDA、ROCm、vLLM、SGLang、Megatron-LM、DeepSpeed、MoE、HPC、GPU
业务类型ambiguous

工作生活匹配

40较低

仅现场办公,深圳科技园,高强度技术岗位通常加班较多,未提及弹性工作或WLB,生活方式满足度较低。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI基础设施岗位推动技术进步,但直接社会影响有限。属于高速增长的AI赛道,创新性强,有一定意义感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 《元梦之星》-资深关卡策划

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯云-上海泛企业销售经理-公有云

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • 腾讯云语音大模型算法工程师(TTS)

    腾讯 · 北京市
    AI 估算 · 35k-55k
  • 《洛克王国:世界》-技术美术-特效向

    腾讯 · 深圳市
    AI 估算 · 25k-40k
  • 内容策划与媒体经理

    腾讯 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k

腾讯 的其他在招职位

  • 《元梦之星》-资深关卡策划

    腾讯 · 上海市
    AI 估算 · 25k-40k
  • 腾讯云-上海泛企业销售经理-公有云

    腾讯 · 上海市
    AI 估算 · 25k-45k
  • 腾讯云语音大模型算法工程师(TTS)

    腾讯 · 北京市
    AI 估算 · 35k-55k
  • 《洛克王国:世界》-技术美术-特效向

    腾讯 · 深圳市
    AI 估算 · 25k-40k
  • 内容策划与媒体经理

    腾讯 · 北京市
    AI 估算 · 15k-25k

相似职位推荐

  • 顶尖应届-Linux内核优化研究员(存储优化)-软件

    小米 · 北京市
    AI 估算 · 30k-50k
  • 顶尖应届-多模态大模型算法研究员-MiMo

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-动力大数据AI算法工程师-整车

    小米 · 南京市
    AI 估算 · 20k-30k
  • 顶尖应届-感知大模型算法工程师-自动驾驶

    小米 · 北京市
    AI 估算 · 20k-30k
  • 顶尖应届-垂域Agentic大模型算法工程师-AI实验室

    小米 · 北京市
    AI 估算 · 25k-45k