Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
元宝-LLM大模型推理工程师
立即应聘

元宝-LLM大模型推理工程师

发布于 大约 16 小时前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
本科
GPU
深度学习
PyTorch
性能优化
LLM
CUDA
并行计算
模型量化
vLLM
TensorRT-LLM

AI 估算 · 25k–50k

腾讯大模型核心岗位,技术深度高,深圳地区大厂薪资竞争力强,综合评估月薪范围合理。

职位详情

关于这个职位

作为腾讯元宝团队的LLM大模型推理工程师,你将负责开发和优化高性能推理引擎,通过GPU、CUDA等技术手段提升大模型推理效率

这是一个深度技术岗位,适合对AI系统工程和性能优化有热情的开发者

最低要求

本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先

熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等
具备丰富的基于CUDA的GPU性能优化经验
了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架及其模型文件的解析,如PyTorch、TensorFlow

工作职责

负责开发和优化大模型推理框架

主要通过GPU、CUDA性能优化的手段,结合线上实际情况,优化高性能LLM推理引擎
负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化等

优先资格

熟悉TensorRT-LLM、vLLM等,了解主流LLM模型,有LLM模型加速优化经验者优先

AI 洞察

优缺点分析

优点

  • 腾讯大平台,核心业务团队,项目影响力大
  • 聚焦大模型推理前沿技术,技术积累含金量高
  • 薪资待遇优厚,股权激励等福利完善
  • 技术深度要求极高,需持续学习GPU和AI领域最新进展
  • 技术迭代快,需要快速适应新的框架和工具
  • 适合对GPU高性能计算和AI推理有浓厚兴趣,追求技术深度,能接受高强度技术攻关的工程师

缺点 / 挑战

  • 大模型推理性能优化极具挑战,工作强度可能较大

角色解读

  • 技术纵深发展:成为LLM推理优化领域专家,主导核心技术攻关
  • 架构师方向:参与大规模分布式推理系统设计,拓展系统架构能力
  • 技术管理方向:积累经验后转向技术团队管理,带领团队突破技术难题
  • 开发和优化大模型推理框架,提升推理速度和效率
  • 利用GPU、CUDA进行性能优化,包括并行计算、访存优化、低比特计算等
  • 研究前沿技术架构,如子图匹配、编译优化、模型量化,并引入实际项目中
  • 精通GPU高性能计算优化,深入理解计算机体系结构
  • 丰富的CUDA编程和优化经验
  • 熟悉深度学习框架(PyTorch/TensorFlow)及模型解析
  • 了解主流LLM模型和推理引擎(TensorRT-LLM、vLLM等)

申请策略

  • 了解腾讯元宝产品线,思考大模型推理在应用中的挑战
  • 准备一个完整的性能优化案例,从问题定位到优化效果的数据分析
  • 突出GPU/CUDA性能优化项目经验,尤其是低比特计算、访存优化等
  • 展示LLM推理引擎(如TensorRT-LLM、vLLM)的实践经验
  • 强调深度学习模型优化和部署背景,包括量化、剪枝等
  • 深入学习CUDA编程和GPU架构,掌握NVIDIA性能分析工具(Nsight)
  • 动手实践LLM推理框架,阅读核心源码,尝试优化一个模型

面试指南

  • STAR法则:情境(Situation)、任务(Task)、行动(Action)、结果(Result)
  • 先讲背景和目标,再讲具体技术方案和数据对比,最后总结学习收获
  • 描述一次GPU性能优化的经历,你用了哪些技术手段?效果如何?
  • 解释Flash Attention的原理及其对LLM推理的意义
  • 如何优化一个Transformer模型的推理速度?请列出你的优化思路
  • TensorRT-LLM和vLLM的主要区别是什么?你如何选择?
  • 什么是KV Cache?在LLM推理中如何处理?
  • 复习CUDA编程和GPU架构知识,准备好性能分析工具使用经验

匹配度报告

68
综合匹配度

腾讯核心大模型推理岗,前沿技术栈,高成长但WLB一般

适合人群
适合追求技术深度和前沿领域、对薪资和成长有高要求,能接受一定工作强度的开发者。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利75
成长发展95
工作生活40
使命价值60

薪资福利匹配

75中等

腾讯大厂薪资福利有竞争力,但JD未明确薪资水平,需在面试中确认具体包。

薪资信号未披露(AI估算:25K-50K/月)

成长发展匹配

95较高

大模型推理是前沿技术领域,岗位深度高,对个人技术成长极为有利。

技术前沿前沿/新兴技术
技术栈LLM、GPU、CUDA、TensorRT-LLM、vLLM、PyTorch、深度学习、模型量化、编译优化
业务类型profit_center

工作生活匹配

40较低

仅现场办公,未提及弹性工作,深圳互联网企业通常有加班文化,WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

60中等

大模型是高速增长赛道,但岗位偏技术实现,社会影响力中性。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 腾讯营销-海外广告联盟流量运营专家-北京

    腾讯 · 北京市
    AI 估算 · 40k-60k
  • 天美游戏-游戏产品战略经理

    腾讯 · 深圳市
    AI 估算 · 25k-40k
  • 微信支付-全栈开发工程师

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • 无畏契约手游-高级动效设计师-重构

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • 狩-后台开发-UE5 DS后台开发

    腾讯 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 大模型应用研发工程师 ( 电商广告方向 ) -【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 策略平台开发工程师-【算法引擎部】

    快手 · 北京市
    AI 估算 · 30k-45k
  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(Top1)-TikTok搜索

    字节跳动 · 北京市
    AI 估算 · 25k-50k

腾讯 的其他在招职位

  • 腾讯营销-海外广告联盟流量运营专家-北京

    腾讯 · 北京市
    AI 估算 · 40k-60k
  • 天美游戏-游戏产品战略经理

    腾讯 · 深圳市
    AI 估算 · 25k-40k
  • 微信支付-全栈开发工程师

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • 无畏契约手游-高级动效设计师-重构

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • 狩-后台开发-UE5 DS后台开发

    腾讯 · 北京市
    AI 估算 · 30k-50k

相似职位推荐

  • 大模型应用研发工程师 ( 电商广告方向 ) -【商业化】

    快手 · 北京市
    AI 估算 · 25k-45k
  • 策略平台开发工程师-【算法引擎部】

    快手 · 北京市
    AI 估算 · 30k-45k
  • 大模型算法工程师-商品治理

    字节跳动 · 北京市
    AI 估算 · 35k-60k
  • AI客户端开发工程师(应用研究方向)-集团信息系统

    字节跳动 · 上海市
    AI 估算 · 25k-45k
  • 后端开发工程师(Top1)-TikTok搜索

    字节跳动 · 北京市
    AI 估算 · 25k-50k