腾讯的元宝-LLM大模型推理工程师薪资是多少？

该职位薪资范围为 25k–50k（人民币/月）。

元宝-LLM大模型推理工程师的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

腾讯的元宝-LLM大模型推理工程师有什么任职要求？

该职位要求本科学历及中级经验工作经验。

腾讯

元宝-LLM大模型推理工程师

立即应聘

元宝-LLM大模型推理工程师

发布于大约 2 个月前

普通员工/个人贡献者

深圳市

中级经验

全职员工

仅现场办公

本科

软件工程

并行计算

性能优化

模型量化

深度学习

CUDA

GPU

LLM

PyTorch

TensorRT-LLM

AI 估算 · 25k–50k

腾讯大模型核心岗位，技术深度高，深圳地区大厂薪资竞争力强，综合评估月薪范围合理。

职位详情

关于这个职位

作为腾讯元宝团队的LLM大模型推理工程师，你将负责开发和优化高性能推理引擎，通过GPU、CUDA等技术手段提升大模型推理效率

这是一个深度技术岗位，适合对AI系统工程和性能优化有热情的开发者

最低要求

本科及以上学历，计算机/电子/自动化/软件等相关专业，有AI工程优化经验的优先

熟练GPU的高性能计算优化技术，深入理解计算机体系结构，熟悉并行计算优化、访存优化，低比特计算等

具备丰富的基于CUDA的GPU性能优化经验

了解深度学习算法基本原理，熟悉神经网络基本架构和各算子计算方式，了解至少一种深度学习训练框架及其模型文件的解析，如PyTorch、TensorFlow

工作职责

负责开发和优化大模型推理框架

主要通过GPU、CUDA性能优化的手段，结合线上实际情况，优化高性能LLM推理引擎

负责大模型训练和推理前瞻性技术架构的调研和引入，技术方案不限于子图匹配、编译优化、模型量化等

优先资格

熟悉TensorRT-LLM、vLLM等，了解主流LLM模型，有LLM模型加速优化经验者优先

AI 洞察

优缺点分析

优点

腾讯大平台，核心业务团队，项目影响力大
聚焦大模型推理前沿技术，技术积累含金量高
薪资待遇优厚，股权激励等福利完善
技术深度要求极高，需持续学习GPU和AI领域最新进展
技术迭代快，需要快速适应新的框架和工具
适合对GPU高性能计算和AI推理有浓厚兴趣，追求技术深度，能接受高强度技术攻关的工程师

缺点 / 挑战

大模型推理性能优化极具挑战，工作强度可能较大

角色解读

技术纵深发展：成为LLM推理优化领域专家，主导核心技术攻关
架构师方向：参与大规模分布式推理系统设计，拓展系统架构能力
技术管理方向：积累经验后转向技术团队管理，带领团队突破技术难题
开发和优化大模型推理框架，提升推理速度和效率
利用GPU、CUDA进行性能优化，包括并行计算、访存优化、低比特计算等
研究前沿技术架构，如子图匹配、编译优化、模型量化，并引入实际项目中
精通GPU高性能计算优化，深入理解计算机体系结构
丰富的CUDA编程和优化经验
熟悉深度学习框架（PyTorch/TensorFlow）及模型解析
了解主流LLM模型和推理引擎（TensorRT-LLM、vLLM等）

申请策略

了解腾讯元宝产品线，思考大模型推理在应用中的挑战
准备一个完整的性能优化案例，从问题定位到优化效果的数据分析
突出GPU/CUDA性能优化项目经验，尤其是低比特计算、访存优化等
展示LLM推理引擎（如TensorRT-LLM、vLLM）的实践经验
强调深度学习模型优化和部署背景，包括量化、剪枝等
深入学习CUDA编程和GPU架构，掌握NVIDIA性能分析工具（Nsight）
动手实践LLM推理框架，阅读核心源码，尝试优化一个模型

面试指南

STAR法则：情境(Situation)、任务(Task)、行动(Action)、结果(Result)
先讲背景和目标，再讲具体技术方案和数据对比，最后总结学习收获
描述一次GPU性能优化的经历，你用了哪些技术手段？效果如何？
解释Flash Attention的原理及其对LLM推理的意义
如何优化一个Transformer模型的推理速度？请列出你的优化思路
TensorRT-LLM和vLLM的主要区别是什么？你如何选择？
什么是KV Cache？在LLM推理中如何处理？
复习CUDA编程和GPU架构知识，准备好性能分析工具使用经验

职位点评

综合评分

腾讯核心大模型推理岗，前沿技术栈，高成长但WLB一般

更适合这类人

适合追求技术深度和前沿领域、对薪资和成长有高要求，能接受一定工作强度的开发者。

表现最好

成长发展

相对薄弱

工作生活

薪资福利75

成长发展95

工作生活40

使命价值60

薪资福利

75中等

腾讯大厂薪资福利有竞争力，但JD未明确薪资水平，需在面试中确认具体包。

薪资信号未披露（AI估算：25K-50K/月）

成长发展

95较高

大模型推理是前沿技术领域，岗位深度高，对个人技术成长极为有利。

技术前沿前沿/新兴技术

技术栈LLM、GPU、CUDA、TensorRT-LLM、vLLM、PyTorch、深度学习、模型量化、编译优化

业务类型profit_center

工作生活

40较低

仅现场办公，未提及弹性工作，深圳互联网企业通常有加班文化，WLB一般。

工作模式仅现场办公

办公地点科技园/产业园

加班情况未提及（无法判断）

使命价值

60中等

大模型是高速增长赛道，但岗位偏技术实现，社会影响力中性。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

Watch Jobs

元宝-LLM大模型推理工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

腾讯的其他在招职位

《三角洲行动》-国服活动运营（世界观衍生）

支付产品经理-高级产品经理

GPU性能优化工程师

芯片设计工程师(北京/上海/深圳)

腾讯云应用性能优化工程师

相似职位推荐

软件开发工程师

数字钥匙软件开发工程师—上海

大模型平台后端工程师实习生

后端开发实习生

安全治理 AI 研发工程师

腾讯的其他在招职位

《三角洲行动》-国服活动运营（世界观衍生）

支付产品经理-高级产品经理

GPU性能优化工程师

芯片设计工程师(北京/上海/深圳)

腾讯云应用性能优化工程师

相似职位推荐

软件开发工程师

数字钥匙软件开发工程师—上海

大模型平台后端工程师实习生

后端开发实习生

安全治理 AI 研发工程师

元宝-LLM大模型推理工程师

职位详情

关于这个职位

最低要求

工作职责

优先资格

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

腾讯 的其他在招职位

《三角洲行动》-国服活动运营（世界观衍生）

支付产品经理-高级产品经理

GPU性能优化工程师

芯片设计工程师(北京/上海/深圳)

腾讯云应用性能优化工程师

相似职位推荐

软件开发工程师

数字钥匙软件开发工程师—上海

大模型平台后端工程师实习生

后端开发实习生

安全治理 AI 研发工程师

腾讯 的其他在招职位

《三角洲行动》-国服活动运营（世界观衍生）

支付产品经理-高级产品经理

GPU性能优化工程师

芯片设计工程师(北京/上海/深圳)

腾讯云应用性能优化工程师

相似职位推荐

软件开发工程师

数字钥匙软件开发工程师—上海

大模型平台后端工程师实习生

后端开发实习生

安全治理 AI 研发工程师

腾讯的其他在招职位

腾讯的其他在招职位