腾讯的微信读书-大模型推理优化工程师- NLP方向薪资是多少？

该职位薪资范围为 20k–40k（人民币/月）。

微信读书-大模型推理优化工程师- NLP方向的工作地点在哪里？

该职位工作地点位于北京市。工作形式为仅现场办公。

腾讯的微信读书-大模型推理优化工程师- NLP方向有什么任职要求？

该职位要求本科学历及初级经验工作经验。

腾讯

微信读书-大模型推理优化工程师- NLP方向

立即应聘

微信读书-大模型推理优化工程师- NLP方向

发布于 1 天前

普通员工/个人贡献者

北京市

初级经验

全职员工

仅现场办公

本科

软件工程

LLM

量化

TensorRT

推理优化

大模型

SGLang

vLLM

Kv Cache

动态批处理

AI 估算 · 20k–40k

大模型推理优化岗属于AI热门方向，腾讯北京薪资具有竞争力，该岗位要求1年经验，薪资范围适中偏上。

职位详情

关于这个职位

加入腾讯微信读书团队，专注于大模型（LLM）在长文本阅读场景下的推理优化

你将负责模型部署、量化、加速等关键任务，提升系统吞吐量和性能，跟踪前沿技术并沉淀可复用方案

适合对NLP和推理优化有热情、追求技术深度的工程师

最低要求

本科及以上学历，计算机相关专业，具备良好的算法、数据结构及操作系统基础

年及以上工业级项目开发经验，熟练掌握 Python，了解 Golang 优先，能独立完成推理相关的开发与调优工作

熟悉 Linux 环境开发，了解常见后端架构方案（RPC 框架、消息队列等），具备扎实的性能瓶颈定位与数据分析能力

有 SGLang/TensorRT//vLLM 等推理框架的使用经验

具备良好的代码习惯，沟通高效，有强烈的技术攻坚意愿与责任心

工作职责

负责微信读书长文本理解场景下大模型（LLM）的部署与推理优化工作，聚焦系统吞吐量（Throughput）及服务性能的极致调优

针对长文本理解的业务特性，开展大模型量化、推理加速等专项落地工作，提升模型在长上下文场景下的推理效率

跟踪大模型推理优化前沿技术（如投机解码、KV Cache 优化、动态批处理等），结合微信读书长文本阅读场景的业务需求开展技术预研与难点攻关，沉淀可复用的技术方案

AI 洞察

优缺点分析

优点

微信读书拥有海量用户场景，技术落地价值高，成果直接影响用户体验
大模型推理优化是当前AI基础设施的核心方向，市场人才稀缺，职业前景广阔
腾讯平台提供丰富的学习资源和业界领先的技术实践机会
长文本推理优化技术难度高，需要持续跟踪前沿论文并快速实验
系统性能调优往往耗时较长，需较强的耐心和问题定位能力

缺点 / 挑战

业务对延迟和吞吐要求严格，可能需要应对线上突发性能瓶颈
适合对NLP和大模型推理有浓厚兴趣、享受性能调优挑战、具备扎实后端功底的工程师

角色解读

技术深耕：从推理优化扩展到模型训练、部署全链路，成为AI Infra专家
架构升级：参与系统设计，逐步负责更大规模的分布式推理系统
团队管理：积累经验后带领推理优化小组，主导技术方向
负责微信读书中大模型在长文本场景的部署与推理加速，提升系统吞吐量和响应速度
开展模型量化、推理框架调优（如SGLang/vLLM）等专项工作，降低推理延迟
跟踪投机解码、KV Cache优化等前沿技术，进行技术预研和落地
扎实的Python编程能力，了解Golang更佳，能独立完成推理优化开发
熟悉Linux后端开发，掌握常见架构组件（RPC、消息队列）和性能分析工具
使用过至少一种推理框架（SGLang/TensorRT/vLLM），了解其原理

申请策略

在简历中量化你的优化成果（例如“推理吞吐提升30%”），用数据说话
面试时准备一个技术分享，展示你对推理优化某一技术点的深入理解
突出在大模型推理或部署方面的项目经验，如使用vLLM/SGLang进行过模型服务化
展示性能优化案例：量化、剪枝、批处理等技术带来的实际吞吐或延迟提升
强调系统性调优能力，包括性能分析工具（如perf, torch.profiler）的使用
如果缺乏推理框架经验，建议学习vLLM或SGLang官方文档并动手部署一个小模型
补充大模型基础知识：Transformer架构、注意力机制、KV Cache原理等

面试指南

对于原理问题：先给出概念定义，再结合实际业务场景说明如何应用和优化
对于项目问题：使用STAR法则（情境-任务-行动-结果），突出技术难点和个人贡献
请解释大模型推理中的KV Cache是什么，如何优化？
你如何衡量和优化推理系统的吞吐量与延迟？
对比vLLM和SGLang的异同，你在项目中为什么选择某个框架？
如何实现动态批处理？在长文本场景下有哪些注意事项？
请介绍你做过的一个推理优化项目，遇到的挑战和解决方案
复习Transformer和LLM基础知识，特别是推理阶段的优化技术（量化、投机解码等）

职位点评

综合评分

大厂AI核心岗，前沿技术栈，成长空间大，但现场办公且工作节奏可能较快。

更适合这类人

最适合追求技术成长、希望深耕大模型推理方向的工程师，愿意接受一定工作强度以换取前沿技能积累。

表现最好

成长发展

相对薄弱

工作生活

薪资福利75

成长发展90

工作生活50

使命价值70

薪资福利

75中等

腾讯薪资福利在行业内属于第一梯队，但该岗位未明确披露薪资范围，面试阶段可进一步沟通。

薪资信号未披露（AI估算：20K-40K/月）

成长发展

90较高

大模型推理优化是AI前沿技术，岗位要求跟踪最新论文并提供实践机会，成长空间极大。

技术前沿前沿/新兴技术

技术栈大模型、LLM、推理优化、量化、SGLang、vLLM、KV Cache、动态批处理

成长机会技术预研、难点攻关

业务类型profit_center

工作生活

50较低

腾讯北京通常要求现场办公，未提及弹性工作，大厂节奏可能较快。

工作模式仅现场办公

办公地点市区核心地段

加班情况未提及（无法判断）

使命价值

70中等

微信读书产品具有文化价值，优化推理能提升阅读体验，但岗位更偏技术实现，社会意义间接。

行业发展高速增长赛道

社会影响中性/一般

创新程度积极采用新技术

腾讯的其他在招职位

相似职位推荐

Watch Jobs

微信读书-大模型推理优化工程师- NLP方向

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

和平精英-高级关卡/战斗策划

微信-小程序测试开发工程师

《英雄联盟》/《无畏契约》-社区高级产品经理-产品策划

和平精英-游戏客户端开发工程师（Gameplay）

《金铲铲之战》-发行运营推广

Assoc, FrontEnd Eng, WRB Tech

算法专家TL（广告商业化-投放算法）

Deep Learning Compiler CI/Infrastructure Engineer

Deep Learning Performance Software Engineer

Software Architect, Autonomous Vehicles - Backend and AI Agents

腾讯的其他在招职位

和平精英-高级关卡/战斗策划

微信-小程序测试开发工程师

《英雄联盟》/《无畏契约》-社区高级产品经理-产品策划

和平精英-游戏客户端开发工程师（Gameplay）

《金铲铲之战》-发行运营推广

相似职位推荐

Assoc, FrontEnd Eng, WRB Tech

算法专家TL（广告商业化-投放算法）

Deep Learning Compiler CI/Infrastructure Engineer

Deep Learning Performance Software Engineer

Software Architect, Autonomous Vehicles - Backend and AI Agents

微信读书-大模型推理优化工程师- NLP方向

职位详情

关于这个职位

最低要求

工作职责

AI 洞察

优缺点分析

角色解读

申请策略

面试指南

职位点评

薪资福利

成长发展

工作生活

使命价值

腾讯 的其他在招职位

和平精英-高级关卡/战斗策划

微信-小程序测试开发工程师

《英雄联盟》/《无畏契约》-社区高级产品经理-产品策划

和平精英-游戏客户端开发工程师（Gameplay）

《金铲铲之战》-发行运营推广

相似职位推荐

Assoc, FrontEnd Eng, WRB Tech

算法专家TL（广告商业化-投放算法）

Deep Learning Compiler CI/Infrastructure Engineer

Deep Learning Performance Software Engineer

Software Architect, Autonomous Vehicles - Backend and AI Agents

腾讯的其他在招职位