
腾讯
微信读书-大模型推理优化工程师- NLP方向
微信读书-大模型推理优化工程师- NLP方向
发布于 1 天前普通员工/个人贡献者
北京市
初级经验
全职员工
仅现场办公
本科
软件工程
LLM
量化
TensorRT
推理优化
大模型
SGLang
vLLM
Kv Cache
动态批处理
AI 估算 · 20k–40k
大模型推理优化岗属于AI热门方向,腾讯北京薪资具有竞争力,该岗位要求1年经验,薪资范围适中偏上。
职位详情
关于这个职位
加入腾讯微信读书团队,专注于大模型(LLM)在长文本阅读场景下的推理优化
你将负责模型部署、量化、加速等关键任务,提升系统吞吐量和性能,跟踪前沿技术并沉淀可复用方案
适合对NLP和推理优化有热情、追求技术深度的工程师
最低要求
本科及以上学历,计算机相关专业,具备良好的算法、数据结构及操作系统基础
年及以上工业级项目开发经验,熟练掌握 Python,了解 Golang 优先,能独立完成推理相关的开发与调优工作
熟悉 Linux 环境开发,了解常见后端架构方案(RPC 框架、消息队列等),具备扎实的性能瓶颈定位与数据分析能力
有 SGLang/TensorRT//vLLM 等推理框架的使用经验
具备良好的代码习惯,沟通高效,有强烈的技术攻坚意愿与责任心
工作职责
负责微信读书长文本理解场景下大模型(LLM)的部署与推理优化工作,聚焦系统吞吐量(Throughput)及服务性能的极致调优
针对长文本理解的业务特性,开展大模型量化、推理加速等专项落地工作,提升模型在长上下文场景下的推理效率
跟踪大模型推理优化前沿技术(如投机解码、KV Cache 优化、动态批处理等),结合微信读书长文本阅读场景的业务需求开展技术预研与难点攻关,沉淀可复用的技术方案
AI 洞察
优缺点分析
优点
- 微信读书拥有海量用户场景,技术落地价值高,成果直接影响用户体验
- 大模型推理优化是当前AI基础设施的核心方向,市场人才稀缺,职业前景广阔
- 腾讯平台提供丰富的学习资源和业界领先的技术实践机会
- 长文本推理优化技术难度高,需要持续跟踪前沿论文并快速实验
- 系统性能调优往往耗时较长,需较强的耐心和问题定位能力
缺点 / 挑战
- 业务对延迟和吞吐要求严格,可能需要应对线上突发性能瓶颈
- 适合对NLP和大模型推理有浓厚兴趣、享受性能调优挑战、具备扎实后端功底的工程师
角色解读
- 技术深耕:从推理优化扩展到模型训练、部署全链路,成为AI Infra专家
- 架构升级:参与系统设计,逐步负责更大规模的分布式推理系统
- 团队管理:积累经验后带领推理优化小组,主导技术方向
- 负责微信读书中大模型在长文本场景的部署与推理加速,提升系统吞吐量和响应速度
- 开展模型量化、推理框架调优(如SGLang/vLLM)等专项工作,降低推理延迟
- 跟踪投机解码、KV Cache优化等前沿技术,进行技术预研和落地
- 扎实的Python编程能力,了解Golang更佳,能独立完成推理优化开发
- 熟悉Linux后端开发,掌握常见架构组件(RPC、消息队列)和性能分析工具
- 使用过至少一种推理框架(SGLang/TensorRT/vLLM),了解其原理
申请策略
- 在简历中量化你的优化成果(例如“推理吞吐提升30%”),用数据说话
- 面试时准备一个技术分享,展示你对推理优化某一技术点的深入理解
- 突出在大模型推理或部署方面的项目经验,如使用vLLM/SGLang进行过模型服务化
- 展示性能优化案例:量化、剪枝、批处理等技术带来的实际吞吐或延迟提升
- 强调系统性调优能力,包括性能分析工具(如perf, torch.profiler)的使用
- 如果缺乏推理框架经验,建议学习vLLM或SGLang官方文档并动手部署一个小模型
- 补充大模型基础知识:Transformer架构、注意力机制、KV Cache原理等
面试指南
- 对于原理问题:先给出概念定义,再结合实际业务场景说明如何应用和优化
- 对于项目问题:使用STAR法则(情境-任务-行动-结果),突出技术难点和个人贡献
- 请解释大模型推理中的KV Cache是什么,如何优化?
- 你如何衡量和优化推理系统的吞吐量与延迟?
- 对比vLLM和SGLang的异同,你在项目中为什么选择某个框架?
- 如何实现动态批处理?在长文本场景下有哪些注意事项?
- 请介绍你做过的一个推理优化项目,遇到的挑战和解决方案
- 复习Transformer和LLM基础知识,特别是推理阶段的优化技术(量化、投机解码等)
职位点评
71
综合评分
大厂AI核心岗,前沿技术栈,成长空间大,但现场办公且工作节奏可能较快。
更适合这类人
最适合追求技术成长、希望深耕大模型推理方向的工程师,愿意接受一定工作强度以换取前沿技能积累。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展90
工作生活50
使命价值70
薪资福利
75中等
腾讯薪资福利在行业内属于第一梯队,但该岗位未明确披露薪资范围,面试阶段可进一步沟通。
薪资信号未披露(AI估算:20K-40K/月)
成长发展
90较高
大模型推理优化是AI前沿技术,岗位要求跟踪最新论文并提供实践机会,成长空间极大。
技术前沿前沿/新兴技术
技术栈大模型、LLM、推理优化、量化、SGLang、vLLM、KV Cache、动态批处理
成长机会技术预研、难点攻关
业务类型profit_center
工作生活
50较低
腾讯北京通常要求现场办公,未提及弹性工作,大厂节奏可能较快。
工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)
使命价值
70中等
微信读书产品具有文化价值,优化推理能提升阅读体验,但岗位更偏技术实现,社会意义间接。
行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
腾讯 的其他在招职位
相似职位推荐
Assoc, FrontEnd Eng, WRB Tech
渣打银行 · 天津市AI 估算 · 15k-25k算法专家TL(广告商业化-投放算法)
希音 · 广州市AI 估算 · 50k-80kDeep Learning Compiler CI/Infrastructure Engineer
英伟达 · 上海市AI 估算 · 30k-60kDeep Learning Performance Software Engineer
英伟达 · 上海市AI 估算 · 35k-65kSoftware Architect, Autonomous Vehicles - Backend and AI Agents
英伟达 · 深圳市AI 估算 · 40k-70k
Watch Jobs