Tencent logo
腾讯
微信读书-大模型推理优化工程师- NLP方向

微信读书-大模型推理优化工程师- NLP方向

发布于 1 天前

普通员工/个人贡献者

北京市
初级经验
全职员工
仅现场办公
本科
软件工程
LLM
量化
TensorRT
推理优化
大模型
SGLang
vLLM
Kv Cache
动态批处理

AI 估算 · 20k–40k

大模型推理优化岗属于AI热门方向,腾讯北京薪资具有竞争力,该岗位要求1年经验,薪资范围适中偏上。

职位详情

关于这个职位

加入腾讯微信读书团队,专注于大模型(LLM)在长文本阅读场景下的推理优化

你将负责模型部署、量化、加速等关键任务,提升系统吞吐量和性能,跟踪前沿技术并沉淀可复用方案
适合对NLP和推理优化有热情、追求技术深度的工程师

最低要求

本科及以上学历,计算机相关专业,具备良好的算法、数据结构及操作系统基础

年及以上工业级项目开发经验,熟练掌握 Python,了解 Golang 优先,能独立完成推理相关的开发与调优工作
熟悉 Linux 环境开发,了解常见后端架构方案(RPC 框架、消息队列等),具备扎实的性能瓶颈定位与数据分析能力
有 SGLang/TensorRT//vLLM 等推理框架的使用经验
具备良好的代码习惯,沟通高效,有强烈的技术攻坚意愿与责任心

工作职责

负责微信读书长文本理解场景下大模型(LLM)的部署与推理优化工作,聚焦系统吞吐量(Throughput)及服务性能的极致调优

针对长文本理解的业务特性,开展大模型量化、推理加速等专项落地工作,提升模型在长上下文场景下的推理效率
跟踪大模型推理优化前沿技术(如投机解码、KV Cache 优化、动态批处理等),结合微信读书长文本阅读场景的业务需求开展技术预研与难点攻关,沉淀可复用的技术方案

AI 洞察

优缺点分析

优点

  • 微信读书拥有海量用户场景,技术落地价值高,成果直接影响用户体验
  • 大模型推理优化是当前AI基础设施的核心方向,市场人才稀缺,职业前景广阔
  • 腾讯平台提供丰富的学习资源和业界领先的技术实践机会
  • 长文本推理优化技术难度高,需要持续跟踪前沿论文并快速实验
  • 系统性能调优往往耗时较长,需较强的耐心和问题定位能力

缺点 / 挑战

  • 业务对延迟和吞吐要求严格,可能需要应对线上突发性能瓶颈
  • 适合对NLP和大模型推理有浓厚兴趣、享受性能调优挑战、具备扎实后端功底的工程师

角色解读

  • 技术深耕:从推理优化扩展到模型训练、部署全链路,成为AI Infra专家
  • 架构升级:参与系统设计,逐步负责更大规模的分布式推理系统
  • 团队管理:积累经验后带领推理优化小组,主导技术方向
  • 负责微信读书中大模型在长文本场景的部署与推理加速,提升系统吞吐量和响应速度
  • 开展模型量化、推理框架调优(如SGLang/vLLM)等专项工作,降低推理延迟
  • 跟踪投机解码、KV Cache优化等前沿技术,进行技术预研和落地
  • 扎实的Python编程能力,了解Golang更佳,能独立完成推理优化开发
  • 熟悉Linux后端开发,掌握常见架构组件(RPC、消息队列)和性能分析工具
  • 使用过至少一种推理框架(SGLang/TensorRT/vLLM),了解其原理

申请策略

  • 在简历中量化你的优化成果(例如“推理吞吐提升30%”),用数据说话
  • 面试时准备一个技术分享,展示你对推理优化某一技术点的深入理解
  • 突出在大模型推理或部署方面的项目经验,如使用vLLM/SGLang进行过模型服务化
  • 展示性能优化案例:量化、剪枝、批处理等技术带来的实际吞吐或延迟提升
  • 强调系统性调优能力,包括性能分析工具(如perf, torch.profiler)的使用
  • 如果缺乏推理框架经验,建议学习vLLM或SGLang官方文档并动手部署一个小模型
  • 补充大模型基础知识:Transformer架构、注意力机制、KV Cache原理等

面试指南

  • 对于原理问题:先给出概念定义,再结合实际业务场景说明如何应用和优化
  • 对于项目问题:使用STAR法则(情境-任务-行动-结果),突出技术难点和个人贡献
  • 请解释大模型推理中的KV Cache是什么,如何优化?
  • 你如何衡量和优化推理系统的吞吐量与延迟?
  • 对比vLLM和SGLang的异同,你在项目中为什么选择某个框架?
  • 如何实现动态批处理?在长文本场景下有哪些注意事项?
  • 请介绍你做过的一个推理优化项目,遇到的挑战和解决方案
  • 复习Transformer和LLM基础知识,特别是推理阶段的优化技术(量化、投机解码等)

职位点评

71
综合评分

大厂AI核心岗,前沿技术栈,成长空间大,但现场办公且工作节奏可能较快。

更适合这类人
最适合追求技术成长、希望深耕大模型推理方向的工程师,愿意接受一定工作强度以换取前沿技能积累。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展90
工作生活50
使命价值70

薪资福利

75中等

腾讯薪资福利在行业内属于第一梯队,但该岗位未明确披露薪资范围,面试阶段可进一步沟通。

薪资信号未披露(AI估算:20K-40K/月)

成长发展

90较高

大模型推理优化是AI前沿技术,岗位要求跟踪最新论文并提供实践机会,成长空间极大。

技术前沿前沿/新兴技术
技术栈大模型、LLM、推理优化、量化、SGLang、vLLM、KV Cache、动态批处理
成长机会技术预研、难点攻关
业务类型profit_center

工作生活

50较低

腾讯北京通常要求现场办公,未提及弹性工作,大厂节奏可能较快。

工作模式仅现场办公
办公地点市区核心地段
加班情况未提及(无法判断)

使命价值

70中等

微信读书产品具有文化价值,优化推理能提升阅读体验,但岗位更偏技术实现,社会意义间接。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs