Tencent logo
腾讯
微信读书/输入法/秒剪-大模型后台开发工程师

微信读书/输入法/秒剪-大模型后台开发工程师

发布于 大约 15 小时前

普通员工/个人贡献者

北京市
中级经验
全职员工
仅现场办公
本科
软件工程
分布式系统
GO
高性能计算
TensorRT
vLLM
大模型推理

AI 估算 · 25k–45k

大模型方向火热,技术门槛高,腾讯薪资有竞争力,北京一线城市薪资较高。

职位详情

关于这个职位

该职位是腾讯微信团队的大模型后端开发岗位,负责微信输入法等产品的核心系统开发、高可用架构保障以及大模型推理加速

你将深入参与异构模型调度、高性能检索、多模态数据处理等技术难点攻关,并有机会接触前沿的LLM推理优化
适合有扎实C++/Go功底、对AI基础设施感兴趣的后端工程师

最低要求

基础扎实:本科及以上学历,计算机相关专业,具备深厚的算法、数据结构及操作系统底蕴

工程实战:1 年及以上工业级项目开发经验,精通 C++ 或 Go(有高性能并发编程经验者优先),熟悉 Python 脚本语言
技术广度:熟悉 Linux 环境下的系统开发,掌握常见的后端架构方案(如 RPC 框架、消息队列、分布式存储等),具备扎实的数据分析能力
综合素养:追求优雅的代码设计,具备良好的文档习惯、严谨的单测意识及版本管理能力(Git)
沟通高效,面对复杂技术挑战有强烈的攻坚意愿和责任心

工作职责

核心系统开发:深度参与输入法核心业务逻辑的设计与研发,攻坚异构模型调度、高性能检索、多模态数据处理等技术难点

高可用保障:构建并维护具备高容错能力的分布式后端架构,完善全链路监控、自动化全量/灰度发布及故障自愈机制
大模型推理加速:负责微信输入法大模型(LLM)的后端服务部署,针对模型推理的端到端时延(Latency)、系统吞吐量(Throughput)及服务稳定性进行极致优化
工程效率提升:研发自动化数据分析系统与中台工具,通过工程化手段提升策略迭代与模型部署的效率
前沿技术预研:参与新技术调研以及探索,以及项目特定方向的重点、难点开发工作

优先资格

加分项(AI 经验):具有 TensorRT / ONNX Runtime / vLLM 等推理框架的使用经验,或具备大模型量化、算子优化、模型加速等实际落地经验者优先

AI 洞察

优缺点分析

优点

  • 大模型领域前沿,技术积累价值高,行业需求旺盛
  • 团队技术氛围浓厚,能接触核心系统的设计与优化
  • 大模型推理优化难度大,需要持续学习底层原理和工具
  • 高性能系统对代码质量和工程规范要求极高

缺点 / 挑战

  • 腾讯微信平台,海量用户场景,挑战性与成就感并存
  • 大厂节奏较快,可能面临较大工作压力和项目排期
  • 适合对AI基础设施和系统性能优化有热情、喜欢技术挑战、愿意在高压环境中快速成长的后端工程师

角色解读

  • 向大模型推理优化专家方向发展,深入GPU底层优化
  • 可转向AI系统架构师或技术Leader,负责更大规模系统设计
  • 在微信生态内积累底层平台经验,未来可跨团队发展
  • 负责输入法核心业务系统开发,包括异构模型调度、高性能检索等
  • 构建高可用分布式后端架构与全链路监控体系
  • 优化大模型推理延迟和吞吐量,端到端提升服务质量
  • 开发自动化中台工具,提升模型部署和策略迭代效率
  • 精通C++或Go,具备高性能并发编程经验
  • 熟悉Linux系统开发与常见后端架构(RPC、消息队列、分布式存储)
  • 了解大模型推理框架如TensorRT、vLLM,有GPU优化经验更佳
  • 具备数据分析能力,能够用工程化手段解决效率问题

申请策略

  • 了解微信输入法产品特点,思考如何通过技术优化用户体验
  • 准备1-2个系统设计或性能优化的案例,展示解决问题的思路
  • 突出C++/Go后端项目经验,尤其是高并发、分布式系统案例
  • 如有大模型推理或GPU优化经验(如TensorRT、vLLM),要重点展示效果
  • 体现系统设计能力,如架构图、性能优化数据等
  • 补充大模型推理框架的使用经验,可上手vLLM或TensorRT官方示例
  • 学习CUDA编程和模型量化知识,提升对GPU优化的理解

面试指南

  • 对于性能优化问题,采用“测量-分析-优化-验证”的迭代框架,先定位瓶颈再针对性优化
  • 对于系统设计问题,先明确需求(功能/非功能),然后选型(框架、组件),最后考虑扩展性和容错
  • 如何优化大模型推理的延迟?请从系统层面给出方案
  • 设计一个高可用的分布式后端系统,考虑故障转移与监控
  • 谈谈你对C++内存管理和并发编程的理解
  • 描述一次你遇到的性能瓶颈问题,如何定位和解决的?
  • 复习C++/Go并发编程、常见设计模式和分布式系统理论
  • 了解主流大模型推理方案(如vLLM连续批处理、TensorRT INT8量化)

职位点评

70
综合评分

腾讯大模型后端,前沿技术栈,薪资竞争力强,WLB一般。

更适合这类人
适合重视技术成长和前沿方向,对工作生活平衡要求不高的求职者。
表现最好
成长发展
相对薄弱
工作生活
薪资福利75
成长发展85
工作生活50
使命价值70

薪资福利

75中等

薪资在行业有竞争力,但JD未明确具体数字,依赖于公司品牌和行业水平。

薪资信号未披露(AI估算:25K-45K/月)

成长发展

85较高

技术非常前沿,聚焦大模型推理优化,能积累宝贵的AI工程经验,成长路径清晰。

技术前沿前沿/新兴技术
技术栈C++、Go、TensorRT、vLLM、大模型、分布式系统
业务类型ambiguous

工作生活

50较低

仅现场办公,JD未提WLB,大厂工作强度通常较高,生活平衡一般。

工作模式仅现场办公
办公地点未明确
加班情况未提及(无法判断)

使命价值

70中等

AI大模型行业高速增长,但职位偏向技术实现,社会影响力中等。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs