Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告招聘观察探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
微信搜索-AI Infra 工程师-大模型推理方向(深圳)(广州)
立即应聘

微信搜索-AI Infra 工程师-大模型推理方向(深圳)(广州)

发布于 大约 16 小时前

普通员工/个人贡献者

深圳市 / 广州市
高级经验
全职员工
仅现场办公
学历未注明
信息技术与基础设施
LLM
VLM
推理引擎
SGLang
vLLM
TRT-LLM
算子融合
量化策略
分布式Kv缓存

AI 估算 · 30k–60k

腾讯大厂高级AI Infra岗位,深圳/广州薪资水平高,技能稀缺,市场竞争力强。

职位详情

关于这个职位

作为微信搜索团队的AI Infra工程师,你将专注于大模型推理引擎的开发和优化,为AI搜索和智能Agent等应用构建高性能推理基础架构

你需要与算法同学深度合作,将前沿技术落地,推动搜索系统的代际升级
这是一个技术挑战大、与顶尖团队协作的岗位

最低要求

熟悉AI基础硬件设置,有真实的大规模推理系统的设计开发部署经验

熟悉各种主流LLM/VLM的模型结构,具有vllm/sglang/TRT-llm等推理引擎优化实践经验
熟悉LLM推理常用加速方法(算子融合、量化策略、动态批处理、分布式KV缓存优化等)
有针对真实场景问题的LLM模型结构和设计优化经验

工作职责

负责开发和优化LLM,VLM等大模型的推理引擎,构建适合AI Search, 智能Agent相关领域大规模落地应用中的推理基础架构

紧跟LLM Infra领域的前沿技术演进突破,将合适成果落地于实际应用
与搜索算法同学深度合作,联合优化,设计实现能够给大型搜索系统带来代际更迭的大模型

AI 洞察

优缺点分析

优点

  • 大厂平台:腾讯微信搜索业务,资源丰富,影响力大
  • 团队协作:与顶尖算法和工程团队共事,成长迅速
  • 薪资优厚:高级岗位薪酬竞争力强,福利完善
  • 技术迭代快:需要持续学习最新论文和框架,保持技术敏感度
  • 工作强度较大:涉及线上系统优化和紧急问题排查,可能加班

缺点 / 挑战

  • 顶级技术挑战:参与大模型推理前沿,技术积累深厚
  • 竞争激烈:大厂内部对绩效和产出要求高,压力不小
  • 适合热爱底层性能优化、对大模型推理充满热情、乐于挑战且能快速学习的技术极客

角色解读

  • 技术深耕:成为推理系统架构专家,主导下一代推理框架的设计
  • 横向扩展:转向AI系统全栈,涉及训练、部署、集群调度等
  • 管理路线:带领技术团队,负责整体AI基础设施方向
  • 负责开发和优化LLM/VLM推理引擎,提升AI搜索和智能Agent的推理性能
  • 跟踪前沿技术(如vLLM、TensorRT-LLM),并将优化方案落地到实际产品中
  • 与搜索算法团队紧密协作,对模型结构和推理流程进行联合优化
  • 深入理解LLM/VLM模型架构和推理原理,具备大规模推理系统实战经验
  • 精通至少一种推理引擎(vllm/sglang/TRT-llm),熟悉加速方法如算子融合、量化、动态批处理
  • 扎实的编程能力(C++/CUDA等),能够进行低层次性能优化

申请策略

  • 面试前了解微信搜索业务场景,思考AI搜索对推理系统的特殊需求
  • 准备一个端到端的推理优化项目经验,从问题发现到解决的全过程
  • 突出大规模推理系统的设计部署经验,量化优化效果(如延迟降低、吞吐提升)
  • 详细说明对vllm/sglang等源码的贡献或二次开发经历
  • 展示与算法团队联合优化的案例,体现跨团队协作能力
  • 如有CUDA/汇编优化经验,务必重点提及
  • 深入学习NVIDIA GPU架构和CUDA编程,掌握性能分析工具(Nsight)
  • 阅读并复现最新推理优化论文(如FlashAttention、PagedAttention等)

面试指南

  • 采用STAR法则描述项目:情境-目标-行动-结果,突显技术深度和量化成果
  • 对于比较类问题,先阐述共同点,再差异点,最后结合场景给出推荐
  • 涉及原理问题时,从数学基础到工程实现逐步展开,展现系统理解
  • 请描述你优化过的最大规模推理系统,遇到了哪些挑战,如何解决?
  • 比较vllm和TensorRT-LLM的优缺点,在什么场景下选择哪个?
  • 如何实现LLM推理的量化?请详细说明PTQ和QAT的区别及适用场景
  • 针对长序列推理,如何优化KV缓存?请介绍PagedAttention的原理
  • 如何诊断推理系统的性能瓶颈?请说明排查步骤和工具

匹配度报告

75
综合匹配度

大厂AI Infra前沿岗,薪资高、技术强、WLB一般,适合技术极客。

适合人群
最适合追求技术成长和前沿挑战的发展型求职者,愿意付出高强度工作换取快速进步。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展95
工作生活50
使命价值70

薪资福利匹配

85较高

腾讯提供具有竞争力的薪酬和福利(五险一金、年终奖、股票等),作为已上市公司稳定性高。薪资信号为市场水准以上。

薪资信号偏高 (30K-60K/月)
福利待遇五险一金、年终奖

成长发展匹配

95较高

该职位处于AI大模型推理的最前沿,技术迭代快,成长空间极大。JD明确要求了解前沿技术,且与顶尖团队合作,属于高速增长赛道。

技术前沿前沿/新兴技术
技术栈LLM、VLM、vllm、sglang、TRT-llm、算子融合、量化策略
成长机会紧跟前沿技术演进、生态共创者
业务类型profit_center

工作生活匹配

50较低

工作地点在深圳/广州,需要现场办公,未提及远程或弹性工时。大厂AI Infra岗通常工作强度较大,可能加班。WLB一般。

工作模式仅现场办公
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

微信搜索服务亿万用户,大模型应用提升信息获取效率,具有一定社会价值。行业属于高速增长赛道,创新性强。

行业发展高速增长赛道
社会影响正向社会影响力较高
使命信号生态共创者
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 微信搜索-Agent算法专家

    腾讯 · 北京市
    AI 估算 · 60k-80k
  • Project T-游戏战斗策划(AI方向)

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • OG项目组-资深叙事设计师

    腾讯 · 深圳市
    AI 估算 · 20k-40k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

相似职位推荐

  • 信息安全运营工程师-数据安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-8k
  • 信息安全运营工程师-办公安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-7k
  • SJZT数据开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 20k-35k
  • 信息安全运营工程师-安全运营方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 3k-5k
  • Devops Engineer(上海)

    舍弗勒 · 上海市
    AI 估算 · 20k-35k

腾讯 的其他在招职位

  • 微信搜索-Agent算法专家

    腾讯 · 北京市
    AI 估算 · 60k-80k
  • Project T-游戏战斗策划(AI方向)

    腾讯 · 深圳市
    AI 估算 · 20k-35k
  • OG项目组-资深叙事设计师

    腾讯 · 深圳市
    AI 估算 · 20k-40k
  • 微信-基础功能后台开发

    腾讯 · 广州市
    AI 估算 · 20k-35k
  • 微信-AI应用开发工程师

    腾讯 · 广州市
    AI 估算 · 20k-40k

相似职位推荐

  • 信息安全运营工程师-数据安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-8k
  • 信息安全运营工程师-办公安全方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 4k-7k
  • SJZT数据开发工程师

    顺丰速运 · 深圳市
    AI 估算 · 20k-35k
  • 信息安全运营工程师-安全运营方向-实习生(顺丰科技)

    顺丰速运 · 深圳市
    AI 估算 · 3k-5k
  • Devops Engineer(上海)

    舍弗勒 · 上海市
    AI 估算 · 20k-35k