Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
QClaw-端侧AI模型推理加速专家(深圳/北京/上海)
立即应聘

QClaw-端侧AI模型推理加速专家(深圳/北京/上海)

发布于 大约 9 小时前

普通员工/个人贡献者

深圳市
高级经验
全职员工
仅现场办公
本科
GPU
模型蒸馏
NPU
端侧推理
Llama.Cpp
量化压缩
Amd Ryzen Ai

AI 估算 · 40k–70k

腾讯高级算法专家岗,端侧AI为前沿技术,市场稀缺,薪资竞争力强,含年终奖估算。

职位详情

关于这个职位

作为腾讯端侧AI模型推理加速专家,你将专注于办公PC和手机消费级终端的AI大模型推理优化

负责端侧推理引擎的性能调优,运用模型蒸馏、量化压缩等技术降低延迟和内存占用,并协调异构算力最大化设备性能
这是一个技术深度高、前沿性强的岗位,适合对端侧AI推理有浓厚兴趣的资深工程师

最低要求

熟悉 PC、手机端 CPU/GPU/NPU 异构开发,掌握 Intel OpenVINO、AMD Ryzen AI、移动端 NPU 加速技术,具备端侧推理加速实战经验

深入理解大模型基础架构,熟悉端侧推理核心性能瓶颈,精通量化、算子优化、内存调度、模型蒸馏等主流轻量化优化方案
熟练掌握 C/C++、Python,熟悉 Windows 与移动端开发环境,具备端侧模型编译、调试与部署能力
熟练使用 llama.cpp、移动端推理框架、本地 PC 推理服务等主流端侧推理组件,精通本地大模型完整部署流程
能够独立解决 PC、手机端推理卡顿、内存溢出、量化精度损失、启动慢等线上实际问题
工作踏实主动,具备良好跨团队沟通能力,具备较强技术钻研与落地能力

工作职责

聚焦办公 PC、手机消费级终端大模型推理优化,负责端侧推理引擎性能调优,保障本地离线大模型平稳高效运行

运用模型蒸馏、量化压缩、KV 缓存优化等轻量化技术,在保证效果前提下,降低端侧推理延迟、内存占用与硬件功耗
负责端侧模型格式转换、算子适配与PC / 手机异构算力调度,充分调用 CPU、独显、端侧 NPU 算力,最大化设备推理性能
对接 Intel、AMD 桌面端 AI 生态,适配本地推理服务框架,完成与上层业务框架快速集成落地
梳理 PC 与手机端推理性能瓶颈,输出标准化优化方案,协同团队完成本地大模型方案规模化落地
持续跟进桌面端、移动端轻量化推理前沿技术,优化本地离线推理体验

AI 洞察

优缺点分析

优点

  • 端侧AI推理是当前最热门的AI方向之一,技术含量高,职业前景广阔
  • 腾讯拥有丰富的业务场景和海量用户,技术影响力大
  • 团队氛围注重技术创新,鼓励探索前沿技术,个人成长快
  • 需要对硬件底层有深入理解,学习曲线陡峭,技术难度高
  • 端侧资源受限,优化任务复杂,需要较强的解决实际问题的能力
  • 跨团队沟通协调多,需要同时对接多个硬件和软件生态

缺点 / 挑战

  • 适合对AI推理和系统优化有浓厚兴趣、具备扎实C/C++功底和硬件知识的资深工程师,喜欢挑战性能极限

角色解读

  • 在腾讯深耕端侧AI推理,成为该领域技术专家,影响亿万用户
  • 向AI系统架构师发展,主导下一代端侧推理平台的设计
  • 有机会转向产品技术负责人,将技术能力转化为商业价值
  • 负责办公PC和手机终端的端侧大模型推理性能优化,使用蒸馏、量化等技术降低延迟和功耗
  • 协调CPU、GPU、NPU异构算力,优化推理引擎,保障本地大模型高效运行
  • 对接Intel、AMD的AI生态,适配本地推理服务框架,推动方案落地
  • 持续跟踪端侧推理前沿技术,输出标准化优化方案,解决实际线上问题
  • 精通C/C++、Python,熟悉Windows和移动端开发环境
  • 深入理解大模型架构,掌握量化、蒸馏、算子优化、内存调度等轻量化技术
  • 熟悉OpenVINO、AMD Ryzen AI、移动端NPU加速等异构开发技术
  • 熟练使用llama.cpp等端侧推理框架,具备完整部署和调试能力

申请策略

  • 准备一个端侧推理优化的完整项目复盘,从问题到方案到效果
  • 关注腾讯在端侧AI的最新动态,面试时展现对业务方向的理解
  • 突出端侧推理加速项目经验,如使用量化、蒸馏优化模型的具体成果
  • 展示异构开发经历,特别是OpenVINO、AMD Ryzen AI或移动端NPU的实际应用
  • 强调性能优化案例,包括延迟降低、内存优化等量化数据
  • 深入学习llama.cpp等开源推理框架源码,掌握其性能优化技巧
  • 补充对主流移动端NPU(如高通、联发科)的加速库了解

面试指南

  • 技术深度问题可遵循STAR法则:情境-任务-行动-结果,突出量化数据和挑战
  • 对比分析问题可采用优劣对比法,先列出方案,再比较适用场景
  • 请介绍你做过的一个端侧推理优化项目,具体采用了哪些技术?
  • 如何平衡模型量化带来的精度损失和性能提升?
  • 在异构计算中,如何调度CPU、GPU、NPU以最大化性能?
  • 当你遇到端侧推理内存溢出时,如何定位和解决?
  • 对llama.cpp的架构了解多少?如何对其进行定制优化?
  • 复习大模型基础架构(Transformer、KV Cache等),准备量化和蒸馏算法细节

匹配度报告

74
综合匹配度

腾讯端侧AI推理专家,前沿技术栈、薪资待遇优厚,但工作生活平衡可能性较低。

适合人群
最适合追求技术深度和职业发展的求职者,对WLB要求不高,愿意在高压力下快速成长。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

腾讯作为上市巨头,薪资待遇行业领先,福利完善(五险一金、年终奖等),但JD未明确薪资范围,综合判断薪资水平偏高。

薪资信号未披露(AI估算:40K-70K/月)

成长发展匹配

90较高

该岗位专注于端侧AI推理前沿技术,涉及量化、蒸馏、异构计算等新兴领域,技术成长空间极大,且腾讯内部有完善的晋升通道和技术交流机制。

技术前沿前沿/新兴技术
技术栈端侧推理、模型蒸馏、量化压缩、异构计算、OpenVINO、NPU
业务类型ambiguous

工作生活匹配

50较低

JD未提及WLB,互联网大厂通常工作强度较高,且地点为深圳/北京/上海,通勤可能较长,但未明确说明加班情况。

工作模式未明确
办公地点未明确
加班情况未提及(无法判断)

使命价值匹配

70中等

端侧AI推理赋能消费级设备,提升用户AI体验,具有较高的行业影响力;但JD未强调社会使命,更多是技术优化。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 腾讯营销-搜索营销匹配策略高级产品经理

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 腾讯视频-动漫市场营销

    腾讯 · 北京市
    AI 估算 · 18k-35k
  • 安全平台中台高级产品经理

    腾讯 · 成都市
    AI 估算 · 30k-45k
  • 《王者荣耀》资深3D特效设计师

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 产品体验设计师

    腾讯 · 深圳市
    AI 估算 · 15k-25k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • 资深后端研发工程师(物流方向)-中国交易与广告

    字节跳动 · 北京市
    AI 估算 · 35k-55k

腾讯 的其他在招职位

  • 腾讯营销-搜索营销匹配策略高级产品经理

    腾讯 · 深圳市
    AI 估算 · 30k-60k
  • 腾讯视频-动漫市场营销

    腾讯 · 北京市
    AI 估算 · 18k-35k
  • 安全平台中台高级产品经理

    腾讯 · 成都市
    AI 估算 · 30k-45k
  • 《王者荣耀》资深3D特效设计师

    腾讯 · 深圳市
    AI 估算 · 30k-50k
  • 产品体验设计师

    腾讯 · 深圳市
    AI 估算 · 15k-25k

相似职位推荐

  • Java开发实习生-【主站用增方向】

    快手 · 北京市
    AI 估算 · 4k-6k
  • 高级/资深后端开发工程师-Commercial AI

    字节跳动 · 北京市
    AI 估算 · 30k-60k
  • 算法工程师(搜索)-今日头条

    字节跳动 · 北京市
    AI 估算 · 30k-55k
  • 前端开发工程师-计算

    字节跳动 · 北京市
    AI 估算 · 25k-50k
  • 资深后端研发工程师(物流方向)-中国交易与广告

    字节跳动 · 北京市
    AI 估算 · 35k-55k