Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Tencent logo
腾讯
Omni模型推理优化工程师
立即应聘

Omni模型推理优化工程师

发布于 大约 17 小时前

普通员工/个人贡献者

深圳市
中级经验
全职员工
仅现场办公
学历未注明
PyTorch
GPU优化
CUDA
TensorRT
SGLang
vLLM
DiT

AI 估算 · 35k–55k

腾讯大厂高级算法工程师薪资水准,结合AI推理优化稀缺技能,市场竞争力强。

职位详情

关于这个职位

该职位负责构建全模态端到端推理的后台架构,优化GPU计算任务,提升推理效率

你将参与Pytorch/CUDA相关开发,涉及编译优化、并行计算和算子优化,使用TensorRT/SGLang/vLLM等框架
适合对AI推理有深入研究的技术人才

最低要求

熟练掌握C/C++或Python,有CUDA开发经验,了解TensorRT/SGLang/vLLM等推理框架

熟悉计算机体系结构,对GPU、CPU等有比较深刻的理解
熟悉Transformers/DiT等主流模型原理
良好的团队协作能力,对技术有热情,有良好的动手实现能力

工作职责

负责构建全模态端到端推理的后台架构,并推进性能优化和稳定性提升

针对Pytorch/CUDA相关GPU计算任务,结合编译优化、并行计算优化、算子优化等,持续提升推理效率

优先资格

在vLLM/vLLM-Omni/SGLang等开源推理框架改造优化方面有经验者优先

在推理框架开源社区有贡献者优先

AI 洞察

优缺点分析

优点

  • 站在AI应用前沿,接触最新多模态模型与推理技术,技能积累扎实
  • 腾讯提供海量业务场景和海量GPU资源,实践机会丰富
  • 薪资待遇优厚,大厂福利完善,股票期权等长期回报可观
  • 技术难度高,需要深入掌握CUDA、计算机体系结构等底层知识
  • AI领域迭代快,需要持续学习新框架和新模型,保持技术敏感度
  • 适合对AI推理性能有浓厚兴趣、具备底层系统优化能力的技术极客,尤其是有开源框架贡献经验或GPU优化经验的工程师

缺点 / 挑战

  • 工作强度较大,可能面临紧急性能优化和线上问题排查压力

角色解读

  • 技术深耕:成为GPU计算与推理优化领域的专家,主导核心模块演进
  • 架构拓展:从单模型优化到全模态、多卡分布式推理架构设计
  • 团队领导:积累经验后担任技术负责人,带领推理优化团队
  • 设计并构建全模态端到端推理后台架构,涵盖多模态模型的推理引擎
  • 针对GPU计算任务进行性能优化,包括编译优化、并行计算和算子融合
  • 改造和优化开源推理框架如vLLM、SGLang,提升大模型推理效率
  • 推进推理服务的稳定性与可扩展性,支撑大规模业务应用
  • 精通C/C++或Python,具备CUDA编程及GPU性能调优经验
  • 深入理解计算机体系结构,熟悉GPU/CPU工作原理
  • 熟悉主流深度学习模型(Transformers/DiT)原理,有模型推理部署经验
  • 熟悉TensorRT/vLLM/SGLang等推理框架,有开源贡献经验更佳

申请策略

  • 在简历中明确提及开源贡献的链接和个人GitHub账号,展示技术热情
  • 面试前了解腾讯AI Lab或相关推理团队的业务方向,结合自身经验提前思考优化方案
  • 突出CUDA编程和GPU性能优化项目经历,展示具体优化效果(如加速比、延迟下降)
  • 强调对vLLM/SGLang等开源框架的贡献或改造经验,附上代码仓库或PR链接
  • 展示在Transformers/DiT等模型推理部署方面的实战案例,包括端到端系统设计
  • 如有论文或技术博客,提及相关计算机体系结构或编译优化成果
  • 系统学习CUDA编程模型和GPU架构(如官方文档、Coursera课程)
  • 实践vLLM/SGLang框架源码,尝试提交简单优化PR以积累经验

面试指南

  • 结构化回答:先明确问题核心(延迟/吞吐/资源约束),再分点提出方案,每条附带原理和预期效果
  • 结合项目经验:用STAR法则(情境-任务-行动-结果)介绍亲身优化案例
  • 展现系统思维:从模型、硬件、框架、工程部署全链路考虑,不局限于单点优化
  • 如何优化一个基于PyTorch的Transformer模型的推理延迟?
  • 解释CUDA中warp divergence概念以及如何避免?
  • 设计一个多模态模型(如图文)的端到端推理服务架构
  • 你对vLLM的PageAttention机制了解多少?可能的优化点?
  • 如何在推理中平衡吞吐量和延迟?给出具体策略

匹配度报告

74
综合匹配度

腾讯大厂,AI推理优化前沿技术岗,高薪高成长,但工作强度大,生活平衡一般。

适合人群
最适合重视技术成长和薪资回报的求职者,愿意为前沿技术投入高强度工作。
最强匹配
成长发展匹配
最弱匹配
工作生活匹配
薪资福利85
成长发展90
工作生活50
使命价值70

薪资福利匹配

85较高

腾讯作为上市大厂,薪资福利优厚,岗位属于稀缺技术方向,薪资空间大。但JD未明确具体薪资和福利细节。

薪资信号未披露(AI估算:35K-55K/月)

成长发展匹配

90较高

岗位聚焦前沿AI推理优化技术,涉及多模态、编译优化等高价值技能,成长空间巨大。但JD未明确晋升路径。

技术前沿前沿/新兴技术
技术栈CUDA、TensorRT、vLLM、SGLang、Transformers、DiT、Pytorch
业务类型profit_center

工作生活匹配

50较低

仅提及现场办公,未说明弹性或远程,互联网大厂通常压力较大,但深圳房价高企可能影响生活。

工作模式未明确
办公地点科技园/产业园
加班情况未提及(无法判断)

使命价值匹配

70中等

AI推理优化属于技术前沿,推动AI应用落地有社会价值,但JD未直接表述使命感。

行业发展高速增长赛道
社会影响中性/一般
创新程度积极采用新技术
Watch Jobs
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 智能体-账号与权限后台开发工程师-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • Omni模型算法工程师

    腾讯 · 北京市
    AI 估算 · 35k-65k
  • 在研日漫动作游戏-3D动画设计师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • OG项目组-资深大世界关卡策划

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 游戏动画设计

    腾讯 · 深圳市
    AI 估算 · 20k-35k

相似职位推荐

  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • AI工程化岗(安全领域)

    中国平安 · 深圳市
    AI 估算 · 35k-60k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 35k-55k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 20k-40k

腾讯 的其他在招职位

  • 智能体-账号与权限后台开发工程师-CodeBuddy/WorkBuddy

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • Omni模型算法工程师

    腾讯 · 北京市
    AI 估算 · 35k-65k
  • 在研日漫动作游戏-3D动画设计师

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • OG项目组-资深大世界关卡策划

    腾讯 · 深圳市
    AI 估算 · 25k-45k
  • 游戏动画设计

    腾讯 · 深圳市
    AI 估算 · 20k-35k

相似职位推荐

  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 25k-45k
  • AI工程化岗(安全领域)

    中国平安 · 深圳市
    AI 估算 · 35k-60k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 35k-55k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 30k-50k
  • AI工程化岗

    中国平安 · 深圳市
    AI 估算 · 20k-40k