Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫
Watch Jobs
浏览职位数据统计洞察报告探索企业定价
我的收藏免费试用登录注册

职位搜索/腾讯/高性能计算工程师
Tencent logo
T
腾讯 (Tencent)

职位信息

浙江省-杭州市
高级经验
全职员工
仅现场办公
硕士
普通员工/个人贡献者

标签

高性能计算LLM推理优化异构计算TensorRT-LLMCuda/Triton低比特量化国产Ai芯片
💡

核心评价

技术顶尖、前景广阔的大厂核心研发岗,薪资竞争力强,但需面对高难度挑战与可能的强度。

高性能计算工程师

🤖 AI 估测:¥45K-80K

发布时间:18 天前

立即应聘

ℹ️关于这个职位

这是一个专注于AI大模型推理性能极致优化的核心研发岗位
你将负责千亿参数级大模型的性能工程、低比特量化、统一推理引擎架构设计,并深入GPU/NPU硬件底层进行算子优化
该职位要求具备从零到一构建生产级LLM在线推理系统的实战经验,是AI系统与高性能计算领域的尖端技术挑战

✓工作职责

超大规模LLM性能工程: 主导并规划千亿参数级大模型的极致性能优化技术路线
负责 PagedAttention、连续批处理等核心调度策略的深度定制与生产级架构设计,负责 vLLM/TensorRT-LLM 等主流推理框架的内核级优化与落地
低比特与稀疏模型优化: 牵头 INT4/FP8/AWQ 等前沿低比特量化技术的工业级系统化落地,平衡精度与计算效率
并设计面向 MoE 模型的分布式调度、路由、显存管理及跨卡通信的优化方案
统一与多模态架构: 定义并设计一套具备长期扩展性的统一 AI 推理引擎架构,以支撑自回归生成任务,并前瞻性地解决多模态大模型(如视觉-语言模型)的协同推理部署挑战
异构算力与国产化适配: 主导推理引擎在国产AI芯片(如昇腾、海光、天数等)平台上的战略级移植、生态适配与性能优化
对 HCCL/NCCL 等通信原语进行深度优化和定制,实现跨异构架构的算力自主可控
核心算子优化与指令架构创新 (Enhanced Focus):深度介入 GPU/NPU 硬件底层,主导设计和实现LLM特有高性能算子
重点包括:高性能Attention Kernel、矩阵乘法(GEMM)的深度定制与融合、KV Cache读写优化等关键算子
具备深入理解和利用硬件指令集架构(ISA)和微架构(Microarchitecture)的能力, 通过 CUDA/Triton 或国产芯片底层编程语言,进行SIMD/SIMT指令优化、指令级并行(ILP)及寄存器重用等,将LLM推理性能推向硬件理论极限

⭐最低要求

计算机、人工智能、软件工程等相关专业硕士及以上学历
具备5年以上 AI 系统、高性能计算或底层系统开发经验
具备大规模、生产级大语言模型(LLM)在线推理系统从零到一的架构设计与优化实战经验
精通 C++/Python,具备深厚的系统编程功底,对并行计算、内存管理和性能调优有深入的系统性理解
深入理解 Transformer 架构,具备 vLLM, TensorRT-LLM, LightLLM 等主流推理框架的内核级/源码级深度优化经验
对 KV Cache、低比特量化、连续批处理等核心技术有架构决策能力
具备设计和主导实现高并发、超低延迟分布式服务系统的能力
熟悉 Docker/Kubernetes 等云原生部署运维技术
Watch Jobs

我们专注于实时追踪各企业最新职位动态,帮助您节省求职时间,快速找到理想工作机会。

探索

  • 浏览职位
  • 数据统计
  • 洞察报告
  • 数据方法论
  • 探索企业

订阅

  • 免费试用
  • 价格方案
  • 常见问题
  • 隐私政策

关注我们

微信公众号小红书淘宝店铺

© 2026 Watch Jobs. 保留所有权利

Created by jianglicat - 讲礼猫

腾讯 的其他在招职位

  • 区域营销经理-西安

    腾讯

    西安市 · 仅现场办公

  • 《逆战:未来》-资深3D场景设计师

    腾讯

    广州市 · 仅现场办公

  • SLG-手游研发项目经理

    腾讯

    上海市 · 仅现场办公

  • 微信小店-产品策划-商品价格

    腾讯

    广州市 · 仅现场办公

  • S2—WXG财务管理

    腾讯

    深圳市 · 仅现场办公

相似职位推荐

  • 模型算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法工程师

    中国平安

    深圳市 · 仅现场办公

  • 算法资深工程师(AI安全算法)

    中国平安

    深圳市 · 仅现场办公

  • CA-高级Java开发工程师

    中国平安

    深圳市 · 仅现场办公

  • 测试开发

    叠纸游戏

    上海市 · 仅现场办公