腾讯的高性能计算工程师薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

高性能计算工程师的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求硕士学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：18 天前

这是一个专注于AI大模型推理系统极致性能优化的核心研发岗位

你将负责千亿参数级大模型的性能工程、低比特量化、统一推理引擎架构设计，并深入GPU/NPU硬件底层进行核心算子优化

该职位要求具备深厚的高性能计算和AI系统开发经验，致力于将LLM推理性能推向硬件理论极限

超大规模LLM性能工程：主导并规划千亿参数级大模型的极致性能优化技术路线

负责 PagedAttention、连续批处理等核心调度策略的深度定制与生产级架构设计，负责 vLLM/TensorRT-LLM 等主流推理框架的内核级优化与落地

低比特与稀疏模型优化：牵头 INT4/FP8/AWQ 等前沿低比特量化技术的工业级系统化落地，平衡精度与计算效率

并设计面向 MoE 模型的分布式调度、路由、显存管理及跨卡通信的优化方案

统一与多模态架构：定义并设计一套具备长期扩展性的统一 AI 推理引擎架构，以支撑自回归生成任务，并前瞻性地解决多模态大模型（如视觉-语言模型）的协同推理部署挑战

异构算力与国产化适配：主导推理引擎在国产AI芯片（如昇腾、海光、天数等）平台上的战略级移植、生态适配与性能优化

对 HCCL/NCCL 等通信原语进行深度优化和定制，实现跨异构架构的算力自主可控

核心算子优化与指令架构创新 (Enhanced Focus):深度介入 GPU/NPU 硬件底层，主导设计和实现LLM特有高性能算子

重点包括：高性能Attention Kernel、矩阵乘法（GEMM）的深度定制与融合、KV Cache读写优化等关键算子

具备深入理解和利用硬件指令集架构（ISA）和微架构（Microarchitecture）的能力，通过 CUDA/Triton 或国产芯片底层编程语言，进行SIMD/SIMT指令优化、指令级并行（ILP）及寄存器重用等，将LLM推理性能推向硬件理论极限

计算机、人工智能、软件工程等相关专业硕士及以上学历

具备5年以上 AI 系统、高性能计算或底层系统开发经验

具备大规模、生产级大语言模型（LLM）在线推理系统从零到一的架构设计与优化实战经验

精通 C++/Python，具备深厚的系统编程功底，对并行计算、内存管理和性能调优有深入的系统性理解

深入理解 Transformer 架构，具备 vLLM, TensorRT-LLM, LightLLM 等主流推理框架的内核级/源码级深度优化经验

对 KV Cache、低比特量化、连续批处理等核心技术有架构决策能力

具备设计和主导实现高并发、超低延迟分布式服务系统的能力

熟悉 Docker/Kubernetes 等云原生部署运维技术

高性能计算工程师

🤖 AI 估测：¥45K-80K

发布时间：18 天前