腾讯的大模型推理引擎研发工程师薪资是多少？

该职位薪资范围为 35k–70k（人民币/月）。

大模型推理引擎研发工程师的工作地点在哪里？

该职位工作地点位于上海市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥35K-70K

发布时间：大约 1 个月前

这是一个专注于大模型推理引擎研发的高级技术岗位

你将负责研发和优化大模型推理引擎，对接客户业务以分析并解决性能瓶颈，同时协助内部集群部署，确保技术性能在行业内保持领先

此外，还需要推广公有云服务，引导客户上云以创造技术优势

研发及优化大模型推理引擎

推广公有云客户，创造技术优势引导客户上云

对接客户业务，分析性能瓶颈，定位、解决问题

协助业务内部集群部署，持续迭代性能，保持业内领先优势

熟悉主流大模型推理框架，如vllm，lightllm，tensorrt-llm，lmdeploy，faster transformer等

熟悉CUDA，triton（https://openai.com/research/triton）、cutlass至少一种以上，精通者优先

熟悉大模型结构，了解大模型性能瓶颈，熟练分析单机及分布式情况下不同性能热点和优化手段

熟悉大模型量化算法，int8/fp8/混合精度量化，了解模型蒸馏、稀疏化、剪裁技术

熟悉推理服务框架，具备服务部署经验者优先，了解k8s，容器化服务，Triton Inference Server (https://github.com/triton-inference-server/server)实现原理者优先

熟悉分布式模型部署及并行策略，如模型并行、流水线并行等，了解NVLINK、GPU通信者优先

熟练掌握Python及C++

了解GPU体系结构者优先

精通CUDA，triton，cutlass

具备服务部署经验

了解k8s，容器化服务，Triton Inference Server实现原理

了解NVLINK、GPU通信

了解GPU体系结构

大模型推理引擎研发工程师

🤖 AI 估测：¥35K-70K

发布时间：大约 1 个月前