腾讯的混元LLM大模型量化压缩高级算法工程师（北京/深圳/上海）薪资是多少？

该职位薪资范围为 45k–80k（人民币/月）。

混元LLM大模型量化压缩高级算法工程师（北京/深圳/上海）的工作地点在哪里？

该职位工作地点位于深圳市。工作形式为仅现场办公。

该职位要求学历未注明学历及高级经验工作经验。

🤖 AI 估测：¥45K-80K

发布时间：大约 1 个月前

这是一个专注于大语言模型（LLM）性能优化与部署的高级算法工程师职位

你将深入研究并实现模型的量化、稀疏化、投机采样等前沿压缩加速技术，旨在降低模型推理成本并提升速度

工作内容涵盖从算法研究、工具开发到与硬件协同优化的全链路，最终推动高效能大模型在实际业务场景中的落地应用

深度参与LLM大模型压缩加速方案研究，包括不限于：

投机采样：适配LLM模型架构特性，探索Prefill / RL等场景下优化加速方案

稀疏化：Sparse Attention，KV-Cache压缩，模型结构剪枝等优化技术，协同框架定制化稀疏方案，提升模型推理性能

量化：优化Transformer中 Linear/KV-Cache/Attention量化算法，适配FP8/INT8/NVFP4等量化方案及不同硬件后端

探索极低bit量化训练方案，深度协同硬件联合优化，实现模型体积极致压缩和性能突破，并推动实际业务落地

新技术：聚焦长上下文，多轮对话优化等压缩加速优化技术研究

设计可落地的大模型压缩算法及成本优化方案，助力大模型的性能加速，不限于模型结构/软硬协同优化

分析业务性能瓶颈和模型特点，定制化开发大模型压缩优化工具，实现一站式模型压缩-部署的高速推理方案

参与前沿的模型压缩加速算法研究，追踪领域前沿工作，撰写并发表顶会论文

熟悉深度学习算法基本原理，熟练掌握PyTorch，具备扎实的Python编程能力与工程实现能力

熟悉主流LLM模型压缩算法体系，并且了解硬件及推理库上对于模型压缩的支持方案

具有扎实的数理基础，熟悉常见的算法和数据结构，具有良好的编程习惯

了解大模型算法基本原理，熟悉常见LLM大模型

有顶会论文发表者优先

混元LLM大模型量化压缩高级算法工程师（北京/深圳/上海）

🤖 AI 估测：¥45K-80K

发布时间：大约 1 个月前