AI院--大模型量化算法研究员
🤖 AI 估测:¥35K-60K
发布时间:19 天前
ℹ️关于这个职位
该职位专注于大语言模型(LLM)及多模态模型的量化、压缩与推理加速技术研发
你将通过设计定制化量化方案、探索低比特量化与协同压缩技术,来降低模型的存储与计算成本,并推动其大规模部署
核心工作包括算法研发、工具链开发及跟踪前沿技术
✓工作职责
研发及改进 PTQ(训练后量化)、QAT(量化感知训练)、混合精度量化等核心算法,针对LLM/VLM(大语言模型/视觉语言模型)设计定制化量化方案,持续优化模型精度与推理效率的平衡
探索并实践低比特量化(如INT8/INT4/FP8/FP4)、权重稀疏化、知识蒸馏等协同压缩技术,提升压缩率同时控制精度损失
开发及优化量化工具链,完成对 GLM 系列模型的转换、量化校准及部署集成
跟踪学术界与工业界前沿量化技术,通过论文复现、实验对比推动技术迭代
⭐最低要求
计算机科学、电子工程、数学等相关专业硕士及以上学历,3 年以上模型量化或推理加速经验
或优秀本科生具备扎实项目履历
深入理解 Transformer 架构及 LLM 推理流程,精通 Python,熟悉常见的开源 LLM 推理框架(sglang/vllm/trtllm 等)
掌握量化原理(校准策略、量化粒度、误差分析)及主流算法(如GPTQ、AWQ)
👍优先资格
具有 CUDA/Triton 编程经验,能自主实现高性能算子或优化内核计算加分