计算机科学、电子工程或相关专业本科及以上学历,3年以上高性能计算/深度学习系统相关经验
扎实的分布式系统功底:深入理解多机并行训练/推理相关技术,具备大规模训练框架(Megatron-LM)及主流推理框架(vLLM,SGLang)的开发能力
以下两项至少具备其一:
掌握低比特推理与量化技术:熟悉GPTQ、AWQ、SmoothQuant等后量化方案,理解训练感知量化的实现细节与数值稳定性处理,熟悉MXFP4,NVFP4等新兴低比特量化格式
深入理解投机解码原理:掌握Draft模型与Target模型的协同机制,了解EAGLE3、DFlash等当前主流方法的训练、推理实现方法