本科及以上学历,4 年+相关经验
熟悉计算机体系结构与并行计算,具备扎实的 C/C++/Python 工程能力
异构计算:熟悉CUDA、OpenCL、Metal、Vulkan Compute、NEON等异构编程语言之一
训练优化:熟悉 FSDP/ZeRO、Megatron-LM、DeepSpeed、混合精度、重计算、梯度/激活检查点等训练优化技术或框架,具有分布式优化与显存优化的项目经验
云端推理:熟悉vLLM、SGLang、TensorRT等推理框架,了解计算图优化、算子融合、量化压缩、稀疏等优化技术,有实际推理优化的项目经验
具备较强的问题分析与解决能力,良好的跨团队沟通协作意识