本科及以上学历,计算机相关专业
熟练掌握C++/Golang,精通数据结构与算法,有并发编程基础
有服务端工程研发和维护经验,有较好的服务端架构优化经验
具备扎实的GPU编程基础,包括CUDA,Trtion,Cutlass等,熟悉大模型网络架构和和算子实现细节,有丰富的模型和算子性能调优实战经验
具有Diffusion/DiT类AIGC模型的工程化和推理加速经验,熟悉PyTorch,熟悉xDiT/LightX2V等DiT推理框架及常用DiT推理加速技术
熟悉大模型的模型量化、剪枝、蒸馏等模型压缩技术