熟练掌握Linux环境下的C/C++、Python语言,熟悉docker使用
熟悉深度学习基本原理和Pytorch深度学习框架,有对Pytorch框架二次开发经验者优先
熟悉Transformer模型及其应用场景,熟练掌握至少一种开源社区的大模型推理框架,如vLLM、SGLang、TensorRT-LLM、LightLLM等
熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等,有CUDA开发经验者优先
具备良好的论文阅读分析和文档撰写能力,独立解决问题的能力,良好的团队合作精神