本科及以上学历,计算机相关专业优先
熟悉至少一种编程语言(如 Golang、Java、Python 等),具备扎实的系统编程与性能调优能力,具备VibeCoding编程认知
掌握 Kubernetes、Docker 等云原生技术,对 Serverless 架构与 GPU 资源调度有深入理解,有大规模在线服务系统开发经验者优先
熟悉 PyTorch、TensorFlow 等机器学习框架,掌握 vLLM、TensorRT-LLM、FasterTransformer、SGLang 等推理引擎中的至少一种,有实际性能优化经验
熟悉 GPU 架构与 CUDA 编程基础,了解显存管理、Kernel 优化、CUDA Graph 等技术,有大模型推理加速经验者优先
具备优秀的分析问题和解决问题的能力,对 AI Infra 技术有热情,能主动跟踪前沿技术并落地实践