本科及以上学历,计算机相关专业,5年及以上互联网行业服务器运维经验
精通X86架构服务器运维,熟悉ARM架构服务器原理及部署运维流程,了解主流服务器厂商产品特性及硬件组成
精通GPU服务器运维,熟悉NVIDIA GPU架构、驱动安装及优化,掌握NCCL等GPU通信协议,了解IB/RoCE高速网络技术,具备一定的GPU集群性能调优及故障排查能力
熟悉国产硬件的适配与运维,了解国产服务器硬件结构及常见故障处理方法
精通Linux操作系统(CentOS/欧拉),深入理解文件系统、网络协议、硬件协议,具备较强的性能问题分析与解决能力
有良好、全面的计算机软硬件知识,对CPU、GPU、网卡、内存、SSD、储存等相关技术有较深入的研究
具备基础的Shell或Python脚本编写能力,能处理日常运维自动化任务