本科及以上学历,计算机相关专业,精通Golang,深入理解其运行机制、并发模型及性能优化
熟练掌握Python
云原生与容器化:深入掌握Kubernetes原理,包括但不限于集群调度机制、Controller模式、Service、CNI、CSI等,具备大规模K8s集群运维或开发经验者优先
AI框架与生态:熟悉主流AI训练与推理框架(如PyTorch、TensorFlow等),了解Megatron-LM、veRL、Ray、vLLM、SGLang等至少一种分布式训练或高性能推理框架的原理与应用
硬件与系统:了解CPU/GPU等计算硬件特性,熟悉网络、分布式存储等相关技术,对国产GPU卡有适配经验者优先
综合能力:具备良好的系统设计能力、问题排查能力和团队协作精神,对技术有热情,能承受一定压力