计算机科学、软件工程、电气工程或相关专业本科及以上学历
硕士优先
10年以上Kubernetes开发、运维和优化实践经验,对K8s核心组件(kube-apiserver, etcd, kube-scheduler, kubelet)和自定义资源开发(CRD/Operator)有深入理解
具备为AI/ML工作负载构建和优化基础设施的经验,深入理解Agentic AI和Agentic RL概念,有在K8s上支持Agentic RL训练或推理工作负载的实践经验者优先
精通容器化技术(Docker, containerd)、容器网络解决方案(Calico, Cilium)和存储解决方案(Ceph, GlusterFS),具备为高并发AI工作负载优化网络和存储性能的经验
在K8s上拥有丰富的GPU资源管理经验,熟悉NVIDIA GPU Operator、CUDA和加速计算技术,能够为Agentic AI/RL工作负载优化GPU利用率
优秀的编程能力,精通至少一门编程语言(Python, Go, C++),能够开发自定义K8s控制器、插件或自动化工具
深刻理解云原生架构和最佳实践,有与主流CSP(阿里云、腾讯云、华为云等)合作经验者优先
流利的英语口语和书面表达能力,能够与全球跨职能团队有效沟通并阅读英文技术文档
强大的问题解决能力,能够独立识别和解决复杂的K8s及Agentic AI/RL Infra技术问题,积极主动且以结果为导向的工作态度