熟悉Linux平台下的分布式系统的开发及运维
具有Golang/Python/C/C++等一种高级语言开发经验
熟悉计算机组成、操作系统原理
熟悉分布式系统原理,参与过大规模分布式系统的设计、开发和维护优先
熟悉容器技术,具有Docker、Kubernetes开发或使用经验
有机器学习平台研发经验,有大规模训练任务和推理服务的编排、在离线混部及资源调度经验者优先
了解 Pytorch/Tensorflow/JAX/PaddlePaddle/Mindspore等机器学习框架、GPU/NPU/ARM等最新异构计算系统与架构、RDMA高性能网络,有相关系统研发经验者优先