计算机相关专业本科及以上学历,3年以上分布式存储运维经验,有实际的AIOps项目落地经验,对智能运维体系有深刻理解和浓厚兴趣
精通分布式存储架构(Ceph/RADOS优先),熟悉数据分布策略、一致性协议及故障恢复机制,具备PB级集群运维调优经验
掌握机器学习全流程能力:熟练使用Python及ML框架(PyTorch/TensorFlow/Sklearn)、具备时序预测(ARIMA/DeepAR)、异常检测(LOF/VAE)等场景实战经验、熟悉特征工程、模型评估及MLOps工具链(MLflow/Kubeflow)
熟练开发运维自动化脚本(Python/Go),熟悉Ansible/SaltStack等配置管理工具
熟悉运维领域经典算法:如根因分析(因果推断/贝叶斯网络)、容量规划(时间序列分解/蒙特卡洛模拟),具备LLM应用经验者优先(如基于GPT构建运维知识问答系统)