有大数据和技术风险领域的经验,深入原理并有相关场景的大规模实践
熟悉机器学习/深度学习算法(如 LSTM、GNN、异常检测算法等),熟练掌握数据ETL流程、PyTorch / TensorFlow 及 MLOps 生产工具链
熟悉并落地如下1个或多个领域的经验:
a). 大规模云平台的资源分配、调度优化和中长期资源规划:运用需求预测、运筹优化等方法,解决大规模混部环境的资源管理和技术风险问题,突破传统策略的瓶颈
b). 技术风险领域的时序预测、异常检测、定位诊断场景:比如基于预训练的半结构化日志深度分析,故障因果关联推断分析,分布式场景下复杂调用关系的异常来源定位等
c). 智能问答:熟悉chatOps,智能客服等相关领域
并结合LLM,实现多个智能体的整合
d). 其他类似的Data+AI领域,并且有一定规模实际场景的落地效果