有Hudi、Hive、Kafka、Spark、Flink、HBase等两种以上两年以上使用经验
熟悉数据仓库理论方法及ETL相关技术,对于数据的架构和设计有一定的思考,具备良好的数学思维和建模思维
具备将业务问题转化为数据问题和潜在AI应用场景的思维
理解特征工程的基本概念及其在数据管道中的重要性
熟悉分布式计算框架,掌握分布式计算的设计与优化能力,了解流式计算
对人工智能(AI)和机器学习(ML)在数据领域的应用(如智能分析、自动化、预测建模、AIGC相关数据处理)有浓厚兴趣和基本认知
具备快速学习并应用新兴AI相关数据技术(如特征存储、模型监控、向量数据库、LLM数据处理等)的意愿和能力
善于思考如何利用数据工程能力赋能和优化AI模型的整个生命周期(数据准备、特征工程、模型服务、监控)
有很强的学习、分析和解决问题的能力,良好的团队合作意识,较强的沟通能力