构建 AI 数据资产体系,包括特征库、样本库、标注规则引擎等,支持特征工程自动化、样本迭代优化,降低 AI 研发的数据门槛
2、对接算法团队,梳理数据标注标准与质量评估体系,搭建数据问题反馈与迭代闭环,持续提升 AI 数据质量
3、负责知识库构建与维护, 包括RAG 体系所需的知识库(文档、图谱等),确保数据实时性和准确性
4、设计并优化数据存储与计算架构(如湖仓一体、实时计算平台),适配 AI 场景的高并发、大容量、低延迟数据需求
负责数据管道、ETL/ELT 任务的开发与维护,结合 AI 技术实现任务调度智能化、故障自愈、性能自动优化
5、探索并应用联邦学习、差分隐私、同态加密等技术,在保护客户隐私的前提下,实现数据价值的最大化
6、引入并应用 AI 技术优化数据研发流程,提升数据处理效率、降低人工成本
探索 AI 在数据治理、数据脱敏、数据血缘分析中的应用,搭建智能化数据治理工具,实现数据资产的自动化管理与风险管控