使用Databricks、Snowflake、Spark和/或Informatica ETL(复用部分)领导设计和交付可扩展的批处理和流式数据管道
负责端到端实施基于Iceberg的Lakehouse表,包括分区策略、模式演进和元数据管理
定义并执行管道可靠性、性能优化、测试和生产就绪的工程标准
领导分析领域的逻辑和物理数据建模,确保一致且正确的业务语义
与领域专家合作定义数据语义、数据管理期望和消费契约
监督数据质量规则、对账检查、血缘捕获和可观测性的实施
审查设计和代码,确保符合架构标准、平台护栏和企业治理要求
与平台工程团队合作,推动CI/CD采用、部署标准化和运营就绪
负责数据产品的生产稳定性,包括事件管理、根本原因分析、数据回填和持续可靠性改进
指导和培养数据工程师,通过代码审查、最佳实践和持续改进推动工程卓越