参与百度云数据处理 Pipeline 引擎的核心研发工作
参与设计与实现分布式 DAG 执行引擎,包括任务调度、依赖管理与失败恢复机制
参与批处理与流处理统一架构(Batch & Streaming Unified)的设计与优化
参与数据加工算子框架的研发,包括 Filter / Join / Aggregate / Transform 等通用算子能力建设
参与任务执行过程中的状态管理、容错机制与资源调度优化
参与数据血缘追踪、Schema 演进与数据质量校验能力的设计与实现
参与企业级复杂场景下大规模 Pipeline 性能优化与稳定性保障工作