1)协助搭建支撑阅文集团相关用户行为分析的数据仓库,参与维度表、事实表的设计,适配千万级用户的海量数据存储需求
2)参与 ETL 全流程开发,运用 Flink、Spark 等工具完成实时 / 离线数据的采集、清洗与转换,保障用户画像、播放,阅读等核心指标的准确性
3)协助优化数据仓库模型与数据处理任务,解决 Hive SQL 执行效率低、数据延迟等问题,提升数据产出速度
4)配合业务团队,开发适配运营场景的数据报表,支撑内容推荐、用户留存分析,数据指标归因等业务决策
5)参与数据质量监控体系搭建,协助编写数据校验脚本,排查数据缺失、异常等问题,输出问题处理报告