架构设计与规划:负责分布式数据库、分布式KV存储的整体架构设计,聚焦高可用、高并发、高扩展性核心目标,输出架构方案、技术选型报告、架构评审文档
结合业务场景(如海量数据存储、高吞吐读写、跨地域容灾等),设计分布式存储分层架构,平衡一致性、可用性与分区容错性(CAP),制定数据分片、副本策略、故障转移机制
主导KV存储引擎(如RocksDB、LevelDB等)的深度优化,包括存储结构、压缩策略、缓存机制、IO模型调优,提升存储性能与资源利用率
高可用体系建设:设计并落地分布式数据库与KV存储的高可用保障体系,包括多副本部署、自动故障检测与恢复、数据备份与恢复、灾备演练等方案,确保系统99.99%以上可用性
制定数据库与KV存储的容灾策略,支持跨机房、跨地域部署,解决数据一致性、数据同步延迟、脑裂等关键问题
参与架构应急方案制定,针对集群扩容、数据迁移、版本升级等场景,设计无感知切换方案,避免业务中断
技术攻关与优化:跟踪分布式存储领域前沿技术(如分布式共识算法、新型存储介质、云原生存储方案等),引入行业顶尖实践并落地
负责解决分布式数据库与KV存储在高并发、大数据量场景下的性能瓶颈,包括慢查询优化、锁机制优化、资源调度优化等
主导技术难题攻关,如分布式事务一致性、热点数据处理、大Key/热Key优化、存储成本优化等
团队协作与技术赋能:与研发、运维、测试团队协作,推动架构方案落地,参与核心模块代码评审,把控技术实现质量
制定技术规范与最佳实践,包括数据库/KV存储的设计规范、运维规范、监控告警规范,赋能团队成员提升技术能力
参与跨团队技术方案评审,协调解决不同业务线在存储层的技术冲突,推动基础存储设施的标准化建设
架构演进与管理:持续关注业务发展需求,评估现有架构的适应性,制定分布式数据库与KV存储的中长期演进路线图
负责架构文档的维护与更新,确保架构设计的透明性与可追溯性,组织架构评审会议并推动问题闭环