图片

作者 | JiekeXu

来源 |公众号 JiekeXu DBA之路(ID: JiekeXu_IT)

如需转载请联系授权 | (个人微信 ID:JiekeXu_DBA)

大家好,我是JiekeXu,江湖人称“强哥”,青学会MOP技术社区联合创始人,荣获Oracle ACE Pro称号,墨天轮MVP,墨天轮年度“墨力之星”,拥有Oracle  OCP/OCM 认证,MySQL 5.7/8.0 OCP认证以及金仓KCA、KCP、KCSM、PCA、PCTA、OBCA等众多国产数据库认证证书,今天和大家一起来看看 数据库架构的范式革命:存算分离为何成为云时代新趋势?欢迎点击下方“JiekeXu DBA之路”公众号名片可关注我的微信公众号,然后点击右上方三个点“设为星标”置顶,更多干货文章才能第一时间推送给你!后台回复【加群】,添加我个人微信拉你进群交流学习。

前  言

天下大势分久必合合久必分,纵观中国古代史,历经夏朝商朝和周朝的统一,而周朝在公元前 770 年,周平王迁都洛邑,今河南洛阳,史称东周。东周又分为春秋和战国两个时期。公元前 403 年,“三家分晋”韩赵魏三家瓜分晋国,“田氏代齐”田氏取代姜太公姜氏王位继续称齐国,标志着战国的开始,然后经过“战国七雄”秦、楚、燕、韩、赵、魏、齐七国,于公元前 221 年,秦始皇统一六国,建立秦朝,战国时代结束实现大一统时代,汉朝后期也是如此分分合合。总之,纵观中国古代史,分分合合。那么在近 50 多年的数据库史上,大概也是如此。

一、数据库架构的演进脉络

自 20 世纪 70 年代关系型数据库诞生以来,数据库系统经历了集中式架构、分布式架构、云原生架构三次重大技术跃迁。在集中式时代(如 Oracle、DB2),存储与计算高度耦合于单机系统,通过纵向扩展硬件性能满足业务需求。进入互联网时代后,Google Spanner、AWS  Aurora 等分布式系统突破单机限制,但存算一体的设计仍面临资源利用率低、扩展成本高等问题。

2020 年后,云计算的普及催生了架构范式变革。Snowflake 在数仓领域率先验证存算分离的可行性,其股价三年暴涨 300% 的背后,是云原生架构对传统数据库商业逻辑的颠覆。如今 OceanBase、TiDB 等主流数据库纷纷转向存算分离,就连我们的老大哥 Oracle 在去年发布的 Oracle 23Ai 中,通过增强 Raft 实现真正的分布式,标志着这场架构革命已从理论验证进入规模化应用阶段。

二、存算分离的技术本质与核心优势

存算分离其实也有两种:引擎级存算分离(逻辑解耦)和 部署级存算分离(物理解耦)

引擎级存算分离技术定义:存算分离将数据库拆解为三个独立层:

  • • 计算层:无状态执行引擎,负责 SQL 解析、查询优化、事务处理

  • • 存储层:分布式持久化存储,保障数据一致性、可靠性

  • • 元数据层:全局事务管理、数据路由的"神经系统"

部署级存算分离定义:在基础设施层面,将数据库计算节点(CPU/内存)与存储设备(磁盘阵列)物理分离,通过外部网络连接,不涉及数据库内部架构改造。

存算分离的架构优势

引擎级存算分离的核心优势

1. 极致弹性扩展能力

  • • 计算/存储独立伸缩
    计算节点可无状态扩展,存储节点按数据增长扩容,避免传统架构中CPU与磁盘的捆绑浪费。  

  • 案例:Snowflake 在黑色星期五期间,计算集群秒级扩容10倍应对流量峰值,存储层保持稳定。

  • • 资源细粒度调度
    支持为不同负载分配专属计算组:  效果:某电商平台混合负载场景下,资源利用率从45%提升至82%。

    • • OLTP事务组:高主频CPU+大内存

    • • OLAP分析组:多核CPU+GPU加速

2. 深度性能优化

  • • 计算下推(Pushdown)
    将谓词过滤、聚合运算下推到存储层执行,减少网络传输与CPU消耗。
    实测数据:TiDB 通过 Coprocessor 下推,TPC-H 查询性能提升 3~8 倍。

  • • 智能数据分布
    存储层感知业务特征,自动优化数据分布(如热点数据多副本、冷数据压缩)。
    技术实现:CockroachDB 通过 Range 分片动态平衡,使跨节点查询延迟降低 60%。

3. 跨平台协同能力

  • • 多云/混合云支持
    计算层部署在公有云,存储层留在私有云,通过统一元数据层实现透明访问。
    架构示例:阿里云 AnalyticDB 支持同时访问 OSS 对象存储与本地 NVMe 存储。

  • • 异构数据联邦
    一个计算集群可对接多种存储引擎(如关系型、文档型、时序数据库)。
    应用场景:金融机构用单一 SQL 接口分析 MySQL 交易数据与 MongoDB 用户日志。

部署级存算分离的核心优势

1. 企业级高可靠性

  • • 硬件级冗余设计
    传统存储设备提供双活控制器、多路径 IO、RAID6 等保护机制,远超本地盘可靠性。
    数据对比:

    • • 本地盘MTBF(平均故障间隔):100万小时

    • • 高端SAN存储 MTBF:20万小时+自动故障切换

  • • 快速容灾恢复
    利用存储阵列的同步复制功能,实现 RPO≈0 的跨机房容灾。
    案例:某银行核心系统通过存储双活,年度计划外停机时间<30秒。

2. 成本优化显著

  • • 硬件利旧与资源共享
    复用现有 SAN/NAS 设备,避免因服务器换代导致的存储资源浪费。
    经济性测算:某政务云平台通过存储池化,5 年 TCO 降低 42%。

  • • 精细化计费模式
    云环境下存储按实际使用量+性能套餐计费,对比本地盘的全量采购更灵活。
    成本对比:AWS RDS使用gp3卷比本地盘节省23%存储成本。

3. 快速落地与兼容性

  • • 零改造快速实施
    无需修改数据库内核,现有 MySQL/Oracle 等数据库可直接迁移。
    迁移案例:某医院 HIS 系统从本地盘迁移至 NetApp SAN,仅需 3 天停机窗口。

  • • 统一运维管理
    沿用存储管理员熟悉的监控工具(如 Dell EMC Unity Manager),降低学习成本。
    效率提升:运维团队故障排查时间从平均 2 小时缩短至 20 分钟。

三、存算分离驱动的六大能力跃升

1. 存储引擎专业化突破

  • • 采用 LSM-Tree、列式存储等新型结构,某银行使用 TiDB 后压缩率提升5倍

  • • 支持内存/SSD/HDD 分层存储,某视频平台冷热数据存储成本下降 70%

2. 计算资源精细化管理

  • • 腾讯云 TDSQL-C 实现 CPU 与内存配比动态调整,资源浪费减少 40%

  • • 支持容器化部署,某 SaaS 企业计算节点部署密度提升 3 倍

3. 混合负载智能调度

  • • 阿里云 AnalyticDB 实现 TP/AP 工作负载隔离,关键交易响应时间标准差降低 90%

  • • 支持 GPU/NPU 异构计算,某 AI 公司模型训练数据吞吐提升 8 倍

4. 全球分布式架构突破

  • • CockroachDB 基于存算分离实现跨洲多活,某跨国企业订单处理延迟从 2 秒降至 200ms

  • • 存储层全局时钟同步,金融级分布式事务性能提升 5 倍

5. 数据服务生态重构

  • • AWS Redshift Spectrum 直接查询 S3 数据湖,某车企数据分析时效从 T+1 变为实时

  • • 支持跨云数据访问,某跨国集团多云数据管理成本降低 60%

6. 硬件协同创新加速

  • • 华为 GaussDB 结合 RDMA 网络,分布式事务吞吐量达 200 万 TPS

  • • 傲腾持久内存应用使某电商库存系统 QPS 提升 10 倍

四、传统存储的深度赋能方向

1. 性能加速层设计

  • • RDMA网络+算子下推

    • • 在存储层实现谓词过滤、列投影等算子,通过RDMA直接返回处理结果,减少网络传输与CPU消耗。

    • • 案例:某证券系统采用存储侧聚合下推,实时风控查询延迟从120ms降至28ms。

  • • 智能缓存分层

    • • 基于AI预测模型动态调整SSD缓存策略,将热数据命中率提升至95%以上,性能比本地盘SSD更稳定。

2. 数据服务增强

  • • 全局一致性快照

    • • 结合存储快照与数据库一致性位点(如LSN),实现零数据丢失的跨库备份,RTO缩短至分钟级。

    • • 技术方案:华为 OceanStor 通过 HyperSnap 技术实现每秒 100TB 的快照创建速度。

  • • 近存储计算(NDP)

    • • 在存储设备内置 FPGA,支持加密、压缩、格式转换等操作,降低数据库主机负载。例如,某医保平台通过存储硬件压缩,CPU 利用率下降 40%。

3. 安全与合规能力

  • • 芯片级加密
    利用存储控制器的国密算法芯片实现数据静态加密,性能损耗 <5%,远超软件加密的 30% 损耗。

  • • 零信任访问控制
    存储层集成ABAC策略引擎,动态校验请求方的设备指纹、地理位置、时间窗口,阻断异常访问。

4. 智能化运维

  • • IO画像与自调优
    基于机器学习分析历史IO模式,自动调整RAID级别、条带大小等参数,性能提升20%~50%。

  • • 预测性维护
    通过SSD磨损度、磁盘振动传感器等数据,提前14天预警硬件故障,避免计划外停机。

五、技术挑战与演进方向

现存挑战

  • • 网络延迟敏感型场景性能瓶颈(如高频交易)

  • • 跨层数据一致性保障机制复杂

  • • 存储计算协同调度算法待优化

创新方向

  1. 1. 智能资源调度:基于 ML 预测负载自动伸缩资源

  2. 2. 软硬协同优化:DPU 卸载数据压缩/加密等计算

  3. 3. 存储介质革命:SCM、QLC SSD 重塑存储层次

  4. 4. 数据编排革命:Deta Lake、Iceberg 构建统一数据平面

六、产业变革与未来展望

Gartner 预测到 2025 年 75% 的数据库将采用存算分离架构。这种变革正在重塑数据库产业格局:

  • • 商业模式:从 license 模式转向存储/计算分离计费

  • • 竞争维度:从单一性能比拼转向全局资源调度能力

  • • 生态体系:催生独立存储服务商、计算优化厂商新物种

在自动驾驶、元宇宙等新场景中,存算分离架构正展现独特价值:某自动驾驶公司采用存算分离数据库后,路测数据实时处理能力提升 20 倍;某 VR 平台实现千万级并发访问下的稳定低延迟。

这场架构革命的技术本质,是将冯·诺依曼体系在分布式时代的重新诠释。当存储与计算的边界被彻底打破,数据库系统正从"功能完备的黑箱"进化为"可编程的数据操作系统",为数字经济发展构建全新的基础设施底座。传统存储在存算分离架构中绝非简单的磁盘替代品,而是通过 RDMA  加速、算子下推、智能分层等技术,演变为数据库的「智能协处理器」。未来,随着存储与数据库协议的深度协同,其价值将向数据增值服务层延伸,成为企业数字化转型的核心使能部件。

全文完,希望可以帮到正在阅读的你,如果觉得有帮助,可以分享给你身边的朋友,同事,你关心谁就分享给谁,一起学习共同进步~~~

欢迎关注我的公众号【JiekeXu DBA之路】,一起学习新知识!
——————————————————————————
公众号:JiekeXu DBA之路
墨天轮:https://www.modb.pro/u/4347
CSDN :https://blog.csdn.net/JiekeXu
ITPUB:https://blog.itpub.net/69968215
腾讯云:https://cloud.tencent.co/developer/user/5645107
——————————————————————————

图片

2024 年公众号 JiekeXu DBA之路历史文章合集

2023 年公众号 JiekeXu DBA之路历史文章合集

2022 年公众号 JiekeXu DBA之路历史文章合集

2021 年公众号历史文章合集

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐