概念

火山模型又叫迭代器模型。

  • IO墙效应

在90年代早期,计算机的内存资源十分昂贵,相对于CPU的执行效率,IO效率要差得多,因此运算符和存储之间的IO交换是影响查询效率的主要因素(IO墙效应)。

火山模型将更多的内存资源用于IO的缓存设计而 没有优化CPU 的执行效率是在当时的硬件基础上很自然的权衡。

火山模型

在这里插入图片描述

设计思路

将关系代数当中的每一个算子抽象成一个迭代器。
每个迭代器都带有一个 next 方法。
每次调用这个方法将会返回这个算子的产生的一行数据(或者说一个 Tuple)。
程序通过在 SQL 的计算树的根节点不断地调用 next方法来获得整个查询的全部结果。

示例

 SELECT col1 FROM table1 WHERE col2 > 0;

这条 SQL 就可以被翻译成由三个算子组成的计算树。
如上图所示,可以使用伪代码将这三个算子的执行逻辑表示出来。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐