Oracle执行计划中的连接方式nested loops join、sort merge

DongFangZiMo

2013-04-14

关键字：nested loops join、sort merge joinn、hash join

嵌套循环（Nested Loops （NL））

假如有A、B两张表进行嵌套循环连接，那么Oracle会首先从A表中提取一条记录，然后去B表中查找相应的匹配记录，如果有的话，就把该条记录的信息推到等待返回的结果集中，然后再去从A表中提取第二条记录，去在B表中找第二条匹配的记录，如果符合就推到返回的结果集中，依次类推，直到A表中的数据全部被处理完成，将结果集返回，就完成了嵌套循环连接的操作。

（散列）哈希连接（Hash Join （HJ））

假如有A、B两张表进行哈希连接，那么ORACLE会首先将B表在内存中建立一棵以散列表形式存在的查询二叉树C，然后开始读取A表的第一条记录，从C中去找匹配的记录，如果有，则推到结果集中。再提取A中的第二条记录，如果有，则推到结果集中，以此类推，直到A中没有记录，返回结果集。

（归并）排序合并连接(Sort Merge Join (SMJ) )

假如有A、B两张表进行排序合并连接，ORACLE会首先将A表进行排序，形成一张临时的“表”C，然后将B进行排序，形成一张临时的“表”D，然后将C与D进行合并操作，返回结果集。

如果从预获取的数据量的角度而言，如果B表参与计算的数据量比较小的话，则嵌套循环连接的效率就是比较高的，因为可以很少的IO就可以获取到最终的结果集。但是如果数据量比较大的话，hash join和sort merge join是比较有优势的。

如果从索引的角度而言，索引可以提高nested loops的效率，因为从B表获取数据进行操作，就类似于从单表中查询数据一样，table access full和by index的效率肯定是不一样的，但是这个也取决于B的参与计算的数据量，如果B表的数据都在可以被一次抓取的数据块的大小之内的话，那么索引未必会被使用到。

如果从内存的角度上，同样的数据量nested loops的内存占用应该是最小的，sort merge 应该是最大的，而hash join内存消耗在中间。只是一种感官的直觉，具体没有测试过，因为sort merge 需要创建两个排序表，而hash join则需要对B表创建一棵查询树。

怎么从hash的角度上来看呢？估计三种表都有hash的使用，使用hash更多的是为了提高查询的效率，比如8=power（2,3），如果使用hash，可能需要创建一棵hash树，就增大了空间的消耗，如果table access full的话，需要最少扫描1次，最多扫描8次。如果使用hash，则最少1次，最多3次，就可以了，使用空间获取时间上的优势。在这个里面，至少感觉到使用到hash的有nested loops中的索引和hash join。

sort oracle执行计划 merge hash

安科网

Oracle执行计划中的连接方式nested loops join、sort merge

DongFangZiMo

DongFangZiMo

相关推荐

mysql的sort by学习

如何在微信小程序中使用骨架屏的步骤

查看linux占用内存/CPU最多的进程

12.分而治之-归并排序

12.分而治之-归并排序

Redis入门(4) - 排序

Linux awk统计日志中出现过的IP(或出现次数最多的N个IP)

算法与数据结构系列 ( 三 ) - 选择排序法 - Select Sort

mysql 之order by

JavaScript数组的sort方法常规用法

PHP排序函数sort底层实现分析

排序和数据结构

关于python中sort排序的一个简单问题：

jpa前端分页参数传递和定制返回属性

sort方法和自定义比较器的写法

排序算法: 归并排序

STL sort 源码解析

网站维护：Linux服务器查看外网访问IP指令汇总

七、排序

rust sort

DongFangZiMo