oracle hash join和nested loop下的驅動表相關測試

阿新 • • 發佈：2019-01-08

Oracle 驅動表

Oracle驅動表也叫做外部表，也叫外層表，是在多表關聯查詢中首先遍歷的表，驅動表的每一行都要到另一個表中尋找相應的記錄，然後計算返回最終資料。

驅動表的概念只在nested loops和hash join時存在。

原則：

1. 驅動表一般是小表，但不絕對，看下邊

2. 驅動表一般是通過where條件篩選後剩餘行數較少的表。

3. 如果表的一條記錄很長，佔用幾個資料塊也適合做驅動表

4. CBO和RBO中，對於驅動表的選擇是不同的，CBO中通過對統計資訊的參考進行計算來選擇驅動表，而RBO中按照既定原則選擇驅動表。

RBO中，from後邊最右邊的表為驅動表（from後邊表從右向左遍歷，where條件從下向上遍歷）

6. 涉及驅動表的查詢，連線條件的索引很重要，驅動表連線欄位可以沒有索引，但是被驅動表需要被掃描驅動表經過篩選後剩餘條數的遍數，所以被驅動表的連線欄位上有一條索引是非常重要的。

分析：

假設a表10行記錄，b表1000行記錄，兩個表都有id列，查詢時使用id列進行關聯

Select * from a,b where a.id=b.id anda.id=100;

A表作為驅動表比較合適，假設a.id=100只有1行，即使全表掃描a表也就幾個塊，假設a表佔用10個塊。

B表的id假如非唯一，如果b

表的id列有索引，b表佔用100個塊，每個塊10行記錄，id列索引佔用10個塊，並且id為100有2條記錄，在兩個塊中

那麼這條語句的成本（以塊計算，下同）：

A表（10個塊）*b表索引（10個塊）+b表id為100的2個塊=102個塊

如果b表沒有索引，成本為：

A表（10個塊）*b表（100個塊）=1000個塊

如果a，b表都沒有索引，可以看出不管哪個表作為驅動表，語句的執行成本都是一樣的。

如果a，b表id列都有索引，a表id列索引佔2個塊，成本為：

A表id列索引（2個塊）*b表id列索引（10個塊）+ b表id為100的2個塊=22個塊

如果B表的記錄很長，可以作為驅動表的情況比較複雜，大家可以自己想象適合的場景。

可以看出，在連線中，如果連線列有索引是多麼的重要。

實驗支撐

SQL> create table a(id,name) as selectobject_id,object_name from all_objects where rownum < 200;

Table created.

SQL>

SQL> create table b as select * fromall_objects ;

Table created.

SQL> select count(*) from a;

COUNT(*)

----------

199

SQL> select count(*) from b

SQL>

COUNT(*)

----------

89083

SQL>

SQL> execdbms_stats.gather_table_stats('TEST','A');

PL/SQL procedure successfully completed.

SQL>

SQL> execdbms_stats.gather_table_stats('TEST','B');

PL/SQL procedure successfully completed.

兩個表都沒有索引

Select count(*) from a,b wherea.id=b.object_id

And a.id=53

執行計劃：（B表驅動）

SQL> Select count(*) from a,b wherea.id=b.object_id

2 And a.id=53

3 /

COUNT(*)

----------

Execution Plan

----------------------------------------------------------

Plan hash value: 319234518

----------------------------------------------------------------------------

----------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 9 | 420 (1)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 9 | | |

|* 2| HASH JOIN | | 1 | 9 | 420 (1)| 00:00:01 |

|* 3| TABLE ACCESS FULL| B | 1 | 5 | 417 (1)| 00:00:01 |

|* 4| TABLE ACCESS FULL| A | 1 | 4 | 3 (0)| 00:00:01 |

----------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

2- access("A"."ID"="B"."OBJECT_ID")

3- filter("B"."OBJECT_ID"=53)

4- filter("A"."ID"=53)

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

1506 consistent gets

0 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Netfrom client

2 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

A表作為驅動表

SQL> Select /*+ ordered use_nl(a) */count(*) from a,b where a.id=b.object_id

2 Anda.id=53;

COUNT(*)

----------

1 row selected.

Execution Plan

----------------------------------------------------------

Plan hash value: 1397777030

----------------------------------------------------------------------------

----------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 9 | 420 (1)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 9 | | |

|* 2| HASH JOIN | | 1 | 9 | 420 (1)| 00:00:01 |

|* 3| TABLE ACCESS FULL| A | 1 | 4 | 3 (0)| 00:00:01 |

|* 4| TABLE ACCESS FULL| B | 1 | 5 | 417 (1)| 00:00:01 |

----------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

2 -access("A"."ID"="B"."OBJECT_ID")

3- filter("A"."ID"=53)

4- filter("B"."OBJECT_ID"=53)

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

1506 consistent gets

0 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Netfrom client

2 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

發現上面兩個語句的代價是一樣的

/*+ Ordered use_nl(table_name) */ --使用hint強制表作為驅動表，另外，這裡使用的use_nl，但是走的是hash join，說明在沒有索引的情況下，oracle優化器更傾向hash join。

執行計劃中，hash join下第一個表為驅動表，此處為A表。

表B object_id列有索引的情況

SQL> create index id_b_object_id onb(object_id);

Index created.

SQL> execdbms_stats.gather_table_stats(ownname => 'TEST',TABNAME => 'B',CASCADE=> TRUE);

PL/SQL procedure successfully completed.

SQL>

執行計劃：

SQL> Select count(*) from a,b wherea.id=b.object_id

2 And a.id=53;

COUNT(*)

----------

1 row selected.

Execution Plan

----------------------------------------------------------

Plan hash value: 3168189658

----------------------------------------------------------------------------------------

----------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 9 | 4 (0)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 9 | | |

| 2| MERGE JOINCARTESIAN| | 1 | 9 | 4 (0)| 00:00:01 |

|* 3| TABLE ACCESS FULL | A | 1 | 4 | 3 (0)| 00:00:01 |

| 4| BUFFER SORT | | 1 | 5 | 1 (0)| 00:00:01 |

|* 5| INDEX RANGE SCAN | ID_B_OBJECT_ID | 1 | 5 | 1 (0)| 00:00:01 |

----------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

3- filter("A"."ID"=53)

5 -access("B"."OBJECT_ID"=53)

Statistics

----------------------------------------------------------

92 recursive calls

0 db block gets

134 consistent gets

23 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Netfrom client

2 SQL*Net roundtrips to/fromclient

12 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

發現執行計劃並沒有使用nested loop和hash join，不過走索引後，執行代價明顯減少。Merge join發生了排序，如果記憶體夠用還好，不夠用就比較耗時了。

強制hash

A表驅動

SQL> Select /*+ use_hash(a,b) */count(*) from a,b where a.id=b.object_id

2 And a.id=53;

COUNT(*)

----------

1 row selected.

Execution Plan

----------------------------------------------------------

Plan hash value: 895278611

--------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 9 | 4 (0)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 9 | | |

|* 2| HASH JOIN | | 1 | 9 | 4 (0)| 00:00:01 |

|* 3| TABLE ACCESS FULL| A | 1 | 4 | 3 (0)| 00:00:01 |

|* 4| INDEX RANGE SCAN | ID_B_OBJECT_ID| 1 | 5 | 1 (0)| 00:00:01 |

--------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

2- access("A"."ID"="B"."OBJECT_ID")

3- filter("A"."ID"=53)

4- access("B"."OBJECT_ID"=53)

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

5 consistent gets

0 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Netfrom client

2 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

--強制使用hash join，a表預設變為了驅動表，執行代價很低，符合要求

B表驅動

SQL> Select /*+ ordered use_hash(b) */count(*) from a,b where a.id=b.object_id

2 And a.id=53;

COUNT(*)

----------

1 row selected.

Execution Plan

----------------------------------------------------------

Plan hash value: 895278611

--------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 9 | 4 (0)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 9 | | |

|* 2| HASH JOIN | | 1 | 9 | 4 (0)| 00:00:01 |

|* 3| TABLE ACCESS FULL| A | 1 | 4 | 3 (0)| 00:00:01 |

|* 4| INDEX RANGE SCAN | ID_B_OBJECT_ID| 1 | 5| 1 (0)| 00:00:01 |

--------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

2- access("A"."ID"="B"."OBJECT_ID")

3- filter("A"."ID"=53)

4- access("B"."OBJECT_ID"=53)

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

5 consistent gets

0 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Netfrom client

2 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

發現有索引，並且有統計資訊的情況下，無法強制B表作為驅動表，oracle對hint進行了忽略。

刪除統計資訊試試：

SQL> EXEC dbms_stats.delete_table_stats(user,'B',cascade_parts =>TRUE);

PL/SQL procedure successfully completed

SQL> EXEC dbms_stats.delete_table_stats(user,'A',cascade_parts =>TRUE);

PL/SQL procedure successfully completed

SQL>

--測試發現仍然不能將B表作為驅動表，修改optimizer_mode為rule

alter session set optimizer_mode=rule;

SQL> Select /*+ ordered use_nl(b) */count(*) from a,b where a.id=b.object_id

2 And object_id=53;

--發現仍然不能將B表作為驅動表

強制nested loop

SQL> Select /*+ ordered use_nl(b) */count(*) from a,b where a.id=b.object_id

2 And object_id=53;

COUNT(*)

----------

1 row selected.

Execution Plan

----------------------------------------------------------

Plan hash value: 1183094437

--------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 26 | 4 (0)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 26 | | |

| 2| NESTED LOOPS | | 1 | 26 | 4 (0)| 00:00:01 |

|* 3| TABLE ACCESS FULL| A | 1 | 13 | 3 (0)| 00:00:01 |

|* 4| INDEX RANGE SCAN | ID_B_OBJECT_ID| 1 | 13 | 1 (0)| 00:00:01 |

--------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

3- filter("A"."ID"=53)

4- access("OBJECT_ID"=53)

Note

-----

-dynamic statistics used: dynamic sampling (level=2)

Statistics

----------------------------------------------------------

10 recursive calls

0 db block gets

73 consistent gets

1 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Netfrom client

2 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

--代價和hash join差不多，另外，即使強制B表作為驅動表，仍然不能將B表作為驅動表。

兩個都有索引的情況

SQL> create index id_a_id on a(id);

Index created.

SQL> execdbms_stats.gather_table_stats(user,'A',CASCADE=>TRUE);

PL/SQL procedure successfully completed.

SQL> execdbms_stats.gather_table_stats(user,'B',cascade => true);

PL/SQL procedure successfully completed.

SQL>

SQL> Select /*+ ordered use_nl(b) */count(*) from a,b where a.id=b.object_id

2 And object_id=53;

COUNT(*)

----------

1 row selected.

Elapsed: 00:00:00.01

Execution Plan

----------------------------------------------------------

Plan hash value: 2751652919

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

| 0| SELECT STATEMENT | | 1 | 9 | 2 (0)| 00:00:01 |

| 1| SORT AGGREGATE | | 1 | 9 | | |

| 2| NESTED LOOPS | | 1 | 9 | 2 (0)| 00:00:01 |

|* 3| INDEX RANGE SCAN| ID_A_ID | 1 | 4 | 1 (0)| 00:00:01 |

|* 4| INDEX RANGE SCAN| ID_B_OBJECT_ID| 1 | 5 | 1 (0)| 00:00:01 |

-------------------------------------------------------------------------------------

Predicate Information (identified byoperation id):

---------------------------------------------------

3- access("A"."ID"=53)

4- access("OBJECT_ID"=53)

Statistics

----------------------------------------------------------

1 recursive calls

0 db block gets

3 consistent gets

0 physical reads

0 redo size

542 bytes sent via SQL*Net toclient

543 bytes received via SQL*Net from client

2 SQL*Net roundtrips to/fromclient

0 sorts (memory)

0 sorts (disk)

1 rows processed

SQL>

--hint強制不能將B表作為驅動表

代價明顯變小，又減少一倍（索引是多麼重要）

我這裡使用的是12c的庫，發現12c對於執行計劃的準確性確實有提高，hint作為輔助手段越來越顯得必要性很小，這是dba要失業的勁頭還是幫助dba減輕負擔，~~

oracle hash join和nested loop下的驅動表相關測試

Oracle 驅動表 Oracle驅動表也叫做外部表，也叫外層表，是在多表關聯查詢中首先遍歷的表，驅動表的每一行都要到另一個表中尋找相應的記錄，然後計算返回最終資料。驅動表的概念只在nested l

Oracle優化器、優化模式、表的連線方式（Hash Join、Nested Loop、Sort Merge Join）

查詢優化器 Oracle的查詢優化器（QO）分為兩種： 1. RBO：Ruled-Based Optimization，基於規則的優化器； 2. CBO ：Cost-Based Optimization，基於代價的優化器；從 Orac

Merge Join vs. Hash Join vs. Nested Loop

Nested Loop，Hash Join，Merge Join介紹 Nested Loop: 對於被連線的資料子集較小的情況，Nested Loop是個較好的選擇。Nested Loop就是掃描一個表（外表），每讀到一條記錄，就根據Join欄位上的索引去另一張表（內表）裡面查詢，若Join欄位上沒

Merge join、Hash join、Nested loop join對比分析

SQL server 內部實現了三種類型的內連線運算，大多數人從來沒有聽說過這些連線型別，因為它們不是邏輯連線也很少被用於程式碼中。那麼它們什麼時候會被用到呢？答案是要依情況而定。這就意味著要依賴於記錄集和索引。查詢優化器總是智慧的選擇最優的物理連線型別。我

多表連線的三種方式詳解 hash join、merge join、 nested loop

在多表聯合查詢的時候，如果我們檢視它的執行計劃，就會發現裡面有多表之間的連線方式。多表之間的連線有三種方式：Nested Loops，Hash Join 和 Sort Merge Join.具體適用哪種型別的連線取決於當前的優化器模式（ALL_ROWS 和 RULE）取決於表大小取決於連線列

資料庫中的三種連結策略 hash join、merge join、 nested loop

1) 巢狀連線(nested loop join) Nested loops 工作方式是迴圈從一張表中讀取資料(驅動表outer table)，然後訪問另一張表（被查詢表 inner table,通常有索引）。驅動表中的每一行與inner表中的相應記錄J

Oracle查看某個用戶下所有表的記錄總數和所有表的字段總數、記錄數

sele user details oracl sys where col 字段 rac https://blog.csdn.net/zhihaoma/article/details/78607368 如我想查看用戶M下的所有表的總記錄數： SELECT SUM(num_

Oracle資料庫Scott和HR使用者下的表字段及其含義

Scott BONUS表（工資表） ENAME是僱員姓名.最多由10個字元所組成; JOB是僱員職位最多由9個字元所組成; SAL是僱員基本工資.NUMBER表示數字位數沒有限制; COMM是獎金、提成.NUMBER表示數字位數沒有限制; 該表沒有L鍵約束和外來鍵約束，預設也沒有資料。

SparkSQL中的三種Join及其實現（broadcast join、shuffle hash join和sort merge join）

1.小表對大表（broadcast join）將小表的資料分發到每個節點上，供大表使用。executor儲存小表的全部資料，一定程度上犧牲了空間，換取shuffle操作大量的耗時，這在SparkSQL中稱作Broadcast Join Broadcast Jo

broadcast hash join和sort merge join

Join操作是資料庫和大資料計算中的高階特性，大多數場景都需要進行復雜的Join操作，本文從原理層面介紹了SparkSQL支援的常見Join演算法及其適用場景。 Join背景介紹 Join是資料庫查詢永遠繞不開的話題，傳統查詢SQL技術總體可以分為簡單操作（過濾操作-wh

Oracle inner join和where區別

1 .WHERE子句中使用的連線語句，在資料庫語言中，被稱為隱性連線。INNER JOIN……ON子句產生的連線稱為顯性連線。（其他JOIN引數也是顯性連線）WHERE 和INNER JOIN產生的連線關係，沒有本質區別，結果也一樣。但是！隱性連線隨著資料庫語言的規範和發展，已經逐漸被淘汰，比較新的資料庫語言

oracle表空間使用情況查詢和用戶下所有表情況查詢

name 表空間 data user ace char sele 文件名 row 一、查看表空間使用情況 --查詢表空間使用情況　　SELECT UPPER(F.TABLESPACE_NAME) "表空間名", D.FILE_N

Oracle 12c 插鏈式資料庫下建表空間，新建使用者及賦權SQL，解決空表導不出的問題，使用者鎖定問題，密碼過期問題。

1、連線SQLPLUS sqlplus /nolog 2、SYSDBA登入 conn / as sysdba 3、檢視PDB show pdbs; 4、將會話轉到具體某個DB下 alter session set container=dbname; 5、建立表

ORACLE閃回和恢復DROP掉的表

--恢復刪除的表DROP TABLE drop_table; 1.用如下語句查詢到這個表還在Oracle回收站中： SELECT * FROM user_recyclebin WHERE original_name='drop_table'; 2.用以下語句進行恢復： FLASHBACK TABLE dro

Oracle -- left join查詢結果不是左表的全部資料的解決方法

left join在實際應用中並不是查出資料都是左邊的全部資料，為什麼呢？看看自己的解決方法吧 SELECT T.xx, T1.xx, ... FROM xxx T LEFT JOIN xxx T1 ON T.ID

oracle 表連線方式： nested loop 巢狀迴圈和Hash Join的比較

一、建立兩張實驗用表：wireless_site.merchant和wireless_site.bb SQL> select count(*) from wireless_site.merchant; COUNT(*) ---------- 14005

oracle 資料庫中幾種連線方式執行過程（nested loop、hash join、sort order join）

簡單介紹了一下oracle 各種連線方式的執行過程，虛擬碼內容來源於pro oracle sql。 nested loop： select empno, ename, dname, loc fro

表的連線方式:NESTED LOOP、HASH JOIN、SORT MERGE JOIN（修改）

表連線方式及使用場合NESTED LOOP 巢狀迴圈連線由兩個for迴圈組成。不管什麼連線，本演算法都可以使用。連線的兩個關係，分別稱之為外層關係和內層關係，把資料塊數大的關係作為外層關係，小的關係作內層關係。分為塊巢狀迴圈連線（簡單點說，就是把已經放在記

深入理解Oracle表(5)：三大表連線方式詳解之Hash Join的定義，原理，演算法，成本，模式和點陣圖

Hash Join只能用於相等連線，且只能在CBO優化器模式下。相對於nested loop join，hash join更適合處理大型結果集 Hash Join的執行計劃第1個是hash表(build table)，第2個探查表(probe table)，

多表連線的三種方式詳解 HASH JOIN MERGE JOIN NESTED LOOP

在多表聯合查詢的時候，如果我們檢視它的執行計劃，就會發現裡面有多表之間的連線方式。之前打算在sqlplus中用執行計劃的，但是格式看起來有點亂，就用Toad 做了3個截圖。

oracle hash join和nested loop下的驅動表相關測試

原則：

分析：

實驗支撐

兩個表都沒有索引

執行計劃：（B表驅動）

A表作為驅動表

表B object_id列有索引的情況

執行計劃：

強制hash

A表驅動

B表驅動

強制nested loop

兩個都有索引的情況

相關推薦