分析比較多表查詢中的IN與JOIN

阿新 • • 發佈：2019-01-18

IN 是子查詢的關鍵字，JOIN 是連線的關鍵字，專案開發中經常會使用到多表查詢，而子查詢與連線正是實現多表查詢的重要途徑。那兩者是怎麼執行的？IN與JOIN哪個更好？下面就來分析與比較。

現在有test1與test2兩張表，都沒有任何像主鍵，外來鍵那樣的約束，且只有一個欄位。兩張表是非相關的。

這裡寫圖片描述

現在使用IN關鍵字實現子查詢，test2作為子查詢表（外部表）：

這裡寫圖片描述

檢視執行計劃：

這裡寫圖片描述

使用JOIN關鍵字實現連線，同樣test2作為外部表：

這裡寫圖片描述

檢視執行計劃：

這裡寫圖片描述

分析：

使用IN子查詢實現多表查詢時，從執行計劃可以看出，整個查詢分成3個部分，id = 1的查詢有兩個，id = 2的查詢有一個。id大的級別高，優先進行查詢。id = 2的查詢對應的是test2（子查詢表）的FTS。然後進行id = 1的查詢，同級別的查詢從上往下順序執行。計劃中顯示這個查詢是個子查詢（subquery），同時查詢test1的時候，使用到join buffer(Blocked Nested Loop)，即連線緩衝(阻塞的巢狀迴圈)。

使用JOIN連線實現多表查詢時，先查詢test2表（外部表），幾乎與IN的方式一樣（FTS），再查詢test1表，也與IN的方式一樣，都用到了join buffer(Blocked Nested Loop)
總結一下，非相關（無索引）的多表查詢中，使用IN與JOIN的查詢都是先將外部表的查詢結果加入到連線緩衝區，再從內部表拿取資料進入緩衝區進行比較（巢狀迴圈）。查詢計劃幾乎沒有區別。但是，IN存在優先順序的關係，比JOIN多了一次subquery的查詢，在這種情況下，JOIN更優。

現在在test1表中新增主鍵（索引），在test2表中新增外來鍵約束（索引），兩張表是相關的。

這裡寫圖片描述

進行同樣的查詢，返回結果是一樣的：

這裡寫圖片描述

檢視IN方式的執行計劃：

這裡寫圖片描述

檢視JOIN方式的執行計劃：

這裡寫圖片描述

分析：

現在使用IN方式進行查詢時，不再像非相關那樣顯示子查詢subquery了（若是子查詢會有不同的優先順序），而是有個參照的過程！先借助索引對外部表test2進行掃描；再借助索引對test1進行掃描，其中參照了test2的id列。
使用JOIN方式也是一樣有一個參照的過程！
這時兩種方式的查詢也沒有用到上面所說的連線緩衝區與阻塞巢狀迴圈。
總結一下，當兩張表相關（外來鍵相連）時，無論是IN還是JOIN，聯合查詢都是一個參照的過程。

寫到這裡，似乎IN與JOIN在表相關（邏輯外來鍵）的時候，並不知道哪個更優，下面就來實踐一下。

實際應用：

下面使用MySQL的示例資料庫sakila（customer表中有599個顧客資訊，主鍵為customer_id。rental表中有16044行資料，其中的主鍵為rental_id，外來鍵列customer_id參考customer表中的主鍵）分別執行IN與JOIN實現多表查詢：

IN查詢語句：SELECT CONCAT(first_name,last_name) FROM customer WHERE customer_id IN (SELECT customer_id FROM rental WHERE rental_id <=16000);

結果（返回了599條客戶名字資訊）：

這裡寫圖片描述

慢查詢日誌：

# Time: 160717 21:17:58
# [email protected]: root[root] @ localhost [127.0.0.1]  Id:    17
# Query_time: 0.000000  Lock_time: 0.000000 Rows_sent: 599  Rows_examined: 1198
use sakila;
SET timestamp=1468761478;
SELECT CONCAT(first_name,last_name) FROM customer WHERE customer_id IN (SELECT customer_id FROM rental WHERE rental_id <=16000);

JOIN查詢語句：SELECT CONCAT(first_name,last_name) FROM customer AS a INNER JOIN rental AS b ON a.customer_id = b.customer_id WHERE rental_id<=16000;

結果（返回了15995行資料，發現裡面有很多重複的名字）：

這裡寫圖片描述

慢查詢日誌：

# Time: 160717 21:19:17
# [email protected]: root[root] @ localhost [127.0.0.1]  Id:    18
# Query_time: 0.030000  Lock_time: 0.000000 Rows_sent: 15995  Rows_examined: 16643
SET timestamp=1468761557;
SELECT CONCAT(first_name,last_name) FROM customer AS a INNER JOIN rental AS b ON a.customer_id = b.customer_id WHERE rental_id<=16000;

使用DISTINCT關鍵字去重的JOIN查詢語句：SELECT DISTINCT CONCAT(first_name,last_name) FROM customer AS a INNER JOIN rental AS b ON a.customer_id = b.customer_id WHERE rental_id <=16000;

這裡寫圖片描述

慢查詢日誌：

# Time: 160717 21:20:31
# [email protected]: root[root] @ localhost [127.0.0.1]  Id:    19
# Query_time: 0.010000  Lock_time: 0.000000 Rows_sent: 599  Rows_examined: 1797
SET timestamp=1468761631;
SELECT DISTINCT CONCAT(first_name,last_name) FROM customer AS a INNER JOIN rental AS b ON a.customer_id = b.customer_id WHERE rental_id <=16000;

分析：

由於rental表的customer_id列作為外來鍵列，參照的是customer表的主鍵customer_id。因此在該查詢上兩張表是相關表。上面已經分析了這樣的IN與JOIN實現多表查詢就不存在連線緩衝與阻塞的巢狀迴圈。但都是通過參照的關係進行查詢。
通過比較查詢時間（SQL效率）與檢索行數（磁碟IO），在這種情況下我會選擇IN進行查詢。

分析比較多表查詢中的IN與JOIN

分析比較多表查詢中的IN與JOIN

多表查詢(內連線與外連線的混合使用)(union聯合)

Oracle學習之路（二）：oracle多表查詢+分組查詢+子查詢講解與案例分析+經典練習題

Hibernate中的HQL的基本常用小例子，單表查詢與多表查詢

MySQL 多表查詢實現分析

sql-多表查詢JOIN與分組GROUP BY

oracle的多表查詢與表的連接

【java專案】mybatis中的mapper查詢時返回其他實體（多用於多表查詢）

django之多表查詢與創建

Day055--MySQL--外來鍵的變種,表與表的關係,單表查詢,多表查詢, 內連線,左右連線,全外連線

Mysql 索引與多表查詢效能優化

MySQL 多表查詢學習與練習

多表查詢、外來鍵、表與表之間的關係

Java面試題：Hibernate的二級快取與Hibernate多表查詢

MyBatis中實現多表查詢

SQL查詢中in和exists的區別分析

Hibernate的hql多表查詢取其中物件，in語句

MySQL 多表結構的建立與分析

Oracle 多表查詢分析

[資料庫]MySql單表多表查詢常用技巧（不斷更新中）

分析比較多表查詢中的IN與JOIN

相關推薦