mysql資料庫中 IN 和 EXISTS 的誤區

阿新 • • 發佈：2018-11-02

前言：最近在看《高效能mysql第三版》這本書，讀到子查詢優化那章，書中說mysql會將in子查詢改寫成exists查詢（書中基於的mysql版本是5.1.50和5.5），於是乎我又上網找了下資料，發現網上說法幾乎都是：

in 子查詢是把外表和內表hash關聯，先查詢內表，再把內表結果與外表匹配，對外表使用索引（外表效率高，可用大表），而內表多大都需要查詢，不可避免，故外表大的使用in，可加快效率。

exists 是對外表做loop迴圈，每次loop迴圈再對內表（子查詢）進行查詢，那麼因為對內表的查詢使用的索引（內表效率高，故可用大表），而外表有多大都需要遍歷，不可避免（儘量用小表），故內表大的使用exists，可加快效率；

發現竟然和書上說的不一樣，因為按照書上說所，in 和 exists 應該是一樣的（會重寫 in 查詢為 exists ) ，於是想在本地mysql測試一下，本地裝的是5.7版本，資料庫中有兩個表 userinfo 和 syslog 表：

這裡使用兩個表的主鍵id進行關聯，sql 和分析計劃表如下：

explain  select * from syslog where id in(select id from userinfo);

show WARNINGS;

可以看到優先執行userinfo表，再去和syslog進行比對，看起來似乎和網上說的一樣，接著我們將順序顛倒：

explain  select * from userinfo where id in(select id from syslog);

show WARNINGS;

結果竟然和上面執行計劃執行順序是一致的？？？我們開啟結果二那一欄檢視mysql優化器將sql重寫後的結果，分別如下：

原SQL：
select * from syslog where id in(select id from userinfo);
優化後的SQL：
/* select#1 */
SELECT
	`test`.`syslog`.`id` AS `id`,
	`test`.`syslog`.`user_name` AS `user_name`,
	`test`.`syslog`.`type` AS `type`,
	`test`.`syslog`.`operation` AS `operation`,
	`test`.`syslog`.`method` AS `method`,
	`test`.`syslog`.`params` AS `params`,
	`test`.`syslog`.`ip` AS `ip`,
	`test`.`syslog`.`operation_time` AS `operation_time`
FROM
	`test`.`userinfo`
JOIN `test`.`syslog`
WHERE
	(
		`test`.`syslog`.`id` = `test`.`userinfo`.`id`
	)

原SQL：
select * from userinfo where id in(select id from syslog);
優化後的SQL：
/* select#1 */
SELECT
	`test`.`userinfo`.`id` AS `id`,
	`test`.`userinfo`.`user_id` AS `user_id`,
	`test`.`userinfo`.`user_name` AS `user_name`,
	`test`.`userinfo`.`age` AS `age`,
	`test`.`userinfo`.`gender` AS `gender`,
	`test`.`userinfo`.`address` AS `address`,
	`test`.`userinfo`.`user_pass` AS `user_pass`
FROM
	`test`.`syslog`
JOIN `test`.`userinfo`
WHERE
	(
		`test`.`userinfo`.`id` = `test`.`syslog`.`id`
	)

可以看到 mysql將兩個in子查詢全都改寫成了內連線查詢 ，這也就可以解釋兩個分析計劃表為什麼總是先查詢userinfo表了，因為在內連線的情況下mysql優化器始終會先訪問資料量小的那張表，這樣可以減少不必要的IO。

第一個sql改寫後首先執行的是 select id from userinfo 使用了主鍵覆蓋索引（Extra 為 using index），將查詢的結果和 syslog 進行匹配，所以syslog表使用了主鍵索引+where條件過濾（Extra 為 using Where）。

第二個sql改寫後首先執行的的是 select * from userinfo ，所以計劃中顯示的是全表掃描，然後將查詢後的結果和 syslog 進行匹配，這裡因為查詢的是select id from syslog where id = ? ，所以計劃中顯示是覆蓋索引+where條件過濾（Extra 為 using where + using index)。

我們再來看一下 exists 的分析情況：

explain select * from syslog where exists(select * from userinfo where userinfo.id = syslog.id);

explain select * from userinfo where exists(select * from syslog where syslog.id = userinfo.id);

可以看到exists查詢是一個相關子查詢，內部的查詢需要依賴外部的查詢結果，所以兩個sql的分析計劃都是先將外部的表進行全表掃描再和子查詢表進行比對，如果外部的表資料量小的話效能可能不會太差，資料量大的情況下效能會非常糟糕。

結論：1、mysql5.5以前會將 in 子查詢改寫成 exists 查詢，如果外部表資料量大的情況下效能會非常糟糕。

2、mysql5.7（5.6沒有測過，感興趣的同學可以測測）對 in 子查詢進行了優化，會將sql改寫成 join 連線，這樣優化器就可以始終優先訪問資料量小的表格，減少IO，效能和直接寫連線查詢幾乎是一樣的（這點和網上書上說的是有出入的）。

3、exists查詢會被分解成一個外部查詢和相關子查詢（DEPENDENT SUBQUERY），這樣子查詢會依賴於外部查詢的結果，所以始終會對外部表進行全表掃描，外部表資料量大的時候要尤其注意。

mysql資料庫中 IN 和 EXISTS 的誤區

前言：最近在看《高效能mysql第三版》這本書，讀到子查詢優化那章，書中說mysql會將in子查詢改寫成exists查詢（書中基於的mysql版本是5.1.50和5.5），於是乎我又上網找了下資料，發現網上說法幾乎都是： &

mysql 中in和exists的區別

有兩張表：student 和 studentcource student 表 studentcource 表需求：查詢所有成績小宇60分的同學 in 原理： 1、先查詢 <60 學生得到student_id列表 select student_id

面試被問之-----sql優化中in與exists的區別 Mysql中 in or exists not exists not in區別（網路整理） Sql語句中IN和exists的區別及應用 [筆記] SQL效能優化 - 避免使用 IN 和 NOT IN

曾經一次去面試,被問及in與exists的區別,記得當時是這麼回答的:''in後面接子查詢或者(xx,xx,xx,,,),exists後面需要一個true或者false的結果",當然這麼說也不算錯,但別人想聽的是sql優化相關,肯定是效率的問題,只是那個時候確實不知道它們在sql優化上的區別,只知道用in會進

mysql資料庫中 IN 和 EXISTS 的誤區

mysql資料庫中 IN 和 EXISTS 的誤區

mysql 中in和exists的區別

面試被問之-----sql優化中in與exists的區別 Mysql中 in or exists not exists not in區別（網路整理） Sql語句中IN和exists的區別及應用 [筆記] SQL效能優化 - 避免使用 IN 和 NOT IN

Sql語句中IN和exists的區別及應用

數據庫中in和exists關鍵字的區別

sql中in和exists的使用情況

SQL查詢中in和exists的區別分析

實習工作中Sql 語句中 IN 和 EXISTS 的心得體會

SQL中IN和EXISTS用法的區別

oracle中in和exists的區別

ORACLE 中IN和EXISTS區別

SQL中in和exists的區別

MySQL資料庫中增加和刪除欄位

linux下在mysql資料庫中建立和刪除使用者

sql中in和exists的原理及使用場景。

MySQL查詢語句中的IN 和Exists 對比分析

MySQL資料庫中主鍵和外來鍵的操作

MySQL資料庫中的Date,DateTime,TimeStamp和Time型別

Mysql中 in or exists not exists not in區別（網路整理）

flask中mysql資料庫的配置和使用

mysql資料庫中 IN 和 EXISTS 的誤區

相關推薦