MySQL 執行計劃詳解
MySQL 原理篇
MySQL 索引機制
MySQL 體系結構及儲存引擎
MySQL 語句執行過程詳解
MySQL 執行計劃詳解
MySQL InnoDB 緩衝池
MySQL InnoDB 事務
MySQL InnoDB 鎖
MySQL InnoDB MVCC
MySQL InnoDB 實現高併發原理
MySQL InnoDB 快照讀在RR和RC下有何差異
我們經常使用 MySQL 的執行計劃來檢視 SQL 語句的執行效率,接下來分析執行計劃的各個顯示內容。
EXPLAIN SELECT * FROM users WHERE id IN (SELECT userID FROMuser_address WHERE address = "湖南長沙麓谷") ;
執行計劃的 id
select 查詢的序列號,標識執行的順序
- id 相同,執行順序由上至下
- id 不同,如果是子查詢,id 的序號會遞增,id 值越大優先順序越高,越先被執行
執行計劃的 select_type
查詢的型別,主要是用於區分普通查詢、聯合查詢、子查詢等。
- SIMPLE:簡單的 select 查詢,查詢中不包含子查詢或者 union
- PRIMARY:查詢中包含子部分,最外層查詢則被標記為 primary
- SUBQUERY/MATERIALIZED:SUBQUERY 表示在 select 或 where 列表中包含了子查詢,MATERIALIZED:表示 where 後面 in 條件的子查詢
- UNION:表示 union 中的第二個或後面的 select 語句
- UNION RESULT:union 的結果
對於 UNION 和 UNION RESULT 可以通過下面的例子展現:
EXPLAIN SELECT * FROM users WHERE id IN(1, 2) UNION SELECT * FROM users WHERE id IN(3, 4);
執行計劃的 table
查詢涉及到的表。
- 直接顯示錶名或者表的別名
- <unionM,N> 由 ID 為 M,N 查詢 union 產生的結果
- <subqueryN> 由 ID 為 N 查詢產生的結果
執行計劃的 type
訪問型別,SQL 查詢優化中一個很重要的指標,結果值從好到壞依次是:system > const > eq_ref > ref > range > index > ALL。
- system:系統表,少量資料,往往不需要進行磁碟IO
- const:常量連線
- eq_ref:主鍵索引(primary key)或者非空唯一索引(unique not null)等值掃描
- ref:非主鍵非唯一索引等值掃描
- range:範圍掃描
- index:索引樹掃描
- ALL:全表掃描(full table scan)
下面通過舉例說明。
system
explain select * from mysql.time_zone;
上例中,從系統庫 MySQL 的系統表 time_zone 裡查詢資料,訪問型別為 system,這些資料已經載入到記憶體裡,不需要進行磁碟 IO,這類掃描是速度最快的。
explain select * from (select * from user where id=1) tmp;
再舉一個例子,內層巢狀(const)返回了一個臨時表,外層巢狀從臨時表查詢,其掃描型別也是 system,也不需要走磁碟 IO,速度超快。
const
資料準備:
CREATE TABLE `user` ( `id` int(11) NOT NULL, `NAME` varchar(20) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi');
explain select * from user where id=1;
const 掃描的條件為:
- 命中主鍵(primary key)或者唯一(unique)索引
- 被連線的部分是一個常量(const)值
如上例,id 是 主鍵索引,連線部分是常量1。
eq_ref
資料準備:
CREATE TABLE `user` ( `id` int(11) NOT NULL, `NAME` varchar(20) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); CREATE TABLE `user_ex` ( `id` int(11) NOT NULL, `age` int(11) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user_ex values(1,18); insert into user_ex values(2,20); insert into user_ex values(3,30); insert into user_ex values(4,40); insert into user_ex values(5,50);
EXPLAIN SELECT * FROM USER,user_ex WHERE user.id=user_ex.id;
eq_ref 掃描的條件為,對於前表的每一行(row),後表只有一行被掃描。
再細化一點:
- join 查詢
- 命中主鍵(primary key)或者非空唯一(unique not null)索引
- 等值連線;
如上例,id 是主鍵,該 join 查詢為 eq_ref 掃描。
ref
資料準備:
CREATE TABLE `user` ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL, KEY `id` (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); CREATE TABLE `user_ex` ( `id` int(11) DEFAULT NULL, `age` int(11) DEFAULT NULL, KEY `id` (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user_ex values(1,18); insert into user_ex values(2,20); insert into user_ex values(3,30); insert into user_ex values(4,40); insert into user_ex values(5,50);
EXPLAIN SELECT * FROM USER,user_ex WHERE user.id=user_ex.id;
如果把上例 eq_ref 案例中的主鍵索引,改為普通非唯一(non unique)索引。就由 eq_ref 降級為了 ref,此時對於前表的每一行(row),後表可能有多於一行的資料被掃描。
select * from user where id=1;
當 id 改為普通非唯一索引後,常量的連線查詢,也由 const 降級為了 ref,因為也可能有多於一行的資料被掃描。
ref 掃描,可能出現在 join 裡,也可能出現在單表普通索引裡,每一次匹配可能有多行資料返回,雖然它比 eq_ref 要慢,但它仍然是一個很快的 join 型別。
range
資料準備:
CREATE TABLE `user` ( `id` int(11) NOT NULL, `name` varchar(20) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); insert into user values(4,'wangwu'); insert into user values(5,'zhaoliu');
explain select * from user where id between 1 and 4; explain select * from user where id in(1,2,3); explain select * from user where id > 3;
range 掃描就比較好理解了,它是索引上的範圍查詢,它會在索引上掃碼特定範圍內的值。
像上例中的 between,in,> 都是典型的範圍(range)查詢。
index
explain count (*) from user;
如上例,id 是主鍵,該 count 查詢需要通過掃描索引上的全部資料來計數,它僅比全表掃描快一點。
ALL
資料準備:
CREATE TABLE `user` ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user values(1,'shenjian'); insert into user values(2,'zhangsan'); insert into user values(3,'lisi'); CREATE TABLE `user_ex` ( `id` int(11) DEFAULT NULL, `age` int(11) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; insert into user_ex values(1,18); insert into user_ex values(2,20); insert into user_ex values(3,30); insert into user_ex values(4,40); insert into user_ex values(5,50);
explain select * from user,user_ex where user.id=user_ex.id;
如果 id 上不建索引,對於前表的每一行(row),後表都要被全表掃描。
文章中,這個相同的 join 語句出現了三次:
- 掃描型別為 eq_ref,此時 id 為主鍵
- 掃描型別為 ref,此時 id 為非唯一普通索引
- 掃描型別為 ALL,全表掃描,此時id上無索引
有此可見,建立正確的索引,對資料庫效能的提升是多麼重要。
總結
- explain 結果中的 type 欄位,表示(廣義)連線型別,它描述了找到所需資料使用的掃描方式;
- 常見的掃描型別有:system>const>eq_ref>ref>range>index>ALL,其掃描速度由快到慢;
- 各類掃描型別的要點是:
- system 最快:不進行磁碟 IO
- const:PK 或者 unique 上的等值查詢
- eq_ref:PK 或者 unique 上的 join 查詢,等值匹配,對於前表的每一行,後表只有一行命中
- ref:非唯一索引,等值匹配,可能有多行命中
- range:索引上的範圍掃描,例如:between、in、>
- index:索引上的全集掃描,例如:InnoDB 的 count
- ALL 最慢:全表掃描
- 建立正確的索引,非常重要;
- 使用 explain 瞭解並優化執行計劃,非常重要;
執行計劃 possible_keys
查詢過程中有可能用到的索引。
執行計劃 key
實際使用的索引,如果為 NULL ,則沒有使用索引。
執行計劃 rows
根據表統計資訊或者索引選用情況,大致估算出找到所需的記錄所需要讀取的行數。
執行計劃 filtered
表示返回結果的行數佔需讀取行數的百分比, filtered 的值越大越好。
執行計劃 Extra
十分重要的額外資訊。
- Using filesort:MySQL 對資料使用一個外部的檔案內容進行了排序,而不是按照表內的索引進行排序讀取。
- Using temporary:使用臨時表儲存中間結果,也就是說 MySQL 在對查詢結果排序時使用了臨時表,常見於order by 或 group by。
- Using index:表示 SQL 操作中使用了覆蓋索引(Covering Index),避免了訪問表的資料行,效率高。
- Using index condition:表示 SQL 操作命中了索引,但不是所有的列資料都在索引樹上,還需要訪問實際的行記錄。
- Using where:表示 SQL 操作使用了 where 過濾條件。
- Select tables optimized away:基於索引優化 MIN/MAX 操作或者 MyISAM 儲存引擎優化 COUNT(*) 操作,不必等到執行階段再進行計算,查詢執行計劃生成的階段即可完成優化。
- Using join buffer (Block Nested Loop):表示 SQL 操作使用了關聯查詢或者子查詢,且需要進行巢狀迴圈計算。
下面通過舉例說明。
資料準備:
CREATE TABLE `user` ( `id` int(11) NOT NULL, `name` varchar(20) DEFAULT NULL, `sex` varchar(5) DEFAULT NULL, PRIMARY KEY (`id`), KEY `name` (`name`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; insert into user values(1, 'shenjian','no'); insert into user values(2, 'zhangsan','no'); insert into user values(3, 'lisi', 'yes'); insert into user values(4, 'lisi', 'no');
資料說明:
使用者表:id 主鍵索引,name 普通索引(非唯一),sex 無索引。
四行記錄:其中 name 普通索引存在重複記錄 lisi。
Using filesort
explain select * from user order by sex;
Extra 為 Using filesort 說明,得到所需結果集,需要對所有記錄進行檔案排序。
這類 SQL 語句效能極差,需要進行優化。
典型的,在一個沒有建立索引的列上進行了 order by,就會觸發 filesort,常見的優化方案是,在 order by 的列上新增索引,避免每次查詢都全量排序。
Using temporary
explain select * from user group by name order by sex;
Extra 為 Using temporary 說明,需要建立臨時表(temporary table)來暫存中間結果。
這類 SQL 語句效能較低,往往也需要進行優化。
典型的 group by 和 order by 同時存在,且作用於不同的欄位時,就會建立臨時表,以便計算出最終的結果集。
臨時表存在兩種引擎,一種是 Memory 引擎,一種是 MyISAM 引擎,如果返回的資料在 16M 以內(預設),且沒有大欄位的情況下,使用 Memory 引擎,否則使用 MyISAM 引擎。
Using index
EXPLAIN SELECT id FROM USER;
Extra 為 Using index 說明,SQL 所需要返回的所有列資料均在一棵索引樹上,而無需訪問實際的行記錄。
這類 SQL 語句往往效能較好。
Using index condition
explain select id, name, sex from user where name='shenjian';
Extra 為 Using index condition 說明,確實命中了索引,但不是所有的列資料都在索引樹上,還需要訪問實際的行記錄。
這類 SQL 語句效能也較高,但不如 Using index。
Using where
explain select * from user where sex='no';
Extra 為 Using where 說明,查詢的結果集使用了 where 過濾條件,比如上面的 SQL 使用了 sex = 'no'
的過濾條件
Select tables optimized away
EXPLAIN SELECT MAX(id) FROM USER;
比如上面的語句查詢 id 的最大值,因為 id 是主鍵索引,根據 B+Tree 的結構,天然就是有序存放的,所以不需要等到執行階段再進行計算,查詢執行計劃生成的階段即可完成優化。
Using join buffer (Block Nested Loop)
explain select * from user where id in (select id from user where sex='no');
Extra 為 Using join buffer (Block Nested Loop) 說明,需要進行巢狀迴圈計算。內層和外層的 type 均為 ALL,rows 均為4,需要迴圈進行4*4次計算。
這類 SQL 語句效能往往也較低,需要進行優化。
典型的兩個關聯表 join,關聯欄位均未建立索引,就會出現這種情況。常見的優化方案是,在關聯欄位上新增索引,避免每次巢狀迴圈計算。
參考
《同一個SQL語句,為啥效能差異咋就這麼大呢?(1分鐘系列)》
《如何利用工具,迅猛定位低效SQL? | 1分鐘系