MySql索引SQL優化,Explain
EXPLAIN
使用EXPLAIN關鍵字可以模擬優化器執行SQL語句,從而知道MySQL是 如何處理你的SQL語句的。分析你的查詢語句或是結構的效能瓶頸
示例
在 select 語句之前增加 explain 關鍵字,MySQL 會在查詢上設定一個標記,執行查詢時,會返回執行計劃的資訊,而不是執行這條SQL(如果 from 中包含子查詢,仍會執行該子查詢,將結果放入臨時表中)
**使用的表和資料 **
DROP TABLE IF EXISTS `actor`;
CREATE TABLE `actor` (
`id` int(11) NOT NULL,
`name` varchar(45) DEFAULT NULL,
`update_time` datetime DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `actor` (`id`, `name`, `update_time`) VALUES (1,'a','2020-12-22 15:27:18'), (2,'b','2020-12-22 15:27:18'), (3,'c','2020-12-22 15:27:18');
DROP TABLE IF EXISTS `film`;
CREATE TABLE `film` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `film` (`id`, `name`) VALUES (3,'film0'),(1,'film1'),(2,'film2');
DROP TABLE IF EXISTS `film_actor`;
CREATE TABLE `film_actor` (
`id` int(11) NOT NULL,
`film_id` int(11) NOT NULL,
`actor_id` int(11) NOT NULL,
`remark` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `film_actor` (`id`, `film_id`, `actor_id`) VALUES (1,1,1),(2,1,2),(3,2,1);
示例
mysql> `explain select * from actor;`
在查詢中的每個表會輸出一行,如果有兩個表通過 join 連線查詢,那麼會輸出兩行。表的意義相當廣泛:可以是子查詢、一個 union 結果等。
explain 兩個變種:
1. explain extended
會在 explain 的基礎上額外提供一些查詢優化的資訊。緊隨其後通過 show warnings
命令可以 得到優化後的查詢語句,從而看出優化器優化了什麼。額外還有 filtered 列,是一個半分比的值,rows * filtered/100 可以估算出將要和 explain 中前一個表進行連線的行數(前一個表指 explain 中的id值比當前表id值小的表)。
mysql> explain extended select * from film where id = 1;
mysql> show warnings;
2. explain partitions
相比 explain 多了個 partitions 欄位,如果查詢是基於分割槽表的話,會顯示查詢將訪問的分割槽。
explain 中的列
較為重要的列(select_type, type, key, extra)
1. id列
id列的編號是 select 的序列號,有幾個 select 就有幾個id,並且id的順序是按 select 出現的順序增長的。MySQL將 select 查詢分為簡單查詢(SIMPLE)和複雜查詢(PRIMARY)。
複雜查詢分為三類:
- 簡單子查詢
- 派生表(from語句中的子查詢)
- union 查詢。
id列越大執行優先順序越高,id相同則從上往下執行,id為NULL最後執行
1)簡單子查詢
mysql> explain select (select 1 from actor limit 1) from film;
2)from子句中的子查詢
mysql> explain select id from (select id from film) as der;
這個查詢執行時有個臨時表別名為der,外部 select 查詢引用了這個臨時表
3)union查詢
mysql> explain select 1 union all select 1;
union結果總是放在一個匿名臨時表中,臨時表不在SQL中出現,因此它的id是NULL。
2. select_type列
select_type 表示對應行是簡單還是複雜的查詢,如果是複雜的查詢,又是上述三種複雜查詢中的哪一種。
1)simple:簡單查詢。查詢不包含子查詢和union
mysql> explain select * from film where id = 2;
2)primary:複雜查詢中最外層的 select
3)subquery:包含在 select 中的子查詢(不在 from 子句中)
4)derived:包含在 from 子句中的子查詢。MySQL會將結果存放在一個臨時表中,也稱為派生表(derived的英文含義)
用這個例子來了解 primary、subquery 和 derived 型別
mysql> set session optimizer_switch='derived_merge=off'; #關閉mysql5.7新特性對衍生表的合併優化
mysql> explain select (select 1 from actor where id = 1) from (select * from film where id = 1) der;
5)union:在 union 中的第二個和隨後的 select
6)union result:從 union 臨時表檢索結果的 select
用這個例子來了解 union 和 union result 型別:
mysql> explain select 1 union all select 1;
3. table列
這一列表示 explain 的一行正在訪問哪個表。
當 from 子句中有子查詢時,table列是 格式,表示當前查詢依賴 id=N 的查詢,於是先執行 id=N 的查詢。
當有 union 時,UNION RESULT 的 table 列的值為<union1,2>,1和2表示參與 union 的 select 行id。
4. type列
這一列表示關聯型別或訪問型別,即MySQL決定如何查詢表中的行,查詢資料行記錄的大概範圍。依次從最優到最差分別為:system > const > eq_ref > ref > range > index > ALL
一般來說,得保證查詢達到range級別,最好達到ref
1) NULL
mysql能夠在優化階段分解查詢語句,在執行階段用不著再訪問表或索引。例如:在索引列中選取最小值,可以單獨查詢索引來完成,不需要在執行時訪問表
mysql> explain select min(id) from film;
2) const, system
mysql能對查詢的某部分進行優化並將其轉化成一個常量(可以看show warnings 的結果)。用於 primary key 或 unique key 的所有列與常數比較時,所以表最多有一個匹配行,讀取1次,速度比較快。system是const的特例,表裡只有一條元組匹配時為system
mysql> explain extended select * from (select * from film where id = 1) tmp;
mysql> show warnings;
3) eq_ref
primary key 或 unique key 索引的所有部分被連線使用 ,最多隻會返回一條符合條件的記錄。這可能是在 const 之外最好的聯接型別了,簡單的 select 查詢不會出現這種 type。
mysql> explain select * from film_actor left join film on film_actor.film_id = film.id;
4) ref
相比 eq_ref,不使用唯一索引,而是使用普通索引或者唯一性索引的部分字首,索引要和某個值相比較,可能會找到多個符合條件的行。
-
簡單 select 查詢,name是普通索引(非唯一索引)
mysql> explain select * from film where name = "film1";
- 關聯表查詢,idx_film_actor_id是film_id和actor_id的聯合索引,這裡使用到了film_actor的左邊字首film_id部分。 mysql> explain select film_id from film left join film_actor on film.id = film_actor.film_id;
5) range
範圍掃描通常出現在 in(), between ,> ,<, >= 等操作中。使用一個索引來檢索給定範圍的行。
mysql> explain select * from actor where id > 1;
6) index
掃描全表索引,這通常比ALL快一些。(index是從索引中讀取的,而all是從硬碟中讀取)
mysql> explain select * from film;
7) ALL
即全表掃描,意味著mysql需要從頭到尾去查詢所需要的行。通常情況下這需要增加索引來進行優化了
mysql> explain select * from actor;
5. possible_keys列
這一列顯示查詢可能使用哪些索引來查詢。
explain 時可能出現 possible_keys 有列,而 key 顯示 NULL 的情況,這種情況是因為表中資料不多,mysql認為索引對此查詢幫助不大,選擇了全表查詢。
如果該列是NULL,則沒有相關的索引。在這種情況下,可以通過檢查 where 子句看是否可以創造一個適當的索引來提高查詢效能,然後用 explain 檢視效果。
6. key列
這一列顯示mysql實際採用哪個索引來優化對該表的訪問。
如果沒有使用索引,則該列是 NULL。如果想強制mysql使用或忽視possible_keys列中的索引,在查詢中使用 force index、ignore index。
7. key_len列
這一列顯示了mysql在索引裡使用的位元組數,通過這個值可以算出具體使用了索引中的哪些列。
舉例來說,film_actor的聯合索引 idx_film_actor_id 由 film_id 和 actor_id 兩個int列組成,並且每個int是4位元組。通過結果中的key_len=4可推斷出查詢使用了第一個列:film_id列來執行索引查詢。
mysql> explain select * from film_actor where film_id = 2;
-
key_len計算規則如下:
-
l 字串
- char(n):n位元組長度
- varchar(n):2位元組儲存字串長度,如果是utf-8,則長度 3n + 2
-
數值型別
-
tinyint:1位元組
-
smallint:2位元組
-
int:4位元組
-
bigint:8位元組
-
-
時間型別
- date:3位元組
- timestamp:4位元組
- datetime:8位元組
-
如果欄位允許為 NULL,需要1位元組x是否為 NULL
-
索引最大長度是768位元組,當字串過長時,mysql會做一個類似左字首索引的處理,將前半部分的字元提取出來做索引。
8. ref列
這一列顯示了在key列記錄的索引中,表查詢值所用到的列或常量,常見的有:const(常量),欄位名(例:film.id)
9. rows列
這一列是mysql估計要讀取並檢測的行數,注意這個不是結果集裡的行數。
10. Extra列
這一列展示的是額外資訊。常見的重要值如下:
1) Using index
查詢的列被索引覆蓋,並且where篩選條件是索引的前導列,是效能高的表現。一般是使用了覆蓋索引(索引包含了所有查詢的欄位)。對於innodb來說,如果是輔助索引效能會有不少提高
mysql> explain select film_id from film_actor where film_id = 1;
2) Using where
查詢的列未被索引覆蓋,where篩選條件非索引的前導列
mysql> explain select * from actor where name = 'a';
3) Using where Using index
查詢的列被索引覆蓋,並且where篩選條件是索引列之一但是不是索引的前導列,意味著無法直接通過索引查詢來查詢到符合條件的資料
mysql> explain select film_id from film_actor where actor_id = 1;
4) NULL
查詢的列未被索引覆蓋,並且where篩選條件是索引的前導列,意味著用到了索引,但是部分欄位未被索引覆蓋,必須通過“回表”來實現,不是純粹地用到了索引,也不是完全沒用到索引
mysql>explain select * from film_actor where film_id = 1;
5) Using index condition
與Using where類似,查詢的列不完全被索引覆蓋,where條件中是一個前導列的範圍;
mysql> explain select * from film_actor where film_id > 1;
6) Using temporary
mysql需要建立一張臨時表來處理查詢。出現這種情況一般是要進行優化的,首先是想到用索引來優化。
-
actor.name沒有索引,此時建立了張臨時表來distinct
mysql> explain select distinct name from actor;
-
film.name建立了idx_name索引,此時查詢時extra是using index,沒有用臨時表
mysql> explain select distinct name from film;
7) Using filesort
mysql 會對結果使用一個外部索引排序,而不是按索引次序從表裡讀取行。此時mysql會根據聯接型別瀏覽所有符合條件的記錄,並儲存排序關鍵字和行指標,然後排序關鍵字並按順序檢索行資訊。這種情況下一般也是要考慮使用索引來優化的。
-
actor.name未建立索引,會瀏覽actor整個表,儲存排序關鍵字name和對應的id,然後排序name並檢索行記錄
mysql> explain select * from actor order by name;
-
film.name建立了idx_name索引,此時查詢時extra是using index
mysql> explain select * from film order by name;
索引最佳實踐
使用的表
CREATE TABLE `employees` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
`age` int(11) NOT NULL DEFAULT '0' COMMENT '年齡',
`position` varchar(20) NOT NULL DEFAULT '' COMMENT '職位',
`hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入職時間',
PRIMARY KEY (`id`),
KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='員工記錄表';
INSERT INTO employees(name,age,position,hire_time) VALUES('LiLei',22,'manager',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('HanMeimei', 23,'dev',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('Lucy',23,'dev',NOW());
最佳實踐
1. 全值匹配
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei';
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22;
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
2. 最佳左字首法則
如果索引了多列,要遵守最左字首法則。指的是查詢從索引的最左前列開始並且不跳過索引中的列。
EXPLAIN SELECT * FROM employees WHERE age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE position = 'manager';
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
3. 不在索引列上做任何操作(計算、函式、(自動or手動)型別轉換),會導致索引失效而轉向全表掃描
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';
給hire_time增加一個普通索引:
ALTER TABLE `employees`
ADD INDEX `idx_hire_time` (`hire_time`) USING BTREE ;
EXPLAIN select * from employees where date(hire_time) ='2020-09-30';
轉化為日期範圍查詢,會走索引:
EXPLAIN select * from employees where hire_time >='2020-09-30 00:00:00' and hire_time <='2020-09-30 23:59:59';
還原最初索引狀態 ,(下面案例不需要這個索引)
1 ALTER TABLE `employees` 2 DROP INDEX `idx_hire_time`;
4. 儲存引擎不能使用索引中範圍條件右邊的列
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';
5. 儘量使用覆蓋索引(只訪問索引的查詢(索引列包含查詢列)),減少select *語句
EXPLAIN SELECT name,age FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
6. mysql在使用不等於(!=或者<>)的時候無法使用索引會導致全表掃描
EXPLAIN SELECT * FROM employees WHERE name != 'LiLei'
7. is null,is not null 也無法使用索引
EXPLAIN SELECT * FROM employees WHERE name is null
8. like以萬用字元開頭(’$abc…’)mysql索引失效會變成全表掃描操作
EXPLAIN SELECT * FROM employees WHERE name like '%Lei'
EXPLAIN SELECT * FROM employees WHERE name like 'Lei%'
問題:解決like’%字串%'索引不被使用的方法?
- 使用覆蓋索引,查詢欄位必須是建立覆蓋索引欄位
EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';
- 如果不能使用覆蓋索引則可能需要藉助搜尋引擎
- 當覆蓋索引指向的欄位是varchar(380)及380以上的欄位時,覆蓋索引會失效!
9. 字串不加單引號索引失效
EXPLAIN SELECT * FROM employees WHERE name = '1000';
EXPLAIN SELECT * FROM employees WHERE name = 1000;
10. 少用or,用它連線時很多情況下索引會失效
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' or name = 'HanMeimei';
11.範圍查詢優化
給年齡新增單值索引
ALTER TABLE `employees`
ADD INDEX `idx_age` (`age`) USING BTREE ;
explain select * from employees where age >=1 and age <=2000;
沒走索引原因:mysql內部優化器會根據檢索比例、表大小等多個因素整體評估是否使用索 引。比如這個例子,可能是由於單次資料量查詢過大導致優化器最終選擇不走索引
優化方法:可以講大的範圍拆分成多個小範圍
explain select * from employees where age >=1 and age <=1000;
explain select * from employees where age >=1001 and age <=2000;
還原最初索引狀態
ALTER TABLE `employees`
DROP INDEX `idx_age`;
總結
假設index(a, b, c)
where語句 | 索引是否使用 |
---|---|
where a =3 | Y, 使用到a |
where a =3 and b=5 | Y, 使用到a, b |
where a =3 and b=5 and c=4 | Y, 使用到a, b, c |
where a =3 或 where a =3 and c=4 或 where c=4 | N |
where a =3 and c=5 | Y, 使用到a, 但是c不可以, b中間斷了 |
where a =3 and b>4 and c=5 | Y, 使用到a和b, c不能用在範圍之後, b斷了 |
where a =3 and b like ‘kk%’ and c=4 | Y, 使用到了a, b, c |
where a =3 and b like ‘%kk’ and c=4 | Y, 使用到a |
where a =3 and b like ‘%kk%’ and c=4 | Y, 使用到a |
where a =3 and b like ‘k%kk%’ and c=4 | Y, 使用到a, b, c |
like KK%相當於=常量,%KK和%KK% 相當於範圍# EXPLAIN
使用EXPLAIN關鍵字可以模擬優化器執行SQL語句,從而知道MySQL是 如何處理你的SQL語句的。分析你的查詢語句或是結構的效能瓶頸
示例
在 select 語句之前增加 explain 關鍵字,MySQL 會在查詢上設定一個標記,執行查詢時,會返回執行計劃的資訊,而不是執行這條SQL(如果 from 中包含子查詢,仍會執行該子查詢,將結果放入臨時表中)
**使用的表和資料 **
DROP TABLE IF EXISTS `actor`;
CREATE TABLE `actor` (
`id` int(11) NOT NULL,
`name` varchar(45) DEFAULT NULL,
`update_time` datetime DEFAULT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `actor` (`id`, `name`, `update_time`) VALUES (1,'a','2020-12-22 15:27:18'), (2,'b','2020-12-22 15:27:18'), (3,'c','2020-12-22 15:27:18');
DROP TABLE IF EXISTS `film`;
CREATE TABLE `film` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(10) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_name` (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `film` (`id`, `name`) VALUES (3,'film0'),(1,'film1'),(2,'film2');
DROP TABLE IF EXISTS `film_actor`;
CREATE TABLE `film_actor` (
`id` int(11) NOT NULL,
`film_id` int(11) NOT NULL,
`actor_id` int(11) NOT NULL,
`remark` varchar(255) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `idx_film_actor_id` (`film_id`,`actor_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `film_actor` (`id`, `film_id`, `actor_id`) VALUES (1,1,1),(2,1,2),(3,2,1);
示例
mysql> `explain select * from actor;`
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-l8qcpNHE-1610023156896)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps1.jpg)]
在查詢中的每個表會輸出一行,如果有兩個表通過 join 連線查詢,那麼會輸出兩行。表的意義相當廣泛:可以是子查詢、一個 union 結果等。
explain 兩個變種:
1. explain extended
會在 explain 的基礎上額外提供一些查詢優化的資訊。緊隨其後通過 show warnings
命令可以 得到優化後的查詢語句,從而看出優化器優化了什麼。額外還有 filtered 列,是一個半分比的值,rows * filtered/100 可以估算出將要和 explain 中前一個表進行連線的行數(前一個表指 explain 中的id值比當前表id值小的表)。
mysql> explain extended select * from film where id = 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-sVCTABqk-1610023156900)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps2.jpg)]
mysql> show warnings;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-dGjsXXVl-1610023156902)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps3.jpg)]
2. explain partitions
相比 explain 多了個 partitions 欄位,如果查詢是基於分割槽表的話,會顯示查詢將訪問的分割槽。
explain 中的列
較為重要的列(select_type, type, key, extra)
1. id列
id列的編號是 select 的序列號,有幾個 select 就有幾個id,並且id的順序是按 select 出現的順序增長的。MySQL將 select 查詢分為簡單查詢(SIMPLE)和複雜查詢(PRIMARY)。
複雜查詢分為三類:
- 簡單子查詢
- 派生表(from語句中的子查詢)
- union 查詢。
id列越大執行優先順序越高,id相同則從上往下執行,id為NULL最後執行
1)簡單子查詢
mysql> explain select (select 1 from actor limit 1) from film;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-kUowtPNG-1610023156904)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps4.jpg)]
2)from子句中的子查詢
mysql> explain select id from (select id from film) as der;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-ZF0QwW5A-1610023156905)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps5.jpg)]
這個查詢執行時有個臨時表別名為der,外部 select 查詢引用了這個臨時表
3)union查詢
mysql> explain select 1 union all select 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-jEwlmMgY-1610023156907)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps6.jpg)]
union結果總是放在一個匿名臨時表中,臨時表不在SQL中出現,因此它的id是NULL。
2. select_type列
select_type 表示對應行是簡單還是複雜的查詢,如果是複雜的查詢,又是上述三種複雜查詢中的哪一種。
1)simple:簡單查詢。查詢不包含子查詢和union
mysql> explain select * from film where id = 2;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-yEChyBf3-1610023156908)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps7.jpg)]
2)primary:複雜查詢中最外層的 select
3)subquery:包含在 select 中的子查詢(不在 from 子句中)
4)derived:包含在 from 子句中的子查詢。MySQL會將結果存放在一個臨時表中,也稱為派生表(derived的英文含義)
用這個例子來了解 primary、subquery 和 derived 型別
mysql> set session optimizer_switch='derived_merge=off'; #關閉mysql5.7新特性對衍生表的合併優化
mysql> explain select (select 1 from actor where id = 1) from (select * from film where id = 1) der;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-eFaaaLbY-1610023156908)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps8.jpg)]
5)union:在 union 中的第二個和隨後的 select
6)union result:從 union 臨時表檢索結果的 select
用這個例子來了解 union 和 union result 型別:
mysql> explain select 1 union all select 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-DXlggivl-1610023156909)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps9.jpg)]
3. table列
這一列表示 explain 的一行正在訪問哪個表。
當 from 子句中有子查詢時,table列是 格式,表示當前查詢依賴 id=N 的查詢,於是先執行 id=N 的查詢。
當有 union 時,UNION RESULT 的 table 列的值為<union1,2>,1和2表示參與 union 的 select 行id。
4. type列
這一列表示關聯型別或訪問型別,即MySQL決定如何查詢表中的行,查詢資料行記錄的大概範圍。依次從最優到最差分別為:system > const > eq_ref > ref > range > index > ALL
一般來說,得保證查詢達到range級別,最好達到ref
1) NULL
mysql能夠在優化階段分解查詢語句,在執行階段用不著再訪問表或索引。例如:在索引列中選取最小值,可以單獨查詢索引來完成,不需要在執行時訪問表
mysql> explain select min(id) from film;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-k27Zj9SP-1610023156909)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps10.jpg)]
2) const, system
mysql能對查詢的某部分進行優化並將其轉化成一個常量(可以看show warnings 的結果)。用於 primary key 或 unique key 的所有列與常數比較時,所以表最多有一個匹配行,讀取1次,速度比較快。system是const的特例,表裡只有一條元組匹配時為system
mysql> explain extended select * from (select * from film where id = 1) tmp;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-9nQVJ69R-1610023156910)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps11.jpg)]
mysql> show warnings;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-PPNHZ0tj-1610023156911)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps12.jpg)]
3) eq_ref
primary key 或 unique key 索引的所有部分被連線使用 ,最多隻會返回一條符合條件的記錄。這可能是在 const 之外最好的聯接型別了,簡單的 select 查詢不會出現這種 type。
mysql> explain select * from film_actor left join film on film_actor.film_id = film.id;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-HyqAXBwX-1610023156911)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps13.jpg)]
4) ref
相比 eq_ref,不使用唯一索引,而是使用普通索引或者唯一性索引的部分字首,索引要和某個值相比較,可能會找到多個符合條件的行。
-
簡單 select 查詢,name是普通索引(非唯一索引)
mysql> explain select * from film where name = "film1";
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-2Mzcgyux-1610023156912)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps14.jpg)]
- 關聯表查詢,idx_film_actor_id是film_id和actor_id的聯合索引,這裡使用到了film_actor的左邊字首film_id部分。 mysql> explain select film_id from film left join film_actor on film.id = film_actor.film_id;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-hZUiHokk-1610023156913)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps15.jpg)]
5) range
範圍掃描通常出現在 in(), between ,> ,<, >= 等操作中。使用一個索引來檢索給定範圍的行。
mysql> explain select * from actor where id > 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-Zo2u3G6I-1610023156913)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps16.jpg)]
6) index
掃描全表索引,這通常比ALL快一些。(index是從索引中讀取的,而all是從硬碟中讀取)
mysql> explain select * from film;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-fI5DESBt-1610023156914)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps17.jpg)]
7) ALL
即全表掃描,意味著mysql需要從頭到尾去查詢所需要的行。通常情況下這需要增加索引來進行優化了
mysql> explain select * from actor;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-cCq3yDyJ-1610023156914)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps18.jpg)]
5. possible_keys列
這一列顯示查詢可能使用哪些索引來查詢。
explain 時可能出現 possible_keys 有列,而 key 顯示 NULL 的情況,這種情況是因為表中資料不多,mysql認為索引對此查詢幫助不大,選擇了全表查詢。
如果該列是NULL,則沒有相關的索引。在這種情況下,可以通過檢查 where 子句看是否可以創造一個適當的索引來提高查詢效能,然後用 explain 檢視效果。
6. key列
這一列顯示mysql實際採用哪個索引來優化對該表的訪問。
如果沒有使用索引,則該列是 NULL。如果想強制mysql使用或忽視possible_keys列中的索引,在查詢中使用 force index、ignore index。
7. key_len列
這一列顯示了mysql在索引裡使用的位元組數,通過這個值可以算出具體使用了索引中的哪些列。
舉例來說,film_actor的聯合索引 idx_film_actor_id 由 film_id 和 actor_id 兩個int列組成,並且每個int是4位元組。通過結果中的key_len=4可推斷出查詢使用了第一個列:film_id列來執行索引查詢。
mysql> explain select * from film_actor where film_id = 2;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-ephKoScG-1610023156915)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps19.jpg)]
-
key_len計算規則如下:
-
l 字串
- char(n):n位元組長度
- varchar(n):2位元組儲存字串長度,如果是utf-8,則長度 3n + 2
-
數值型別
-
tinyint:1位元組
-
smallint:2位元組
-
int:4位元組
-
bigint:8位元組
-
-
時間型別
- date:3位元組
- timestamp:4位元組
- datetime:8位元組
-
如果欄位允許為 NULL,需要1位元組x是否為 NULL
-
索引最大長度是768位元組,當字串過長時,mysql會做一個類似左字首索引的處理,將前半部分的字元提取出來做索引。
8. ref列
這一列顯示了在key列記錄的索引中,表查詢值所用到的列或常量,常見的有:const(常量),欄位名(例:film.id)
9. rows列
這一列是mysql估計要讀取並檢測的行數,注意這個不是結果集裡的行數。
10. Extra列
這一列展示的是額外資訊。常見的重要值如下:
1) Using index
查詢的列被索引覆蓋,並且where篩選條件是索引的前導列,是效能高的表現。一般是使用了覆蓋索引(索引包含了所有查詢的欄位)。對於innodb來說,如果是輔助索引效能會有不少提高
mysql> explain select film_id from film_actor where film_id = 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-djRdEqNU-1610023156915)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps20.jpg)]
2) Using where
查詢的列未被索引覆蓋,where篩選條件非索引的前導列
mysql> explain select * from actor where name = 'a';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-25e1o7bn-1610023156916)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps21.jpg)]
3) Using where Using index
查詢的列被索引覆蓋,並且where篩選條件是索引列之一但是不是索引的前導列,意味著無法直接通過索引查詢來查詢到符合條件的資料
mysql> explain select film_id from film_actor where actor_id = 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-N7ljXY4M-1610023156917)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps22.jpg)]
4) NULL
查詢的列未被索引覆蓋,並且where篩選條件是索引的前導列,意味著用到了索引,但是部分欄位未被索引覆蓋,必須通過“回表”來實現,不是純粹地用到了索引,也不是完全沒用到索引
mysql>explain select * from film_actor where film_id = 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-mjx8ayLW-1610023156917)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps23.jpg)]
5) Using index condition
與Using where類似,查詢的列不完全被索引覆蓋,where條件中是一個前導列的範圍;
mysql> explain select * from film_actor where film_id > 1;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-RxUKcy0N-1610023156918)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps24.jpg)]
6) Using temporary
mysql需要建立一張臨時表來處理查詢。出現這種情況一般是要進行優化的,首先是想到用索引來優化。
-
actor.name沒有索引,此時建立了張臨時表來distinct
mysql> explain select distinct name from actor;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-ravFYPsv-1610023156918)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps25.jpg)]
-
film.name建立了idx_name索引,此時查詢時extra是using index,沒有用臨時表
mysql> explain select distinct name from film;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-sZjFy1YX-1610023156919)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps26.jpg)]
7) Using filesort
mysql 會對結果使用一個外部索引排序,而不是按索引次序從表裡讀取行。此時mysql會根據聯接型別瀏覽所有符合條件的記錄,並儲存排序關鍵字和行指標,然後排序關鍵字並按順序檢索行資訊。這種情況下一般也是要考慮使用索引來優化的。
-
actor.name未建立索引,會瀏覽actor整個表,儲存排序關鍵字name和對應的id,然後排序name並檢索行記錄
mysql> explain select * from actor order by name;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-KytzirQ2-1610023156920)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps27.jpg)]
-
film.name建立了idx_name索引,此時查詢時extra是using index
mysql> explain select * from film order by name;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-SbeEN382-1610023156920)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps28.jpg)]
索引最佳實踐
使用的表
CREATE TABLE `employees` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`name` varchar(24) NOT NULL DEFAULT '' COMMENT '姓名',
`age` int(11) NOT NULL DEFAULT '0' COMMENT '年齡',
`position` varchar(20) NOT NULL DEFAULT '' COMMENT '職位',
`hire_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入職時間',
PRIMARY KEY (`id`),
KEY `idx_name_age_position` (`name`,`age`,`position`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8 COMMENT='員工記錄表';
INSERT INTO employees(name,age,position,hire_time) VALUES('LiLei',22,'manager',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('HanMeimei', 23,'dev',NOW());
INSERT INTO employees(name,age,position,hire_time) VALUES('Lucy',23,'dev',NOW());
最佳實踐
1. 全值匹配
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-VlcfKgEp-1610023156922)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps29.jpg)]
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-OI05Dhlq-1610023156922)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps30.jpg)]
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-QI9R7t0U-1610023156923)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps31.jpg)]
2. 最佳左字首法則
如果索引了多列,要遵守最左字首法則。指的是查詢從索引的最左前列開始並且不跳過索引中的列。
EXPLAIN SELECT * FROM employees WHERE age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE position = 'manager';
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-svhqPIj2-1610023156924)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps32.jpg)]
3. 不在索引列上做任何操作(計算、函式、(自動or手動)型別轉換),會導致索引失效而轉向全表掃描
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei';
EXPLAIN SELECT * FROM employees WHERE left(name,3) = 'LiLei';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-56eUjpQD-1610023156924)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps33.jpg)]
給hire_time增加一個普通索引:
ALTER TABLE `employees`
ADD INDEX `idx_hire_time` (`hire_time`) USING BTREE ;
EXPLAIN select * from employees where date(hire_time) ='2020-09-30';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-G1jyxR15-1610023156925)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210107200050778.png)]
轉化為日期範圍查詢,會走索引:
EXPLAIN select * from employees where hire_time >='2020-09-30 00:00:00' and hire_time <='2020-09-30 23:59:59';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-osOvpe8C-1610023156925)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210107200318575.png)]
還原最初索引狀態 ,(下面案例不需要這個索引)
1 ALTER TABLE `employees` 2 DROP INDEX `idx_hire_time`;
4. 儲存引擎不能使用索引中範圍條件右邊的列
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 22 AND position ='manager';
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age > 22 AND position ='manager';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-6V6niYV0-1610023156926)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps34.jpg)]
5. 儘量使用覆蓋索引(只訪問索引的查詢(索引列包含查詢列)),減少select *語句
EXPLAIN SELECT name,age FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-Lsbbsrtm-1610023156926)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps35.jpg)]
EXPLAIN SELECT * FROM employees WHERE name= 'LiLei' AND age = 23 AND position ='manager';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-WYeihxOr-1610023156927)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps36.jpg)]
6. mysql在使用不等於(!=或者<>)的時候無法使用索引會導致全表掃描
EXPLAIN SELECT * FROM employees WHERE name != 'LiLei'
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-UNpCGC3O-1610023156927)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps37.jpg)]
7. is null,is not null 也無法使用索引
EXPLAIN SELECT * FROM employees WHERE name is null
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-QGyruv3S-1610023156928)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps38.jpg)]
8. like以萬用字元開頭(’$abc…’)mysql索引失效會變成全表掃描操作
EXPLAIN SELECT * FROM employees WHERE name like '%Lei'
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-WRJvAqCt-1610023156928)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps39.jpg)]
EXPLAIN SELECT * FROM employees WHERE name like 'Lei%'
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-QbMyfLfO-1610023156929)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps40.jpg)]
問題:解決like’%字串%'索引不被使用的方法?
- 使用覆蓋索引,查詢欄位必須是建立覆蓋索引欄位
EXPLAIN SELECT name,age,position FROM employees WHERE name like '%Lei%';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-90jwrsmb-1610023156930)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps41.jpg)]
- 如果不能使用覆蓋索引則可能需要藉助搜尋引擎
- 當覆蓋索引指向的欄位是varchar(380)及380以上的欄位時,覆蓋索引會失效!
9. 字串不加單引號索引失效
EXPLAIN SELECT * FROM employees WHERE name = '1000';
EXPLAIN SELECT * FROM employees WHERE name = 1000;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-FT2MPcud-1610023156930)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps42.jpg)]
10. 少用or,用它連線時很多情況下索引會失效
EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' or name = 'HanMeimei';
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-omC9aCok-1610023156931)(file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml19284\wps43.jpg)]
11.範圍查詢優化
給年齡新增單值索引
ALTER TABLE `employees`
ADD INDEX `idx_age` (`age`) USING BTREE ;
explain select * from employees where age >=1 and age <=2000;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-0MucZWgy-1610023156931)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210107201527790.png)]
沒走索引原因:mysql內部優化器會根據檢索比例、表大小等多個因素整體評估是否使用索 引。比如這個例子,可能是由於單次資料量查詢過大導致優化器最終選擇不走索引
優化方法:可以講大的範圍拆分成多個小範圍
explain select * from employees where age >=1 and age <=1000;
explain select * from employees where age >=1001 and age <=2000;
[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片儲存下來直接上傳(img-u3bSNtbA-1610023156932)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20210107201651139.png)]
還原最初索引狀態
ALTER TABLE `employees`
DROP INDEX `idx_age`;
總結
假設index(a, b, c)
where語句 | 索引是否使用 |
---|---|
where a =3 | Y, 使用到a |
where a =3 and b=5 | Y, 使用到a, b |
where a =3 and b=5 and c=4 | Y, 使用到a, b, c |
where a =3 或 where a =3 and c=4 或 where c=4 | N |
where a =3 and c=5 | Y, 使用到a, 但是c不可以, b中間斷了 |
where a =3 and b>4 and c=5 | Y, 使用到a和b, c不能用在範圍之後, b斷了 |
where a =3 and b like ‘kk%’ and c=4 | Y, 使用到了a, b, c |
where a =3 and b like ‘%kk’ and c=4 | Y, 使用到a |
where a =3 and b like ‘%kk%’ and c=4 | Y, 使用到a |
where a =3 and b like ‘k%kk%’ and c=4 | Y, 使用到a, b, c |
like KK%相當於=常量,%KK和%KK% 相當於範圍