MySQL索引 及 EXPLAIN
1.索引長度計算:
1.索引欄位,沒有設定NOT NULL,則需要加一個位元組。
2.定長欄位:tinyiny佔1個位元組、int佔4個位元組、bitint佔8個位元組、date佔3個位元組、datetime佔5個位元組,char(n)佔n個字元。
3.變長欄位:varchar(n)佔n個字元+2個位元組。
4.不同的字符集,一個字元佔用的位元組數不同:
latin1編碼,每個字元佔用一個位元組
gbk編碼,每個字元佔用兩個位元組
utf8編碼,每個字元佔用三個位元組
utf8mb4編碼,每個字元佔用四個位元組
2.EXPLAIN 中的屬性說明
1)id:
1. id相同時,執行順序由上至下
2. 如果是子查詢,id的序號會遞增,id值越大優先順序越高,越先被執行
3. id如果相同,可以認為是一組,從上往下順序執行;在所有組中,id值越大,優先順序越高,越先執行
2)select_type:
(1)SIMPLE(簡單SELECT,不使用UNION或子查詢等)
(2)PRIMARY(子查詢中最外層查詢,查詢中若包含任何複雜的子部分,最外層的select被標記為PRIMARY)
(3)UNION(UNION中的第二個或後面的SELECT語句)
(4)DEPENDENT UNION(UNION中的第二個或後面的SELECT語句,取決於外面的查詢)
(5)UNION RESULT(UNION的結果,union語句中第二個select開始後面所有select)
(6)SUBQUERY(子查詢中的第一個SELECT,結果不依賴於外部查詢)
(7)DEPENDENT SUBQUERY(子查詢中的第一個SELECT,依賴於外部查詢)
(8)DERIVED(派生表的SELECT, FROM子句的子查詢)
(9)UNCACHEABLE SUBQUERY(一個子查詢的結果不能被快取,必須重新評估外連結的第一行)
3)table:
顯示這一步所訪問資料庫中表名稱(顯示這一行的資料是關於哪張表的),有時不是真實的表名字,可能是簡稱
4)type:
對錶訪問方式,表示MySQL在表中找到所需行的方式,又稱“訪問型別”。
常用的型別有:ALL、index、range、 ref、eq_ref、const、system、NULL(從左到右,效能從差到好)
ALL:Full Table Scan, MySQL將遍歷全表以找到匹配的行
index: Full Index Scan,index與ALL區別為index型別只遍歷索引樹
range:只檢索給定範圍的行,使用一個索引來選擇行
ref: 表示上述表的連線匹配條件,即哪些列或常量被用於查詢索引列上的值
eq_ref: 類似ref,區別就在使用的索引是唯一索引,對於每個索引鍵值,表中只有一條記錄匹配,簡單來說,就是多表連線中使用primary key或者 unique key作為關聯條件
const、system: 當MySQL對查詢某部分進行優化,並轉換為一個常量時,使用這些型別訪問。如將主鍵置於where列表中,MySQL就能將該查詢轉換為一個常量,system是const型別的特例,當查詢的表只有一行的情況下,使用system
NULL: MySQL在優化過程中分解語句,執行時甚至不用訪問表或索引,例如從一個索引列裡選取最小值可以通過單獨索引查詢完成。
5)possible_keys:
指出MySQL能使用哪個索引在表中找到記錄,查詢涉及到的欄位上若存在索引,則該索引將被列出,但不一定被查詢使用(該查詢可以利用的索引,如果沒有任何索引顯示 null)
該列完全獨立於EXPLAIN輸出所示的表的次序。這意味著在possible_keys中的某些鍵實際上不能按生成的表次序使用。
如果該列是NULL,則沒有相關的索引。在這種情況下,可以通過檢查WHERE子句看是否它引用某些列或適合索引的列來提高你的查詢效能。如果是這樣,創造一個適當的索引並且再次用EXPLAIN檢查查詢
6)Key:
key列顯示MySQL實際決定使用的鍵(索引),必然包含在possible_keys中
如果沒有選擇索引,鍵是NULL。要想強制MySQL使用或忽視possible_keys列中的索引,在查詢中使用FORCE INDEX、USE INDEX或者IGNORE INDEX。
7)key_len:
表示索引中使用的位元組數,可通過該列計算查詢中使用的索引的長度(key_len顯示的值為索引欄位的最大可能長度,並非實際使用長度,即key_len是根據表定義計算而得,不是通過表內檢索出的)
不損失精確性的情況下,長度越短越好
8)ref:
列與索引的比較,表示上述表的連線匹配條件,即哪些列或常量被用於查詢索引列上的值
9)rows:
估算出結果集行數,表示MySQL根據表統計資訊及索引選用情況,估算的找到所需的記錄所需要讀取的行數
10)Extra:
該列包含MySQL解決查詢的詳細資訊,有以下幾種情況:
Using where:不用讀取表中所有資訊,僅通過索引就可以獲取所需資料,這發生在對錶的全部的請求列都是同一個索引的部分的時候,表示mysql伺服器將在儲存引擎檢索行後再進行過濾
Using temporary:表示MySQL需要使用臨時表來儲存結果集,常見於排序和分組查詢,常見 group by ; order by
Using filesort:當Query中包含 order by 操作,而且無法利用索引完成的排序操作稱為“檔案排序”
Using join buffer:改值強調了在獲取連線條件時沒有使用索引,並且需要連線緩衝區來儲存中間結果。如果出現了這個值,那應該注意,根據查詢的具體情況可能需要新增索引來改進能。
Impossible where:這個值強調了where語句會導致沒有符合條件的行(通過收集統計資訊不可能存在結果)。
Select tables optimized away:這個值意味著僅通過使用索引,優化器可能僅從聚合函式結果中返回一行
No tables used:Query語句中使用from dual 或不含任何from子句
3.索引失效:
1)索引無法儲存null值
a.單列索引無法儲null值,複合索引無法儲全為null的值。
b.查詢時,採用is null條件時,不能利用到索引,只能全表掃描。
為什麼索引列無法儲存Null值?
a.索引是有序的。NULL值進入索引時,無法確定其應該放在哪裡。(將索引列值進行建樹,其中必然涉及到諸多的比較操作,null值是不確定值無法
比較,無法確定null出現在索引樹的葉子節點位置。)
b.如果需要把空值存入索引,方法有二:其一,把NULL值轉為一個特定的值,在WHERE中檢索時,用該特定值查詢。其二,建立一個複合索引。例如
create index ind_a on table(col1,1);通過在複合索引中指定一個非空常量值,而使構成索引的列的組合中,不可能出現全空值。
2)不適合鍵值太少的列(重複資料太多的列)
假如索引列TYPE有5個鍵值,如果有1萬條資料,那麼 WHERE TYPE = 1將訪問表中的2000個數據塊。
再加上訪問索引塊,一共要訪問大於200個的資料塊。
如果全表掃描,假設10條資料一個數據塊,那麼只需訪問1000個數據塊,既然全表掃描訪問的資料塊
少一些,肯定就不會利用索引了。
3)前導模糊查詢不能利用索引(like “@XX” 或者 like ”%XX%“)
假如有這樣一列code的值為'AAA','AAB','BAA','BAB' ,如果where code like '%AB'條件,由於前面是
模糊的,所以不能利用索引的順序,必須一個個去找,看是否滿足條件。這樣會導致全索引掃描或者全表掃
描。如果是這樣的條件where code like 'A % ',就可以查詢CODE中A開頭的CODE的位置,當碰到B開頭的
資料時,就可以停止查找了,因為後面的資料一定不滿足要求。這樣就可以利用索引了。