mysql優化：覆蓋索引（延遲關聯）

前言

上週新系統改版上線，上線第二天就出現了較多的線上慢sql查詢，緊接著dba 給出了定位及解決方案，這裡較多的是使用延遲關聯去優化。
而我對於這個延遲關聯也是第一次聽說（o(╥﹏╥)o），所以今天一定要學習併產出一篇學習筆記。(^▽^)

回表

我們都知道InnoDB採用的B+ tree來實現索引的，索引又分為主鍵索引(聚簇索引)和普通索引(二級索引)。
那麼我們就來看下基於主鍵索引和普通索引的查詢有什麼區別？

如果語句是select * from T where ID=500，即主鍵查詢方式，則只需要搜尋ID這棵B+樹；
如果語句是select * from T where k=5，即普通索引查詢方式，則需要先搜尋k索引樹，得到ID的值為500，再到ID索引樹搜尋一次。這個過程稱為回表。

舉個栗子：

可以看出我們有一個普通索引k，那麼兩顆B+樹的示意圖如下：

（注：圖來自極客時間專欄）

當我們查詢 select * from T where k=5 其實會先到k那個索引樹上查詢k = 5，然後找到對應的id為500，最後回表到主鍵索引的索引樹找返回所需資料。
如果我們查詢select id from T where k=5 則不需要回表就直接返回。
也就是說，基於非主鍵索引的查詢需要多掃描一棵索引樹。因此，我們在應用中應該儘量使用主鍵查詢。

覆蓋索引

解釋一：就是select的資料列只用從索引中就能夠取得，不必從資料表中讀取，換句話說查詢列要被所使用的索引覆蓋。
解釋二：索引是高效找到行的一個方法，當能通過檢索索引就可以讀取想要的資料，那就不需要再到資料表中讀取行了。如果一個索引包含了（或覆蓋了）滿足查詢語句中欄位與條件的資料就叫做覆蓋索引。
解釋三：是非聚集組合索引的一種形式，它包括在查詢裡的Select、Join和Where子句用到的所有列（即建立索引的欄位正好是覆蓋查詢語句[select子句]與查詢條件[Where子句]中所涉及的欄位，也即，索引包含了查詢正在查詢的所有資料）。
不是所有型別的索引都可以成為覆蓋索引。覆蓋索引必須要儲存索引的列，而雜湊索引、空間索引和全文索引等都不儲存索引列的值，所以MySQL只能使用B-Tree索引做覆蓋索引

當發起一個被索引覆蓋的查詢(也叫作索引覆蓋查詢)時，在EXPLAIN的Extra列可以看到“Using index”的資訊

概念如上，這裡我們還是用例子來說明：

（注：圖來自極客時間專欄）
現在，我們一起來看看這條SQL查詢語句的執行流程：

在k索引樹上找到k=3的記錄，取得 ID = 300；
再到ID索引樹查到ID=300對應的R3；
在k索引樹取下一個值k=5，取得ID=500；
再回到ID索引樹查到ID=500對應的R4；
在k索引樹取下一個值k=6，不滿足條件，迴圈結束。

在這個過程中，回到主鍵索引樹搜尋的過程，我們稱為回表。可以看到，這個查詢過程讀了k索引樹的3條記錄（步驟1、3和5），回表了兩次（步驟2和4）。
在這個例子中，由於查詢結果所需要的資料只在主鍵索引上有，所以不得不回表。那麼，有沒有可能經過索引優化，避免回表過程呢？

如果執行的語句是select ID from T where k between 3 and 5，這時只需要查ID的值，而ID的值已經在k索引樹上了，因此可以直接提供查詢結果，不需要回表。也就是說，在這個查詢裡面，索引k已經“覆蓋了”我們的查詢需求，我們稱為覆蓋索引。
由於覆蓋索引可以減少樹的搜尋次數，顯著提升查詢效能，所以使用覆蓋索引是一個常用的效能優化手段。
需要注意的是，在引擎內部使用覆蓋索引在索引k上其實讀了三個記錄，R3~R5（對應的索引k上的記錄項），但是對於MySQL的Server層來說，它就是找引擎拿到了兩條記錄，因此MySQL認為掃描行數是2。

延遲關聯

上面介紹了那麼多其實是在為延遲關聯做鋪墊，這裡直接續上我們本次慢查詢的sql：

我們都知道在做分頁時會用到Limit關鍵字去篩選所需資料，limit接受1個或者2個引數，接受兩個引數時第一個引數表示偏移量，即從哪一行開始取資料，第二個引數表示要取的行數。如果只有一個引數，相當於偏移量為0。
當偏移量很大時，如limit 100000,10 取第100001-100010條記錄，mysql會取出100010條記錄然後將前100000條記錄丟棄，這無疑是一種巨大的效能浪費。

當有這種寫法時，我們可以採用延遲關聯來進行優化，重點關注：** SELECT id FROM qa_question WHERE expert_id = 69 AND STATUS = 30 ORDER BY over_time DESC LIMIT 0, 10**，這裡其實利用了索引覆蓋，where條件後的expert_id 是有新增索引的，這裡查詢id 可以避免回表，大大提升效率。

結語

工作中會遇到各種各樣的問題，對於一個研發來說最重要的是能夠從這些問題中學到什麼。好久沒有寫部落格了，究其原因還是自己變得懶惰了。
接下來還有很多東西需要學習，也是平時工作中所用到的，列舉一下如：設計模式、dubbo、rediss等等，加油吧少年。
最後以《高效能Mysql》中的一段話結束：

mysql優化：覆蓋索引（延遲關聯）

前言

回表

覆蓋索引

延遲關聯

結語

mysql優化：覆蓋索引（延遲關聯）

優化limit分頁（延遲關聯）

多執行緒下單例模式：懶載入（延遲載入）和即時載入

PostgreSQL 11 新特性之覆蓋索引（Covering Index）

MySQL優化案例---半連線（semi join）優化方式導致的查詢效能低下

Mysql性能優化之覆蓋索引

MySQL SQL優化之覆蓋索引

【MySQL】效能優化之覆蓋索引

SQL優化：基本概念（索引調優、統計資訊、查詢調整、資源調控）

SQL優化基礎：使用索引（一個小例子）

MySQL全面瓦解24：構建高效能索引（策略篇）

（譯）MySQL 8.0實驗室---MySQL中的倒敘索引（Descending Indexes）

優化演算法：牛頓法（Newton法）

ExtJs效能優化：tab的資料延遲載入

Mysql優化選擇最佳索引使用方法

sql：主鍵（primary key）和唯一索引（unique index）區別

Mysql之DQL複雜查詢（連線查詢）：

MySQL資料庫優化（三）——MySQL悲觀鎖&&樂觀鎖（併發控制）

效能優化：監控索引的使用情況

百萬資料排序：優化的選擇排序（堆排序）

mysql優化：覆蓋索引（延遲關聯）

前言

回表

覆蓋索引

延遲關聯

結語

相關推薦