1. 程式人生 > >MySQL開發索引創建規範

MySQL開發索引創建規範

混合 查詢 一個 覆蓋 文件 獲取 select 表關聯 字段

1. 【強制】業務上具有唯一特性的字段,即使是多個字段的組合,也必須建成唯一索引。

說明:不要以為唯一索引影響了insert速度,這個速度損耗可以忽略,但提高查找速度是明顯的;另外,即使在應用層做了非常完善的校驗控制,只要沒有唯一索引,根據墨菲定律,必然有臟數據產生。

2. 【強制】超過三個表禁止join。需要join的字段,數據類型必須絕對一致;多表關聯查詢時,保證被關聯的字段需要有索引。

說明:即使雙表join也要註意表索引、SQL性能。

3. 【強制】在varchar字段上建立索引時,必須指定索引長度,沒必要對全字段建立索引,根據實際文本區分度決定索引長度即可。

說明:索引的長度與區分度是一對矛盾體,一般對字符串類型數據,長度為20的索引,區分度會高達90%以上,可以使用count(distinct left(列名, 索引長度))/count(*)的區分度來確定。

4. 【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決。

說明:索引文件具有B-Tree的最左前綴匹配特性,如果左邊的值未確定,那麽無法使用此索引。

5. 【推薦】如果有order by的場景,請註意利用索引的有序性。order by 最後的字段是組合索引的一部分,並且放在索引組合順序的最後,避免出現file_sort的情況,影響查詢性能。

正例:where a=? and b=? order by c; 索引:a_b_c 
 反例:索引中有範圍查找,那麽索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引a_b無法排序。

6. 【推薦】利用覆蓋索引來進行查詢操作,避免回表。

說明:如果一本書需要知道第11章是什麽標題,會翻開第11章對應的那一頁嗎?目錄瀏覽一下就好,這個目錄就是起到覆蓋索引的作用。

正例:能夠建立索引的種類分為主鍵索引、唯一索引、普通索引三種,而覆蓋索引只是一種查詢的一種效果,用explain的結果,extra列會出現:using index。

7. 【推薦】利用延遲關聯或者子查詢優化超多分頁場景。

說明:MySQL並不是跳過offset行,而是取offset+N行,然後返回放棄前offset行,返回N行,那當offset特別大的時候,效率就非常的低下,要麽控制返回的總頁數,要麽對超過特定閾值的頁數進行SQL改寫。

正例:先快速定位需要獲取的id段,然後再關聯: SELECT a.* FROM 表1 a, (select id from 表1 where 條件 LIMIT 100000,20 ) b where a.id=b.id

8. 【推薦】 SQL性能優化的目標:至少要達到 range 級別,要求是ref級別,如果可以是consts最好。 說明:

1)consts 單表中最多只有一個匹配行(主鍵或者唯一索引),在優化階段即可讀取到數據。 2)ref 指的是使用普通的索引(normal index)。

3)range 對索引進行範圍檢索。 反例:explain表的結果,type=index,索引物理文件全掃描,速度非常慢,這個index級別比較range還低,與全表掃描是小巫見大巫。

9. 【推薦】建組合索引的時候,區分度最高的在最左邊。

說明:存在非等號和等號混合時,在建索引時,請把等號條件的列前置。如:where c>? and d=? 那麽即使c的區分度更高,也必須把d放在索引的最前列,即索引idx_d_c。

正例:如果where a=? and b=? ,如果a列的幾乎接近於唯一值,那麽只需要單建idx_a索引即可。

10. 【推薦】防止因字段類型不同造成的隱式轉換,導致索引失效。

11. 【參考】創建索引時避免有如下極端誤解:

1)寧濫勿缺。認為一個查詢就需要建一個索引。

2)寧缺勿濫。認為索引會消耗空間、嚴重拖慢更新和新增速度。

3)抵制惟一索引。認為業務的惟一性一律需要在應用層通過“先查後插”方式解決。

MySQL開發索引創建規範