1. 程式人生 > 資料庫 >怎樣正確建立MySQL索引的方法詳解

怎樣正確建立MySQL索引的方法詳解

索引類似大學圖書館建書目索引,可以提高資料檢索的效率,降低資料庫的IO成本。MySQL在300萬條記錄左右效能開始逐漸下降,雖然官方文件說500~800w記錄,所以大資料量建立索引是非常有必要的。MySQL提供了Explain,用於顯示SQL執行的詳細資訊,可以進行索引的優化。

什麼是索引?

MySQL官方對索引的定義為:索引(Index)是幫助MySQL高效獲取資料的資料結構。我們可以簡單理解為:快速查詢排好序的一種資料結構。Mysql索引主要有兩種結構:B+Tree索引和Hash索引。我們平常所說的索引,如果沒有特別指明,一般都是指B樹結構組織的索引(B+Tree索引)。索引如圖所示:

最外層淺藍色磁碟塊1裡有資料17、35(深藍色)和指標P1、P2、P3(黃色)。P1指標表示小於17的磁碟塊,P2是在17-35之間,P3指向大於35的磁碟塊。真實資料存在於子葉節點也就是最底下的一層3、5、9、10、13……非葉子節點不儲存真實的資料,只儲存指引搜尋方向的資料項,如17、35。

查詢過程:例如搜尋28資料項,首先載入磁碟塊1到記憶體中,發生一次I/O,用二分查詢確定在P2指標。接著發現28在26和30之間,通過P2指標的地址載入磁碟塊3到記憶體,發生第二次I/O。用同樣的方式找到磁碟塊8,發生第三次I/O。

真實的情況是,上面3層的B+Tree可以表示上百萬的資料,上百萬的資料只發生了三次I/O而不是上百萬次I/O,時間提升是巨大的。

資料表索引可以提高資料的檢索效率,也可以降低資料庫的IO成本,並且索引還可以降低資料庫的排序成本。排序分組操作主要消耗的就是CPU資源和記憶體,所以能夠在排序分組操作中好好的利用索引將會極大地降低CPU資源的消耗。下面我們將簡單的分析一下怎樣正確建立MySQL資料索引。

怎樣判斷是否需要建立索引?

1、某些欄位需要頻繁用作查詢條件時需要為它建立索引

這個應該都知道,什麼樣才是頻繁呢?綜合分析你執行的所有SQL語句。最好將他們一個個都列出來。然後分析,發現其中有些欄位在大部分的SQL語句查詢時候都會用到,那麼就果斷為他建立索引。

2、唯一性太差的欄位不適合建立索引

什麼是唯一性太差的欄位?如狀態欄位、型別欄位。那些只儲存固定幾個值的欄位,例如使用者登入狀態、訊息的status等。這個涉及到了索引掃描的特性。例如:通過索引查詢鍵值為A和B的某些資料,通過A找到某條相符合的資料,這條資料在X頁上面,然後繼續掃描,又發現符合A的資料出現在了Y頁上面,那麼儲存引擎就會丟棄X頁面的資料,然後儲存Y頁面上的資料,一直到查詢完所有對應A的資料,然後查詢B欄位,發現X頁面上面又有對應B欄位的資料,那麼他就會再次掃描X頁面,等於X頁面就會被掃描2次甚至多次。以此類推,所以同一個資料頁可能會被多次重複的讀取,丟棄,在讀取,這無疑給儲存引擎極大地增加了IO的負擔。

3、更新太頻繁地欄位不適合建立索引

當你為某個欄位建立索引時候,如果再次更新這個欄位資料時,資料庫就會自動更新他的索引,所以當這個欄位更新太頻繁地時候那麼就會不斷的更新索引,效能的影響可想而知。大概被檢索幾十次才會更新一次的欄位才比較符合建立索引的規範。而如果一個欄位同一個時間段內被更新多次,那麼果斷不能為他建立索引。

4、不會出現在where條件中的欄位不該建立索引

這個其實沒什麼好說的,不會用作查詢條件的欄位建立了索引也沒用。

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對我們的支援。如果你想了解更多相關內容請檢視下面相關連結