【MySQL】-索引
什麼是索引? |
排好序的快速查詢資料結構
目的: |
提高查詢效率
在資料之外,資料庫系統還維護著滿足特定查詢演算法的資料結構,這些資料結枘以某種方式引用(指向)資料,
這樣就可以在這些資料結構上實現高階查詢演算法。這種資料結構,就是索引。下圖就是一種可能的索引方式示例:
左邊是資料表,一共有兩列七條記錄,最左邊的是資料記錄的實體地址
為了加快Col2的查詢,可以維護一個右邊所示的二叉查詢樹,每個節點分別包含索引鍵值和一個指向對應資料記錄實體地址的指標,這樣就可以運用二叉查詢在一定的複雜度內獲取到相應資料,從而快速的檢索出符合條件的記錄。
索引分類: |
單值索引:即一個索引只包含單個列,一個表可以有多個單列索引
唯一索引:索引列的值必須唯一,但允許有空值
複合索引:即一個索引包含多個列
索引結構和檢索原理: |
MySQL的索引結構:BTree索引,Hash索引,full-text全文索引,R-Tree索引
初始化介紹: |
一顆b+樹,淺藍色的塊我們稱之為一個磁碟塊,可以看到每個磁碟塊包含幾個資料項(深藍色所示)和指標(黃色所示〕
如盤塊1包含資料項17和35。包含指標P1、P2、P3,
P1表示小於17的磁碟塊,P2表示在17和35之間的磁碟塊,P3表示大於35的磁碟塊。
真實的資料存在葉子節點即3、5、9、10、13、15、28、29、36、60、75、79、90、99.
非葉子節點不存真實的資料,只存指引搜素萬向的資料項,如17、35並不真實存在於資料表中。
【查詢過程】
如果要查詢資料項29,那麼首先會把磁碟塊1由磁碟載入到記憶體,此時發生一次℃,在記憶體中用二分查詢確定29在17和35之間,鎖定磁碟塊1的P2指標,記憶體時間因為非常短(相比磁碟的IO)可以忽略不計,通過過盤塊1的P2指標的過盤地址把過盤塊3由盤載入到記憶體,發生第二次IO,29在26和30之間,鎖定磁碟塊3的P2指標,通過指標載入磁碟塊8到記憶體,發生第三次IO,同時記憶體中做二分查詢找到29。結束查詢,總計三次IO:
真實的情況是,3層的b+樹可以表示上百萬的資料,如果上百萬的資料查詢只需要三次IO,效能提高將是巨大的,如果沒有索引,每個資料項都要發生一IO,那麼總共要百萬次IO,顯然成本非常高。
什麼情況下建索引? |
1.主鍵自動建立唯一索引
2.頻繁作為杳詢條件的欄位應該建立索引
3.查詢中與其它表關聯的欄位,外來鍵關係建立索引
4.頻繁更新的欄位不適合建立索引,因為每次更新不單單是更新了記錄還會更新索弓
5.Where條件裡用不到的欄位不建立索引
6.單鍵/組合索引的選擇問題(在高併發下傾向建立組合索引)
7.查詢中排序的欄位,排序欄位若通過索引去訪問將大大提高排序速度
8.查詢中統計或者分組欄位
不適合建索引: |
1.表記錄太少
2.經常增改的表,提高了查詢速度,同時卻會降低更新的速度,如對錶進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案
3.資料重複且分佈平均的表字段,因此應該只為最經常查詢和最經常排扉的資料列建立索引。注意,如果某個資料列包含許多重複的內容,為它建立索引沒有太大的實際效果。(比如性別:男,女)
假如一個表有10萬行記錄,有一個欄位A只有T和F兩種值,且每個值的分步概率大約為50%,那麼對這種表A欄位建索引一般不會提高資料庫的查詢速度。
索引的選擇性是指索引列中不同值的數目與表中記錄數的比。如果一個表中有2000條記錄,表索引列有1980個不同的值,那麼這個索引的選擇性就是1980/2000=0.99一個索引的選擇性越接近於1,這個索引的效率就越高