Hash索引和BTree索引區別

阿新 • • 發佈：2019-01-16

索引是幫助mysql獲取資料的資料結構。最常見的索引是Btree索引和Hash索引。

不同的引擎對於索引有不同的支援：Innodb和MyISAM預設的索引是Btree索引；而Mermory預設的索引是Hash索引。

我們在mysql中常用兩種索引演算法BTree和Hash，兩種演算法檢索方式不一樣，對查詢的作用也不一樣。
一、BTree
BTree索引是最常用的mysql資料庫索引演算法，因為它不僅可以被用在=,>,>=,<,<=和between這些比較操作符上，而且還可以用於like操作符，只要它的查詢條件是一個不以萬用字元開頭的常量，例如：
select * from user where name like ‘jack%’;
select * from user where name like ‘jac%k%’;
如果一萬用字元開頭，或者沒有使用常量，則不會使用索引，例如：
select * from user where name like ‘%jack’;
select * from user where name like simply_name;
二、Hash
Hash索引只能用於對等比較，例如=,<=>（相當於=）操作符。由於是一次定位資料，不像BTree索引需要從根節點到枝節點，最後才能訪問到頁節點這樣多次IO訪問，所以檢索效率遠高於BTree索引。
但為什麼我們使用BTree比使用Hash多呢？主要Hash本身由於其特殊性，也帶來了很多限制和弊端：
1. Hash索引僅僅能滿足“=”,“IN”,“<=>”查詢，不能使用範圍查詢。
2. 聯合索引中，Hash索引不能利用部分索引鍵查詢。
對於聯合索引中的多個列，Hash是要麼全部使用，要麼全部不使用，並不支援BTree支援的聯合索引的最優字首，也就是聯合索引的前面一個或幾個索引鍵進行查詢時，Hash索引無法被利用。
3. Hash索引無法避免資料的排序操作
由於Hash索引中存放的是經過Hash計算之後的Hash值，而且Hash值的大小關係並不一定和Hash運算前的鍵值完全一樣，所以資料庫無法利用索引的資料來避免任何排序運算。
4. Hash索引任何時候都不能避免表掃描
Hash索引是將索引鍵通過Hash運算之後，將Hash運算結果的Hash值和所對應的行指標資訊存放於一個Hash表中，由於不同索引鍵存在相同Hash值，所以即使滿足某個Hash鍵值的資料的記錄條數，也無法從Hash索引中直接完成查詢，還是要通過訪問表中的實際資料進行比較，並得到相應的結果。
5. Hash索引遇到大量Hash值相等的情況後效能並不一定會比BTree高
對於選擇性比較低的索引鍵，如果建立Hash索引，那麼將會存在大量記錄指標資訊存於同一個Hash值相關聯。這樣要定位某一條記錄時就會非常麻煩，會浪費多次表資料訪問，而造成整體效能底下。

Hash索引

所謂Hash索引，當我們要給某張表某列增加索引時，將這張表的這一列進行雜湊演算法計算，得到雜湊值，排序在雜湊陣列上。所以Hash索引可以一次定位，其效率很高，而Btree索引需要經過多次的磁碟IO，但是innodb和myisam之所以沒有采用它，是因為它存在著好多缺點：

1、因為Hash索引比較的是經過Hash計算的值，所以只能進行等式比較，不能用於範圍查詢

1、每次都要全表掃描

2、由於雜湊值是按照順序排列的，但是雜湊值對映的真正資料在雜湊表中就不一定按照順序排列，所以無法利用Hash索引來加速任何排序操作

3、不能用部分索引鍵來搜尋，因為組合索引在計算雜湊值的時候是一起計算的。

4、當雜湊值大量重複且資料量非常大時，其檢索效率並沒有Btree索引高的。

Btree索引

至於Btree索引，它是以B+樹為儲存結構實現的。

但是Btree索引的儲存結構在Innodb和MyISAM中有很大區別。

在MyISAM中，我們如果要對某張表的某列建立Btree索引的話，如圖：

所以我們經常會說MyISAM中資料檔案和索引檔案是分開的。

因此MyISAM的索引方式也稱為非聚集，Innodb的索引方式成為聚集索引。

至於輔助索引，類似於主索引，唯一區別就是主索引上的值不能重複，而輔助索引可以重複。

因此當我們根據Btree索引去搜索的時候，若key存在，在data域找到其地址，然後根據地址去表中查詢資料記錄。

至於Innodb它跟上面又有很大不同，它的葉子節點儲存的並不是表的地址，而是資料

我們可以看到這裡並沒有將地址放入葉子節點，而是直接放入了對應的資料，這也就是我們平常說到的，Innodb的索引檔案就是資料檔案，

那麼對於Innodb的輔助索引結構跟主索引也相差很多，如圖：

我們可以發現，這裡葉子節點儲存的是主鍵的資訊，所以我們在利用輔助索引的時候，檢索到主鍵資訊，然後再通過主鍵去主索引中定位表中的資料，這就可以說明Innodb中主鍵之所以不宜用過長的欄位，由於所有的輔助索引都包含主索引，所以很容易讓輔助索引變得龐大。

我們還可以發現：在Innodb中儘量使用自增的主鍵，這樣每次增加資料時只需要在後面新增即可，非單調的主鍵在插入時會需要維持B+tree特性而進行分裂調整，十分低效。

Btree索引中的最左匹配原則：
Btree是按照從左到右的順序來建立搜尋樹的。比如索引是(name,age,sex)，會先檢查name欄位，如果name欄位相同再去檢查後兩個欄位。

所以當傳進來的是後兩個欄位的資料（age，sex），因為建立搜尋樹的時候是按照第一個欄位建立的，所以必須根據name欄位才能知道下一個欄位去哪裡查詢。

所以傳進來的是（name，sex）時，首先會根據name指定搜尋方向，但是第二個欄位缺失，所以將name欄位正確的都找到後，然後才會去匹配sex的資料。

建立索引的規則：
1、利用最左字首：Mysql會一直向右查詢直到遇到範圍操作（>，<，like、between）就停止匹配。比如a=1 and b=2 and c>3 and d=6；此時如果建立了（a,b,c,d）索引，那麼後面的d索引是完全沒有用到，當換成了（a,b,d,c）就可以用到。

2、不能過度索引：在修改表內容的時候，索引必須更新或者重構，所以索引過多時，會消耗更多的時間。

3、儘量擴充套件索引而不要新建索引

4、最適合的索引的列是出現在where子句中的列或連線子句中指定的列。

5、不同值較少的列不必要建立索引（性別）。

Hash索引和BTree索引區別

Hash索引和BTree索引區別

Mysql索引---Hash索引和Btree索引區別

hash索引和btree索引的區別

(ainusers原創)Hash索引和BTree索引

mysql的hash索引和btree索引

Hash索引和BTree索引

mysql索引型別Normal,Unique,Full Text區別以及索引方法btree索引和hash的區別

索引原理-btree索引與hash索引的區別

數據庫索引（BTree索引和Hash索引）

單列索引和聯合索引區別

普通索引和唯一索引的區別、性能差異，以及其他索引簡介

唯一索引和普通索引的區別

普通索引和唯一索引的區別

SAP裡主索引和二級索引區別

聯合索引和單個索引的區別：

多個單列索引和聯合索引的區別詳解

【轉】Mysql學習-索引總結(B-tree和hash、主鍵索引、唯一索引、普通索引、全文索引和組合索引)

主索引和二級索引區別，並建立一個二級索引

mysql單個索引和聯合索引的區別

普通索引和唯一索引的區別、效能差異，以及其他索引簡介

Hash索引和BTree索引區別

相關推薦