雜湊表簡介

阿新 • • 發佈：2019-01-11

相信學計算機的同學對雜湊表都不陌生，但由於它的重要性，我還是在這裡介紹一下，算是一個複習。

雜湊表是一種在插入，刪除，搜尋上等操作上具有“常數時間平均時間"（當然是指統計表現上)的資料結構，這種表現不需要依賴元素的隨機性。

雜湊表的核心是對映函式，即雜湊函式，常用的雜湊函式稍後介紹(我見過一些相當奇怪的對映函式，不知道創造的人是怎麼想的，可能我數學基礎還是太差了，無法設計出那種很神奇的對映函式，比如redis的底層資料結構hash中就有用到一種古怪的雜湊函式)，我們先來解決另一個問題：碰撞問題(不同的元素被對映到相同的位置，比如採用對映函式y = x^2,那麼-1和1的對映結果是相同的，這就很麻煩了。為了解決碰撞問題，我們常用的方法有如下幾種：

1.開放定址法

這種方法也稱再雜湊法，其基本思想是：當關鍵字key的雜湊地址p=H（key）出現衝突時，以p為基礎，產生另一個雜湊地址p1，如果p1仍然衝突，再以p為基礎，產生另一個雜湊地址p2，…，直到找出一個不衝突的雜湊地址pi ，將相應元素存入其中。這種方法有一個通用的再雜湊函式形式：
Hi=（H（key）+di）% m i=1，2，…，n
其中H（key）為雜湊函式，m 為表長，di稱為增量序列。增量序列的取值方式不同，相應的再雜湊方式也不同。主要有以下三種：
    線性探測再雜湊
      dii=1，2，3，…，m-1
        這種方法的特點是：衝突發生時，順序查看錶中下一單元，直到找出一個空單元或查遍全表。
    二次探測再雜湊
      di=12，-12，22，-22，…，k2，-k2 ( k<=m/2 )
    這種方法的特點是：衝突發生時，在表的左右進行跳躍式探測，比較靈活。
    偽隨機探測再雜湊
    di=偽隨機數序列。
        具體實現時，應建立一個偽隨機數發生器，（如i=(i+p) % m），並給定一個隨機數做起點

2.開鏈法：這種方法是在每一個表格中分配一個list，然後我們在那個list上執行插入，查詢，刪除，如果list不太長，即同一個位置上的衝突不要發生特別多，速度還是可以接受的。下面是我從網上隨便找的一張形象地描述開鏈法的圖：

3.再雜湊法

這種方法是同時構造多個不同的雜湊函式：
Hi=RH1（key） i=1，2，…，k
當雜湊地址Hi=RH1（key）發生衝突時，再計算Hi=RH2（key）……，直到衝突不再產生。這種方法不易產生聚集，但增加了計算時間。

4.建立公共溢位區

這裡對這個方法不做介紹

接下來再來介紹一下Hash表的平均查詢長度

　　Hash表的平均查詢長度包括查詢成功時的平均查詢長度和查詢失敗時的平均查詢長度。

　　查詢成功時的平均查詢長度=表中每個元素查詢成功時的比較次數之和/表中元素個數；

　　下面舉個我從網上借鑑的例子：

　　有一組關鍵字{23，12，14，2，3，5}，表長為14，Hash函式為key%11，則關鍵字在表中的儲存如下：

　　地址 0 1 2 3 4 5 6 7 8 9 10 11 12 13

　　關鍵字 23 12 14 2 3 5

　比較次數 1 2 1 3 3 2

　　因此查詢成功時的平均查詢長度為(1+2+1+3+3+2)/6=11/6；

　　查詢失敗時的平均查詢長度為(1+7+6+5+4+3+2+1+1+1+1+1+1+1)/14=38/14；

　　另外再介紹一下負載係數：表中元素個數除以表格大小。

改天介紹下雜湊表的具體程式碼實現。

雜湊表簡介

雜湊表簡介(Intorduction to Hash Table)

雜湊表簡介

字典樹簡介、應用以及與雜湊表的比較

Hash(雜湊/雜湊)表中衝突處理及命中計算

查詢演算法淺談演算法和資料結構: 七二叉查詢樹淺談演算法和資料結構: 十一雜湊表

【LeetCode】雜湊表 hashmap（共88題）

記錄一下雜湊表底層原理

散列表（雜湊表）+雜湊衝突的解決方法

九章演算法筆記 8.雜湊表與堆 Hash & Heap

27-集合--Set及其子類（HashSet+LinkedHashSet+TreeSet）+二叉樹+Comparable+Comparator+雜湊表+HashSet儲存自定義物件+判斷元素唯一的方式

基於雜湊表實現字典和集合

雜湊表的原理及實現

資料結構基礎之查詢（下）：雜湊表

構建雜湊表——優化暴力求解方程

構造雜湊表——求前m大的數

雜湊表—拉鍊法

二叉樹和雜湊表的優缺點對比與選擇

雜湊表 -- C語言實現

雜湊表的儲存自定義物件

雜湊表的儲存過程

雜湊表簡介

相關推薦