什麼是Hash衝突，又如何解決？

阿新 • • 發佈：2018-12-18

什麼是Hash衝突？

雜湊計算就是努力的把比較大的資料存放到相對較小的空間中。最常見的雜湊演算法是取模法。下面簡單講講取模法的計算過程。比如：陣列的長度是5。這時有一個數據是6。那麼如何把這個 6存放到長度只有5的陣列中呢。按照取模法，計算 6％5，結果是1，那麼就把6放到陣列下標是1的位置。那麼，7 就應該放到2這個位置。到此位置，哈斯衝突還沒有出現。這時，有個資料是11，按照取模法，11％5＝1，也等於1。那麼原來陣列下標是1的地方已經有數了，是6。這時又計算出1這個位置，那麼陣列1這個位置，就必須儲存兩個數了。這時，就叫雜湊衝突。衝突之後就要按照順序來存放了。如果資料的分佈比較廣泛，而且儲存資料的陣列長度比較大。那麼雜湊衝突就比較少。否則衝突是很高的。

如何解決hash衝突？

1，開放定址法：所謂的開放定址法就是一旦發生了衝突，就去尋找下一個空的雜湊地址，只要散列表足夠大，空的雜湊地址總能找到，並將記錄存入公式為：fi(key) = (f(key)+di) MOD m (di=1,2,3,……,m-1) ※ 用開放定址法解決衝突的做法是：當衝突發生時，使用某種探測技術在散列表中形成一個探測序列。沿此序列逐個單元地查詢，直到找到給定的關鍵字，或者碰到一個開放的地址（即該地址單元為空）為止（若要插入，在探查到開放的地址，則可將待插入的新結點存人該地址單元）。查詢時探測到開放的地址則表明表中無待查的關鍵字，即查詢失敗。比如說，我們的關鍵字集合為{12,67,56,16,25,37,22,29,15,47,48,34},表長為12。我們用雜湊函式f(key) = key mod l2 當計算前S個數{12,67,56,16,25}時，都是沒有衝突的雜湊地址，直接存入：

計算key = 37時，發現f(37) = 1，此時就與25所在的位置衝突。於是我們應用上面的公式f(37) = (f(37)+1) mod 12 = 2。於是將37存入下標為2的位置：

2，再雜湊法：再雜湊法又叫雙雜湊法，有多個不同的Hash函式，當發生衝突時，使用第二個，第三個，….，等雜湊函式計算地址，直到無衝突。雖然不易發生聚集，但是增加了計算時間。

3，鏈地址法：鏈地址法的基本思想是：每個雜湊表節點都有一個next指標，多個雜湊表節點可以用next指標構成一個單向連結串列，被分配到同一個索引上的多個節點可以用這個單向連結串列連線起來，如：鍵值對k2, v2與鍵值對k1, v1通過計算後的索引值都為2，這時及產生衝突，但是可以通道next指標將k2, k1所在的節點連線起來，這樣就解決了雜湊的衝突問題

4，建立公共溢位區：這種方法的基本思想是：將雜湊表分為基本表和溢位表兩部分，凡是和基本表發生衝突的元素，一律填入溢位表

什麼是Hash衝突，又如何解決？