1. 程式人生 > >什麼是Hash衝突,又如何解決?

什麼是Hash衝突,又如何解決?

什麼是Hash衝突?

雜湊計算就是努力的把比較大的資料存放到相對較小的空間中。 最常見的雜湊演算法是取模法。 下面簡單講講取模法的計算過程。 比如:陣列的長度是5。這時有一個數據是6。那麼如何把這個 6存放到長度只有5的陣列中呢。按照取模法,計算 6%5,結果是1,那麼就把6放到陣列下標是1的位置。那麼,7 就應該放到2這個位置。到此位置,哈斯衝突還沒有出現。 這時,有個資料是11,按照取模法,11%5=1,也等於1。那麼 原來陣列下標是1的地方已經有數了,是6。這時又計算出1這個 位置,那麼陣列1這個位置,就必須儲存兩個數了。這時,就叫 雜湊衝突。衝突之後就要按照順序來存放了。 如果資料的分佈比較廣泛,而且儲存資料的陣列長度比較大。 那麼雜湊衝突就比較少。否則衝突是很高的。

如何解決hash衝突?

1, 開放定址法: 所謂的開放定址法就是一旦發生了衝突,就去尋找下一個空的雜湊地址,只要散列表足夠大,空的雜湊地址總能找到,並將記錄存入 公式為:fi(key) = (f(key)+di) MOD m (di=1,2,3,……,m-1) ※ 用開放定址法解決衝突的做法是:當衝突發生時,使用某種探測技術在散列表中形成一個探測序列。沿此序列逐個單元地查詢,直到找到給定的關鍵字,或者 碰到一個開放的地址(即該地址單元為空)為止(若要插入,在探查到開放的地址,則可將待插入的新結點存人該地址單元)。查詢時探測到開放的地址則表明表 中無待查的關鍵字,即查詢失敗。 比如說,我們的關鍵字集合為{12,67,56,16,25,37,22,29,15,47,48,34},表長為12。 我們用雜湊函式f(key) = key mod l2 當計算前S個數{12,67,56,16,25}時,都是沒有衝突的雜湊地址,直接存入:

計算key = 37時,發現f(37) = 1,此時就與25所在的位置衝突。 於是我們應用上面的公式f(37) = (f(37)+1) mod 12 = 2。於是將37存入下標為2的位置:

2, 再雜湊法: 再雜湊法又叫雙雜湊法,有多個不同的Hash函式,當發生衝突時,使用第二個,第三個,….,等雜湊函式 計算地址,直到無衝突。雖然不易發生聚集,但是增加了計算時間。

3, 鏈地址法: 鏈地址法的基本思想是:每個雜湊表節點都有一個next指標,多個雜湊表節點可以用next指標構成一個單向連結串列,被分配到同一個索引上的多個節點可以用這個單向 連結串列連線起來,如: 鍵值對k2, v2與鍵值對k1, v1通過計算後的索引值都為2,這時及產生衝突,但是可以通道next指標將k2, k1所在的節點連線起來,這樣就解決了雜湊的衝突問題

4, 建立公共溢位區: 這種方法的基本思想是:將雜湊表分為基本表和溢位表兩部分,凡是和基本表發生衝突的元素,一律填入溢位表