java開放地址法和鏈地址法解決hash衝突的方法示例
hashMap對各位小夥們來說,沒有不知道的了,使用過的人想必或多或少的都瞭解一點hashMap的底層實現原理,總結來說就是,陣列+連結串列,至於原始碼的實現,大家可參看原始碼,今天想說的是hashMap是怎麼解決hash衝突的呢?
首先看一張圖,
從這張圖也大概可以看出來,hashMap維護的是一個數組,數組裡面的每個單元又是一個個連結串列,那麼為什麼會產生hash衝突呢?這也就是接下來要探討的問題。
既是陣列,必然會有長度,當我們在往陣列中插入資料的時候,不管是什麼型別的資料,對於陣列來說,就是佔據了某個下標對應的空間,那麼當加入的資料越來越多的時候,是否會出現多個數據佔據同一個位置呢?答案是肯定的,這就是hash衝突產生的原始因素;
首先,我們先弄清楚幾個概念,對於hashMap或者其他類似的map來說,我們往裡面新增資料的時候,並不是直接往數組裡面加,而是通過計算這個插入資料的hash值,即通過一個hash的演算法,然後把這個值加進去,以後再去查詢資料的時候,hashMap同樣會根據你的key,倒推出這個hash值然後取出資料,即這個hash值可以理解為插入值對應的陣列下表;
但通過實驗我們可以發現,hash函式計算不同的key的時候,可能得到相同的hash值,這樣一來,如果再用這個hash值作為陣列的標識這個值的下標,就無法定位這個值了,這個時候衝突就發生了;
下面我們用程式碼來模擬一下這個使用開發地址法解決hash衝突的問題,首先定義一個物件,這裡為Info,為了更接近真實場景,我們這裡的屬性都為字串,
什麼是開放地址法呢?
當衝突發生的時候,通過查詢陣列的一個空位,將資料插入進去,而不再用hash函式計算獲取數的下標,這個方法就叫做開發地址法;
public class Info { private String key; //關鍵字,或者能標識物件的唯一屬性 private String name; //值域 public Info(String key,String name) { this.key = key; this.name = name; } public String getKey() { return key; } public void setKey(String key) { this.key = key; } public String getName() { return name; } public void setName(String name) { this.name = name; } }
接下來手工寫一個hashTable,用於模擬hashMap,
/** * 模擬hashMap * */ public class HashTable { private Info[] arr; /** * 預設的構造方法 */ public HashTable() { arr = new Info[100]; } /** * 指定陣列初始化大小 */ public HashTable(int maxSize) { arr = new Info[maxSize]; } /** * 插入資料 */ public void insert(Info info) { //獲得關鍵字 String key = info.getKey(); //關鍵字所自定的雜湊數 int hashVal = hashCode(key); //如果這個索引已經被佔用,而且裡面是一個未被刪除的資料 while(arr[hashVal] != null && arr[hashVal].getName() != null) { //進行遞加,避免漏找 ++hashVal; //迴圈 hashVal %= arr.length; } arr[hashVal] = info; } /** * 查詢資料 */ public Info find(String key) { int hashVal = hashCode(key); while(arr[hashVal] != null) { if(arr[hashVal].getKey().equals(key)) { return arr[hashVal]; } ++hashVal; hashVal %= arr.length; } return null; } /** * 刪除資料 */ public Info delete(String key) { int hashVal = hashCode(key); //迴圈查詢,陣列中下標為hashVal的值,沒有找到返回null while(arr[hashVal] != null) { if(arr[hashVal].getKey().equals(key)) { Info tmp = arr[hashVal]; tmp.setName(null); return tmp; } ++hashVal; //由於陣列的值是連續的,為了避免漏找,需要依次往下找 hashVal %= arr.length; } return null; } /** * 獲得關鍵字的hash值,也可以自定義 */ public int hashCode(String key) { BigInteger hashVal = new BigInteger("0"); BigInteger pow27 = new BigInteger("1"); for(int i = key.length() - 1; i >= 0; i--) { int letter = key.charAt(i) - 96; BigInteger letterB = new BigInteger(String.valueOf(letter)); hashVal = hashVal.add(letterB.multiply(pow27)); pow27 = pow27.multiply(new BigInteger(String.valueOf(27))); } return hashVal.mod(new BigInteger(String.valueOf(arr.length))).intValue(); } }
可以看到,我們是通過對要插入的數值先進行hash編碼,再對數值的長度進行取模i,這樣得到的位置總能夠落在數值的長度內,
裡面有個地方可能不太好理解,就是在插入資料的時候,我們使用while迴圈進行插入,既然是開發地址,也就是說陣列的每一個閒置的空間我們都能使用,前提是這個位置沒有被其他的值佔用,由於陣列是連續的,所以我們需要迴圈的去尋找一個這樣的位置,所以才有 ++hashVal這段程式碼,直到找到了一個空位,然後我們把資料插入進去,
執行測試main方法,我們看到,資料成功插入,但通過hash函式計算得到的“a”和"ct"卻是一樣的,再一次印證了我們前面所說的問題,
以上便是所說的採用開發地址法解決hash衝突的解決方法,但這樣就萬無一失了嗎?
我們考慮一下,資料的長度是有限的,但我們可能會往數組裡面新增很多資料進去,陣列總有被填滿的時候,那樣開發地址法也不管用了,當然,實際業務中,如果可以預料資料的大小,我們可以採用這樣的方式解決部分問題,但問題是這樣確實不是萬無一失的解決辦法,
更合適的方式是什麼呢?其實就是hashMap中使用較多的鏈地址法,也就是一開始我們圖中展示的,基本結構仍然是一個數組,但是陣列的每個單元維護的不再是一個個資料,而是一個個連結串列,也就是類似於linkedList這樣的結構,當新插入的多個數據通過計算hash函式得到的是相同的陣列下標時候,我們只需要把值往這個索引位置維護的連結串列中插入即可,什麼是鏈地址法呢?
**
在hash表每個單元中設定連結串列,某個要插入的資料項的關鍵字還是像通常那樣對映到hash表的某個單元中,而資料項的本身則被插入到該單元維護的連結串列中;
**
下面用程式碼來實現一下這個過程,同上面所有不同的是,連結串列中的結構我們通過是維護者一個個節點,即Node ,對連結串列結構不熟悉的同學可以先自行百度一下,不是很難,
1、定義一個物件Info,
public class Info { private String key; private String name; public Info(String key,String name) { this.key = key; this.name = name; } public String getKey() { return key; } public void setKey(String key) { this.key = key; } public String getName() { return name; } public void setName(String name) { this.name = name; } }
2、定義一個Node作為連結串列中的基本儲存單元,
public class Node { // 資料域 public Info info; // 指標域,指向對下一個節點引用 public Node next; public Node(Info info) { this.info = info; } }
3、定義一個連結串列,
/** * 模擬linkedList * * @author asus * */ public class LinkList { // 頭結點 private Node first; public LinkList() { first = null; } // 插入一個節點 public void insertFirst(Info info) { Node node = new Node(info); node.next = first; first = node; } // 刪除一個節點,在頭結點後進行刪除 public Node deleteFirst() { Node temp = first; first = temp.next; return temp; } /** * 查詢方法 */ public Node find(String key) { Node current = first; while (!key.equals(current.info.getKey())) { if (current.next == null) { return null; } current = current.next; } return current; } /** * 刪除方法 */ public Node delete(String key) { Node current = first; Node previous = first; while (!key.equals(current.info.getKey())) { if (current.next == null) { return null; } previous = current; current = current.next; } if (current == first) { first = first.next; } else { previous.next = current.next; } return current; } }
4、模擬hashMap的幾個方法,
public class HashTable { private LinkList[] arr; /** * 預設的構造方法 */ public HashTable() { arr = new LinkList[100]; } /** * 指定陣列初始化大小 */ public HashTable(int maxSize) { arr = new LinkList[maxSize]; } /** * 插入資料 */ public void insert(Info info) { String key = info.getKey(); // 獲取關鍵字的自定義hash函式 int hashVal = hashCode(key); if (arr[hashVal] == null) { //如果陣列某個單元的位置為空,則需要重新構造一個linkList arr[hashVal] = new LinkList(); } arr[hashVal].insertFirst(info); } /** * 查詢資料 */ public Info find(String key) { int hashVal = hashCode(key); return arr[hashVal].find(key).info; } /** * 刪除資料 */ public Info delete(String key){ int hashVal = hashCode(key); return arr[hashVal].delete(key).info; } /** * 自定義計算hash的函式 */ public int hashCode(String key) { BigInteger hashVal = new BigInteger("0"); BigInteger pow27 = new BigInteger("1"); for (int i = key.length() - 1; i >= 0; i--) { int letter = key.charAt(i) - 96; BigInteger letterB = new BigInteger(String.valueOf(letter)); hashVal = hashVal.add(letterB.multiply(pow27)); pow27 = pow27.multiply(new BigInteger(String.valueOf(27))); } return hashVal.mod(new BigInteger(String.valueOf(arr.length))).intValue(); } }
和上面開發地址法插入資料和查詢資料不同,此種方式進行資料查詢的時候,其實是進行兩次查到的,第一次定位陣列中的位置,第二次去到連結串列中,呼叫連結串列的查詢方法進行查詢,這一點值得注意,插入和刪除的思想也是類似,
下面我們來測試一下,可以看到,依然達到了效果,說明我們模擬的鏈地址法也生效了,
以上就是通過開發地址法和鏈地址法解決hash衝突的兩種方式,希望對大家理解hashMap的底層原理有所幫助…感謝觀看!也希望大家多多支援我們。