1. 程式人生 > 程式設計 >java開放地址法和鏈地址法解決hash衝突的方法示例

java開放地址法和鏈地址法解決hash衝突的方法示例

hashMap對各位小夥們來說,沒有不知道的了,使用過的人想必或多或少的都瞭解一點hashMap的底層實現原理,總結來說就是,陣列+連結串列,至於原始碼的實現,大家可參看原始碼,今天想說的是hashMap是怎麼解決hash衝突的呢?

首先看一張圖,

在這裡插入圖片描述

從這張圖也大概可以看出來,hashMap維護的是一個數組,數組裡面的每個單元又是一個個連結串列,那麼為什麼會產生hash衝突呢?這也就是接下來要探討的問題。

既是陣列,必然會有長度,當我們在往陣列中插入資料的時候,不管是什麼型別的資料,對於陣列來說,就是佔據了某個下標對應的空間,那麼當加入的資料越來越多的時候,是否會出現多個數據佔據同一個位置呢?答案是肯定的,這就是hash衝突產生的原始因素;

首先,我們先弄清楚幾個概念,對於hashMap或者其他類似的map來說,我們往裡面新增資料的時候,並不是直接往數組裡面加,而是通過計算這個插入資料的hash值,即通過一個hash的演算法,然後把這個值加進去,以後再去查詢資料的時候,hashMap同樣會根據你的key,倒推出這個hash值然後取出資料,即這個hash值可以理解為插入值對應的陣列下表;

但通過實驗我們可以發現,hash函式計算不同的key的時候,可能得到相同的hash值,這樣一來,如果再用這個hash值作為陣列的標識這個值的下標,就無法定位這個值了,這個時候衝突就發生了;

下面我們用程式碼來模擬一下這個使用開發地址法解決hash衝突的問題,首先定義一個物件,這裡為Info,為了更接近真實場景,我們這裡的屬性都為字串,

什麼是開放地址法呢?

當衝突發生的時候,通過查詢陣列的一個空位,將資料插入進去,而不再用hash函式計算獲取數的下標,這個方法就叫做開發地址法;

public class Info {
	private String key;			//關鍵字,或者能標識物件的唯一屬性
	private String name;		//值域
	
	public Info(String key,String name) {
		this.key = key;
		this.name = name;
	}

	public String getKey() {
		return key;
	}

	public void setKey(String key) {
		this.key = key;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}
}

接下來手工寫一個hashTable,用於模擬hashMap,

/**
 * 模擬hashMap
 *
 */
public class HashTable {
	
	private Info[] arr;
	
	/**
	 * 預設的構造方法
	 */
	public HashTable() {
		arr = new Info[100];
	}
	
	/**
	 * 指定陣列初始化大小
	 */
	public HashTable(int maxSize) {
		arr = new Info[maxSize];
	}
	
	/**
	 * 插入資料
	 */
	public void insert(Info info) {
		//獲得關鍵字
		String key = info.getKey();
		//關鍵字所自定的雜湊數
		int hashVal = hashCode(key);
		//如果這個索引已經被佔用,而且裡面是一個未被刪除的資料
		while(arr[hashVal] != null && arr[hashVal].getName() != null) {
			//進行遞加,避免漏找
			++hashVal;
			//迴圈
			hashVal %= arr.length;
		}
		arr[hashVal] = info;
	}
	
	/**
	 * 查詢資料
	 */
	public Info find(String key) {
		int hashVal = hashCode(key);
		while(arr[hashVal] != null) {
			if(arr[hashVal].getKey().equals(key)) {
				return arr[hashVal];
			}
			++hashVal;
			hashVal %= arr.length;
		}
		return null;
	}
	
	/**
	 * 刪除資料
	 */
	public Info delete(String key) {
		int hashVal = hashCode(key);
		//迴圈查詢,陣列中下標為hashVal的值,沒有找到返回null
		while(arr[hashVal] != null) {
			if(arr[hashVal].getKey().equals(key)) {
				Info tmp = arr[hashVal];
				tmp.setName(null);
				return tmp;
			}
			++hashVal;			//由於陣列的值是連續的,為了避免漏找,需要依次往下找
			hashVal %= arr.length;
		}
		return null;
	}
	
	/**
	 * 獲得關鍵字的hash值,也可以自定義
	 */
	public int hashCode(String key) {
		
		BigInteger hashVal = new BigInteger("0");
		BigInteger pow27 = new BigInteger("1");
		for(int i = key.length() - 1; i >= 0; i--) {
			int letter = key.charAt(i) - 96;
			BigInteger letterB = new BigInteger(String.valueOf(letter));
			hashVal = hashVal.add(letterB.multiply(pow27));
			pow27 = pow27.multiply(new BigInteger(String.valueOf(27)));
		}
		return hashVal.mod(new BigInteger(String.valueOf(arr.length))).intValue();
	}
}

可以看到,我們是通過對要插入的數值先進行hash編碼,再對數值的長度進行取模i,這樣得到的位置總能夠落在數值的長度內,

裡面有個地方可能不太好理解,就是在插入資料的時候,我們使用while迴圈進行插入,既然是開發地址,也就是說陣列的每一個閒置的空間我們都能使用,前提是這個位置沒有被其他的值佔用,由於陣列是連續的,所以我們需要迴圈的去尋找一個這樣的位置,所以才有 ++hashVal這段程式碼,直到找到了一個空位,然後我們把資料插入進去,

在這裡插入圖片描述

執行測試main方法,我們看到,資料成功插入,但通過hash函式計算得到的“a”和"ct"卻是一樣的,再一次印證了我們前面所說的問題,

在這裡插入圖片描述

以上便是所說的採用開發地址法解決hash衝突的解決方法,但這樣就萬無一失了嗎?

我們考慮一下,資料的長度是有限的,但我們可能會往數組裡面新增很多資料進去,陣列總有被填滿的時候,那樣開發地址法也不管用了,當然,實際業務中,如果可以預料資料的大小,我們可以採用這樣的方式解決部分問題,但問題是這樣確實不是萬無一失的解決辦法,

更合適的方式是什麼呢?其實就是hashMap中使用較多的鏈地址法,也就是一開始我們圖中展示的,基本結構仍然是一個數組,但是陣列的每個單元維護的不再是一個個資料,而是一個個連結串列,也就是類似於linkedList這樣的結構,當新插入的多個數據通過計算hash函式得到的是相同的陣列下標時候,我們只需要把值往這個索引位置維護的連結串列中插入即可,什麼是鏈地址法呢?

**

在hash表每個單元中設定連結串列,某個要插入的資料項的關鍵字還是像通常那樣對映到hash表的某個單元中,而資料項的本身則被插入到該單元維護的連結串列中;

**

下面用程式碼來實現一下這個過程,同上面所有不同的是,連結串列中的結構我們通過是維護者一個個節點,即Node ,對連結串列結構不熟悉的同學可以先自行百度一下,不是很難,

1、定義一個物件Info,

public class Info {
	
	private String key;
	private String name;
	
	public Info(String key,String name) {
		this.key = key;
		this.name = name;
	}

	public String getKey() {
		return key;
	}

	public void setKey(String key) {
		this.key = key;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}
	
	
	
}

2、定義一個Node作為連結串列中的基本儲存單元,

public class Node {

	// 資料域
	public Info info;
	// 指標域,指向對下一個節點引用
	public Node next;

	public Node(Info info) {
		this.info = info;
	}

}

3、定義一個連結串列,

/**
 * 模擬linkedList
 * 
 * @author asus
 *
 */
public class LinkList {

	// 頭結點
	private Node first;

	public LinkList() {
		first = null;
	}

	// 插入一個節點
	public void insertFirst(Info info) {
		Node node = new Node(info);
		node.next = first;
		first = node;
	}

	// 刪除一個節點,在頭結點後進行刪除
	public Node deleteFirst() {
		Node temp = first;
		first = temp.next;
		return temp;
	}

	/**
	 * 查詢方法
	 */
	public Node find(String key) {
		Node current = first;
		while (!key.equals(current.info.getKey())) {
			if (current.next == null) {
				return null;
			}
			current = current.next;
		}
		return current;
	}

	/**
	 * 刪除方法
	 */
	public Node delete(String key) {
		Node current = first;
		Node previous = first;
		while (!key.equals(current.info.getKey())) {
			if (current.next == null) {
				return null;
			}
			previous = current;
			current = current.next;
		}

		if (current == first) {
			first = first.next;
		} else {
			previous.next = current.next;
		}
		return current;

	}

}

4、模擬hashMap的幾個方法,

public class HashTable {

	private LinkList[] arr;

	/**
	 * 預設的構造方法
	 */
	public HashTable() {
		arr = new LinkList[100];
	}

	/**
	 * 指定陣列初始化大小
	 */
	public HashTable(int maxSize) {
		arr = new LinkList[maxSize];
	}

	/**
	 * 插入資料
	 */
	public void insert(Info info) {
		String key = info.getKey();
		// 獲取關鍵字的自定義hash函式
		int hashVal = hashCode(key);

		if (arr[hashVal] == null) {		//如果陣列某個單元的位置為空,則需要重新構造一個linkList
			arr[hashVal] = new LinkList();
		}
		arr[hashVal].insertFirst(info);
	}

	/**
	 * 查詢資料
	 */
	public Info find(String key) {
		int hashVal = hashCode(key);
		return arr[hashVal].find(key).info;
	}
	
	/**
	 * 刪除資料
	 */
	public Info delete(String key){
		int hashVal = hashCode(key);
		return arr[hashVal].delete(key).info;
	}
	

	/**
	 * 自定義計算hash的函式
	 */
	public int hashCode(String key) {

		BigInteger hashVal = new BigInteger("0");
		BigInteger pow27 = new BigInteger("1");
		for (int i = key.length() - 1; i >= 0; i--) {
			int letter = key.charAt(i) - 96;
			BigInteger letterB = new BigInteger(String.valueOf(letter));
			hashVal = hashVal.add(letterB.multiply(pow27));
			pow27 = pow27.multiply(new BigInteger(String.valueOf(27)));
		}
		return hashVal.mod(new BigInteger(String.valueOf(arr.length))).intValue();
	}

}

和上面開發地址法插入資料和查詢資料不同,此種方式進行資料查詢的時候,其實是進行兩次查到的,第一次定位陣列中的位置,第二次去到連結串列中,呼叫連結串列的查詢方法進行查詢,這一點值得注意,插入和刪除的思想也是類似,

在這裡插入圖片描述

下面我們來測試一下,可以看到,依然達到了效果,說明我們模擬的鏈地址法也生效了,

在這裡插入圖片描述

以上就是通過開發地址法和鏈地址法解決hash衝突的兩種方式,希望對大家理解hashMap的底層原理有所幫助…感謝觀看!也希望大家多多支援我們。