查詢演算法之雜湊查詢

阿新 • • 發佈：2019-01-12

雜湊查詢是通過計算資料元素的儲存地址進行查詢的一種方法。O(1)的查詢，即所謂的秒殺。雜湊查詢的本質是先將資料對映成它的雜湊值。雜湊查詢的核心是構造一個雜湊函式，它將原來直觀、整潔的資料對映為看上去似乎是隨機的一些整數。

雜湊查詢的操作步驟：

1) 用給定的雜湊函式構造雜湊表；

2) 根據選擇的衝突處理方法解決地址衝突；

3) 在雜湊表的基礎上執行雜湊查詢。

建立雜湊表操作步驟：

1) step1 取資料元素的關鍵字key，計算其雜湊函式值（地址）。若該地址對應的儲存空間還沒有被佔用，則將該元素存入；否則執行step2解決衝突。

2) step2

根據選擇的衝突處理方法，計算關鍵字key的下一個儲存地址。若下一個儲存地址仍被佔用，則繼續執行step2，直到找到能用的儲存地址為止。

雜湊查詢步驟為：

1) Step1 對給定k值，計算雜湊地址 Di=H（k）；若HST為空，則查詢失敗；若HST=k，則查詢成功；否則，執行step2（處理衝突）。

2) Step2 重複計算處理衝突的下一個儲存地址 Dk=R（Dk-1），直到HST[Dk]為空，或HST[Dk]=k為止。若HST[Dk]=K，則查詢成功，否則查詢失敗。

比如說：”5“是一個要儲存的數，然後我丟給雜湊函式，雜湊函式給我返回一個”2"，那麼此時的”5“和“2

”就建立一種對應關係，這種關係就是所謂的“雜湊關係”，在實際應用中也就形成了”2“是key，”5“是value。

那麼有的朋友就會問如何做雜湊，首先做雜湊必須要遵守兩點原則：

①: key儘可能的分散，也就是我丟一個“6”和“5”給你，你都返回一個“2”，那麼這樣的雜湊函數不盡完美。

②：雜湊函式儘可能的簡單，也就是說丟一個“6”給你，你雜湊函式要搞1小時才能給我，這樣也是不好的。

其實常用的做雜湊的手法有“五種”：

第一種：”直接定址法“。

很容易理解，key=Value+C；這個“C"是常量。Value+C其實就是一個簡單的雜湊函式。

第二種：“除法取餘法”。

很容易理解， key=value%C;

解釋同上。

第三種：“數字分析法”。

這種蠻有意思，比如有一組value1=112233，value2=112633，value3=119033，

針對這樣的數我們分析數中間兩個數比較波動，其他數不變。那麼我們取key的值就可以是

key1=22,key2=26,key3=90。

第四種：“平方取中法”。此處忽略，見名識意。

第五種：“摺疊法”。

這種蠻有意思,比如value=135790，要求key是2位數的雜湊值。那麼我們將value變為13+57+90=160，然後去掉高位“1”,此時key=60，哈哈，這就是他們的雜湊關係，這樣做的目的就是key與每一位value都相關，來做到“雜湊地址”儘可能分散的目地。

影響雜湊查詢效率的一個重要因素是雜湊函式本身。當兩個不同的資料元素的雜湊值相同時，就會發生衝突。為減少發生衝突的可能性，雜湊函式應該將資料儘可能分散地對映到雜湊表的每一個表項中。

解決衝突的方法有以下兩種：　　

(1) 開放地址法　　

如果兩個資料元素的雜湊值相同，則在雜湊表中為後插入的資料元素另外選擇一個表項。當程式查詢雜湊表時，如果沒有在第一個對應的雜湊表項中找到符合查詢要求的資料元素，程式就會繼續往後查詢，直到找到一個符合查詢要求的資料元素，或者遇到一個空的表項。　　

(2) 鏈地址法

將雜湊值相同的資料元素存放在一個連結串列中，在查詢雜湊表的過程中，當查詢到這個連結串列時，必須採用線性查詢方法。

實現雜湊函式為“除法取餘法”，解決衝突為“開放地址線性探測法”，程式碼如下：

public class HashSearch {

	public static void main(String[] args) {
		//“除法取餘法”
        int hashLength = 13;

        int [] array  = { 13, 29, 27, 28, 26, 30, 38 };

        //雜湊表長度
        int[] hash = new int[hashLength];
        //建立hash
        for (int i = 0; i < array.length; i++)
        {
            insertHash(hash, hashLength, array[i]);
        }
        
        int result = searchHash(hash,hashLength, 29);

		if (result != -1)
			System.out.println("已經在陣列中找到，索引位置為：" + result);
		else
			System.out.println("沒有此原始");
	}

	/****
	 * Hash表檢索資料
	 * 
	 * @param hash
	 * @param hashLength
	 * @param key
	 * @return
	 */
	public static int searchHash(int[] hash, int hashLength, int key) {
		// 雜湊函式
		int hashAddress = key % hashLength;

		// 指定hashAdrress對應值存在但不是關鍵值，則用開放定址法解決
		while (hash[hashAddress] != 0 && hash[hashAddress] != key) {
			hashAddress = (++hashAddress) % hashLength;
		}

		// 查詢到了開放單元，表示查詢失敗
		if (hash[hashAddress] == 0)
			return -1;
		return hashAddress;

	}

	/***
	 * 資料插入Hash表
	 * 
	 * @param hash 雜湊表
	 * @param hashLength
	 * @param data
	 */
	public static void insertHash(int[] hash, int hashLength, int data) {
		// 雜湊函式
		int hashAddress = data % hashLength;

		// 如果key存在，則說明已經被別人佔用，此時必須解決衝突
		while (hash[hashAddress] != 0) {
			// 用開放定址法找到
			hashAddress = (++hashAddress) % hashLength;
		}

		// 將data存入字典中
		hash[hashAddress] = data;
	}
}

執行結果：
已經在陣列中找到，索引位置為：3

查詢演算法之雜湊查詢

查詢演算法之雜湊查詢（近似O(1)的單點查詢方法）

查詢演算法之雜湊查詢

路由之路由表查詢演算法概述-雜湊/LC-Trie樹/256-way-mtrie樹

Internet路由之路由表查詢演算法概述-雜湊/LC-Trie樹/256-way-mtrie樹

路由表查詢演算法概述-雜湊/LC-Trie樹/256-way-mtrie樹

七大查詢演算法之樹表查詢---二叉樹查詢演算法

查詢演算法之——二叉查詢樹（圖文分析）

查詢演算法之三分查詢

資料結構之查詢-雜湊查詢

資料結構實驗之查詢七：線性之雜湊表

資料結構實驗之查詢五：平方之雜湊表（SDUT 3377）

資料結構實驗之查詢七：線性之雜湊表 (SDUT 3379)

SDUT3379資料結構實驗之查詢七：線性之雜湊表

SDUT3377資料結構實驗之查詢五：平方之雜湊表

雜湊查詢演算法及C語言實現

動態查詢之雜湊（hash）表

雜湊查詢之鏈地址法解決衝突（程式碼封裝實現）

查詢演算法之——符號表（引入篇）

python 雜湊查詢

二叉排序樹查詢演算法之php實現

查詢演算法之雜湊查詢

相關推薦