【18.10.22】雜湊（Hash）函式

阿新 • • 發佈：2018-12-17

雜湊資料結構是一種非常簡單，實用的資料結構。原理是將資料通過一定的hash函式規則，然後儲存起來。使查詢的時間複雜度近似於O（1）。進而大大節省了程式的執行時間。

雜湊表的原理如圖

原來的資料可以直接通過雜湊函式儲存起來，這樣在搜尋的時候，等於每一個數據都有了自己的特定查詢號碼，所以在查詢時，可以通過雜湊函式，一步直接找到（不考慮衝突）。所以時間複雜度，接近O（1）。

但是雜湊最大的困擾就是雜湊函式在解決問題是會出現衝突，例如說，將16和32存在餘數為0-7的地方，那麼16先進去，餘數為0，那麼32再進去是餘數還是0，怎麼解決這一問題呢？這裡引進了兩種方法。

（開放定址）線性探測法

在這裡插入圖片描述

32原本也應該放在餘數為0的位置，但是餘數為0的地方已經有數字了，就向後一位放到餘數為1的位置。假設下一次放64，那麼64就放到餘數為2的地方，這樣查詢64，主需要3次，也就找到了。複雜度還是比單鏈表的O（n）要快很多。用程式碼來表示是這樣的。

標頭檔案

#define _CRT_SECURE_NO_WARNINGS 1
#pragma once
#include <stdio.h>
typedef int Key;
typedef enum//狀態機，用於記錄位置儲存資料的狀態
{
	EMPTY,//空的
	EXIST,//有資料的
	DELETED//刪除過得
}State;
typedef struct Element//狀態
{
	Key key;
	State state;
}Element;
typedef int(*HashFuncType)(Key key, int capacity);
typedef struct HashTable
{
	Element * table;
	int size;
	int capacity;//容量
	HashFuncType HashFunc;
}HashTable;
int HashSearch(HashTable *pHT, Key key);
void HashDestroy(HashTable *pHT);
void HashInit(HashTable *pHT, int capaicity, HashFuncType HashFunc);
int mod(Key key, int capacity);
void ExpandIfRequired(HashTable *pHT);
int HashInsert(HashTable *pHT, Key key);
int HashRemove(HashTable *pHT, Key key);

在擴容的地方引入了一個負載因子的概念，負載因子 = 雜湊表中元素個數/散列表的長度，一般大小定義在0.7到0.8之間，超過0.8會影響雜湊表的效率。但是增大負載因子的數值可以減少雜湊表所佔記憶體空間。反之減少負載因子的數值可以增加搜尋效率。

函式的.c檔案

#define _CRT_SECURE_NO_WARNINGS 1
#include "Hash.h"
#include <stdio.h>
#include <assert.h>
void HashInit(HashTable *pHT, int capaicity, HashFuncType HashFunc)
{
	pHT->table = (Element *)malloc(sizeof(Element)* capaicity);
	assert(pHT->table);
	pHT->size = 0;
	pHT->capacity = capaicity;
	pHT->HashFunc = HashFunc;
	for (int i = 0; i < capaicity; i++)
	{
		pHT->table[i].state = EMPTY;
	}
}
void HashDestroy(HashTable *pHT)
{
	free(pHT->table);
}
int HashSearch(HashTable *pHT, Key key)
{
	int index = pHT->HashFunc(key, pHT->capacity);
	while (pHT->table[index].state != EMPTY)
	{
		if (pHT->table[index].key == key&&pHT->table[index].state == EXIST)
		{
			return index;
		}//如果雜湊表存滿，這裡就是死迴圈，但是雜湊表不會被存滿
		index = (index + 1) % pHT->capacity;//便於返回第一個
	}
	return -1;
}
int mod(Key key, int capacity)
{
	return key % capacity;
}
void ExpandIfRequired(HashTable *pHT)
{
	int i = 0;
	if (pHT->size * 10 / pHT->capacity < 7)//引用負載因子，保證衝突率儘量低
	{
		return;
	}
	/*int newCapacity = pHT->capacity * 2;
	Element * newTable = (Element *)malloc(sizeof(Element)* newCapacity);
	assert(newTable);
	for (i = 0; i < newCapacity; i++)
	{
		newTable[i].state = EMPTY;
	}
	free(pHT->table);
	pHT->table = newTable;
	pHT->capacity = newCapacity;*///資料搬移太麻煩
	HashTable newHT;
	HashInit(&newHT, pHT->capacity * 2, pHT->HashFunc);
	for (i = 0; i < pHT->capacity; i++)
	{
		if (pHT->table[i].state == EXIST)
		{
			HashInsert(&newHT, pHT->table[i].key);
		}
	}
	free(pHT->table);
	pHT->table = newHT.table;
	pHT->capacity = newHT.capacity;
}
int HashInsert(HashTable *pHT, Key key)
{
	ExpandIfRequired(pHT);//擴容
	int index = pHT->HashFunc(key, pHT->capacity);
	while (1)
	{
		if (pHT->table[index].key == key && pHT->table[index].state == EXIST)
		{
			return -1;
		}
		if (pHT->table[index].state != EXIST)
		{
			pHT->table[index].key = key;
			pHT->table[index].state = EXIST;
			pHT->size++;
			return 0;
		}
		index = (index + 1) % pHT->capacity;
	}
}
int HashRemove(HashTable *pHT, Key key)
{
	int index = pHT->HashFunc(key, pHT->capacity);
	while (pHT->table[index].state != EMPTY)
	{
		if (pHT->table[index].key == key && pHT->table[index].state == EXIST)
		{
			pHT->table[index].state = DELETED;
			return 0;
		}
		index = (index + 1) % pHT->capacity;
	}
	return -1;
}

雜湊桶

雜湊桶就是將陣列和連結串列結合起來解決雜湊函式的衝突問題，原理用俗話講，就是數組裡存的的是一個連結串列的地址，16，放進去，在放32進去，找的時候餘數為0，就從16,往後繼續找，直到找到32為止。畫個圖。

首先是標頭檔案

#define _CRT_SECURE_NO_WARNINGS 1
typedef int Key;

typedef struct Node
{
	Key key;
	struct Node * Next;
}Node;
typedef struct HashBucket
{
	int size;
	int capacity;
	Node ** array;
}HashBucket;
void HashBucketInit(HashBucket *pHB, int capacity);
void HashBucketDestroy(HashBucket *pHB);
void ListDestroy(Node *first);
Node * HashBucketSearch(HashBucket *pHB, Key key);
void ExpandIfRequired1(HashBucket *pHB);
int HashBucketInsert(HashBucket *pHB, Key key);
int HashBucketRemove(HashBucket *pHB, Key key);

然後是.c檔案

#define _CRT_SECURE_NO_WARNINGS 1
#include "HashBucket.h"
#include <stdio.h>
#include <stdlib.h>
void HashBucketInit(HashBucket *pHB, int capacity)
{
	pHB->array = (Node **)malloc(sizeof(Node *)*capacity);
	for (int i = 0; i < capacity; i++) {
		pHB->array[i] = NULL;	// 空連結串列
	}
	pHB->capacity = capacity;
	pHB->size = 0;
}
void ListDestroy(Node *first)
{
	Node *next;
	Node *cur;
	for (cur = first; cur != NULL; cur = next)
	{
		next = cur->Next;
		free(cur);
	}
}
void HashBucketDestroy(HashBucket *pHB)
{
	int i = 0;
	for (i = 0; i < pHB->capacity; i++)
	{
		ListDestroy(pHB->array[i]);
	}
	free(pHB->array);
}
Node * HashBucketSearch(HashBucket *pHB, Key key)
{
	int index = key % pHB->capacity;
	Node *cur = pHB->array[index];
	while(cur != NULL)
	{
		if (cur->key ==key)
		{
			return cur;
		}
		cur = cur->Next;
	}
	return NULL;
}
void ExpandIfRequired1(HashBucket *pHB)
{
	int i = 0;
	Node *node;
	if (pHB->size < pHB->capacity)
	{
		return;
	}
	HashBucket NB;
	HashBucketInit(&NB, pHB->capacity * 2);
	for (i = 0; i < pHB->capacity; i++)
	{
		for (node = pHB->array[i]; node != NULL; node = node->Next)
		{
			HashBucketInsert(&NB, node->key);
		}
	}
	HashBucketDestroy(pHB);
	pHB->array = NB.array;
	pHB->capacity = NB.capacity;
}
int HashBucketInsert(HashBucket *pHB, Key key)
{
	ExpandIfRequired1(pHB);
	if (HashBucketSearch(pHB, key) != NULL)
	{
		return -1;
	}
	int index = key % pHB->capacity;
	Node *first = pHB->array[index];
	Node *node = (Node *)malloc(sizeof(Node));
	node->key = key;
	node->Next = NULL;
	first = node->Next;
	pHB->array[index] = node;
	pHB->size++;
	return 0;
}
int HashBucketRemove(HashBucket *pHB, Key key)
{
	int index = key % pHB->capacity;
	Node *prev = NULL;
	Node *cur = pHB->array[index];
	while (cur != NULL)
	{
		if (cur->key == key)
		{
			if (prev == NULL)
			{
				pHB->array[index] = cur->Next;
			}
			else
			{
				prev->Next = cur->Next;
			}
			free(cur);
		}
		prev = cur;
		cur = cur->Next;
	}
	return -1;
}

這就是我對雜湊函式的理解，希望各位大佬指正

【18.10.22】雜湊（Hash）函式

雜湊資料結構是一種非常簡單，實用的資料結構。原理是將資料通過一定的hash函式規則，然後儲存起來。使查詢的時間複雜度近似於O（1）。進而大大節省了程式的執行時間。雜湊表的原理如圖原來的資料可以直接通過雜湊函式儲存起來，這樣在搜尋的時候，等於每一個數據都有了自

【演算法筆記】雜湊（hash）總結

有兩天沒寫部落格了，前兩天刷完了PAT甲級中的雜湊的題目，做一個小小的總結。雜湊的定義：將元素通過一個函式轉化成一個整數，使得該整數能夠儘量唯一地代表這個元素。最常用的雜湊：對於數字而言，H(key) = key，最常見的用法是某個數字直接作為對於陣列的下標。

Redis入門【七】---------雜湊雜湊（Hash）

前言 Redis的雜湊可以讓使用者將多個鍵值對存到一個redis鍵裡面，從功能來說，redis為雜湊值提供了一些與字串值相同特性，使得雜湊非常適合將一些相關的資料儲存到一起。【1】新增和刪除鍵

雜湊（Hash）資料結構，使用C語言實現s。傻瓜也能

雜湊資料結構是一種非常簡單，實用的資料結構。原理是將資料通過一定的hash函式規則，然後儲存起來。使查詢的時間複雜度近似於O（1）。進而大大節省了程式的執行時間。雜湊表的原理如圖原來的資料可以直接通過雜湊函式儲存起來，這樣在搜尋的時候，等於每一個數據都有了自己的特定查詢號碼，

ruby 物件轉換雜湊（Hash）

通過 ActiveRecord 從資料庫的某張資料表（table）中獲取的物件如何轉換成為 Hash orders_table 是一張訂單資訊表，對應的 model 為 Orders @order = Orders.first 最簡單的方法，獲取一條 orders 表中的一條資料。方法一：使用原

Redis儲存結構之雜湊（Hash）

實用場景：分散式鎖 Redis雜湊/雜湊（Hashes）是鍵值對的集合。Redis雜湊/雜湊是字串欄位和字串值之間的對映。因此，它們用於表示物件。 HDEL HEXISTS HGET HGETALL HINCRBY HINCRBYFLOAT HKEY

字元雜湊（hash）

字串hash的核心思想與整數hash是一致的，將字串對映成為一個整數唯一表示。假設字串只由A~Z組成，將A~Z看做0-25，這樣就轉化成了一個26進位制數，再將這個26進位制數轉化為10進位制數，則每個字串都能用一個整數唯一表示。程式碼如下： in

雷林鵬分享：Ruby 雜湊（Hash）

　　Ruby 雜湊(Hash) 　　雜湊(Hash)是類似 "employee" => "salary" 這樣的鍵值對的集合。雜湊的索引是通過任何物件型別的任意鍵來完成的，而不是一個整數索引，其他與陣列相似。　　通過鍵或值遍歷雜湊的順序看起來是隨意的，且通常不是按照插入順序。如果您嘗試通過一個不存

HTML頁面的雜湊（hash）路由原理+原生js案例

<!DOCTYPE html

HashMap怎樣解決雜湊（hash）衝突？

常用兩種方法：連結串列法和開放定址法 1、連結串列法（chaining）在雜湊表中，每一個桶（bucket）或者槽（slot）都會對應一條連結串列，所有雜湊值相同的元素放到相同槽位對應的連結串列中。在插入的時候，我們可以通過雜湊函式計算出對應的雜湊槽位，將元素插入到對應

動態查詢之雜湊（hash）表

一、介紹　　與其他建立在“比較”基礎上的查詢演算法不同，雜湊表是通過雜湊函式將儲存位置與值得關鍵字建立一一對應關係，從而一般一次就能夠得到值。但是有時對於不同關鍵字雜湊後得到的地址會是相同的，稱這種現象為衝突。具有相同雜湊值的關鍵字稱為同義詞。二、雜

2.8 ruby的資料結構--雜湊（Hash）

1、雜湊（Hash）雜湊也是儲存物件的一個集合，雜湊裡面的元素是以"key" => “value”（鍵值對）這樣的形式存在的，元素是沒有順序的，雜湊的鍵可以是任意物件，鍵必須的唯一的，鍵通常用符號（Symbol）表示。雜湊的建立有兩種形式，兩種形式都是一樣的，最常使用第

Java實現Redis的雜湊（Hash）命令

本編文章知識簡單的實現了redis 的增刪改查，指令不是很全還請大家見諒 package com.huadian.Hash; import com.huadian.redisUntil.JedisPoolUntil; import org.junit.After; i

搜尋引擎中快取（cache）用到的雜湊（hash）演算法

前一段查看了關於雜湊的各種演算法，發現流傳最廣的還算偉大的暴雪（dota愛好者）工程師得到的一種演算法，有很多部落格中都有對其的介紹，我在此就不多廢話了。雖說是借鑑，也只是一小部分的抄襲。不知道是否冒犯了暴雪的版權。我修改成了我需要的功能，我的目標是對6w資料進行雜湊計

雜湊（Hash）演算法

一、什麼是 Hash 演算法雜湊演算法（Hash Algorithm），又稱雜湊演算法，雜湊演算法，是一種從任意檔案中創造小的數字「指紋」的方法。與指紋一樣，雜湊演算法就是一種以較短的資訊來保證檔案唯一性的標誌，這種標誌與檔案的每一個位元組都相關，而且難以找到

2018.10.14【NOIP提高練習】01串（倍增）（字串雜湊）

傳送門解析：其實我們直接處理出每個數向後倍增能夠到哪個數，以及它倍增hashhashhash出來的值是多少就行了。然後直接倍增處理出每個位置迭代nnn次的01串的hashhashhash值就行了

jzoj5919. 【NOIP2018模擬10.22】逛公園（tarjan,二分）

5919. 【NOIP2018模擬10.22】逛公園 Description 琥珀色黃昏像糖在很美的遠方，思念跟影子在傍晚一起被拉長…… Description 小 B 帶著 GF 去逛公園，公園一共有 n 個景點，標號為 1 . . . n。景點之間有 m

【洛谷3396】雜湊衝突（大力分塊）

點此看題面大致題意：給你一個長度為nn的陣列valval以及mm個操作，操作有兩種：一種是將valxvalx修改為yy，另一種操作是求出∑vali(i∑vali(i%x=y)x=y)。樸素的暴力我們先

【機器學習】使用Python中的區域性敏感雜湊（LSH）構建推薦引擎

學習如何使用LSH在Python中構建推薦引擎; 一種可以處理數十億行的演算法你會學到：在本教程結束時，讀者可以學習如何：通過建立帶狀皰疹來檢查和準備LSH的資料選擇LSH的引數為LSH建立Minhash 使用LSH Query推薦會議論文使用LSH

P3370 【模板】字串雜湊（Hash詳解）

題目連結題意：給定N個字串（第i個字串長度為Mi，字串內包含數字、大小寫字母，大小寫敏感），請求出N個字串中共有多少個不同的字串。單hash——模數19260817（80分） #include<iostream> #include<al

【18.10.22】雜湊（Hash）函式

雜湊資料結構是一種非常簡單，實用的資料結構。原理是將資料通過一定的hash函式規則，然後儲存起來。使查詢的時間複雜度近似於O（1）。進而大大節省了程式的執行時間。

雜湊表的原理如圖

原來的資料可以直接通過雜湊函式儲存起來，這樣在搜尋的時候，等於每一個數據都有了自己的特定查詢號碼，所以在查詢時，可以通過雜湊函式，一步直接找到（不考慮衝突）。所以時間複雜度，接近O（1）。

但是雜湊最大的困擾就是雜湊函式在解決問題是會出現衝突，例如說，將16和32存在餘數為0-7的地方，那麼16先進去，餘數為0，那麼32再進去是餘數還是0，怎麼解決這一問題呢？這裡引進了兩種方法。

（開放定址）線性探測法

標頭檔案

函式的.c檔案

雜湊桶

雜湊桶就是將陣列和連結串列結合起來解決雜湊函式的衝突問題，原理用俗話講，就是數組裡存的的是一個連結串列的地址，16，放進去，在放32進去，找的時候餘數為0，就從16,往後繼續找，直到找到32為止。畫個圖。

首先是標頭檔案

然後是.c檔案

這就是我對雜湊函式的理解，希望各位大佬指正

相關推薦