雜湊表基本操作及其擴充套件

阿新 • • 發佈：2019-01-30

雜湊表

雜湊表的概念：
- 雜湊表本身是一個數組，其元素在陣列中存放位置為：通過雜湊函式使元素關鍵碼和元素儲存位置有一定的對映關係
雜湊表的特點：
- 搜尋陣列中某一元素時，可以通過該元素的關鍵碼和儲存位置的對映關係直接找到對應位置檢視是否存在
- 在陣列中插入元素時，根據雜湊函式計算出插入元素的位置並且在此位置存放
- 存在雜湊衝突：兩個不同的元素通過雜湊函式所對映的儲存位置相同即為雜湊衝突。例如：兩個元素的關鍵字X != y,但有HashFunc(x) == HashFunc(y)

雜湊衝突的解決方法

根據雜湊表的特點可知，雜湊衝突在所難免，雖然可以通過調整雜湊函式來降低雜湊函式的可能性，但還是不能完全避免雜湊衝突，因此提出兩種解決方案：

閉雜湊：開放地址法，即當雜湊表未裝滿時，將待插入元素Key放在下一“空位”處，
- “空位尋找”：線性探測和二次探測
- 線性探測：從發生雜湊衝突的位置挨著挨著向後找空位置，直到找到空位置，例如：
- 二次探測：從雜湊衝突的位置加上 $i^{2}$ ，i=1,2,3,….例如：
開雜湊：拉鍊法,首先對關鍵碼集合用雜湊函式計算雜湊地址，具有相同地址的關鍵碼歸於同一子集合，每一個子集合稱為一個桶，各個桶中的元素通過一個單鏈錶鏈接起來，各連結串列的頭結點儲存在雜湊表中（如圖）

基本操作

插入
- 注意問題：
  （1）使用閉雜湊方法時擴容須滿足的負載因子（大於0.7）
  （2）使用開雜湊方法時擴容須滿足的負載因子（等於1）
  （3）擴容時將原雜湊表中的內容存放至新表時，對映到新表的位置須重新計算
  （4）為了儘可能的避免雜湊衝突，使用素數表對齊做雜湊表的容量
刪除
- 注意問題：
  （1）閉雜湊刪除時只需要將其元素的狀態改為刪除即可
  （2）開雜湊在刪除時需要將其所在節點進行刪除，刪除節點須注意是否為頭節點
查詢
- 注意問題：
  （1）閉雜湊查詢某一元素時，只須在存在狀態的元素中尋找，如果狀態該元素的關鍵碼所對映的位置為空（EMPTY）或者刪除（DELET）,表示該元素不存在
  （2）閉雜湊查詢某一元素時，不僅需要在所對映的當前位置去找，還須在其所掛連結串列中尋找

程式碼實現

閉雜湊（開放地址）

#include<stdio.h>
#include<stdlib.h>
#include<assert.h> 


typedef enum Status
{
    EXITS,//存在
    EMPTY,//空
    DELETE,//刪除
}Status;


typedef int KeyType;
typedef int ValueType;

typedef struct HashNode
{
    KeyType _key;
    ValueType _value;
    Status _status;
}HashNode;



typedef struct HashTable
{
    HashNode* _table;

    size_t _size;
    size_t _N;
}HashTable;

size_t GetNewN(size_t N);//獲取容量
void HashTableInit(HashTable* hash);//初始化
int HashTableInsert(HashTable* hash, KeyType key, ValueType value);//插入
size_t HashFunc(size_t n, KeyType key);//獲取座標
void HashPrint(HashTable* hash);//列印
HashNode* HashTableFind(HashTable* hash, KeyType key);//查詢
void HashTableRemove(HashTable* hash, KeyType key);//刪除
void HashTableDestory(HashTable* hash);//銷燬
void TestHash();




size_t GetNewN(size_t N)
{
    const int _PrimeSize = 28;
    static const unsigned long _PrimeList[_PrimeSize] =
    {
        53ul, 97ul, 193ul, 389ul, 769ul,
        1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
        49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
        1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
        50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
        1610612741ul, 3221225473ul, 4294967291ul
    };

    size_t i = 0;
    for (; i < _PrimeSize; ++i)
    {
        if (_PrimeList[i]>N)
        {
            return _PrimeList[i];
        }
    }

    return _PrimeList[_PrimeSize - 1];

}


//初始化
void HashTableInit(HashTable* hash,size_t N)
{
    //hash->_N = 3;
    hash->_N = N;
    hash->_size = 0;
    hash->_table = (HashNode*)malloc(sizeof(HashNode)*hash->_N);

    for (size_t i = 0; i < hash->_N; ++i)
    {
        hash->_table[i]._status = EMPTY;
    }

}



size_t HashFunc(size_t n,KeyType key )
{
    return  key%n;
}


void  IsFull(HashTable* hash)
{
    if (hash->_size * 10 / hash->_N >= 7)
    {
        //大於負載因子，進行擴容
        //並進行初始化

        //建立新的雜湊表

        size_t newN = GetNewN( hash->_N);
        HashNode* newTable = (HashNode*)malloc(sizeof(HashNode)*newN);
        assert(newTable);
        for (size_t i = 0; i < hash->_N; ++i)
        {
            size_t newindex = HashFunc(newN,hash->_table[i]._key);
            while (newTable[newindex]._status == EXITS)
            {
                if (newindex == newN)
                    newindex = 0;

                ++newindex;
            }

            newTable[newindex] = hash->_table[i];
        }
        hash->_N = newN;
        free(hash->_table);
        hash->_table = newTable;
    }

}
//插入
int HashTableInsert(HashTable* hash, KeyType key, ValueType value)
{
    //判滿並擴容
    IsFull(hash);

    size_t index = HashFunc(hash->_N, key);

    while (hash->_table[index]._status == EXITS)
    {
        //如果相等，不插入，直接返回
        if (hash->_table[index]._key == key)
            return -1;

        index++;
        //如果到最後，從頭開始
        if (index == hash->_N)
        {
            index = 0;
        }
    }

    hash->_table[index]._key = key;
    hash->_table[index]._value = value;
    ++hash->_size;
    hash->_table[index]._status = EXITS;

    return 0;
}


//查詢
HashNode* HashTableFind(HashTable* hash, KeyType key)
{
    assert(hash);
    size_t index = HashFunc(hash->_N, key);

    while (hash->_table[index]._status == EXITS)
    {
        if (hash->_table[index]._key == key)
            return &hash->_table[index];

        ++index;

        if (index == hash->_N)
            index = 0;


    }
    return NULL;

}


//刪除
void  HashTableRemove(HashTable* hash, KeyType key)
{
    assert(hash);
    HashNode* tmp = HashTableFind(hash, key);
    if (tmp == NULL)
        return;

    tmp->_status = DELETE;
}

//銷燬
void HashTableDestory(HashTable* hash)
{
    assert(hash);
    free(hash->_table);
    hash->_N = 0;
    hash->_size = 0;
}

void HashPrint(HashTable* hash)
{
    assert(hash);
    for (size_t i = 0; i < hash->_N; ++i)
    {
        if (hash->_table[i]._status == EXITS)
        {
            printf("[%d]->EX->%d  ", i, hash->_table[i]._key);
        }
        else if (hash->_table[i]._status == EMPTY)
        {
            printf("[%d]->EM  ",i);
        }
        else if (hash->_table[i]._status == DELETE)
        {
            printf("[%d]->DE  ", i);
        }
    }
    printf("\n\n");
}

開雜湊（拉鍊法）

#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
#include<string.h>


typedef int KeyType;
typedef int ValueType;


typedef struct HashNode
{
    KeyType _key;
    ValueType _value;
    struct HashNode* _next;
}HashNode;

typedef struct HashTable
{
    HashNode** _tables;
    size_t _N;
    size_t _size;

}HashTable;


size_t GetNextPrimeNum(size_t N);//空間
void HashTableInit(HashTable* ht);//初始化
size_t HashFunc(size_t n, KeyType key);//計算座標
HashNode* BuyHashNode(KeyType key, ValueType value);//建立節點
HashNode* HashTableFind(HashTable* ht, KeyType key);//查詢
int HashTableRemove(HashTable* ht, KeyType key);//刪除
void HashTablePrint(HashTable* ht);//列印
void HashTableDestory(HashTable* ht);//銷燬
void TestHashTable();


size_t GetNextPrimeNum(size_t N)
{
    const int _PrimeSize = 28;
    static const unsigned long _PrimeList[_PrimeSize] =
    {
        53ul, 97ul, 193ul, 389ul, 769ul,
        1543ul, 3079ul, 6151ul, 12289ul, 24593ul,
        49157ul, 98317ul, 196613ul, 393241ul, 786433ul,
        1572869ul, 3145739ul, 6291469ul, 12582917ul, 25165843ul,
        50331653ul, 100663319ul, 201326611ul, 402653189ul, 805306457ul,
        1610612741ul, 3221225473ul, 4294967291ul
    };

    size_t i = 0;
    for (; i < _PrimeSize; ++i)
    {
        if (_PrimeList[i]>N)
        {
            return _PrimeList[i];
        }
    }

    return _PrimeList[_PrimeSize - 1];

}


void HashTableInit(HashTable* ht)
{
    ht->_N = GetNextPrimeNum(0);
    ht->_size = 0;
    ht->_tables = (HashNode**)malloc(sizeof(HashNode*)*ht->_N);
    assert(ht->_tables);
    memset(ht->_tables, NULL, sizeof(HashNode*)*ht->_N);


}

size_t HashFunc(size_t n, KeyType key)
{
    return  key%n;
}

//建立節點
HashNode* BuyHashNode(KeyType key, ValueType value)
{
    HashNode* node = (HashNode*)malloc(sizeof(HashNode));
    assert(node);
    node->_key = key;
    node->_value = value;
    node->_next = NULL;

    return node;
}

//插入
int HashTableInsert(HashTable* ht, KeyType key, ValueType value)
{
    assert(ht);

    if (ht->_N == ht->_size)
    {
        //獲取下一個質數
        size_t newN= GetNextPrimeNum(ht->_N);
        //拷貝
        HashNode** NewTable = (HashNode**)malloc(sizeof(HashNode*)*newN);
        assert(NewTable);
        memset(NewTable, NULL, sizeof(HashNode*)*newN);

        for (size_t i = 0; i < ht->_N; ++i)
        {
            //新的位置
            HashNode* cur =ht->_tables[i];

            while (cur)
            {
                //進行頭插
                size_t newindex = HashFunc(newN, cur->_key);
                HashNode* next = cur->_next;
                cur->_next = NewTable[newindex];
                 NewTable[newindex]=cur;
                 cur = next;
            }
        }
        ht->_N = newN;
        free(ht->_tables);
        ht->_tables = NewTable;
    }
    //獲取位置
    size_t index = HashFunc(ht->_N, key);
    HashNode* cur = ht->_tables[index];
    while (cur)
    {
        if (cur->_key == key)//已經插入過不在插入
        {
            return -1;
        }
        cur = cur->_next;
    }


    HashNode* node = BuyHashNode(key, value);
    node->_next = ht->_tables[index];
    ht->_tables[index] = node;
    ++ht->_size;
    return 0;

}


//查詢
HashNode* HashTableFind(HashTable* ht, KeyType key)
{
    assert(ht);
    size_t index = HashFunc(ht->_N,key);

    HashNode* cur = ht->_tables[index];

    while (cur)
    {
        if (cur->_key == key)
        {
            return cur;
        }
        cur = cur->_next;
    }

    return NULL;

}

//刪除
int HashTableRemove(HashTable* ht, KeyType key)
{
    assert(ht);

    size_t index = HashFunc(ht->_N, key);

    //1.頭節點
    //2.非頭節點
    HashNode* cur = ht->_tables[index];
    HashNode* prev = cur;


    while (cur)
    {
        if (cur->_key == key)
        {
            if (prev == cur)
            {
                //頭節點
                ht->_tables[index] = cur->_next;
            }
            else
            {
                //不是頭節點
                prev->_next = cur->_next;
            }

            free(cur);
            return 0;
        }
        prev = cur;
        cur = cur->_next;
    }
    return -1;
}


//銷燬
void HashTableDestory(HashTable* ht)
{
    assert(ht);
    free(ht->_tables);
    ht->_tables = NULL;
    ht->_N = 0;
    ht->_size = 0;
}


//列印
void HashTablePrint(HashTable* ht)
{
    assert(ht);

    for (size_t i = 0; i < ht->_N; ++i)
    {
        HashNode* cur = ht->_tables[i];
        while (cur)
        {
            printf("[%d]->%d ", i, cur->_key);
            cur = cur->_next;
        }

    }
    printf("\n\n");
}

雜湊擴充套件

擴充套件一（點陣圖）
- 點陣圖理解：，點陣圖是利用每一位來表示一個整數是否存在來節省空間，1表示存在，0表示不存在。
- 點陣圖優缺點
  （1）優點：點陣圖所開空間只與範圍有關，節省空間，在處理海量資料問題時，可使用點陣圖；例如：在40億個數中判斷一個數是否存在
  （2）缺點：通過點陣圖所得到的結果不精確
- 點陣圖操作
  （1）插入：注意位置的計算，先計算待插入元素在陣列當中的位置，在計算在哪一個位元位
  （2）重置：和插入一樣，找到位置，進行去反即可
  （3）查詢：因為是1代表存在，故利用按位與（&）操作符檢視是否為1
擴充套件二（布隆過濾器）
- 概念
  Bloom Filter是一種空間效率很高的隨機資料結構，它利用位陣列很簡潔地表示一個集合，並能判斷一個元素是否屬於這個集合。
- 特點
  （1）它適用於判斷元素是否存在集合當中，速率非常高。Bloom Filter有可能會出現錯誤判斷，但不會漏掉判斷。
  （2）Bloom Filter可以準確的判斷出某個元素不在集合之中。但如果判斷某個元素存在集合中，有一定的概率判斷錯誤。因此，Bloom Filter不適合那些“零錯誤”的應用場合。
  （3）在能容忍低錯誤率的應用場合下，Bloom Filter比其他查詢演算法（如hash，折半查詢）極大節省了空間。
- 結構
  （1）陣列：既然是雜湊的擴充套件，結構中必然包含陣列，但此陣列是有位元位（bite）組成的陣列
  （2）含有多個雜湊函式，為了表達S={x1, x2,…,xn}這樣一個n個元素的集合，Bloom Filter使用k個相互獨立的雜湊函式（Hash Function），它們分別將集合中的每個元素對映到{1,…,n}的範圍中。
- 操作
  （1）插入：布隆的結構裡有多個雜湊函式，必然某一資料的關鍵碼對映到陣列的位置不止一個
  （2）刪除：一個數據對應多個位置，故刪除一個必然會影響其他資料，布隆過濾器的操作裡不支援刪除
  （3）查詢：前面布隆的特點已經說過查詢會出現誤差，故布隆不適合出現在“零錯誤”的場合
- 應用
  （1）對y使用k個雜湊函式得到k個雜湊值
  （2）判斷是否所有hash(y)的位置都是1（1≤i≤k），即k個位置都被設定為1了，
  （3）如果所有位置都已置成了‘1’，y就可能集合中的元素；只有一個位置上是‘0’，那y一定不是集合中的元素。
  注意1：布隆過濾器無法準確判斷某個元素存在於集合中，因為一個不存在元素通過k個雜湊函式映射出來的位置上的值可能都是‘1’。
  注意2：布隆過濾器不能刪除元素。刪除一個元素就要把k個位置置為‘0’，這樣就會影響其他元素。（可以改進）
- 改進
  
  前面我們提到布隆過濾器不能刪除元素這一缺點是可以改進的，解決方案是用多個bit來儲存一個元素。這裡為了計算方便，採用32bit來儲存。全‘0’代表不存在，出現一個便加一，刪除元素時把對應位置減一就可以了。

雜湊表基本操作及其擴充套件

雜湊表雜湊表的概念：雜湊表本身是一個數組，其元素在陣列中存放位置為：通過雜湊函式使元素關鍵碼和元素儲存位置有一定的對映關係雜湊表的特點：搜尋陣列中某一元素時，可以通過該元素的關鍵碼和儲存位置的對映關係直接找到對應位置檢視是否存在在陣列中插入元素

雜湊表Hash：概念與基本操作

什麼是Hash Hash就像是一個桶排，那隻不過是把各個元素的數值當做下標進行儲存.其最常用的用途就是用來判重.但是，如何對字串進行判重，不可能一個一個往前超，若n上萬則顯然不可行.我們可以選擇進行Hash，將每一個字串或者大數字進行一定的操作即可進行. 對大整數型別進行Hash 取模法對於每一個

散列表查詢（雜湊表）的基本操作（完整程式碼）

表和二叉樹的排序，是利用元素之間的關係，逐個查詢，或按一定的規律查詢。而散列表（雜湊表），元素之間沒有關係，它是利用了元素與儲存地址之間的關係。說白了，就是利用雜湊函式建立元素->地址

【資料結構】--1.連結串列的基本操作和雜湊表定義

C實現連結串列的基本操作初始化插入刪除雜湊表的定義 //連結串列的基本操作初始化插入刪除雜湊表的定義 #include<iostream> using namespace std; typedef struct Node { int

【資料結構】雜湊表及雜湊桶的基本操作

順序搜尋和二叉搜尋樹中，元素儲存位置和元素各關鍵碼之間沒有對應的關係，這就導致在查詢一個元素時，必須經過關鍵碼的多次比較。那麼是否有這樣一種資料結構，可以不經過任何比較，直接找到想要搜尋的元素呢？答案是肯定的，那就是通過某種函式(hashFunc)使得元素的儲存位置與它的

27-集合--Set及其子類（HashSet+LinkedHashSet+TreeSet）+二叉樹+Comparable+Comparator+雜湊表+HashSet儲存自定義物件+判斷元素唯一的方式

一、Set 1、Set：元素不可以重複，是無序的（存入和取出的順序不一致） 2、Set介面中的方法和Collection中的方法一致 3、Set集合的元素取出方式只有一種：迭代器iterator() Set set = new HashSet(); I

第十五週專案一雜湊表及其運算的實現

[資料結構][C++] 查詢和排序（雜湊表儲存基本思想）

雜湊表類概念摘要雜湊表類SqHash的建立、查詢。設有若干個學生的考試成績，採用除留餘數求雜湊地址，將學生的資訊儲存到該地址空間，並且採用線性探測法解決衝突問題。雜湊表又稱散列表。雜湊表儲存的基本思想是：以資料表中的每個記錄的關鍵字 k為自變數，通過一種函式H(

散列表（雜湊表）及其儲存結構和特點詳解

順序儲存的結構型別需要一個一個地按順序訪問元素，當這個總量很大且我們所要訪問的元素比較靠後時，效能就會很低。散列表是一種空間換時間的儲存結構，是在演算法中提升效率的一種比較常用的方式，但是所需空間太大也會讓人頭疼，所以通常需要在二者之間權衡。我們會在之後的具體演算法章節中得到更多的領悟。什麼是散列表讓我

線性表的基本操作及其應用——約瑟夫環

1.順序儲存 /* 程式執行後首先要求使用者輸入初始報數m，人數n,(設n≤10)。上述程式中順序儲存的插入（或刪除）操作，鏈式結構上的插入（或刪除）操作。 */ #include<iostream> #define MAXSIZE 10//人數

Redis常用操作-------Hash（雜湊表）

1.HDEL key field [field ...] 刪除雜湊表 key 中的一個或多個指定域，不存在的域將被忽略。在Redis2.4以下的版本里， HDEL 每次只能刪除單個域，如果你需要在一個原子時間內刪除多個域，請將命令包含在 MULTI

多執行緒操作雜湊表避免死鎖

copy自《UNIX環境高階程式設計》圖11.11。 #include <stdlib.h> #include <pthread.h> #define NHASH 29 #define HASH(id) (((unsigned lon

雜湊表（hash table）及其應用舉例

雜湊表最主要的有點在於我們利用它能夠在 O(1) （直接根據線性空間的下標進行索引）時間查詢某一元素，是效率最高的查詢方式，其缺點是需要額外的空間實現雜湊表。 1. 百分制成績建立成績與出現

征服 Redis + Jedis + Spring （二）—— 雜湊表操作（HMGET HMSET）

一、預期接上一篇，擴充User屬性： Java程式碼 public class User implements Serializable { private static final long serialVersionUID = -1267

雜湊表及其常用演算法(程式碼實現)

轉載自—>http://blog.csdn.net/wangxu_zju_2010/article/details/7489548 整理了一下Hash表相關內容，如下： Hash 表是使用 O(1) 時間進行資料的插入刪除和查詢，但是 hash 表不保證表中資料的有序性，這樣在 hash 表中

Lab1 線性表的基本操作及其應用 sqlist linklist

實驗要求 1、建立一個學生表（5個學生）； 2、顯示該表中所有的元素； 3、根據姓名查詢到第3個學生的資訊並顯示； 4、插入一個新的學生並顯示全部學生資訊； 5、刪除第3個學生的資訊並顯示全部學生資訊； 6、統計學生表中元素的個數（即學生人數）； 7、退出

連結串列，順序表的基本操作及其實現的棧與佇列

1，順序表在c裡面，這一部分也就是靜態表和動態表的實現，插入，刪除有丁點意思。靜態表靠陣列和長度實現（注意長度這一點，因為它反映了當前表內容長度，十分重要）動態表依靠申請連續空間實現（結構體內部包括首地址，當前規模以及長度）插入： int *p; p=&

理解雜湊表及其查詢

以上討論的查詢方法，由於資料元素的儲存位置與關鍵碼之間不存在確定的關係，因此，查詢時，需要進行一系列對關鍵碼的查詢比較，即“查詢演算法”是建立在比較的基礎上的，查詢效率由比較一次縮小的查詢範圍決定。理想的情況是依據關鍵碼直接得到其對應的資料元素位置，即要求關鍵碼與資料

圖解雜湊表及其原理

## 要點回顧 > 此部分方便知識點快速回顧，首次閱讀請從引言部分開始。 - 雜湊表（Hash Table）其實也叫散列表，是一個數據結構。 - 雜湊表本質上就是一個數組，只不過陣列存放的是單一的資料，而雜湊表中存放的是鍵值對（key - value pair）。 - key 通過雜湊函式

1.順序表基本操作

空間 sql註入表達 pan 專業 truct 優點 length 理解（ps上了大學，一開始不知道自己專業是學編程的，等到半路知道自己是學編程的時候，又不知道到底該怎麽學，該學什麽。一直處於一個很尷尬的境地。大一的時候玩了玩pangolin，學了html和一點點ja

雜湊表基本操作及其擴充套件

雜湊表

雜湊衝突的解決方法

基本操作

程式碼實現

雜湊擴充套件

相關推薦