[譯]C語言實現一個簡易的Hash table(3)

阿新 • • 發佈：2019-01-14

上一章，我們講了hash表的資料結構，並簡單實現了hash表的初始化與刪除操作，這一章我們會講解Hash函式和實現演算法，並手動實現一個Hash函式。

Hash函式

本教程中我們實現的Hash函式將會實現如下操作：

輸入一個字串，然後返回一個0到m(Hash表的大小)的數字
為一組平常的輸入返回均勻的bucket索引。如果Hash函式不是均勻分佈的，就會將多個記錄插入到相同的bucket中，這就回提高衝突的機率，而這個衝突就會影響到我們的Hash表的效率。

Hash演算法

我們將會設計一個普通的字串Hash函式，在虛擬碼中表示如下：

function hash(string, a, num_buckets):
    hash = 0
    string_len = length(string)
    for i = 0, 1, ..., string_len:
        hash += (a ** (string_len - (i+1))) * char_code(string[I])
    hash = hash % num_buckets
    return hash

這個Hash函式主要分為兩步：

將字串轉為大整型
通過取餘數mod m將整數的大小減小到固定範圍

變數a是一個素數，並且要大於英文字母，我們正在雜湊ASCII字串，其字母大小為128，因此我們應該選擇大於此的素數。

char_code這個函式會返回字母對應的整數，使用的是ASCII中的字母。

如下使用這個Hash函式：

hash("cat", 151, 53)

// 函式拆解
hash = (151**2 * 99 + 151**1 * 97 + 151**0 * 116) % 53
hash = (2257299 + 14647 + 116) % 53
hash = (2272062) % 53
hash = 5

如果改變a我們會得到不同的結果：

hash("cat", 163, 53) = 3

程式碼實現

// hash_table.c
static int ht_hash(const char* s, const int a, const int m) {
    long hash = 0;
    const int len_s = strlen(s);
    for (int i = 0; i < len_s; i++) {
        hash += (long)pow(a, len_s - (i+1)) * s[i];
        hash = hash % m;
    }
    return (int)hash;
}

什麼是衝突？

理想中的雜湊函式返回的結果都是均勻分佈的，但是，對於任意一個雜湊函式，總會有一些輸入經過雜湊後，得到相同的值。如果要找到這組輸入，我們就需要測試大量的輸入資料。

因為上面提到的有不好的輸入存在，意味著所有輸入都沒有完美的雜湊函式。所以在設計雜湊函式時，針對預期輸入，我們的雜湊函式需要表現最好。

不好的輸入也存在安全問題，如果某個惡意使用者向雜湊表提供了一組衝突金鑰，那麼搜尋這些金鑰將比正常情況（O(1)）花費更長時間（O(n)）。這可以用作針對以雜湊表為基礎的系統（例如DNS和某些Web服務）的拒絕服務攻擊。

上一章：Hash table資料結構
下一章：衝突處理

原文地址：https://github.com/jamesroutley/write-a-hash-table/tree/master/03-hashing

[譯]C語言實現一個簡易的Hash table(1)

說明 Hash table翻譯過來就是Hash表，是一種提供了類似於關聯陣列的資料結構，可以通過key執行搜尋、插入和刪除操作。Hash表由一些列桶(buckets)組成，而每一個bucket都是由key-value的形式組成。儲存時都是以key-value儲存的，因為當要定位一個value時，需要把k

[譯]C語言實現一個簡易的Hash table(2)

上一章，簡單介紹了Hash Table，並提出了本教程中要實現的幾個Hash Table的方法，有search(a, k)、insert(a, k, v)和delete(a, k)，本章將介紹Hash table使用的資料結構。 Hash table資料結構 hash表中儲存的每一項key-value

[譯]C語言實現一個簡易的Hash table(3)

上一章，我們講了hash表的資料結構，並簡單實現了hash表的初始化與刪除操作，這一章我們會講解Hash函式和實現演算法，並手動實現一個Hash函式。 Hash函式本教程中我們實現的Hash函式將會實現如下操作：輸入一個字串，然後返回一個0到m(Hash表的大小)的數字為一組平常的輸

[譯]C語言實現一個簡易的Hash table(4)

att urn 開放 image num pri 實現需要 code 上一章我們解釋了Hash table中最重要的hash函數，並用偽代碼和C語言實現了一個我們自己的hash函數，hash函數中碰撞是無法避免的，當發生碰撞時我們改如何有效的處理呢？這章我們就來講解下。

[譯]C語言實現一個簡易的Hash table(5)

現在 static 插入 int err mas const -h uri 上一章中，我們使用了雙重Hash的技術來處理碰撞，並用了C語言實現，賁張我們將實現Hash表中的插入、搜索和刪除接口。實現接口我們的hash函數將會實現如下的接口： // hash_table

[譯]C語言實現一個簡易的Hash table(7)

分享圖片每次就會 code 指針分布放置 .cn git 上一章我們講了如何根據需要動態設置hash表的大小，在第四章中，我們使用了雙重哈希來解決hash表的碰撞，其實解決方法有很多，這一章我們來介紹下其他方法。本章將介紹兩種解決hash表碰撞的方法：拉鏈法

使用C語言實現一個虛擬機

doesn 寄存器 php 浪費 vid c11 machine 指向編程語言使用C語言實現一個虛擬機 2015-6-22 21:32| 發布者: joejoe0332| 查看: 2891| 評論: 0|原作者: leoxu, Serval, 社會主義好, los

c語言實現一個函式，判斷一個數是不是素數

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

用c語言實現一個簡單的通訊錄

通訊錄的c語言實現原始碼簡單通訊錄的實現還是包括三個原始檔，test.c（實現通訊錄主邏輯），txl.c（實現用到的各個函式），txl.h（存放txl中用到的各種標頭檔案與宣告）。 txl.h #ifndef __TXL_H__//**txl.h** #defi

C語言實現一個函式，可以左旋字串中的k個字元

// 實現一個函式，可以左旋字串中的k個字元例如： //ABCD左旋一個字元得到BCDA //ABCD左旋兩個字元得到CDAB 解題思路： 1> 先理思

用C語言實現一個鍵值對結構demo

主要思路是有兩個指標陣列，一個為key，一個為value，用索引一一對應實現一個key對應一個value。包括了增加和刪除，控制檯列印方法，現在仍有些指標指向記憶體類的bug需注意。這個程式嚴格來說還算不上雜湊。 #include<stdio.h>

用c語言實現一個通訊錄（實現增加、刪除、查詢、修改、顯示、清空功能）

源程式標頭檔案contact.h #ifndef _CONTACT_H__ #define _CONTACT_H__ #define NAME_MAX 20 #define SEX_MAX 5 #define TELE_MAX 15 #define ADDR_MAX 5

綜合例項：用C語言實現一個自定義的shell程式

一個shell需要實現若干功能，比如解釋執行命令，支援輸入輸出重定向，支援管道，後臺執行程式等。首先對要實現的功能做一個簡要介紹：（1）輸出重定向：就是把執行某命令後的結果輸出到某個檔案。例如： ls -al > list.txt

【二分查詢】用C語言實現一個有序陣列的二分查詢

什麼是二分查詢？首先，二分查詢也叫折半查詢，它是對於一組有序（升序或降序）數列來說的，我們舉例子說明這個思想。例如：猜數字遊戲隨機給出1-100內的一個數字，請猜出這個數字那我們不能隨機沒有規律的去猜，這時考慮二分查詢的思想例如38 第一次

C語言-------實現一個簡單的單向連結串列

編寫一個連結串列程式,在程式中實現簡單的功能#include <stdio.h> #include <stdlib.h> struct node{ int num; char name[20]; struct node* nex

C語言實現一個簡單的伺服器

C/S結構流程圖服務端 socket函式為了執行網路I/O，一個程序必須做的第一件事情就是建立一個socket函式 /* family 表示協議族 AF_INET(IPv4協議)、AF_INET6(IPv6協議)、AF_L

C函式指標妙用，用c語言寫一個簡易類

其實在C++中的物件也並不是實現起來也並不是多麼的什麼神祕，只是編譯器幫我們做了許多工作，所以我們總覺得C++要比c語言難一些，C++編譯器其實對於類中的非Virtual 函式的的呼叫規則與對C編譯器對函式的呼叫時一樣的，那就是通過call 函式地址的方法。等有

用c語言實現一個strcat函式功能相同的函式

extern char *strcat(char *dest,char *src); 把src所指字串新增到dest結尾處(覆蓋dest結尾處的'\0')並新增'\0'。 #include "std

C語言實現一個列表式的學生資訊管理系統(完善)

http://blog.csdn.net/morixinguan/article/details/77489633上節，我們實現了學生資訊管理系統的大多數功能，但還有兩個功能沒有實現，就是學生資訊修改還有學生資訊刪除了。當然，程式中依然存在諸多的BUG，比如，scanf和ge

用c語言實現一個自己的atof()函式

用c語言實現atof()函式，將字元分解用乘法和除法實現轉換，程式碼如下 ****************************************************************************************************

[譯]C語言實現一個簡易的Hash table(3)

Hash函式

Hash演算法

程式碼實現

什麼是衝突？

相關推薦