1. 程式人生 > >Redis數據結構:字典(hash表)

Redis數據結構:字典(hash表)

整數 dex typedef strong 慢慢 mas src str 完成後

使用場景:set name "tom"

1. 字典結構:

技術分享圖片

哈希表數據結構

typedef struct dictht {
    //哈希表數組,存的是哈希值
    dictEntrry **table;
    
    //哈希表大小(table的大小)
    unsigned long size;

    //哈希表大小掩碼,用於計算索引值,總是等於size-1
    unsigned long sizemask;

    //該哈希表已有節點的數量
    unsigned long used;

} dictht;
哈希表節點數據結構

typedef 
struct dictEntry { // void *key; // union {
//值可以是一個指針
void *val; //也可以是一個uint64_t整數 uint64_tu64; //也可以是int64_t整數 int64_ts64; } v; //指向下個哈希表節點,形成鏈表,用來使用拉鏈法解決哈希沖突 struct dictEntry *next; } dictEntry;
字典數據結構

typedef 
struct dict { //類型特定函數(保存了一些操作特定類型鍵值對函數) dictType *type; //私有數據(保存了傳給特定函數的一些參數) void *privdata; //哈希表(一般使用ht[0]哈希表,ht[1]是在rehash時使用) dictht ht[2]; //rehash 索引(記錄了rehash的進度,不rehash時,值為-1) int trehashidx; } dict;

2. 哈希算法:

當添加一個新鍵值時,會先根據鍵計算出哈希值和索引值,然後將新鍵值節點放到指定索引上(dictEntry*[index])。

計算哈希值:hash = dict -> type -> hashFunction(key);

計算索引值:index = hash & dict -> ht[x].sizemask;

3. 解決哈希沖突:

當鍵沖突時,使用next指針將新鍵連接起來。註意:為了速度考慮,程序會將新節點添加到鏈表的表頭位置。

4. rehash:

隨著數據的增多和減少,為了讓哈希表的負載因子維持在一個合理的範圍,需要對哈希表進行擴展和收縮。

負載因子:load_factor = ht[0].used / ht[0].size

rehash擴展觸發條件:

1). 服務器目前沒有在執行BGSAVE命令或者BGREWRITEAOF命令,並且負載因子大於等於1。

2). 服務器目前正在執行BGSAVE命令或者BGREWRITEAOF命令,並且負載因子大於等於0.5。

rehash收縮觸發條件:負載因子小於0.1。

步驟如下:

1). 在沒有rehash時,字典只使用ht[0]。在rehash時,程序會對ht[1]分配空間。

擴展:ht[1]的大小為第一個大於等於ht[0].used * 2的2^n (2的n次方冪);

收縮:ht[1]的大小為第一個大於等於ht[0].used的2^n;

2). 將ht[0]的所有數據全部rehash到ht[1]上面,rehash指的是重新計算鍵的哈希值和索引值,然後放到ht[1]的指定位置上。

3). 當ht[0]上的數據全部遷移到ht[1]後,釋放ht[0],將ht[1]置為ht[0],並在ht[1]上新建一個空的哈希表,為下一次rehash做準備。

5. 漸進式rehash(rehash的優化,觸發條件由負載因子決定,如上)

當哈希表的鍵值對數量巨大時,一次rehash會非常耗時,為了避免對服務器性能造成影響,服務器采用分批次、漸進式的將ht[0]裏面的鍵值對慢慢的rehash到ht[1]。

步驟:

1)為ht[1]分配空間,字典同時持有ht[0]和ht[1]。

2)字典中設置一個計數器rehashidx,當值為0時,表示rehash開始。

3)在rehash期間,每次增刪改查時,程序還會順帶將ht[0]在rehashidx索引上的所有鍵值對rehash到ht[1],當rehash完成後,rehashidx增一。(這裏是將table上對應的某條索引值指向的數據節點鏈表遷移到ht[1]中,th[0].table[rehashidx]數據就空了)

4)隨著操作的不斷執行,ht[0]上的所有鍵值對都會被rehash到ht[1]上,這時rehashidx為-1,表示rehash完成。

註意:

1)在rehash執行期間,新數據會保存到ht[1]裏面,而ht[0]不進行添加操作,這樣,ht[0]裏的數據會逐漸遷移到ht[1],直到ht[0]清空。

2)在rehash執行期間,查找某個鍵時,會先從ht[0]中查找,如果沒找到就去ht[1]裏面查找。

Redis數據結構:字典(hash表)