Redis原始碼剖析--跳躍表zskiplist

阿新 • • 發佈：2019-01-30

跳躍表是一種有序的資料結構，它通過在每個節點中維持多個指向其他節點的指標，從而達到快速訪問的目的。跳躍表在插入、刪除和查詢操作上的平均複雜度為O（logN），最壞為O（N），可以和紅黑樹相媲美，但是在實現起來，比紅黑樹簡單很多。 > 說起跳躍表，在前段時間面試中可幫了我的大忙。騰訊一面的時候面試官要求設計一個數據結構，裡面的元素要求按一定順序存放，能以最低的複雜度獲取每個元素的名次，且增、刪等操作的複雜度儘可能低，博主最終就是用跳躍表來解決了這個問題，平均複雜度能達到O（logN）。 # 跳躍表資料結構跳躍表的結構體定義在server.h檔案中。其中包括跳躍表節點zskiplistNode和跳躍表zskiplist兩個結構體。

typedef struct zskiplistNode {
    robj *obj; // 成員物件
    double score;  // 分值
    struct zskiplistNode *backward; // 後向指標
    // 層
    struct zskiplistLevel {
        struct zskiplistNode *forward; // 前向指標
        unsigned int span; // 跨度
    } level[];
} zskiplistNode;

typedef struct zskiplist {
    // 跳躍表的表頭節點和表尾節點 

    struct zskiplistNode *header, *tail;
    // 表中節點的數量
    unsigned long length;
    // 表中層數最大的節點層數
    int level;
} zskiplist;

對於跳躍表節點來說： + obj 存放著該節點對於的成員物件，一般指向一個sds結構 + score 表示該節點你的分值，跳躍表按照分值大小進行順序排列 + backward 指向跳躍表的前一個節點 + level[] 這個屬性至關重要，是跳躍表的核心所在，初始化一個跳躍表節點的時候會為其隨機生成一個層大小，每個節點的每一層以連結串列的形式連線起來。看完上面的解釋之後，可能讀者對跳躍表還沒有一個清晰的認識，下面我畫了一張圖來形象的描述一下跳躍表結構。

# 跳躍表基本操作 Redis中關於跳躍表的相關操作函式定義在t_zset.c檔案中，下面分別介紹幾個基本操作函式的實現原始碼。 ## 建立跳躍表 Redis在建立一個跳躍表的時候完成以下操作： + 建立一個zskiplist結構 + 設定其level為1，長度length為0 + 初始化一個表頭結點，其層數為32層，每一層均指向NULL

// 建立跳躍表
zskiplist *zslCreate(void) {
    int j;
    zskiplist *zsl;
    // 申請記憶體
    zsl = zmalloc(sizeof(*zsl));
    // 初始化跳躍表屬性 

    zsl->level = 1;
    zsl->length = 0;
    // 建立一個層數為32，分值為0，成員物件為NULL的表頭結點
    zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);
    // 設定每層的forward指標指向NULL
    for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {
        zsl->header->level[j].forward = NULL;
        zsl->header->level[j].span = 0;
    }
    // 設定backward指向NULL
    zsl->header->backward = NULL;
    zsl->tail = NULL;
    return zsl;
}
// 建立一個跳躍表節點
zskiplistNode *zslCreateNode(int level, double score, robj *obj) {
    // 申請記憶體
    zskiplistNode *zn = zmalloc(sizeof(*zn)+level*sizeof(struct zskiplistLevel));
    // 設定分值
    zn->score = score;
    // 設定成員物件
    zn->obj = obj;
    return zn;
}

## 插入節點往跳躍表中插入一個節點，必然會改變跳錶的長度，可能會改變其長度。而且對於插入位置處的前後節點的backward和forward指標均要改變。插入節點的關鍵在找到在何處插入該節點，跳躍表是按照score分值進行排序的，其查詢步驟大致是：從當前最高的level開始，向前查詢，如果當前節點的score小於插入節點的score，繼續向前；反之，則降低一層繼續查詢，直到第一層為止。此時，插入點就位於找到的節點之後。

zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {
    // updata[]陣列記錄每一層位於插入節點的前一個節點
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    // rank[]記錄每一層位於插入節點的前一個節點的排名
    unsigned int rank[ZSKIPLIST_MAXLEVEL];
    int i, level;

    serverAssert(!isnan(score));
    x = zsl->header; // 表頭節點
    // 從最高層開始查詢
    for (i = zsl->level-1; i >= 0; i--) {
        // 儲存rank值是為了交叉快速地到達插入位置
        rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];
        // 前向指標不為空，前置指標的分值小於score或當前向指標的分值等// 於空但成員物件不等於o的情況下，繼續向前查詢
        while (x->level[i].forward &&
            (x->level[i].forward->score < score ||
                (x->level[i].forward->score == score &&
                compareStringObjects(x->level[i].forward->obj,obj) < 0))) {
            rank[i] += x->level[i].span;
            x = x->level[i].forward;
        }
        // 儲存當前層上位於插入節點的前一個節點
        update[i] = x;
    }
    // 此處假設插入節點的成員物件不存在於當前跳躍表內，即不存在重複的節點
    // 隨機生成一個level值
    level = zslRandomLevel();
    if (level > zsl->level) {
        // 如果level大於當前儲存的最大level值
        // 設定rank陣列中大於原level層以上的值為0
        // 同時設定update陣列大於原level層以上的資料
        for (i = zsl->level; i < level; i++) {
            rank[i] = 0;
            update[i] = zsl->header;
            update[i]->level[i].span = zsl->length;
        }
        // 更新level值
        zsl->level = level;
    }
    // 建立插入節點
    x = zslCreateNode(level,score,obj);
    for (i = 0; i < level; i++) {
        // 針對跳躍表的每一層，改變其forward指標的指向
        x->level[i].forward = update[i]->level[i].forward;
        update[i]->level[i].forward = x;

        // 更新插入節點的span值
        x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);
        // 更新插入點的前一個節點的span值
        update[i]->level[i].span = (rank[0] - rank[i]) + 1;
    }

    // 更新高層的span值
    for (i = level; i < zsl->level; i++) {
        update[i]->level[i].span++;
    }
    // 設定插入節點的backward指標
    x->backward = (update[0] == zsl->header) ? NULL : update[0];
    if (x->level[0].forward)
        x->level[0].forward->backward = x;
    else
        zsl->tail = x;
    // 跳躍表長度+1
    zsl->length++;
    return x;
}

## 跳躍表刪除 Redis提供了三種跳躍表節點刪除操作。分別如下： + 根據給定分值和成員來刪除節點，由zslDelete函式實現 + 根據給定分值來刪除節點，由zslDeleteByScore函式實現 + 根據給定排名來刪除節點，由zslDeleteByRank函式實現上述三種操作的刪除節點部分都由zslDeleteNode函式完成。zslDeleteNode函式用於刪除某個節點，需要給定當前節點和每一層下當前節點的前一個節點。

void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {
    int i;
    for (i = 0; i < zsl->level; i++) {
        if (update[i]->level[i].forward == x) {
            // 如果x存在於該層，則需要修改前一個節點的前向指標
            update[i]->level[i].span += x->level[i].span - 1;
            update[i]->level[i].forward = x->level[i].forward;
        } else {
            // 反之，則只需要將span-1
            update[i]->level[i].span -= 1;
        }
    }
    // 修改backward指標，需要考慮x是否為尾節點
    if (x->level[0].forward) {
        x->level[0].forward->backward = x->backward;
    } else {
        zsl->tail = x->backward;
    }
    // 如果被刪除的節點為當前層數最多的節點，
    while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)
        zsl->level--;
    zsl->length--;
}

以zslDelete為例，根據節點的分值和成員來刪除該節點，其他兩個操作無非是在查詢節點上有區別。

int zslDelete(zskiplist *zsl, double score, robj *obj) {
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    int i;

    x = zsl->header;
    // 找到要刪除的節點，以及每一層上該節點的前一個節點
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward &&
            (x->level[i].forward->score < score ||
                (x->level[i].forward->score == score &&
                compareStringObjects(x->level[i].forward->obj,obj) < 0)))
            x = x->level[i].forward;
        update[i] = x;
    }
    // 跳躍表中可能存在分值相同的節點
    // 所以此處需要判斷成員是否相等
    x = x->level[0].forward;
    if (x && score == x->score && equalStringObjects(x->obj,obj)) {
        // 呼叫底層刪除節點函式
        zslDeleteNode(zsl, x, update);
        zslFreeNode(x);
        return 1;
    }
    // 沒有刪除成功
    return 0; 
}

## 獲取給定分值和成員的節點的排名開篇提到博主在騰訊一面中被問的問題，需要獲取每個玩家的排名，跳躍表獲取排名的平均複雜度為O（logN），最壞為O（n）。其實現如下：

unsigned long zslGetRank(zskiplist *zsl, double score, robj *o) {
    zskiplistNode *x;
    unsigned long rank = 0;
    int i;

    x = zsl->header;
    // 從最高層開始查詢
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward &&
            (x->level[i].forward->score < score ||
                (x->level[i].forward->score == score &&
                compareStringObjects(x->level[i].forward->obj,o) <= 0))) {
            // 前向指標不為空，前置指標的分值小於score或當前向指標的// 分值等於空但成員物件不等於o的情況下，繼續向前查詢
            rank += x->level[i].span;
            x = x->level[i].forward;
        }

        // 此時x可能是header，所以此處需要判斷一下
        if (x->obj && equalStringObjects(x->obj,o)) {
            return rank;
        }
    }
    return 0;
}

這裡粗略的畫了一張圖來說明查詢過程，紅線代表查詢的路線。

區間操作

Redis提供了一些區間操作，用於獲取某段區間上的節點或者刪除某段區間上的所有節點等操作，這些操作大大提高了Redis的易用性。

// 獲取某個區間上第一個符合範圍的節點。
zskiplistNode *zslFirstInRange(zskiplist *zsl, zrangespec *range) {
    zskiplistNode *x;
    int i;

    // 判斷給定的分值範圍是否在跳躍表的範圍內
    if (!zslIsInRange(zsl,range)) return NULL;

    x = zsl->header;

    for (i = zsl->level-1; i >= 0; i--) {
        // 如果當前節點的分值小於給定範圍的下限則一直向前查詢
        while (x->level[i].forward &&
            !zslValueGteMin(x->level[i].forward->score,range))
                x = x->level[i].forward;
    }

    // x的下一個節點才是我們要找的節點
    x = x->level[0].forward;
    serverAssert(x != NULL);

    // 檢查該節點不超過給定範圍範圍
    if (!zslValueLteMax(x->score,range)) return NULL;
    return x;
}
// 獲取某個區間上最後一個符合範圍的節點。
zskiplistNode *zslLastInRange(zskiplist *zsl, zrangespec *range) {
    zskiplistNode *x;
    int i;

    // 判斷給定的分值範圍是否在跳躍表的範圍內
    if (!zslIsInRange(zsl,range)) return NULL;

    x = zsl->header;
    for (i = zsl->level-1; i >= 0; i--) {
        // 如果在給定範圍內則一直向前查詢
        while (x->level[i].forward &&
            zslValueLteMax(x->level[i].forward->score,range))
                x = x->level[i].forward;
    }

    // x即為要找的節點
    serverAssert(x != NULL);

    // 判斷該分值是否在給定範圍內
    if (!zslValueGteMin(x->score,range)) return NULL;
    return x;
}
// 刪除給定分值範圍內的所有元素
unsigned long zslDeleteRangeByScore(zskiplist *zsl, zrangespec *range, dict *dict) {
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    unsigned long removed = 0;
    int i;

    x = zsl->header;
    // 找到小於或等於給定範圍最小分值的節點
    // 並將每層上的節點儲存到update陣列
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && (range->minex ?
            x->level[i].forward->score <= range->min :
            x->level[i].forward->score < range->min))
                x = x->level[i].forward;
        update[i] = x;
    }

    // x的下一個節點則是給定區間內分值最小的節點
    x = x->level[0].forward;

    // 刪除該區間下的所有節點
    while (x &&
           (range->maxex ? x->score < range->max : x->score <= range->max))
    {
        // 儲存下一個節點
        zskiplistNode *next = x->level[0].forward;
        // 刪除該節點
        zslDeleteNode(zsl,x,update);
        // 刪除該節點的成員
        dictDelete(dict,x->obj);
        // 釋放該節點
        zslFreeNode(x);
        removed++;
        x = next;
    }
    // 返回刪除節點的個數
    return removed;
}
// 刪除給定排名區間內的所有節點
unsigned long zslDeleteRangeByRank(zskiplist *zsl, unsigned int start, unsigned int end, dict *dict) {
    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;
    unsigned long traversed = 0, removed = 0;
    int i;

    x = zsl->header;
    // 找到給定排名區間內名次最小的節點
    // 並儲存每一層下該節點的前一個節點
    for (i = zsl->level-1; i >= 0; i--) {
        while (x->level[i].forward && (traversed + x->level[i].span) < start) {
            traversed += x->level[i].span;
            x = x->level[i].forward;
        }
        update[i] = x;
    }
    // traversed儲存當前刪除節點的排名值
    traversed++;
    x = x->level[0].forward;
    while (x && traversed <= end) {
        // 記錄下一個節點
        zskiplistNode *next = x->level[0].forward;
        // 刪除該節點
        zslDeleteNode(zsl,x,update);
        // 刪除該節點的成員
        dictDelete(dict,x->obj);
        // 釋放該節點
        zslFreeNode(x);
        // 個數+1
        removed++;
        // 排名值加1
        traversed++;
        x = next;
    }
    // 返回刪除的節點個數
    return removed;
}

跳躍表小結

跳躍表是有序集合的底層實現之一。在同一個跳躍表中，多個節點可以包含相同的分值，但每個節點的成員物件必須是唯一的。跳躍表的節點是按照分值進行排序的，當分值相同時，節點按照成員物件的大小進行排序。

Redis原始碼剖析--跳躍表zskiplist

區間操作

跳躍表小結

Redis原始碼剖析--跳躍表zskiplist

redis原始碼之跳躍表skiplist

唯快不破：redis原始碼剖析03-dict雜湊表結構

Redis原始碼剖析--記憶體管理zmalloc

Redis原始碼剖析（二）--簡單動態字串

Redis原始碼剖析（七）--壓縮列表

Redis原始碼剖析和註釋（二十五）--- Redis Cluster 的通訊流程深入剖析（載入配置檔案、節點握手、分配槽）

Redis原始碼剖析和註釋（二十七）--- Redis 故障轉移流程和原理剖析

Redis原始碼剖析（九）--資料庫

Redis原始碼剖析（十）--RDB持久化

Redis原始碼剖析和註釋（十四）---- Redis 資料庫及相關命令實現(db)

Redis原始碼剖析--整數集合Intset

Redis中的跳躍表

Redis原始碼剖析——adlist的實現

Redis原始碼剖析和註釋（二十）--- 網路連線庫剖析(client的建立/釋放、命令接收/回覆、Redis通訊協議分析等)

Redis原始碼剖析和註釋（十九）--- Redis 事件處理實現

Redis原始碼剖析--基數統計hyperloglog

Redis原始碼剖析和註釋（十一）--- 雜湊鍵命令的實現(t_hash)

Redis原始碼剖析（五）訂閱與釋出

Redis原始碼剖析--雙端連結串列Sdlist

Redis原始碼剖析--跳躍表zskiplist

區間操作

跳躍表小結

相關推薦