【網路程式設計】說說Redis的服務端設計

阿新 • • 發佈：2019-01-21

引子

感覺這東西看過不記一下總會忘，所以手不能懶，及時總結一下。
本文主要針對Redis的服務端模型進行分析，力爭能有總體的思路和部分細緻的深入。原始碼版本3.2.8.

正文

Redis服務端一個典型的單執行緒reactor模型，使用I/O多路複用來完成對檔案描述符的監聽，然後主執行緒依次處理就緒的事件。

I/O多路複用

思路非常的簡單，首先我們知道I/O多路複用有好幾種方式，而這常常是和平臺相關的，所以為了實現的簡潔，擴充套件性，跨平臺性，Redis在這裡進行了一層封裝，通過一套統一的API完成整個網路通訊部分。
以Linux下的epoll為例，讓我們來看一下。

typedef 
 struct aeApiState {
    int epfd;
    struct epoll_event *events;
} aeApiState;

static int aeApiCreate(aeEventLoop *eventLoop)；

初始化，主要是分配記憶體和呼叫epoll_create生成epoll監聽fd,eventLoop結構體是服務端事件驅動的結構體。

static int aeApiResize(aeEventLoop *eventLoop, int setsize)；
eventLoop記錄了能監控的事件最大數，這裡重新調整大小。

static void aeApiFree(aeEventLoop *eventLoop);

釋放直接分配給eventLoop的記憶體空間

static int aeApiAddEvent(aeEventLoop *eventLoop, int fd, int mask);
向eventLoop裡面新增要監控的事件，對於epoll來說就是epoll_ctl(EPOLL_CTL_ADD)

static void aeApiDelEvent(aeEventLoop *eventLoop, int fd, int delmask);
刪除監控的事件，對於epoll來說就是epoll_ctl(EPOLL_CTL_DEL)

static int aeApiPoll(aeEventLoop *eventLoop, struct timeval *tvp);

I/O多路複用的阻塞呼叫，對於epoll來說就是epoll_wait，第二個引數表示epoll要㩐待的最長時間。

static char *aeApiName(void);
返回封裝的I/O多路複用實現，對於epoll來說就是返回“epoll”

而在選擇I/O多路複用的實現時，是按照效能的從高到低。
在Redis的網路庫ae.c最前面是這樣的

#ifdef HAVE_EVPORT
#include "ae_evport.c" // Solaris
#else
    #ifdef HAVE_EPOLL
    #include "ae_epoll.c" // Linux
    #else
        #ifdef HAVE_KQUEUE
        #include "ae_kqueue.c" // BSD
        #else
        #include "ae_select.c"
        #endif
    #endif
#endif

自然，跨平臺的select作為保留選擇，但是由於其效能原因，放在最後了。

兩種事件

Redis的服務端通過事件驅動，I/O事件和定時事件，I/O事件我們都很熟悉，便是可讀/寫或者accept返回的fd，而定時事件的處理之前則沒怎麼接觸，最近也趁機好好學習了《高效能服務端》裡面的定時器一章。所以在這裡順便展開小說一下定時器。

定時器

定時器裡面有兩個最基本的屬性，即超時時間和處理函式（回撥函式），當然可能還有其他的屬性，比如是否需要重啟等等，一個定時器就是一個定時事件，我們可以通過連結串列、時間輪、最小堆來組織定時事件。
而在監控定時事件時可以通過訊號（定時發訊號檢測是否到時），I/O多路複用（超時引數）來實現。

服務端事件驅動流程

在服務端啟動之後，首先會進行各種初始化工作，在初始化結束之後，便進入aeMain，開始執行服務端的事件迴圈，等待客戶端連線。

void aeMain(aeEventLoop *eventLoop) {
    eventLoop->stop = 0; // 終止flag
    while (!eventLoop->stop) {
        if (eventLoop->beforesleep != NULL)
            eventLoop->beforesleep(eventLoop);
        aeProcessEvents(eventLoop, AE_ALL_EVENTS);
    }
}

可以看到這裡便是不斷呼叫aeProcessEvents，並且監聽兩種種類事件（AE_ALL_EVENTS）

事件種類

#define AE_FILE_EVENTS 1 // I/O事件
#define AE_TIME_EVENTS 2 // 定時事件
#define AE_ALL_EVENTS (AE_FILE_EVENTS|AE_TIME_EVENTS)

每次aeProcessEvents都是一次I/O多路複用的輪詢，讓我們來看一下這個核心函式的細節
int aeProcessEvents(aeEventLoop *eventLoop, int flags)
eventLoop就是我們的事件驅動主結構體，flag則記錄了需要關心的事件（主迴圈似乎是會關心所有事件，這裡我認為主要體現了Redis網網路庫的拓展性，程式也許只需要關心一種事件）。

if (!(flags & AE_TIME_EVENTS) && !(flags & AE_FILE_EVENTS)) 
    return 0;
/*
既然只有兩種事件，那麼這兩種事件都不關心自然是直接結束了（return ASAP--as soon as possible）
*/

    if (eventLoop->maxfd != -1 ||
        ((flags & AE_TIME_EVENTS) && !(flags & AE_DONT_WAIT))) { // 需要關心時間事件，並且不是立即返回
        int j;
        aeTimeEvent *shortest = NULL;
        struct timeval tv, *tvp;

        if (flags & AE_TIME_EVENTS && !(flags & AE_DONT_WAIT))
            shortest = aeSearchNearestTimer(eventLoop);
            /*在最近記錄的定時事件中，查詢還有最短時間的事件*/
        if (shortest) { //找到一個距離到時最近的定時事件
            long now_sec, now_ms;

            aeGetTime(&now_sec, &now_ms);//獲取現在的時間（秒和毫秒）
            tvp = &tv;

            long long ms =
                (shortest->when_sec - now_sec)*1000 +
                shortest->when_ms - now_ms;
            //計算距離到時還有多少時間
            if (ms > 0) { // 如果定時事件還沒到達時間，將剩餘時間記錄在tvp中
                tvp->tv_sec = ms/1000;
                tvp->tv_usec = (ms % 1000)*1000;
            } else {// 已經有定時事件到時了，那麼就不等待，將tvp設定為0
                tvp->tv_sec = 0; 
                tvp->tv_usec = 0;
            }
        } else { //shortest為NULL，目前沒有等待的定時事件
            if (flags & AE_DONT_WAIT) { /AE_DONT_WAIT被設定則不需要等待
                tv.tv_sec = tv.tv_usec = 0;
                tvp = &tv;
            } else {
                //永遠等待直到有事件發生
                tvp = NULL; 
            }
        }

經過這一步，我們已經計算出了多路複用需要的超時時間儲存在tvp裡了。然後就是對監聽的fd進行輪詢了。

numevents = aeApiPoll(eventLoop, tvp);//返回發生的事件
        for (j = 0; j < numevents; j++) {//遍歷，處理事件
            aeFileEvent *fe = &eventLoop->events[eventLoop->fired[j].fd];
            int mask = eventLoop->fired[j].mask;
            int fd = eventLoop->fired[j].fd;
            int rfired = 0;

            if (fe->mask & mask & AE_READABLE) {// 可讀事件
                rfired = 1;
                fe->rfileProc(eventLoop,fd,fe->clientData,mask);//呼叫之前新增的處理函式
            }
            if (fe->mask & mask & AE_WRITABLE) {// 可寫事件
                if (!rfired || fe->wfileProc != fe->rfileProc)
                    fe->wfileProc(eventLoop,fd,fe->clientData,mask);// 同上
            }
            processed++;// 成功處理的事件數加1
        }
    }
    // 可以看到，當一個fd 上既可讀又可寫時是優先處理可讀事件的

因為我們剛才設定的傳給aeApiPoll的時間是定時事件剛好到時的剩餘時間，所以現在定時事件已經到時了，我們還需要再去處理定時事件。
當然，因為我們是處理完所有非定時事件之後，才處理定時事件的，所以實際處理定時事件可能要比預定的時間慢一點。

    if (flags & AE_TIME_EVENTS)
        processed += processTimeEvents(eventLoop);
    return processed;

讓我們再來看processTimeEvents的細節。

首先是一個異常處理，如果系統時間發生錯亂被移到未來（moved to the future），這裡我們就不關心細節了。

    int processed = 0;
    aeTimeEvent *te, *prev;
    long long maxId;

    time_t now = time(NULL);   // 獲取現在的時間
    eventLoop->lastTime = now; // 設定時間

    prev = NULL;               // 前驅指標
    te = eventLoop->timeEventHead;// te就是定時事件連結串列頭
    maxId = eventLoop->timeEventNextId-1;//定時事件的最大ID

while(te) {// 主迴圈
        long now_sec, now_ms;
        long long id;

        if (te->id == AE_DELETED_EVENT_ID) { // 這個事件要被刪除
            aeTimeEvent *next = te->next;
            if (prev == NULL)
                eventLoop->timeEventHead = te->next;
            else
                prev->next = te->next;
            if (te->finalizerProc)// 清理資源
                te->finalizerProc(eventLoop, te->clientData);
            zfree(te);// 釋放資源
            te = next;
            continue;
        }


        if (te->id > maxId) {
            te = te->next;
            continue;
        }
        aeGetTime(&now_sec, &now_ms);
        if (now_sec > te->when_sec ||
            (now_sec == te->when_sec && now_ms >= te->when_ms)) //如果定時事件到時了（現在的時間大於設定的時間）
        {
            int retval;

            id = te->id;
            retval = te->timeProc(eventLoop, id, te->clientData); //呼叫處理函式處理
            processed++; //處理數+1
            if (retval != AE_NOMORE) { //如果這個事件之後還要執行，也就是隔一段時間再執行的事件
                aeAddMillisecondsToNow(retval,&te->when_sec,&te->when_ms); //新增時間
            } else {
                te->id = AE_DELETED_EVENT_ID;//否則設定刪除標誌
            }
        }
        prev = te;
        te = te->next;//處理下一個事件
    }
return processed;// 返回處理數

至此，一次對時間事件處理就結束了，aeProcessEvents也就結束了。
而服務端主要就是一個死迴圈aeProcessEvents來進行事件處理。

參考閱讀

《Redis設計與實現》中的第12章事件，第14章伺服器。
小夥伴Tanswer之前也分析了ae.c的原始碼,並且還有之前學長利用ae寫的demo，請移步 Redis網路庫原始碼淺解

【網路程式設計】說說Redis的服務端設計

引子

正文

I/O多路複用

兩種事件

定時器

服務端事件驅動流程

參考閱讀

【網路程式設計】說說Redis的服務端設計

【網路程式設計】服務端的I/O模型，事件處理模式，併發模式

【網路程式設計】tcp伺服器與客戶端

【網路程式設計】TCP網路程式設計中connect()、listen()和accept()三者之間的關係

【網路程式設計】網路程式設計筆記

3、【網路程式設計】Socket程式設計

2、【網路程式設計】TCP報文段/網路位元組序/主機位元組序/網-主位元組序轉換函式

1、【網路程式設計】Socket/TCP/UDP/HTTP/HTTPS/網路分層模型

【網路程式設計】滑動視窗詳解 (TCP流量控制)

【javaweb:servlet】從服務端下載中文名稱檔案應該注意的問題！！！

【shell程式設計】 nginx 服務的啟動指令碼

【網路程式設計】之九、事件選擇WSAEventSelect

【網路程式設計】libevent 入門

【網路程式設計】處理定時事件（二）---利用訊號通知

【許可權維持】window服務端常見後門技術

【網路程式設計】socket、埠、程序的關係

Java基礎知識網路程式設計（瀏覽器&服務端）

【網路程式設計】資料傳輸時的位元組序

【VS開發】TCP服務端如何判斷客戶端斷開連線

【網路程式設計】非阻塞connect詳解

【網路程式設計】說說Redis的服務端設計

引子

正文

I/O多路複用

兩種事件

定時器

服務端事件驅動流程

參考閱讀

相關推薦