1. 程式人生 > >Redis持久化的幾種方式——深入解析RDB

Redis持久化的幾種方式——深入解析RDB

Redis 的讀寫都是在記憶體中,所以它的效能較高,但在記憶體中的資料會隨著伺服器的重啟而丟失,為了保證資料不丟失,我們需要將記憶體中的資料儲存到磁碟,以便 Redis 重啟時能夠從磁碟中恢復原有的資料,而整個過程就叫做 Redis 持久化。


Redis 持久化也是 Redis 和 Memcached 的主要區別之一,因為 Memcached 是不具備持久化功能的。

1.持久化的幾種方式

Redis 持久化擁有以下三種方式:

  • 快照方式(RDB, Redis DataBase)將某一個時刻的記憶體資料,以二進位制的方式寫入磁碟;
  • 檔案追加方式(AOF, Append Only File),記錄所有的操作命令,並以文字的形式追加到檔案中;
  • 混合持久化方式,Redis 4.0 之後新增的方式,混合持久化是結合了 RDB 和 AOF 的優點,在寫入的時候,先把當前的資料以 RDB 的形式寫入檔案的開頭,再將後續的操作命令以 AOF 的格式存入檔案,這樣既能保證 Redis 重啟時的速度,又能簡單資料丟失的風險。

因為每種持久化方案,都有特定的使用場景,讓我們先從 RDB 持久化說起吧。

2.RDB簡介

RDB(Redis DataBase)是將某一個時刻的記憶體快照(Snapshot),以二進位制的方式寫入磁碟的過程。

3.持久化觸發

RDB 的持久化觸發方式有兩類:一類是手動觸發,另一類是自動觸發。

1)手動觸發

手動觸發持久化的操作有兩個: save

 和 bgsave ,它們主要區別體現在:是否阻塞 Redis 主執行緒的執行。

① save 命令

在客戶端中執行 save 命令,就會觸發 Redis 的持久化,但同時也是使 Redis 處於阻塞狀態,直到 RDB 持久化完成,才會響應其他客戶端發來的命令,所以在生產環境一定要慎用。

save 命令使用如下:

從圖片可以看出,當執行完 save 命令之後,持久化檔案 dump.rdb 的修改時間就變了,這就表示 save 成功的觸發了 RDB 持久化。
save 命令執行流程,如下圖所示:

② bgsave 命令

bgsave(background save)既後臺儲存的意思, 它和 save

 命令最大的區別就是 bgsave 會 fork() 一個子程序來執行持久化,整個過程中只有在 fork() 子程序時有短暫的阻塞,當子程序被建立之後,Redis 的主程序就可以響應其他客戶端的請求了,相對於整個流程都阻塞的 save 命令來說,顯然 bgsave 命令更適合我們使用。
bgsave 命令使用,如下圖所示:

bgsave 執行流程,如下圖所示:

2)自動觸發

說完了 RDB 的手動觸發方式,下面來看如何自動觸發 RDB 持久化?
RDB 自動持久化主要來源於以下幾種情況。

① save m n

save m n 是指在 m 秒內,如果有 n 個鍵發生改變,則自動觸發持久化。
引數 m 和 n 可以在 Redis 的配置檔案中找到,例如,save 60 1 則表明在 60 秒內,至少有一個鍵發生改變,就會觸發 RDB 持久化。
自動觸發持久化,本質是 Redis 通過判斷,如果滿足設定的觸發條件,自動執行一次 bgsave 命令。
注意:當設定多個 save m n 命令時,滿足任意一個條件都會觸發持久化。
例如,我們設定了以下兩個 save m n 命令:

  • save 60 10
  • save 600 1

當 60s 內如果有 10 次 Redis 鍵值發生改變,就會觸發持久化;如果 60s 內 Redis 的鍵值改變次數少於 10 次,那麼 Redis 就會判斷 600s 內,Redis 的鍵值是否至少被修改了一次,如果滿足則會觸發持久化。

② flushall

flushall 命令用於清空 Redis 資料庫,在生產環境下一定慎用,當 Redis 執行了 flushall 命令之後,則會觸發自動持久化,把 RDB 檔案清空。
執行結果如下圖所示:

③ 主從同步觸發

在 Redis 主從複製中,當從節點執行全量複製操作時,主節點會執行 bgsave 命令,並將 RDB 檔案傳送給從節點,該過程會自動觸發 Redis 持久化。

4.配置說明

合理的設定 RDB 的配置,可以保障 Redis 高效且穩定的執行,下面一起來看 RDB 的配置項都有哪些?

RDB 配置引數可以在  Redis 的配置檔案中找見,具體內容如下:

# RDB 儲存的條件
save 900 1
save 300 10
save 60 10000

# bgsave 失敗之後,是否停止持久化資料到磁碟,yes 表示停止持久化,no 表示忽略錯誤繼續寫檔案。
stop-writes-on-bgsave-error yes

# RDB 檔案壓縮
rdbcompression yes

# 寫入檔案和讀取檔案時是否開啟 RDB 檔案檢查,檢查是否有無損壞,如果在啟動是檢查發現損壞,則停止啟動。
rdbchecksum yes

# RDB 檔名
dbfilename dump.rdb

# RDB 檔案目錄
dir ./

其中比較重要的引數如下列表:
① save 引數
它是用來配置觸發 RDB 持久化條件的引數,滿足儲存條件時將會把資料持久化到硬碟。
預設配置說明如下:

  • save 900 1:表示 900 秒內如果至少有 1 個 key 值變化,則把資料持久化到硬碟;
  • save 300 10:表示 300 秒內如果至少有 10 個 key 值變化,則把資料持久化到硬碟;
  • save 60 10000:表示 60 秒內如果至少有 10000 個 key 值變化,則把資料持久化到硬碟。

② rdbcompression 引數
它的預設值是 yes 表示開啟 RDB 檔案壓縮,Redis 會採用 LZF 演算法進行壓縮。如果不想消耗 CPU 效能來進行檔案壓縮的話,可以設定為關閉此功能,這樣的缺點是需要更多的磁碟空間來儲存檔案。
③ rdbchecksum 引數
它的預設值為 yes 表示寫入檔案和讀取檔案時是否開啟 RDB 檔案檢查,檢查是否有無損壞,如果在啟動是檢查發現損壞,則停止啟動。

5.配置查詢

Redis 中可以使用命令查詢當前配置引數。查詢命令的格式為:config get xxx ,例如,想要獲取 RDB 檔案的儲存名稱設定,可以使用 config get dbfilename ,執行效果如下圖所示:

查詢 RDB 的檔案目錄,可使用命令 config get dir ,執行效果如下圖所示:

6.配置設定

設定 RDB 的配置,可以通過以下兩種方式:

  • 手動修改 Redis 配置檔案;
  • 使用命令列設定,例如,使用 config set dir "/usr/data" 就是用於修改 RDB 的儲存目錄。

注意:手動修改 Redis 配置檔案的方式是全域性生效的,即重啟 Redis 伺服器設定引數也不會丟失,而使用命令修改的方式,在 Redis 重啟之後就會丟失。但手動修改 Redis 配置檔案,想要立即生效需要重啟 Redis 伺服器,而命令的方式則不需要重啟 Redis 伺服器。

小貼士:Redis 的配置檔案位於 Redis 安裝目錄的根路徑下,預設名稱為 redis.conf。

7.RDB 檔案恢復

當 Redis 伺服器啟動時,如果 Redis 根目錄存在 RDB 檔案 dump.rdb,Redis 就會自動載入 RDB 檔案恢復持久化資料。
如果根目錄沒有 dump.rdb 檔案,請先將 dump.rdb 檔案移動到 Redis 的根目錄。
驗證 RDB 檔案是否被載入
Redis 在啟動時有日誌資訊,會顯示是否載入了 RDB 檔案,我們執行 Redis 啟動命令:src/redis-server redis.conf ,如下圖所示:

從日誌上可以看出, Redis 服務在啟動時已經正常載入了 RDB 檔案。

小貼士:Redis 伺服器在載入 RDB 檔案期間,會一直處於阻塞狀態,直到載入工作完成為止。

8.RDB 優缺點

1)RDB 優點

  • RDB 的內容為二進位制的資料,佔用記憶體更小,更緊湊,更適合做為備份檔案;
  • RDB 對災難恢復非常有用,它是一個緊湊的檔案,可以更快的傳輸到遠端伺服器進行 Redis 服務恢復;
  • RDB 可以更大程度的提高 Redis 的執行速度,因為每次持久化時 Redis 主程序都會 fork() 一個子程序,進行資料持久化到磁碟,Redis 主程序並不會執行磁碟 I/O 等操作;
  • 與 AOF 格式的檔案相比,RDB 檔案可以更快的重啟。

    2)RDB 缺點

  • 因為 RDB 只能儲存某個時間間隔的資料,如果中途 Redis 服務被意外終止了,則會丟失一段時間內的 Redis 資料;
  • RDB 需要經常 fork() 才能使用子程序將其持久化在磁碟上。如果資料集很大,fork() 可能很耗時,並且如果資料集很大且 CPU 效能不佳,則可能導致 Redis 停止為客戶端服務幾毫秒甚至一秒鐘。

    9.禁用持久化

    禁用持久化可以提高 Redis 的執行效率,如果對資料丟失不敏感的情況下,可以在連線客戶端的情況下,執行 config set save "" 命令即可禁用 Redis 的持久化,如下圖所示:

    10.小結

    通過本文我們可以得知,RDB 持久化分為手動觸發和自動觸發兩種方式,它的優點是儲存檔案小,Redis 啟動時恢復資料比較快,缺點是有丟失資料的風險。RDB 檔案的恢復也很簡單,只需要把 RDB 檔案放到 Redis 的根目錄,在 Redis 啟動時就會自動載入並恢復資料。

    11.思考題

    如果 Redis 伺服器 CPU 佔用過高,可能是什麼原因導致的?歡迎各位在評論區,寫下你們的答案。

    12.參考&鳴謝

    https://redis.io/topics/persistence
    https://blog.csdn.net/qq_36318234/article/details/79994133
    https://www.cnblogs.com/ysocean/p/9114268.html
    https://www.cnblogs.com/wdliu/p/9377278.html