1. 程式人生 > >Redis Cluster 的資料分片機制

Redis Cluster 的資料分片機制

上一篇《分散式資料快取中的一致性雜湊演算法》
文章中講述了一致性雜湊演算法的基本原理和實現,今天就以 Redis Cluster 為例,詳細講解一下分散式資料快取中的資料分片,上線下線時資料遷移以及請求重定向等操作。

Redis 叢集簡介

Redis Cluster 是 Redis 的分散式解決方案,在 3.0 版本正式推出,有效地解決了 Redis 分散式方面的需求。

Redis Cluster 一般由多個節點組成,節點數量至少為 6 個才能保證組成完整高可用的叢集,其中三個為主節點,三個為從節點。三個主節點會分配槽,處理客戶端的命令請求,而從節點可用在主節點故障後,頂替主節點。


圖片來源 redislabs

如上圖所示,該叢集中包含 6 個 Redis 節點,3主3從,分別為M1,M2,M3,S1,S2,S3。除了主從 Redis 節點之間進行資料複製外,所有 Redis 節點之間採用 Gossip 協議進行通訊,交換維護節點元資料資訊。

一般來說,主 Redis 節點會處理 Clients 的讀寫操作,而從節點只處理讀操作。

資料分片策略

分散式資料儲存方案中最為重要的一點就是資料分片,也就是所謂的 Sharding。

為了使得叢集能夠水平擴充套件,首要解決的問題就是如何將整個資料集按照一定的規則分配到多個節點上,常用的資料分片的方法有:範圍分片,雜湊分片,一致性雜湊演算法,雜湊槽等。

範圍分片假設資料集是有序,將順序相臨近的資料放在一起,可以很好的支援遍歷操作。範圍分片的缺點是面對順序寫時,會存在熱點。比如日誌型別的寫入,一般日誌的順序都是和時間相關的,時間是單調遞增的,因此寫入的熱點永遠在最後一個分片。

對於關係型的資料庫,因為經常性的需要表掃描或者索引掃描,基本上都會使用範圍的分片策略。

雜湊分片和一致性雜湊演算法在上一篇文章中已經學習過了,感興趣的同學可以去了解一下《分散式資料快取中的一致性雜湊演算法》。我們接下來主要來看Redis 的虛擬雜湊槽策略。

Redis Cluster 採用虛擬雜湊槽分割槽,所有的鍵根據雜湊函式對映到 0 ~ 16383 整數槽內,計算公式:slot = CRC16(key) & 16383。每一個節點負責維護一部分槽以及槽所對映的鍵值資料。

Redis 虛擬槽分割槽的特點:

  • 解耦資料和節點之間的關係,簡化了節點擴容和收縮難度。
  • 節點自身維護槽的對映關係,不需要客戶端或者代理服務維護槽分割槽元資料
  • 支援節點、槽和鍵之間的對映查詢,用於資料路由,線上叢集伸縮等場景。

Redis 叢集提供了靈活的節點擴容和收縮方案。在不影響叢集對外服務的情況下,可以為叢集新增節點進行擴容也可以下線部分節點進行縮容。可以說,槽是 Redis 叢集管理資料的基本單位,叢集伸縮就是槽和資料在節點之間的移動。

下面我們就先來看一下 Redis 叢集伸縮的原理。然後再瞭解當 Redis 節點資料遷移過程中或者故障恢復時如何保證叢集可用。

擴容叢集

為了讓讀者更好的理解上線節點時的擴容操作,我們通過 Redis Cluster 的命令來模擬整個過程。

當一個 Redis 新節點執行並加入現有集群后,我們需要為其遷移槽和資料。首先要為新節點指定槽的遷移計劃,確保遷移後每個節點負責相似數量的槽,從而保證這些節點的資料均勻。

1) 首先啟動一個 Redis 節點,記為 M4。
2) 使用 cluster meet 命令,讓新 Redis 節點加入到叢集中。新節點剛開始都是主節點狀態,由於沒有負責的槽,所以不能接受任何讀寫操作,後續我們就給他遷移槽和填充資料。
3) 對 M4 節點發送 cluster setslot { slot } importing { sourceNodeId} 命令,讓目標節點準備匯入槽的資料。
4) 對源節點,也就是 M1,M2,M3 節點發送 cluster setslot { slot } migrating { targetNodeId} 命令,讓源節點準備遷出槽的資料。
5) 源節點執行 cluster getkeysinslot { slot } { count } 命令,獲取 count 個屬於槽 { slot } 的鍵,然後執行步驟六的操作進行遷移鍵值資料。
6) 在源節點上執行 migrate { targetNodeIp} " " 0 { timeout } keys { key... } 命令,把獲取的鍵通過 pipeline 機制批量遷移到目標節點,批量遷移版本的 migrate 命令在 Redis 3.0.6 以上版本提供。
7) 重複執行步驟 5 和步驟 6 直到槽下所有的鍵值資料遷移到目標節點。
8) 向叢集內所有主節點發送 cluster setslot { slot } node { targetNodeId } 命令,通知槽分配給目標節點。為了保證槽節點對映變更及時傳播,需要遍歷傳送給所有主節點更新被遷移的槽執行新節點。

收縮叢集

收縮節點就是將 Redis 節點下線,整個流程需要如下操作流程。

1) 首先需要確認下線節點是否有負責的槽,如果是,需要把槽遷移到其他節點,保證節點下線後整個叢集槽節點對映的完整性。
2) 當下線節點不再負責槽或者本身是從節點時,就可以通知叢集內其他節點忘記下線節點,當所有的節點忘記改節點後可以正常關閉。

下線節點需要將節點自己負責的槽遷移到其他節點,原理與之前節點擴容的遷移槽過程一致。

遷移完槽後,還需要通知叢集內所有節點忘記下線的節點,也就是說讓其他節點不再與要下線的節點進行 Gossip 訊息交換。

Redis 叢集使用 cluster forget { downNodeId } 命令來講指定的節點加入到禁用列表中,在禁用列表內的節點不再發送 Gossip 訊息。

客戶端路由

在叢集模式下,Redis 節點接收任何鍵相關命令時首先計算鍵對應的槽,在根據槽找出所對應的節點,如果節點是自身,則處理鍵命令;否則回覆 MOVED 重定向錯誤,通知客戶端請求正確的節點。這個過程稱為 MOVED 重定向。

需要注意的是 Redis 計算槽時並非只簡單的計算鍵值內容,當鍵值內容包括大括號時,則只計算括號內的內容。比如說,key 為 user:{10000}:books時,計算雜湊值只計算10000。

MOVED 錯誤示例如下,鍵 x 所屬的雜湊槽 3999 ,以及負責處理這個槽的節點的 IP 和埠號 127.0.0.1:6381 。 客戶端需要根據這個 IP 和埠號, 向所屬的節點重新發送一次 GET 命令請求。

GET x
-MOVED 3999 127.0.0.1:6381

由於請求重定向會增加 IO 開銷,這不是 Redis 叢集高效的使用方式,而是要使用 Smart 叢集客戶端。Smart 客戶端通過在內部維護 slot 到 Redis節點的對映關係,本地就可以實現鍵到節點的查詢,從而保證 IO 效率的最大化,而 MOVED 重定向負責協助客戶端更新對映關係。

Redis 叢集支援線上遷移槽( slot ) 和資料來完成水平伸縮,當 slot 對應的資料從源節點到目標節點遷移過程中,客戶端需要做到智慧遷移,保證鍵命令可正常執行。例如當 slot 資料從源節點遷移到目標節點時,期間可能出現一部分資料在源節點,而另一部分在目標節點。

所以,綜合上述情況,客戶端命令執行流程如下所示:

  • 客戶端根據本地 slot 快取傳送命令到源節點,如果存在鍵對應則直接執行並返回結果給客戶端。
  • 如果節點返回 MOVED 錯誤,更新本地的 slot 到 Redis 節點的對映關係,然後重新發起請求。
  • 如果資料正在遷移中,節點會回覆 ASK 重定向異常。格式如下: ( error ) ASK { slot } { targetIP } : {targetPort}
  • 客戶端從 ASK 重定向異常提取出目標節點資訊,傳送 asking 命令到目標節點開啟客戶端連線標識,再執行鍵命令。

ASK 和 MOVED 雖然都是對客戶端的重定向控制,但是有著本質區別。ASK 重定向說明叢集正在進行 slot 資料遷移,客戶端無法知道什麼時候遷移完成,因此只能是臨時性的重定向,客戶端不會更新 slot 到 Redis 節點的對映快取。但是 MOVED 重定向說明鍵對應的槽已經明確指定到新的節點,因此需要更新 slot 到 Redis 節點的對映快取。

故障轉移

當 Redis 叢集內少量節點出現故障時通過自動故障轉移保證叢集可以正常對外提供服務。

當某一個 Redis 節點客觀下線時,Redis 叢集會從其從節點中通過選主選出一個替代它,從而保證叢集的高可用性。這塊內容並不是本文的核心內容,感興趣的同學可以自己學習。

但是,有一點要注意。預設情況下,當叢集 16384 個槽任何一個沒有指派到節點時整個叢集不可用。執行任何鍵命令返回 CLUSTERDOWN Hash slot not served 命令。當持有槽的主節點下線時,從故障發現到自動完成轉移期間整個叢集是不可用狀態,對於大多數業務無法忍受這情況,因此建議將引數 cluster-require-full-coverage 配置為 no ,當主節點故障時隻影響它負責槽的相關命令執行,不會影響其他主節點的可用性

本人部落格,歡迎來玩

參考

  • 《Redis 開發與運維》
  • https://juejin.im/entry/593a498aac502e006ccd6656
  • https://phachon.com/redis/redis-3.html
  • http://kdf5000.com/2017/04/17/%E5%B8%B8%E8%A7%81%E7%9A%84%E5%87%A0%E7%A7%8DSharding%E7%AD%96%E7%95%A5/