Redis哨兵實現原理

阿新 • • 發佈：2021-11-17

本文內容出自李子驊的《Redis入門指南》

一、讀取配置檔案內容

一個哨兵程序啟動時會讀取配置檔案的內容，通過如下的配置找出需要監控的主資料庫:
sentinel monitor master-name ip redis-port quorum

master-name是一個由大小寫字母、數字和'.'，'-'，'_'組成的主資料庫的名字。
因為考慮到故障恢復後當前監控的系統的主資料庫的地址和埠會產生變化，所以哨兵提供了命令可以通過主資料庫的名字獲取當前系統的主資料庫的地址和埠號。
ip表示當前系統中主資料庫的地址，而redis-port則表示埠號。
quorum用來表示執行故障恢復操作前至少需要幾個哨兵節點同意，作用可檢視下文。

一個哨兵節點可以同時監控多個Redis主從系統，只需要提供多個sentinel monitor配置即可，例如

sentinel moni tor mymaster 127.0.0.1 6379 2
sentinel monitor othermaater 192.168.1.3 6380 4

同時多個哨兵節點也可以同時監控同一個 Redis主從系統，從而形成網狀結構。

配置檔案中還可以定義其他監控相關的引數，每個配置選項都包含主資料庫的名字使得監控不同主資料庫時可以使用不同的配置引數。例如:

sentinel down-after-milliseconds mymaster 60000
sentinel down-after-milliseconds othermaster 10000

上面的兩行配置分別配置了mymaster和othermaster的down-after-milliseconds選項分別為60000和10000。作用可檢視下文

二、建立連線

哨兵啟動後，會與要監控的主資料庫建立兩條連線，這兩個連線的建立方式與普通的Redis客戶端無異。

其中一條連線用來訂閱該主資料的sentinel:he11o頻道以獲取其他同樣監控該資料庫的哨兵節點的資訊
使用另外一條連線來定期向主資料庫傳送INFo等命令來獲取主資料庫本身的資訊。

之所以哨兵會使用另一條連線傳送這些命令，是因為當客戶端的連線進入訂閱模式時就不能再執行其他命令了

和主資料庫的連線建立完成後，哨兵會定時執行下面3個操作。

每10秒哨兵會向主資料庫和從資料庫傳送INFO命令。
每2秒哨兵會向主資料庫和從資料庫的sentinel:he11o頻道傳送自己的資訊。
每1秒哨兵會向主資料庫、從資料庫和其他哨兵節點發送PING命令

這3個操作貫穿哨兵程序的整個生命週期中，非常重要，可以說了解了這3個操作的意義就能夠了解哨兵工作原理的一半內容了。

三、哨兵的三個定期操作

傳送INFO命令使得哨兵可以獲得當前資料庫的相關資訊(包括執行ID、複製資訊等)從而實現新節點的自動發現。

前面說配置哨兵監控Redis主從系統時只需要指定主資料庫的資訊即可
因為哨兵正是藉助NFo命令來獲取所有複製該主資料庫的從資料庫資訊的。啟動後，哨兵向主資料庫傳送INFO命令，通過解析返回結果來得知從資料庫列表，而後對每個從資料庫同樣建立兩個連線，兩個連線的作用和前文介紹的與主資料庫建立的兩個連線完全一致。

在此之後，哨兵會每10秒定時向已知的所有主從資料庫傳送INFO命令來獲取資訊更新並進行相應操作，比如
- 對新增的從資料庫建立連線並加入監控列表
- 對主從資料庫的角色變化(由故障恢復操作引起)進行資訊更新等
接下來哨兵向主從資料庫的sentinel:he11o頻道傳送資訊來與同樣監控該資料庫的哨兵分享自己的資訊。
- 傳送的訊息內容為:
  <哨兵的地址>，<哨兵的埠>，<哨兵的執行ID>，<哨肖兵的配置版本>，<主資料庫的名字>，
  <主資料庫的地址>，<主資料庫的埠>，<主資料庫的配置版本>
  可以看到訊息包括的哨兵的基本資訊，以及其監控的主資料庫的資訊
- 哨兵會訂閱每個其監控的資料庫的sentinel:he11o頻道，所以當其他哨兵收到訊息後，會判斷髮訊息的哨兵是不是新發現的哨兵。如果是則將其加入已發現的哨兵列表中並建立一個到其的連線(與資料庫不同，哨兵與哨兵之間只會建立一條連線用來發送命令，而不需要建立另外一條連線來訂閱頻道，因為哨兵只需要訂閱資料庫的頻道即可實現自動發現其他哨兵)。同時哨兵會判斷資訊中主資料庫的配置版本，如果該版本比當前記錄的主資料庫的版本高，則更新主資料庫的資料。
實現了自動發現從資料庫和其他哨兵節點後，哨兵要做的就是定時監控和節點有沒有停止服務。這是通過每隔一定時間向這些節點發送PING命令實現的。
時間間隔與down-after-milliseconds選項有關
- 當down-after-milliseconds的值小於1秒時，哨兵會每隔down-after-milliseconds指定的時間傳送一次PING命令，
- 當down-after-milliseconds的值大於1秒時，哨兵會每隔1秒傳送一次PING命令
當超過down-after-milliseconds選項指定時間後，如果被PING的資料庫或節點仍然未進行回覆，則哨兵認為其主觀下線(subjectively down)。主觀下線表示從當前的哨兵程序看來，該節點已經下線。

如果該節點是主資料庫，則哨兵會進一步判斷是否需要對其進行故障恢復：

哨兵傳送SENTINEL is-master-down-by-addr命令詢問其他哨兵節點以瞭解他們是否也認為該主資料庫主觀下線，如果達到指定數量時，哨兵會認為其客觀下線(objectively down)，並選舉領頭的哨兵節點對主從系統發起故障恢復。
這個指定數量即為前文介紹的quorum引數，只有當至少quorum個Sentinel節點(包括當前節點)認為該主資料庫主觀下線時，當前哨兵節點才會認為該主資料庫客觀下線。

四、選舉領頭哨兵步驟

雖然當前哨兵節點發現了主資料庫客觀下線，需要故障恢復，但是故障恢復需要由領頭的哨兵來完成，這樣可以保證同一時間只有一個哨兵節點來執行故障恢復。

選舉領頭哨兵的過程使用了Raft演算法，具體過程如下。

發現主資料庫客觀下線的哨兵節點(下面稱作A)向每個哨兵節點發送命令，要求對方選自己成為領頭哨兵.
如果目標哨兵節點沒有選過其他人，則會同意將A設定成領頭哨兵.
如果A發現有超過半數且超過quorum引數值的哨兵節點同意選自己成為領頭哨兵，則A成功稱為領頭哨兵。
當有多個哨兵節點同時參選領頭哨兵，則會出現沒有任何節點當選的可能。此時每個參選節點將等待一個隨機時間重新發起參選請求，進行下一輪選舉，直到選舉成功。

具體過程可以參考Raft演算法的過程http://raftconsensus.github.io/。因為要成為領頭哨兵必須有超過半數的哨兵節點支援，所以每次選舉最多隻會選出一個領頭哨兵。

選出領頭哨兵後，領頭哨兵將會開始對主資料庫進行故障恢復。

五、故障恢復

首先領頭哨兵將從停止服務的主資料庫的從資料庫中挑選一個來充當新的主資料庫。
挑選的依據如下。
1. 所有線上的從資料庫中，選擇優先順序最高的從資料庫。優先順序可以通過slave-priority選項來設定。
2. 如果有多個最高優先順序的從資料庫，則複製的命令偏移量越大(即複製越完整)越優先。命令偏移量可參考redis的增量複製
3. 如果以上條件都一樣，則選擇執行ID較小的從資料庫。
選出一個從資料庫後，領頭哨兵將向從資料庫傳送SLAVEOF NO ONE命令使其升格為主資料庫。領頭哨兵向其他從資料庫傳送SLAVEOF命令來使其成為新主資料庫的從資料庫。
最後一步則是更新內部的記錄，將已經停止服務的舊的主資料庫更新為新的主資料庫的從資料庫，使得當其恢復服務時自動以從資料庫的身份繼續服務。

Redis哨兵實現原理

本文內容出自李子驊的《Redis入門指南》一、讀取配置檔案內容一個哨兵程序啟動時會讀取配置檔案的內容，通過如下的配置找出需要監控的主資料庫:

redis哨兵實現

原理：基於一主兩從架構實現哨兵哨兵的前提是已經實現了一個redis的主從複製的執行環境，從而實現一個一主兩從基於哨兵的高可用redis架構注意: master 的配置檔案中masterauth 和slave 都必須

Redis哨兵、複製、叢集的設計原理，以及區別

談到Redis伺服器的高可用，如何保證備份的機器是原始伺服器的完整備份呢？這時候就需要哨兵和複製。

Redis主從複製的配置和實現原理

Redis的持久化功能在一定程度上保證了資料的安全性，即便是伺服器宕機的情況下，也可以保證資料的丟失非常少。通常，為了避免服務的單點故障，會把資料複製到多個副本放在不同的伺服器上，且這些擁有資料副本的伺服器

Redis Sentinel實現哨兵模式搭建小結

Redis哨兵模式，用現在流行的話可以說就是一個“哨兵機器人”，給“哨兵機器人”進行相應的配置之後，這個\"機器人\"可以7*24小時工作，它能能夠自動幫助你做一些事情，如監控，提醒，自動處理故障等。

SpringBoot結合Redis哨兵模式的實現示例

Redis哨兵模式 Redis Sentinel介紹 Redis Sentinel是Redis高可用的實現方案。Sentinel是一個管理多個Redis例項的工具，它可以實現對Redis的監控、通知、自動故障轉移。

單機redis分散式鎖實現原理解析

最近我們有個服務經常出現儲存的資料出現重複，首先上一個系統流程圖：使用者通過http請求可以通知任務中心結束掉自己傳送的任務，這時候任務中心會通過MQ通知結束服務去結束任務儲存資料，由於任務結束資料計算儲

redis分散式鎖原理與實現

分散式鎖原理分散式鎖，是控制分散式系統之間同步訪問共享資源的一種方式。在分散式系統中，常常需要協調他們的動作。如果不同的系統或是同一個系統的不同主機之間共享了一個或一組資源，那麼訪問這些資源的時候，往

Redis事務的實現原理

Redis通過MULTI、EXEC、WATCH、DISCARD等命令來實現事務功能。主要有以下三個階段：

PHP+Redis連結串列解決高併發下商品超賣問題(實現原理及步驟)

上一篇文章聊了一下使用Redis事務來解決高併發商品超賣問題，今天我們來聊一下使用Redis連結串列來解決高併發商品超賣問題。

《Redis核心原理與實戰》學習筆記3——字串使用與內部實現原理

一、簡介 Redis最常用的資料型別有5種，分別是：字串型別、列表型別、雜湊表型別、集合型別、有序集合型別。其中，最常用的是字串型別。

《Redis核心原理與實戰》學習筆記6——集合使用與內部實現原理

一、簡介集合型別 (Set) 是一個無序並唯一的鍵值集合。集合與列表的區別：列表可以儲存重複元素，集合只能儲存非重複元素；

Redis 哨兵機制與實現

#1.配置sentinel配置檔案 1.1 從redis安裝包複製配置檔案到redis的目錄 cp sentinel.conf /usr/local/redis/

Redis分散式鎖的使用和實現原理詳解

模擬一個電商裡面下單減庫存的場景。 1.首先在redis里加入商品庫存數量。 2.新建一個Spring Boot專案，在pom裡面引入相關的依賴。

5.Redis詳解（五）------ redis的五大資料型別實現原理

前面兩篇部落格，第一篇介紹了五大資料型別的基本用法，第二篇介紹了Redis底層的六種資料結構。在Redis中，並沒有直接使用這些資料結構來實現鍵值對資料庫，而是基於這些資料結構建立了一個物件系統，這些物件系統也

redis分散式鎖如何實現原理

分散式鎖，是控制分散式系統之間同步訪問共享資源的一種方式。在分散式系統中，常常需要協調他們的動作。如果不同的系統或是同一個系統的不同主機之間共享了一個或一組資源，那麼訪問這些資源的時候，往往需要互斥

Redis之AOF重寫及其實現原理

AOF 重寫 AOF 檔案重寫的實現AOF重寫功能的實現原理AOF後臺重寫使用子程序進行AOF重寫的問題如何修正效果完成AOF重寫之後觸發AOF後臺重寫的條件總結ref

高效能的Redis之物件底層實現原理詳解

物件在前面的數個章節裡，我們陸續介紹了 Redis 用到的所有主要資料結構，比如簡單動態字串（SDS）、雙端連結串列、字典、壓縮列表、整數集合，等等。

關於Redis主從節點資料過期一致性的思考，實現原理分析

關於Redis主從節點資料過期一致性的思考，實現原理分析個人基本情況：首先介紹一下自己的個人基本情況，某專科學校畢業，計算機技術與應用專業，有過2年的工作經驗，畢業以後一直想要進入一線網際網路大廠工作，

Redis學習之5種資料型別操作、實現原理及應用場景

Redis可以儲存可以儲存鍵與5種不同資料結構型別之間的對映。五種資料型別為：STRING(字串)、LIST(列表)、SET(集合)、HASH(雜湊)、ZSET(有序集合)。

Redis哨兵實現原理

一、讀取配置檔案內容

二、建立連線

三、哨兵的三個定期操作

四、選舉領頭哨兵步驟

五、故障恢復

相關推薦