1. 程式人生 > >Redis 哨兵模式實現主從故障互切換

Redis 哨兵模式實現主從故障互切換

介紹

Redis Sentinel 是一個分散式系統, 你可以在一個架構中執行多個 Sentinel 程序(progress), 這些程序使用流言協議(gossip protocols)來接收關於主伺服器是否下線的資訊, 並使用投票協議(agreement protocols)來決定是否執行自動故障遷移, 以及選擇哪個從伺服器作為新的主伺服器。

雖然 Redis Sentinel 釋出為一個單獨的可執行檔案 redis-sentinel , 但實際上它只是一個執行在特殊模式下的 Redis 伺服器, 你可以在啟動一個普通 Redis 伺服器時通過給定 --sentinel 選項來啟動 Redis Sentinel 。

Sentinel 系統用於管理多個 Redis 伺服器(instance), 該系統執行以下三個任務:

  •  監控(Monitoring): Sentinel 會不斷地檢查你的主伺服器和從伺服器是否運作正常。
  •  提醒(Notification): 當被監控的某個 Redis 伺服器出現問題時, Sentinel 可以通過 API 向管理員或者其他應用程式傳送通知。
  •  自動故障遷移(Automatic failover): 當一個主伺服器不能正常工作時, Sentinel 會開始一次自動故障遷移操作, 它會將失效主伺服器的其中一個從伺服器升級為新的主伺服器, 並讓失效主伺服器的其他從伺服器改為複製新的主伺服器; 當客戶端試圖連線失效的主伺服器時, 叢集也會向客戶端返回新主伺服器的地址, 使得叢集可以使用新主伺服器代替失效伺服器。

redis版本:3.2.11

ip:192.168.137.40

主:6379   ,sentinel:26379

從:6380   ,sentinel:26380

配置

當主宕機了從接替主成為新的主,宕機的主啟動後自動變成了從,其實它和Mysql的雙主模式是一樣的互為主從;redis哨兵需要用到redis-sentinel程式和sentinel.conf配置檔案。

mkdir -p /usr/local/redis
mkdir -p /usr/local/redis/6379
mkdir -p /usr/local/redis/6380
mkdir -p /usr/local/redis/redis_cluster

主配置

 vim redis_6379.conf

daemonize yes
pidfile /usr/local/redis/6379/redis_6379.pid
port 6379
tcp-backlog 128
timeout 0
tcp-keepalive 0
loglevel notice
logfile ""
databases 16
save 900 1    ###save
save 300 10
save 60 10000
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename dump.rdb   ###dbfile
dir "/usr/local/redis/6379"
masterauth "123456"
requirepass "123456"
slave-serve-stale-data yes
slave-read-only yes
repl-diskless-sync no
repl-diskless-sync-delay 5
repl-disable-tcp-nodelay no
slave-priority 100
appendonly yes
appendfilename "appendonly.aof"
appendfsync everysec
no-appendfsync-on-rewrite no
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
aof-load-truncated yes
lua-time-limit 5000
slowlog-log-slower-than 10000
slowlog-max-len 128
latency-monitor-threshold 0
notify-keyspace-events ""
hash-max-ziplist-entries 512
hash-max-ziplist-value 64
list-max-ziplist-entries 512
list-max-ziplist-value 64
set-max-intset-entries 512
zset-max-ziplist-entries 128
zset-max-ziplist-value 64
hll-sparse-max-bytes 3000
activerehashing yes
client-output-buffer-limit normal 0 0 0
client-output-buffer-limit slave 256mb 64mb 60
client-output-buffer-limit pubsub 32mb 8mb 60
hz 10
aof-rewrite-incremental-fsync yes

 vim sentinel_1.conf

 群集檔案配置

port 26379
dir "/usr/local/redis/redis_cluster"
# 守護程序模式
daemonize yes
# 指明日誌檔名
logfile "/usr/local/redis/redis_cluster/sentinel_26379.log"
sentinel monitor mymaster 192.168.137.40 6379 2
sentinel down-after-milliseconds mymaster 5000
sentinel failover-timeout mymaster 18000
sentinel auth-pass mymaster 123456

從配置

 vim redis_6380.conf

daemonize yes
pidfile "/usr/local/redis/6380/redis_6380.pid"
port 6380
tcp-backlog 128
timeout 0
tcp-keepalive 0
loglevel notice
logfile ""
databases 16
save 900 1
save 300 10
save 60 10000
stop-writes-on-bgsave-error yes
rdbcompression yes
rdbchecksum yes
dbfilename "dump.rdb"
dir "/usr/local/redis/6380"
masterauth "123456"
requirepass "123456"
slave-serve-stale-data yes
slave-read-only yes
repl-diskless-sync no
repl-diskless-sync-delay 5
repl-disable-tcp-nodelay no
slave-priority 100
appendonly yes
appendfilename "appendonly.aof"
appendfsync everysec
no-appendfsync-on-rewrite no
auto-aof-rewrite-percentage 100
auto-aof-rewrite-min-size 64mb
aof-load-truncated yes
lua-time-limit 5000
slowlog-log-slower-than 10000
slowlog-max-len 128
latency-monitor-threshold 0
notify-keyspace-events ""
hash-max-ziplist-entries 512
hash-max-ziplist-value 64
list-max-ziplist-entries 512
list-max-ziplist-value 64
set-max-intset-entries 512
zset-max-ziplist-entries 128
zset-max-ziplist-value 64
hll-sparse-max-bytes 3000
activerehashing yes
client-output-buffer-limit normal 0 0 0
client-output-buffer-limit slave 256mb 64mb 60
client-output-buffer-limit pubsub 32mb 8mb 60
hz 10
aof-rewrite-incremental-fsync yes

vim sentinel_2.conf

#sentinel埠
port 26380
#工作路徑,注意路徑不要和主重複
dir "/usr/local/redis_cluster"
# 守護程序模式
daemonize yes
# 指明日誌檔名
logfile "/usr/local/redis_cluster/sentinel_26380.log"
#哨兵監控的master,主從配置一樣,sentinel monitor <master-name> <ip> <redis-port> <quorum>
sentinel monitor mymaster 192.168.137.40 6379 2
# master或slave多長時間(預設30秒)不能使用後標記為s_down狀態。
sentinel down-after-milliseconds mymaster 5000
#若sentinel在該配置值內未能完成failover操作(即故障時master/slave自動切換),則認為本次failover失敗。
sentinel failover-timeout mymaster 18000
#設定master和slaves驗證密碼
sentinel auth-pass mymaster 123456

注意:

1.應用程式連線到哨兵埠,通過指定不同的master名稱連線到具體的主副本。

2.哨兵配置檔案中只需要配置主從複製中的主副本ip和埠即可,當主從進行切換時哨兵會自動修改哨兵配置檔案中的主副本ip為新在主副本ip。

3.一個哨兵配置檔案中可以同時配置監控多個主從複製。

4.單個哨兵就可以用來進行主從故障監控,但是如果只有一個sentinel程序,如果這個程序執行出錯,或者是網路堵塞,那麼將無法實現redis叢集的主備切換(單點問題);<quorum>這個2代表投票數,當2個sentinel認為一個master已經不可用了以後,將會觸發failover,才能真正認為該master已經不可用了。(sentinel叢集中各個sentinel也有互相通訊,通過gossip協議);所以合理的配置應該是同時啟動多個哨兵程序,並且最好是在不同的伺服器中啟動。

5.注意mymaster的需要在整個網路環境都是唯一的,哨兵之間會自動通過mastername去建立關聯關係只要網路環境是相通的。

啟動redis

主從都要啟動

src/redis-server redis.conf

登入到6380建立主從關係

redis-cli -p 6380
slaveof 192.168.137.40 6379

啟動哨兵

主從兩個哨兵都要啟動,還可以通過redis-server方式啟動,例如“redis-server sentinel.conf --sentinel

src/redis-sentinel sentinel.conf

啟動報錯處理

錯誤1:

WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.

兩個解決方法(overcommit_memory)

1.  echo "vm.overcommit_memory=1" > /etc/sysctl.conf  或 vi /etcsysctl.conf , 然後reboot重啟機器

2.  echo 1 > /proc/sys/vm/overcommit_memory  不需要啟機器就生效
overcommit_memory引數說明:
設定記憶體分配策略(可選,根據伺服器的實際情況進行設定)
/proc/sys/vm/overcommit_memory
可選值:0120, 表示核心將檢查是否有足夠的可用記憶體供應用程序使用;如果有足夠的可用記憶體,記憶體申請允許;否則,記憶體申請失敗,並把錯誤返回給應用程序。
1, 表示核心允許分配所有的實體記憶體,而不管當前的記憶體狀態如何。
2, 表示核心允許分配超過所有實體記憶體和交換空間總和的記憶體

注意:redis在dump資料的時候,會fork出一個子程序,理論上child程序所佔用的記憶體和parent是一樣的,比如parent佔用 的記憶體為8G,這個時候也要同樣分配8G的記憶體給child,如果記憶體無法負擔,往往會造成redis伺服器的down機或者IO負載過高,效率下降。所 以這裡比較優化的記憶體分配策略應該設定為 1(表示核心允許分配所有的實體記憶體,而不管當前的記憶體狀態如何)。

這裡又涉及到Overcommit和OOM。

什麼是Overcommit和OOM
在Unix中,當一個使用者程序使用malloc()函式申請記憶體時,假如返回值是NULL,則這個程序知道當前沒有可用記憶體空間,就會做相應的處理工作。許多程序會列印錯誤資訊並退出。

Linux使用另外一種處理方式,它對大部分申請記憶體的請求都回復"yes",以便能跑更多更大的程式。因為申請記憶體後,並不會馬上使用記憶體。這種技術叫做Overcommit。
當記憶體不足時,會發生OOM killer(OOM=out-of-memory)。它會選擇殺死一些程序(使用者態程序,不是核心執行緒),以便釋放記憶體。

Overcommit的策略
Linux下overcommit有三種策略(Documentation/vm/overcommit-accounting):
0. 啟發式策略。合理的overcommit會被接受,不合理的overcommit會被拒絕。
1. 任何overcommit都會被接受。
2. 當系統分配的記憶體超過swap+N%*物理RAM(N%由vm.overcommit_ratio決定)時,會拒絕commit。
overcommit的策略通過vm.overcommit_memory設定。
overcommit的百分比由vm.overcommit_ratio設定。

# echo 2 > /proc/sys/vm/overcommit_memory
# echo 80 > /proc/sys/vm/overcommit_ratio

當oom-killer發生時,linux會選擇殺死哪些程序
選擇程序的函式是oom_badness函式(在mm/oom_kill.c中),該函式會計算每個程序的點數(0~1000)。
點數越高,這個程序越有可能被殺死。
每個程序的點數跟oom_score_adj有關,而且oom_score_adj可以被設定(-1000最低,1000最高)。

錯誤2:
WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.

echo 511 > /proc/sys/net/core/somaxconn

錯誤3:

16433:X 12 Jun 14:52:37.734 * Increased maximum number of open files to 10032 (it was originally set to 1024).

新裝的linux預設只有1024,當負載較大時,會經常出現error: too many open files

ulimit -a:使用可以檢視當前系統的所有限制值

vim /etc/security/limits.conf

在檔案的末尾加上

* soft nofile 65535
* hard nofile 65535
執行su或者重新關閉連線使用者再執行ulimit -a就可以檢視修改後的結果。 

故障切換機制

1. 啟動群集後,群集程式預設會在從庫的redis檔案中加入連線主的配置

# Generated by CONFIG REWRITE
slaveof 192.168.137.40 6379

2.啟動群集之後,群集程式預設會在主從的sentinel.conf檔案中加入群集資訊

主:

port 26379
dir "/usr/local/redis-6379"
# 守護程序模式
daemonize yes
# 指明日誌檔名
logfile "./sentinel.log"
sentinel monitor mymaster 192.168.137.40 6379 1
sentinel down-after-milliseconds mymaster 5000
sentinel failover-timeout mymaster 18000
sentinel auth-pass mymaster 123456
# Generated by CONFIG REWRITE
sentinel config-epoch mymaster 0
sentinel leader-epoch mymaster 1
sentinel known-slave mymaster 192.168.137.40 6380
sentinel known-sentinel mymaster 192.168.137.40 26380 c77c5f64aaad0137a228875e531c7127ceeb5c3f
sentinel current-epoch 1

從:

#sentinel埠
port 26380
#工作路徑
dir "/usr/local/redis-6380"
# 守護程序模式
daemonize yes
# 指明日誌檔名
logfile "./sentinel.log"
#哨兵監控的master,主從配置一樣,在進行主從切換時6379會變成當前的master埠,
sentinel monitor mymaster 192.168.137.40 6379 1
# master或slave多長時間(預設30秒)不能使用後標記為s_down狀態。
sentinel down-after-milliseconds mymaster 5000
#若sentinel在該配置值內未能完成failover操作(即故障時master/slave自動切換),則認為本次failover失敗。
sentinel failover-timeout mymaster 18000
#設定master和slaves驗證密碼
sentinel auth-pass mymaster 123456
#哨兵程式自動新增的部分
# Generated by CONFIG REWRITE
sentinel config-epoch mymaster 0
sentinel leader-epoch mymaster 1
###指明瞭當前群集的從庫的ip和埠,在主從切換時該值會改變
sentinel known-slave mymaster 192.168.137.40 6380
###除了當前的哨兵還有哪些監控的哨兵
sentinel known-sentinel mymaster 192.168.137.40 26379 7a88891a6147e202a53601ca16a3d438e9d55c9d
sentinel current-epoch 1

模擬主故障

[[email protected] redis-6380]# ps -ef|grep redis
root       4171      1  0 14:20 ?        00:00:15 /usr/local/redis-6379/src/redis-server *:6379                          
root       4175      1  0 14:20 ?        00:00:15 /usr/local/redis-6380/src/redis-server *:6380                          
root       4305      1  0 15:28 ?        00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel]                            
root       4306      1  0 15:28 ?        00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel]                            
root       4337   4144  0 15:56 pts/1    00:00:00 grep redis
[[email protected] redis-6380]# kill -9 4171
[[email protected] redis-6380]# ps -ef|grep redis
root       4175      1  0 14:20 ?        00:00:15 /usr/local/redis-6380/src/redis-server *:6380                          
root       4305      1  0 15:28 ?        00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel]                            
root       4306      1  0 15:28 ?        00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel]                            
root       4339   4144  0 15:56 pts/1    00:00:00 grep redis
[[email protected] redis-6380]# 

從哨兵配置檔案中可以看到當前的主庫的已經發生了改變

 從日誌檔案也可以看到當前的主已經從6379轉換成了6380

總結

 redis的哨兵埠26379、26380使用客戶端軟體無法連線,使用程式可以連線,客戶端軟體只能直接連線6379和6380埠。使用哨兵監控當主故障後會自動切換從為主,當主啟動後就變成了從。有看到別人只配置單哨兵26379的這種情況,這種情況無法保證哨兵程式自身的高可用。

備註:

本站點所有隨筆都是原創,歡迎大家轉載;但轉載時必須註明文章來源,且在文章開頭明顯處給明連結。

《歡迎交流討論》

相關推薦

Redis 哨兵模式實現主從故障切換

介紹 Redis Sentinel 是一個分散式系統, 你可以在一個架構中執行多個 Sentinel 程序(progress), 這些程序使用流言協議(gossip protocols)來接收關於主伺服器是否下線的資訊, 並使用投票協議(agreement protocols)來決定是否執行自動故障遷移

三:redis哨兵模式實現主從故障切換2

本篇接著上一篇進行redis哨兵的配置練習實驗,一般經典的哨兵需要3個節點(為什麼是3個節點,不是兩個節點)後面專門寫篇文章來分析這個問題. 可以再用一臺虛擬機器安裝一個redis服務,這臺虛擬機器不需要啟動例項,啟動哨兵就行,我這裡還是用兩臺機器只是測試,生

三:redis哨兵模式實現主從故障切換1

介紹 Redis Sentinel 是一個分散式系統, 你可以在一個架構中執行多個 Sentinel 程序(progress), 這些程序使用流言協議(gossip protocols)來接收關於主伺服器是否下線的資訊, 並使用投票協議(agreement

redis哨兵模式實現主從故障切換

大多數的應用場景是MySQL(主)+Redis(輔),MySQL做為主儲存,Redis用於快取, 加快訪問速度。需要高效能的地方使用Redis,不需要高效能的地方使用MySQL。儲存 資料在MySQL和Redis之間做同步; server1 ,ser

Redis哨兵模式(sentinel)學習總結及部署記錄(主從複製、讀寫分離、主從切換

Redis的叢集方案大致有三種:1)redis cluster叢集方案;2)master/slave主從方案;3)哨兵模式來進行主

兩臺redis做主從+哨兵模式實現vip漂移

一、環境 地址 作業系統 redis埠 哨兵埠 10.24.43.6 centos6.x 6380 6381 10.24.43.7 centos6.x

Redis採用Sentinel實現主從切換

今天研究了一下Sentinel,實現了Redis的主從切換,下面簡單介紹一下。 以下是我使用的兩臺機器,沒有多餘的機器,所以把sentinel部署在了166上面,最好是三臺機器一起測試,效果會更明顯。 master:192.168.11.165 port:2

Spring Boot 入門(十):整合Redis哨兵模式實現Mybatis二級快取

本片文章續《Spring Boot 入門(九):整合Quartz定時任務》。本文主要基於redis實現了mybatis二級快取。較redis快取,mybaits自帶快取存在缺點(自行谷歌)。本文是基於docker安裝redis主從模式。 1.redis安裝 (1)首先安裝redis叢集模式,建立redis目錄

Redis哨兵模式(Sentinel)的搭建

事件 配置 切換 通過 發送消息 無法訪問 etc 一個 pub 一、Redis的哨兵模式 Sentinel是Redis官方提供的一種高可用方案(除了Sentinel,Redis Cluster是另一種方案),它可以自動監控Redis master/slave的

Redis 哨兵模式Redis集群

redis第1章 Redis哨兵模式:1.1 sentinel的功能:1. 監控,sentinel會不斷的檢查你的主服務器和從服務器是否運行正常2. 提醒.當被監控的某個redis服務器出現問題時,sentinel可以通過API向管理員或者其他應用程序發送通知3. 自動故障遷移1

一圖帶你了解redis哨兵模式

http TP 技術分享 哨兵 了解 pan tps aid 百度網盤 百度網盤 https://pan.baidu.com/s/10JmcwEfCu-OKy4Yapkjxwg一圖帶你了解redis哨兵模式

redis哨兵模式安裝

  環境 centos 7.4 單機模式 將  redis-3.0.0.rar.gz 上傳到 /usr/local/src/ 進入 存放壓縮包的目錄 cd  /usr/local/src/ 對壓縮包進行解壓 tar -zxvf redis-3

6.redis哨兵模式

redis哨兵模式 Author:SimpleWu 簡介 Redis-Sentinel是官方推薦的高可用解決方案,當redis在做master-slave的高可用方案時,假如master宕機了,redis本身(以及其很多客戶端)都沒有實現自動進行主備切換,而redis-sentinel本身也是

redis哨兵模式

設定的哨兵模式和其他redis伺服器相同,只不過不能做儲存等處理哨兵也是 Redis 伺服器,只是它與我們平時提到的 Redis 伺服器職能不同,哨兵負責監視普通的 Redis 伺服器,提高一個伺服器叢集的健壯和可靠性。哨兵和普通的 Redis 伺服器所用的是同一套伺服器框架

Redis 哨兵模式的理論(轉載)

Sentinel是Redis的高可用性解決方案,本文主要介紹Sentinel的初始化過程及其與一般Redis伺服器的區別。並說明Sentinel監視伺服器的方法和原理,說明Sentinel如何判斷一個伺服器是否線上,並介紹故障轉移過程。 I、上帝視角看Sentinel

Redis 哨兵模式的原始碼(轉載)

建議閱讀: 1、Sentinel的理論部分見: I、上帝視角 1、Sentinel也是Redis伺服器,只是與普通伺服器職責不同,其負責監視Redis伺服器,以提高伺服器叢集的可靠性。Sentinel與普通伺服器共用一套框架(網路框架,底層資料結構,訂閱與釋出機制),但又

windows單機 redis哨兵模式

windos下,redis哨兵模式配置和spring boot 讀取使用:     2、下載後解壓資料夾目錄可以看到內容如下:        3、複製三個redis.windows.conf檔案,分別命

Redis 哨兵模式詳解

1、Sentinel 哨兵Sentinel(哨兵)是Redis的高可用性解決方案:由一個或多個Sentinel例項組成的Sentinel系統可以監視任意多個主伺服器,以及這些主伺服器屬下的所有從伺服器,並在被監視的主伺服器進入下線狀態時,自動將下線主伺服器屬下的某個從伺服器升

Redis-3.2.1主從故障測試例項 及出現sdown後沒有出現try-failover 或者出現 failover-abort-not-elected 解決方法

Redis-3.2.1主從故障測試例項 配置檔案如下: Rdis 例項1配置檔案 r1.conf :(預設為master) port 6379 masterauth mypwd requirepass mypwd protected-mode yes bind 192.1

Spring boot 配置 Redis哨兵模式

Spring官方提供了Redis哨兵的配置,這篇文章主要指導讀者手動配置Redis哨兵模式 ps: 參考我的文章<<Spring boot 配置 Redis叢集模式>>可將該配置改成按資原始檔載入 以下是我搜集並整理出來的一個config