keepalived實現服務高可用

阿新 • • 發佈：2020-07-27

第1章 keepalived服務說明

1.1 keepalived是什麼？

　　Keepalived軟體起初是專為LVS負載均衡軟體設計的，用來管理並監控LVS集群系統中各個服務節點的狀態，後來又加入了可以實現高可用的VRRP功能。因此，Keepalived除了能夠管理LVS軟體外，還可以作為其他服務（例如：Nginx、Haproxy、MySQL等）的高可用解決方案軟體。

　　Keepalived軟體主要是通過VRRP協議實現高可用功能的。VRRP是Virtual Router RedundancyProtocol(虛擬路由器冗餘協議）的縮寫，VRRP出現的目的就是為了解決靜態路由單點故障問題的，它能夠保證當個別節點宕機時，整個網路可以不間斷地執行。

　　所以，Keepalived 一方面具有配置管理LVS的功能，同時還具有對LVS下面節點進行健康檢查的功能，另一方面也可實現系統網路服務的高可用功能。

　　keepalived官網http://www.keepalived.org

1.2 keepalived服務的三個重要功能

　　管理LVS負載均衡軟體

　　實現LVS叢集節點的健康檢查中

　　作為系統網路服務的高可用性（failover）

1.3 Keepalived高可用故障切換轉移原理

　　Keepalived高可用服務對之間的故障切換轉移，是通過 VRRP (Virtual Router Redundancy Protocol ,虛擬路由器冗餘協議）來實現的。

　　在 Keepalived服務正常工作時，主 Master節點會不斷地向備節點發送（多播的方式）心跳訊息，用以告訴備Backup節點自己還活看，當主 Master節點發生故障時，就無法傳送心跳訊息，備節點也就因此無法繼續檢測到來自主 Master節點的心跳了，於是呼叫自身的接管程式，接管主Master節點的 IP資源及服務。而當主 Master節點恢復時，備Backup節點又會釋放主節點故障時自身接管的IP資源及服務，恢復到原來的備用角色。

　　那麼，什麼是VRRP呢？

　　VRRP ,全稱 Virtual Router Redundancy Protocol ,中文名為虛擬路由冗餘協議，VRRP的出現就是為了解決靜態踣甶的單點故障問題，VRRP是通過一種競選機制來將路由的任務交給某臺VRRP路由器的。

1.4 keepalived 原理

1.4.1keepalived高可用架構示意圖

1.4.2 文字，表述

Keepalived的工作原理：

　　Keepalived高可用對之間是通過VRRP通訊的，因此，我們從 VRRP開始瞭解起：

　　　　1) VRRP,全稱 Virtual Router Redundancy Protocol,中文名為虛擬路由冗餘協議，VRRP的出現是為了解決靜態路由的單點故障。

　　　　2) VRRP是通過一種竟選協議機制來將路由任務交給某臺 VRRP路由器的。

　　　　3) VRRP用 IP多播的方式（預設多播地址（224.0_0.18))實現高可用對之間通訊。

　　　　4) 工作時主節點發包，備節點接包，當備節點接收不到主節點發的資料包的時候，就啟動接管程式接管主節點的開源。備節點可以有多個，通過優先順序競選，但一般 Keepalived系統運維工作中都是一對。

　　　　5) VRRP使用了加密協議加密資料，但Keepalived官方目前還是推薦用明文的方式配置認證型別和密碼。

　　介紹完 VRRP,接下來我再介紹一下 Keepalived服務的工作原理：

　　Keepalived高可用對之間是通過 VRRP進行通訊的， VRRP是遑過競選機制來確定主備的，主的優先順序高於備，因此，工作時主會優先獲得所有的資源，備節點處於等待狀態，當主掛了的時候，備節點就會接管主節點的資源，然後頂替主節點對外提供服務。

　　在 Keepalived服務對之間，只有作為主的伺服器會一直髮送 VRRP廣播包,告訴備它還活著，此時備不會槍佔主，當主不可用時，即備監聽不到主傳送的廣播包時，就會啟動相關服務接管資源，保證業務的連續性.接管速度最快可以小於1秒。

第2章 keepalived軟體使用

2.1 軟體的部署

2.1.1 第一個里程碑 keepalived軟體安裝

yum install keepalived -y

/etc/keepalived
/etc/keepalived/keepalived.conf     #keepalived服務主配置檔案
/etc/rc.d/init.d/keepalived         #服務啟動指令碼
/etc/sysconfig/keepalived
/usr/bin/genhash
/usr/libexec/keepalived
/usr/sbin/keepalived

第二個里程碑：進行預設配置測試

2.1.2 配置檔案說明

1-13行表示全域性配置

 global_defs {    #全域性配置
    notification_email {   定義報警郵件地址
      [email protected]
      [email protected]
      [email protected]
    } 
    notification_email_from [email protected]  #定義傳送郵件的地址
    smtp_server 192.168.200.1   #郵箱伺服器 
    smtp_connect_timeout 30      #定義超時時間
    router_id LVS_DEVEL        #定義路由標識資訊，相同區域網唯一
 }

15-30行虛擬ip配置 brrp

vrrp_instance VI_1 {   #定義例項
    state MASTER         #狀態引數 master/backup 只是說明
    interface eth0       #虛IP地址放置的網絡卡位置
    virtual_router_id 51 #同一家族要一直，同一個叢集id一致
    priority 100         # 優先順序決定是主還是備    越大越優先
    advert_int 1        #主備通訊時間間隔
    authentication {     # ↓
        auth_type PASS    #↓
        auth_pass 1111    #認證
    }                        #↑ 
    virtual_ipaddress {  #↓
        192.168.200.16    裝置之間使用的虛擬ip地址
        192.168.200.17
        192.168.200.18
    }
}

配置管理LVS：

　　關於 LVS 詳情參考http://www.cnblogs.com/clsn/p/7920637.html#_label7

2.1.3 最終配置檔案

主負載均衡伺服器配置

[root@lb01 conf]# cat  /etc/keepalived/keepalived.conf 
! Configuration File for keepalived

global_defs {
   router_id lb01
}

vrrp_instance VI_1 {
    state MASTER
    interface eth0
    virtual_router_id 51
    priority 150
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        10.0.0.3
    }
}

備負載均衡伺服器配置

[root@lb02 ~]# cat /etc/keepalived/keepalived.conf 
! Configuration File for keepalived

global_defs {
   router_id lb02
}

vrrp_instance VI_1 {
    state BACKUP
    interface eth0
    virtual_router_id 51
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
     10.0.0.3
    }
}

2.1.4 啟動keepalived

[root@lb02 ~]# /etc/init.d/keepalived start
Starting keepalived:                                       [  OK  ]

2.1.5 【說明】在進行訪問測試之前要保證後端的節點都能夠單獨的訪問。

測試連通性. 後端節點

[root@lb01 conf]# curl -H host:www.etiantian.org  10.0.0.8
web01 www
[root@lb01 conf]# curl -H host:www.etiantian.org  10.0.0.7
web02 www
[root@lb01 conf]# curl -H host:www.etiantian.org  10.0.0.9
web03 www
[root@lb01 conf]# curl -H host:bbs.etiantian.org  10.0.0.9
web03 bbs
[root@lb01 conf]# curl -H host:bbs.etiantian.org  10.0.0.8
web01 bbs
[root@lb01 conf]# curl -H host:bbs.etiantian.org  10.0.0.7
web02 bbs

2.1.6 檢視虛擬ip狀態

[root@lb01 conf]# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN 
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 00:0c:29:90:7f:0d brd ff:ff:ff:ff:ff:ff
    inet 10.0.0.5/24 brd 10.0.0.255 scope global eth0
    inet 10.0.0.3/24 scope global secondary eth0:1
    inet6 fe80::20c:29ff:fe90:7f0d/64 scope link 
       valid_lft forever preferred_lft forever
3: eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 00:0c:29:90:7f:17 brd ff:ff:ff:ff:ff:ff
    inet 172.16.1.5/24 brd 172.16.1.255 scope global eth1
    inet6 fe80::20c:29ff:fe90:7f17/64 scope link 
       valid_lft forever preferred_lft forever

2.1.7 【總結】配置檔案修改

Keepalived主備配置檔案區別：

　　01. router_id 資訊不一致

　　02. state 狀態描述資訊不一致

　　03. priority 主備競選優先順序數值不一致

2.2 腦裂

　　在高可用（HA）系統中，當聯絡2個節點的“心跳線”斷開時，本來為一整體、動作協調的HA系統，就分裂成為2個獨立的個體。由於相互失去了聯絡，都以為是對方出了故障。兩個節點上的HA軟體像“裂腦人”一樣，爭搶“共享資源”、爭起“應用服務”，就會發生嚴重後果——或者共享資源被瓜分、2邊“服務”都起不來了；或者2邊“服務”都起來了，但同時讀寫“共享儲存”，導致資料損壞（常見如資料庫輪詢著的聯機日誌出錯）。

　　對付HA系統“裂腦”的對策，目前達成共識的的大概有以下幾條：

　　　　1）新增冗餘的心跳線，例如：雙線條線（心跳線也HA），儘量減少“裂腦”發生機率；

　　　　2）啟用磁碟鎖。正在服務一方鎖住共享磁碟，“裂腦”發生時，讓對方完全“搶不走”共享磁碟資源。但使用鎖磁碟也會有一個不小的問題，如果佔用共享盤的一方不主動“解鎖”，另一方就永遠得不到共享磁碟。現實中假如服務節點突然宕機或崩潰，就不可能執行解鎖命令。後備節點也就接管不了共享資源和應用服務。於是有人在HA中設計了“智慧”鎖。即：正在服務的一方只在發現心跳線全部斷開（察覺不到對端）時才啟用磁碟鎖。平時就不上鎖了。

　　　　3）設定仲裁機制。例如設定參考IP（如閘道器IP），當心跳線完全斷開時，2個節點都各自ping一下參考IP，不通則表明斷點就出在本端。不僅“心跳”、還兼對外“服務”的本端網路鏈路斷了，即使啟動（或繼續）應用服務也沒有用了，那就主動放棄競爭，讓能夠ping通參考IP的一端去起服務。更保險一些，ping不通參考IP的一方乾脆就自我重啟，以徹底釋放有可能還佔用著的那些共享資源。

2.2.1 腦裂產生的原因

一般來說，裂腦的發生，有以下幾種原因：

keepalived實現服務高可用

第1章 keepalived服務說明

1.1 keepalived是什麼？

1.2 keepalived服務的三個重要功能

1.3 Keepalived高可用故障切換轉移原理

1.4 keepalived 原理

1.4.1keepalived高可用架構示意圖

1.4.2 文字，表述

第2章 keepalived軟體使用

2.1 軟體的部署

2.1.1 第一個里程碑 keepalived軟體安裝

2.1.2 配置檔案說明

2.1.3 最終配置檔案

2.1.4 啟動keepalived

2.1.5 【說明】在進行訪問測試之前要保證後端的節點都能夠單獨的訪問。

2.1.6 檢視虛擬ip狀態

2.1.7 【總結】配置檔案修改

2.2 腦裂

2.2.1 腦裂產生的原因

keepalived實現服務高可用

centos nginx重啟_Nginx+Keepalived 實現 Nginx 高可用負載均衡

微服務高可用利器——Hystrix熔斷降級原理&實踐總結

MySQL資料庫實現MMM高可用群集架構

搭建keepalived叢集+nginx高可用

HAproxy+Keepalived負載均衡-高可用web站

秒級故障切換！用MHA輕鬆實現MySQL高可用（二）

keepalived部署+nginx高可用

大資料環境下hive使用HAproxy+keepalived+vip搭建高可用負載均衡叢集

Centos 7.6基於MariaDB-server-10.2.32-1.el7 版本實現MHA高可用

mysql+keepalived+orchestrator 構建高可用mysql

基於LVS、Nginx和Redis的多服務高可用負載均衡叢集方案設計與實踐

HBase服務高可用之路的探索

keepalived配置nfs高可用

keepalived+haproxy部署高可用k8s叢集（containerd）

hive通過nginx實現HA高可用

Nginx+keepalived負載均衡高可用

Keepalived+Nginx+Tomcat 實現高可用Web叢集

Haproxy/LVS負載均衡實現+keepalived實現高可用

基於keepalived配置資料庫主從實現高可用

keepalived實現服務高可用

第1章 keepalived服務說明

1.1 keepalived是什麼？

1.2 keepalived服務的三個重要功能

1.3 Keepalived高可用故障切換轉移原理

1.4 keepalived 原理

1.4.1keepalived高可用架構示意圖

1.4.2 文字，表述

第2章 keepalived軟體使用

2.1 軟體的部署

2.1.1 第一個里程碑 keepalived軟體安裝

2.1.2 配置檔案說明

2.1.3 最終配置檔案

2.1.4 啟動keepalived

2.1.5 【說明】在進行訪問測試之前要保證後端的節點都能夠單獨的訪問。

2.1.6 檢視虛擬ip狀態

2.1.7 【總結】配置檔案修改

2.2 腦裂

2.2.1 腦裂產生的原因

相關推薦