高可用(HA)叢集原理概述
-
99% 一年宕機時間不超過4天
-
99.9% 一年宕機時間不超過10小時
-
99.99% 一年宕機時間不超過1小時
-
99.999% 一年宕機時間不超過6分鐘
-
PE :定義資源轉移的一整套轉移方式,但只做策略,並不親自來參加資源轉移的過程,而是讓TE來執行自己的策略。
-
TE : 就是來執行PE做出的策略的並且只有DC上才執行PE和TE。
-
heartbeat (v1,v2,v3)
-
corosync
-
cman
-
keepalived
-
ultramokey
-
haresource,crm (heartbeat v1/v2)
-
pacemaker (heartbeat v3/corosync)
-
rgmanager (cman)
-
heartbeat v2+haresource(或crm) (一般常用於CentOS 5.X)
-
heartbeat v3+pacemaker (一般常用於CentOS 6.X)
-
corosync+pacemaker (現在最常用的組合)
-
cman + rgmanager (紅帽叢集套件中的元件,還包括gfs2,clvm)
-
keepalived+lvs (常用於lvs的高可用)
-
節點級別:這種就叫STONITH,直接把對方的電源給切斷,一般這種主機都是連線到電源交換機上的。
-
資源級別:同樣需要依賴一些硬體裝置來完成。比如節點通過光纖交換機連線到共享儲存,通過把需要踢除出去的節點的光纖介面遮蔽來實現資源隔離。
-
ping node:兩個節點的模式下,一旦其中一個節點發生故障,發生叢集分隔以後,無法判定哪個節點不正常,但工作正常的節點一定是可以連到網際網路,故正常的節點是可以跟前端路由通訊,所以可以把前端路由當成第三個節點,如果可以ping通,那就說明自己是正常的,可以將對方隔離掉。
-
qdisk: RHCS不是使用ping節點來判斷,而是使用一個共享儲存的裝置,節點按照心跳資訊頻率每隔一個資訊頻率時間就往磁盤裡寫一個數據位,如果裝置每隔一個心跳時間間隔就更新一次資料位,就說明這個裝置處於活動狀態的,可以將對方隔離掉。