HP-UX MC/SG報錯一例分享
阿新 • • 發佈:2017-12-28
hp-ux mc/sg ha 環境:HPUX 11.31;ServiceGurad A.11.20。2個node:node1,node2;一個package:pkg1.
主機:BL860c i4
故障現象:pkg1可以正常的在兩個node之間切換,但是當其中一個node關機後,pkg1切到node2上只能運行1分鐘左右,之後便會自動failed。
分析過程:
1.檢查了pkg1的log,系統的syslog,均未發現異常。
2.檢查配置在pkg控制文件裏的應用腳本,未發現異常。為了方便排查,暫時將定義在control文件裏的應用腳本註釋掉。
3.註釋掉之後,故障現場仍然存在。肩擦包配置文件,包控制文件,依然沒有什麽發現。
4.檢查集群配置文件,和以往自己做的集群配置文件進行對比,發現客戶的集群配置文件裏多了SUBNET配置和IP_MONITOR配置。懷疑是
此原因,故將其註釋,如下:
#SUBNET 10.73.0.0
# IP_MONITOR OFF
# POLLING_TARGET 10.73.0.1
5.重新check,apply集群配置文件後,故障解決。
總結:經過查證,在集群配置文件裏(一般為cluster.ascii)不需要寫SUBNET參數(在pkg配置文件裏寫入MONITORED_SUBNET即可),也不需要IP_MONITOR參數,如果寫了SUBNET,則一定要把IP_MONITOR 設置為OFF。
對於這種故障,解決方法為:A.註釋掉集群配置文件裏的SUBNET參數和IP_MONITOR參數。2.如果不註釋,在一定要把IP_MONITOR配置為OFF。推薦方法A。IP監控的配置在包配置文件裏可以定義,不用再在集群裏定義。
HP-UX MC/SG報錯一例分享