1. 程式人生 > >HP-UX MC/SG報錯一例分享

HP-UX MC/SG報錯一例分享

hp-ux mc/sg ha

環境:HPUX 11.31;ServiceGurad A.11.20。2個node:node1,node2;一個package:pkg1.

主機:BL860c i4

故障現象:pkg1可以正常的在兩個node之間切換,但是當其中一個node關機後,pkg1切到node2上只能運行1分鐘左右,之後便會自動failed。

分析過程:

1.檢查了pkg1的log,系統的syslog,均未發現異常。

2.檢查配置在pkg控制文件裏的應用腳本,未發現異常。為了方便排查,暫時將定義在control文件裏的應用腳本註釋掉。

3.註釋掉之後,故障現場仍然存在。肩擦包配置文件,包控制文件,依然沒有什麽發現。

4.檢查集群配置文件,和以往自己做的集群配置文件進行對比,發現客戶的集群配置文件裏多了SUBNET配置和IP_MONITOR配置。懷疑是

此原因,故將其註釋,如下:

#SUBNET 10.73.0.0

# IP_MONITOR OFF

# POLLING_TARGET 10.73.0.1

5.重新check,apply集群配置文件後,故障解決。

總結:經過查證,在集群配置文件裏(一般為cluster.ascii)不需要寫SUBNET參數(在pkg配置文件裏寫入MONITORED_SUBNET即可),也不需要IP_MONITOR參數,如果寫了SUBNET,則一定要把IP_MONITOR 設置為OFF。

對於這種故障,解決方法為:A.註釋掉集群配置文件裏的SUBNET參數和IP_MONITOR參數。2.如果不註釋,在一定要把IP_MONITOR配置為OFF。推薦方法A。IP監控的配置在包配置文件裏可以定義,不用再在集群裏定義。


HP-UX MC/SG報錯一例分享