1. 程式人生 > >網禦星雲防火牆CPU使用率100%的解決方案

網禦星雲防火牆CPU使用率100%的解決方案

網禦星雲防火牆CPU使用率100%解決方案

前幾天收到河南某地方性銀行出現的故障:網禦星雲防火牆CPU使用率一直處於100%的狀態,
於是前去現場檢查裝置
發現
1.該防火牆策略做的並不多;
2.該防火牆當前的出入埠流量也並不大;
可以排除防火牆的工作負載過大導致CPU滿載。

3.檢視日誌也只能獲取CPU使用率100%的資訊

回想在出現故障開始到現場檢查的這段時間,收到過幾次現場工程師發來的幾張截圖,在重新翻看記錄的時候發現
這裡寫圖片描述

這裡寫圖片描述
這兩張圖在不同的時間 顯示記憶體也一直保持在58%,心想這是不是效能顯示的這程式有故障,
於是諮詢網禦原廠的一朋友,瞭解到部分裝置出現過此問題,

    由於裝置長時間執行 cpu時間過長 導致變數溢位、cpu利用率計算錯誤、持續保持100%,解決此BUG,需要打補丁。

找到故障原因開始制定實施解決方案:

制定方案:

當前環境是兩臺裝置做的是HA,所以先升級備機,再升級主機

1.初始操作:
a) 備份:儲存並匯出配置。
b) 關閉HA功能。

2.升級備牆:
c) 將備牆斷電關機,並拔掉業務線和心跳線。
d) 將備牆開機,電腦直連備牆,升級補丁包
e) 重啟備牆,將心跳線接回,並開啟HA功能,待HA狀態同步後,將業務線接回。

3.升級主牆:
a) 主牆裝置斷電,備牆此時切換為新的主牆,驗證新的主牆使用者業務是否正常。若使用者業務不正常,需切回原來的主牆。
b) 將原來的主牆心跳線、業務線依次拔掉,並關閉HA功能,電腦直連主牆,打上升級包,並重啟。
c) 將心跳線、業務線依次接回原來的主牆,並開啟HA功能,狀態變為備牆

4、驗證
在HA狀態下檢視系統面板狀態、系統狀態及業務是否正常。

5、退回方案
升級補丁不能逆操作,若業務連通性有故障可將匯出的配置重新匯入。

晚上12點做變更,升級備機之後就可以看到CPU儀表盤恢復正常了

這裡寫圖片描述