50、【華為HCIE-Storage】--存儲維護與故障處理
以下部分內容來網絡,部分自華為存儲官方教材
具體教材內容請移步華為存儲官網進行教材下載
網絡引用內容無法找到原創,如有侵權請通知
------------------------------------重要說明------------------------------------
1.Toolkit
① store
在第一次安裝OceanStor Toolkit工具箱後, 您需要輸入用戶名和密碼進行身份驗證(用戶名和密碼是華為企業業務技術支持網站上的賬號), 以此來激活工具Store。 並且您可以通過工具Store將已安裝的工具導出到本地, 也可以將本地下載好的工具導入到工具Store中。
1. 功能導航欄:通過此導航欄可以選擇功能類別。
2. 工具篩選條件: “ 待升級” , “ 未安裝” , “ 最新” 。
3. 單擊“ 刷新” , 會根據篩選條件獲取指定的工具列表。
4. 對於未安裝的工具, 可以單擊“ 安裝” 安裝該工具。
5. 單擊“ 詳情” , 查看此工具的詳情。
6. 單擊“ 反饋” , 反饋信息。
7. 對於已安裝的工具, 可以單擊“ 卸載” 卸載此工具。
8. 對於已安裝的工具, 如果技術支持網站上有對應的新版本, 則可以單擊“ 升級” 升級該工具。
9. 單擊“ 導出工具” , 將工具Store中已安裝的工具導出到本地。
10.單擊“ 導入工具” , 可以將從Toolkit工具箱導出到本地的工具包或從技術支持網站下載到本地的工具包導入到Toolkit工具箱中。 說明如果 該工具有對應的業務包, 請通過相同的方式導入業務包。
11. 單擊“ 重新激活” , 可以對用戶變化後的身份進行重新驗證, 並重新激活工具Store。
② 巡檢
③ 信息收集
2.常見問題
① 誤碼
誤碼數是設備上記錄的各個端口所接收到的誤碼總和。
產生原因很多一般分為部件故障和非部件故障。
部件故障:一般是由於鏈路上部件異常或鏈路上各部件間接接觸異常導致。
非部件故障:一般為線纜觸碰、線纜插拔、接口虛接。
② 內存使用率過高
此巡檢項是巡檢系統是否有內存使用率過高的記錄;
此項不通過並不表示系統處於故障狀態,一般在業務壓力過大的情況下,內存使用率會過高;
l 處理方法:
可以在業務量較小時間段再進行一次巡檢;
若持續出現內存使用率過高的情況,為避免出現其他系統異常導致的內存消耗,請收集陣列日誌並返回華為;
③ 告警檢查不通過
告警檢查包括了緊急、重要、警告三種級別的告警。產生了告警說明設備發生了某種異常需要處理;
l 處理方法:
登陸設備查看具體的告警信息,根據告警信息的提示進行修復;
收集陣列日誌,並返回華為處理;
④ 軟件狀態不通過
軟件主要是設備上運行的軟件,檢查項會對版本號等必要的的合法性進行檢測,有該類型檢查項檢查不通過說明軟件出現了問題需要更新或者修復
l 處理方法:
收集陣列日誌,並返回華為確認處理。
⑤ 升級流程
l 在線升級:升級前需要確保升級包版本支持從當前版本在線升級到升級包版本。 進行
在線升級時, 系統會依次對控制器軟件進行升級, 首先升級備用控制器( 備控) 軟件
, 再升級主控制器( 主控) 軟件。 升級備用控制器時, 首先將備控的業務切換到主控
, 然後自動檢查需要升級的固件並依次進行升級, 升級完成後重新啟動備控系統, 備
控系統重新恢復上電後, 歸屬於備控的業務切換回備控, 並將原主控的業務切換到備
控。 然後按照相同的方式進行主控軟件的升級。
l 離線升級:離線升級過程中, 主控和備控同時進行升級, 大大縮短了升級時間。 由於
升級之前已經中止主機業務讀寫, 這樣就降低了系統在升級過程中出現數據丟失、 業
務中斷的風險。
l 在OceanStor Toolkit主界面, 單擊“ 升級” , 選擇“ 設備升級” , 進入“ 設備升級” 界
面。
l 在“ 設備升級” 界面, 單擊“ 添加設備” 。
l 在“ 選擇升級設備” 界面, 單擊“ 添加設備” 。
l 升級包路徑和數據備份路徑選擇完成後, 在“ 升級信息設置” 界面, 選擇升級模式。
l 升級模式選擇完成後, 選擇是否啟用專家模式。
l 單擊“ 完成” 按鈕, 進入“ 設備升級” 界面。
l 在“ 設備升級” 界面, 選擇要升級的陣列, 再單擊“ 執行升級” 按鈕開始升級。
l 系統彈出“ 升級確認” 對話框, 確認完成後, 選中復選框並單擊“ 確定” 按鈕進行升
級。
l 系統自動進入設備升級的導入升級包步驟。
l 導入包完成之後, 系統自動進入升級前檢查步驟。
l 在升級前檢查完成之後, 系統自動進入數據備份步驟。
l 在執行升級完成之後, 系統自動進入升級後驗證步驟。
l 查看升級後版本與升級包是否一致, 確認升級完成。
⑥ CLI命令視圖
l 根據命令行體系使用操作者的不同特性, 將操作者劃分為用戶、 用服、 研發三大領域
角色;對應產生三大視圖。
p 用戶視圖( user) 指在網產品的終端用戶進入的管理視圖。
p 用服視圖( engineer) 包括華為用服人員和服務外包人員進入的維護視圖。
p 研發視圖( developer) 僅限於華為存儲的研發人員進入的調試視圖。
l 用服領域可以執行超級管理員的所有命令, 並且可以執行用服類專有命令。
l 研發領域可以執行用服可執行的所有命令, 並且可以執行研發類專有命令。
a. 告警查詢和清除
l 查詢所有告警信息
#show alarm
l 清除指定告警信息
#change alarm clear sequence_list=3424
3.硬件類故障
① 常見硬件類故障
② 常見告警指示燈狀態
紅燈亮:模塊故障;
紅燈閃:模塊正在啟動、定位端口、定位硬盤;
藍燈亮:端口的速率值;
藍燈閃:端口正在傳輸數據;
藍燈亮表示8G的FC主機端口模塊速率為8G, 10G的iscsi主機端口模塊速率為10G,miniSAS級聯模塊與級聯框連接速率為12G。
綠燈長亮:模塊正常、端口的速率值;
綠燈閃:端口正在傳輸數據、BBU充電、電源模塊已接、硬盤傳輸數據、電源未上電、控制器正在啟動、端口模塊有熱插拔請求;
綠燈亮表示8G的FC主機端口模塊速率為4G或2G, 10G的iscsi主機端口模塊速率為1G, 12G miniSAS級聯模塊與級聯框連接速率為6G。
橙燈亮:端口的速率值;
橙燈閃:管理網口正在傳輸數據、BBU正在放電;
橙燈亮表示1G的iscsi主機端口速率為1G。
橙燈滅表示1G的iscsi主機端口速率低於1G。
50、【華為HCIE-Storage】--存儲維護與故障處理