1. 程式人生 > 其它 >交換機在江湖】 裝置異常重啟故障案例

交換機在江湖】 裝置異常重啟故障案例

交換機在江湖官方號2017-7-12 16:13:39最新回覆:2017-07-12 17:11:22 3407103
涉及產品和版本
框式V200R006C00SPC500

組網情況
組網資訊不涉及,僅單裝置故障。

現象描述
S9300在早上720左右的時間出現了一次異常重啟,任意檢視執行命令display reset-reason,裝置未記錄重啟原因;執行命令display version,發現裝置啟動後工作時間為38分鐘,說明裝置的確重啟過。
<HUAWEI>display reset-reason
Info: The LPU frame[1] board[1] does not have reset records.
Info: The LPU frame[1] board[2] does not have reset records.
Info: The LPU frame[1] board[3] does not have reset records.
Info: The LPU frame[1] board[4] does not have reset records.
Info: The LPU frame[1] board[5] does not have reset records.

<HUAWEI>display version

Huawei Versatile Routing Platform Software
VRP (R) software, Version 5.160 (S9300 V200R006C00SPC500)
Copyright (C) 2000-2017 HUAWEI TECH CO., LTD
HUAWEI S9303 Terabit Routing Switch uptime is0 week, 0 day, 0 hours, 38 minutes

... ...

原因分析

裝置異常啟動的一些原因並不能全部由display reset-reason記錄,還需要繼續排查日誌告警資訊,進一步確認。
處理步驟

檢視日誌資訊,發現早上718分,裝置記錄如下日誌告警資訊,裝置冷啟動一次,存在掉電重啟。需要進一步排查裝置供電環境,經確認是外部供電環境異常導致。

<HUAWEI>display trapbuffer
Trapping buffer configuration and contents : enabled
Allowed max buffer size : 1024
Actual buffer size : 256
Channel number : 3 , Channel name : trapbuffer
Dropped messages : 0
Overwritten messages : 70
Current messages : 256

#May 12 2017 07:18:00 cuqiao9303 ENTMIB/4/TRAP: OID 1.3.6.1.2.1.47.2.0.1 Entity MIB change.
#May 12 2017 07:18:00 cuqiao9303 SNMP/4/COLDSTART:OID 1.3.6.1.6.3.1.1.5.1 coldStart.

#May 12 2017 07:17:58 cuqiao9303 BASETRAP/4/POWERON: OID 1.3.6.1.4.1.2011.5.25.129.2.3.2 The power supply is on.(Index=69206025, Severity=6, ProbableCause=1024, EventType=5, ContainedIn=69206021, PhysicalName="PWR2")
#May 12 2017 07:17:58 cuqiao9303 BASETRAP/4/POWERON: OID 1.3.6.1.4.1.2011.5.25.129.2.3.2 The power supply is on.(Index=68943881, Severity=6, ProbableCause=1024, EventType=5, ContainedIn=68943877, PhysicalName="PWR1")

總結與建議

裝置異常重啟,不僅需要看display reset-reason命令回顯資訊,還需排查日誌告警資訊。本帖最後由 交換機在江湖 於 2017-07-12 16:15 編輯