1. 程式人生 > >網路故障和網路診斷工具(3.0)

網路故障和網路診斷工具(3.0)

網路故障管理

故障管理是網路管理員中最基本的內容之一,網路故障管理的目的在於防止類似故障的再次發生,確保網路系統的高穩定性。網路故障管理是相當重要的。

在網路出現故障時,一般情況下,網路管理員應報警。網路管理員應執行一些診斷測試來辨別故障原因。網路管理員必須及時發現故障部位,對所有節點動作狀態的監控、故障記錄的追蹤與檢查,對網路系統測試。

網路發生故障可能會對社會或產生帶來很大的影響。但在發生故障時,往往不能具體地確定故障所在的準確位置,而需要相關技術上的支援。因此,需要有一個故障管理系統,科學地管理網路發生的所有故障,並記錄每個故障的產生及相關資訊,最後確定並改正哪些故障,保證網路能提供連續可靠的服務。網路故障管理包括故障檢測、隔離、糾正、分析故障原因、網路故障報告和設定優先順序。

1.故障檢測

故障檢測時按照順序列出可能的原因,第一條是最有可能的原因,最後一條是最不可能的原因。然後逐條測試,看看是不是這種原因造成的問題。例如,如果懷疑計算機中的一個網絡卡是造成問題的原因,那麼就用一個正常工作的網絡卡來替換它進行測試。故障檢測要做到:

接收故障發生錯誤的檢測報告並做出相應;

分析故障發生情況,制定排錯方案;

使用各種故障診斷工具,執行診斷測試;

確認故障型別及性質。

2.隔離

啟用備用線路或裝置,進行故障隔離。

3.糾正

跟蹤、辨認故障

進行故障追蹤定位

根據故障分析結果,制定並實施解決方案

4.分析故障原因

根據網路系統故障的型別及發作頻度,分析故障產生的原因和故障性質,預測將未來網路故障的發作趨勢,建立故障報警資料庫,通過對歷史故障警報資料的統計分析,尋找網路故障發生的規律,建立故障預防體系,制定並實施解決方案。

5.網路故障報告

通過各種途徑報告網路故障。

網路故障自動報警,具有自動通知的手段,包括尋呼機、手機、電子郵件等方法。

根據網路故障的危害程度將報警指示分級管理,系統根據故障級別做出不同反應。

6.設定優先順序

解決網路故障問題的一個基本要素是設定優先順序。每個人都希望自己的計算機最早修好,所以設定優先次序並不是一件容易的事情。儘管最簡單的方式是根據先到先服務的原則,但這並不總是可行的,因為某些問題與其它問題相比可能更重要。所以,第一步是根據問題的重要性設定優先順序。

網路故障的定位

網路是一個動態系統,若干離散的部件在一起工作以形成一個功能整體。

故障定位是在部件基礎上進行的3個步驟。

1.確定該問題的實際性質

一個應用程式引起的故障問題

伺服器和客戶機之間不能通訊引起的問題

伺服器自身崩潰產生的問題

伺服器螢幕上的黑屏或一條訊息

應該做出如下考慮:

伺服器或某客戶機可能簡單掛起,或者沒有留下任何線索而不能執行

如果還有客戶機在執行,對這些客戶機做個記錄

如果該問題僅限於一臺客戶機或相同硬體相連的一組客戶機,首先懷疑這個硬體。

如果該問題影響所有的執行某個程式的各臺客戶機,那麼該程式可能是禍根。

如果沒有一個客戶機能夠訪問該伺服器,則可能是該伺服器中的LAN通道(網路作業系統、LAN驅動程式、網路介面卡、電纜系統、路由器等)出了問題。

也要考慮自從該網路上次正常工作以來,是否已經改變了什麼。

如果伺服器不能再執行,重新啟動它並且看問題是否再次出現。

以相同方式重複出現的問題比沒有什麼規律出現的問題更容易確定。

試圖用另一個應用程式或不執行任何程式時重現該問題,這能夠幫助決定該問題是否與一個特定的應用程式有關。

一旦已經注意到了能夠觀察到的一切現象,就可以準備對觀察到的症狀憑藉經驗進行猜測。

2.隔離該問題的原因

伺服器或某客戶機可能簡單掛起,或者沒有留下任何線索而不能執行。考慮的問題如下:

該機器還有電源補給嗎?                                  該問題出現的實際內容

該顯示器仍然有效嗎?                                     問題發生時網路上的活動

該計算機還接收鍵盤輸入嗎?                          伺服器上正執行的應用程式

磁碟驅動器的燈還閃爍嗎?                             註冊用網的使用者數量和動作

遵循所述確定可能的根源後,準備執行涉及這種可能的原因的各種測試。這樣做,應當能夠總結出其假設是否正確。

3.解決該問題

解決問題的主要手段是找出問題、得出結論、故障排除。

(1)找出問題

用能夠確定是正常工作的類似部件來替代懷疑有問題的部件。

在熟悉每個部件的效能,瞭解它們可能會引起什麼樣的問題後,這個方法比較有效。

如果懷疑是一個硬體問題,去除這個值得懷疑的部件並且用一個相同的部件來代替,看看是否有所改變。

如果只是增加一個新的硬體,則先替換該部件。

網路的一個優點是通常在LAN上的另一個客戶機中又可供使用的類似的網路硬體。許多有經驗的人會備用裝置儲備,就不必從執行的機器上拆除。

(2)得出結論

進行每個試驗,必須確定該嘉定是否正確。如果正確地執行了其它步驟,這個步驟通常最為直接。

如果問題依然如故,則可判斷該假定是不正確的。

如果該問題已經消除,則知道已經找到了問題的根源

一種最為麻煩的情況是,當改變部件之一後,該問題依然存在但外在表現形式卻不同。

對一個具有可能不熟悉的測試結果的事件,必須擴充套件或修訂關於該問題的方法,因而能夠更好地將觀察到的結果與其症狀聯絡在一起。

如果一個測試的結果沒有得出結論,必須更為詳細地關注該症狀且形成另一個假設。在大多數情況下需要在重新檢查該症狀之前,改變該問題的環境。

例如,可能要從一個給定的系統中檢測、隔離和修理故障的過程。

網路故障定位是一項綜合性的技術,涉及網路的方方面面。

操作

ping

connect

show

verbose

儲存到桌面

分類

郵件服務

新聞服務

Internet代理伺服器

計算機資訊

作業系統

Windows版本

調變解調器

網路使用者