網路故障診斷和排除

來源:酷知科普網 1.19W

一個成熟的網路管理機構一般都制定有一整套完整的故障管理日誌記錄機制,同時人們也率先把專家系統和人工智慧技術引進到網路故障管理中心。但對於大多數初學網路的人來說,這未免有點過於複雜,不過沒關係,我來幫大家總結一下網路故障診斷和排除的方法和經驗,供各位網管和菜鳥參考。
我們可以根據網路故障的性質把網路故障分為物理故障與邏輯故障,也可以根據網路故障的物件把網路故障分為線路故障、路由故障和主機故障。 下面首先介紹按照網路故障不同性質而劃分的物理故障與邏輯故障。

物理故障

(01)物理故障指的是裝置或線路損壞、插頭鬆動、線路受到嚴重電磁干擾等情況。比如說,網路管理人員發現網路某條線路突然中斷,首先用ping或fping檢查線路在網管中心這邊是否連通。

網路故障診斷和排除

(02)ping的格式為:ping (是IP地址,可以是主機的IP也可以是網路中另一臺計算機的IP)。ping一般一次只能檢測到一端到另一端的連通性,而不能一次檢測一端到多端的連通性,但fping一次就可以ping多個IP地址,比如C類的整個網段地址等。順便多說一句,網路管理員經常發現有人依次掃描本網的大量IP地址,不一定就是有黑客攻擊,fping也可以做到。如果連續幾次ping都出現"Requst time out"資訊,表明網路不通。這時去檢查埠插頭是否鬆動,或者網路插頭誤接,這種情況經常是沒有搞清楚網路插頭規範或者沒有弄清網路拓撲規劃的情況下導致的。

網路故障診斷和排除 第2張

(03)另一種情況,比如兩個路由器Router直接連線,這時應該讓一臺路由器的出口連線另一臺路由器的入口,而這臺路由器的入口連線另一路由器的出口才行。當然,集線器Hub、交換機、多路複用器也必須連線正確,否則也會導致網路中斷。還有一些網路連線故障顯得很隱蔽,要診斷這種故障沒有什麼特別好的工具,只有依靠經驗豐富的網路管理人員了。

網路故障診斷和排除 第3張

邏輯故障

(01)邏輯故障中最常見的情況就是配置錯誤,就是指因為網路裝置的配置原因而導致的網路異常或故障。配置錯誤可能是路由器埠引數設定有誤,或路由器路由配置錯誤以至於路由迴圈或找不到遠端地址,或者是路由掩碼設定錯誤等。比如,同樣是網路中的線路故障,該線路沒有流量,但又可以ping通線路的兩端埠,這時就很有可能是路由配置錯誤了。

(02)​遇到這種情況,我們通常用“路由跟蹤程式”就是traceroute,它和ping類似,最大的區別在於traceroute是把端到端的線路按線路所經過的路由器分成多段,然後以每段返回響應與延遲。如果發現在traceroute的結果中某一段之後,兩個IP地址迴圈出現,這時,一般就是線路遠端把埠路由又指向了線路的近端,導致IP包在該線路上來回反覆傳遞。幸好traceroute可以檢測到哪個路由器之前都能正常響應,到哪個路由器就不能正常響應了。這時只需更改遠端路由器埠配置,就能恢復線路正常了。

(03)邏輯故障的另一類就是一些重要程序或埠關閉,以及系統的負載過高。比如也是線路中斷,沒有流量,用ping發現線路埠不通,檢查發現該埠處於down的狀態,這就說明該埠已經關閉,因此導致故障。這時只需重新啟動該埠,就可以恢復線路的連通了。還有一種常見情況是路由器的負載過高,表現為路由器CPU溫度太高、CPU利用率太高,以及記憶體剩餘太少等,如果因此影響網路服務質量,最直接也是最好的辦法就是——更換路由器,當然換個好點的。(如果你有銀子的話)

熱門標籤