網(wǎng)絡(luò)故障診斷概述
網(wǎng)絡(luò)故障診斷應(yīng)該實(shí)現(xiàn)三方面的目的:
確定網(wǎng)絡(luò)的故障點(diǎn),恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行;
發(fā)現(xiàn)網(wǎng)絡(luò)規(guī)劃和配置中欠佳之處,改善和優(yōu)化網(wǎng)絡(luò)的性能;
觀察網(wǎng)絡(luò)的運(yùn)行狀況,及時(shí)預(yù)測網(wǎng)絡(luò)通信質(zhì)量。
網(wǎng)絡(luò)故障診斷以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運(yùn)行的知識為基礎(chǔ)。從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點(diǎn),查找問題的根源,排除故障,恢復(fù)網(wǎng)絡(luò)正常運(yùn)行。網(wǎng)絡(luò)故障通常有以下幾種可能:物理層中物理設(shè)備相互連接失敗或者硬件及線路本身的問題;數(shù)據(jù)鏈路層的網(wǎng)絡(luò)設(shè)備的接口配置問題;網(wǎng)絡(luò)層網(wǎng)絡(luò)協(xié)議配置或操作錯誤;傳輸層的設(shè)備性能或通信擁塞問題;上三層CISCOIOS或網(wǎng)絡(luò)應(yīng)用程序錯誤。診斷網(wǎng)絡(luò)故障的過程應(yīng)該沿著OSI七層模型從物理層開始向上進(jìn)行。首先檢查物理層,然后檢查數(shù)據(jù)鏈路層,以此類推,設(shè)法確定通信失敗的故障點(diǎn),直到系統(tǒng)通信正常為止。
網(wǎng)絡(luò)診斷可以使用包括局域網(wǎng)或廣域網(wǎng)分析儀在內(nèi)的多種工具:路由器診斷命令;網(wǎng)絡(luò)管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數(shù)網(wǎng)絡(luò)故障。查看路由表,是解決網(wǎng)絡(luò)故障開始的好地方。ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網(wǎng)絡(luò)工具。我們通常使用一個(gè)或多個(gè)命令收集相應(yīng)的信息,在給定情況下,確定使用什么命令獲取所需要的信息。譬如,通過IP協(xié)議來測定設(shè)備是否可達(dá)到的常用方法是使用ping命令。ping從源點(diǎn)向目標(biāo)發(fā)出ICMP信息包,如果成功的話,返回的ping信息包就證實(shí)從源點(diǎn)到目標(biāo)之間所有物理層、數(shù)據(jù)鏈路層和網(wǎng)羅層的功能都運(yùn)行正常。如何在互聯(lián)網(wǎng)絡(luò)運(yùn)行后了解它的信息,了解網(wǎng)絡(luò)是否正常運(yùn)行,監(jiān)視和了解網(wǎng)絡(luò)在正常條件下運(yùn)行細(xì)節(jié),了解出現(xiàn)故障的情況。監(jiān)視那些內(nèi)容呢?利用showinterface命令可以非常容易地獲得待檢查的每個(gè)接口的信息。另外showbuffer命令提供定期顯示緩沖區(qū)大小、用途及使用狀況等。Showproc命令和showprocmem命令可用于跟蹤處理器和內(nèi)存的使用情況,可以定期收集這些數(shù)據(jù),在故障出現(xiàn)時(shí),用于診斷參考。網(wǎng)絡(luò)故障以某種癥狀表現(xiàn)出來,故障癥狀包括一般性的(象用戶不能接入某個(gè)服務(wù)器)和較特殊的(如路由器不在路由表中)。對每一個(gè)癥狀使用特定的故障診斷工具和方法都能查找出一個(gè)或多個(gè)故障原因。
一般故障排除模式如下:第一步,當(dāng)分析網(wǎng)絡(luò)故障時(shí),首先要清楚故障現(xiàn)象。應(yīng)該詳細(xì)說明故障的癥侯和潛在的原因。為此,要確定故障的具體現(xiàn)象,然后確定造成這種故障現(xiàn)象的原因的類型。例如,主機(jī)不響應(yīng)客戶請求服務(wù)?赡艿墓收显蚴侵鳈C(jī)配置問題、接口卡故障或路由器配置命令丟失等。第二步,收集需要的用于幫助隔離可能故障原因的信息。向用戶、網(wǎng)絡(luò)管理員、管理者和其他關(guān)鍵人物提一些和故障有關(guān)的問題。廣泛的從網(wǎng)絡(luò)管理系統(tǒng)、協(xié)議分析跟蹤、路由器診斷命令的輸出報(bào)告或軟件說明書中收集有用的信息。第三步,根據(jù)收集到的情況考慮可能的故障原因?梢愿鶕(jù)有關(guān)情況排除某些故障原因。例如,根據(jù)某些資料可以排除硬件故障,把注意力放軟件原因上。對于任何機(jī)會都應(yīng)該設(shè)法減少可能的故障原因,以至于盡快的策劃出有效的故障診斷計(jì)劃。第四步,根據(jù)最后的可能的故障原因,建立一個(gè)診斷計(jì)劃。開始僅用一個(gè)最可能的故障原因進(jìn)行診斷活動,這樣可以容易恢復(fù)到故障的原始狀態(tài)。如果一次同時(shí)考慮一個(gè)以上的故障原因,試圖返回故障原始狀態(tài)就困難的多了。第五步,執(zhí)行診斷計(jì)劃,認(rèn)真做好每一步測試和觀察,直到故障癥狀消失。第六步,每改變一個(gè)參數(shù)都要確認(rèn)其結(jié)果。分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到解決。