網(wǎng)絡(luò)故障分層診斷課件_第1頁
網(wǎng)絡(luò)故障分層診斷課件_第2頁
網(wǎng)絡(luò)故障分層診斷課件_第3頁
網(wǎng)絡(luò)故障分層診斷課件_第4頁
網(wǎng)絡(luò)故障分層診斷課件_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)故障分層診斷制作人:鄒紹軍指導(dǎo)老師:沈奕佳老師網(wǎng)絡(luò)故障分層診斷制作人:鄒紹軍OSI的體系結(jié)構(gòu)OSI的體系結(jié)構(gòu)網(wǎng)絡(luò)故障分層診斷本次課主要講的內(nèi)容:1.網(wǎng)絡(luò)故障發(fā)生位置?2.網(wǎng)絡(luò)故障的分類3.故障診斷的一般步驟4.網(wǎng)絡(luò)的分層診斷技術(shù)5.

網(wǎng)絡(luò)故障診斷及維護(hù)6.經(jīng)典案例解析

本次課主要講的內(nèi)容:1.網(wǎng)絡(luò)故障發(fā)生位置?網(wǎng)絡(luò)故障通常有以下幾種可能:物理層問題:物理設(shè)備相互連接失敗或者硬件及線路本身的問題;數(shù)據(jù)鏈路層問題:網(wǎng)絡(luò)設(shè)備的接口配置問題;網(wǎng)絡(luò)層問題;網(wǎng)絡(luò)協(xié)議配置或操作錯誤;傳輸層問題:設(shè)備性能、通信擁塞及差錯問題;高層問題:包括操作系統(tǒng),應(yīng)用接口、驅(qū)動程序及各種應(yīng)用程序錯誤。

網(wǎng)絡(luò)故障通常有以下幾種可能:物理層問題:物理設(shè)備相互連接失敗網(wǎng)絡(luò)故障的分類根據(jù)網(wǎng)絡(luò)故障的性質(zhì)分為:

1)物理故障;2)邏輯故障。根據(jù)網(wǎng)絡(luò)故障的對象分為:1)線路故障;2)路由故障;3)主機(jī)故障。網(wǎng)絡(luò)故障的分類根據(jù)網(wǎng)絡(luò)故障的性質(zhì)分為:物理類故障物理故障定義:一般是指線路或設(shè)備出現(xiàn)物理類問題或說成硬件類問題。具體指的是設(shè)備或線路損壞、插頭松動等情況。1線路故障2端口故障3集線器或路由器故障4主機(jī)物理故障

物理類故障物理故障定義:邏輯類故障邏輯故障中最常見的情況就是配置錯誤,因?yàn)榫W(wǎng)絡(luò)設(shè)備的配置原因而導(dǎo)致的網(wǎng)絡(luò)異?;蚬收?。

1路由器邏輯故障

2一些重要進(jìn)程或端口關(guān)閉

3主機(jī)邏輯故障邏輯類故障邏輯故障中最常見的情況就是配置錯誤故障診斷的一般步驟故障的準(zhǔn)確定位準(zhǔn)確收集與故障相關(guān)信息考慮故障的可能原因確定解決方案實(shí)施解決方案測試驗(yàn)證記錄解決方案確定預(yù)防措施故障診斷的一般步驟故障的準(zhǔn)確定位1故障的準(zhǔn)確定位故障的定位就是要清楚故障的性質(zhì)及其影響,將故障的范圍縮小到一個網(wǎng)段,某一個節(jié)點(diǎn)或網(wǎng)絡(luò)設(shè)備。然后確定故障是否會出現(xiàn)在其他節(jié)點(diǎn)上,故障是局限于一個節(jié)點(diǎn)還是某個網(wǎng)絡(luò)設(shè)備1故障的準(zhǔn)確定位故障的定位就是要清楚故障的2準(zhǔn)確收集與故障相關(guān)信息觀察網(wǎng)絡(luò)設(shè)備的指示燈設(shè)備以前工作是否正常故障發(fā)生的時間

運(yùn)行環(huán)境是否發(fā)生了改變不要忽視一些明顯的人為錯誤2準(zhǔn)確收集與故障相關(guān)信息觀察網(wǎng)絡(luò)設(shè)備的指示燈3考慮故障的可能原因確定了故障區(qū)域及范圍,收集了相關(guān)故障現(xiàn)象及信息后,就可以根據(jù)故障現(xiàn)象及信息,利用軟硬件幫助功能,考慮引起故障的可能原因,并通過分析,推斷出最后產(chǎn)生故障的可能原因,并初步識別出故障的基本類型。把所有可能的原因按可能性大小一一排列記錄成事件列表,逐一排查,首先用一個最可能的故障原因進(jìn)行診斷活動,這樣可以比較容易恢復(fù)到故障的原始狀態(tài),相比而言,如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態(tài)就困難多了。3考慮故障的可能原因確定了故障區(qū)域及范圍,收4確定解決方案在執(zhí)行解決方案前,還需考慮以下幾方面問題:所確定的原因是否真是故障原因,需要相應(yīng)的診斷結(jié)果或報(bào)告作支撐。是否可以對設(shè)定的解決方案進(jìn)行預(yù)先的測試,并制定故障的診斷計(jì)劃。實(shí)現(xiàn)解決方案預(yù)定的結(jié)果是怎樣的?所制定的解決方案對于網(wǎng)絡(luò)的其他部分有沒有影響?4確定解決方案在執(zhí)行解決方案前,還需考慮以下幾方面問題:在實(shí)施解決方案前做好以下準(zhǔn)備保存全部的網(wǎng)絡(luò)設(shè)備配置文件。對服務(wù)器及重要的客戶段的配置文件進(jìn)行備份記錄。記錄網(wǎng)絡(luò)的基本拓?fù)浣Y(jié)構(gòu),設(shè)備的物理位置以及各設(shè)備之間線路的連接關(guān)系、端口號等。建立最終的基準(zhǔn),以便對新舊結(jié)果進(jìn)行對比,同時在需要恢復(fù)時可以作為比較的依據(jù)。在實(shí)施解決方案前做好以下準(zhǔn)備保存全部的網(wǎng)絡(luò)設(shè)備配置文件。5實(shí)施解決方案在實(shí)施解決方案時,可能還需要分成很多步驟來操作,所以需要認(rèn)真做好每一步測試和觀察。在測試過程中,每次只能完成一項(xiàng)測試,每改變一個參數(shù)都要確認(rèn)其結(jié)果并記錄下來,并分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到故障現(xiàn)象消失。5實(shí)施解決方案在實(shí)施解決方案時,可能還需要分6測試驗(yàn)證故障是否真正解決及排除,要通過網(wǎng)絡(luò)管理員及用戶的多方驗(yàn)證。對于網(wǎng)絡(luò)管理員而言,主要通過查看有關(guān)網(wǎng)絡(luò)設(shè)備是否正常工作,通過網(wǎng)絡(luò)管理軟件綜合分析網(wǎng)絡(luò)各項(xiàng)運(yùn)行參數(shù)。對于用戶而言,主要是觀察日常的各項(xiàng)網(wǎng)絡(luò)服務(wù)是否正常,網(wǎng)絡(luò)的使用性能。這個過程是一個持續(xù)的過程,需要大量時間去完成。

6測試驗(yàn)證故障是否真正解決及排除,要通過網(wǎng)

7記錄解決方案

故障排除后,需要把故障的解決方案,實(shí)施解決方案過程中的測試步驟及相關(guān)結(jié)果記錄成文檔,進(jìn)而積累實(shí)際故障解決經(jīng)驗(yàn)。作為網(wǎng)絡(luò)管理員,在這方面應(yīng)該養(yǎng)成良好的習(xí)慣。。7記錄解決方案

故障排除后,需要把故障的8確定預(yù)防措施

完成了故障的排除和文檔記錄后,就應(yīng)該著手于預(yù)防措施,防范于故障的再次發(fā)生。(目的)根據(jù)故障產(chǎn)生的各種原因,有針對性地制定相應(yīng)的網(wǎng)絡(luò)管理方案并實(shí)施,觀察方案的運(yùn)行效果,把被動的網(wǎng)絡(luò)管理方式變成主動地網(wǎng)絡(luò)管理方式8確定預(yù)防措施

完成了故障的排除和文檔記錄網(wǎng)絡(luò)的分層診斷技術(shù)

五層協(xié)議的層次結(jié)構(gòu)把每層功能及職責(zé)范圍定義得非常清晰,為管理員分析和排查故障提供了非常好的組織方式。由于各層相對獨(dú)立,按層排查能夠有效地發(fā)現(xiàn)和隔離故障,因而一般使用逐層分析和排查的方法。通常有兩種逐層排查方式:

一種是從低層開始排查,適用于物理網(wǎng)絡(luò)不夠成熟穩(wěn)定的情況,如組建新的網(wǎng)絡(luò)、重新調(diào)整網(wǎng)絡(luò)線纜、增加新的網(wǎng)絡(luò)設(shè)備;網(wǎng)絡(luò)的分層診斷技術(shù)五層協(xié)議的層次結(jié)構(gòu)把每層功網(wǎng)絡(luò)的分層診斷技術(shù)另一種是從高層開始排查,適用于物理網(wǎng)絡(luò)相對成熟穩(wěn)定的情況,如硬件設(shè)備沒有變動。無論哪種方式,最終都能達(dá)到目標(biāo),只是解決問題的效率有所差別。

網(wǎng)絡(luò)的分層診斷技術(shù)另一種是從高層開始排查,網(wǎng)絡(luò)故障統(tǒng)計(jì)

據(jù)統(tǒng)計(jì),出網(wǎng)絡(luò)故障通常發(fā)生在網(wǎng)絡(luò)五層模型的下三層,即物理層、鏈路層和網(wǎng)絡(luò)層。網(wǎng)絡(luò)故障統(tǒng)計(jì)網(wǎng)絡(luò)故障診斷及維護(hù)網(wǎng)絡(luò)故障診斷形式:軟件形式工具:比如操作系統(tǒng)提供的網(wǎng)絡(luò)診斷命令及專業(yè)管理軟件。使用簡單,方便,成本低,但診斷不能深入網(wǎng)絡(luò)內(nèi)部,具體反映各項(xiàng)網(wǎng)絡(luò)參數(shù),功能有限。硬件形式工具:比如各種網(wǎng)絡(luò)萬用表、網(wǎng)絡(luò)協(xié)議分析儀等。功能強(qiáng)大,能夠?qū)W(wǎng)絡(luò)進(jìn)行系統(tǒng)全面深入的診斷,但使用較復(fù)雜,成本較高。網(wǎng)絡(luò)故障診斷及維護(hù)網(wǎng)絡(luò)故障診斷形式:1物理層(1)線路方面故障(2)端口設(shè)置方面的故障(3)集線器故障(4)電源方面的故障(5)網(wǎng)卡故障網(wǎng)卡參數(shù)設(shè)置錯誤在同一網(wǎng)段的網(wǎng)絡(luò)設(shè)備的參數(shù)設(shè)置要一致對網(wǎng)卡的干擾網(wǎng)卡驅(qū)動不正1物理層(1)線路方面故障經(jīng)典案例1故障現(xiàn)象:某進(jìn)出口公司開通DDN(DigitalDataNetwork,數(shù)字?jǐn)?shù)據(jù)網(wǎng))專線后部分用戶抱怨數(shù)據(jù)交換的速度變慢,且經(jīng)常有連接中斷的現(xiàn)象。網(wǎng)絡(luò)支持人員雖經(jīng)多方查找仍不得要領(lǐng),故請求網(wǎng)絡(luò)醫(yī)院出診援救。

經(jīng)典案例1故障現(xiàn)象:經(jīng)典案例1(續(xù))故障排除:該公司的網(wǎng)絡(luò)為lOBase-T局域網(wǎng),此次只增加了DDN設(shè)備和路由器,其他配置基本不變。故將網(wǎng)絡(luò)測試儀F68X從最低樓層的某個用戶端接入網(wǎng)絡(luò)進(jìn)行觀察,平均流量為1.20/0,未發(fā)現(xiàn)異常。改用流量發(fā)送功能作流量逐級遞增的體能測試,也未發(fā)現(xiàn)任何異常。表面上看,該網(wǎng)段似乎沒有什么問題。為快速定位網(wǎng)絡(luò)故障,將流量發(fā)送到其他網(wǎng)段,同時觀察網(wǎng)絡(luò)狀況。隨著發(fā)送流量的增加,1分鐘后發(fā)現(xiàn)錯誤幀經(jīng)典案例1(續(xù))故障排除:經(jīng)典案例1(續(xù))幀類型為FCS錯誤幀,并指示FCS幀來自第二層的某個用戶。顯然,只據(jù)此現(xiàn)象就判斷故障原因?yàn)樵摴ぷ髡镜木W(wǎng)卡損壞或網(wǎng)卡驅(qū)動程序錯誤,似乎顯得“證據(jù)不足”,因?yàn)檎麄€樓層的用戶反映的故障現(xiàn)象是相同的。繼續(xù)觀察到5分鐘,發(fā)現(xiàn)FCS錯誤幀數(shù)量增加為10個用戶左右,由此可以斷定不是某個工作站的問題。為此,令其他樓層多個用戶與故障樓層用戶交換數(shù)據(jù)(比如復(fù)制文件),

經(jīng)典案例1(續(xù))幀類型為FCS錯誤幀,并指示FCS經(jīng)典案例1(續(xù))結(jié)果發(fā)現(xiàn)多個FCS幀錯誤。打開交換機(jī)端口工作表觀察,本樓層的記錄中也顯示FCS幀錯誤,而其他的交換機(jī)端口工作表中沒有FCS錯誤記錄,這說明是本網(wǎng)段內(nèi)存在著線纜超長的鏈路。再試著向Internet某個已知用戶發(fā)送流量,并且進(jìn)行ICMPPing測試,結(jié)果發(fā)現(xiàn)損失率為90%左右。由于剛才本網(wǎng)段內(nèi)的體能測試未發(fā)現(xiàn)異常,所以只能是集線器與交換機(jī)連接的單條鏈路有問題。測試該電纜,長度指示為175m!經(jīng)典案例1(續(xù))結(jié)果發(fā)現(xiàn)多個FCS幀錯誤。打開交換機(jī)端口工作經(jīng)典案例1(續(xù))由于175m超常鏈路在集線器和交換機(jī)之間,所以本網(wǎng)段內(nèi)的用戶在交換數(shù)據(jù)時可以順利進(jìn)行。但與其他網(wǎng)段的用戶交換數(shù)據(jù)時就可能出問題。

一周后該公司重新劃分網(wǎng)段施工結(jié)束,用戶來電報(bào)告一切正常。

經(jīng)典案例1(續(xù))由于175m超常鏈路在集線經(jīng)典案例2故障現(xiàn)象:某網(wǎng)吧老板打電話給網(wǎng)絡(luò)公司的技術(shù)人員說,網(wǎng)吧局域網(wǎng)內(nèi)出現(xiàn)頻繁斷網(wǎng)的情況。技術(shù)人員打車到達(dá)現(xiàn)場后詢問了網(wǎng)吧業(yè)主故障發(fā)生前的一些情況,業(yè)主反應(yīng)閑來無事,看見交換機(jī)灰塵太多,于是分片進(jìn)行了除塵,全部干完以后玩了十幾分鐘后就發(fā)生這樣的情況了,每次掉線以后重新啟動所有設(shè)備只能維持一小會,然后就是斷網(wǎng),找了半天原因也沒找到,于是打電話報(bào)修。經(jīng)典案例2故障現(xiàn)象:經(jīng)典案例2(續(xù))故障排除:

首先觀察交換機(jī),發(fā)現(xiàn)網(wǎng)吧內(nèi)所有的交換機(jī)網(wǎng)絡(luò)指示燈都在以相同的頻率在閃,斷開局域網(wǎng),使用筆記本直接接在路由器上進(jìn)行上網(wǎng)測試,一切正常,故障顯然出在局域網(wǎng)內(nèi),把所有交換機(jī)之間的級聯(lián)線斷開,先插上主交換機(jī),無異常,再一臺一臺的接入分交換機(jī),接到第三臺的時候故障出現(xiàn)了,到那個交換機(jī)上查網(wǎng)線,為了快速排除故障,那臺交換機(jī)上的所有網(wǎng)線都被拔了下來,然后一個一個插回經(jīng)典案例2(續(xù))故障排除:經(jīng)典案例2(續(xù))去,最后發(fā)現(xiàn)其中一根網(wǎng)線是級聯(lián)線,被人插在了同一個交換機(jī)上造成數(shù)據(jù)回路,拔掉這根網(wǎng)線后網(wǎng)絡(luò)恢復(fù)正常。

故障總結(jié):故障處理完之后詢問業(yè)主為什么這么插,業(yè)主說當(dāng)時也沒注意,看見有水晶頭的網(wǎng)線就往交換機(jī)上插,不知道這根網(wǎng)線是干啥的。技術(shù)人員告訴業(yè)主以后再動網(wǎng)線的時候最好有個技術(shù)在場的情況下再動。

經(jīng)典案例2(續(xù))去,最后發(fā)現(xiàn)其中一根網(wǎng)線是級聯(lián)線,被人2數(shù)據(jù)鏈路層數(shù)據(jù)鏈路層的故障一般包括以下幾個方:1)數(shù)據(jù)鏈路層幀的問題,通常的幀錯發(fā)、重發(fā)、丟失及幀碰撞等。2)數(shù)據(jù)幀的流量控制及差錯控制。3)鏈路層地址的設(shè)置。4)鏈路層協(xié)議的匹配問題,在相互連接的兩端口應(yīng)該使用同一種協(xié)議封裝。5)鏈路通信的時鐘同步問題。6)數(shù)據(jù)終端設(shè)備(DTE)在數(shù)據(jù)鏈路層驅(qū)動程序的加載問題。2數(shù)據(jù)鏈路層數(shù)據(jù)鏈路層的故障一般包括以下幾個方:經(jīng)典案例3故障現(xiàn)象:某校網(wǎng)絡(luò)教室中的計(jì)算機(jī)是通過校園網(wǎng)中的代理服務(wù)器共享上網(wǎng)的。一天,上網(wǎng)后不久,發(fā)現(xiàn)計(jì)算機(jī)瀏覽Internet的速度很慢,以為是開啟程序太多引起計(jì)算機(jī)的內(nèi)存不足,就重新啟動機(jī)器??芍貑⒑筮€是老樣子,換一臺機(jī)器上網(wǎng)也是如此。

經(jīng)典案例3故障現(xiàn)象:經(jīng)典案例3(續(xù))故障排除:由于多臺計(jì)算機(jī)都出現(xiàn)了網(wǎng)速很慢的毛病,因此初步判斷是代理服務(wù)器出問題了。檢查代理服務(wù)器,發(fā)現(xiàn)服務(wù)器鼠標(biāo)和鍵盤都無法響應(yīng),出現(xiàn)了死機(jī)故障。沒辦法,只得按下Reset鍵重新啟動系統(tǒng),可在快進(jìn)入系統(tǒng)界面時又死機(jī)了。難道是服務(wù)器操作系統(tǒng)崩潰了?立即用先前備份的Ghost鏡像將系統(tǒng)分區(qū)恢復(fù)了一遍,再次啟動機(jī)器,不料還是老樣子??磥聿⒎擒浖收?。或者可能是由于經(jīng)典案例3(續(xù))故障排除:經(jīng)典案例3(續(xù))很久沒有打開機(jī)箱清理,計(jì)算機(jī)內(nèi)部灰塵積聚太多,配件晝夜運(yùn)轉(zhuǎn)在散熱不良的環(huán)境中,引起CPU怠工了吧?拿來螺絲刀正想打開機(jī)箱查個究竟,發(fā)現(xiàn)機(jī)箱后面板網(wǎng)卡口上的黃燈急速閃爍著,再看看機(jī)柜內(nèi)的交換機(jī),所有的指示燈也同樣都異常急速地閃爍著。網(wǎng)絡(luò)故障莫不是由數(shù)據(jù)阻塞引起的?試著關(guān)閉交換機(jī)電源,稍等一下再重新打開,然后再次啟動服務(wù)器。這次服務(wù)器竟然能正常啟動了,通過各終端訪問Intenet,一切恢復(fù)了正常。經(jīng)典案例3(續(xù))很久沒有打開機(jī)箱清理,計(jì)算機(jī)內(nèi)部灰塵積聚太多經(jīng)典案例3(續(xù))故障總結(jié):此次由交換機(jī)數(shù)據(jù)阻塞引起的網(wǎng)絡(luò)故障,由于沒有首先檢查交換機(jī),使本來只需開關(guān)一下交換機(jī)電源就能解決的問題,卻走了不少彎路。由此提醒大家:檢查網(wǎng)絡(luò)故障時,千萬不要把目光只停留在網(wǎng)絡(luò)的某一個節(jié)點(diǎn)上,而要對整個鏈路系統(tǒng)做綜合觀察,才能少走彎路。

經(jīng)典案例3(續(xù))故障總結(jié):3網(wǎng)絡(luò)層網(wǎng)絡(luò)層提供建立、保持和釋放網(wǎng)絡(luò)層連接的手段,包括路由選擇、流量控制、傳輸確認(rèn)、中斷、差錯及故障恢復(fù)等。排除網(wǎng)絡(luò)層故障的基本方法是沿著從源到目標(biāo)的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應(yīng)該通過檢查來確定是否已經(jīng)輸入適當(dāng)?shù)撵o態(tài)路由、默認(rèn)路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動態(tài)路由選擇過程的故障,包括RIP或者GRP路由協(xié)議出現(xiàn)的故障3網(wǎng)絡(luò)層網(wǎng)絡(luò)層提供建立、保持和釋放網(wǎng)絡(luò)層連經(jīng)典案例4故障現(xiàn)象:某一技術(shù)人員接到一電話,對方很著急的說網(wǎng)吧一個勁的斷線,查不出原因,請技術(shù)人員去協(xié)助處理故障。經(jīng)典案例4故障現(xiàn)象:經(jīng)典案例4(續(xù))故障排除:打車到達(dá)現(xiàn)場以后,進(jìn)入機(jī)房,發(fā)現(xiàn)主交換機(jī)和光纖收發(fā)器指示燈都在以極快的頻率閃,說明流量很大,使用筆記本直接接在電信的光纖收發(fā)器上進(jìn)行測試,發(fā)現(xiàn)筆記本的CPU占用率一下就到了100%,不用測試了,被攻擊了。再接到網(wǎng)通光纖收發(fā)器上測試沒什么異常,于是暫時只接網(wǎng)通光纖,恢復(fù)網(wǎng)絡(luò),然后聯(lián)系電信中心機(jī)房更換IP地址,故障就這么搞定了。經(jīng)典案例4(續(xù))故障排除:經(jīng)典案例4(續(xù))故障總結(jié):技術(shù)人員跟業(yè)主說被攻擊了以后業(yè)主不相信攻擊會造成這么大的影響,并說我花了好幾萬購買的防火墻呢,怎么可能被攻擊搞的這么慘,技術(shù)人員說你的出口帶寬是40M,對方如果使用大于40M的流量攻擊你,防火墻就什么用都沒有了,所以網(wǎng)吧里你買的防火墻在受到這種攻擊時是不起作用的。業(yè)主聽了技術(shù)人員的話沒再說什么。經(jīng)典案例4(續(xù))故障總結(jié):經(jīng)典案例5故障現(xiàn)象:技術(shù)人員接到一家局域網(wǎng)的電話,反應(yīng)局域網(wǎng)網(wǎng)絡(luò)速度不穩(wěn)定,玩游戲的時候經(jīng)常斷線,可以再次重新登陸,但過會還會斷線。

經(jīng)典案例5故障現(xiàn)象:經(jīng)典案例5(續(xù))故障排除:到達(dá)網(wǎng)吧發(fā)現(xiàn)顧客在進(jìn)入游戲以后玩了一會就顯示已經(jīng)與服務(wù)器失去連接,ping電信的DNS發(fā)現(xiàn)延時一會20多ms,一會300多ms,在CMD下使用tracert命令探測路由路徑,發(fā)現(xiàn)延時在20多ms的時候走的是電信線路,延時在300多ms的時候走的是網(wǎng)通線路,問題出在路由器上,向業(yè)主要來管理密碼,進(jìn)入路由器的web界面進(jìn)行檢查,發(fā)現(xiàn)設(shè)置沒什么經(jīng)典案例5(續(xù))故障排除:經(jīng)典案例5(續(xù))問題,在CMD下使用telnet進(jìn)入路由器,在超級權(quán)限下打入setup重新設(shè)置路由,保存后觀察路由近2個小時,沒有再發(fā)生這樣的情況,故障處理完畢。故障總結(jié):銳捷的路由器在第一次安裝的時候最好使用telnet登陸路由器進(jìn)行配置,配置完以后再進(jìn)入web管理界面進(jìn)行雙線的設(shè)置。經(jīng)典案例5(續(xù))問題,在CMD下使用telnet進(jìn)4傳輸層鏈路層故障主要包括:1)差錯檢測糾錯等,如數(shù)據(jù)包的重發(fā)。2)通信擁塞控制錯誤或上層協(xié)議在網(wǎng)絡(luò)層協(xié)議上的捆綁錯誤。3)私密信和可靠性問題,例如SSL安全協(xié)議握手連接失敗。4傳輸層鏈路層故障主要包括:5應(yīng)用高層

應(yīng)用層故障檢查主要包括以下幾個方面:1)終端系統(tǒng)的系統(tǒng)資源狀態(tài),如CPU、內(nèi)存、磁盤利用、I/O系統(tǒng)、進(jìn)程等。2)應(yīng)用程序?qū)ο到y(tǒng)資源的占用及調(diào)度管理3)安全管理,用戶管理,文件管理等高層服務(wù)。5應(yīng)用高層應(yīng)用層故障檢查主要包括以下幾個方面:網(wǎng)絡(luò)故障分層診斷制作人:鄒紹軍指導(dǎo)老師:沈奕佳老師網(wǎng)絡(luò)故障分層診斷制作人:鄒紹軍OSI的體系結(jié)構(gòu)OSI的體系結(jié)構(gòu)網(wǎng)絡(luò)故障分層診斷本次課主要講的內(nèi)容:1.網(wǎng)絡(luò)故障發(fā)生位置?2.網(wǎng)絡(luò)故障的分類3.故障診斷的一般步驟4.網(wǎng)絡(luò)的分層診斷技術(shù)5.

網(wǎng)絡(luò)故障診斷及維護(hù)6.經(jīng)典案例解析

本次課主要講的內(nèi)容:1.網(wǎng)絡(luò)故障發(fā)生位置?網(wǎng)絡(luò)故障通常有以下幾種可能:物理層問題:物理設(shè)備相互連接失敗或者硬件及線路本身的問題;數(shù)據(jù)鏈路層問題:網(wǎng)絡(luò)設(shè)備的接口配置問題;網(wǎng)絡(luò)層問題;網(wǎng)絡(luò)協(xié)議配置或操作錯誤;傳輸層問題:設(shè)備性能、通信擁塞及差錯問題;高層問題:包括操作系統(tǒng),應(yīng)用接口、驅(qū)動程序及各種應(yīng)用程序錯誤。

網(wǎng)絡(luò)故障通常有以下幾種可能:物理層問題:物理設(shè)備相互連接失敗網(wǎng)絡(luò)故障的分類根據(jù)網(wǎng)絡(luò)故障的性質(zhì)分為:

1)物理故障;2)邏輯故障。根據(jù)網(wǎng)絡(luò)故障的對象分為:1)線路故障;2)路由故障;3)主機(jī)故障。網(wǎng)絡(luò)故障的分類根據(jù)網(wǎng)絡(luò)故障的性質(zhì)分為:物理類故障物理故障定義:一般是指線路或設(shè)備出現(xiàn)物理類問題或說成硬件類問題。具體指的是設(shè)備或線路損壞、插頭松動等情況。1線路故障2端口故障3集線器或路由器故障4主機(jī)物理故障

物理類故障物理故障定義:邏輯類故障邏輯故障中最常見的情況就是配置錯誤,因?yàn)榫W(wǎng)絡(luò)設(shè)備的配置原因而導(dǎo)致的網(wǎng)絡(luò)異常或故障。

1路由器邏輯故障

2一些重要進(jìn)程或端口關(guān)閉

3主機(jī)邏輯故障邏輯類故障邏輯故障中最常見的情況就是配置錯誤故障診斷的一般步驟故障的準(zhǔn)確定位準(zhǔn)確收集與故障相關(guān)信息考慮故障的可能原因確定解決方案實(shí)施解決方案測試驗(yàn)證記錄解決方案確定預(yù)防措施故障診斷的一般步驟故障的準(zhǔn)確定位1故障的準(zhǔn)確定位故障的定位就是要清楚故障的性質(zhì)及其影響,將故障的范圍縮小到一個網(wǎng)段,某一個節(jié)點(diǎn)或網(wǎng)絡(luò)設(shè)備。然后確定故障是否會出現(xiàn)在其他節(jié)點(diǎn)上,故障是局限于一個節(jié)點(diǎn)還是某個網(wǎng)絡(luò)設(shè)備1故障的準(zhǔn)確定位故障的定位就是要清楚故障的2準(zhǔn)確收集與故障相關(guān)信息觀察網(wǎng)絡(luò)設(shè)備的指示燈設(shè)備以前工作是否正常故障發(fā)生的時間

運(yùn)行環(huán)境是否發(fā)生了改變不要忽視一些明顯的人為錯誤2準(zhǔn)確收集與故障相關(guān)信息觀察網(wǎng)絡(luò)設(shè)備的指示燈3考慮故障的可能原因確定了故障區(qū)域及范圍,收集了相關(guān)故障現(xiàn)象及信息后,就可以根據(jù)故障現(xiàn)象及信息,利用軟硬件幫助功能,考慮引起故障的可能原因,并通過分析,推斷出最后產(chǎn)生故障的可能原因,并初步識別出故障的基本類型。把所有可能的原因按可能性大小一一排列記錄成事件列表,逐一排查,首先用一個最可能的故障原因進(jìn)行診斷活動,這樣可以比較容易恢復(fù)到故障的原始狀態(tài),相比而言,如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態(tài)就困難多了。3考慮故障的可能原因確定了故障區(qū)域及范圍,收4確定解決方案在執(zhí)行解決方案前,還需考慮以下幾方面問題:所確定的原因是否真是故障原因,需要相應(yīng)的診斷結(jié)果或報(bào)告作支撐。是否可以對設(shè)定的解決方案進(jìn)行預(yù)先的測試,并制定故障的診斷計(jì)劃。實(shí)現(xiàn)解決方案預(yù)定的結(jié)果是怎樣的?所制定的解決方案對于網(wǎng)絡(luò)的其他部分有沒有影響?4確定解決方案在執(zhí)行解決方案前,還需考慮以下幾方面問題:在實(shí)施解決方案前做好以下準(zhǔn)備保存全部的網(wǎng)絡(luò)設(shè)備配置文件。對服務(wù)器及重要的客戶段的配置文件進(jìn)行備份記錄。記錄網(wǎng)絡(luò)的基本拓?fù)浣Y(jié)構(gòu),設(shè)備的物理位置以及各設(shè)備之間線路的連接關(guān)系、端口號等。建立最終的基準(zhǔn),以便對新舊結(jié)果進(jìn)行對比,同時在需要恢復(fù)時可以作為比較的依據(jù)。在實(shí)施解決方案前做好以下準(zhǔn)備保存全部的網(wǎng)絡(luò)設(shè)備配置文件。5實(shí)施解決方案在實(shí)施解決方案時,可能還需要分成很多步驟來操作,所以需要認(rèn)真做好每一步測試和觀察。在測試過程中,每次只能完成一項(xiàng)測試,每改變一個參數(shù)都要確認(rèn)其結(jié)果并記錄下來,并分析結(jié)果確定問題是否解決,如果沒有解決,繼續(xù)下去,直到故障現(xiàn)象消失。5實(shí)施解決方案在實(shí)施解決方案時,可能還需要分6測試驗(yàn)證故障是否真正解決及排除,要通過網(wǎng)絡(luò)管理員及用戶的多方驗(yàn)證。對于網(wǎng)絡(luò)管理員而言,主要通過查看有關(guān)網(wǎng)絡(luò)設(shè)備是否正常工作,通過網(wǎng)絡(luò)管理軟件綜合分析網(wǎng)絡(luò)各項(xiàng)運(yùn)行參數(shù)。對于用戶而言,主要是觀察日常的各項(xiàng)網(wǎng)絡(luò)服務(wù)是否正常,網(wǎng)絡(luò)的使用性能。這個過程是一個持續(xù)的過程,需要大量時間去完成。

6測試驗(yàn)證故障是否真正解決及排除,要通過網(wǎng)

7記錄解決方案

故障排除后,需要把故障的解決方案,實(shí)施解決方案過程中的測試步驟及相關(guān)結(jié)果記錄成文檔,進(jìn)而積累實(shí)際故障解決經(jīng)驗(yàn)。作為網(wǎng)絡(luò)管理員,在這方面應(yīng)該養(yǎng)成良好的習(xí)慣。。7記錄解決方案

故障排除后,需要把故障的8確定預(yù)防措施

完成了故障的排除和文檔記錄后,就應(yīng)該著手于預(yù)防措施,防范于故障的再次發(fā)生。(目的)根據(jù)故障產(chǎn)生的各種原因,有針對性地制定相應(yīng)的網(wǎng)絡(luò)管理方案并實(shí)施,觀察方案的運(yùn)行效果,把被動的網(wǎng)絡(luò)管理方式變成主動地網(wǎng)絡(luò)管理方式8確定預(yù)防措施

完成了故障的排除和文檔記錄網(wǎng)絡(luò)的分層診斷技術(shù)

五層協(xié)議的層次結(jié)構(gòu)把每層功能及職責(zé)范圍定義得非常清晰,為管理員分析和排查故障提供了非常好的組織方式。由于各層相對獨(dú)立,按層排查能夠有效地發(fā)現(xiàn)和隔離故障,因而一般使用逐層分析和排查的方法。通常有兩種逐層排查方式:

一種是從低層開始排查,適用于物理網(wǎng)絡(luò)不夠成熟穩(wěn)定的情況,如組建新的網(wǎng)絡(luò)、重新調(diào)整網(wǎng)絡(luò)線纜、增加新的網(wǎng)絡(luò)設(shè)備;網(wǎng)絡(luò)的分層診斷技術(shù)五層協(xié)議的層次結(jié)構(gòu)把每層功網(wǎng)絡(luò)的分層診斷技術(shù)另一種是從高層開始排查,適用于物理網(wǎng)絡(luò)相對成熟穩(wěn)定的情況,如硬件設(shè)備沒有變動。無論哪種方式,最終都能達(dá)到目標(biāo),只是解決問題的效率有所差別。

網(wǎng)絡(luò)的分層診斷技術(shù)另一種是從高層開始排查,網(wǎng)絡(luò)故障統(tǒng)計(jì)

據(jù)統(tǒng)計(jì),出網(wǎng)絡(luò)故障通常發(fā)生在網(wǎng)絡(luò)五層模型的下三層,即物理層、鏈路層和網(wǎng)絡(luò)層。網(wǎng)絡(luò)故障統(tǒng)計(jì)網(wǎng)絡(luò)故障診斷及維護(hù)網(wǎng)絡(luò)故障診斷形式:軟件形式工具:比如操作系統(tǒng)提供的網(wǎng)絡(luò)診斷命令及專業(yè)管理軟件。使用簡單,方便,成本低,但診斷不能深入網(wǎng)絡(luò)內(nèi)部,具體反映各項(xiàng)網(wǎng)絡(luò)參數(shù),功能有限。硬件形式工具:比如各種網(wǎng)絡(luò)萬用表、網(wǎng)絡(luò)協(xié)議分析儀等。功能強(qiáng)大,能夠?qū)W(wǎng)絡(luò)進(jìn)行系統(tǒng)全面深入的診斷,但使用較復(fù)雜,成本較高。網(wǎng)絡(luò)故障診斷及維護(hù)網(wǎng)絡(luò)故障診斷形式:1物理層(1)線路方面故障(2)端口設(shè)置方面的故障(3)集線器故障(4)電源方面的故障(5)網(wǎng)卡故障網(wǎng)卡參數(shù)設(shè)置錯誤在同一網(wǎng)段的網(wǎng)絡(luò)設(shè)備的參數(shù)設(shè)置要一致對網(wǎng)卡的干擾網(wǎng)卡驅(qū)動不正1物理層(1)線路方面故障經(jīng)典案例1故障現(xiàn)象:某進(jìn)出口公司開通DDN(DigitalDataNetwork,數(shù)字?jǐn)?shù)據(jù)網(wǎng))專線后部分用戶抱怨數(shù)據(jù)交換的速度變慢,且經(jīng)常有連接中斷的現(xiàn)象。網(wǎng)絡(luò)支持人員雖經(jīng)多方查找仍不得要領(lǐng),故請求網(wǎng)絡(luò)醫(yī)院出診援救。

經(jīng)典案例1故障現(xiàn)象:經(jīng)典案例1(續(xù))故障排除:該公司的網(wǎng)絡(luò)為lOBase-T局域網(wǎng),此次只增加了DDN設(shè)備和路由器,其他配置基本不變。故將網(wǎng)絡(luò)測試儀F68X從最低樓層的某個用戶端接入網(wǎng)絡(luò)進(jìn)行觀察,平均流量為1.20/0,未發(fā)現(xiàn)異常。改用流量發(fā)送功能作流量逐級遞增的體能測試,也未發(fā)現(xiàn)任何異常。表面上看,該網(wǎng)段似乎沒有什么問題。為快速定位網(wǎng)絡(luò)故障,將流量發(fā)送到其他網(wǎng)段,同時觀察網(wǎng)絡(luò)狀況。隨著發(fā)送流量的增加,1分鐘后發(fā)現(xiàn)錯誤幀經(jīng)典案例1(續(xù))故障排除:經(jīng)典案例1(續(xù))幀類型為FCS錯誤幀,并指示FCS幀來自第二層的某個用戶。顯然,只據(jù)此現(xiàn)象就判斷故障原因?yàn)樵摴ぷ髡镜木W(wǎng)卡損壞或網(wǎng)卡驅(qū)動程序錯誤,似乎顯得“證據(jù)不足”,因?yàn)檎麄€樓層的用戶反映的故障現(xiàn)象是相同的。繼續(xù)觀察到5分鐘,發(fā)現(xiàn)FCS錯誤幀數(shù)量增加為10個用戶左右,由此可以斷定不是某個工作站的問題。為此,令其他樓層多個用戶與故障樓層用戶交換數(shù)據(jù)(比如復(fù)制文件),

經(jīng)典案例1(續(xù))幀類型為FCS錯誤幀,并指示FCS經(jīng)典案例1(續(xù))結(jié)果發(fā)現(xiàn)多個FCS幀錯誤。打開交換機(jī)端口工作表觀察,本樓層的記錄中也顯示FCS幀錯誤,而其他的交換機(jī)端口工作表中沒有FCS錯誤記錄,這說明是本網(wǎng)段內(nèi)存在著線纜超長的鏈路。再試著向Internet某個已知用戶發(fā)送流量,并且進(jìn)行ICMPPing測試,結(jié)果發(fā)現(xiàn)損失率為90%左右。由于剛才本網(wǎng)段內(nèi)的體能測試未發(fā)現(xiàn)異常,所以只能是集線器與交換機(jī)連接的單條鏈路有問題。測試該電纜,長度指示為175m!經(jīng)典案例1(續(xù))結(jié)果發(fā)現(xiàn)多個FCS幀錯誤。打開交換機(jī)端口工作經(jīng)典案例1(續(xù))由于175m超常鏈路在集線器和交換機(jī)之間,所以本網(wǎng)段內(nèi)的用戶在交換數(shù)據(jù)時可以順利進(jìn)行。但與其他網(wǎng)段的用戶交換數(shù)據(jù)時就可能出問題。

一周后該公司重新劃分網(wǎng)段施工結(jié)束,用戶來電報(bào)告一切正常。

經(jīng)典案例1(續(xù))由于175m超常鏈路在集線經(jīng)典案例2故障現(xiàn)象:某網(wǎng)吧老板打電話給網(wǎng)絡(luò)公司的技術(shù)人員說,網(wǎng)吧局域網(wǎng)內(nèi)出現(xiàn)頻繁斷網(wǎng)的情況。技術(shù)人員打車到達(dá)現(xiàn)場后詢問了網(wǎng)吧業(yè)主故障發(fā)生前的一些情況,業(yè)主反應(yīng)閑來無事,看見交換機(jī)灰塵太多,于是分片進(jìn)行了除塵,全部干完以后玩了十幾分鐘后就發(fā)生這樣的情況了,每次掉線以后重新啟動所有設(shè)備只能維持一小會,然后就是斷網(wǎng),找了半天原因也沒找到,于是打電話報(bào)修。經(jīng)典案例2故障現(xiàn)象:經(jīng)典案例2(續(xù))故障排除:

首先觀察交換機(jī),發(fā)現(xiàn)網(wǎng)吧內(nèi)所有的交換機(jī)網(wǎng)絡(luò)指示燈都在以相同的頻率在閃,斷開局域網(wǎng),使用筆記本直接接在路由器上進(jìn)行上網(wǎng)測試,一切正常,故障顯然出在局域網(wǎng)內(nèi),把所有交換機(jī)之間的級聯(lián)線斷開,先插上主交換機(jī),無異常,再一臺一臺的接入分交換機(jī),接到第三臺的時候故障出現(xiàn)了,到那個交換機(jī)上查網(wǎng)線,為了快速排除故障,那臺交換機(jī)上的所有網(wǎng)線都被拔了下來,然后一個一個插回經(jīng)典案例2(續(xù))故障排除:經(jīng)典案例2(續(xù))去,最后發(fā)現(xiàn)其中一根網(wǎng)線是級聯(lián)線,被人插在了同一個交換機(jī)上造成數(shù)據(jù)回路,拔掉這根網(wǎng)線后網(wǎng)絡(luò)恢復(fù)正常。

故障總結(jié):故障處理完之后詢問業(yè)主為什么這么插,業(yè)主說當(dāng)時也沒注意,看見有水晶頭的網(wǎng)線就往交換機(jī)上插,不知道這根網(wǎng)線是干啥的。技術(shù)人員告訴業(yè)主以后再動網(wǎng)線的時候最好有個技術(shù)在場的情況下再動。

經(jīng)典案例2(續(xù))去,最后發(fā)現(xiàn)其中一根網(wǎng)線是級聯(lián)線,被人2數(shù)據(jù)鏈路層數(shù)據(jù)鏈路層的故障一般包括以下幾個方:1)數(shù)據(jù)鏈路層幀的問題,通常的幀錯發(fā)、重發(fā)、丟失及幀碰撞等。2)數(shù)據(jù)幀的流量控制及差錯控制。3)鏈路層地址的設(shè)置。4)鏈路層協(xié)議的匹配問題,在相互連接的兩端口應(yīng)該使用同一種協(xié)議封裝。5)鏈路通信的時鐘同步問題。6)數(shù)據(jù)終端設(shè)備(DTE)在數(shù)據(jù)鏈路層驅(qū)動程序的加載問題。2數(shù)據(jù)鏈路層數(shù)據(jù)鏈路層的故障一般包括以下幾個方:經(jīng)典案例3故障現(xiàn)象:某校網(wǎng)絡(luò)教室中的計(jì)算機(jī)是通過校園網(wǎng)中的代理服務(wù)器共享上網(wǎng)的。一天,上網(wǎng)后不久,發(fā)現(xiàn)計(jì)算機(jī)瀏覽Internet的速度很慢,以為是開啟程序太多引起計(jì)算機(jī)的內(nèi)存不足,就重新啟動機(jī)器??芍貑⒑筮€是老樣子,換一臺機(jī)器上網(wǎng)也是如此。

經(jīng)典案例3故障現(xiàn)象:經(jīng)典案例3(續(xù))故障排除:由于多臺計(jì)算機(jī)都出現(xiàn)了網(wǎng)速很慢的毛病,因此初步判斷是代理服務(wù)器出問題了。檢查代理服務(wù)器,發(fā)現(xiàn)服務(wù)器鼠標(biāo)和鍵盤都無法響應(yīng),出現(xiàn)了死機(jī)故障。沒辦法,只得按下Reset鍵重新啟動系統(tǒng),可在快進(jìn)入系統(tǒng)界面時又死機(jī)了。難道是服務(wù)器操作系統(tǒng)崩潰了?立即用先前備份的Ghost鏡像將系統(tǒng)分區(qū)恢復(fù)了一遍,再次啟動機(jī)器,不料還是老樣子??磥聿⒎擒浖收??;蛘呖赡苁怯捎诮?jīng)典案例3(續(xù))故障排除:經(jīng)典案例3(續(xù))很久沒有打開機(jī)箱清理,計(jì)算機(jī)內(nèi)部灰塵積聚太多,配件晝夜運(yùn)轉(zhuǎn)在散熱不良的環(huán)境中,引起CPU怠工了吧?拿來螺絲刀正想打開機(jī)箱查個究竟,發(fā)現(xiàn)機(jī)箱后面板網(wǎng)卡口上的黃燈急速閃爍著,再看看機(jī)柜內(nèi)的交換機(jī),所有的指示燈也同樣都異常急速地閃爍著。網(wǎng)絡(luò)故障莫不是由數(shù)據(jù)阻塞引起的?試著關(guān)閉交換機(jī)電源,稍等一下再重新打開,然后再次啟動服務(wù)器。這次服務(wù)器竟然能正常啟動了,通過各終端訪問Intenet,一切恢復(fù)了正常。經(jīng)典案例3(續(xù))很久沒有打開機(jī)箱清理,計(jì)算機(jī)內(nèi)部灰塵積聚太多經(jīng)典案例3(續(xù))故障總結(jié):此次由交換機(jī)數(shù)據(jù)阻塞引起的網(wǎng)絡(luò)故障,由于沒有首先檢查交換機(jī),使本來只需開關(guān)一下交換機(jī)電源就能解決的問題,卻走了不少彎路。由此提醒大家:檢查網(wǎng)絡(luò)故障時,千萬不要把目光只停留在網(wǎng)絡(luò)的某一個節(jié)點(diǎn)上,而要對整個鏈路系統(tǒng)做綜合觀察,才能少走彎路。

經(jīng)典案例3(續(xù))故障總結(jié):3網(wǎng)絡(luò)層網(wǎng)絡(luò)層提供建立、保持和釋放網(wǎng)絡(luò)層連接的手段,包括路由選擇、流量控制、傳輸確認(rèn)、中斷、差錯及故障恢復(fù)等。排除網(wǎng)絡(luò)層故障的基本方法是沿著從源到目標(biāo)的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應(yīng)該通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論