故障定位思路與處理方法_第1頁
故障定位思路與處理方法_第2頁
故障定位思路與處理方法_第3頁
故障定位思路與處理方法_第4頁
故障定位思路與處理方法_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

目錄TOC\o"1-5"\h\z\o"CurrentDocument"第3章故障處理思路與方法3-1\o"CurrentDocument"3.1對維護人員的要求3-1\o"CurrentDocument"3.1.1加強SDH基本原理,尤其是告警信號流的學習3-1\o"CurrentDocument"3.1.2熟練掌握所維護傳輸設備的基本操作3-1\o"CurrentDocument"3.1.3熟悉所維護局的情況3-2\o"CurrentDocument"3.1.4故障發(fā)生時作好現(xiàn)場數(shù)據(jù)的采集與保存工作3-2\o"CurrentDocument"3.2故障處理的基本思路一一先定位故障,再排除故障3-3\o"CurrentDocument"3.2.1故障處理的關(guān)鍵一一故障定位3-3\o"CurrentDocument"3.2.2故障排除3-3\o"CurrentDocument"3.3故障定位的步驟3-4\o"CurrentDocument"“先排除外部,后定位傳輸”3-4\o"CurrentDocument"“先定位單站,后定位單板”3-4\o"CurrentDocument"“先高速部分,后低速部分”3-4\o"CurrentDocument"“先高級別告警,后低級別告警”3-4\o"CurrentDocument"3.4故障定位的常用方法3-6\o"CurrentDocument"3.4.1告警、性能分析法3-6\o"CurrentDocument"環(huán)回法3-12\o"CurrentDocument"替換法3-18\o"CurrentDocument"3.4.4配置數(shù)據(jù)分析法3-18\o"CurrentDocument"3.4.5更改配置法3-19\o"CurrentDocument"3.4.6儀表測試法3-19\o"CurrentDocument"3.4.7經(jīng)驗處理法3-20\o"CurrentDocument"3.4.8各種故障定位法的比較3-20\o"CurrentDocument"3.5排除傳輸設備外部故障的方法3-22\o"CurrentDocument"3.5.1定位對接設備故障3-223.5.2光纖故障的確定3-233.5.3供電電源故障的確定3-243.5.4接地問題的確定3-24第3章故障處理思路與方法正常運行的OptiX光傳輸設備在多方面的原因影響下(比如受系統(tǒng)外部環(huán)境的影響、部分元器件的老化損壞、維護過程中的誤操作等),有時可能會進入不正常運行的狀態(tài)。此時,就需要維護人員能夠?qū)υO備故障進行正確的分析、定位和排除,使系統(tǒng)迅速恢復正常。本章介紹故障處理的基本思路及常用的故障處理方法。3.1對維護人員的要求能否快速定位和及時排除故障,對維護人員的業(yè)務技能、操作規(guī)范、心理素質(zhì)等都是有較高要求的。3.1.1加強SDH基本原理,尤其是告警信號流的學習要求維護人員做到對SDH傳輸系統(tǒng)告警信號流非常熟悉,平時重視SDH基礎(chǔ)知識、基本原理的學習。對于影響業(yè)務和性能的各單板危急告警、主要告警,要掌握其產(chǎn)生的機理、相應的告警回傳(告警回傳指下游告警后對上游的告警回送,比如MS_RDI)以及對下游信號的影響。只有對每個告警的機理、影響都非常熟悉,才能更好地利用這些告警信息,對故障原因做出一個清晰的判斷。維護手冊的第五章“OptiX設備告警產(chǎn)生原理”中詳細講解了SDH光傳輸系統(tǒng)的告警信號流。建議維護人員在從事維護工作前經(jīng)過專門的OptiX光傳輸設備原理和維護培訓。3.1.2熟練掌握所維護傳輸設備的基本操作要求維護人員熟練掌握網(wǎng)管設備、網(wǎng)元設備以及相關(guān)測試儀表的基本操作。需要掌握的基本操作有:告警、性能的設置和查詢操作;SDH接入板(線路板)、PDH接入板(支路板)的內(nèi)環(huán)回和外環(huán)回操作;復用段協(xié)議的啟動和停止操作;插拔單板操作;誤碼測試儀的使用等。維護人員平時要加強對網(wǎng)管操作手冊、設備維護手冊的學習,多實踐、多鍛煉,逐步達到熟練操作的程度。3.1.3熟悉所維護局的情況要求維護人員對所維護局的組網(wǎng)情況、保護方式、業(yè)務配置、機房設備的布局非常清楚。對設備在各種運行狀態(tài)下,每個業(yè)務的源和宿、占用的時隙以及經(jīng)過的站點要非常清楚,平時要注意了解所維護局的情況,加強對工程文檔的學習,作好工程文檔的維護工作。3.1.4故障發(fā)生時作好現(xiàn)場數(shù)據(jù)的采集與保存工作在進行故障處理前,要求維護人員首先采集、保存故障現(xiàn)場數(shù)據(jù),這是非常重要的工作。事實上很常見的一種情況是:由于缺乏故障現(xiàn)場數(shù)據(jù),雖然設備已經(jīng)恢復正常運行,但故障的真正原因卻無法查清!造成設備運行的極大隱患。在故障的處理過程中,不可避免地會破壞故障現(xiàn)場數(shù)據(jù),而詳實的故障現(xiàn)場數(shù)據(jù),對于查清故障原因是很有用的。需要現(xiàn)場采集保存的主要數(shù)據(jù)有系統(tǒng)告警及性能數(shù)據(jù)、各網(wǎng)元及單板的配置和運行狀態(tài)數(shù)據(jù)、網(wǎng)管的操作日志(需要將日志轉(zhuǎn)儲)等。另外,還要求維護人員作好操作記錄,將排除故障過程中的每一步操作都認真記錄下來。保存維護數(shù)據(jù)對于后續(xù)的事故原因析是非常有用的,同時可作為一個經(jīng)驗保留下來,為以后處理類似故障提供指導。3.2故障處理的基本思路一一先定位故障,再排除故障3.2.1故障處理的關(guān)鍵一一故障定位由于傳輸設備自身的應用特點一一設備與設備之間的距離較遠,在沒有確定故障發(fā)生在哪里,是無法進行故障排除的。因此,進行SDH傳輸設備故障處理,就需要逐步縮小故障發(fā)生的范圍,最后確定故障發(fā)生點,再進行故障排除;也就是,“先定位故障,再排除故障”。縮小故障發(fā)生的范圍,就是先要在傳輸網(wǎng)中確定故障發(fā)生在哪一套設備,再確定在哪一個板件(單板、電纜、尾纖等),再確認故障定位的正確性,這樣才能排除故障。因此,故障處理的關(guān)鍵在于故障的定位,故障定位的關(guān)鍵就是將故障點從全網(wǎng)準確地定位到設備。在進行故障定位時,將故障點準確地定位到設備是極其重要的。在將故障點準確地定位到單站之前,憑空猜測這個站或那個站、這塊板或那塊板的問題,都是徒勞的,只會延誤問題的解決。一旦將故障定位到單站后,就可以集中精力,通過數(shù)據(jù)分析、硬件檢查、更換單板等手段來排除該站的故障。3.2.2故障排除定位了對于傳輸設備故障后,故障的排除就很簡單。故障的排除是在進行嚴謹?shù)耐评?,確認發(fā)生故障點后,進行針對故障發(fā)生點故障排除:基本故障排除(排除尾纖、電纜中斷,電源故障等);采用備用板件替換故障板件。科總結(jié):故障處理的關(guān)鍵在于故障的定位,故障定位的關(guān)鍵就是將故障點從全網(wǎng)準確地定位到設備。3.3故障定位的步驟故障定位的一般原則可總結(jié)為四句話:先排除外部,后定位傳輸;先定位單站,后定位單板;先高速部分,后低速部分;先高級別告警,后低級別告警?!跋扰懦獠?,后定位傳輸”在定位故障時,應先確定與傳輸設備連接的設備(如交換機、接入網(wǎng)設備、無線基站、路由器等)沒有發(fā)生故障。然后,排除傳輸設備外部的連接故障(如光纖/電纜故障),電源故障,接地故障等。傳輸設備與外的光纖、電纜等接口很多,都很有可能發(fā)生故障。因此,在沒有排除外部故障的可能時,對傳輸設備的故障定位可能是徒勞的?!跋榷ㄎ粏握?,后定位單板”先從全網(wǎng)的角度定位故障發(fā)生在哪一個單站,然后才有可能對發(fā)生故障的單板進行定位。進行這一步故障定位必須經(jīng)過嚴謹?shù)耐茢?,證明故障發(fā)生的確實位置;憑空猜測和不嚴謹?shù)耐茢?,只會貽誤故障處理時間?!跋雀咚俨糠?,后低速部分”先觀察分析高速部分(光路單元),再分析低速部分(支路單元)。因為線路部分的故障往往會引發(fā)一連串支路告警,所以應該先從線路告警開始著手進行分析,定位是否高速部分故障,或者排除高速部分故障的可能?!跋雀呒墑e告警,后低級別告警”在分析告警時,應首先分析告警級別高的告警,然后再分析低級別的告警。比如先分析危急告警、主要告警,再分析提示告警和一般告警。高級別告警會衍生出低級別告警,低級別告警通常不會衍生出高級別告警。設備出現(xiàn)故障時,往往會出現(xiàn)大量告警、性能事件,但只有其中幾個告警是基本告警,與故障息息相關(guān)的,可通過這些基本告警直接定位出故障點。還有一些告警則是由這些基本告警衍生出來的,不能通過它們定位出故障點。3.4故障定位的常用方法故障定位的常用方法有:告警、性能分析法環(huán)回法替換法配置數(shù)據(jù)分析法更改配置法儀表測試法經(jīng)驗處理法其中最為常用的前三種,可簡單地總結(jié)為:一分析;二環(huán)回;三換板?!耙环治觥碑敼收习l(fā)生時,首先采用“告警、性能分析法”通過對告警事件、性能事件、業(yè)務流向及告警信號流向的分析,逐步判斷故障發(fā)生的范圍;“二環(huán)回”通過對故障的告警、性能分法后,采用“環(huán)回法”通過逐段環(huán)回,逐步縮小故障范圍,并最終將故障定位到單站,乃至單板;“三換板”最后采用“替換法”通過換板排除故障。隨故障范圍、故障類型的不同,所使用的故障定位方法會有所不同。下面將對故障定位方法分別給予介紹。3.4.1告警、性能分析法SDH光同步傳輸系統(tǒng)相對于PDH很大的一個優(yōu)點,就是其幀結(jié)構(gòu)里定義了豐富的、包含系統(tǒng)告警和性能信息的開銷字節(jié),當SDH系統(tǒng)發(fā)生故障時,一般會伴隨有大量的告警事件和性能數(shù)據(jù)的產(chǎn)生,通過對這些信息的分析,可大致判斷出所發(fā)生故障的類型和位置?!案婢⑿阅芊治龇ā本褪峭ㄟ^對告警事件、性能事件、業(yè)務流向及告警信號流向的分析,逐步判斷故障發(fā)生的范圍的方法。使用告警、性能分析法,首先要及時、全面、真實地獲取故障信息。故障信息的來源一般有兩個渠道:一個渠道是通過網(wǎng)管軟件查詢傳輸系統(tǒng)當前或歷史發(fā)生的告警事件和性能數(shù)據(jù);另一個渠道是通過觀察設備指示燈的閃爍情況了解設備當前的運行狀況。這兩個獲取故障信息的途徑各有優(yōu)缺點。說明:傳輸設備的維護人員可大致分為兩類:在網(wǎng)管中心使用網(wǎng)管的網(wǎng)絡維護人員和傳輸機房內(nèi)的設備維護人員(網(wǎng)元維護人員)。作為網(wǎng)管中心維護人員,可通過網(wǎng)管查詢設備的詳細數(shù)據(jù),在設備出現(xiàn)故障時,有大量的告警、性能數(shù)據(jù)供其分析、定位,因此可以定位到較細、較精確的故障點,能判斷和處理常見的設備故障,對下屬站具有一定的技術(shù)支援能力。而作為設備維護人員,沒有網(wǎng)管可供使用,只能通過設備、單板告警燈閃爍情況來分析定位故障。通過網(wǎng)管獲取告警信息通過網(wǎng)管軟件可對全網(wǎng)傳輸設備的運行情況進行監(jiān)控和管理,因此通過網(wǎng)管軟件獲取的故障信息是非常全面的,不僅是一個站、一塊板的故障信息,而是全網(wǎng)設備的故障信息;通過該渠道獲取的故障信息也是非常確切的,可以知道當前設備存在什么告警,什么時間發(fā)生的,以前曾經(jīng)發(fā)生過什么歷史告警,性能不好時指針調(diào)整有多少等。因此,當故障發(fā)生時,維護人員使用網(wǎng)管獲取故障信息,可以將故障定位到較細、較準確的程度。但是,通過網(wǎng)管軟件獲取故障信息,維護人員有時也面臨告警、性能事件太多,無從著手分析的情況。另外,該途徑依賴于計算機、軟件、網(wǎng)管與網(wǎng)元之間的通信三者的正常工作,一旦以上三者之一出問題,該途徑獲取故障信息的能力將大大降低,甚至于完全失去。

注意:通過網(wǎng)管獲取告警或性能信息時,應注意保證網(wǎng)絡中各網(wǎng)元的當前網(wǎng)元運行時間設置正確,倘若網(wǎng)元時間設置錯誤,將會導致告警、性能信息不上報。在維護過程中,對某網(wǎng)元重下配置后,應特別注意將該網(wǎng)元的網(wǎng)元時間設為當前時間,否則網(wǎng)元會工作在缺省時間,而缺省時間并不是當前時間,會出現(xiàn)告警、性能不上報的錯誤。下面舉例說明告警性能數(shù)據(jù)分析法。例1:(1)故障現(xiàn)象在如圖3-1所示的鏈形組網(wǎng)中,網(wǎng)管計算機設在#1站,此時若#1站和#4站間的2M業(yè)務中斷,而且網(wǎng)管從#1站無法登錄#4站,且#3站東向光板有MS_RDI告警和HP_RDI告警,#1站與#4站間的業(yè)務所對應的2M通道有LP_RDI告警。(2)故障判斷根據(jù)告警可判斷:#4站沒有正確接收到#3站發(fā)出的信號,而#3站能正確接收到#4站發(fā)出的信號??赡艿墓收显蚴牵?3站東向光板發(fā)送信號有問題;也可能是光路問題(包括光纖和光纖接頭〕;還可能是#4站光板的接收信號問題。故障的進一步定位可以使用環(huán)回法,具體適用請參考“環(huán)回法”介紹。w圖3-1鏈形組網(wǎng)圖對于告警、性能分析法,除了可以借助于網(wǎng)管軟件查詢設備產(chǎn)生的告警或性能事件,還可以通過修改配置,人工插入告警對故障進行定位。w比如,若我們懷疑圖3-1中#2站的東向光板接#3站的東向光板,則可以通過網(wǎng)管在#2站東向光板人工插入MS_RDI(高階通道遠端接收缺陷指示告警),然后通過網(wǎng)管觀察#3站告警上報情況,若是西向光板上報MS_RDI告警,則說明#2站的東向發(fā)送端接的是#3站的西向接收端,光纖連接正確;若是#3站的東向光板上報了MS_RDI告警,則說明#2站東向發(fā)送端接到了#3站的東向接收端,光纖接反,需要糾正。2.通過設備上的指示燈獲取告警信息,進行故障定位OptiX光傳輸系統(tǒng)的設備上,設計有不同顏色的運行和告警指示燈,這些指示燈的亮、滅及閃爍情況,反映出設備當前的運行狀況或存在告警的級別。OptiX155/622H設備在正面與背面都有相同的指示燈,兩組指示燈指示的狀態(tài)相同。這些指示燈的顏色及含義如表3-1所示。表3-1指示燈的顏色及含義標號顏色意義ETH黃色以太網(wǎng)指示燈。當設備與網(wǎng)管終端利用網(wǎng)線相連時,燈亮起;否則,燈熄滅。RUN綠色運行燈。設備正常開工后,運行燈兩秒閃爍一次;否則,設備運行不正常。RALM紅色嚴重告警燈。出現(xiàn)級別為緊急的告警時,燈亮起;告警排除時,燈熄滅。YALM黃色一般告警燈。出現(xiàn)級別為主要或緊急的告警時,燈亮起;告警排除時,燈熄滅。FANALM黃色風扇告警燈。當風扇板上至少一個風扇停止工作時,燈亮起;告警排除時,燈熄滅。設備的指示燈的閃爍次數(shù)都有一定的含義,說明如下。(1)RUN(運行燈):當運行燈RUN快速閃動(每秒鐘亮滅1次),表示設備SCB板處于未開工狀態(tài)。設備SCB板未開工的可能原因是設備上電后,主機軟件未加載。當運行燈RUN亮1秒鐘、滅1秒鐘(每2秒鐘亮滅1次)時,表示設備SCB板處于開工狀態(tài),即單板上電后系統(tǒng)的主機軟件加載正常。(2)YALM、RALM告警燈當告警燈YALM和RALM都沒有亮時,表示本板無告警發(fā)生。當紅色告警燈RALM亮時,表示設備有嚴重告警事件發(fā)生。當黃色告警燈YALM亮時,表示本板有一般告警事件發(fā)生。設備指示燈可幫助維護人員及時了解設備的工作狀況,當紅燈亮時,表示設備檢測到有緊急告警事件發(fā)生,如無光信號輸入告警或同步源丟失告警等;當黃燈亮時,表示設備檢測到有主要或緊急告警事件發(fā)生,如支路倒換告警等。通過觀察指示燈的閃爍情況,我們可以大致定位故障的類型和可能的位置。比如,在發(fā)生故障時,發(fā)現(xiàn)綠色運行燈進入快閃狀態(tài),則可判斷故障的原因可能是SCB板主機軟件丟失,在進行確認后可通過重新下載主機軟件排除故障。從表3-1可以看出,設備指示燈所能傳遞的故障信息是有限的。因此,僅通過觀察設備指示燈進行故障定位難度比較大。但該方法也有優(yōu)勢,維護人員就在設備現(xiàn)場,不依賴任何工具就可實時觀察到有什么級別的告警,且在現(xiàn)場進行各種操作都比較方便。因此,通過觀察設備指示燈的閃爍情況并結(jié)合相關(guān)儀表的使用,維護人員應能對設備的簡單故障進行分析、定位。使用該方法要求維護人員熟練掌握各告警指示燈的不同閃爍狀態(tài)所代表的告警信息。注意:設備指示燈僅反映設備當前的運行狀態(tài),對于設備曾經(jīng)出現(xiàn)過但當前已結(jié)束的故障,無法表示。3.兩種獲取故障信息途徑的比較從上面的介紹可以看出,通過網(wǎng)管與通過觀察設備指示燈獲取設備故障信息,各有其優(yōu)、缺點一一通過網(wǎng)管軟件可以對全網(wǎng)設備的運行狀況進行全面的把握,而且對設備本身所存在的具體告警有確切的了解;而在現(xiàn)場通過觀察設備指示燈的狀態(tài),除了可實時了解到設備的運行情況外,還可以方便地在現(xiàn)場進行各種維護操作。因此,在實際的故障定位過程中,這兩種手段要結(jié)合起來使用。這兩種途徑的比較如表3-2所示。排除故障時,需要網(wǎng)管中心的維護人員與各站的設備維護人員共同參與,一般由網(wǎng)管中心的維護人員協(xié)調(diào)指揮,各站的設備維護人員密切配合,統(tǒng)一行動。表3-2兩種獲取故障信息途徑的比較網(wǎng)管設備指示燈主要使用者網(wǎng)管維護人員設備維護人員定位作用指揮配合告警信息全網(wǎng)、大量、確切單站、少量、模糊歷史告警有無告警時間可以看到無法知道性能事件可以看到無法知道計算機、軟件、通信狀態(tài)完全依賴無關(guān)3.4.2環(huán)回法我們可能會遇到一些問題,使用告警、性能分析法不能解決。一種是在組網(wǎng)、業(yè)務以及故障信息比較復雜的情況下,伴隨故障的發(fā)生,可能會產(chǎn)生大量的告警和性能事件;由于告警和性能事件太多,使得維護人員無從著手分析;第二種情況恰恰與第一種情況相反,某些特殊的故障,可能沒有明顯的告警或性能事件上報,有時甚至查不到任何告警或性能事件。在這種情況下,告警、性能分析法是無能為力的。如果發(fā)生上面兩種情況,我們不妨試一試另一種比較經(jīng)典的方法一一環(huán)回法。環(huán)回法是SDH傳輸設備定位故障時最常用、最行之有效的一種方法。該方法最大的一個特色就是,故障的定位可以不依賴于對大量告警及性能數(shù)據(jù)的深入分析。作為一名SDH傳輸設備維護人員,應熟練掌握。這種方法也有不能克服的缺陷,使用時會影響正常的業(yè)務,因此建議在業(yè)務量小的時候使用,比如在深夜進行。1.OptiX系統(tǒng)對軟件環(huán)回操作的支持對于環(huán)回操作,我們需要清楚:軟件環(huán)回是在單板內(nèi)部通過軟件設置實現(xiàn),環(huán)回后信號只經(jīng)過了單板的部分路徑,硬件環(huán)回相對于軟件環(huán)回而言環(huán)回更為徹底,因為它是在單板的外部通過人工實現(xiàn),環(huán)回后信號經(jīng)過了環(huán)回單板的全路徑,但它的操作不是很方便,需要到設備現(xiàn)場才能進行;而軟件環(huán)回雖然操作方便,但它定位故障的范圍和位置不如硬件環(huán)回準確。比如,在單站測試時,若通過光口的軟件內(nèi)環(huán)回,業(yè)務測試正常,并不能確定該光板沒有問題因為問題還可能出在光連接器上;但若通過尾纖將光口自環(huán)后,業(yè)務測試正常,則可確定該光板正常??傊?,軟件、硬件兩種環(huán)回方式各有所長,我們應根據(jù)實際情況靈活應用。表3-3OptiX光傳輸系統(tǒng)軟件環(huán)回操作及應用支持軟件環(huán)回的單板軟件環(huán)回操作類型環(huán)回級別應用SDH接口板內(nèi)環(huán)回、夕卜環(huán)回按VC-4通道級別或整個STM-N信號環(huán)回將故障定位到單站,且可初步判斷線路板是否存在故障,不需要更改業(yè)務配置。PDH接口板內(nèi)環(huán)回、夕卜環(huán)回按通道環(huán)回可定位交換機故障還是傳輸故障,且可初步判斷支路板是否存在故障。不需要更改業(yè)務配置。交叉單元線路環(huán)回、支路環(huán)回按業(yè)務通道環(huán)回單站故障的定位中,可定位是線路側(cè)故障還是支路側(cè)故障。需要更改業(yè)務配置,對操作人員要求較高。線路板環(huán)回可將故障定位到單站,同時可初步定位線路板是否存在故障,因此在實際中使用最多,要求維護人員熟練掌握。但使用線路環(huán)回需要特別注意的是,在對遠端站點進行環(huán)回操作時,千萬要小心,避免環(huán)回后發(fā)生遠端站點ECC通信中斷的問題。一旦遠端站點的ECC通信中斷,則只能到遠端站點現(xiàn)場才能排除環(huán)回和恢復ECC通信,從而延誤了故障的及時排除。若按VC-4通道環(huán)回一一其實是按幀結(jié)構(gòu)中第一個直插列進行環(huán)回,則對線路板第一個VC-4環(huán)回時,會影響ECC通信。警告:由于鏈形網(wǎng)中,兩站間的ECC通訊只有單路徑,無備份路徑,而在環(huán)形網(wǎng)中,兩站間的ECC通訊有兩條路徑,在一側(cè)ECC路徑中斷后,還可以通過另一側(cè)的ECC路徑與網(wǎng)元通訊,因此對鏈形網(wǎng)的線路板進行軟件環(huán)回時,需要慎重,對于環(huán)形網(wǎng)的線路板進行軟件環(huán)回時,一般沒有此問題。不過注意,環(huán)形網(wǎng)的一側(cè)光纖斷開后,將退化為鏈形網(wǎng)。支路板環(huán)回可用于定位交換機故障還是傳輸設備故障,同時可用來初步判斷支路板是否存在故障,在實際中使用較多,也要求維護人員熟練掌握。2.“環(huán)回法”的步驟在進行“環(huán)回”操作前,首先需確定對哪個通道、哪個時隙環(huán)回,應該在哪些位置環(huán)回,應該使用哪種環(huán)回一一外環(huán)回、還是內(nèi)環(huán)回。用環(huán)回法定位故障可以分四個步驟進行:第一步:環(huán)回業(yè)務通道采樣簡化通過咨詢、觀察和測試等手段,選擇其中一個的確有故障的業(yè)務通道作為處理、分析的對象。對于同時出問題的業(yè)務,一般都具有一定的相關(guān)性,因此只要恢復其中的一個業(yè)務,其它的業(yè)務常常能自動得到恢復。采樣簡化的思路,可以使得故障的分析、處理顯得更加清晰,簡單。尤其是在出故障的業(yè)務比較復雜的情況下,采樣簡化的方法更加顯得行之有效,甚至是解決問題的出發(fā)點或突破口。環(huán)回業(yè)務通道采樣簡化的過程可以描述如下:從多個有故障的站點中選擇其中的一個站點;在此站點,從多個有問題的業(yè)務通道中選擇其中的一個業(yè)務通道。由于自環(huán)第一個VC-4通道,會影響ECC通信,因此盡量不要選擇第一個VC-4通道內(nèi)的業(yè)務。針對STM-1的設備做環(huán)回時要遵循基本操作中環(huán)回操作的注意事項°(2M和VC-4分開說明)對所選擇出來的業(yè)務通道,先分析其中一個方向的業(yè)務。第二步:畫業(yè)務路徑圖畫出所采樣業(yè)務一個方向的路徑圖。在路徑圖中表示出:該業(yè)務的源和宿,該業(yè)務所經(jīng)過的站點,該業(yè)務所占用的VC-4通道和時隙。第三步:逐段環(huán)回,定位故障站點根據(jù)所畫出的業(yè)務路徑圖,采取逐段、逐站環(huán)回的方法,定位出故障站點。第四步:初步定位單板問題故障定位到單站后,通過線路、支路和交叉單元環(huán)回,進一步定位可能存在故障的單板。最后結(jié)合其它方法,確認存在故障的單板,并通過換板排除故障。3.“環(huán)回法”實際應用舉例仍以圖3-1為例,介紹“環(huán)回法”的應用。假設組成圖3-1鏈形傳輸網(wǎng)的四個網(wǎng)元1、2、3、4為OptiX155/622H設備。各站點間的時隙分配表如下表3-4所示。表3-4時隙分配表VC-4站名站點1站點2站點3站點41t4:1-161-16<>t4:1-16t4:17-3217-32<>t4:1-16t4:33-4833-48<>t4:1-16該局共用到了一個VC-4的業(yè)務;t4表示網(wǎng)元中的第4板位的2M支路板(IU4);支路板后面的數(shù)字表示2M通道號,例如“t4:1-16”表示第4板位的支路板上的1到16個2M通道;雙箭頭線上的數(shù)字表示所占用的VC-4中的時隙號。表中表示的業(yè)務為:(1)站1的t4支路板上1T6個2M通道,通過第1個VC-4中的1—16時隙,與站2的t4支路板上1—16個2M通道互通業(yè)務;⑵站1的t4支路板上17—32個2M通道,通過第1個VC-4中的17—32時隙,與站3的t4支路板上1—16個2M通道互通業(yè)務;(3)站1的t4支路板上33-48個2M通道,通過第1個VC-4中的33—48時隙,與站4的t4支路板上1—16個2M通道互通業(yè)務。注:本手冊示例中的業(yè)務分配關(guān)系,都將以此方法來表示?,F(xiàn)假設1號站與2、3、4站間的業(yè)務全部中斷,使用“環(huán)回法”定位故障的步驟如下:第一步:中斷業(yè)務采樣?,F(xiàn)2、3、4站與1站的業(yè)務均中斷,選取3號站業(yè)務進行分析;3號站共有16個業(yè)務中斷,選取t4支路板第1個2M業(yè)務進行分析;首先分析從1站到3站方向的業(yè)務。第二步:畫中斷業(yè)務路徑圖從時隙分配表中可看出,所采樣中斷業(yè)務的源為1號站的t4:17,占用第1個VC-4的第17個2M時隙;經(jīng)過的中間站點是2號站;業(yè)務的宿是3號站的t4:1。這樣可畫出中斷業(yè)務的路徑如圖3-2所示。。方"Wh%2接著,按順序進行如下操作(注意,在每一次進行環(huán)回操作前,要取消上一步所作的環(huán)回):對1號站西向光板第1接著,按順序進行如下操作(注意,在每一次進行環(huán)回操作前,要取消上一步所作的環(huán)回):對1號站西向光板第1個VC-4作內(nèi)環(huán)回,監(jiān)測業(yè)務是否正常,如正常,取消此環(huán)回,進入下一步;對2號站東向光板第1個VC-4作內(nèi)環(huán)回,監(jiān)測業(yè)務是否正常,如正常,取消此環(huán)回,進入下一步;對3號站東向光板第1個VC-4作內(nèi)環(huán)回,監(jiān)測業(yè)務是否正常。環(huán)回到哪一站業(yè)務不通,則可定位出是那一站有問題。故障定位到站點后,則集中精力將該站的故障排除,然后繼續(xù)檢查是否還有存在故障的站點,直至將所有故障排除,業(yè)務恢復?!碍h(huán)回法”小結(jié)從上面故障定位的過程可以看出,“環(huán)回法”不需要花費過多的時間去分析告警或性能事件,而可以將故障較快地定位到單站乃至單板。而且,該方法操作簡單,維護人員較容易掌握,這是該方法的優(yōu)勢。但假若所環(huán)回的VC-4通道內(nèi)有其它正常的業(yè)務,“環(huán)回法”必然會導致正常業(yè)務的暫時中斷,這是該方法最大的一個缺點。因此,一般只有出現(xiàn)業(yè)務中斷等重大事故時,才圖3-2中斷業(yè)務路徑圖第三步:逐段環(huán)回,定位故障站點依據(jù)圖3-2中斷業(yè)務的路徑圖,在1號站t4支路板的第17個2M通道外接一個2M誤碼儀,監(jiān)測業(yè)務好壞。ffl竅門:若對告警信號流比較熟悉,也可以通過觀察異常告警的結(jié)束與否,判斷業(yè)務是否已經(jīng)恢復。一般情況下,業(yè)務的恢復,常常會伴隨大量告警的結(jié)束;業(yè)務一中斷,常常會伴隨大量告警的產(chǎn)生。使用環(huán)回法進行故障排除。另外,上面說過,當環(huán)回線路的第一個VC-4通道時,可能會影響網(wǎng)元間的ECC通信,這也是該方法的一個不足。3.4.3替換法“替換法”就是使用一個工作正常的部件去替換一個被懷疑工作不正常的部件,從而達到定位故障、排除故障的目的。這里的部件,可以是一段線纜、一塊單板或一套設備?!疤鎿Q法”適用于排除傳輸設備外部的問題,如光纖、中繼電纜、交換機、供電設備等;或故障定位到單站后,用于排除單站內(nèi)單板的問題。如圖3-1的示例中,我們懷疑3號站發(fā)與4號站收之間的光纖有問題,則可將3號站與4號站間收、發(fā)兩根光纖互換。若互換后,3號站東向光板的收有R_LOS告警,則說明是光纖的問題;若互換后,故障現(xiàn)象與原來一樣,則說明光纖沒有問題,而是光板的問題。此時,我們可以進一步使用替換法,分別替換3號站東向光板和4號站西向光板,來定位到底是哪塊光板的問題。如支路板某個2M通道有T_ALOS告警,我們懷疑是交換機或中繼線的問題,則可與其它正常通道互換一下。若互換后,T_ALOS告警發(fā)生了轉(zhuǎn)移,則說明是外部中繼電纜或交換機的問題;若互換后,故障現(xiàn)象不變,則可能是傳輸設備的問題。利用“替換法”,我們還可以解決其它如電源、接地等問題?!疤鎿Q法”的優(yōu)勢就是簡單,對維護人員的要求不高,是一種比較實用的方法。但該方法對備件有要求。插拔單板時,必須嚴格按照操作方法進行;若不小心,還可能導致板件損壞等問題的發(fā)生。3.4.4配置數(shù)據(jù)分析法在某些特殊的情況下,如外界環(huán)境條件的突然改變,或由于誤操作,可能會使設備的配置數(shù)據(jù)一一網(wǎng)元數(shù)據(jù)和單板數(shù)據(jù)遭到破壞或改變,導致業(yè)務中斷,倒換異常等故障的發(fā)生。通過告警性能分析,環(huán)回定位等方法將故障定位到單站后,可通過查詢、分析設備當前的配置數(shù)據(jù):如邏輯系統(tǒng)及其屬性、復用段的節(jié)點參數(shù)、線路板和支路板通道的環(huán)回設置、支路通道保護屬性、通道追蹤字節(jié)等是否正常,來查找故障原因。對于網(wǎng)管誤操作,還可以通過查看網(wǎng)管的操作日志來進行確認。舉例:某支路板通道保護不動作,我們就需要查看該支路板的通道屬性是否已配置為保護?!芭渲脭?shù)據(jù)分析法”適用于故障定位到單站后的進一步分析。該方法可以查清真正的故障原因。但該方法定位故障的時間相對較長,且對維護人員的要求較高,一般只有對設備較熟悉、且經(jīng)驗豐富的維護人員才使用。3.4.5更改配置法“更改配置法”所更改的配置內(nèi)容可以包括:時隙配置、板位配置、單板參數(shù)配置等。因此“更改配置法”適用于故障定位到單站后,排除由于配置錯誤導致的故障。更改配置法最典型的應用就是用來排除指針調(diào)整問題。若懷疑支路板的某些通道或某一塊支路板有問題,可以更改時隙配置將業(yè)務下到另外的通道或另一塊支路板;若懷疑某個板位有問題,可通過更改板位配置進行排除;若懷疑某一個VC-4有問題可以將業(yè)務時隙調(diào)整到另一個VC-4;另外交叉單元的自環(huán),也可以認為是“更改配置法”的一種。在升級擴容改造中,若懷疑新的配置有錯,可以重新下發(fā)原來的配置來定位是否配置問題。需要注意的是,一般來說,通過更改時隙配置,并不能將故障確切地定位到是哪塊單板的問題一一線路板、交叉單元、還是母板問題。此時,需進一步通過“替換法”進行故障定位。因此,該方法適用于沒有備板的情況下,初步定位故障類型,并使用其它業(yè)務通道或板位暫時恢復業(yè)務。應用“更改配置法”在定位指針調(diào)整問題時,可以通過更改時鐘的跟蹤方向以及時鐘的基準源進行定位。由于“更改配置法”操作起來比較復雜,對維護人員的要求較高。通常在沒有備板的情況下,用于臨時恢復業(yè)務,或用于定位指針調(diào)整問題。3.4.6儀表測試法“儀表測試法”一般用于排除傳輸設備外部問題以及與其它設備的對接問題。我們懷疑電源供電電壓過高或過低,就可以用萬用表進行測試;若懷疑對接不上是由于接地的問題,則可用萬用表測量對接通道發(fā)端和收端同軸端口屏蔽層之間的電壓值,若電壓值超過0.5V,可認為接地有問題;若懷疑對接不上是由于對接信號不匹配,則可通過相應的分析儀表觀察信號幀結(jié)構(gòu)是否正常,開銷字節(jié)是否正常,是否有異常告警等。通過“儀表測試法”分析定位故障,說服力比較強。缺點是對儀表有需求,同時對維護人員的要求也比較高。3.4.7經(jīng)驗處理法在一些特殊的情況下,如:由于瞬間供電異常、低壓或外部強烈的電磁干擾,致使傳輸設備某些單板進入異

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論