




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、人為故障研討,引入,針對目前網(wǎng)上運行的華為光網(wǎng)絡設備在日常運行過程中,由于維護人員在進行維護操作時違反日常維護建議或操作規(guī)范而引發(fā)的重大事故 側(cè)重于以下幾方面: 規(guī)范性: 安全性: 事故處理方面:,學習目標,了解發(fā)生人為故障的常見原因 學習、研討具體人為故障案例 掌握如何避免人為故障,學習完本課程,您應該能夠:,課程內(nèi)容,第一章 人為故障定義及危害 第二章 典型人為故障案例學習 第三章 小組討論,第一章 人為故障定義及危害,人為故障的定義 人為故障的危害,人為故障的定義,由于人為因素引起的業(yè)務中斷類設備故障,人為故障的危害,突發(fā)性:對故障的處理往往準備不及 責任性:需追究當事人責任 隱蔽性:給
2、定位故障帶來許多障礙,問題,如何才能避免人為故障的發(fā)生呢?,解答,提高技術水平 增加對所維護設備的了解 操作之前三思而行 增加責任心 加強日常維護制度的規(guī)范性 ,課程內(nèi)容,第一章 人為故障的定義及危害 第二章 典型人為故障案例學習 第三章 小組討論,參考資料,光網(wǎng)絡設備網(wǎng)上人為重大事故分析 故障排除案例集錦 光網(wǎng)絡維護速查手冊,第二章 典型人為故障案例學習,第一節(jié) 誤操作 第二節(jié) 違反日常維護建議,光纜錯連導致的全網(wǎng)業(yè)務中斷,【系統(tǒng)概述】 某用戶使用華為公司20多套OptiX155/622設備組成一通道保護環(huán),集中型業(yè)務。在工程中主站一側(cè)最后一段光纜未好,全網(wǎng)處于倒換狀態(tài),支路顯示PS告警,業(yè)
3、務正常。 【故障現(xiàn)象】 某天下午,光纜施工完畢,將最后一段光路打通,業(yè)務正常。10分鐘后,全網(wǎng)業(yè)務中斷。,光纜錯連導致的全網(wǎng)業(yè)務中斷,【故障分析及排除】 將該段尾纖拔掉,業(yè)務立刻恢復正常??梢姙橹饔猛ǖ拦收?,再次檢查配置,無問題;懷疑交叉板故障,因網(wǎng)上有業(yè)務,不便處理;后想到用戶方面原因,可能為最后一段光纜接錯,讓用戶仔細檢查,確實為光纜接錯。,光纜錯連導致的全網(wǎng)業(yè)務中斷,【事故原因】 通道環(huán)原來處于倒換狀態(tài),業(yè)務正常。當最后一段光纜連好,因光纜連錯且該段光纜恰為我司另一個環(huán)的光纜,含有正常光信號,光板無法分辨是否為正確的光信號,RLOS告警消失,不再下插AIS,支路檢測不到TU-AIS,根據(jù)
4、通道倒換原理,10分鐘后選收主用通道。但因為此時光纜接錯,主用通道中無正常的業(yè)務信號,故實際業(yè)務中斷且網(wǎng)上無任何告警。,光纜錯連導致的全網(wǎng)業(yè)務中斷,【事故總結(jié)】 光纜接錯是用戶在升級擴容和熔接光纜時最常見問題,其原因一般多為連接光纜時太隨意或光纜沒有按照維護要求粘貼標簽;這類事故發(fā)生后通常會造成大面積的業(yè)務中斷,釀成重大事故。這里從維護的角度,向維護人員說明講解一下這類故障的現(xiàn)象與常用定位故障的方法。,光纜錯連導致的全網(wǎng)業(yè)務中斷,當此類事故發(fā)生后,一般表現(xiàn)的現(xiàn)象; a、組網(wǎng)為通道保護環(huán): 如果光纖自環(huán)或連接錯誤,不會有什么異常告警,但在光纜連接正常十分鐘后業(yè)務會中斷;因為此時斷纖西向的站點會默
5、認為主環(huán)光路恢復正常,而把備環(huán)的業(yè)務倒回倒主環(huán),導致業(yè)務中斷。 b、組網(wǎng)為復用段環(huán): 如果光纖自環(huán)或連接錯誤,光板上的R-LOS告警消失,但全網(wǎng)仍處于復用段保護倒換狀態(tài)下,業(yè)務沒有中斷;由于光纖連接錯導致斷纖兩端的網(wǎng)元無法從短徑正常收發(fā)K1K2字節(jié),因此復用段保護環(huán)始終處于保護倒換狀態(tài)下,無法恢復。,光纜錯連導致的全網(wǎng)業(yè)務中斷,預防措施:如何定位光纜是否連接錯誤 a、用網(wǎng)管檢查ECC通道是否正常,判斷光纜是否接錯:正常情況下,ECC路由應該走最短路徑,并且其每個DCC通道的收發(fā)字節(jié)應在同一數(shù)量級; b、用網(wǎng)管向光板下插MS-RDI告警,通過查詢下游站對應光板的告警信息來判斷光纜連接是否正確。
6、c、用網(wǎng)管軟件更改線路板的J1字節(jié),通過查詢下游站的告警信息是否上報HP-TIM告警來判斷光纜連接是否正確。(由于HP-TIM告警可能會下插AIS,此方法不適用于OptiX155/622設備的老子架,在OptiX系列設備與其他廠家設備進行對接時也不推薦使用此方法),未成環(huán)由于復用段協(xié)議啟動使業(yè)務中斷,【系統(tǒng)概述】 某工程由OptiX 2500+設備組成STM-16雙向復用段保護環(huán),1號站接網(wǎng)管,組網(wǎng)如圖所示。由于5號站和6號站之間的光纜可能很長時間不能到位,在開局時按復用段配置,但停止了復用段協(xié)議。各個站到1號站都有業(yè)務。 【故障現(xiàn)象】 某日,維護人員在網(wǎng)管上增加3號站到1號站之間的業(yè)務,對1
7、、2、3號站的配置進行了修改。配置修改完成后,交換機房反映4、5、6、7號站的業(yè)務出現(xiàn)了中斷。,未成環(huán)由于復用段協(xié)議啟動使業(yè)務中斷,【故障分析及排除】 查詢告警,發(fā)現(xiàn)1號站對應于4、5、6、7號站的業(yè)務出現(xiàn)了TU-AIS告警,而且1、2、3號站出現(xiàn)了PS告警。 檢查復用段狀態(tài),發(fā)現(xiàn)1號站為“倒換西向”、2號站為“穿通”、3號站為“倒換東向”。將1、2、3號站的復用段協(xié)議停止后,業(yè)務恢復正常。,未成環(huán)由于復用段協(xié)議啟動使業(yè)務中斷,【事故原因】 由于修改配置導致了復用段協(xié)議的異常啟動,影響了業(yè)務。 修改配置主機要進行校驗,會使復用段協(xié)議自動重新啟動。如,1號站復用段協(xié)議啟動時,由于其兩側(cè)的站復用段
8、協(xié)議是停止狀態(tài),1號站發(fā)出的用于檢測環(huán)路是否正常的K字節(jié)在環(huán)上不能穿通回到1號站,而且其它站對1號站發(fā)出的K字節(jié)也不會有響應,這種情況下1號站認為兩側(cè)網(wǎng)元失效,1號站協(xié)議啟動并進入雙端失效的狀態(tài),雙端失效并不會改變交叉板的數(shù)據(jù)。但在2號站協(xié)議啟動時,由于1號站收到了2號站的K字節(jié),1號站認為其東向正常會進入倒換西向,將導致1號站西向工作通道上的業(yè)務甩開,而且2號站也進入倒換東向。在1、2、3號站協(xié)議都啟動后,將出現(xiàn)1號站倒換狀態(tài)為“倒換西向”、2號站為“穿通”、3號站為“倒換東向”的現(xiàn)象。,未成環(huán)由于復用段協(xié)議啟動使業(yè)務中斷,【事故總結(jié)】 在主機復位、掉電重起、重新配置的情況下都可能導致復用段
9、協(xié)議自動啟動,由于這些情況很難預料,目前華為公司的工程規(guī)范要求對于沒有成環(huán)的網(wǎng)絡按鏈配置。,更改2500高階開銷穿通模式導致過環(huán)業(yè)務中斷,【系統(tǒng)概述】 某工程組網(wǎng)如下圖所示,由4個OptiX 2500+設備組成STM-16雙向復用段保護環(huán)。在1號站和3號站之間有一條155M業(yè)務,此業(yè)務在2號站穿通。在1號站和3號站分別用SQ1板與A廠家的SDH設備對接,開通過OptiX 2500+環(huán)的業(yè)務。,更改2500高階開銷穿通模式導致過環(huán)業(yè)務中斷,【故障現(xiàn)象】 某日維護人員在OptiX網(wǎng)管上操作,對網(wǎng)管的一些功能進行驗證時,忽然交換機房反映A設備經(jīng)過OptiX 2500+環(huán)的過環(huán)業(yè)務中斷。維護人員在A的
10、網(wǎng)管上檢查發(fā)現(xiàn)A1、A2設備與OptiX 2500+ SQ1板對接的155M光板上有HP-TIM告警。 【故障分析及排除】 維護人員用網(wǎng)管對3號站的SQ1光板相應光口作內(nèi)環(huán)回,在1號網(wǎng)元掛表進行測試,發(fā)現(xiàn)正常,基本排除OptiX 2500+的設備VC4不通導致業(yè)務不通。,更改2500高階開銷穿通模式導致過環(huán)業(yè)務中斷,因為A1、A2設備上報HP-TIM告警,而且A設備在J1失配的情況下會下插AIS導致業(yè)務不通,可以認為是J1字節(jié)失配導致了業(yè)務的中斷。檢查A1、A2設備實際接收的J1字節(jié)內(nèi)容,發(fā)現(xiàn)為“HuaWei SBS”,是OptiX設備缺省的J1字節(jié)內(nèi)容。 由于OptiX 2500+上測試該V
11、C4業(yè)務是正常的,而正常情況下OptiX 2500+的高階開銷是穿通模式,A1、A2設備的高階開銷通過OptiX 2500+環(huán)時能夠互相實現(xiàn)透傳,出現(xiàn)HP-TIM有可能是此VC4業(yè)務在某個OptiX 2500+網(wǎng)元上被設置為開銷終結(jié)模式。 逐步檢查1、2、3站各光板相應VC4的開銷模式設置,發(fā)現(xiàn)2號站東向光板相應VC4的開銷穿通模式被設置為終結(jié),重新設置為開銷穿通后,業(yè)務恢復。,更改2500高階開銷穿通模式導致過環(huán)業(yè)務中斷,【事故原因】 由于維護人員修改了OptiX 2500+的開銷穿通模式,通過查看網(wǎng)管上的操作記錄證實了這一點,而A設備在J1字節(jié)失配情況下下插AIS導致了業(yè)務中斷。 【事故總
12、結(jié)】 OptiX 2500+將VC4級別業(yè)務的高階開銷自動設置為穿通模式,方便了不同廠家設備之間的對接,尤其是能順利實現(xiàn)與ATM/IP業(yè)務的開通對接。如果錯誤的修改了開銷穿通模式,對高階業(yè)務會影響開銷的透傳。,更改2500高階開銷穿通模式導致過環(huán)業(yè)務中斷,在進行STM-N口對接時,某些廠家的設備,當檢測到J1或C2字節(jié)與期望值不一致時,缺省會下插AIS,導致業(yè)務中斷。而OptiX設備在缺省情況下,J1失配不會下插AIS,如果需要下插AIS可以通過軟件設置來實現(xiàn)。 對VC4級別業(yè)務,在SDH的高階開銷無論是處于穿通還是終結(jié)的模式下,用儀表測試結(jié)果都能顯示正常的原因是儀表沒有處理高階開銷失配。,時
13、鐘級別設錯導致斷纖后出現(xiàn)時鐘互鎖使基站中斷,【系統(tǒng)概述】 某工程組網(wǎng)如圖1所示,4個OptiX 設備組成單向通道保護環(huán),1號站為中心點,集中型業(yè)務,2、3、4號站西向跟蹤1號站的時鐘。網(wǎng)管為NES網(wǎng)管。,時鐘級別設錯導致斷纖后出現(xiàn)時鐘互鎖使基站中斷,【故障現(xiàn)象】 某日,2號站與3號站之間發(fā)生斷纖,業(yè)務正常倒換未受影響。30分鐘后,3號站和4號站所帶基站業(yè)務中斷,但3號站和4號站所帶的交換等業(yè)務未受影響,光纖恢復后,所有業(yè)務自動恢復。 為定位故障,在光纖恢復后,維護人員模擬斷纖倒換,故障現(xiàn)象再現(xiàn)。檢查告警和性能數(shù)據(jù),發(fā)現(xiàn)除大量的指針調(diào)整事件外,未發(fā)現(xiàn)其他異常告警和性能事件,光纖連接正常后,所有告
14、警和性能事件消失。,時鐘級別設錯導致斷纖后出現(xiàn)時鐘互鎖使基站中斷,【故障分析及排除】 從指針調(diào)整事件上分析,在2號站與3號站斷纖后,3號站和4號站與1號站不同步,導致頻繁發(fā)生指針調(diào)整。 查詢各站當前跟蹤源:進入NES網(wǎng)管的“配置/時鐘板/同步狀態(tài)”菜單,查詢各個站的當前時鐘源。查詢發(fā)現(xiàn)1號站為“內(nèi)部時鐘源”,2號站為“西向時鐘源1”,3號站為“東向時鐘源1”,4號站為“西向時鐘源1”??梢钥吹?號站和4號站的時鐘出現(xiàn)了互相跟蹤的現(xiàn)象。,時鐘級別設錯導致斷纖后出現(xiàn)時鐘互鎖使基站中斷,查詢各站時鐘優(yōu)先級:進入NES網(wǎng)管的“配置/時鐘板/時鐘源/優(yōu)先級”菜單,查詢3、4號站的時鐘配置。查詢發(fā)現(xiàn)3號站
15、的時鐘配置為“西向時鐘源1/東向時鐘源1/內(nèi)部時鐘源”;4號站的時鐘配置為“西向時鐘源1/內(nèi)部時鐘源”。 修改3號站的時鐘配置為“西向時鐘源1/內(nèi)部時鐘源”后,再次進行斷纖實驗,基站業(yè)務沒有出現(xiàn)中斷的現(xiàn)象,故障解決。,時鐘級別設錯導致斷纖后出現(xiàn)時鐘互鎖使基站中斷,【事故原因】 查看網(wǎng)管操作日志,發(fā)現(xiàn)是網(wǎng)管維護人員對3號網(wǎng)元的時鐘配置進行了修改。3號站西向斷纖后,3號站時鐘要進行倒換去跟蹤東向光板的時鐘;而4號站仍然跟蹤西向光板的時鐘。出現(xiàn)了3號站和4號站時鐘互鎖的情況。,時鐘級別設錯導致斷纖后出現(xiàn)時鐘互鎖使基站中斷,【事故總結(jié)】 在沒有使用S1字節(jié)時鐘保護的情況下,如果ADM站時鐘級別中同時有
16、西向時鐘源、東向時鐘源,在斷纖的情況下網(wǎng)元跟蹤下一個級別的時鐘,網(wǎng)絡可能會出現(xiàn)時鐘互跟的現(xiàn)象。 時鐘互鎖會導致時鐘性能隨時間增加而劣化,而基站需要從2M信號中提取時鐘,對時鐘比較敏感?;ユi一段時間后,基站會因為無法從2M信號中提取時鐘而中斷;而交換業(yè)務對時鐘要求較低,所以沒有此類問題(信令電路除外)。 華為公司的規(guī)范規(guī)定在未啟動S1字節(jié)時鐘保護時,網(wǎng)元時鐘級別只能選擇一個線路方向,防止發(fā)生時鐘互鎖現(xiàn)象。,網(wǎng)管誤做VC4環(huán)回導致業(yè)務和ECC中斷,【系統(tǒng)概述】 某局本地網(wǎng)采用OptiX 2500+系統(tǒng)組成一個兩纖復用段共享保護環(huán),全網(wǎng)共7個站。組網(wǎng)如下圖所示:,網(wǎng)管誤做VC4環(huán)回導致業(yè)務和ECC中
17、斷,【故障現(xiàn)象】 10月27日17:30時,維護人員申告7號網(wǎng)元的部分業(yè)務中斷并且無法登錄7號網(wǎng)元。 通過遠程維護發(fā)現(xiàn),10月27日16:30復用段環(huán)發(fā)生了倒換,1號網(wǎng)元和7號網(wǎng)元為倒換態(tài),其余站點為穿通態(tài)。業(yè)務中斷時間是17:20分,基本說明不是復用段倒換引起的故障。,網(wǎng)管誤做VC4環(huán)回導致業(yè)務和ECC中斷,【故障分析及排除】 經(jīng)了解,1號到7號網(wǎng)元間光纜下午16:30被施工挖斷,目前正在搶修光纜。檢查各網(wǎng)元復用段保護倒換參數(shù)設置,復用段段節(jié)點參數(shù)設置正確,排除倒換不正常的可能。查看業(yè)務配置,發(fā)現(xiàn)7號網(wǎng)元中斷的業(yè)務是到5號和6號網(wǎng)元的業(yè)務,并且走的是第1個VC4。結(jié)合7號網(wǎng)元ECC中斷的問題
18、,于是登錄6號網(wǎng)元使用ECC查詢命令,發(fā)現(xiàn)其東向的ECC通道只有發(fā)送字節(jié),接收字節(jié)很小,且不再發(fā)生變化,說明7號網(wǎng)元的西向光板ECC通道發(fā)送有問題。由于ECC通道走的是第一個VC4,而其他通道的VC4業(yè)務沒有影響,據(jù)此斷定是7號網(wǎng)元的西向光板故障。,網(wǎng)管誤做VC4環(huán)回導致業(yè)務和ECC中斷,詢問維護人員在17:20分對7號網(wǎng)元是否做過操作,維護人員承認對7號網(wǎng)元的西向光板的第1個VC4進行了內(nèi)環(huán)回。要求維護人員攜帶便攜機到7號網(wǎng)元,登錄后對西向光板進行解環(huán)回操作,業(yè)務于20:30恢復。 【事故原因】 維護人員在發(fā)生復用段保護倒換后,檢查倒換狀態(tài)和業(yè)務時,由于誤操作,對7號網(wǎng)元的西向第一個VC4進
19、行了內(nèi)環(huán)回,而引起故障。,網(wǎng)管誤做VC4環(huán)回導致業(yè)務和ECC中斷,【事故總結(jié)】 a、對光路的環(huán)回操作,是個危險操作,此類操作會導致整個VC4的業(yè)務中斷,還有可能引起ECC中斷。所以維護人員在做此類操作前,一定要仔細確認是否確實可以做環(huán)回,在網(wǎng)管上選擇的環(huán)回應用確認之前,要再次核對是否要環(huán)回VC4選擇是否正確。 b、進行環(huán)回操作之后,一定不要忘記解開環(huán)回。目前網(wǎng)管界面都提供環(huán)回指示的功能,做了環(huán)回操作的單板都有紅色的環(huán)回指示。 c、要將檢查單板是否有環(huán)回指示,做為日常維護中的一項重要工作。,網(wǎng)管誤操作導致復用段節(jié)點參數(shù)設置錯誤,【系統(tǒng)概述】 某局本地網(wǎng)采用OptiX 2500+系統(tǒng)組成一個兩纖復
20、用段共享保護環(huán),全網(wǎng)共7個站。組網(wǎng)如下圖所示:,網(wǎng)管誤操作導致復用段節(jié)點參數(shù)設置錯誤,【故障現(xiàn)象】 某日,1站與7站光纜中斷,復用段保護倒換正常。 當光纖恢復后,倒換恢復,但2站和6站狀態(tài)仍為穿通(P),而其它站復用段協(xié)議已恢復為空閑狀態(tài)(I)。 【故障分析及排除】 從故障現(xiàn)象分析,懷疑問題是復用段節(jié)點參數(shù)錯誤導致。檢查各網(wǎng)元復用段保護倒換參數(shù)設置,發(fā)現(xiàn)節(jié)點號為0的有兩個站點1站和6站,節(jié)點號為3的也有兩個站點2站和4站,復用段節(jié)點參數(shù)被修改導致了本次故障,重新設置了各節(jié)點復用段節(jié)點參數(shù)后倒換恢復正常。,網(wǎng)管誤操作導致復用段節(jié)點參數(shù)設置錯誤,【事故原因】 檢查NES網(wǎng)管中的數(shù)據(jù)設置,發(fā)現(xiàn)網(wǎng)管復
21、用段維護中多創(chuàng)建了一個環(huán)R0,依次包括6、7、1、2站。因為NES網(wǎng)管在創(chuàng)建復用段環(huán)時,會按照網(wǎng)管中創(chuàng)建的環(huán)生成節(jié)點信息并下發(fā)到網(wǎng)元,所以進行此操作時必須保證按照主環(huán)方向依次選擇環(huán)上的站點,否則會造成復用段倒換。本次故障就是因為沒有按照主環(huán)方向創(chuàng)建復用段環(huán)且站點選擇不全造成的倒換異常。 節(jié)點參數(shù)不連續(xù)時保護倒換會出現(xiàn)異常,在一些情況下可正常倒換;在一些情況下正常倒換后會出現(xiàn)無法恢復的現(xiàn)象。若沒有按主環(huán)方向設置,將節(jié)點參數(shù)設反或節(jié)點號重復、參數(shù)有錯,保護倒換可能無法成功。,網(wǎng)管誤操作導致復用段節(jié)點參數(shù)設置錯誤,【事故總結(jié)】 a、對復用段環(huán),在業(yè)務發(fā)生異常的時候,要先檢查一下環(huán)上各個節(jié)點的復用段倒
22、換狀態(tài)是否正確。如果確認光路正常而復用段出現(xiàn)了異常倒換,可以先停止協(xié)議;如果是由于復用段參數(shù)設置錯誤而導致的倒換失敗,在修改參數(shù)后再啟動協(xié)議。 b、對于網(wǎng)管中已設置好的復用段環(huán)路,非必要情況下不要重新設置。在網(wǎng)管中創(chuàng)建復用段環(huán)路信息的時候,會根據(jù)環(huán)路信息的設置情況,將新的復用段節(jié)點下發(fā)到網(wǎng)元。 c、在網(wǎng)管中創(chuàng)建復用段環(huán)時,必須保證按照東發(fā)西收的主環(huán)方向依次選擇環(huán)上的網(wǎng)元和邏輯系統(tǒng)。只有操作正確才能使復用段節(jié)點號從“0”開始(“0”可是環(huán)上任一節(jié)點),逐一遞增,最大節(jié)點號為環(huán)上節(jié)點數(shù)減1。 d、要將檢查復用段節(jié)點參數(shù)和協(xié)議狀態(tài)作為日常維護的項目;對網(wǎng)元重新下載過配置時也要檢查復用段參數(shù)和協(xié)議狀態(tài)
23、。,問題,如何才能避免誤操作的發(fā)生呢?,解答,提高技術水平 增加對所維護設備的了解 操作之前三思而行 增加責任心 加強日常維護制度的規(guī)范性 ,第二章 典型人為故障案例學習,第一節(jié) 誤操作 第二節(jié) 違反日常維護建議,PGND接地不良造成單板頻繁損壞,【系統(tǒng)概述】 某局傳輸由4個OptiX155/622設備組成雙向復用段保護環(huán),依主環(huán)方向依次為1、2、3、4號網(wǎng)元。1號網(wǎng)元為業(yè)務中心點,接有網(wǎng)管計算機。該局處于雷擊多發(fā)地帶,所有站點采用獨立接地的方式。,PGND接地不良造成單板頻繁損壞,【故障現(xiàn)象】 2號網(wǎng)元經(jīng)常發(fā)生單板損壞并造成業(yè)務中斷的事故,已累計損壞PL1板2塊,SL4板1塊,GTC板1塊。
24、某日,機房維護人員又反饋2號網(wǎng)元PL1板(1板位)、TDA板(2板位)在網(wǎng)管上板位為灰色(單板不在位),但業(yè)務正常。 【故障分析及排除】 1)攜帶備板趕到2號站,發(fā)現(xiàn)2號網(wǎng)元1板位的PL1板和2板位的TDA板運行燈每兩秒一閃,單板已與主控板失去聯(lián)系。 2)拔插PL1板后,PL1板運行燈快閃,單板無法正常開工,業(yè)務中斷。換上帶來的PL1板,正常開工后業(yè)務恢復。 同樣方法更換TDA板。,PGND接地不良造成單板頻繁損壞,3)查找2號網(wǎng)元的地線走向,發(fā)現(xiàn)傳輸機柜的BGND電纜接至直流柜的BGND銅排,直流柜的BGND銅排又接至戶外的地線排。而所有設備的PGND都接在機房內(nèi)的另一地排上,該地排與墻體外
25、漏的一根生銹的鐵線相連,明顯不符合接地規(guī)范。 4)對BGND和PGND地排進行地阻測試,其中BGND為2.1歐姆,基本符合要求;PGND為12歐姆,地阻明顯偏大。 5)將傳輸機柜BGND和PGND短接,并加裝PLB電源防雷盒,重新給設備加電,并確認業(yè)務正常。 6)遞交報告希望用戶進行2號站PGND地線整改(重新埋設地排)或在2號站采用聯(lián)合接地的方式。,PGND接地不良造成單板頻繁損壞,【事故原因】 單板不在位、但業(yè)務正常是雷擊造成單板接口芯片損壞的典型癥狀,由于2號網(wǎng)元經(jīng)常在雷雨天氣后發(fā)生單板損壞,再結(jié)合上面測試的數(shù)據(jù)得出結(jié)論,單板被雷擊損壞。 【事故總結(jié)】 根據(jù)有關規(guī)范的規(guī)定,建議接地電阻值
26、在綜合通信大樓宜小于1歐姆,在普通通信局(站)宜小于5歐姆(高土壤電阻率地區(qū)可放寬到10歐姆)。接地電阻值越小越好。 華為公司在OptiX設備日常維護建議中建議維護人員每年進行1次各站點的地阻測試,發(fā)現(xiàn)地阻值過高,要及時處理,排除雷擊隱患。,備份網(wǎng)管與網(wǎng)元數(shù)據(jù)不一致下載后業(yè)務中斷,【系統(tǒng)概述】 某干線工程,覆蓋了多個城市,組網(wǎng)如下圖所示。采用了OptiX iManager RMS網(wǎng)管進行管理,全網(wǎng)分別在3個城市設置了網(wǎng)管(RMS-1、RMS-2、RMS-3),其中RMS-1為中心網(wǎng)管,進行業(yè)務配置與電路管理,而RMS-2、RMS-3為備份網(wǎng)管。,備份網(wǎng)管與網(wǎng)元數(shù)據(jù)不一致下載后業(yè)務中斷,【故障現(xiàn)
27、象】 某日17時30分網(wǎng)上部分2M業(yè)務出現(xiàn)了TU-AIS告警,業(yè)務中斷。經(jīng)核實,出現(xiàn)中斷的業(yè)務都為RMS-1最近新增加的業(yè)務,并且這些中斷的業(yè)務均與NE-M號站有關。 【故障分析及排除】 用RMS-1網(wǎng)管查詢NE-M號站的配置,發(fā)現(xiàn)這些出現(xiàn)告警的業(yè)務配置已丟失。在RMS-2網(wǎng)管上檢查網(wǎng)管的操作日志,發(fā)現(xiàn)17時30分前后RMS-2網(wǎng)管對NE-M號站執(zhí)行過業(yè)務配置的操作。 初步判斷是由于RMS-2網(wǎng)管執(zhí)行的業(yè)務配置下發(fā)導致新增配置丟失,引起了業(yè)務的中斷。用RMS-1網(wǎng)管對NE-M重新下發(fā)正確的配置后,業(yè)務恢復。,備份網(wǎng)管與網(wǎng)元數(shù)據(jù)不一致下載后業(yè)務中斷,【事故原因】 業(yè)務配置都是由于中心RMS-1網(wǎng)
28、管完成的,RMS-1網(wǎng)管上的業(yè)務配置是最新的配置。RMS-2、RMS-3網(wǎng)管在異地,并且網(wǎng)管操作人員沒有更新過數(shù)據(jù),其網(wǎng)管配置數(shù)據(jù)是20多天前的配置數(shù)據(jù)。在事故發(fā)生時,又由于RMS-2網(wǎng)管操作人員的誤操作,在業(yè)務配置窗口誤按了“激活全部”,對NE-M號站業(yè)務進行了全量下發(fā),由于此時通過RMS-2網(wǎng)管下發(fā)網(wǎng)元的業(yè)務并不是最新業(yè)務,導致NE-M號站網(wǎng)元側(cè)的最新配置業(yè)務丟失,致使新增業(yè)務中斷。,備份網(wǎng)管與網(wǎng)元數(shù)據(jù)不一致下載后業(yè)務中斷,【事故總結(jié)】 1、在多網(wǎng)管情況下要讓備份網(wǎng)管起作用,應該定期進行數(shù)據(jù)同步操作,本案例中RMS-2、RMS-3網(wǎng)管就應該將每天將對全網(wǎng)網(wǎng)元業(yè)務進行一次查詢作為一項日常操作
29、來執(zhí)行。 2、“激活全部”操作是個危險操作,需要強調(diào)不要隨意使用此操作,對業(yè)務要按增量的方式進行增加和刪除。 3、要注意網(wǎng)絡的安全管理,制定有效的維護制度,加強密碼管理,設置相應權限的網(wǎng)管用戶,做維護時以維護權限用戶登錄,做網(wǎng)絡監(jiān)控時以監(jiān)視權限用戶登錄。平時進行網(wǎng)管監(jiān)控時應使用“監(jiān)視級別”的身份登錄,避免不必要的誤操作。,備份網(wǎng)管與網(wǎng)元數(shù)據(jù)不一致下載后業(yè)務中斷,4、OptiX系統(tǒng)提供了完善的網(wǎng)絡安全管理,可以通過設置網(wǎng)元用戶的級別和網(wǎng)管用戶的級別進行操作權限的控制。如,可以只給RMS-2和RMS-3網(wǎng)管分別分配只有監(jiān)視級別或維護級別的網(wǎng)元用戶,在這種情況下,即使RMS-2網(wǎng)管以配置級別的網(wǎng)管用
30、戶進行業(yè)務配置,但由于網(wǎng)元用戶操作權限的限制,RMS-2網(wǎng)管也不能對網(wǎng)元進行實際的業(yè)務配置。,風扇長期未清掃設備產(chǎn)生大量誤碼引起業(yè)務中斷,【系統(tǒng)概述】 某局本地傳輸網(wǎng)采用OptiX 155/622系統(tǒng)組 網(wǎng),整個網(wǎng)絡由5個622M網(wǎng)元組成,構(gòu)成一條無保護鏈,網(wǎng)絡結(jié)構(gòu)如圖6所示。縣局1站為網(wǎng)關網(wǎng)元連接網(wǎng)管終端,其它各站均只與縣局有2M業(yè)務,縣局時鐘設為自由振蕩,其它各站均跟蹤西向線路時鐘。,風扇長期未清掃設備產(chǎn)生大量誤碼引起業(yè)務中斷,【故障現(xiàn)象】 某一天,交換機房人員反映1號網(wǎng)元到3、4、5網(wǎng)元的2M通道有誤碼,影響業(yè)務。到2號網(wǎng)元的業(yè)務正常。 【故障分析及排除】 1、1號網(wǎng)元和3、4、5號網(wǎng)元
31、都出現(xiàn)了低階通道誤碼,問題應該出在共有的業(yè)務路徑上,初步定位到1號網(wǎng)元到3號網(wǎng)元之間。 2、如果1站中繼電纜或電源接地不好,也會導致2M產(chǎn)生誤碼。 從網(wǎng)管查詢當前性能,發(fā)現(xiàn)1號網(wǎng)元對3、4、5號網(wǎng)元相應的低階通道確實有誤碼性能事件,排除了中繼電纜接地不好的原因。,風扇長期未清掃設備產(chǎn)生大量誤碼引起業(yè)務中斷,查詢1站和其它各站線路板性能,發(fā)現(xiàn)2號網(wǎng)元東向SL4板、3號網(wǎng)元東西向SL4板、4號網(wǎng)元西向SL4板均有高階通道誤碼,說明問題是由于SL4板產(chǎn)生高階誤碼引起的低階誤碼。由于是3號網(wǎng)元相鄰站點都產(chǎn)生高階誤碼,問題可能出現(xiàn)在3號網(wǎng)元的STG、GTC、東西向SL4板。 通過對3號網(wǎng)元的東西向光板進
32、行VC4自環(huán),發(fā)現(xiàn)誤碼均未消失,說明不是1塊SL4出問題,但問題仍然無法定位。 在準備出發(fā)換板之前,查看3號網(wǎng)元性能數(shù)據(jù),發(fā)現(xiàn)3號網(wǎng)元溫度為36度,溫度偏高??紤]到當時是3月,室溫溫度不高,而性能上的溫度是在機柜頂部檢測的,也就是說網(wǎng)管上上報的溫度要與子架上單板的實際溫度有幾度的溫差,所以有可能是設備溫度過高導致誤碼。 詢問維護人員得知長時間未清潔過風扇。到現(xiàn)場后,發(fā)現(xiàn)風扇很臟,單板燙手,清掃風扇后,性能溫度變?yōu)?0度,同時誤碼也消失了。,風扇長期未清掃設備產(chǎn)生大量誤碼引起業(yè)務中斷,【事故原因】 對于誤碼問題,一般情況下低階誤碼是由高階誤碼引起的,所以應遵循先高階后低階的原則。高階誤碼產(chǎn)生的原
33、因主要是光板、交叉板故障,此外在很多南方地區(qū)設備溫度過高,導致光板性能劣化,也是產(chǎn)生誤碼的一個常見原因。 【事故總結(jié)】 嚴格按照日常維護建議進行日常維護操作是保證設備穩(wěn)定運行的有效保障。,風扇長期未清掃設備產(chǎn)生大量誤碼引起業(yè)務中斷,1、定期清掃風扇,OptiX設備維護建議中要求每月至少清掃2次風扇。例如本故障,根據(jù)季節(jié)的不同可以適當調(diào)整清掃風扇的時長,但也不應該長時間的不清掃。 2、同時,機房的通風、制冷效果也相應檢查,尤其要關注夏天時的空調(diào)使用情況。 3、定期監(jiān)測網(wǎng)元的溫度性能。另外,要注意由于設備上監(jiān)控溫度的傳感器位于機柜頂部,因此,監(jiān)控的溫度要比子架上單板的實際溫度低幾度。,換纖時沒有注
34、意光衰減器導致光功率過載出現(xiàn)誤碼,【系統(tǒng)概述】 某工程由OptiX 2500設備組成2.5G的復用段保護環(huán),1號站接網(wǎng)管,組網(wǎng)如下圖所示。1號站和4號站之間的距離為10km,為8芯的光纜,使用1、2號纖。,換纖時沒有注意光衰減器導致光功率過載出現(xiàn)誤碼,【故障現(xiàn)象】 某日,1號站的S16板上報RLOS,4號站的相應的S16板上報MSRDI。用光功率計在1號站ODF架測試收4號站的光功率,為收無光;在4號站測試S16的輸出光功率,為0dBm。 判斷是4號站發(fā)往1號站的光纖出現(xiàn)了問題。對光纜里的其它纖測試,發(fā)現(xiàn)3號纖可用。將尾纖換到3號纖后,告警消失但是性能事件上報RS、MS誤碼。,換纖時沒有注意光衰減器導致光功率過載出現(xiàn)誤碼,【故障分析及排除】 網(wǎng)管上查詢1號站收4號站的光功率為-3dBm,光功率實測也是這個值附近。懷疑是光功率過載導致的誤碼,檢查工程文檔中的光功率記錄表,發(fā)現(xiàn)工程期間記錄的值為-13dBm,但是注明在收端加了一個10dBm的光衰減器,而且使用的是長距的SS62S1603板。 在ODF架到S16單板之間并沒有找到光衰減器,光衰減原來可能裝在ODF架上。將“法蘭盤”卸下來觀察,一面寫有“S10”、另一面寫有“1550nm”的字樣,這應該是個光衰減器。用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)業(yè)項目合同標準文本
- 鄉(xiāng)鎮(zhèn)船舶售賣合同標準文本
- 臨時演出合同標準文本
- 公司出售商鋪合同標準文本
- 專用定制合同標準文本
- 會務會展框架合同范例
- 刊物合作合同標準文本
- 2025年廣東佛山市三水海江昇平建設工程有限公司招聘企業(yè)工作人員27人(第一批)筆試參考題庫附帶答案詳解
- 女性月經(jīng)不調(diào)的中醫(yī)調(diào)理方法
- 2025山東棗莊市國企招聘實習生高薪急聘人數(shù)106人筆試參考題庫附帶答案詳解
- 人名調(diào)解員培訓課件
- 大數(shù)據(jù)導論之大數(shù)據(jù)應用
- 能源托管服務投標方案(技術方案)
- 第七講社會主義現(xiàn)代化建設的教育、科技、人才戰(zhàn)略教學課件
- 2024屆安徽省阜陽市第十中學重點名校中考試題猜想數(shù)學試卷含解析
- 光伏-施工安全培訓
- 2023年初中學生綜合素質(zhì)自我評價標準版本
- 機器人制造與工藝
- 參保個人停保申請表
- 武漢光谷為明實驗學校六年級小升初語文測試卷(8套試卷帶答案解析)
- 兒童環(huán)內(nèi)環(huán)內(nèi)置式包皮
評論
0/150
提交評論