傳輸常見告警分析及處理_第1頁
傳輸常見告警分析及處理_第2頁
傳輸常見告警分析及處理_第3頁
傳輸常見告警分析及處理_第4頁
傳輸常見告警分析及處理_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

傳輸常見告警分析及處理網(wǎng)絡(luò)部/根底網(wǎng)維護(hù)中心PTN設(shè)備ETH端口告警PTN設(shè)備SDH及E1端口告警PTN設(shè)備硬件常見告警PTN設(shè)備其他常見告警PTN業(yè)務(wù)故障與告警對應(yīng)關(guān)系PTN告警分析及處理ETH鏈路故障及告警BTS1CESCESBTS2PTNPTNETHBTS3PTNMPLSPTNPTNMPLSPTNBSCCoreNetwrokPTNBSC10G/GEGE/FESTM-1STM-110G/GEETH_LOS光信號喪失故障原因:(1)光纖斷;(2)光模塊壞;(3)光衰減過大;ETH_LINK_DOWN網(wǎng)口連接故障故障原因:兩端工作模式不一致,造成協(xié)商失??;電纜、光纖連接或者對端設(shè)備故障。MAC_FCS_EXC誤碼越限故障原因:MAC層檢測到誤碼越限;線路信號劣化;光纖性能劣化;光口不潔凈ETH端口常見告警處理方法:ETH_LOS—以太網(wǎng)端口連接喪失告警步驟1:檢查以太網(wǎng)端口的電纜或光纖是否接好,插緊松脫的電纜或光纖。步驟2:檢查電纜或光纖是否存在故障,更換故障的電纜或光纖。步驟3:在網(wǎng)管上查看對端網(wǎng)元是否存在OUT_PWR_ABN告警。假設(shè)存在,優(yōu)先去除該告警后,查看本告警是否去除。假設(shè)告警未去除,清潔接收光口及光纖頭外表。假設(shè)告警仍未消除,檢查法蘭盤或光衰減器是否連接正確,光衰減器的衰減值是否過大。正確使用法蘭盤或光衰減器。假設(shè)告警仍未消除,通過增減光衰減器調(diào)整光功率至正常范圍內(nèi)。步驟4:更換上報告警的處理板。假設(shè)告警未消除,更換對端網(wǎng)元對應(yīng)的處理板??赡茉颍涸?:以太網(wǎng)端口的電纜或光纖沒有連接好。原因2:電纜或光纖故障。原因3:本端網(wǎng)元接收光功率過低。原因4:單板故障。ETH端口常見告警ETH_LINK_DOWN——網(wǎng)口連接故障告警可能原因:原因1:本端網(wǎng)元和對端網(wǎng)元的端口工作模式不一致,造成協(xié)商失敗。原因2:端口內(nèi)環(huán)回。原因3:纖纜連接到錯誤的端口。原因4:單板故障。處理方法:步驟1:在網(wǎng)管上查看兩端網(wǎng)元的以太網(wǎng)端口工作模式是否一致。假設(shè)不一致,修改設(shè)置,使兩端的端口工作模式一致后,查看告警是否去除。步驟2:在網(wǎng)管上查看兩端端口是否存在LOOP_ALM告警,假設(shè)存在,優(yōu)化去除LOOP_ALM告警后,查看本告警是否去除。步驟3:對照網(wǎng)元規(guī)劃表,查看上報告警的端口是否錯插了纖纜,造成兩端端口工作模式不一致。重新正確連接纖纜,去除告警。步驟4:在網(wǎng)管上查看兩端網(wǎng)元的相關(guān)單板是否存在HARD_BAD等硬件類告警。假設(shè)存在,更換存在硬件類告警的單板后,查看本告警是否去除。ETH端口常見告警MAC_FCS_EXC——MAC層檢測到誤碼越限告警可能原因:原因1:線路信號劣化。原因2:輸入光功率不正常。原因3:光纖頭外表不清潔。處理方法:步驟1:在網(wǎng)管上查看是否存在LOOP_ALM告警。假設(shè)存在,優(yōu)先清楚LOOP_ALM告警后,查看本告警是否去除。假設(shè)告警未去除,在網(wǎng)管上檢查是否存在DOS攻擊等。假設(shè)存在,消除非法發(fā)送大量數(shù)據(jù)的根源,查看告警是否去除。假設(shè)告警仍未去除,查看光纖或電纜是否存在故障。更換故障的光纖或電纜后,查看告警是否去除。步驟2:查看上報本告警的端口是否同時上報IN_PWR_ABN告警。假設(shè)存在,優(yōu)先去除IN_PWR_ABN告警后,查看本告警是否去除。步驟3:清潔光纖頭外表和處理板接收光口。PTN設(shè)備ETH端口告警PTN設(shè)備SDH及E1端口告警PTN設(shè)備硬件常見告警PTN設(shè)備其他常見告警PTN業(yè)務(wù)故障與告警對應(yīng)關(guān)系SDH鏈路告警排查BTS1CESCESBTS2PTNPTNETHBTS3PTNMPLSPTNPTNMPLSPTNBSCCoreNetwrokPTNBSCGEGE/FESTM-1STM-1GE/10GER_LOS光信號喪失故障原因:〔1〕斷纖;〔2〕線路衰耗過大;〔3〕對端站發(fā)送局部故障,線路發(fā)送失效;R_LOC時鐘喪失故障原因:(1)接收到的信號失效;(2)時鐘提取模塊故障;R_LOF幀喪失故障原因:〔1〕接收信號衰減過大;〔2〕對端站發(fā)送信號無幀結(jié)構(gòu);〔3〕本板接收方向故障SDH端口常見告警R_LOS——線路接收側(cè)信號喪失告警可能原因:激光器原因1:本端光口未使用,卻開啟激光器。激光器原因2:本端網(wǎng)元開啟了激光器,但對端網(wǎng)元激光器關(guān)閉,造成無光信號輸出。光纖原因1:本端單板光接口處未連接尾纖或者尾纖連接錯誤。光纖原因2:斷纖。光纖原因3:接收光功率過低。單板原因1:本端網(wǎng)元接收單板故障,線路接收失效。單板原因2:對端網(wǎng)元發(fā)送單板故障,線路發(fā)送失效。SDH端口常見告警處理方法:步驟1:在網(wǎng)管上查看光口的“激光口開啟狀態(tài)〞是否為“關(guān)斷〞。假設(shè)不是,關(guān)閉光口的激光器。在網(wǎng)管上查看對端網(wǎng)元對應(yīng)光口的“激光口開啟狀態(tài)〞是否為“開啟〞。假設(shè)不是,開啟對端光口的激光器。步驟2:檢查本端單板光接口處是否正確連接尾纖。假設(shè)尾纖未連接或者尾纖連接錯誤,請正確連接尾纖。檢查是否存在斷纖。假設(shè)存在,更換光纖。在網(wǎng)管上查看對端發(fā)送光口是否存在OUT_PWR_ABN告警。假設(shè)存在,優(yōu)先去除對端光口的告警后,查看本告警是否去除。假設(shè)告警未去除,清潔接收光口和光纖頭外表。假設(shè)告警仍未去除,檢查法蘭盤或光衰減器是否連接正確,光衰減器的衰減值是否過大。正確使用法蘭盤或光衰減器。假設(shè)告警仍未去除,通過增減光衰減器調(diào)整接收光功率至正常范圍內(nèi)。步驟3:假設(shè)本端單板接收光功率正常,設(shè)置端口為“內(nèi)環(huán)回〞。假設(shè)告警未去除,說明本端單板故障。更換故障單板。更換對端網(wǎng)元相應(yīng)的處理板。假設(shè)告警未去除,更換對端網(wǎng)元的交叉板。SDH端口常見告警R_LOF——線路接收側(cè)幀喪失告警可能原因:原因1:兩端光接口類型,即光模塊類型不一致。如一端為STM-1,另一端為STM-4。原因2:接收光功率異常。原因3:光纖錯連。原因4:對端發(fā)送信號無幀結(jié)構(gòu)。原因5:本端接收單板故障。處理方法:步驟1:依照網(wǎng)絡(luò)規(guī)劃,查看兩端光模塊類型是否正確。假設(shè)不正確,更換正確的光模塊。步驟2:在網(wǎng)管上查看上報告警的光口是否存在IN_PWR_ABN告警。假設(shè)存在,優(yōu)先去除IN_PWR_ABN告警后,查看本告警是否去除。步驟3:檢查光纖是否存在錯連。如存在,修正錯誤的連接后,查看告警是否去除。步驟4:在網(wǎng)管上查看對端發(fā)送單板是否存在HARD_BAD告警。假設(shè)存在,優(yōu)先去除對端發(fā)送單板的HARD_BAD告警后,查看本告警是否去除。E1鏈路告警BTS1CESCESBTS2PTNPTNETHBTS3PTNMPLSPTNPTNMPLSPTNBSCCoreNetwrokPTNBSCGE/10GEGE/FESTM-1STM-1GE/10GET_ALOS信號喪失故障原因:〔1〕E1/T1業(yè)務(wù)未接入;〔2〕DDF架側(cè)E1/T1接口輸出端口脫落或松動;〔3〕本站E1/T1接口輸入端口脫落或松動;〔4〕單板故障;〔5〕電纜故障ALM_E1RAI遠(yuǎn)端告警指示故障原因:對端有告警;E1端口常見告警T_ALOS——E1接口信號喪失告警可能原因:原因1:對端未發(fā)送E1業(yè)務(wù)。原因2:E1電纜脫落或松動。原因3:對端設(shè)備故障。原因4:電纜故障。原因5:上報告警的接口板故障。處理方法:步驟1:查看對端的E1業(yè)務(wù)是否正常發(fā)送。假設(shè)沒有,恢復(fù)對端E1業(yè)務(wù)的正常發(fā)送。步驟2:檢查E1電纜是否存在脫落或松動。假設(shè)存在,插緊脫落或松動的電纜,確保電纜與端口良好接觸。步驟3:在DDF架處對告警通道做自環(huán)〔硬件內(nèi)環(huán)回〕。優(yōu)先排除對端設(shè)備的故障。步驟4:假設(shè)在DDF架處對告警通道做自環(huán)后告警未消失,在接口板處對告警通道做自環(huán)〔硬件內(nèi)環(huán)回〕。假設(shè)告警消失,說明E1電纜故障。更換E1電纜。步驟5:假設(shè)在接口板處對告警通道做自環(huán)后告警未消失,在網(wǎng)管上對告警通道進(jìn)行內(nèi)環(huán)回設(shè)置。假設(shè)告警消失,說明接口板故障,更換接口板。E1端口常見告警ALM_E1RAI——對端網(wǎng)元E1鏈路告警可能原因:原因1:對端網(wǎng)元的E1鏈路上報T_ALOS、LFA、LMFA、UP_E1_AIS或DOWN_E1_AIS告警,本端網(wǎng)元收到對端網(wǎng)元下插的告警指示ALM_E1RAI。原因2:物理鏈路中斷。處理方法:步驟1:檢查對端網(wǎng)元的E1鏈路是否存在T_ALOS、LFA、LMFA、UP_E1_AIS或DOWN_E1_AIS告警,假設(shè)存在,優(yōu)先去除對端網(wǎng)元上的告警后,查看本告警是否消除。步驟2:查看物理鏈路是否存在中斷。假設(shè)存在,修復(fù)中斷的物理鏈路。E1端口常見告警UP_E1_AIS——上行方向2M信號告警指示

如果上行E1信號全1,上報此告警可能原因:原因1:對端網(wǎng)元存在T_ALOS告警。原因2:E1端口設(shè)置了內(nèi)環(huán)回。原因3:單板故障。處理方法:步驟1:在網(wǎng)管中查看對端網(wǎng)元是否存在T_ALOS告警。假設(shè)存在,優(yōu)先去除對端的T_ALOS告警后,查看本告警是否去除。步驟2:在網(wǎng)管上查詢E1端口是否存在LOOP_ALM告警。假設(shè)存在,修改E1端口配置為“不環(huán)回〞后,查看本告警是否去除。步驟3:在網(wǎng)管上查詢本端網(wǎng)元和對端網(wǎng)元是否存在HARD_BAD等硬件類告警。假設(shè)存在,硬復(fù)位上報硬件告警的單板,查看本告警是否去除。假設(shè)告警未去除,更換相應(yīng)單板后,查看本告警是否去除。E1端口常見告警DOWN_E1_AIS——下行方向2M信號告警指示

如果單板檢測到下行E1信號全1時就會上報此告警可能原因:原因1:本單板存在UP_E1_AIS或者T_ALOS告警。原因2:單板故障。處理方法:步驟1:在網(wǎng)管上查看本單板是否存在UP_E1_AIS或者T_ALOS告警。假設(shè)存在,優(yōu)先去除UP_E1_AIS或T_ALOS告警后,查看本告警是否去除。步驟2:在網(wǎng)管上查看本單板和交叉板是否存在HARD_BAD等硬件類告警。假設(shè)存在,硬復(fù)位上報硬件類告警的單板,假設(shè)本告警未去除,更換相關(guān)單板后,查看本告警是否去除。PTN設(shè)備ETH端口告警PTN設(shè)備SDH及E1端口告警PTN設(shè)備硬件常見告警PTN設(shè)備其他常見告警PTN業(yè)務(wù)故障與告警對應(yīng)關(guān)系硬件常見告警HARD_BAD——硬件故障告警可能原因:原因1:外接電源失效。原因2:單板與母板未良好接觸。原因3:單板硬件故障。原因4:假設(shè)接口板上報HARD_BAD告警,可能是對應(yīng)的處理板出現(xiàn)故障。處理方法:步驟1:確保正常電源接入后,查看告警是否去除。步驟2:拔出故障單板,確認(rèn)背板上的導(dǎo)針無異常。重新插入單板,使單板與母板良好接觸。步驟3:硬復(fù)位上報告警的單板,查看告警是否去除。假設(shè)告警未消除,更換上報告警的單板。步驟4:硬復(fù)位接口板對應(yīng)的處理板,參看告警是否去除。硬件常見告警BUS_ERR——總線錯誤告警可能原因:原因1:單板與背板接觸不良。原因2:單板故障。原因3:單板檢測到板間總線故障。處理方法:步驟1:檢查背板是否存在倒針。假設(shè)存在,修正背板的倒針。重新插拔上報告警的單板。步驟2:硬復(fù)位上報告警的單板。假設(shè)告警未消除,硬復(fù)位交叉板。假設(shè)告警仍未消除,更換上報告警的單板。步驟3:在網(wǎng)管上查看是否存在指示時鐘源喪失或時鐘源劣化的告警。假設(shè)存在,優(yōu)先去除時鐘類告警后,查看本告警是否去除。假設(shè)告警未去除,查看單板與背板接觸是否良好。硬件常見告警BD_STATUS——物理單板離線告警可能原因:原因1:單板正在硬復(fù)位。原因2:單板未插上,或單板插上,但與母板接觸不良。原因3:板間通訊故障。處理方法:步驟1:在網(wǎng)管的“運(yùn)行態(tài)〞槽位視圖中查看該單板的工作狀態(tài)是否為藍(lán)色,假設(shè)是,那么該單板處于硬復(fù)位狀態(tài)。等待3至5分鐘,該單板的工作狀態(tài)轉(zhuǎn)成綠色后,查看本告警是否消除。步驟2:檢查相應(yīng)槽位的單板是否插入。假設(shè)未插入,請插入相應(yīng)物理單板,告警將自動去除。檢查單板與母板是否接觸良好,母板連接器的導(dǎo)針是否歪斜。修正歪斜的導(dǎo)針,重新插拔單板使之與母板良好接觸,告警將自動去除。步驟3:在網(wǎng)管上查詢是否上報告警的單板或主控板是否存在HARD_BAD或COMMUN_FAIL告警。假設(shè)存在,更換上報告警的單板,查看告警是否消除。硬件常見告警COMMUN_FAIL——單板間通信失效告警可能原因:單板排查原因1:單板處于硬復(fù)位狀態(tài)。單板排查原因2:單板故障。主控板排查原因1:38M系統(tǒng)時鐘故障。主控板排查原因2:電源板故障,造成主控板3.3V電壓異常。主控板排查原因3:主控板不在位或故障。主控板排查原因4:主控板的EXT接口直接連接HUB或者交換機(jī)。硬件常見告警POWER_ABNORMAL——電源失效告警可能原因:單塊單板上報告警原因:單板電源模塊失效。多塊單板上報告警原因1:電源板故障。多塊單板上報告警原因2:電源輸入異常。硬件常見告警THUNDERALM——防雷失效告警可能原因:原因1:防雷電路保險管斷開。原因2:單板故障。處理方法:更換上報告警的單板,查看告警是否去除。硬件常見告警可能原因:原因1:制冷〔熱〕設(shè)備故障,導(dǎo)致環(huán)境溫度過高〔低〕。原因2:溫度告警上下限設(shè)置不符合實(shí)際情況。原因3:風(fēng)扇停止工作或防塵板積累灰塵太多。原因4:單板故障。處理方法:步驟1:檢測環(huán)境溫度是否高于45℃或者低于0℃。假設(shè)溫度異常,檢查制冷〔熱〕設(shè)備是否能正常調(diào)節(jié)環(huán)境溫度,優(yōu)先處理制冷〔熱〕設(shè)備故障。步驟2:查詢單板當(dāng)前工作溫度和溫度上下限設(shè)置,根據(jù)實(shí)際情況判斷溫度上下限值是否合理。假設(shè)溫度上下限設(shè)置不合理,重新設(shè)置上下限的數(shù)值。步驟3:檢查風(fēng)扇是否存在FAN_FAIL告警。假設(shè)存在,優(yōu)先處理該告警。檢查防塵網(wǎng)上積累的灰塵是否過多而導(dǎo)致散熱不及時。可將手置于風(fēng)扇出風(fēng)處感覺出風(fēng)的溫度和出風(fēng)是否順暢。假設(shè)因防塵網(wǎng)被堵塞而影響散熱效果,取出并清潔防塵網(wǎng)。步驟4:查看上報告警的單板是否還存在其它硬件類的告警,如HARD_BAD。假設(shè)存在,更換上報告警的單板。TEMP_OVER——單板工作溫度越限告警硬件常見告警可能原因:風(fēng)扇板上存在風(fēng)扇失效停轉(zhuǎn)。處理方法:FAN_FAIL——風(fēng)扇故障告警可能原因:風(fēng)扇板上存在風(fēng)扇失效停轉(zhuǎn)。重新拔插風(fēng)扇板。假設(shè)告警未消除,更換風(fēng)扇板。硬件常見告警可能原因:原因1:光口使能,但沒有安裝光模塊。原因2:光模塊或單板故障,監(jiān)測不到安裝的光模塊。處理方法:步驟1:查看光口是否安裝了光模塊。假設(shè)未安裝,對照工程文檔,安裝適宜的光模塊后,查看告警是否去除。步驟2:更換上報告警端口的光模塊,查看告警是否去除。假設(shè)告警未去除,更換上報告警的單板,查看告警是否去除。LSR_NO_FITED——激光器未安裝告警硬件常見告警可能原因:原因1:激光器老化。原因2:單板的檢測電路故障。處理方法:步驟1:更換光模塊,查看告警是否去除。步驟2:更換上報告警的單板,查看告警是否去除。LSR_WILL_DIE——激光器壽命即將終止告警硬件常見告警可能原因:原因1:拉手條被扳開。原因2:單板拉手條微動開關(guān)故障。處理方法:步驟1:查看上報告警的單板的拉手條是否被扳開。如果被扳開,重新扣好拉手條后,查看告警是否去除。步驟2:重新插拔上報告警的單板。假設(shè)告警未消除,更換上報告警的單板。W_OFFLINE——拉手條離位告警PTN設(shè)備ETH端口告警PTN設(shè)備SDH及E1端口告警PTN設(shè)備硬件常見告警PTN設(shè)備其他常見告警PTN業(yè)務(wù)故障與告警對應(yīng)關(guān)系其他鏈路常見告警IN_PWR_ABN—輸入光功率異常告警可能原因:原因1:對端網(wǎng)元發(fā)送光功率不正常。原因2:接收光功率高于正常范圍。原因3:接收光功率低于正常范圍。原因4:接收單板故障。處理方法:步驟1:在網(wǎng)管上,查詢對端網(wǎng)元是否存在OUT_PWR_ABN告警。假設(shè)存在,優(yōu)先去除對端網(wǎng)元的OUT_PWR_ABN告警。假設(shè)告警未去除,在網(wǎng)管上查詢本端網(wǎng)元接收光功率。步驟2:在接收光口處增加適當(dāng)?shù)墓馑p器,將輸入光功率調(diào)節(jié)到正常范圍內(nèi),查看告警是否去除。其他鏈路常見告警處理方法:步驟3:檢查本端網(wǎng)元尾纖彎曲半徑是否小于6cm。假設(shè)是,重新盤放尾纖后,查看告警是否消除。確認(rèn)光衰減器的衰減值是否適宜。假設(shè)不適宜,將光衰減器調(diào)整至適宜值,查看告警是否去除。檢查本端網(wǎng)元的光模塊是否存在松動或未插緊的情況。假設(shè)是,重新插好光模塊,查看告警是否去除。假設(shè)告警未去除,更換新的光模塊。清潔兩端網(wǎng)元的光纖接頭后,查看告警是否去除,具體操作請參見檢查及清潔光纖連接器。步驟4:檢查本端網(wǎng)元處理板和交叉板是否存在HARD_BAD或TEMP_OVER等硬件類告警。假設(shè)存在,更換上報告警的單板。其他鏈路常見告警OUT_PWR_ABN——輸出光功率異常告警可能原因:原因1:輸出光功率過高或過低。原因2:單板故障。處理方法:步驟1:更換上報告警的端口的光模塊,查看告警是否去除。步驟2:更換上報告警的單板,查看告警是否去除。其他鏈路常見告警LOOP_ALM——環(huán)回告警可能原因:原因1:端口配置了環(huán)回。原因2:業(yè)務(wù)配置成了環(huán)路。處理方法:步驟1:在網(wǎng)管上查詢上報告警的端口雖否配置了環(huán)回。假設(shè)是,解除端口的環(huán)回,查看告警是否去除。步驟2:在網(wǎng)管上檢查業(yè)務(wù)是否配置成為環(huán)路。假設(shè)是,修改業(yè)務(wù)配置,消除業(yè)務(wù)環(huán)路。對于以太網(wǎng)業(yè)務(wù),使能環(huán)路端口自動關(guān)斷功能,解除業(yè)務(wù)環(huán)回,查看告警是否去除。Tunnel常見告警MPLS_TUNNEL_LOCV——Tunnel連通性喪失告警可能原因:原因1:Tunnel的Ingress節(jié)點(diǎn)停止CV/FFD。原因2:物理鏈路故障。原因3:Ingress節(jié)點(diǎn)的單板正在復(fù)位。原因4:業(yè)務(wù)接口配置錯誤。原因5:網(wǎng)絡(luò)出現(xiàn)嚴(yán)重?fù)砣T?:CPU占用率飽和,無法處理ARP協(xié)議報文。Tunnel常見告警處理方法:步驟1:查看兩端的“檢測方式〞和“檢測報文類型〞參數(shù)配置是否一致。如不一致修改為一致。查看Ingress節(jié)點(diǎn)的“CV/FFD狀態(tài)〞參數(shù),如果為“停止〞,那么啟動。步驟2:在網(wǎng)管上查看Egress節(jié)點(diǎn)是否存在HARD_BAD、ETH_LOS或ETH_LINK_DOWN告警,如有,去除告警。步驟3:在網(wǎng)管上查看Ingress節(jié)點(diǎn)是否存在COMMUN_FAIL告警,如有,去除告警。步驟4:對照網(wǎng)元規(guī)劃表,查看Tunnel是否配置在正確的接口之上,例如查看下一跳IP地址。步驟5:檢查故障Tunnel的帶寬是否已被完全占用。如是,增大Tunnel帶寬配置或消除非法發(fā)送大數(shù)據(jù)量的根源。查看告警是否去除。對于動態(tài)Tunnel,查看業(yè)務(wù)路由是否經(jīng)過了帶寬較低的物理鏈路。如是,重新配置正確的路由約束條件。查看告警是否去除。步驟6:在網(wǎng)管上查看是否存在CPU_BUSY告警。如果存在,優(yōu)先去除CPU_BUSY告警后,查看本告警是否去除。Tunnel常見告警MPLS_TUNNEL_FDI/BDI——Tunnel前/后向缺陷指示告警可能原因:原因:上游網(wǎng)元檢測到物理層Tunnel發(fā)生了故障。處理方法:檢查本端網(wǎng)元與上游網(wǎng)元之間的物理鏈路是否存在故障,如纖纜中斷,光模塊故障,單板故障等。如存在,排除相關(guān)故障后,查看本告警是否去除。APS常見告警ETH_APS_LOST——APS幀喪失告警可能原因:原因1:對端網(wǎng)元未配置APS保護(hù)。原因2:APS保護(hù)組兩端配置不一致。原因3:APS保護(hù)組狀態(tài)未激活。原因4:保護(hù)通道業(yè)務(wù)中斷。處理方法:步驟1:在網(wǎng)管上查詢對端網(wǎng)元是否配置了APS保護(hù)。假設(shè)沒有,在對端網(wǎng)元配置與本端網(wǎng)元一致的APS保護(hù)組,并使能協(xié)議。步驟2:在網(wǎng)管上查詢APS保護(hù)組兩端配置是否一致。假設(shè)不一致,修改APS保護(hù)組配置,使兩端配置一致。步驟3:檢查兩端是否都激活了APS保護(hù)協(xié)議。將已激活的協(xié)議狀態(tài)設(shè)置為“禁止〞,再重新激活兩端的協(xié)議狀態(tài)。步驟4:檢查保護(hù)通道是否存在信號喪失或業(yè)務(wù)質(zhì)量劣化等告警,如ETH_LOS。假設(shè)存在,優(yōu)先去除這些告警。APS常見告警ETH_APS_SWITCH_FAIL——保護(hù)倒換失敗告警可能原因:APS保護(hù)組兩端配置不一致處理方法:在網(wǎng)管上查詢APS保護(hù)組兩端配置是否一致。修改APS保護(hù)組配置,使兩端配置一致。去激活、重新激活兩端APS保護(hù)組。LAG常見告警LAG_DOWN—聚合組不可用告警可能原因:原因1:對端網(wǎng)元未配置LAG聚合組。原因2:聚合組所有成員端口不可用。處理方法:步驟1:在網(wǎng)管上查詢對端網(wǎng)元是否配置了LAG聚合組。假設(shè)未配置,在對端網(wǎng)元上配置LAG聚合組后,查看告警是否去除。步驟2:LAG聚合組成員端口不可用時,系統(tǒng)中會存在ETH_LOS、ETH_LINK_DOWN或LAG_MEMBER_DOWN告警。處理并去除這些告警,激活聚合組的成員端口后,該告警將自動去除。LAG常見告警LAG_MEMBER_DOWN——聚合組成員端口不可用告警可能原因:原因1:端口連接不可用。原因2:端口未收到LACP報文。原因3:端口工作模式為半雙工。原因4:端口設(shè)置了環(huán)回。處理方法:步驟1:在網(wǎng)管上,根據(jù)告警參數(shù),查看上報告警的LAG成員端口是否已使能。假設(shè)未使能,使能LAG成員端口后,查看本告警是否去除。假設(shè)告警未去除,查看上報告警的端口是否存在ETH_AUTO_LINK_DOWN告警。假設(shè)存在,優(yōu)先去除告警后,查看本告警是否去除。步驟2:在網(wǎng)管上,查看對端端口是否參加了LAG組。假設(shè)沒有,在LAG組中添加對端端口后,查看告警是否去除。假設(shè)告警未去除,查看上報告警的端口是否存在ETH_LOS或FLOW_OVER告警。假設(shè)存在,優(yōu)先去除告警后,查看本告警是否去除。步驟3:修改端口工作模式為“自協(xié)商〞或“全雙工〞后,查看告警是否去除。步驟4:解除端口的環(huán)回設(shè)置,查看告警是否去除。時鐘常見告警SYN_BAD—同步時鐘源信號劣化告警可能原因:原因1:所跟蹤的時鐘源質(zhì)量變壞。原因2:上報告警的單板故障。處理方法:步驟1:在網(wǎng)管上查看是否存在B1_EXC、B2_EXC或B3_EXC等表示誤碼增多的告警,如存在,優(yōu)先去除這些告警后,查看本告警是否去除。假設(shè)告警未去除,更換當(dāng)前跟蹤的時鐘源,查看本告警是否去除。假設(shè)告警仍未去除,檢查輸入時鐘配置是否正確。如不正確,修改時鐘配置后,查看本告警是否去除。步驟2:在網(wǎng)管上查看上報告警的單板是否還存在HARD_BAD或TEMP_OVER等硬件類告警。假設(shè)存在,優(yōu)先去除這些告警后,查看本告警是否去除。時鐘常見告警LTI——同步時鐘源喪失告警可能原因:原因1:XCS單板上外時鐘接口接入的外部時鐘源喪失。原因2:線路時鐘源喪失。原因3:時鐘源被設(shè)置為不可自動恢復(fù)或被鎖定,導(dǎo)致當(dāng)前跟蹤的時鐘源喪失時,無法自動倒換到其它時正常鐘源上。處理方法:步驟1:在網(wǎng)管上查看是否存在EXT_SYNC_LOS告警。假設(shè)存在,優(yōu)先去除EXT_SYNC_LOS告警后,查看本告警是否去除。步驟2:在網(wǎng)管上查看是否存在ETH_LOS或R_LOS等信號喪失類告警,假設(shè)存在,那么優(yōu)先去除這些告警后,查看本告警是否去除。假設(shè)告警仍未去除,硬復(fù)位XCS板,查看告警是否去除。假設(shè)告警仍未去除,請更換XCS板,查看告警是否去除。步驟3:在網(wǎng)管上查看時鐘源是否被設(shè)為不可自動恢復(fù),如是,將其設(shè)置為自動恢復(fù)后,查看告警是否去除。在網(wǎng)管上查看是否存在SYNC_LOCKOFF告警,假設(shè)存在,優(yōu)先去除SYNC_LOCKOFF告警后,查看本告警是否去除。時鐘常見告警CLK_NO_TRACE_MODE——時鐘進(jìn)入非跟蹤工作模式告警可能原因:原因1:未啟動SSM協(xié)議。原因2:沒有配置系統(tǒng)時鐘源優(yōu)先級表,網(wǎng)元使用自帶的默認(rèn)優(yōu)先級表。原因3:時鐘源優(yōu)先級表中除了內(nèi)部源以外的其他時鐘源存在狀態(tài)喪失,無法跟蹤。原因4:時鐘源優(yōu)先級表中除了內(nèi)部源以外的其他時鐘源頻偏過大,無法跟蹤。處理方法:步驟1:在網(wǎng)管上檢查兩端網(wǎng)元是否都使能了SSM協(xié)議。假設(shè)沒有,使能兩端網(wǎng)元的SSM協(xié)議。步驟2:在網(wǎng)管上檢查系統(tǒng)時鐘源優(yōu)先級表是否已配置。假設(shè)未配置,重新配置時鐘源優(yōu)先級表,使其包含其他可用時鐘源。步驟3:在網(wǎng)管上查看是否存在SYNC_C_LOS告警,表示時鐘源存在狀態(tài)喪失。假設(shè)存在,優(yōu)先去除SYNC_C_LOS告警后,時鐘可跟蹤除內(nèi)部源以外的任何一個源。步驟4:在網(wǎng)管上查看是否存在SYN_BAD告警,表示時鐘源頻偏過大。假設(shè)存在,去除SYN_BAD告警后,時鐘可跟蹤除內(nèi)部源以外的任何一個源。PTN設(shè)備ETH端口告警PTN設(shè)備SDH及E1端口告警PTN設(shè)備硬件常見告警PTN設(shè)備其他常見告警PTN業(yè)務(wù)故障與告警對應(yīng)關(guān)系CES業(yè)務(wù)常見故障處理方法原因1:單板硬件故障、溫度過高或板間通信故障,無法正常工作查詢并處理以下告警:HARD_BAD、TEMP_OVER、COMMUN_FAIL或BUS_ERR告警。原因2:處理板、接口板的接口接入的信號喪失或惡化查詢并處理以下告警:T_ALOS、UP_E1_AIS、DOWN_E1_AIS、R_LOS、LASER_MOD_ERR、LSR_WILL_DIE、IN_PWR_ABN、TEM_HA或LSR_BCM_ALM告警。原因3:承載CES業(yè)務(wù)的Tunnel或PW中斷查詢并處理以下告警:MPLS_TUNNEL_LOCV告警。原因4:網(wǎng)元的同步時鐘源級別喪失,或同步時鐘源喪失查詢并處理以下告警:SYNC_C_LOS或LTI告警。原因5:承載CES業(yè)務(wù)的PW在單位時間內(nèi)丟包數(shù)、錯包數(shù)或抖動緩沖超過閾值查詢并處理以下告警:CES_LOSPKT_EXC、CES_MISORDERPKT_EXC、CES_STRAYPKT_EXC、CES_JTRUDR_EXC或CES_JTROVR_EXC告警。ETH業(yè)務(wù)常見故障處理方法原因1:單板硬件故障、溫度過高或板間通信故障,無法正常工作查詢并處理以下告警:HARD_BAD、TEMP_OVER、COMMUN_FAIL或BUS_ERR告警。原因2:接收信號喪失查詢并處理以下告警:ETH_LOS、R_LOS、LASER_SHUT、LSR_WILL_DIEMAC_FCS_EXC告警。原因3:以太網(wǎng)網(wǎng)口連接錯誤,端口協(xié)商失敗查詢并處理以下告警:ETH_LINK_DOWN告警。原因4:端口配置了環(huán)回查詢并處理以下告警:LOOP_ALM、ETH_EFM_LOOPBACK告警。原因5:接口流量限值配置過低,源宿兩端接口配置不一致查詢并處理以下告警:FLOW_OVER、ETH_CFM_UNEXPERI告警。SDH告警分析及處理SDH告警及性能事件產(chǎn)生原理SDH常見告警分析與處理SDH告警分析及處理SDH告警及性能事件產(chǎn)生原理下行信號流上行信號流下行信號流、上行信號流低階信號流高階信號流高階信號流、低階信號流兩種通用告警AIS告警〔AlarmIndicationSignal〕:對下一級電路下插全“1〞,告知該信號不可用。常見的AIS告警有:MS_AIS、AU_AIS、TU_AIS、E1_AISRDI告警〔RemoteDefectIndication〕:指對端站檢測到LOS、AIS、TIM等告警后,而傳給本站的回送告警,常見的告警有:MS_RDI、HP_RDI、LP_RDI高階告警、性能事件的產(chǎn)生和檢測幀同步器和再生段開銷處理器(RST)復(fù)用段開銷處理器(MST)指針處理器和高階通道開銷處理器

(MSA、HPT)LOSLOFB1ErrA1,A2B1AISMS_AISB2ErrK2B2MS_REIM1MS_RDIK2“1”AISAU_AISAU_LOPH1,H2H4B3ErrJ1HP_SLMC2“1”HP_LOMHP_TIMHP_UNEQHP_REIHP_RDIH1,H2C2B3G1G1“1”交叉板STM-N光接口下行信號流告警上報或回告信號傳遞點(diǎn)〔下插全“1〞信號〕告警終結(jié)點(diǎn)〔上報主控〕異步物理接口模塊低階通道適配功能塊高階通道適配功能塊和低階通道終端功能塊信號流程告警上報或回告信號傳遞點(diǎn)〔下插全“1〞信號〕告警終結(jié)點(diǎn)〔上報主控〕(PPI)(LPA)(HPA、LPT)LP_TFIFO全“1”LP_SLMLP_UNEQV1,V2H4BIP-2J2TU_AISV5HP_LOMLP_TIMTU_LOPLP_REILP_RDIV5V5交叉板E1接口V5V1,V2LP_RFIFOE1_AIS全“1”T_ALOSE1_AIS交叉板E1接口低階告警、性能事件的產(chǎn)生和檢測告警信號間的抑制關(guān)系:主要告警抑制樹R_LOSR_LOFR_OOFAU_AISAU_LOPB1_SDB2_SDHP_TIMHP_SLMHP_LOMHP_UNEQB3_EXECB3_SDTU_AISTU_LOPBIP_EXECLP_UNEQLP_TIMLP_SLMBIP_SDMS_RDIHP_RDILP_RDI圖例:ABA抑制BJ0_MMMS_AISB1_EXECB2_EXECA1、A2字節(jié)RSOH、MSOH〔除A1、A2外〕SDH告警及性能事件產(chǎn)生原理SDH常見告警分析與處理SDH告警分析及處理SDH接口板常見告警分析與處理R_LOF--表示接收線路側(cè)幀喪失R_LOS—端口無收光原因1:光纖故障;原因2:對端站發(fā)送故障;原因3:本端接收故障。可能原因:原因1:接收光功率過低或過高;原因2:對端站發(fā)送信號無幀結(jié)構(gòu);原因3:本板接收方向故障??赡茉颍篠DH接口板常見告警分析與處理

R_LOF/R_LOS的處理步驟:<Step1>檢查本端收光功率與對端發(fā)光功率<Step2>檢查本端和對端光板的告警<Step3>檢查本端和對端光板的性能事件<Step4>檢查本端和對端光板之間的線路<Step5>檢查是否上游交叉時鐘板故障<Step6>更換故障單板或器件,解決問題SDH接口板常見告警分析與處理MS_AIS--復(fù)用段告警指示可能原因:1:對端站發(fā)送MS_AIS信號;2:對端站時鐘板故障;3:本板接收局部故障。處理步驟:<Step1>檢查對應(yīng)的線路板是否有R_LOS、R_LOF告警<Step2>處理完R_LOS、RLOF后MS_AIS是否消失<Step3>復(fù)位、更換本端、對端線路板,告警是否消失<Step4>更換對端交叉單板,檢查告警是否消失SDH接口板常見告警分析與處理AU_AIS--AU告警指示1:對端站發(fā)送AU_AIS;2:對端站發(fā)送局部故障;3:本站接收局部故障??赡茉颍禾幚聿襟E:<Step1>

找出該告警涉及業(yè)務(wù)的流向<Step2>

沿業(yè)務(wù)流向檢查本地光板是否存在更高級別的告警<Step3>檢查上游站點(diǎn)該業(yè)務(wù)是否為VC4穿通,是否有高級別告警<Step4>檢查設(shè)備是否處于倒換態(tài),恢復(fù)正常態(tài)后故障是否消失<Step5>檢查設(shè)備告警、性能事件,進(jìn)行告警性能分析<Step6>環(huán)回定位至故障單板,更換故障單板AU_AIS是會沿VC4穿通方向下插的!SDH接口板常見告警分析與處理告警名稱告警含義MS_RDI表示復(fù)用段遠(yuǎn)端接收失效指示,為次要告警。MS_REI表示復(fù)用段遠(yuǎn)端誤碼指示,為提示告警。AU_LOP表示AU指針丟失,為主要告警。HP_TIM表示高階通道追蹤識別符失配,為次要告警。HP_SLM表示高階通道信號標(biāo)記失配,為次要告警。HP_RDI表示高階通道遠(yuǎn)端接收失效指示,為次要告警。HP_REI表示高階通道遠(yuǎn)端誤碼指示,為提示告警。HP_UNEQ表示高階通道未裝載,為次要告警。IN_PWR_ABN表示輸入功率異常,為主要告警。LASER_SHUT表示單板在激光器關(guān)閉,為主要告警。LOOP_ALM表示設(shè)置了環(huán)回,為次要告警。COMMUN_FAIL表示單板網(wǎng)口或串口通信失效,為主要告警。其它告警PDH處理板常見告警分析與處理T_ALOS--2M接口模擬信號喪失可能原因:1、2M業(yè)務(wù)未接入;2、DDF架側(cè)2M接口輸出端口脫落或松動;3、本站2M接口輸入端口脫落或松動;4、單板故障;5、電纜故障。處理步驟:<Step1>在DDF架處對告警通道的業(yè)務(wù)自環(huán)〔硬件內(nèi)環(huán)回〕<Step2>在接口板處對該通道進(jìn)行自環(huán)〔硬件內(nèi)環(huán)回〕,<Step3>網(wǎng)管上對該通道進(jìn)行內(nèi)環(huán)回設(shè)置<Step4>更換故障單板、接口板、電纜,檢查告警是否排除。PDH處理板常見告警分析與處理TU_AIS--TU告警指示可能原因:1、業(yè)務(wù)配置錯誤;2、對端站對應(yīng)通道失效;3、由更高階告警引起;4、交叉板故障。處理步驟:<Step1>檢查告警涉及業(yè)務(wù)的流向,檢查沿業(yè)務(wù)流向是否存在高級別的會導(dǎo)致TU_AIS下插的告警<Step2>檢查網(wǎng)元是否處于倒換態(tài),排除倒換問題<Step3>檢查網(wǎng)元業(yè)務(wù)配置是否正確<Step4>環(huán)回分析、更改業(yè)務(wù)時隙定位故障到單板<Step5>更換故障單板PDH處理板常見告警分析與處理TU_LOP--TU指針喪失可能原因:支路板與交叉板間接口故障;業(yè)務(wù)配置錯誤。處理步驟:<Step1>檢查告警涉及業(yè)務(wù)的流向,檢查沿業(yè)務(wù)流向是否存在高級別的告警<Step2>檢查網(wǎng)元是否處于倒換態(tài),排除倒換問題<Step3>檢查網(wǎng)元業(yè)務(wù)配置是否正確<Step4>環(huán)回分析、更改業(yè)務(wù)時隙定位故障到單板<Step5>復(fù)位相關(guān)故障單板,更換故障單板PDH處理板常見告警分析與處理告警名稱告警含義LP_RDI表示低階通道遠(yuǎn)端接收失效指示,為次要告警。LP_REI表示低階通道遠(yuǎn)端誤碼指示,為次要告警。NO_BD_SOFT表示單板無軟件,為緊急告警。TPS_ALM表示已發(fā)生TPS保護(hù)倒換,為主要告警。UP_E1_AIS表示2M上行信號告警指示,為次要告警。DOWN_E1_AIS表示2M下行信號告警指示,為次要告警。ALM_SUBCARD_ABN表示檢測到子卡狀態(tài)錯誤,為主要告警。BD_STATUS表示單板不在位,為主要告警。COMMUN_FAIL表示單板網(wǎng)口或串口通信失效,為主要告警。LOOP_ALM表示設(shè)置了環(huán)回,為次要告警。其它告警以太網(wǎng)單板常見告警告警名稱告警含義AU_AIS表示高階業(yè)務(wù)告警中斷,為主要告警。ETH_LOS表示以太網(wǎng)端口連接丟失,為緊急告警。PROTOCOL_MM表示封裝協(xié)議類型不匹配,為緊急告警。NO_BD_SOFT表示單板無軟件,為緊急告警。BD_STATUS表示單板不在位,為主要告警。COMMUN_FAIL表示單板網(wǎng)口或串口通信失效,為主要告警。LOOP_ALM表示設(shè)置了環(huán)回,為次要告警。交叉時鐘單元常見告警分析與處理告警名稱告警含義APS_FAIL表示保護(hù)倒換失敗指示,為主要告警APS_INDI表示保護(hù)倒換指示,主要告警,在環(huán)倒換兩端網(wǎng)元上報。LTI表示同步源丟失,為主要告警。BUS_ERR表示總線錯誤,為主要告警。CLK_NO_TRACE_MODE表示時鐘進(jìn)入非跟蹤工作模式,為次要告警。S1_SYN_CHANGE表示在S1字節(jié)模式下時鐘源發(fā)生倒換,為主要告警。SYN_BAD表示同步源劣化,為次要告警。SYNC_C_LOS表示同步源級別丟失,為提示告警。NO_BD_SOFT表示單板無軟件,為緊急告警。BD_STATUS表示單板不在位,為主要告警。TEMP_OVER告警表示工作溫度過限,為次要告警。COMMUN_FAIL表示單板網(wǎng)口或串口通信失效,為主要告警。主控單元常見告警告警名稱告警含義HARD_BAD表示硬件故障,為緊急告警,根據(jù)參數(shù)含義處理NESF_LOST表示缺少一套主機(jī)軟件,為提示告警。NODEID_MM表示復(fù)用段節(jié)點(diǎn)號失配,為主要告警。POWER_ABNORMAL表示電源失效,為主要告警。POWER_FAIL表示鋰電池電量不足或失效,為主要告警。WRG_BD_TYPE表示所插板類型錯誤,為次要告警。BD_STATUS表示單板不在位,為主要告警。COMMUN_FAIL表示單板網(wǎng)口或串口通信失效,為主要告警。APS_MANUAL_STOP表示復(fù)用段協(xié)議人工停止,為次要告警。硬件常見告警HARD_BAD——硬件故障告警可能原因:原因1:外接電源失效。原因2:單板與母板未良好接觸。原因3:單板硬件故障。原因4:假設(shè)接口板上報HARD_BAD告警,可能是對應(yīng)的處理板出現(xiàn)故障。處理方法:步驟1:確保正常電源接入后,查看告警是否去除。步驟2:拔出故障單板,確認(rèn)背板上的導(dǎo)針無異常。重新插入單板,使單板與母板良好接觸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論