基站隱性故障排除指導(dǎo)書_第1頁
基站隱性故障排除指導(dǎo)書_第2頁
基站隱性故障排除指導(dǎo)書_第3頁
基站隱性故障排除指導(dǎo)書_第4頁
基站隱性故障排除指導(dǎo)書_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 基站隱性故障排除 目目 錄錄 1基站隱性故障處理的一般方法及案例分析基站隱性故障處理的一般方法及案例分析.3 1.1發(fā)現(xiàn)問題的方法 .3 1.2基站故障的分類 .4 1.3基站隱性故障處理的一般方法.5 1.3.1看基站當(dāng)前的狀態(tài)及告警.5 1.3.2檢查基站傳輸?shù)臓顟B(tài).14 1.3.3檢查基站的數(shù)據(jù)定義.19 1.3.4檢查并分析error log.20 1.3.5對基站進(jìn)行檢查.23 1.3.6使用儀表設(shè)備對基站進(jìn)行檢測.41 2一點建議一點建議 .43 1基站隱性故障處理的一般方法及案例分析基站隱性故障處理的一般方法及案例分析 所謂基站的隱性故障是指那些沒有明顯的告警但對基站的性能有影

2、響的故障,或者是那些 反復(fù)出現(xiàn)后又往往能自行消失的告警。這些告警的存在將使得系統(tǒng)的性能指標(biāo)受到影響。 由于這些問題的隱蔽性,往往無法直接發(fā)現(xiàn)它們,因此我們需要借助其他方法才能發(fā)現(xiàn)這 些潛在的故障。 1.1發(fā)現(xiàn)問題的方法發(fā)現(xiàn)問題的方法 話務(wù)統(tǒng)計話務(wù)統(tǒng)計 話務(wù)統(tǒng)計提供了各種指標(biāo)去衡量系統(tǒng)服務(wù)的好壞?;镜暮芏喙收隙紩从车皆拕?wù)統(tǒng)計 的某項指標(biāo)上來。常用的指標(biāo)有信道完好率,掉話,切換,無線接入性等。如果基站存 在問題,則有可能影響到其中一項或者幾項指標(biāo)。因此如果這些指標(biāo)的變化,特別是在 沒做任何參數(shù)修改的情況下發(fā)生了變化,我們應(yīng)該考慮基站硬件的因素。 路測路測 路測能夠最直接的反映系統(tǒng)真實運行情況和

3、最終用戶的感知。因此對路測文件的分析也 往往能幫助我們發(fā)現(xiàn)問題。 bsc 中基站的歷史告警記錄中基站的歷史告警記錄 有些告警產(chǎn)生了之后能夠自行恢復(fù),因此當(dāng)打印網(wǎng)絡(luò)中現(xiàn)存的故障的時候不一定能發(fā)現(xiàn) 這些故障。但是它們往往會在 bsc 的歷史告警記錄中留下痕跡。通過分析這些記錄,能 夠幫助發(fā)現(xiàn)一些基站潛在的問題。 用戶投訴用戶投訴 用戶的投訴可能會是由基站的硬件引起,如基站的發(fā)射功率不穩(wěn)定導(dǎo)致用戶手機(jī)信號不 穩(wěn)。對投訴信息加以提煉和分析,能幫助我們發(fā)現(xiàn)存在問題的區(qū)域。 在下面的案例分析中我們可以看到這幾種發(fā)現(xiàn)問題的方法的具體應(yīng)用。 1.2基站故障的分類基站故障的分類 就基站的故障對系統(tǒng)指標(biāo)的影響而言

4、,我們可以將它們分為話務(wù)敏感型故障和非話務(wù)敏感 型故障。象天饋線駐波比過高的告警,能夠直接影響下行信號的輸出強(qiáng)度,影響通話質(zhì)量, 屬于話務(wù)敏感型故障。而象風(fēng)扇告警這類故障,不會對話務(wù)產(chǎn)生直接的影響,屬于非話務(wù) 敏感型故障。但這類故障往往會間接的影響到系統(tǒng)的性能,更具隱蔽性,所以同樣不能忽 視它們。 從基站對信號的處理流程來看,我們又可以將基站的故障分為兩大類。一類是對基帶信號 處理時產(chǎn)生的告警。另一類是發(fā)生在射頻信號處理時的故障?;局刑幚砘鶐盘柕挠布?有 dxu 和 tru 中的部分功能模塊,dxu 中包括 cf,tf,is,con,dp 等功能模塊。 tru 中處理基帶信號的功能模塊是

5、trxc。基站中對射頻信號的處理主要是由 tru,cdu 和天饋線來完成的。tru 內(nèi)部是由 tx 和 rx 兩個功能模塊來完成對基帶信號 的調(diào)制和解調(diào)功能的。 分清楚告警的類型有助于我們分析問題,不至于產(chǎn)生方向性的錯誤。 1.3基站隱性故障處理的一般方法基站隱性故障處理的一般方法 當(dāng)我們發(fā)現(xiàn)某個基站可能存在問題時,我們一般從以下幾個方面著手來處理。 1.3.1看基站當(dāng)前的狀態(tài)及告警看基站當(dāng)前的狀態(tài)及告警 常用的命令如下: rxtcp:moty=rxotg,cell=4001a;從小區(qū)名找到相連的 tg 號。 rxcdp:mo=rxotg-69;檢查 tg 下面的 mo 的配置情況。 rxms

6、p:mo=rxocf-69;檢查 mo 的狀態(tài)。關(guān)于 mo 狀態(tài)的含義見下面詳細(xì)說明。 rxasp:mo=rxotg-69;檢查 tg 下面的 mo 是否有告警。 rxmfp:mo=rxotrx-69-0;檢查有故障的 mo 的告警代碼。再根據(jù)告警代碼查找相應(yīng) 解釋。 rlcrp:cell=4001a;檢查小區(qū)的資源使用情況。如是否有人占用小區(qū),小區(qū)的時隙是 否有 blocked 的,小區(qū)是否存在上行干擾等。 rlslp:cell=4001a;檢查小區(qū)信道使用的情況。 通過以上命令,我們可以大致知道一個基站當(dāng)前的工作狀態(tài)。 關(guān)于 mo 狀態(tài)的詳細(xì)說明。 熟練掌握這些 mo 狀態(tài)的含義對我們分析

7、網(wǎng)絡(luò)中存在的隱性問題很有幫助。因為很多基站 問題并沒有明確的告警指示,而是通過 mo 狀態(tài)的變化反映出問題的存在的。 rxmsp:mo=rxotrx-3-4; radio x-ceiver administration managed object status mo state blstate blo bla lmo bts conf rxotrx-3-4 noop blo 0040 000a res globle state:從 bsc 的角度來看的 mo 的狀態(tài)。globle state 有以下幾種狀態(tài): globle state block state block reason bts

8、 state def:mo 在 bsc 中被定義。 com:mo 已經(jīng)和 bsc 建立起通訊。 preop:這是 mo 由 com 到 oper 的一個過渡狀態(tài)。 oper:mo 處于正常工作狀態(tài)。 noop:mo 暫時處于非工作狀態(tài)。 fail:mo 永久性地處于非工作狀態(tài)。 block state:表明 mo 是由于何種原因處于 block 的狀態(tài)的。block state 有以 下幾種狀態(tài): mbl:人工將 mo 閉掉的。 blo:mo 自動被閉掉的。如 mo 產(chǎn)生錯誤,或者 oml link 斷了等等。 bla:由于需要對 mo 進(jìn)行操作而進(jìn)入 block 的狀態(tài)。 bll:mo 在下

9、載軟件時的狀態(tài)。 blt:mo 由于測試而進(jìn)入的 block 狀態(tài)。 block reason:通過代碼解釋 block 的原因。 值得注意的是 lmo 代碼,其含義是指從 traffic 的角度來看,mo 已經(jīng)不能承載話務(wù)了, 雖然從 o radio x-ceiver administration managed object configuration data mo result arfcn mismatch rxorx-109-0 config hop none rxorx-109-1 config hop none rxorx-109-2 config hop none rxorx-

10、109-3 config hop none rxorx-109-4 config hop none rxorx-109-5 config hop none mo result arfcn txad tn bpc chcomb offs xra icm rxots-109-0-5 config hop hop 1 2398 tch 0 no on rxots-109-0-6 config hop hop 0 2395 tch 0 no on rxots-109-0-7 config hop hop 2 2290 tch 0 no on rxots-109-1-0 config hop hop 7

11、 2423 tch 0 no on rxots-109-1-1 config hop hop 6 2419 tch 0 no on rxots-109-1-2 config hop hop 5 2415 tch 0 no on rxots-109-1-3 config hop hop 4 2411 tch 0 no on rxots-109-1-4 config hop hop 3 2407 tch 0 no on rxots-109-1-5 config hop hop 1 2399 tch 0 no on rxots-109-1-6 config hop hop 0 2396 tch 0

12、no on rxots-109-1-7 config hop hop 2 2291 tch 0 no on rxots-109-2-0 config hop hop 2 2405 sdcch8 0 no on rxots-109-2-1 config hop hop 7 2424 tch 0 no on rxots-109-2-2 config hop hop 6 2420 tch 0 no on rxots-109-2-3 config hop hop 5 2416 tch 0 no on rxots-109-2-4 config hop hop 4 2412 tch 0 no on rxo

13、ts-109-2-5 config hop hop 3 2408 tch 0 no on rxots-109-2-6 config hop hop 1 2400 tch 0 no on mo result arfcn txad bspwr c0f mismatch rxotx-109-0 config 22 0 41 yes none rxotx-109-1 config 2 1 41 no none rxotx-109-2 config 69 2 41 no none rxotx-109-3 config 81 3 41 no none rxotx-109-4 config 1000 4 4

14、1 no none rxotx-109-5 config 1018 5 41 no none end 但用 rlcrp 查看發(fā)現(xiàn) 4001a 小區(qū)上總有部分時隙受到干擾。 rlcrp:cell=4001a; cell resources cell bcch cbch sdcch nooftch zhewja1 1 0 32 43- 86 chgr bpc channel chrate spv state icmband chband 64k 0 2425 tch-4742 fr 1,2 idle 1 p900 none tch-17729 hr 1 idle 1 p900 tch-17728

15、hr 1 idle 1 p900 2424 tch-4741 fr 1,2 idle 1 p900 none tch-17727 hr 1 idle 1 p900 tch-17726 hr 1 idle 1 p900 2423 tch-4740 fr 1,2 idle 4 p900 none tch-17725 hr 1 idle 4 p900 tch-17724 hr 1 idle 4 p900 2422 tch-4739 fr 1,2 idle 1 p900 none tch-17723 hr 1 idle 1 p900 tch-17722 hr 1 idle 1 p900 . 2396

16、tch-4717 fr 1,2 idle 4 p900 none tch-17679 hr 1 idle 4 p900 tch-17678 hr 1 idle 4 p900 . 2399 tch-4720 fr 1,2 idle 4 p900 none tch-17685 hr 1 idle 4 p900 tch-17684 hr 1 idle 4 p900 2400 tch-4721 fr 1,2 idle 1 p900 none tch-17687 hr 1 idle 1 p900 tch-17686 hr 1 idle 1 p900 2406 tch-4723 fr 1,2 busy 1

17、 p900 none tch-17691 hr 1 lock 1 p900 tch-17690 hr 1 lock 1 p900 2407 tch-4724 fr 1,2 idle 4 p900 none tch-17693 hr 1 idle 4 p900 tch-17692 hr 1 idle 4 p900 2408 tch-4725 fr 1,2 idle 1 p900 none tch-17695 hr 1 idle 1 p900 tch-17694 hr 1 idle 1 p900 end 不難發(fā)現(xiàn),受干擾的時隙都集中對應(yīng)為同一個 trx 所控制的時隙。具體方法如下: 1rlcrp

18、的打印列表中 bpc 為 2423 的時隙的 icm=4。 2在 rxcdp 的打印列表中 bpc 為 2423 所對應(yīng)的時隙為:rxots-109-1- 0。 3用類似的方法將所有的受干擾的時隙找出來,可以發(fā)現(xiàn)它們都是 trx-109- 1 所控制的時隙。 將跳頻關(guān)掉,情況更明顯。所有受干擾的時隙仍然都集中在 tru1 上。 rlcrp:cell=4001a; cell resources cell bcch cbch sdcch nooftch zhewja1 1 0 32 43- 86 chgr bpc channel chrate spv state icmband chband 64

19、k . 1 2770 tch-1452 fr 1,2 idle 4 e900 none tch-11673 hr 1 idle 4 e900 tch-11672 hr 1 idle 4 e900 2773 tch-1453 fr 1,2 idle 5 e900 none tch-11675 hr 1 idle 5 e900 tch-11674 hr 1 idle 5 e900 2776 tch-1479 fr 1,2 idle 4 e900 none tch-11679 hr 1 idle 4 e900 tch-11678 hr 1 idle 4 e900 2774 tch-1478 fr 1

20、,2 idle 4 e900 none tch-11677 hr 1 idle 4 e900 tch-11676 hr 1 idle 4 e900 2779 tch-1480 fr 1,2 idle 4 e900 none tch-11681 hr 1 idle 4 e900 tch-11680 hr 1 idle 4 e900 2780 tch-1481 fr 1,2 idle 4 e900 none tch-11683 hr 1 idle 3 e900 tch-11682 hr 1 idle 4 e900 2782 tch-1482 fr 1,2 idle 4 e900 none tch-

21、11685 hr 1 idle 3 e900 tch-11684 hr 1 idle 4 e900 2783 tch-1483 fr 1,2 idle 4 e900 none tch-11687 hr 1 idle 4 e900 tch-11686 hr 1 idle 4 e900 end 該載頻使用的是 1000 號頻點,用 fas 查看,其受干擾的情況和其它頻點差不多。不應(yīng)該 單單這個頻點產(chǎn)生這么高的上行干擾。但為了保險起見,還是通過 fas 選擇了一個更好的 頻點 1021 號頻點。但發(fā)現(xiàn)該載頻上的干擾仍然很強(qiáng)。 于是將該載頻所對應(yīng)的時隙全部閉掉。rxbli:mo=rxots-109-1

22、-0 此時用 rlcrp 觀察,發(fā)現(xiàn)干擾基本消失了。 resetting isl channel. islresetcnt=10 (since last dxu reset) 03-10-14 20:38:37.482 oms_so_main so.c:19798 traceh:sap disconnected 03-10-14 20:38:37.492 oms_hwu hwu.c:33071 fault: lb:0, raise i2a missing ru tru 1 03-10-14 20:38:37.670 oms_hwu hwu.c:33071 fault: lb:0, raise

23、i2a missing ru tru 2 03-10-14 20:38:37.772 oms_hwu hwu.c:33071 fault: lb:0, raise i2a missing ru tru 3 03-10-14 20:38:37.852 oms_hwu hwu.c:33071 fault: lb:0, raise i2a missing ru ecu 0 dtqup:dip=rblt28; dip t1 t2 slip slip2 uas uasr uav1 uasb1 uav2 uasb2 rblt28 12 9 0 0 0 0 0 0 0 0 section esv sesv

24、dmv esvr sesvr dmvr sfv sfti 0 0 0 0 0 24 section es2v ses2v dm2v es2vr ses2vr dm2vr smi 0 0 0 0 0 end 在四個 tru 中都讀到如下記錄。 在 ecu 中讀到如下記錄。 03-10-14 20:38:37.332 pls_hx_int0 hx_int.c:3494 traceh:isl protocol error 03-10-14 20:38:37.576 pls_hx_main hx_main.c:376 traceh:dxu lost activate command in state

25、connected 03-10-14 20:38:37.588 pls_hx_main mps_temp.c:185 traceh:trlr091s (pls-tru/r8 cxc1121202_1.r8_12), start cause: dxu_lost, appl. type: 1 90-01-01 00:00:00.034 noname debug_main.c:2492 traceh:no restart info 03-10-14 20:38:37.366 pls_hx_int0 hx_int.c:3494 traceh:isl protocol error 03-10-14 20

26、:38:37.580 pls_hx_main hx_main.c:376 traceh:dxu lost activate command in state connected 03-10-14 20:38:37.594 pls_hx_main mps_temp.c:185 traceh:eclr091s (pls-ecu/r8 cxc1121202_1.r8_12), start cause: dxu_lost, appl. type: 1 90-01-01 00:00:00.046 noname debug_main.c:2492 traceh:no restart info 可以看出四個

27、 tru 和 ecu 都檢測到 isl protocol error 的錯誤,觸發(fā)重啟動的條 件都是 dxu_lost。當(dāng) dxu 檢測到和 tru,ecu 失去聯(lián)系后,發(fā)出 resetting isl channel 的命令。 我們可以看出從上次 dxu 重啟以來 isl channel 共重啟了 10 次(islresetcnt=10)。 關(guān)于關(guān)于 isl 的簡介。的簡介。 isl(internal signaling link)是一種點對多點的信令協(xié)議,用于 dxu 和 tru 及 ecu 之 間的通訊。例如在基站啟動時傳遞 idb 配置參數(shù),各子系統(tǒng)之間的通信都要用到 isl。讀 取

28、ecu 和 tru 的 log 文件也是通過 isl 進(jìn)行的。 isl 和 lapd 信令一起在 local bus 上傳遞。local bus 是基站內(nèi)部用于在 dxu 和 tru,ecu 之間傳遞語音及信令的一條串行總線,其帶寬為 2.048mbit/s,也分為 32 個時 隙。isl 占用 tso-ts2 時隙,lapd 信令占用 ts3ts8 時隙,ts15-ts26 則分配給 tch(每個 tru 占用兩個時隙)。 其邏輯結(jié)構(gòu)如圖所示。 isl lapd tch 在 dxu 中 isl 是由 concentrator hw 來處理,在 tru 中則是由 pls(platform su

29、bsystem)子系統(tǒng)來實現(xiàn)的。如圖所示。 話音和信令通過 local bus 傳到 tru,在 tru 內(nèi)部 isl 和 lapd(oml 和 rsl)是由 cpu 來處理的。而話音數(shù)據(jù)則是由 tora 模塊來處理。 因此從物理上來看,和 isl 相關(guān)的硬件有 dxu,背板連線及插座,tru 和 ecu。任何相 關(guān)的部分出現(xiàn)錯誤都有可能引起 isl protocol error 的告警。 鑒于所有的 tru 及 ecu 上都檢測到該錯誤,我們首先懷疑是 dxu 中處理 isl 的功能模 塊出現(xiàn)問題。于是我們將 1 小區(qū)的 dxu 和 3 小區(qū)的 dxu 進(jìn)行互換,然后觀察是否還有自 動重啟的

30、現(xiàn)象。 到目前為止,1 小區(qū)和 3 小區(qū)都沒有觀察到 tru/ecu 有自動重啟的記錄。 這說明原 1 小區(qū)的 isl protocol error 的告警應(yīng)該是由該小區(qū)的 dxu 和背板插座之 間接觸不良造成的。 1.3.5.4 使用使用 omt 對基站的性能進(jìn)行監(jiān)測對基站的性能進(jìn)行監(jiān)測 基站對一些重要的性能提供了實時監(jiān)測功能,如發(fā)射功率,反射功率,駐波比等。通過對 這些數(shù)據(jù)的監(jiān)測,我們可以知道基站目前的工作是否正常。 對tru和cdu的輸出功率進(jìn)行監(jiān)測 可以監(jiān)測的項目有 tru 的前向功率和反向功率,cdu 的前向功率和反向功率,天饋線的 駐波比。注意:只有發(fā)射共用或單發(fā)射天線才能監(jiān)測出它

31、的駐波比,單接收天線是不能用 這種方法來監(jiān)測其駐波比的。 對基站的同步性能進(jìn)行監(jiān)測 讀取完基站的 idb 后在 mo 所指的頁面上,選中 tf 圖標(biāo),然后單擊鼠標(biāo)右鍵,選擇 monitor,可以看到有些選項,其中比較重要的是:phase diff error pcm a,tu internal state 和 vco control value 等項目。 phase diff error pcm a 用來檢測基站內(nèi)部時鐘源和外部時鐘源之間的相位差。正 常情況下測量值應(yīng)該是在 0 附近波動。如果測量值的絕對值很大并且保持恒定則有可能是 dxu 內(nèi)部時鐘源有問題產(chǎn)生了漂移,但還在可控制的范圍內(nèi)。如

32、果測量值波動太大則有可 能由于傳輸信號不穩(wěn)定造成的。 tu internal state 表示基站的內(nèi)部時鐘源的同步狀態(tài),它有幾種取值,0 表示正在建 立同步,1 表示已經(jīng)建立同步,2 表示基站是處于 hold over 狀態(tài),也就是用基站自己 的時鐘源。 vco control value 這個測量值反映了對基站內(nèi)部 vco 電路調(diào)控的情況。正常的范 圍是 273-16111,超出這個范圍將產(chǎn)生告警。 案例分析:駐波比高引起的手機(jī)接收信號不穩(wěn)的案例。 故障現(xiàn)象:小區(qū)所覆蓋的范圍內(nèi)進(jìn)行路測時發(fā)現(xiàn)手機(jī)接收信號有時很強(qiáng),有時很弱,變化 很大。 故障分析: 在分析該基站的 error log 時發(fā)現(xiàn)該小區(qū)時不時的出現(xiàn)駐波比過高的告警。 駐波比是一個反映天饋線對無線信號藕合程度的指標(biāo)。駐波比比值越接近 1,表明天饋系 統(tǒng)的藕合程度越高,也就有越多的無線信號發(fā)射到空中。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論