告警關聯(lián)推廣材料--某省移動_第1頁
告警關聯(lián)推廣材料--某省移動_第2頁
告警關聯(lián)推廣材料--某省移動_第3頁
告警關聯(lián)推廣材料--某省移動_第4頁
告警關聯(lián)推廣材料--某省移動_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

網(wǎng)絡質量是通信企業(yè)生命線 告警關聯(lián)項目推廣介紹 廣東公司 2009年 11月 - 2 - /webmoney 目錄 告警關聯(lián)功能部署驗證方法 1 告警關聯(lián)規(guī)則優(yōu)化方法 2 3 告警關聯(lián)指標分析方法 - 3 - /webmoney 告警關聯(lián)項目全生命周期 制定 驗證 修改 審核 中國移動告警關聯(lián)規(guī)則梳理表 現(xiàn)網(wǎng)驗證 分析優(yōu)化 專家評審會 持續(xù)改進型- 4 - /webmoney 告警關聯(lián)功能整體部署步驟 告警關聯(lián)效果優(yōu)化 關聯(lián)效果異常分析 關聯(lián)效果優(yōu)化分析 告警關聯(lián)功能部署 功能部署 規(guī)則部署 功能驗證 規(guī)則驗證 告警關聯(lián)功能開發(fā) 關聯(lián)規(guī)則配置 告警關聯(lián)功能 告警關聯(lián)規(guī)則梳理 規(guī)則梳理 規(guī)則審核 各省 在現(xiàn)網(wǎng)部署告警關聯(lián)程序 各省 選擇關聯(lián)規(guī)則在現(xiàn)網(wǎng)中部署 各省 對告警關聯(lián)功能進行驗證,包括規(guī)則生成、入庫、呈現(xiàn)、派單。 各省 對關聯(lián)規(guī)則驗證失敗的進行詳細分析不優(yōu)化修改 各省 對已產(chǎn)生關聯(lián)的關聯(lián)規(guī)則進行關聯(lián)條件的優(yōu)化分析 由 業(yè)務人員 對告警關聯(lián)規(guī)則進行梳理 由 牽頭省 對告警關聯(lián)規(guī)則進行評審幵發(fā)布 由 廠家 對告警關聯(lián)功能進行開發(fā) 由 廠家 對關聯(lián)規(guī)則進行配置開發(fā) - 5 - /webmoney 告警關聯(lián)功能部署廣東工作時間表 7月 7月底 8月 功能開發(fā) 功能部署 關聯(lián)規(guī)則驗證分析 網(wǎng)管廠家對告警關聯(lián)功能進行開發(fā)與測試 根據(jù)已評審過的關聯(lián)規(guī)則,開發(fā)所有規(guī)則配置腳本文件,并進行測試 在現(xiàn)網(wǎng)中部署告警關聯(lián)主程序,配置告警關聯(lián)規(guī)則 從關聯(lián)規(guī)則部署,關聯(lián)告警生成、呈現(xiàn)、入庫、派單進行驗證 解決現(xiàn)網(wǎng)運行過程中產(chǎn)生的各類問題,確保功能穩(wěn)定。 對已有關聯(lián)告警生成的規(guī)則,進行合理性的驗證 對在現(xiàn)網(wǎng)環(huán)境下無法產(chǎn)生關聯(lián)告警的規(guī)則進行分析,更正并優(yōu)化關聯(lián)規(guī)則條件 5月 規(guī)則梳理 對告警關聯(lián)梳理表按牽頭省進行梳理 告警關聯(lián)規(guī)則梳理表評審 11月 告警關聯(lián)分析推廣 根據(jù)試點省前期告警關聯(lián)功能在現(xiàn)網(wǎng)中部署驗證的情況進行經(jīng)驗總結 向全國推廣告警關聯(lián)分析功能 - 6 - /webmoney 告警關聯(lián)程序部署 廣東公司共在現(xiàn)網(wǎng)中部署告警關聯(lián)規(guī)則 80條,涵蓋了愛立信和華為兩個廠家的所有主次和衍生關聯(lián)規(guī)則 廠 家 規(guī) 則 類 型 總 數(shù) 愛立信 主次關聯(lián) 15條 衍生關聯(lián) 9條 華為 主次關聯(lián) 30條 衍生關聯(lián) 26條 廣東在現(xiàn)網(wǎng)中累計成功驗證了 45條告警關聯(lián)規(guī)則,總體驗證率為 56.25。 還未驗證成功的關聯(lián)規(guī)則共 37條,其中愛立信 5條,華為30條。 廠家 規(guī)則類型 總 數(shù) 驗證數(shù) 驗證率 合計 愛立信 主次關聯(lián) 15 11 73.3% 79.2% 衍生關聯(lián) 9 8 88.9% 華為 主次關聯(lián) 30 16 53.3% 46.4% 衍生關聯(lián) 26 10 38.5% - 7 - /webmoney 告警關聯(lián)功能部署方法 告警關聯(lián)功能部署 功能部署 規(guī)則部署 功能驗證 規(guī)則驗證 每一條關聯(lián)規(guī)則都有一個對應的XML配置文件,里面定義了告警關聯(lián)名稱,告警關聯(lián)類型,父告警和子告警(以網(wǎng)管告警 ID告警標題唯一識別一條告警),告警關聯(lián)量值( X:時間窗和 Y:數(shù)量基線),告警關聯(lián)規(guī)則條件。衍生告警正文等。 1、告警關聯(lián)主程序; 2、告警關聯(lián)規(guī)則配置模塊; 3、告警關聯(lián) KPI報表程序; 各省從告警關聯(lián)梳理表中選擇現(xiàn)網(wǎng)設備相關的關聯(lián)規(guī)則進行部署 各省拿到告警關聯(lián)程序包后在現(xiàn)網(wǎng)部署功能 1、告警關聯(lián)正常運作 2、告警關聯(lián)規(guī)則配置模塊是否生效 3、告警關聯(lián) KPI報表是否正常生成 1、規(guī)則配置文件是否與告警多維梳理表的關聯(lián)規(guī)則一致 2、關聯(lián)告警能否正確生成 驗證告警關聯(lián)規(guī)則的正確性 測試告警關聯(lián)主程序各項功能的可用性和穩(wěn)定性 - 8 - /webmoney 告警關聯(lián)功能驗證方法 功能驗證 建議: 各省在告警關聯(lián)程序部署的初期,必須密切留意告警關聯(lián)各功能程序的運行狀態(tài)以及不其相關的周邊功能的狀態(tài),確保告警關聯(lián)程序異常能夠及時發(fā)現(xiàn)和處理,且丌影響其他功能的正常運作。 告警關聯(lián)主程序 關聯(lián)告警能夠正常生成 關聯(lián)告警能夠正常呈現(xiàn)入庫,能查詢歷史關聯(lián)告警 界面上有關聯(lián)拓撲圖功能 衍生告警信息不梳理表一致 告警關聯(lián)規(guī)則配置模塊 能夠查詢告警關聯(lián)規(guī)則配置 能夠修改告警關聯(lián)規(guī)則的量值( X和 Y),幵生效 能夠啟用 /禁用告警關聯(lián)規(guī)則,幵生效 告警關聯(lián) KPI報表程序 能夠每天生成正確的報表 報表數(shù)據(jù)無缺數(shù) 報表數(shù)據(jù)無小于 0,百分比超 100的數(shù)據(jù)邏輯錯誤 報表數(shù)據(jù)無算法錯誤,如“關聯(lián)成功數(shù)”大于“匹配告警數(shù)” 客戶端程序不告警庫驗證 界面不配置文件驗證 報表程序不數(shù)據(jù)源驗證 - 9 - /webmoney 告警關聯(lián)功能部署舉例 1、衍生告警存在告警指紋重復問題 廣東發(fā)現(xiàn)關聯(lián)分析主程序生成的衍生告警指紋重復,影響到后續(xù)的告警歷史庫的同步,直接引發(fā)告警系統(tǒng)占用主機資源嚴重而使主機崩潰。 【 解決過程 】 已升級新的關聯(lián)分析主程序,加上內部程序的唯一碼判重,可以保證生成的告警指紋唯一。 【 經(jīng)驗分享 】 要 留意關聯(lián)告警的入庫情況 ,及時發(fā)現(xiàn)入庫異常。 2、不需關注的告警屏蔽 告警關聯(lián)程序部署中發(fā)現(xiàn),有丌需要被處理的告警進入了關聯(lián),產(chǎn)生了丌需要處理的告警關聯(lián)。 【 解決過程 】 告警關聯(lián)功能要處理的告警應為 1 3級告警、非工程告警和非退網(wǎng)網(wǎng)元的告警,在告警關聯(lián)主程序的入口處應該進行告警過濾,屏蔽了四級告警、工程告警以及退網(wǎng)網(wǎng)元,只保留現(xiàn)網(wǎng)有業(yè)務告警。 【 經(jīng)驗分享 】 告警關聯(lián)功能的入口應是需要被關注和需要被處理的告警,在實施過程中應該予以限制。 - 10 - /webmoney 告警關聯(lián)規(guī)則驗證方法 規(guī)則驗證 建議: 各省在告警關聯(lián)規(guī)則部署中,必須先核查關聯(lián)規(guī)則配置文件,確保不告警關聯(lián)規(guī)則梳理表一致,以免日后驗證工作中增添干擾源。 關聯(lián)規(guī)則 配置文件 表征:某告警關聯(lián)規(guī)則無法生成關聯(lián),無匹配告警 檢查項: 1、網(wǎng)管告警 ID 2、告警標題 3、網(wǎng)元類型 4、告警關聯(lián)類型 5、量值設置 6、告警關聯(lián)規(guī)則條件 一般問題出現(xiàn)在 1、 2點 目標:兩者信息完全一致 前提 驗證 建議采取在測試環(huán)境中,人工生成所有規(guī)則的告警,進行要部署規(guī)則的測試驗證。 目標: 驗證率 100,規(guī)則中的問題必須在現(xiàn)網(wǎng)部署前全部解決。 - 11 - /webmoney 告警關聯(lián)功能部署舉例 1、愛立信主次 -基站低壓引起小區(qū)退服規(guī)則 【 問題描述 】 該規(guī)則一直無法產(chǎn)生關聯(lián)告警,且僅能匹配一種告警,另外一種無法匹配。 【 解決過程 】 經(jīng)查看告警關聯(lián)規(guī)則 XML配置文件,發(fā)現(xiàn)其中主告警“ RADIO X-CEIVER ADMINISTRATION BTS EXTERNAL FAULT”告警標題寫成“ RADIO X-CEIVER ADMINISTRATION”,導致該類告警無法進入此關聯(lián)規(guī)則,最終導致無法產(chǎn)生關聯(lián)告警。更新規(guī)則后在現(xiàn)網(wǎng)驗證,已有關聯(lián)告警產(chǎn)生,問題解決。 【 經(jīng)驗總結 】 若關聯(lián)規(guī)則一直無法產(chǎn)生關聯(lián),建議先查看告警關聯(lián)規(guī)則源文件,告警匹配規(guī)則是否配置錯誤, 一般來說為網(wǎng)管告警 ID或者告警標題錯誤。 2、愛立信主次 -APG進程啟動導致進程相關的如計費 _統(tǒng)計等告警規(guī)則 【 問題描述 】 該關聯(lián)規(guī)則一直無法生成關聯(lián)告警,且能匹配的告警類型丌全,有一種告警一直無法匹配。 【 解決過程 】 經(jīng)查看關聯(lián)規(guī)則 XML配置文件,發(fā)覺 CPT FAULT的網(wǎng)管告警ID為“ 001-001-00-800070”,經(jīng)查看告警多維梳理表,發(fā)覺有誤,應為“ 001-001-00-800069”。更新規(guī)則后在現(xiàn)網(wǎng)驗證。 【 經(jīng)驗總結 】 若關聯(lián)規(guī)則一直無法產(chǎn)生關聯(lián),建議先查看告警關聯(lián)規(guī)則源文件,告警匹配規(guī)則是否配置錯誤,一般來說為網(wǎng)管告警 ID或者告警標題錯誤。 - 12 - /webmoney 告警關聯(lián)功能部署建議 因告警關聯(lián)規(guī)則配置文件是以 網(wǎng)管告警 ID 告警標題 唯一確定一類告警,存在網(wǎng)管告警 ID不告警標題丌一致導致無法確訃一類告警。 基于愛立信多維梳理表是以告警標題為 KEY值,告警標題已足以唯一確定一類告警,因此廣東在部署愛立信告警關聯(lián)規(guī)則上,去掉網(wǎng)管告警 ID條件,僅以告警標題作為唯一匹配條件,以免增加丌確定因素。 建議 : 各省也可以參照告警多維梳理表中的 KEY值來部署關聯(lián)規(guī)則配置文件中的 KEY值。 - 13 - /webmoney 目錄 告警關聯(lián)功能部署驗證方法 1 告警關聯(lián)規(guī)則優(yōu)化方法 2 3 告警關聯(lián)指標分析方法 - 14 - /webmoney 告警關聯(lián)規(guī)則優(yōu)化 告警關聯(lián)功能部署驗證后,保證了功能的穩(wěn)定性和規(guī)則的正確性。接著進入了告警關聯(lián)規(guī)則的分析優(yōu)化工作階段。 效果分析 參數(shù)優(yōu)化 現(xiàn)網(wǎng)驗證 關聯(lián)規(guī)則部署后不斷驗證,對異常的關聯(lián)規(guī)則和需要優(yōu)化的關聯(lián)規(guī)則進行標識和統(tǒng)計。 通過各種分析方法與手段,結合各省實際運維情況,對關聯(lián)規(guī)則進行分析和調優(yōu)。 部署優(yōu)化后的關聯(lián)規(guī)則,進行現(xiàn)網(wǎng)驗證 目標: 1、 告警關聯(lián)能夠有效減少告警呈現(xiàn)量和工單派發(fā)量 2、能夠有效自動分析故障定位 - 15 - /webmoney 相關告警實際時間間隔和次數(shù)是否與關聯(lián)規(guī)則中的量值有出入導致無法關聯(lián) 相關告警是否在現(xiàn)網(wǎng)出現(xiàn)過 是否未匹配導致無網(wǎng)管告警 ID 告警關聯(lián)規(guī)則優(yōu)化方法 問題 1:某些規(guī)則無法產(chǎn)生關聯(lián) /關聯(lián)極少 解決方向:查找分析無法生成關聯(lián)的原因 是否存在關聯(lián)告警? 關聯(lián)規(guī)則量值是否合理? 相關告警實際情況是否能滿足關聯(lián)規(guī)則條件 關聯(lián)規(guī)則條件是否合理? 告警沒出現(xiàn)的原因 告警未匹配原因 告警實際不能滿足關聯(lián)規(guī)則條件的原因 分析關聯(lián)規(guī)則量值的合理性 制定關聯(lián)規(guī)則修改方案,重新部署關聯(lián)規(guī)則。 異常 注意:要結合實際運維要求合理優(yōu)化, 存在正常情況的無關聯(lián)告警產(chǎn)生,不要為了產(chǎn)生關聯(lián)而搞關聯(lián)。 繼續(xù)觀察 對未匹配告警進行梳理 - 16 - /webmoney 告警關聯(lián)規(guī)則優(yōu)化方法 問題 2:某些以壓縮告警的關聯(lián)規(guī)則沒有很好的壓縮告警 解決方向:橫向比較優(yōu)化規(guī)則量值 規(guī)則 A( x1,y1) 規(guī)則 A( x2,y2) 規(guī)則 A( x3,y3) 分析這些規(guī)則的壓縮情況 挑選最優(yōu)量值 配置多種目標規(guī)則條件與量值的關聯(lián)規(guī)則 規(guī)則 A( x1,y1) 壓縮量,匹配告警數(shù) 規(guī)則 A( x2,y2) 壓縮量,匹配告警數(shù) 規(guī)則 A( x3,y3) 壓縮量,匹配告警數(shù) 規(guī)則 A( x2,y2) 優(yōu)化 同一告警會同時匹配到多條關聯(lián)規(guī)則的特性 分析壓縮量和匹配告警數(shù)兩個指標考慮 根據(jù)壓縮效果目標選定合適的量值 - 17 - /webmoney 告警關聯(lián)規(guī)則優(yōu)化方法 問題 2:某些以壓縮告警的關聯(lián)規(guī)則沒有很好的壓縮告警 解決方向:橫向比較優(yōu)化規(guī)則量值 優(yōu)化 分析這些規(guī)則的壓縮情況 規(guī)則 A( x1,y1) 壓縮量,匹配告警數(shù) 規(guī)則 A( x2,y2) 壓縮量,匹配告警數(shù) 規(guī)則 A( x3,y3) 壓縮量,匹配告警數(shù) 分析壓縮量和匹配告警數(shù)兩個指標考慮 要增大壓縮率,一般采取增大 X值以加長關聯(lián)時間,使更多的告警能夠被關聯(lián)在一起,Y值可丌變或者稍微增加以升高關聯(lián)門檻,減少衍生告警數(shù)量。 通過分析告警壓縮量和匹配告警數(shù)兩個指標,在所匹配的告警數(shù)變化丌大的情況下,告警壓縮量得到提升,衍生告警數(shù)量得到減少為確實能夠提升告警壓縮效能的體現(xiàn)。 建議:在告警關聯(lián)規(guī)則梳理表中的量值具有一定的指導性意義,量值的調優(yōu)應該在關聯(lián)規(guī)則原量值基礎上作微調,丌應作太大改勱,否則將影響規(guī)則本來的關聯(lián)意義。 建議:請避免單方面考慮告警壓縮效能從而導致以下兩種丌應該出現(xiàn)的情況: 1、告警匹配數(shù)量減少,使得本來應該被關聯(lián)的告警被排除在外。 2、時間窗設置過大,使得告警關聯(lián)成為純粹的告警合幵容器。 - 18 - /webmoney 告警關聯(lián)規(guī)則優(yōu)化舉例 異常: M3UA偶聯(lián)中斷導致的 M3UA信令全阻規(guī)則 優(yōu)化原因: 該關聯(lián)規(guī)則一直無法生成關聯(lián)告警 。 優(yōu)化方法:修改該規(guī)則的關聯(lián)條件。 分析過程: 1、從告警庫中抽樣分析,發(fā)現(xiàn)在關聯(lián)條件范圍內產(chǎn)生了該規(guī)則的子告警和父告警,但是無法被關聯(lián)。 2、查看關聯(lián)規(guī)則,發(fā)現(xiàn)該規(guī)則需要滿足父告警的 SPID不子告警的 SAID要一樣才能被關聯(lián)。 3、廣東現(xiàn)網(wǎng)中 SAID不 SPID的命名規(guī)則丌一致,此關聯(lián)條件丌成立。 結論:該規(guī)則的關聯(lián)條件丌符合現(xiàn)網(wǎng)情況,需修訂完善關聯(lián)規(guī)則。 異常: APG進程啟勱導致進程相關的如計費統(tǒng)計等告警規(guī)則 優(yōu)化原因: 該關聯(lián)規(guī)則一直無法生成關聯(lián)告警 。 優(yōu)化方法:增大該規(guī)則的 X量值,以便告警容易產(chǎn)生。 分析過程: 1、查看歷史庫,發(fā)現(xiàn)同一網(wǎng)元產(chǎn)生該規(guī)則關聯(lián)告警的時間間隔均在 5分鐘以外; 2、把 X調整為 10分鐘后,再到現(xiàn)網(wǎng)驗證; 3、發(fā)現(xiàn)能夠產(chǎn)生關聯(lián)關系。 結論:該規(guī)則 X值應為 10,才能有效產(chǎn)生告警關聯(lián)。 - 19 - /webmoney 告警關聯(lián)規(guī)則優(yōu)化舉例 優(yōu)化:同一網(wǎng)元 SNT告警合幵規(guī)則優(yōu)化 規(guī)則名 X值 Y值 匹配告警 衍生告警 原始告警 愛立信衍生 -同一網(wǎng)元 SNT告警合并 5 2 1651 18 459 5 3 1651 18 459 5 4 1651 19 461 5 5 1651 17 457 20 2 1651 8 438 30 2 1651 8 438 60 2 1651 8 438 優(yōu)化原因:該規(guī)則衍生告警過多,達丌到告警合幵效果。 優(yōu)化方法:通過部署丌同 X、 Y量值的規(guī)則,進行橫向對比。 分析過程: 1、當 X丌變, Y增大,衍生告警數(shù)量和原始告警數(shù)量變化丌大。 2、當 Y丌變, X變大,衍生告警數(shù)量和原始告警數(shù)量一致。 3、當 Y 2時, X越大,衍生告警產(chǎn)生的越少,原始告警量變化丌大。 結論:該規(guī)則適當增加 X值,滿足對告警進行合幵的目的。 - 20 - /webmoney 目錄 告警關聯(lián)功能部署驗證方法 1 告警關聯(lián)規(guī)則優(yōu)化方法 2 3 告警關聯(lián)指標分析方法 - 21 - /webmoney 告警關聯(lián)指標 告警關聯(lián)功能是在支撐系統(tǒng)底層實現(xiàn),天生缺乏顯性化的效能呈現(xiàn),必須提供相應的顯性化呈現(xiàn)和分析依據(jù)。 集團制定了 中國移勱告警標準化運維管理指標體系 ,幵部署了告警關聯(lián)相關報表。 通過對告警關聯(lián)相關指標進行分析,可以輔劣告警關聯(lián)的驗證和優(yōu)化工作。 - 22 - /webmoney 告警關聯(lián)指標分析方法 單條規(guī)則分析指標報表 ,以規(guī)則為粒度統(tǒng)計此規(guī)則的告警關聯(lián)相關指標對于進行規(guī)則優(yōu)化分析工作有很大用途 涉及告警種類 匹配告警數(shù) 單條關聯(lián)規(guī)則的關注價值 單條關聯(lián)規(guī)則的壓縮量 關聯(lián)成功數(shù) 衍生告警數(shù)量 主告警數(shù)量 子告警數(shù)量 1、如果匹配數(shù)為 0,則有可能匹配規(guī)則異常。 2、如果匹配數(shù)過少 ,則可以分析關聯(lián)規(guī)則和量值的合理性。 壓縮量要不關聯(lián)成功數(shù)做參照,若壓縮量丌理想,可以優(yōu)化此規(guī)則,增加壓縮比 關聯(lián)成功數(shù)要不匹配告警數(shù)做參照,若關聯(lián)成功比丌高,可以優(yōu)化此規(guī)則,增加成功比例 以減少衍生告警產(chǎn)生為目的進行量值優(yōu)化時,增加時間窗或者加高門檻。 主次告警應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論