智能IT運(yùn)維監(jiān)控平臺(tái)-技術(shù)白皮書V2_第1頁(yè)
智能IT運(yùn)維監(jiān)控平臺(tái)-技術(shù)白皮書V2_第2頁(yè)
智能IT運(yùn)維監(jiān)控平臺(tái)-技術(shù)白皮書V2_第3頁(yè)
智能IT運(yùn)維監(jiān)控平臺(tái)-技術(shù)白皮書V2_第4頁(yè)
智能IT運(yùn)維監(jiān)控平臺(tái)-技術(shù)白皮書V2_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

目錄一、背景與需求 41、背景 42、需求要點(diǎn) 4二、解決方案與系統(tǒng)構(gòu)架 61、解決方案 62、系統(tǒng)構(gòu)架 7三、系統(tǒng)及運(yùn)維監(jiān)控功能與特點(diǎn) 83.1系統(tǒng)功能特點(diǎn) 83.1.1IT資源集中監(jiān)控管理 8、IT資源運(yùn)行狀態(tài)統(tǒng)一展示 8、IT資源告警事件管理 8、IT設(shè)備智能巡檢 9、業(yè)務(wù)維度監(jiān)控 9、業(yè)務(wù)維度的拓?fù)湔故?10、應(yīng)用性能分析 10、IT資源使用分析 113.2監(jiān)控功能 11、IT資源監(jiān)控類型 11、網(wǎng)絡(luò)設(shè)備狀態(tài)監(jiān)控 11、效勞器狀態(tài)監(jiān)控 13、數(shù)據(jù)庫(kù)監(jiān)控 14、Web中間件監(jiān)控 14、虛擬設(shè)備監(jiān)控 17四、部署與配置 184.1、部門級(jí)部署 184.2、企業(yè)應(yīng)用部署 184.3、集團(tuán)應(yīng)用部署 194.4、部署要求 204.5、運(yùn)行環(huán)境 20五、效益與價(jià)值 215.1、產(chǎn)品價(jià)值 215.2、效益表達(dá) 21一、背景與需求1、背景隨著我國(guó)工業(yè)企業(yè)及組織機(jī)構(gòu)信息化建設(shè)的快速開展,越來(lái)越多的企業(yè)核心業(yè)務(wù)及機(jī)構(gòu)工作的開展已經(jīng)高度依賴于信息系統(tǒng)的應(yīng)用,隨著信息化的不斷深入,信息系統(tǒng)越來(lái)越多,各類系統(tǒng)越來(lái)越復(fù)雜,系統(tǒng)間的關(guān)聯(lián)度也越來(lái)越高,使得企事業(yè)單位的IT運(yùn)行環(huán)境日趨復(fù)雜,各類IT設(shè)備的運(yùn)行監(jiān)控難度加大,由于IT系統(tǒng)的運(yùn)行環(huán)境更加復(fù)雜,造成了機(jī)房管理、系統(tǒng)監(jiān)控和運(yùn)行維護(hù)工作變的十分困難。目前單個(gè)的IT設(shè)備初步具有自監(jiān)控的手段和方法,但由于設(shè)備的種類數(shù)量眾多且分屬不同的平臺(tái)和廠商,導(dǎo)致運(yùn)維監(jiān)控工作各自為政,運(yùn)維監(jiān)控缺乏一個(gè)集中、統(tǒng)一的運(yùn)維監(jiān)控平臺(tái),使得各類設(shè)備運(yùn)行事件無(wú)法做到實(shí)時(shí)統(tǒng)一。由于缺少一個(gè)IT統(tǒng)一的監(jiān)控運(yùn)維平臺(tái),任何一個(gè)IT設(shè)備資源出現(xiàn)故障時(shí)都需要IT運(yùn)維人員手工查找與排查故障產(chǎn)生原因和定位故障,使得運(yùn)維人員對(duì)于日常的運(yùn)維工作還是處于被動(dòng)等待“救火式”狀態(tài)之中,運(yùn)維事件的發(fā)現(xiàn)收集操作為傳統(tǒng)手工方式,往往是故障事件發(fā)生后,運(yùn)維人員被動(dòng)告知后去處理問(wèn)題,嚴(yán)重制約IT運(yùn)維的響應(yīng)速度和執(zhí)行效率,影響企事業(yè)單位的IT信息系統(tǒng)的順利使用。通過(guò)建立智能IT運(yùn)維監(jiān)控平臺(tái),對(duì)網(wǎng)絡(luò)、硬件、平安設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用系統(tǒng)、機(jī)房空調(diào)、UPS等資源實(shí)時(shí)監(jiān)控采集,能夠自動(dòng)地收集信息系統(tǒng)中各類IT資源設(shè)備運(yùn)行狀態(tài)、數(shù)據(jù)庫(kù)狀態(tài)、中間件運(yùn)行狀態(tài)和網(wǎng)絡(luò)狀態(tài)等,發(fā)現(xiàn)各類IT資源運(yùn)行過(guò)程中的異常。依據(jù)業(yè)務(wù)視角和設(shè)備視角分析發(fā)現(xiàn)已發(fā)生和潛在的各類資源問(wèn)題,及時(shí)通知相關(guān)責(zé)任人和啟動(dòng)相關(guān)運(yùn)維流程。2、需求要點(diǎn)智能IT運(yùn)維監(jiān)控平臺(tái)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)、應(yīng)用效勞器、業(yè)務(wù)系統(tǒng)、各類主機(jī)資源和平安設(shè)備等運(yùn)行狀態(tài)的全面監(jiān)控,建立對(duì)各類IT資源的各類運(yùn)行狀態(tài)參數(shù)的采集、分析,及時(shí)發(fā)現(xiàn)和定位IT設(shè)備故障,啟動(dòng)相關(guān)的故障解決流程。智能IT運(yùn)維監(jiān)控平臺(tái)可從IT視角完成對(duì)各類IT資源監(jiān)控的同時(shí),也提供從業(yè)務(wù)系統(tǒng)的視角對(duì)IT資源監(jiān)控運(yùn)維方法。智能IT資源集中監(jiān)控平臺(tái)系統(tǒng)必須做到:強(qiáng)化主動(dòng)監(jiān)控,實(shí)現(xiàn)集中管理。以應(yīng)用性能和應(yīng)用系統(tǒng)為監(jiān)控主線,集成各類監(jiān)控工具,構(gòu)建統(tǒng)一集中的IT系統(tǒng)資源監(jiān)控平臺(tái),能夠主動(dòng)及時(shí)發(fā)現(xiàn)問(wèn)題,解決被動(dòng)效勞的局面。同時(shí)以自主運(yùn)維為目的,主動(dòng)監(jiān)控,自動(dòng)更新,自動(dòng)實(shí)現(xiàn)IT運(yùn)維監(jiān)控管理。幫助定位故障,快速恢復(fù)系統(tǒng)運(yùn)行。建立針對(duì)IT資源的集中告警分析機(jī)制和故障預(yù)警機(jī)制,提供自動(dòng)化故障處理能力,當(dāng)故障產(chǎn)生時(shí),可以進(jìn)行故障的快速定位,很快發(fā)現(xiàn)問(wèn)題根源并找到相應(yīng)的解決方案,從而縮短故障解決時(shí)間,減少維護(hù)本錢。提高運(yùn)行效率,合理利用IT資源。建立統(tǒng)一IT資源監(jiān)控平臺(tái)后,可以實(shí)時(shí)了解全部IT資源的使用和運(yùn)行情況,根據(jù)IT業(yè)務(wù)需要從整體角度考慮資源的使用,甚至可以根據(jù)業(yè)務(wù)頂峰期的不同來(lái)調(diào)劑業(yè)務(wù)系統(tǒng)對(duì)資源的使用。提供統(tǒng)計(jì)分析和決策支持。通過(guò)提供各類資源的性能分析報(bào)表、資源統(tǒng)計(jì)報(bào)表和運(yùn)維分析報(bào)表,從各個(gè)側(cè)面、各個(gè)角度反映系統(tǒng)的運(yùn)行狀況、性能情況和運(yùn)維人員工作情況,為系統(tǒng)升級(jí)、改造、擴(kuò)容提供科學(xué)依據(jù)。全面直觀的系統(tǒng)展示。通過(guò)一個(gè)統(tǒng)一的門戶系統(tǒng),有效的展示內(nèi)部的IT資源運(yùn)行情況、性能狀況、效勞工單情況等,使得領(lǐng)導(dǎo)、管理者、技術(shù)人員能迅速了解自己關(guān)心的問(wèn)題。二、解決方案與系統(tǒng)構(gòu)架1、解決方案智能IT資源集中監(jiān)控平臺(tái)以企業(yè)的實(shí)際在用IT資產(chǎn)和業(yè)務(wù)系統(tǒng)來(lái)構(gòu)架監(jiān)控管理的對(duì)象,建立網(wǎng)絡(luò)管理、主機(jī)系統(tǒng)管理、應(yīng)用效勞管理和虛擬設(shè)備等IT資源的統(tǒng)一監(jiān)控管理平臺(tái)。各項(xiàng)管理數(shù)據(jù)共享集中,互通互融。IT運(yùn)維監(jiān)控平臺(tái)即可根據(jù)IT資源類型分類監(jiān)控各類IT資源,也可按照業(yè)務(wù)信息系統(tǒng)所依賴的IT資源建立模型,實(shí)現(xiàn)對(duì)業(yè)務(wù)資源模型的運(yùn)維監(jiān)控。通過(guò)業(yè)務(wù)監(jiān)控模型能夠簡(jiǎn)化IT資源運(yùn)行狀態(tài)監(jiān)控,提高企業(yè)IT運(yùn)維的總體效勞品質(zhì)。通過(guò)統(tǒng)一的管理系統(tǒng)對(duì)管轄內(nèi)IT對(duì)象的運(yùn)行狀態(tài)和系統(tǒng)性能進(jìn)行實(shí)時(shí)的監(jiān)控,并以圖形化的方式直觀地展示出來(lái)。對(duì)于系統(tǒng)運(yùn)行的異常表現(xiàn)及時(shí)報(bào)警,提供故障修復(fù)功能;同時(shí)預(yù)設(shè)性能監(jiān)控閘值,以幫助在系統(tǒng)出現(xiàn)問(wèn)題之前提前向管理人員發(fā)出預(yù)警。從而可以積極主動(dòng)地發(fā)現(xiàn)問(wèn)題,改變被動(dòng)管理的局面,保障系統(tǒng)的高可用性。整個(gè)系統(tǒng)以事件為核心,可將IT資源監(jiān)控管理系統(tǒng)與ITIL運(yùn)維流程系統(tǒng)有機(jī)地結(jié)合在一起,采用統(tǒng)一事件管理系統(tǒng),對(duì)整個(gè)系統(tǒng)內(nèi)的所有事件進(jìn)行收集、關(guān)聯(lián)分析和處理。局部事件自動(dòng)采取修復(fù)動(dòng)作,同時(shí)可以有選擇的將事件發(fā)送給運(yùn)維流程管理系統(tǒng),并按照不同類別事件預(yù)先定義的處理流程控制事件的處理。通過(guò)事件問(wèn)題管理的有效執(zhí)行,將整個(gè)運(yùn)維效勞模式由被動(dòng)支持轉(zhuǎn)為主動(dòng)效勞。2、系統(tǒng)構(gòu)架如上圖所示,智能IT運(yùn)維集中監(jiān)控系統(tǒng)以各種IT硬件設(shè)備的監(jiān)控信息和日志信息做為數(shù)據(jù)源,以各類數(shù)據(jù)的流轉(zhuǎn)和處理為功能劃分依據(jù),將總體功能分為4大類別:數(shù)據(jù)采集功能:根據(jù)平臺(tái)指定的運(yùn)維策略,數(shù)據(jù)采集層負(fù)責(zé)從網(wǎng)絡(luò)設(shè)備、平安設(shè)備、業(yè)務(wù)系統(tǒng)、效勞器等采集各類運(yùn)行信息、日志信息、流量信息,經(jīng)過(guò)數(shù)據(jù)格式標(biāo)準(zhǔn)化、數(shù)據(jù)歸并、數(shù)據(jù)壓縮等處理后,提交給上層數(shù)據(jù)處理平臺(tái)。采集后的信息經(jīng)過(guò)歸并匯總后可在系統(tǒng)中進(jìn)行查看和編輯。數(shù)據(jù)處理功能:平臺(tái)將采集到的原始數(shù)據(jù)按照業(yè)務(wù)系統(tǒng)數(shù)據(jù)、IT資源狀態(tài)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、日志數(shù)據(jù)進(jìn)行分門別類,經(jīng)過(guò)基于統(tǒng)計(jì)、基于資產(chǎn)、基于規(guī)那么的關(guān)聯(lián)分析后,科學(xué)合理的定義運(yùn)維事件的性質(zhì)和處理級(jí)別,作為展示平臺(tái)的數(shù)據(jù)根底。數(shù)據(jù)分析功能:以豐富的報(bào)表展示手段對(duì)各類數(shù)據(jù)進(jìn)行直觀顯示,輔助以網(wǎng)絡(luò)拓?fù)鋱D形化功能為平臺(tái)用戶提供方便快捷的信息獲取途徑。對(duì)于運(yùn)維數(shù)據(jù)分析,也會(huì)借助知識(shí)庫(kù)提供的分析策略,提高數(shù)據(jù)分析的準(zhǔn)確性。監(jiān)控預(yù)警功能:實(shí)現(xiàn)整個(gè)平臺(tái)的靈活展示和配置管理。一方面通過(guò)豐富的圖形化展示方式呈現(xiàn)IT資源、業(yè)務(wù)網(wǎng)絡(luò)系統(tǒng)的整體運(yùn)行狀況和平安,提供有效的平安預(yù)警,減少IT資源故障和平安破壞的發(fā)生,降低事故所造成的損失。三、系統(tǒng)及運(yùn)維監(jiān)控功能與特點(diǎn)3.1系統(tǒng)功能特點(diǎn)3.1.1IT資源集中監(jiān)控管理通過(guò)統(tǒng)一的IT運(yùn)維監(jiān)控管理平臺(tái),企業(yè)可從設(shè)備分類和業(yè)務(wù)信息系統(tǒng)視角出發(fā),實(shí)現(xiàn)對(duì)效勞器系統(tǒng)、網(wǎng)絡(luò)、平安產(chǎn)品、操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、應(yīng)用系統(tǒng)、儲(chǔ)存設(shè)備、IT環(huán)境等系統(tǒng)的狀態(tài)和性能的實(shí)時(shí)監(jiān)控。提供統(tǒng)一的用戶界面,統(tǒng)一的管理手段,準(zhǔn)確反映各類設(shè)備運(yùn)行狀態(tài)和性能。對(duì)于效勞器系統(tǒng)及網(wǎng)絡(luò)運(yùn)行的異常表現(xiàn)進(jìn)行預(yù)警,能夠?qū)崟r(shí)產(chǎn)生趨勢(shì)性能分析報(bào)告、統(tǒng)計(jì)報(bào)告、TOP-N報(bào)告和歷史報(bào)告。為優(yōu)化IT系統(tǒng)性能和解決故障提供數(shù)據(jù)分析依據(jù)。集中監(jiān)控系統(tǒng)應(yīng)支持有代理和無(wú)代理的監(jiān)控方式,對(duì)各類應(yīng)用效勞器的配置數(shù)據(jù)、性能數(shù)據(jù)、告警數(shù)據(jù)進(jìn)行采集。同時(shí)集中監(jiān)控管理系統(tǒng)能夠通過(guò)多種監(jiān)測(cè)工具自動(dòng)地定期和不定期監(jiān)測(cè)效勞器系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、數(shù)據(jù)庫(kù)等設(shè)備的根本配置數(shù)據(jù)。、IT資源運(yùn)行狀態(tài)統(tǒng)一展示集中監(jiān)控系統(tǒng)的監(jiān)控視圖實(shí)現(xiàn)對(duì)所有被監(jiān)控對(duì)象告警的統(tǒng)一監(jiān)控、集中展現(xiàn)。監(jiān)控視圖可以展示不同監(jiān)控偏重的IT資源監(jiān)控視圖,如網(wǎng)絡(luò)拓?fù)湟晥D、資源狀態(tài)視圖、業(yè)務(wù)應(yīng)用視圖、平安視圖、存儲(chǔ)視圖等。對(duì)不同的用戶可提供不同的監(jiān)控界面,顯示不同的監(jiān)測(cè)內(nèi)容。對(duì)管理人員顯示對(duì)業(yè)務(wù)影響較為嚴(yán)重的告警和告警處理記錄。對(duì)具體的維護(hù)人員,根據(jù)其分工,顯示不同的監(jiān)測(cè)內(nèi)容,不同的告警信息,便于具體IT運(yùn)維人員及時(shí)發(fā)現(xiàn)問(wèn)題和處理問(wèn)題。3.1.3、IT資源告警事件管理通過(guò)對(duì)采集的IT資源數(shù)據(jù)過(guò)濾、壓縮、歸并、聚合,通過(guò)關(guān)聯(lián)分析技術(shù),提取有效的告警信息上報(bào)告警中心。系統(tǒng)提供了靈活的告警設(shè)置,多樣的告警推送方式。系統(tǒng)告警規(guī)那么可實(shí)現(xiàn)快速設(shè)置,預(yù)置大量告警規(guī)那么,提供基于設(shè)備類型指標(biāo)參數(shù)的告警批量設(shè)置。告警的推送方式支持短信、郵件、微信等。系統(tǒng)提供靈活的告警查詢方式,可通過(guò)告警檢測(cè)指標(biāo)進(jìn)行統(tǒng)一查詢,實(shí)現(xiàn)指標(biāo)統(tǒng)一分析;也可通過(guò)設(shè)備IP查詢?cè)撛O(shè)備上所有的告警。告警事件展示分為兩種,即列表式告警事件展示和拓?fù)涫礁婢故尽A斜硎礁婢@示是展示完整、統(tǒng)一的圖形化告警事件界面,集中顯示各IT資源發(fā)生的各類告警事件,確保運(yùn)維人員可以及時(shí)響應(yīng);拓?fù)涫礁婢@示是在拓?fù)鋱D上實(shí)時(shí)以不同的顏色標(biāo)識(shí)顯示告警信息,提醒運(yùn)維人員注意。3.1.4、IT設(shè)備智能巡檢系統(tǒng)可以按照IT運(yùn)維的管理要求實(shí)現(xiàn)不同頻度對(duì)不同設(shè)備運(yùn)行狀態(tài)的無(wú)人智能巡檢,巡檢的設(shè)備運(yùn)行狀態(tài)數(shù)據(jù)依據(jù)自主學(xué)習(xí)的業(yè)務(wù)基線以及業(yè)界標(biāo)準(zhǔn)基準(zhǔn)值進(jìn)行分析檢測(cè);并將巡檢異常以實(shí)時(shí)狀態(tài)、越界統(tǒng)計(jì)、巡檢報(bào)表、智能策略方式進(jìn)行反響。智能巡檢對(duì)于不符合內(nèi)置檢測(cè)閘值的事件定義為越界事件,系統(tǒng)以越界事件的出現(xiàn)規(guī)律進(jìn)行數(shù)據(jù)判斷,提供完善的分析統(tǒng)計(jì),包含等級(jí)、時(shí)間、指標(biāo)、IP范圍的越界比例TOPN分析,周越界比率增長(zhǎng)TOPN,月越界比率TOPN。對(duì)于短期內(nèi)出現(xiàn)越界過(guò)多的指標(biāo),系統(tǒng)通知相關(guān)運(yùn)維人員。、業(yè)務(wù)維度監(jiān)控系統(tǒng)提供靈活的業(yè)務(wù)定義方式,可以將網(wǎng)絡(luò)、主機(jī)、數(shù)據(jù)庫(kù)、應(yīng)用、存儲(chǔ)、虛擬化等IT資源作為相關(guān)業(yè)務(wù)的組成單元,從業(yè)務(wù)應(yīng)用視角提供應(yīng)客戶對(duì)IT資源的監(jiān)控方式??梢酝ㄟ^(guò)業(yè)務(wù)視圖發(fā)現(xiàn)業(yè)務(wù)組件的故障點(diǎn),從業(yè)務(wù)組件到對(duì)應(yīng)的IT資源設(shè)備,實(shí)現(xiàn)完整IT資源監(jiān)控和快速定位故障的效果。業(yè)務(wù)信息監(jiān)控系統(tǒng)應(yīng)具有良好的開放性,提供豐富的開放接口,滿足對(duì)新應(yīng)用系統(tǒng)的監(jiān)控定制需求,便于用戶對(duì)新應(yīng)用系統(tǒng)的監(jiān)控部署。能夠監(jiān)控各業(yè)務(wù)系統(tǒng)的實(shí)時(shí)工作狀態(tài),及時(shí)發(fā)現(xiàn)各業(yè)務(wù)系統(tǒng)的硬件宕機(jī)和邏輯宕機(jī)故障;可建立基于網(wǎng)絡(luò)系統(tǒng)、效勞器主機(jī)系統(tǒng)、數(shù)據(jù)庫(kù)系統(tǒng)和中間件應(yīng)用系統(tǒng)之上的企業(yè)綜合業(yè)務(wù)監(jiān)控管理系統(tǒng);能夠監(jiān)控各業(yè)務(wù)系統(tǒng)的整體運(yùn)行效率;在監(jiān)控整體效率的根底上,可將與業(yè)務(wù)系統(tǒng)相關(guān)聯(lián)的IT資源分解,可監(jiān)控單個(gè)IT資源的執(zhí)行效率,發(fā)現(xiàn)影響業(yè)務(wù)系統(tǒng)運(yùn)行效率的系統(tǒng)和設(shè)備;能夠?qū)I(yè)務(wù)系統(tǒng)涉及的IT資源進(jìn)行組合,形成以業(yè)務(wù)視角的運(yùn)行狀態(tài)監(jiān)控管理方式,從業(yè)務(wù)視角可查看各IT資源單元的運(yùn)行狀態(tài);能夠監(jiān)控業(yè)務(wù)系統(tǒng)的關(guān)鍵進(jìn)程和資源占用情況;能夠監(jiān)控業(yè)務(wù)系統(tǒng)所涉及IT系統(tǒng)的運(yùn)行日志,對(duì)系統(tǒng)日志進(jìn)行分析。當(dāng)系統(tǒng)出現(xiàn)異常情況及時(shí)報(bào)警,從而及時(shí)掌握應(yīng)用業(yè)務(wù)的運(yùn)行狀況,確認(rèn)系統(tǒng)的性能。分析系統(tǒng)的性能瓶頸,協(xié)助定位應(yīng)用系統(tǒng)的故障;能夠?qū)?yīng)用系統(tǒng)做根源故障分析,如根源故障在業(yè)務(wù)系統(tǒng)內(nèi),報(bào)出根源故障。如果根源故障在業(yè)務(wù)系統(tǒng)外,對(duì)引起的應(yīng)用系統(tǒng)故障進(jìn)行提示,并可追蹤根源故障;、業(yè)務(wù)維度的拓?fù)湔故疽灾匾獦I(yè)務(wù)效勞器系統(tǒng)為中心,系統(tǒng)提供重要業(yè)務(wù)系統(tǒng)的拓?fù)鋱D,顯示從數(shù)據(jù)庫(kù)效勞器到前置效勞器的業(yè)務(wù)效勞視圖。當(dāng)系統(tǒng)資源〔如效勞器、網(wǎng)絡(luò)等〕發(fā)生故障時(shí),能夠快速定位受影響的業(yè)務(wù)。支持在業(yè)務(wù)維度視圖上直接查看故障信息。業(yè)務(wù)效勞拓?fù)鋱D應(yīng)包括如下信息:拓?fù)鋱D包含也業(yè)務(wù)系統(tǒng)有關(guān)的所有設(shè)備,包含客戶端、交換機(jī)、路由器、效勞器、存儲(chǔ)藏份設(shè)備等。拓?fù)鋱D能夠反響業(yè)務(wù)系統(tǒng)的真實(shí)運(yùn)行狀態(tài),如效勞器端的IP地址、效勞器的性能、效勞器的存儲(chǔ)狀態(tài)等等。拓?fù)鋱D能夠與相關(guān)的維護(hù)信息相關(guān)聯(lián),可以從拓?fù)鋱D查詢業(yè)務(wù)系統(tǒng)的維護(hù)人員、業(yè)務(wù)維護(hù)信息,各處于熱備狀態(tài)的設(shè)備運(yùn)行情況等屬于效勞器的相關(guān)信息。拓?fù)鋱D能夠與相關(guān)的資產(chǎn)信息相關(guān)聯(lián)。拓?fù)鋱D與報(bào)警事件信息相關(guān)聯(lián),能夠?qū)崿F(xiàn)拓?fù)鋱D的報(bào)警。拓?fù)鋱D的報(bào)警事件與知識(shí)庫(kù)相關(guān)聯(lián),能夠查詢相關(guān)的處理方法,對(duì)出現(xiàn)的故障做推薦的處理措施。、應(yīng)用性能分析能夠監(jiān)控應(yīng)用系統(tǒng)的關(guān)鍵進(jìn)程和資源占用情況;能夠監(jiān)控應(yīng)用系統(tǒng)的運(yùn)行日志,通過(guò)對(duì)系統(tǒng)運(yùn)行日志和資源占用情況進(jìn)行分析,分析系統(tǒng)的性能瓶頸,協(xié)助定位應(yīng)用系統(tǒng)的故障。當(dāng)系統(tǒng)出現(xiàn)異常情況及時(shí)報(bào)警,從而及時(shí)掌握應(yīng)用業(yè)務(wù)的運(yùn)行狀況,確認(rèn)系統(tǒng)的性能。能夠?qū)I(yè)務(wù)系統(tǒng)的響應(yīng)時(shí)間做分層的分析,發(fā)現(xiàn)系統(tǒng)的性能瓶頸。3.1.8、IT資源使用分析可分析當(dāng)前IT資源使用情況和未來(lái)IT資源使用趨勢(shì),主要基于監(jiān)控對(duì)象的資源使用情況的監(jiān)控,如磁盤陣列、數(shù)據(jù)庫(kù)表空間、應(yīng)用系統(tǒng)容量及當(dāng)前用戶數(shù)量,分析展示一定時(shí)期內(nèi)相應(yīng)指標(biāo)的變化趨勢(shì)和未來(lái)開展趨勢(shì)的預(yù)測(cè)分析,幫助運(yùn)維人員掌握目前IT資源使用情況,可根據(jù)業(yè)務(wù)對(duì)IT資源做科學(xué)的規(guī)劃和調(diào)整。3.2監(jiān)控指標(biāo)功能、IT資源監(jiān)控類型3.2.2、網(wǎng)絡(luò)設(shè)備狀態(tài)監(jiān)控監(jiān)控平臺(tái)基于SNMP和SSH協(xié)議,對(duì)支持這些協(xié)議的網(wǎng)絡(luò)設(shè)備提供監(jiān)控和管理。網(wǎng)絡(luò)運(yùn)行狀態(tài)監(jiān)控包括網(wǎng)絡(luò)故障監(jiān)控、網(wǎng)絡(luò)性能監(jiān)控、網(wǎng)絡(luò)流量監(jiān)控和網(wǎng)絡(luò)配置監(jiān)控。網(wǎng)絡(luò)故障監(jiān)控功能:能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備出現(xiàn)的物理宕機(jī)〔如停電等〕、邏輯宕機(jī)〔如誤操作命令引起宕機(jī)等〕;能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備出現(xiàn)的CPU、電源、風(fēng)扇、設(shè)備溫度等故障;能夠接收網(wǎng)絡(luò)設(shè)備發(fā)出的故障日志信息;能夠發(fā)現(xiàn)重要網(wǎng)絡(luò)重要鏈路故障事件,重要網(wǎng)絡(luò)設(shè)備與網(wǎng)絡(luò)效勞器〔如網(wǎng)站系統(tǒng)、電子郵件系統(tǒng)、DNS系統(tǒng)、ERP應(yīng)用效勞器、PDM系統(tǒng)等〕之間的線路狀態(tài)、重要網(wǎng)絡(luò)設(shè)備與業(yè)務(wù)系統(tǒng)效勞器之間的線路狀態(tài)等;能夠發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備連接重要網(wǎng)絡(luò)鏈路的端口物理宕〔端口物理故障等〕、邏輯宕〔誤操作shutdown端口〕等;能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)協(xié)議故障事件,包括網(wǎng)絡(luò)協(xié)議運(yùn)行過(guò)程中產(chǎn)生的運(yùn)行故障〔如ospf協(xié)議運(yùn)行無(wú)法到達(dá)full狀態(tài)等〕,從而可能導(dǎo)致網(wǎng)絡(luò)運(yùn)行不正常的事件;能夠發(fā)現(xiàn)路由器CPU使用率過(guò)高〔大于85%〕和內(nèi)存余量太小而引起網(wǎng)絡(luò)質(zhì)量下降的故障;網(wǎng)絡(luò)性能監(jiān)控功能:能夠及時(shí)了解監(jiān)控的各類網(wǎng)絡(luò)設(shè)備的CPU使用率、內(nèi)存使用率;能夠及時(shí)了解重要網(wǎng)絡(luò)鏈路的帶寬利用率、Drop包率、Error包率、CRC校驗(yàn)錯(cuò)誤包率;能夠及時(shí)了解監(jiān)控交換機(jī)的總的數(shù)據(jù)吞吐量;能夠及時(shí)了解監(jiān)控交換機(jī)的端口速率〔端口總速率、端口入速率、端口出速率〕;能夠及時(shí)了解網(wǎng)絡(luò)設(shè)備運(yùn)行情況,如網(wǎng)絡(luò)設(shè)備連續(xù)運(yùn)行時(shí)間、網(wǎng)絡(luò)設(shè)備運(yùn)行狀態(tài)、網(wǎng)絡(luò)設(shè)備模塊運(yùn)行狀態(tài),網(wǎng)絡(luò)設(shè)備切換情況等;網(wǎng)絡(luò)流量監(jiān)控功能:能夠?qū)崿F(xiàn)根據(jù)源IP地址、目的IP地址、協(xié)議號(hào)、效勞號(hào)、自治域號(hào)等采集重要網(wǎng)絡(luò)鏈路流量、網(wǎng)絡(luò)整體流量等信息;能夠?qū)崿F(xiàn)設(shè)定網(wǎng)絡(luò)正常通信網(wǎng)絡(luò)流量的基準(zhǔn)數(shù)據(jù),通過(guò)與實(shí)際網(wǎng)絡(luò)流量比照,發(fā)現(xiàn)異常的網(wǎng)絡(luò)流量,定位異常流量屬性;能夠提供能夠準(zhǔn)確地了解到某個(gè)IP、某個(gè)協(xié)議、某個(gè)時(shí)段等的詳細(xì)流量信息,使網(wǎng)絡(luò)管理人員根據(jù)統(tǒng)計(jì)的數(shù)據(jù),制定適宜的流量監(jiān)控策略;網(wǎng)絡(luò)配置監(jiān)控功能:能夠及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備配置參數(shù)的變更,結(jié)合運(yùn)維管理系統(tǒng)中的變更管理流程驗(yàn)證網(wǎng)絡(luò)配置變更的合法性;能夠?qū)τ脩襞渲眠M(jìn)行監(jiān)控,判斷是否為合法用戶使用合法權(quán)限進(jìn)行合法操作;、效勞器狀態(tài)監(jiān)控效勞器系統(tǒng)監(jiān)控范圍包括各種效勞器系統(tǒng)的32位或64位系統(tǒng),包括AIX、Linux、Unix、Windows操作系統(tǒng)。幫助運(yùn)維人員實(shí)時(shí)了解主機(jī)的運(yùn)行狀態(tài),對(duì)監(jiān)控的指標(biāo)及時(shí)報(bào)警,保證主機(jī)系統(tǒng)的連續(xù)運(yùn)行,降低故障時(shí)間。根本監(jiān)控指標(biāo)包括:CPU監(jiān)控:CPU利用率,顯示系統(tǒng)/用戶/空閑時(shí)間百分比;支持多CPU和多核情況下的匯總顯示和分CPU/核顯示等;進(jìn)程監(jiān)控:進(jìn)程的運(yùn)行情況,如進(jìn)程、多個(gè)實(shí)例、子進(jìn)程等CPU、內(nèi)存、網(wǎng)絡(luò)等系統(tǒng)資源的占用情況,并對(duì)相關(guān)事件發(fā)出告警;磁盤監(jiān)控:被監(jiān)控系統(tǒng)上的配置磁盤〔包括物流磁盤、邏輯磁盤、虛擬磁盤、卷組、遠(yuǎn)程磁盤等〕的相關(guān)屬性。監(jiān)控內(nèi)容包含磁盤的配置屬性、磁盤空間使用率、數(shù)據(jù)傳輸、平均等待時(shí)間及繁忙程度等參數(shù)。當(dāng)某項(xiàng)或某些項(xiàng)的組合指標(biāo)超過(guò)特點(diǎn)閘值時(shí)報(bào)警;文件系統(tǒng)監(jiān)控:存儲(chǔ)空間和文件系統(tǒng)的占用率,超過(guò)限定閘值及時(shí)報(bào)警;特點(diǎn)文件:監(jiān)控系統(tǒng)中文件和目錄的相關(guān)屬性,包括名稱、文件大小、擁有者、訪問(wèn)權(quán)限、修改日期、文件包含的特定字符以及鏈接等。如發(fā)現(xiàn)文件被修改或其它異常時(shí)〔包括非法訪問(wèn)、大小異常等〕產(chǎn)生報(bào)警。同時(shí)監(jiān)控特定目錄下的文件個(gè)數(shù);用戶:監(jiān)測(cè)與用戶有關(guān)的特定關(guān)聯(lián)的信息,主要包括用戶名、用戶ID、登錄時(shí)間、登錄終端IP信息等。效勞器網(wǎng)絡(luò)接口監(jiān)控:監(jiān)控效勞器網(wǎng)絡(luò)端口的輸入、輸出、錯(cuò)包及各類可用統(tǒng)計(jì)參數(shù),端口是否被停用或者刪除。日志監(jiān)控:日志文件的變化情況,可根據(jù)監(jiān)控系統(tǒng)及用戶應(yīng)用系統(tǒng)的日志文件大小屬性,并根據(jù)日志中出現(xiàn)的特定關(guān)鍵字信息進(jìn)行報(bào)警。內(nèi)存:內(nèi)存大小、內(nèi)存的使用率、內(nèi)存的可用空間、交換進(jìn)內(nèi)存的頁(yè)數(shù)、交換出內(nèi)存的頁(yè)數(shù)等交換空間:交換空間的大小、交換空間的使用率等。、數(shù)據(jù)庫(kù)監(jiān)控?cái)?shù)據(jù)庫(kù)監(jiān)控包含目前流行的大多數(shù)數(shù)據(jù)庫(kù)Oracle、SqlServer、MySql等,根本監(jiān)控功能如下:能夠監(jiān)控?cái)?shù)據(jù)庫(kù)效勞器實(shí)例的配置運(yùn)行情況,包括默認(rèn)配置是否使用、參數(shù)名、參數(shù)ID、參數(shù)類型等指標(biāo);對(duì)數(shù)據(jù)庫(kù)的CPU使用率、內(nèi)存使用狀況進(jìn)行監(jiān)控;能夠監(jiān)控?cái)?shù)據(jù)庫(kù)的存儲(chǔ)狀況,如各類存儲(chǔ)分配情況、總體空間占用情況等;為防止死鎖的發(fā)生,自動(dòng)監(jiān)控可用資源;監(jiān)控效勞器實(shí)例的所有進(jìn)程信息,報(bào)告CPU使用情況、進(jìn)程活動(dòng)、系統(tǒng)進(jìn)程等;監(jiān)控?cái)?shù)據(jù)庫(kù)的WAIT狀況,如BufferBusyWait等;監(jiān)控?cái)?shù)據(jù)庫(kù)的I/O狀況,可以查看任意一個(gè)數(shù)據(jù)文件或表空間上的物理/邏輯的讀寫;監(jiān)控實(shí)時(shí)SQL語(yǔ)句的運(yùn)行狀況,要求能夠捕捉瞬時(shí)的或一段時(shí)間內(nèi)執(zhí)行的SQL語(yǔ)句,使管理員可以有效地獲取關(guān)于正在執(zhí)行的事務(wù)的詳細(xì)信息;監(jiān)控?cái)?shù)據(jù)庫(kù)的日志文件;監(jiān)控用戶連接情況;監(jiān)控?cái)?shù)據(jù)庫(kù)并發(fā)連接數(shù);、Web中間件監(jiān)控基于Java技術(shù)的中間件平臺(tái)有WebSphere、WebLogic、Jboss和Tomcat,Windows下的中間件平臺(tái)有IIS。Java技術(shù)的中間件平臺(tái)需提供以下類別的參數(shù)監(jiān)控:能夠監(jiān)控應(yīng)用效勞器及中間件的配置情況、運(yùn)行狀況和請(qǐng)求CPU使用率;JDBC數(shù)據(jù)庫(kù)連接池的大小,包括AllocateCount,CloseCount,CreateCount,F(xiàn)aultCount,F(xiàn)reePoolSize,PercentUsed,PoolSize,PrepStmtCacheDiscardCount,WaitTime等參數(shù);中間件容器中Web應(yīng)用程序的狀態(tài),包括ConcurrentRequests,ErrorCount,LoadedServletCount,RequestCount,ServiceTime等參數(shù);系統(tǒng)平均響應(yīng)時(shí)間和各個(gè)請(qǐng)求的響應(yīng)時(shí)間;最差響應(yīng)的請(qǐng)求情況,Servlet響應(yīng)時(shí)間,接受負(fù)載客戶機(jī)響應(yīng)時(shí)間,后端資源響應(yīng)時(shí)間等;Servlet引擎線程池大小,該指標(biāo)決定了包含Web應(yīng)用的JVM可執(zhí)行工作量;JVM虛擬機(jī)中的JVM的堆大小。IIS技術(shù)的中間件平臺(tái)需提供以下類別的參數(shù)監(jiān)控:監(jiān)測(cè)點(diǎn)監(jiān)測(cè)指標(biāo)指標(biāo)含義

Ping效勞成功率(%)接收包數(shù)和發(fā)送包數(shù)的比值平均響應(yīng)時(shí)間(ms)接收包的平均響應(yīng)時(shí)間

IIS流量性能每秒接收字節(jié)數(shù)(Byte/sec)每秒接收的字節(jié)數(shù)每秒發(fā)送字節(jié)數(shù)(Byte/sec)每秒發(fā)送的字節(jié)數(shù)每秒總字節(jié)數(shù)(Byte)發(fā)送字節(jié)數(shù)/秒+接收字節(jié)數(shù)/秒帶寬使用率(%)實(shí)際數(shù)據(jù)流量/最大數(shù)據(jù)流量總接收字節(jié)數(shù)(kB)自效勞啟動(dòng)后接收字節(jié)總數(shù)總發(fā)送字節(jié)數(shù)(KB)自效勞啟動(dòng)后發(fā)送字節(jié)總數(shù)總處理字節(jié)數(shù)(KB)總接收字節(jié)數(shù)+總發(fā)送字節(jié)數(shù)

IIS請(qǐng)求性能每秒HTTP請(qǐng)求數(shù)(個(gè)/秒)使用各種方法進(jìn)行的HTTP請(qǐng)求的速率每秒GET請(qǐng)求數(shù)(個(gè)/秒)使用GET方法進(jìn)行的HTTP請(qǐng)求的速率每秒POST請(qǐng)求數(shù)(個(gè)/秒)使用POST方法進(jìn)行的HTTP請(qǐng)求的速率每秒CGI請(qǐng)求數(shù)(個(gè)/秒)每秒由效勞同時(shí)處理的CGI請(qǐng)求數(shù)當(dāng)前CGI請(qǐng)求數(shù)(個(gè))當(dāng)前由效勞同時(shí)處理的CGI請(qǐng)求數(shù)總HTTP請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后進(jìn)行HTTP請(qǐng)求的總數(shù)總GET請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后用GET方法進(jìn)行的HTTP請(qǐng)求的總數(shù)總POST請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后用POST方法進(jìn)行的HTTP請(qǐng)求的總數(shù)總CGI請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后所執(zhí)行的通用網(wǎng)關(guān)接口(CGI)請(qǐng)求總數(shù)最大CGI請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后由此效勞同時(shí)處理的最大CGI請(qǐng)求數(shù)

IIS連接性能當(dāng)前連接數(shù)(個(gè))當(dāng)前由效勞同時(shí)處理的連接數(shù)每秒嘗試連接數(shù)(個(gè)/秒)每秒用效勞嘗試連接數(shù)每秒嘗試登錄數(shù)(個(gè)/秒)每秒用效勞嘗試登錄數(shù)最大連接數(shù)(個(gè))自效勞啟動(dòng)后由此效勞建立的最大并發(fā)連接數(shù)總嘗試連接數(shù)(個(gè))自啟動(dòng)效勞后試圖連接到效勞的連接總數(shù)總嘗試登錄數(shù)(個(gè))自啟動(dòng)效勞后試圖登錄到效勞的登錄總數(shù)

IIS阻塞性能當(dāng)前阻塞請(qǐng)求數(shù)〔帶寬限制〕自效勞啟動(dòng)后由于帶寬限制設(shè)置而暫時(shí)阻塞的當(dāng)前請(qǐng)求數(shù)阻塞的請(qǐng)求總數(shù)〔帶寬限制〕自效勞啟動(dòng)后由于帶寬限制設(shè)置而阻塞的用戶請(qǐng)求總數(shù)阻塞字計(jì)數(shù)〔帶寬限制〕當(dāng)前由于帶寬限制設(shè)置而阻塞的字節(jié)數(shù)阻塞字節(jié)數(shù)〔帶寬限制〕自效勞啟動(dòng)后由于帶寬限制設(shè)置而阻塞的字節(jié)總數(shù)

IIS鎖信息每秒鎖住請(qǐng)求數(shù)(個(gè)/秒)每秒使用LOCK方法的HTTP請(qǐng)求數(shù)每秒解鎖請(qǐng)求數(shù)(個(gè)/秒)每秒使用UNLOCK方法的HTTP請(qǐng)求數(shù)總鎖住請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后使用LOCK方法的HTTP請(qǐng)求總數(shù)總解鎖請(qǐng)求數(shù)(個(gè))自效勞啟動(dòng)后使用UNLOCK方法的HTTP請(qǐng)求總數(shù)

IIS錯(cuò)誤信息每秒未發(fā)現(xiàn)錯(cuò)誤數(shù)(個(gè)/秒)由于未找到所請(qǐng)求文檔,每秒效勞無(wú)法滿足的請(qǐng)求數(shù)每秒鎖住錯(cuò)誤數(shù)(個(gè)/秒)由于所需文檔被鎖定,每秒使效勞器無(wú)法滿足請(qǐng)求而導(dǎo)致的錯(cuò)誤數(shù)總發(fā)現(xiàn)錯(cuò)誤數(shù)(個(gè))自效勞啟動(dòng)后由于未找到所請(qǐng)求文檔,效勞無(wú)法滿足的請(qǐng)求總數(shù)總鎖住錯(cuò)誤數(shù)(個(gè))自效勞啟動(dòng)后由于所需文檔被鎖定,使效勞器無(wú)法滿足請(qǐng)求而導(dǎo)致的錯(cuò)誤總數(shù)

IIS文件監(jiān)測(cè)每秒接收文件數(shù)(個(gè)/秒)效勞器接收文件的速率每秒發(fā)送文件數(shù)(個(gè)/秒)效勞器發(fā)送文件的速率每秒處理文件數(shù)(個(gè)/秒)效勞器處理文件的速率總接收文件數(shù)(個(gè))效勞器自啟動(dòng)后接收文件的總數(shù)總發(fā)送文件數(shù)(個(gè))效勞器自啟動(dòng)后發(fā)送文件的總數(shù)總處理文件數(shù)(個(gè))效勞器自啟動(dòng)后處理文件的總數(shù)

IIS網(wǎng)站根本性能網(wǎng)站狀態(tài)網(wǎng)站運(yùn)行的狀況、虛擬設(shè)備監(jiān)控監(jiān)控管理系統(tǒng)支持對(duì)VMWare、HyperV、XenServer的監(jiān)控管理,滿足了客戶對(duì)IT系統(tǒng)中虛擬資源的監(jiān)控需求。實(shí)現(xiàn)物理環(huán)境與虛擬環(huán)境的統(tǒng)一監(jiān)控,展現(xiàn)物理環(huán)境與虛擬環(huán)境的關(guān)聯(lián)關(guān)系,便于及時(shí)定位故障;實(shí)現(xiàn)異構(gòu)〔多廠商〕虛擬化環(huán)境的統(tǒng)一監(jiān)控,解決由于監(jiān)控工具數(shù)量繁多而造成的操作繁瑣問(wèn)題;實(shí)現(xiàn)虛擬機(jī)運(yùn)行數(shù)據(jù)采集,為容量規(guī)劃、虛擬遷移等決策提供數(shù)據(jù)支持;虛擬設(shè)備的物理主機(jī)狀態(tài)監(jiān)控,CPU總量、CPU使用量、CPU使用率,內(nèi)存總量、內(nèi)存使用量、內(nèi)存使用率,網(wǎng)卡配置等;虛擬機(jī)監(jiān)控,虛擬機(jī)名稱,IP地址,被分配內(nèi)存,虛擬機(jī)CPU和內(nèi)存使用率,狀態(tài)〔是否啟動(dòng)〕、端口組、操作系統(tǒng),說(shuō)在主機(jī)、網(wǎng)絡(luò)、存儲(chǔ)信息。四、部署與配置4.1、部門級(jí)部署對(duì)于網(wǎng)絡(luò)環(huán)境比擬簡(jiǎn)單,設(shè)備數(shù)量較小的網(wǎng)絡(luò),可采用獨(dú)立部署模式,部署一套平安審計(jì)系統(tǒng),直接管理所有的平安設(shè)備與網(wǎng)絡(luò)主機(jī)。4.2、企業(yè)應(yīng)用部署對(duì)于網(wǎng)絡(luò)環(huán)境復(fù)雜、或者存在大量平安設(shè)備的網(wǎng)絡(luò)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論