華誼集團IT監(jiān)控運維系統(tǒng)技術建議書v3.0_第1頁
華誼集團IT監(jiān)控運維系統(tǒng)技術建議書v3.0_第2頁
華誼集團IT監(jiān)控運維系統(tǒng)技術建議書v3.0_第3頁
華誼集團IT監(jiān)控運維系統(tǒng)技術建議書v3.0_第4頁
華誼集團IT監(jiān)控運維系統(tǒng)技術建議書v3.0_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

技術建議書華誼集團IT監(jiān)控運維系統(tǒng)技術建議書冠群電腦(中國)有限公司TIME\@"yyyy年M月"2013年6月

目錄1 華誼集團IT監(jiān)控運維系統(tǒng)的建設目標 52 華誼集團IT監(jiān)控運維系統(tǒng)的建議藍圖 62.1 系統(tǒng)建設藍圖 62.2 系統(tǒng)建設階段 73 華誼集團IT監(jiān)控運維系統(tǒng)第一階段建設方案 83.1 第一階段建設框架 83.2 第一階段部署說明 83.3 第一階段軟件部署清單 93.4 第一階段系統(tǒng)建設效果 104 華誼集團IT監(jiān)控運維系統(tǒng)第一階段的建設要素 124.1 建立統(tǒng)一的監(jiān)控管理平臺 124.2 實現(xiàn)端到端的面向業(yè)務的管理 124.3 全面覆蓋各層面的監(jiān)控管理需要 134.4 實現(xiàn)對應用的“黑箱透視” 145 華誼集團IT監(jiān)控運維系統(tǒng)第一階段的功能說明 155.1 實時監(jiān)控IT服務質量:監(jiān)測IT系統(tǒng)的健康度 155.1.1 針對業(yè)務的健康度管理 155.1.2 針對服務對象的健康度管理 165.1.3 針對機房機架的管理 185.1.4 核心網絡及服務器健康度管理 205.2 面向服務質量的監(jiān)控,關注于業(yè)務系統(tǒng)的SLA 215.2.1 SLA狀態(tài)查詢 215.2.2 SLA問題確認 225.3 集中式管理:實現(xiàn)各個業(yè)務系統(tǒng)的集中管理 235.4 完備的運維管理能力 245.5 統(tǒng)一告警處理:集中的告警管理和分析處理 265.5.1 豐富的事件管理和分析處理手段 265.5.2 動態(tài)數(shù)據(jù)的閥值監(jiān)控 295.6 綜合性能分析:對IT業(yè)務系統(tǒng)的綜合性能分析 305.7 自上而下的業(yè)務監(jiān)控管理 325.7.1 實現(xiàn)端到端的業(yè)務監(jiān)控管理 335.7.2 7×24實時監(jiān)控業(yè)務系統(tǒng)的客戶體驗 345.7.3 應用診斷分析管理 385.8 自下而上的基礎架構監(jiān)控 535.8.1 服務器監(jiān)控管理 535.8.2 虛擬化監(jiān)控管理 535.8.3 網絡監(jiān)控管理 545.8.4 數(shù)據(jù)庫監(jiān)控管理 545.8.5 中間件監(jiān)控管理 555.8.6 存儲監(jiān)控管理 565.9 各類運維報表,監(jiān)測資源利用狀態(tài) 575.10 個性化支持,提供自定義管理面板和報表 585.10.1 性能報表設計器 585.10.2 列表設計器 595.10.3 管理面板設計器 595.10.4 SLA設計器 605.11 支持多租戶,不同用戶查看不同的內容 605.12 易用性,用戶DIY管理風格 616 重點問題分析 616.1 開放的管理體系 616.2 擴展性 626.3 兼容性 626.4 系統(tǒng)高度可配置 636.5 安全性 637 CAIT監(jiān)控運維系統(tǒng)的方案特點與優(yōu)勢 647.1 CA公司解決方案為國內外眾多公司多信任 647.2 CA公司的實施經驗和最佳實踐 647.3 提供完整的IT運維管理系統(tǒng)建設規(guī)劃,符合華誼集團建設發(fā)展的需要 657.4 提供完備的實施風險保障措施 657.5 提供完備的使用保障措施 658 相關產品概述 678.1 NimsoftMonitoringServer產品概述 678.2 APM產品概述 68

華誼集團IT監(jiān)控運維系統(tǒng)的建設目標華誼集團針對IT系統(tǒng)在日常運維中存在的問題,希望通過IT監(jiān)控運維系統(tǒng)實現(xiàn)對這些IT系統(tǒng)的運維監(jiān)控和優(yōu)化分析。IT監(jiān)控運維系統(tǒng)的建設從服務管理的角度,保障華誼集團各業(yè)務系統(tǒng)的服務質量,以提升華誼集團IT服務的能力,從而更加有力的支持華誼集團的發(fā)展。IT監(jiān)控運維系統(tǒng)的建設目標,可以進一步解析為以下四個方面:統(tǒng)一管理需求實現(xiàn)從業(yè)務服務到基礎架構,從事件管理到性能分析的統(tǒng)一管理實現(xiàn)對運維效率的提高與運維成果的統(tǒng)一監(jiān)管和提升實時掌握SAP等個業(yè)務系統(tǒng)的健康度情況閉環(huán)管理需求從真實用戶對業(yè)務的使用的角度,實現(xiàn)端到端的業(yè)務監(jiān)控和瓶頸診斷的閉環(huán)處理通過流程保證故障、異常、隱患由合適的人采用合適的方式閉環(huán)處理精益管理需求分析信息基礎設施的運行負荷,提供相關數(shù)據(jù),幫助制定合理的資源調配方案通過豐富完善的系統(tǒng)運行性能監(jiān)控數(shù)據(jù),為運行維護工作提供直觀準確的基礎數(shù)據(jù)幫助運維人員分析系統(tǒng)瓶頸,快速定位問題根源,提升問題處理的效率戰(zhàn)略管理需求實現(xiàn)對業(yè)務服務質量的監(jiān)測和保障幫助提升SAP等業(yè)務系統(tǒng)的穩(wěn)健性,降低IT系統(tǒng)風險提升IT團隊的服務能力,提升企業(yè)對IT部門的滿意度華誼集團IT監(jiān)控運維系統(tǒng)的建議藍圖系統(tǒng)建設藍圖根據(jù)以上建設目標,華誼集團IT監(jiān)控運維系統(tǒng)的整體架構設計藍圖,如下圖所示:圖整體架構設計藍圖華誼集團IT監(jiān)控運維系統(tǒng)的建設藍圖可以分為集中監(jiān)控子系統(tǒng)和流程管理子系統(tǒng)兩部分,并通過統(tǒng)一運維管理門戶提供統(tǒng)一的運維管理界面。集中監(jiān)控子系統(tǒng)是通過統(tǒng)一的管理平臺,實現(xiàn)對IT系統(tǒng)進行集中監(jiān)控和管理。通過大量的商業(yè)化的采集探針,可以從被監(jiān)控設備中采集相應的事件、告警、性能、拓撲和可用性信息。CA公司推薦采用輕量級代理程序和無代理管理混合的方式管理監(jiān)控對象。即增強了對監(jiān)控對象的管理能力,同時將對監(jiān)控對象的資源影響降到最低。采集的數(shù)據(jù)通過事件根源分析、性能監(jiān)測診斷和容量趨勢規(guī)劃等手段,實現(xiàn)對基礎資源可用性管理、應用系統(tǒng)可用性管理、服務質量SLA管理和端到端的IT綜合運維管理。流程管理子系統(tǒng)是基于ITIL最佳實踐的流程管理,對整個IT服務流程中的關鍵流程進行優(yōu)化和管理。量化運維團隊對IT的服務要求,進一步確保IT的服務質量。統(tǒng)一運維管理門戶提供了基于Portal門戶的統(tǒng)一運維管理窗口。運維人員可以通過Web瀏覽器,采用統(tǒng)一登錄、分權管理的方式完成相應的管理工作。同時,運維人員也可以通過統(tǒng)一運維管理門戶實現(xiàn)拓撲查看、告警管理、性能分析、運維規(guī)劃報表、自定義報表、業(yè)務診斷分析和查看服務工單的功能,并支持個性化門戶的自定制功能。系統(tǒng)建設階段華誼集團針對IT監(jiān)控運維系統(tǒng)的建設藍圖,建議可以分為兩個階段來建設,如下圖所示:圖系統(tǒng)建設階段第一個階段,實現(xiàn)對IT系統(tǒng)的綜合保障,通過搭建綜合監(jiān)控平臺,監(jiān)控SAP等業(yè)務系統(tǒng)的健康度狀態(tài);通過端到端的監(jiān)控管理,監(jiān)測SAP等業(yè)務系統(tǒng)的應用性能;分析和診斷業(yè)務系統(tǒng)的應用故障;并提供集中的事件管理平臺,實現(xiàn)對事件的統(tǒng)一處理;通過各類運維報表和個性化可定制報表功能,全面提高運維管理效率。第二階段,實現(xiàn)對IT系統(tǒng)的服務優(yōu)化和系統(tǒng)發(fā)展規(guī)劃,一方面,通過基于ITIL的服務管理,優(yōu)化現(xiàn)有IT服務流程;另一方面,為IT系統(tǒng)的容量規(guī)劃提供各類運營規(guī)劃數(shù)據(jù)和分析報表。華誼集團IT監(jiān)控運維系統(tǒng)第一階段建設方案第一階段建設框架根據(jù)以上建議,華誼集團IT監(jiān)控運維系統(tǒng)的第一階段將主要實現(xiàn)對華誼集團業(yè)務系統(tǒng)的綜合服務保障,包括SAP等各類業(yè)務系統(tǒng)的服務保障。其建設框架如下圖所示:圖第一階段建設框架第一階段部署說明根據(jù)華誼集團IT監(jiān)控運維系統(tǒng)的建設需求,CA公司推薦采用集中式的部署方式實現(xiàn)第一階段的管理內容,其部署架構如下圖所示:圖系統(tǒng)部署架構在管理中心,部署七臺管理服務器。Nimsoft管理服務器提供統(tǒng)一的事件和性能管理平臺,實現(xiàn)基礎架構的監(jiān)控;IM管理服務器實現(xiàn)對網絡設備的全面監(jiān)控和分析;Introscope管理服務器用于針對SAP和J2EE應用系統(tǒng)的監(jiān)控管理,ADA和CEM管理服務器用于監(jiān)測用戶體驗;門戶服務器用于提供統(tǒng)一的運維管理門戶;數(shù)據(jù)庫服務器提供后臺數(shù)據(jù)存儲。在被管設備上部署輕量級代理程序Robot或采用無代理的方式,實現(xiàn)對各類管理數(shù)據(jù)的采集。第一階段軟件部署清單針對第一階段項目建設的要求,CA公司解決方案采用成熟的商業(yè)化軟件,其軟件產品清單如下表所示:安裝的軟件模塊功能實現(xiàn)NimsoftMonitoringServer包括管理服務器和統(tǒng)一管理門戶,實現(xiàn)集中的監(jiān)控管理平臺,實現(xiàn)集中的事件管理,綜合的服務視圖展示,全面的告警處理等功能。CEM、ADA實現(xiàn)對用戶體驗的監(jiān)控和管理。Introscope業(yè)務分析診斷模塊,實現(xiàn)對J2EE和.Net應用的監(jiān)控和診斷分析。IM提供針對網絡設備的全面監(jiān)控和分析。第一階段系統(tǒng)建設效果通過華誼集團IT監(jiān)控運維系統(tǒng)第一階段的建設,可以實現(xiàn)基于SLM的多角色多角度的全面管理。如下圖所示:圖系統(tǒng)建設效果首先,通過IT監(jiān)控運維系統(tǒng)實現(xiàn)了對華誼集團各個IT應用系統(tǒng)的全面運維管理。將所涉及到的網絡、服務器、數(shù)據(jù)庫、中間件、虛擬化、存儲和SAP等應用系統(tǒng)都監(jiān)控管理了起來。其次,提升了運維管理能力,實現(xiàn)了統(tǒng)一運維管理和服務能力管理,為華誼集團全面評估現(xiàn)有IT系統(tǒng)的服務能力和服務質量提供科學的數(shù)據(jù)依據(jù),并進一步為業(yè)務服務優(yōu)化,提供了數(shù)據(jù)報表和指導分析。再次,通過CA公司解決方案可以實現(xiàn)多角色的管理,不同的管理角色如:華誼集團CIO、華誼集團IT經理和各部門的運維人員等可以通過不同的管理界面和管理內容實現(xiàn)不同的管理要求。通過IT監(jiān)控運維系統(tǒng)的建設,實現(xiàn)了從業(yè)務的角度自上而下的管理和從運維的角度自下而上的管理。一方面,可以從IT系統(tǒng)使用的角度監(jiān)控最終用戶體驗,并定義IT系統(tǒng)瓶頸。另一方面,也可以從基礎架構的角度,分析其對IT系統(tǒng)使用的影響,并確定告警處理的優(yōu)先級。CA公司解決方案不僅實現(xiàn)了對IT系統(tǒng)的監(jiān)控能力,還實現(xiàn)了針對服務水平的管理能力。從而為華誼集團提升監(jiān)控能力,提供更先進更全面的管理平臺。服務水平協(xié)議(SLA)是客戶和服務提供商之間的協(xié)議,對合同以及客戶和服務提供商之間的關系來說,協(xié)議雙方確認和記錄其各自的服務需求非常重要。服務水平管理(SLM)包括一套工具以便于監(jiān)控和確保針對內部客戶和外部客戶的一系列SLA的有效性,服務水平管理直觀顯示為下列的層次結構:-服務平管理(SM)-服務平協(xié)議(SLA)-服務平目標(SL)-服務量(o)服務水平管理(SLM)的基本原則是把服務水平協(xié)議(SLA)細分成較小的部分,讓運維人員能跟輕松簡單的建立強大、可擴展和可衡量的協(xié)議。華誼集團IT監(jiān)控運維系統(tǒng)第一階段的建設要素建立統(tǒng)一的監(jiān)控管理平臺統(tǒng)一的監(jiān)控平臺建設包括三方面的建設內容:端到端的業(yè)務監(jiān)控、事件管理功能、性能管理功能。提供了端到端的業(yè)務監(jiān)控功能,提供豐富的監(jiān)控探針,覆蓋業(yè)務監(jiān)控的各個層面。提供了豐富的事件管理功能,事件管理可以覆蓋所有需要管理的設備,快速捕捉到服務器、中間件、數(shù)據(jù)庫、應用程序產生的日志和消息等事件。實現(xiàn)了全面的性能管理,包括各種設備性能管理,維護人員可以根據(jù)需要靈活的設定性能閥值,生成相應的性能告警。建立運維標準化,為未來業(yè)務建模和標準化流程管理建立標準。實現(xiàn)端到端的面向業(yè)務的管理通過IT監(jiān)控運維系統(tǒng)可以實現(xiàn)端到端的業(yè)務監(jiān)控,IT監(jiān)控運維系統(tǒng)提供了豐富的監(jiān)控探針,覆蓋了業(yè)務監(jiān)控的各個層面,包括:用戶體驗管理、網絡管理、服務器管理、存儲管理、數(shù)據(jù)庫管理、中間件管理和應用管理。通過對各個層面的監(jiān)控,全面監(jiān)控和分析業(yè)務的性能狀態(tài)。圖端到端的業(yè)務監(jiān)控示意圖IT監(jiān)控運維系統(tǒng)提供了直觀的端到端業(yè)務監(jiān)控Dashboard,運維人員可以根據(jù)不同的業(yè)務監(jiān)控要求,定義不同的監(jiān)管理Dashboard,從而全面提升對業(yè)務的管理能力。圖Dashboard監(jiān)控示意圖全面覆蓋各層面的監(jiān)控管理需要IT監(jiān)控運維系統(tǒng)的重點是實現(xiàn)對各個層面的監(jiān)控,包括用戶、業(yè)務系統(tǒng)和基礎架構。通過對各層面的監(jiān)控,實時了解用戶對業(yè)務的使用情況,分析和定位業(yè)務系統(tǒng)瓶頸和基礎架構問題,不斷的優(yōu)化業(yè)務系統(tǒng)和基礎架構,從而全面保障業(yè)務的服務能力,提升IT系統(tǒng)的服務質量。IT監(jiān)控運維系統(tǒng)具有豐富多樣的監(jiān)控器,可以有效的覆蓋到監(jiān)控管理的各個層面,而不會再存在管理“黑洞”。圖豐富的監(jiān)控器示意圖實現(xiàn)對應用的“黑箱透視”應用系統(tǒng)對于運維人員來說就像一個“黑箱”一樣,無法分析,卻不得不運維。當應用系統(tǒng)出現(xiàn)故障后,運維人員往往無法去分析和診斷應用層面的故障和問題。針對這種情況,IT監(jiān)控運維系統(tǒng)應該具有“黑箱透視”功能,可以將基于J2EE、.NET和標準化應用如SAP等應用的執(zhí)行狀態(tài)打開,幫助運維人員分析應用的問題根源,并定位SQL語句的執(zhí)行性能和故障。通過深入地監(jiān)控和管理整個應用環(huán)境的性能來確保應用的最佳性能!圖對應用的“黑箱透視”華誼集團IT監(jiān)控運維系統(tǒng)第一階段的功能說明實時監(jiān)控IT服務質量:監(jiān)測IT系統(tǒng)的健康度針對CIO和IT運維人員對IT監(jiān)控運維的要求,IT監(jiān)控運維系統(tǒng)提供了面向IT服務質量的實時監(jiān)控視圖。通過該視圖,CIO和IT運維人員可以通過多個管理角度,一目了然的看到當前各個IT系統(tǒng)的服務狀態(tài),并可以通過逐級點擊的方式查看相關的健康度狀態(tài)和相關監(jiān)控指標狀態(tài)。針對業(yè)務的健康度管理通過系統(tǒng)整體健康度管理,可以實現(xiàn)對華誼集團所關注的各項業(yè)務的健康度管理,幫助華誼集團第一時間掌握自身各項業(yè)務的服務水平和健康度狀態(tài)。如果發(fā)現(xiàn)有業(yè)務健康度下降的問題,可以通過點擊鼠標,向下挖掘,分析影響業(yè)務健康度的問題和定位業(yè)務瓶頸。針對服務對象的健康度管理通過對業(yè)務系統(tǒng)健康度的管理,可以實現(xiàn)針對個業(yè)務對象的性能分析和診斷。當業(yè)務系統(tǒng)的健康度出現(xiàn)問題時,可以查詢相應的應用組件性能狀態(tài),幫助運維人員快速分析應用故障根源。如分析業(yè)務系統(tǒng)相關的網絡設備的性能狀態(tài)。分析業(yè)務系統(tǒng)相關的服務器的性能狀態(tài)。分析業(yè)務系統(tǒng)相關的數(shù)據(jù)庫的性能狀態(tài)。針對機房機架的管理通過直觀的機房機架視圖,管理和查看個設備的健康度狀態(tài)。當有些設備出現(xiàn)健康度下降的情況時,快速查看和分析問題根源所在。核心網絡及服務器健康度管理網絡和服務器是基礎架構的主要環(huán)境,網絡即服務器的健康度狀態(tài)對系統(tǒng)的整體健康度狀態(tài)影響最大。因此,可以通過網絡及服務器健康度管理,全面查看網絡可用性和帶寬使用狀態(tài),以及服務的綜合性能狀態(tài)等信息。通過網絡健康度管理,一方面可以快速查看網絡設備的可用性或主要端口的可用性信息,另一方面可以快速查看各網絡設備的端口流量狀態(tài)。查看核心網絡設備的端口流量帶寬狀態(tài)。通過服務器健康度管理,可以快速查看各服務器的服務狀態(tài),包括Windows服務器、Linux服務器、Unix服務器的可用性。面向服務質量的監(jiān)控,關注于業(yè)務系統(tǒng)的SLA當前系統(tǒng)運維管理不僅僅是針對被管設備的性能指標的監(jiān)控,而是更加關注于系統(tǒng)的各項SLA指標。通過對SLA各項指標的監(jiān)控,來評估和管理系統(tǒng)的可用性。IT監(jiān)控運維系統(tǒng)提供了全面的SLA支持能力,從SLA的創(chuàng)建,到SLA的狀態(tài)查詢,以及SLA的報表展現(xiàn),無需開發(fā),即可幫助客戶實現(xiàn)針對SLA的管理能力。SLA狀態(tài)查詢通過IT監(jiān)控運維系統(tǒng)可以實現(xiàn)對各項預定于的SLA的狀態(tài)查詢,了解各SLA的變化情況,分析影響SLA的根源所在,快速定位SLA問題,提升系統(tǒng)的服務水平。SLA問題確認通過逐級分析的方式,可以快速定位SLA問題的根源和發(fā)生時間,幫助IT管理層逐步提升業(yè)務系統(tǒng)的服務能力。集中式管理:實現(xiàn)各個業(yè)務系統(tǒng)的集中管理集中監(jiān)控管理平臺是監(jiān)控人員日常使用的重要工具,所以需要提供一個方便實用的監(jiān)控界面,供日常的監(jiān)控人員使用,通過監(jiān)控界面,可以直觀的了解到當前的各個組件的性能狀態(tài)和告警信息,并提供豐富的運維報表,從而滿足日常的系統(tǒng)運行維護工作。通過統(tǒng)一的服務管理器,直觀查看各個服務器和網絡等被管對象的配置、告警、性能和報表。可以基于一個被管對象,直觀的查看相關的資產信息和性能狀態(tài)。通過統(tǒng)一的服務管理器,快速查看一臺被管對象的告警內容,并處理??焖俨榭聪嚓P被管對象的性能報表。靈活設定報表時間范圍。完備的運維管理能力IT監(jiān)控運維系統(tǒng)提供了統(tǒng)一的拓撲管理、事件管理、性能管理、容量規(guī)劃、診斷分析和流程管理功能,并支持多樣的運維報表和自定義的報表??梢杂行У奶岣呷A誼集團對IT運維管理的能力,滿足華誼集團IT運維管理的能力。提供拓撲管理,選擇相關管理內容??梢圆榭丛O備的自動發(fā)現(xiàn)狀態(tài)。提供多種直觀的拓撲展現(xiàn)方式,可以查看當前的拓撲展現(xiàn)狀態(tài)。提供集中的事件管理功能:支持各種組件的性能分析:統(tǒng)一告警處理:集中的告警管理和分析處理豐富的事件管理和分析處理手段IT監(jiān)控運維系統(tǒng)提供了豐富的告警管理的功能和告警處理手段。運維人員可以通過告警過濾,查看相應的告警信息。IT監(jiān)控運維系統(tǒng)支持告警的各類處理機制,告警的過濾、告警級別定義、告警壓縮、告警關聯(lián)、告警轉發(fā)、告警自處理、告警分配和告警監(jiān)控時間設置等。IT監(jiān)控運維系統(tǒng)提供了豐富的事件管理功能,事件管理可以覆蓋所有需要管理的設備,快速捕捉到服務器、中間件、數(shù)據(jù)庫、應用程序產生的日志和消息等事件。默認提供了五種告警級別,并提供了多種事件處理手段,運維人員可以根據(jù)需要靈活的定義報警事件。事件的集中管理在一個統(tǒng)一的運維管理系統(tǒng)上,通過同一個管理界面,實現(xiàn)對事件的集中管理。維護人員可以在統(tǒng)一事件管理平臺上看到所收到的事件的發(fā)送源、系統(tǒng)名、用戶名、事件信息、事件生成時間等詳細信息。統(tǒng)一事件管理平臺的設置有很強的靈活性,可根據(jù)運維人員的不同要求而改變,以適應各個運維人員的需要。事件關聯(lián)處理防止告警風暴事件關聯(lián)處理可以有效的防止告警風暴,通過內置的事件關聯(lián)處理機制,可以快速的定位問題根源,屏蔽關聯(lián)告警,防止告警風暴。事件關聯(lián)處理技術使得當故障發(fā)生時,運維人員能夠更快地定位原因、排除故障。通過高級事件關聯(lián)引擎,更快地識別故障根源。這個引擎將把事件與高層次報警關聯(lián)起來,并立即查找故障的根本原因。深入分析(drill-down)功能令運維人員能夠看到與每一個故障有關的所有事件。通過使用以上的這些事件關聯(lián)模板,維護人員就可以方便的設計出滿足自己需要的事件處理,從而實現(xiàn)對事件的智能處理,并快速定位關鍵故障,從而恢復系統(tǒng)故障,保障系統(tǒng)的正常運行。靈活的事件的過濾處理與分類歸并可以通過定義對統(tǒng)一事件管理平臺所收到的事件信息進行過濾,只顯示運維人員所關心的事件信息,同時可對所顯示的事件信息進一步分類,對不同級別的事件信息以不同的顏色表示。通過這種方法可以提高運維人員的工作效率,增強系統(tǒng)的可維護性。多樣的事件自動處理設置可以定義事件觸發(fā)器,當統(tǒng)一事件管理平臺收到某一條或一組特定事件信息時,統(tǒng)一事件管理平臺可以自動執(zhí)行一組動作(Action)自動處理事件。這組動作可以包括發(fā)送一條報警信息,執(zhí)行一個命令,啟動一個進程或一個批處理業(yè)等。如監(jiān)視用戶的關鍵數(shù)據(jù)庫應用,當收到數(shù)據(jù)庫進程非正常終止的信息時,對此進程自動重起,以保障用戶的應用不間斷運行。事件的管理方式事件管理可指定事件所有組、所有人,與操作權限直接關聯(lián),如事件的所有人才能更改或刪除該事件,同組的其他人才能查看該事件等??稍O定條件自動更改事件內容,如指定最高嚴重等級的事件發(fā)生以后超過1小時無人響應就自動將事件所有人改為更高級別的管理員。事件管理執(zhí)行動作的多種通告方式統(tǒng)一事件管理平臺支持將事件通過聲光報警、電子郵件、短信通知等方式,將事件信息通知相關運維人員。事件的數(shù)據(jù)統(tǒng)計統(tǒng)一事件管理平臺的事件管理會記錄所有收集到的事件信息,并每天生成一個事件日志文件,還可對事件信息進行統(tǒng)計,提供相關日報表、周報表和月報表。動態(tài)數(shù)據(jù)的閥值監(jiān)控IT運維管理系統(tǒng)能夠動態(tài)收集應用性能數(shù)據(jù)并通過定制界面展現(xiàn),可以對任意關鍵性能監(jiān)控對象定義告警閥值(例如JVMheapsize,JDBCcollectionpool,數(shù)據(jù)庫連接數(shù)量,事務處理時間,瀏覽器瀏覽時間等)并根據(jù)閥值提供不同的監(jiān)控展示方式(例如:標志顏色,坐標水位線等)IT運維管理系統(tǒng)能夠監(jiān)控所有業(yè)務的響應時間,包括關鍵業(yè)務的響應時間,并評測出客戶端實際的響應時間。每個業(yè)務中的“ErrorsPerInterval”、“StallCount”和“Concurrent”參數(shù)可以表示業(yè)務的可用性問題,“AverageResponseTime”參數(shù)表示響應時間,可以為這些參數(shù)設定報警閾值,當超過閾值就會及時報警,通知系統(tǒng)管理員。IT運維管理系統(tǒng)能夠對一組相關對象的性能數(shù)據(jù)進行合并、計算(例如:將相關的幾個方法調用的總平均時間相加,或按比例擴大監(jiān)控數(shù)字等)并根據(jù)用戶的需求將合并或計算的結果用不同的方式展現(xiàn)出來并定義該組數(shù)據(jù)的閥值。IT運維管理系統(tǒng)支持設置一定的閥值自動收集相關用于診斷數(shù)據(jù)(javacoreheapdump),自動增加監(jiān)控的級別。舉例:當某段時間CPU持續(xù)60%以上,這個時候觸發(fā)報警,該報警對應的自動腳本自動執(zhí)行,保存一下當時的javacore。綜合性能分析:對IT業(yè)務系統(tǒng)的綜合性能分析綜合性能分析主要是針對華誼集團各類業(yè)務系統(tǒng),將對業(yè)務系統(tǒng)影響最大的各類性能指標放在一張視圖中去綜合管理,從而實現(xiàn)對性能的統(tǒng)一分析。IT運維管理系統(tǒng)實現(xiàn)了全面的性能管理,包括服務器性能管理、數(shù)據(jù)庫性能管理、中間件性能管理、存儲性能管理、網絡性能管理、應用性能管理等。維護人員可以根據(jù)需要靈活的設定性能閥值,生成相應的性能告警。可以以圖形化的方式,批量對監(jiān)控對象、監(jiān)控指標和監(jiān)控策略進行設置,并支持靈活的設定采樣周期。根據(jù)采集到的不同對象的性能參數(shù),在統(tǒng)一的界面內分別以曲線圖,餅圖或表格的方式顯示,可以根據(jù)分析的需要,將不同的參數(shù)指標或不同主機的性能參數(shù)指標在同一窗口內顯示比較,從而可以了解系統(tǒng)的性能瓶頸和不同系統(tǒng)的負載壓力。對于性能的指標,還可以做到根據(jù)歷史的變化趨勢,設置在某一置信度下的預測功能。從而可預言到系統(tǒng)需要升級擴展的時間。性能管理會集成所有收集到的性能指標信息,與后端的報表工具集成,生成性能統(tǒng)計報表。查看數(shù)據(jù)中心的綜合性能:查看各個被管對象的綜合性能:自上而下的業(yè)務監(jiān)控管理業(yè)務系統(tǒng)的性能直接決定了業(yè)務的增長和業(yè)務人員的效率以及客戶對服務的滿意度。因此在生產環(huán)境中保障這種復雜的、異構的分布式架構的應用性能,為業(yè)務和客戶提供滿意的服務,是IT運維團隊面臨的挑戰(zhàn)。目前在系統(tǒng)應用級別缺乏運行效率和異常的監(jiān)控,在故障情況下缺少處理依據(jù)和分析對象,造成對故障處理反應較慢。部分系統(tǒng)無客戶使用情況、系統(tǒng)運行情況的監(jiān)控,無有效的工具可以應用代碼進行分析優(yōu)化。不能持續(xù)改進系統(tǒng)的服務質量。IT部門需要通過交付從終端用戶角度管理的高品質的業(yè)務導向型IT服務,在目前的狀況,要交付關鍵的Web服務并實現(xiàn)業(yè)務目標,需要一種應用性能管理(APM)的新方法。IT監(jiān)控運維系統(tǒng)可使用戶在發(fā)展的同時主動監(jiān)測和管理日益復雜的Web應用服務環(huán)境,該解決方案提供的實時詳細數(shù)據(jù)有助于在問題影響客戶之前能快速理解和確定問題、符合服務級別協(xié)議要求、并提供客戶需要的在線體驗。實現(xiàn)端到端的業(yè)務監(jiān)控管理IT監(jiān)控運維系統(tǒng)為IT運維團隊提供實時的應用業(yè)務交易的端到端的執(zhí)行過程的性能可視化,幫助IT團隊及早預警影響業(yè)務和客戶的性能問題,快速定位問題原因,及時找到并把問題轉發(fā)到負責的相關技術部門。IT監(jiān)控運維系統(tǒng)監(jiān)控用戶的在線性能體驗,實時分析用戶和業(yè)務交易,識別性能問題;根據(jù)業(yè)務影響對性能事件進行優(yōu)先級分級,從而可以根據(jù)業(yè)務優(yōu)先順序有效解決IT問題;通過搜集端到端(客戶、網絡、web服務器、應用程序服務器、邏輯和后端層)性能數(shù)據(jù)對問題進行定位分類,及時將問題準確地分派到責任團隊解決;通過一個百分點分布圖或“箱線圖”圖形化展示了客戶體驗數(shù)據(jù),從而可以提供例如最小、最大、中等和六西格瑪質量度量(例如每百萬個交易中的收益和缺陷數(shù))等統(tǒng)計報表。IT監(jiān)控運維系統(tǒng)可使客戶的IT組織在生產中24x7全天候監(jiān)測復雜的Java和.NET應用和SOA環(huán)境,并在問題影響客戶之前檢測和解決問題??蓮臑g覽器到應用組件和后端系統(tǒng)監(jiān)測交易,并關聯(lián)數(shù)據(jù),以確定客戶如何受到應用問題的影響。可提供對整個應用架構的全面概覽,這些應用架構包括Java和.NET應用、應用服務器、Web服務器、消息中間件、數(shù)據(jù)庫、和交易服務器。具有可快速鑒別、根本原因分析和歷史數(shù)據(jù)報告的強大性能。IT監(jiān)控運維系統(tǒng)可以對業(yè)務應用進行實時監(jiān)控,在任何時刻均能夠以最大的采集能力工作,采集實時、全面的性能測試數(shù)據(jù),用戶能夠有全面的性能數(shù)據(jù)來進行分析從而找出性能問題所在。提供了深入的應用可視化和獨一無二的管理性能,主要包括:真實業(yè)務交易和終端用戶體驗數(shù)據(jù)SLA管理和業(yè)務影響數(shù)據(jù)映射到應用基礎架構上的事件優(yōu)先排序24x7全天候監(jiān)測應用的狀況和有效性,近乎為零的故障影響支持開放和大機的異構應用的端到端監(jiān)控對復雜SOA和虛擬環(huán)境的可視化同時監(jiān)控B/S和C/S架構應用的性能7×24實時監(jiān)控業(yè)務系統(tǒng)的客戶體驗檢測和統(tǒng)計交易錯誤及性能問題當終端用戶體驗到性能問題或交易錯誤時,無論是翻頁遲緩、部分或全部無響應、服務器錯誤、或客戶錯誤信息(如“無效頁面”),都可以檢測到。根據(jù)對用戶組、業(yè)務交易、或特殊業(yè)務交易的用戶組的錯誤和性能指標閥值進行詳細確定而生成警告。一旦交易違反了性能指標閥值,將記錄該交易,并將類似的錯誤交易統(tǒng)計為一個事件。根據(jù)業(yè)務影響對事件進行優(yōu)先排序可根據(jù)業(yè)務影響對個體事件進行分級,從而可以根據(jù)業(yè)務優(yōu)先順序有效解決IT問題。根據(jù)特定執(zhí)行的業(yè)務交易、受影響的用戶類型、以及遭遇問題的類型判斷業(yè)務影響。一旦達到特定的業(yè)務影響級別,將自動收集證據(jù),IT監(jiān)控運維系統(tǒng)是由行業(yè)領先的應用程序性能管理工具、路由器、交換機和其他架構組成。由于這些證據(jù)快照是在因為是在用戶出現(xiàn)問題的情況下實時收集的,所以對問題的診斷非常有用。一旦受影響的用戶數(shù)達到一定比例,并且產生了一定比例的錯誤,可以在服務臺或類似的事件和問題管理解決方案中,向相關的小組成員發(fā)布警報或自動打開事件工單(ticket)。面向業(yè)務的性能監(jiān)控實時監(jiān)控業(yè)務交互過程中的錯誤(例如丟包、沒有響應,響應慢等錯誤),并會根據(jù)規(guī)則定義發(fā)起管理事故,按照業(yè)務影響度排序。下圖是事故管理界面。業(yè)務質量SLA監(jiān)控所有業(yè)務,統(tǒng)計成功率,響應時間等關鍵指標的SLA??焖俣ㄎ粏栴}原因收到警報或打開事件工單后,可以使用SmartChart快速定位問題。SmartChart用圖形描述了對在每一個層級上,根據(jù)每個業(yè)務交易所產生錯誤的可變性和數(shù)量的基礎架構層級的預先分析。如有必要,用戶可以通過一次單擊,進行從上而下型的操作,進一步根據(jù)客戶、網絡、web服務器、應用程序服務器、邏輯和后端層對問題進行隔離。可提供與問題自然屬性有關的數(shù)據(jù),例如一個特定web服務器、一個特定應用程序服務器程序ID、Java方法或以統(tǒng)一方式表達的SQL語句,從而可以方便地采取向下層層分解的方法獲得數(shù)據(jù),便于更深入的分析。這樣可確保避免IT人員“相互推卸責任”,并即時將問題交予相關團隊進行解決。建立、追蹤和報告服務等級協(xié)議可以監(jiān)測用戶的活動,例如登錄、賬戶總計和業(yè)務程序級別的購買交易,這樣可使你報告SLA的法規(guī)遵從情況,從而便于在業(yè)務環(huán)境下進行管理。監(jiān)測和獲得從性能度量標準到交易構成級別的能力可使以下成為可能:根據(jù)服務等級協(xié)議(SLA)而正確測量真實終端用戶的體驗。此外,還根據(jù)URL字符串或HTTP標題屬性將用戶分組,例如根據(jù)促銷代碼、消費者類型、地點、模擬用戶等等。這可為每組用戶生成SLA報告??梢愿鶕?jù)業(yè)務程序生成的SLA報告,內置的記分卡和報告顯示了商業(yè)程序根據(jù)服務等級協(xié)議(SLA)而獲得成功。除了內置的報告,包括一個以便利格式提取數(shù)據(jù)的網絡服務API,此格式可通過專業(yè)化的分析和報告工具而生成。優(yōu)化客戶體驗任何對“平均性能”度量標準進行的分析都忽視了外層,不能正確表達所有在線終端用戶的體驗。為此,通過一個百分點分布圖或“箱線圖”圖形化展示了客戶體驗數(shù)據(jù),從而可以在使用例如最小、最大、中等和六西格瑪質量度量(例如每百萬個交易中的收益和缺陷數(shù))等統(tǒng)計表的業(yè)務程序中,對交易進行詳細的分析。這些度量可提供終端用戶的真實體驗,使你將主要資源用于減少差異并為客戶、合作伙伴和雇員提供具有一致性的在線體驗。IT監(jiān)控運維系統(tǒng)包括交易生成器,這是一個主要的特性,可在無人使用或升級后產生模擬交易,以便檢查應用程序的可用性,這兩種情況都發(fā)生在標準營業(yè)時間之外。在高峰時間對真實用戶造成影響之前,模擬交易生成能力可以確定并解決問題。交易生成器可以模擬生成客戶壓力。記錄用戶真實訪問交互,生成壓力腳本定義壓力回訪順序統(tǒng)一的用戶界面管理分布式的壓力虛擬機支持WebServices,加載分析WSDL,并自動生成模擬對webservice的訪問壓力腳本根據(jù)請求變量動態(tài)定義壓力腳本,真實地模擬大規(guī)模的用戶的交互客戶體驗監(jiān)控的工作方式客戶體驗監(jiān)控包括兩個組成:交易影響監(jiān)測(TIM)TIM位于數(shù)據(jù)中心,可以監(jiān)測網絡流量,并應用業(yè)務規(guī)定來檢測影響客戶的缺陷和異常情況。TIM向TESS報告有關客戶和交易的實時和歷史信息。交易事件和統(tǒng)計服務器(TESS)TESS與一個或更多TIM連接,從多個應用程序中收集和集中控制實時警報、性能及質量分析。你可以對此數(shù)據(jù)進行分析和統(tǒng)計,以便為解決事件、持續(xù)優(yōu)化和執(zhí)行報告而形成觀點、報告和記分卡。如下圖說明。網絡應用性能分析提供端到端應用響應時間監(jiān)控模塊,能夠跟蹤并測量最終用戶的響應時間。不僅可幫助用戶查看網絡向最終用戶交付服務的質量,而且還能為網絡上的總體狀況提供最全面的視圖。IT監(jiān)控運維系統(tǒng)將響應時間細分成應用、服務器以及網絡延遲等成分,從而使用戶能夠快速地排除造成網絡性能瓶頸的故障并保持優(yōu)異的應用性能。其可持續(xù)地分析所有TCP/IP交易的性能,依據(jù)其計算出的基線對響應時間進行比較,并在性能下降的時候向用戶發(fā)出告警。在問題發(fā)生時對造成問題的原因進行調查,以幫助用戶迅速解決性能問題。應用診斷分析管理J2EE應用服務器監(jiān)控IT監(jiān)控運維系統(tǒng)可以實時監(jiān)控執(zhí)行隊列當前空閑的數(shù)量、執(zhí)行隊列當前等待的數(shù)量、當前打開的HTTP會話數(shù)、Cookie會話創(chuàng)建的時間、文件會話創(chuàng)建的時間、JDBC會話創(chuàng)建的時間、內存會話創(chuàng)建的時間、復制會話創(chuàng)建的時間、每個JDBC連接池當前活動的連接數(shù)、每個JDBC連接池當前等待連接數(shù)據(jù)庫的請求數(shù)、實體Bean創(chuàng)建的時間、實體Bean創(chuàng)建的頻率、EJB池當前的使用量、EJB池當前的空閑量、EJB緩存獲取的時間、EJB緩存獲取的頻率、EJB緩存釋放的時間、EJB緩存釋放的頻率、Java消息服務各操作的響應時間和頻率、安全子系統(tǒng)各操作的響應時間。持續(xù)監(jiān)控關鍵應用服務器資源??焖俑綦x引起應用程序性能瓶頸的應用服務器配置問題,確保應用服務器及應用程序擁有一致的高可用性性能。應用服務器支持WebLogicWebSphereJBOSSTOMCAT所有遵循J2EE規(guī)范和Servlet規(guī)范的應用服務器可用性監(jiān)控服務器狀態(tài)JVM使用的堆??臻g監(jiān)控執(zhí)行隊列的服務請求數(shù)監(jiān)控客戶端請求等待數(shù)監(jiān)控活動socket連接數(shù)監(jiān)控EJB監(jiān)控空閑池中EJB實例數(shù)量監(jiān)測用戶請求超時的EJB實例監(jiān)測每秒EJB交易數(shù)監(jiān)測每秒EJB交易回滾數(shù)量監(jiān)測Servlet監(jiān)控Servlet平均執(zhí)行時間監(jiān)測每秒針對servlet的請求數(shù)監(jiān)測JMS監(jiān)控每秒通過JMS服務器的消息數(shù)監(jiān)測每秒通過JMS服務器的字節(jié)數(shù)監(jiān)測JDBC監(jiān)控連接池中JDBC連接數(shù)的可用性百分比監(jiān)測連接池中用戶等待連接數(shù)監(jiān)測未關閉的JDBC連接數(shù)監(jiān)測連接及time服務的監(jiān)控交易平均提交時間監(jiān)測交易回滾百分比監(jiān)測每秒交易執(zhí)行數(shù)量監(jiān)測交易監(jiān)控交易平均提交時間監(jiān)測;交易回滾百分比監(jiān)測;每秒交易執(zhí)行數(shù)量監(jiān)測集群的監(jiān)控集群重發(fā)廣播消息數(shù)量監(jiān)測集群丟失廣播消息數(shù)量監(jiān)測查看服務器記錄的內容,監(jiān)控對服務器配置文件的修改,檢查服務器可用性J2EE應用監(jiān)控監(jiān)控應用層面的執(zhí)行組件的性能,并直觀地反映到業(yè)務層面的性能,使得業(yè)務管理人員不需了解實現(xiàn)的技術細節(jié)也可以方便準確的監(jiān)控應用業(yè)務。可以對事務的執(zhí)行路徑進行跟蹤分析,確定方法的相互關聯(lián)性,為整個分布式J2EE應用提供基于事務的性能視圖,可以在組件或方法級重建特定用戶事務的執(zhí)行路徑。應用組件(Servlet/JSP/EJB/JMS/JDBC/JTA/WebService等)響應時間監(jiān)控應用組件(Servlet/JSP/EJB/JMS/JDBC/JTA/WebService等)吞吐量監(jiān)控IntroscopeTransactionTrace可以對事務的執(zhí)行路徑進行自動地跟蹤分析,確定方法的相互關聯(lián)性,為整個分布式J2EE應用提供基于事務的性能IntroscopeTransactionTrace可以直觀地顯示整個執(zhí)行過程視圖。并且自動找到執(zhí)行路徑中的性能瓶頸點,以紅色標注提示給分析人員,提高診斷的效率。(見下圖)。支持靈活的監(jiān)控擴充能力,可以根據(jù)需要對任意客戶應用中的類和方法進行監(jiān)控。通過方便快捷的定制定義方法,可以滿足監(jiān)控人員的各種定制監(jiān)控的需求。例如可以按包分類、按繼承關系、按類名定義監(jiān)控或者不監(jiān)控的范圍;可以對類中的任意多個方法、單個方法指定任意的監(jiān)控目標,如處理筆數(shù),響應時間,錯誤率,并發(fā)調用數(shù),以及超時數(shù)等。并可以根據(jù)方法調用的參數(shù)分解出不同參數(shù)的執(zhí)行性能,例如對一個EAI接口,同一個接口方法使用不同的參數(shù)調用后臺系統(tǒng)不同的服務,通過定制可以分解追蹤不同的參數(shù)的調用性能,從而反映后臺系統(tǒng)中相應的服務的執(zhí)行性能。(見下圖)。支持Struts、Spring和Hibernate等通用開發(fā)框架的監(jiān)控,例如Struts中StructsAction類的執(zhí)行性能,Spring中Controller、View等組件的執(zhí)行性能,Hibernate中Mapping機制的執(zhí)行性能等。見下圖的交易追蹤圖示了一個應用請求的執(zhí)行是如何通過Struts、Hibernate完成的。通過靈活的定制擴充能力,可以支持其他第三方定制開發(fā)的開發(fā)框架的監(jiān)控。自動觸發(fā)交易追蹤記錄性能異常的業(yè)務,IntroscopeTransactionTrace支持根據(jù)Session追蹤相應的端到端的應用執(zhí)行,能夠顯示當前Session的IP地址、URL、用到的程序組件如JSP、EJB或JavaBean的響應時間、操作的SQL語句的時間(見下圖)。應用系統(tǒng)執(zhí)行中的錯誤和異常監(jiān)控ErrorDetector可以實時監(jiān)控捕獲應用中阻礙應用程序成功執(zhí)行的異常和錯誤(下圖顯示有JDBC異常、404錯誤及程序異常),并顯示具體出錯的位置。Java內存管理監(jiān)控解決內存管理問題,有效隔離難以發(fā)現(xiàn)的潛在內存漏洞。內存使用和內存中對象數(shù)量監(jiān)控JVMGC健康監(jiān)控JVM內存泄露監(jiān)控和檢測IntroscopeLeakhunter可以監(jiān)控JavaCollection的使用情況,發(fā)現(xiàn)不斷占用內存的類、方法、Collection名和占用Collection的個數(shù)。Introscope的InstanceCount技術支持在生產環(huán)境實時監(jiān)控Java對象的數(shù)量,并支持與JVMGC曲線圖關聯(lián)分析,發(fā)現(xiàn)引起泄漏的類(下圖顯示兩個引起內存泄漏的類)。WebServer監(jiān)控IntroscopePowerPackforWebServers支持監(jiān)控各種WebServer(ApacheServer、IHS、IIS和iPlanet)的執(zhí)行狀態(tài),監(jiān)控的指標包括WebServer的可用性、每秒傳輸?shù)淖止?jié)數(shù)、每秒處理的請求數(shù)、當前活動的線程數(shù)和空閑的線程數(shù)。數(shù)據(jù)庫訪問監(jiān)控監(jiān)控數(shù)據(jù)庫訪問性能IntroscopeSQLAgent監(jiān)控數(shù)據(jù)庫SQL訪問性能,捕獲每個SQL語句的詳細信息,監(jiān)控動態(tài)、預處理及通用的SQL語句的執(zhí)行性能(每個SQL語句的單位時間處理筆數(shù),響應時間,錯誤率,并發(fā)調用數(shù),以及超時數(shù)等)。并且通過實時交易追蹤應用對SQL的調用。監(jiān)控動態(tài)、預處理及通用的SQL語句的執(zhí)行性能監(jiān)控存儲過程的執(zhí)行性能捕獲每個SQL語句的詳細信息標準JDBC驅動器的數(shù)據(jù)庫連接支持Oracle(7、8i、9i和10g版)DB2(5、6、7和7.1版)Sybase(10-11.9x版)SQLserver2000MySqlInformix數(shù)據(jù)連接池性能監(jiān)控系統(tǒng)環(huán)境性能監(jiān)控持續(xù)監(jiān)控系統(tǒng)環(huán)境的性能,例如webserver,操作系統(tǒng)等??焖俑綦x引起應用程序性能瓶頸的環(huán)境組件的性能問題,確保環(huán)境組件及應用程序擁有一致的高可用性性能。監(jiān)控操作系統(tǒng)資源CPU內存線程磁盤I/O網絡I/O支持AIX、Solaris、Windows、Linux、z/OS監(jiān)控WebServer資源點擊率錯誤率響應時間支持Apache、IIS能夠集成非自身采集系統(tǒng)的日志信息,并可以在界面上圖表化的展現(xiàn)出來。IntroscopeEPA可以定時執(zhí)行非Java軟件提供的命令,然后將其輸出轉化成Introscope的數(shù)據(jù)類型,發(fā)送給監(jiān)控服務器,從而達到監(jiān)控各種非JAVA的系統(tǒng)性能指標的要求。IntroscopeEPA可以分析非Java系統(tǒng)的日志,從中獲取可用性及性能相關的信息,發(fā)送給監(jiān)控服務器(下圖展示監(jiān)控Apache的日志和WebLogic的日志信息,如apache頁面點擊率、404錯誤率、WebLogic的Alert數(shù)量、Warning數(shù)量和Notice數(shù)量等)。SOAWeb服務監(jiān)控SOAWebService管理器(SOAManager)監(jiān)控實現(xiàn)SOA的Web服務,對Web服務相關的性能問題進行根源分析。24x7地監(jiān)控Web服務端到端的性能和可用性;可以偵測和隔離單個出現(xiàn)嚴重故障的使用Web服務的事務。通過生產監(jiān)控、預應報警和歷史報告等手段確保達到服務等級的目標。IntroscopeTransactionTrace可以追蹤顯示WebService在一個請求響應中的占用時間(見下圖)。EPagent除了J2EE應用,IntroscopeEnvironmentPerformanceAgent(以下簡稱EPA)可以定時執(zhí)行非Java軟件提供的命令,然后將其輸出轉化成Introscope的數(shù)據(jù)類型,發(fā)送給監(jiān)控服務器,從而達到監(jiān)控各種非JAVA的系統(tǒng)性能指標的要求。IntroscopeEPA還可以分析非Java系統(tǒng)的日志,從中獲取可用性及性能相關的信息,發(fā)送給監(jiān)控服務器。應用環(huán)境更改的監(jiān)控IntroscopeChangeDetector可以實時監(jiān)控應用環(huán)境中的文件、Oracle數(shù)據(jù)庫表、Java系統(tǒng)屬性和Java類的更改,并提供預定制的監(jiān)控面板。IntroscopeChangeDetector而且能夠在生產環(huán)境下實時地與應用性能作關聯(lián),快速定位由于上述更改引起的性能問題。如果是文件的更改,還可以知道修改的具體位置。主動檢查業(yè)務可用性WilyTransactionGenerator可以錄制客戶交易,模擬生成客戶訪問,實時監(jiān)測系統(tǒng)的可用性。預警機制及故障分析IT監(jiān)控運維系統(tǒng)提供的報警機制可以根據(jù)監(jiān)控的數(shù)據(jù)實現(xiàn)預警功能。例如對空閑線程設置報警,當空閑線程小于3個時就發(fā)出報警信息,讓運維人員進行處理。用戶甚至不會知道系統(tǒng)曾經出現(xiàn)過問題。當出現(xiàn)異常時,運維人員可以通過彈出窗口、郵件等方式第一時間知道應用出現(xiàn)了問題。運維人員可以通過查看紅綠燈,定位問題是發(fā)生在什么應用、什么位置,是應用本身的問題,或是后臺的問題,還是網絡的問題。性能分析優(yōu)化應用的性能分析優(yōu)化考慮兩個層面,應用服務器層和應用程序層。應用服務器層應用服務器層會考慮資源的使用情況,如GCHeap、線程池、JDBC連接池及其它各種池。IT監(jiān)控運維系統(tǒng)會自動記錄性能數(shù)據(jù),而且能夠非常方便地進行查詢。應用程序層儀表板視圖可以實時顯示當前最慢的程序組件,哪些組件的性能不佳可以一目了然。也可以捕捉緩慢的事務,并顯示每個事務在客戶端、網絡、應用服務器和數(shù)據(jù)庫服務器處花費的時間,直接顯示事務在哪個部分最慢(能夠深入到SQL語句),從而實現(xiàn)端到端分析。主要技術特點Introscope用于管理生產環(huán)境中Java應用程序性能問題的軟件產品,它確保企業(yè)關鍵業(yè)務應用程序高性能、高可用性的7×24小時全年無休的持續(xù)運作。產品包含多項先進的專利技術,高度可延展,簡捷易用;是監(jiān)控管理復雜的復合式應用程序最為行之有效的方法;公用語言確保業(yè)務部門與IT團隊之間的通信暢通,以全面達成應用程序的業(yè)務目標與性能目標。Introscope涵蓋應用程序生命周期的各個階段,對于測試環(huán)境,Introscope協(xié)助IT開發(fā)團隊迅速隔離并解決性能問題,并以非常低的系統(tǒng)開銷的專利技術7×24地持續(xù)監(jiān)控應用環(huán)境中的Java應用性能。Introscope提供企業(yè)整個應用程序環(huán)境的組件視圖(包括應用程序自身、應用服務器以及到后端系統(tǒng)的連接)。確保IT開發(fā)團隊前攝性和反應性監(jiān)控關鍵應用程序,以迅速解決問題或避免問題的出現(xiàn)。Introscope監(jiān)控代理使用Wily的專利技術BytecodeInstrumentation,此技術具有不需要修改應用代碼,資源(CPU、內存、網絡IO等)占用低的特點,適宜7×24地在生產系統(tǒng)上使用。此專利技術已經成為Sun的J2SE5.0的標準技術。Intrsocope的監(jiān)控代理(Agent)是以實時方式收集性能數(shù)據(jù),但以7.5秒的間隔匯聚并上傳數(shù)據(jù)。由于Introscope的Agent采用的業(yè)界領先的技術,IntroscopeAgent的工作開銷非常低,完全滿足客戶對生產環(huán)境中低開銷監(jiān)控的要求。Introscope的部署不需要源代碼,也不會更改應用的部署包文件,所有監(jiān)控所需的操作均在內存加載過程中動態(tài)完成,因此,監(jiān)控功能的開啟和關閉都是非常方便直接。Introscope也支持動態(tài)修改配置,并動態(tài)生效的能力(對java方法的追蹤配置的動態(tài)生效需要JDK1.5環(huán)境)。Introscope監(jiān)控代理與收集服務器之間沒有依存關系,監(jiān)控代理只負責發(fā)送數(shù)據(jù),并不會通過任何機制(緩存數(shù)據(jù)、失敗重發(fā))來保證收集服務器一定收到數(shù)據(jù)。因此,即使收集服務器工作不正常,也不會影響監(jiān)控代理。Introscope是唯一的平臺無關的管理軟件。與企業(yè)級J2EE應用程序環(huán)境完全兼容。允許企業(yè)中個人或部門(包括業(yè)務組、高級管理層、作業(yè)人員、開發(fā)人員、質量保證團隊及系統(tǒng)管理員)共享關鍵性能數(shù)據(jù)。確保應用程序成功部署,全天候高性能、高可靠性地持續(xù)運作。Introscope確保IT部門專業(yè)技術在整個企業(yè)內部合理分布。即時可用的報告功能,報告創(chuàng)建瞬間完成。用戶可對關鍵業(yè)務實施快速高效地智能化管理。Introscope簡捷易用的儀表板具備超級鏈接和可自定義圖形顯示方式等功能。提供深層次的直觀視圖。顯示系統(tǒng)構件與應用程序基礎架構的相互關系;可依據(jù)應用程序及用戶自身作業(yè)環(huán)境的不同創(chuàng)建個人儀表板。靈活的界面和歷史數(shù)據(jù)報告功能,便于非Java專業(yè)人員利用應用程序性能數(shù)據(jù)監(jiān)控應用程序健康狀況與可用性、檢測性能瓶頸、實施服務等級協(xié)議管理、進行容量規(guī)劃與趨勢分析等。自下而上的基礎架構監(jiān)控服務器監(jiān)控管理通過IT監(jiān)控運維系統(tǒng),可以實現(xiàn)對各類物理服務器的監(jiān)控管理和性能分析。通過IT監(jiān)控運維系統(tǒng)提供了服務器管理的視圖。用戶也可以根據(jù)需要,定制自己所需要的服務器性能指標來進行性能分析。虛擬化監(jiān)控管理通過IT監(jiān)控運維系統(tǒng),可以實現(xiàn)對各類主流虛擬化技術的監(jiān)控和管理,包括VMWare、Ctrix、Hyper-V、IBMVM、SolarisZone等。運維人員即可以查看各類虛擬化組件狀態(tài),也可以分析各類虛擬化指標變化。網絡監(jiān)控管理通過IT監(jiān)控運維系統(tǒng),可以實現(xiàn)對網絡設備的監(jiān)控和分析。根據(jù)客戶需要可以實現(xiàn)針對網絡設備狀態(tài)的監(jiān)控和網絡帶寬狀態(tài)的監(jiān)控,也可以實現(xiàn)對不同廠商設備的性能監(jiān)控和分析。數(shù)據(jù)庫監(jiān)控管理通過IT監(jiān)控運維系統(tǒng),可以實現(xiàn)隨各類數(shù)據(jù)庫的性能查看和分析,包括SQLServer數(shù)據(jù)庫、Oracle數(shù)據(jù)量、DB2數(shù)據(jù)庫、Sybase數(shù)據(jù)庫、Informix數(shù)據(jù)庫和Mysql數(shù)據(jù)庫。中間件監(jiān)控管理通過IT監(jiān)控運維系統(tǒng),可以實現(xiàn)對中間件的監(jiān)控管理,包括Weblogic、Websphere、Tomcat、Jboss等各類中間件軟件。存儲監(jiān)控管理通過IT監(jiān)控運維系統(tǒng),可以實現(xiàn)對主流存儲設備的監(jiān)控,包括EMC、IBM、NetApp、HDS、HP等。各類運維報表,監(jiān)測資源利用狀態(tài)IT監(jiān)控運維系統(tǒng)提供了豐富的運維報表,包括預定義的統(tǒng)一運維報表。報表設計了IT的各個層面包括服務器報表、虛擬化報表、網絡報表、數(shù)據(jù)庫報表等。此外,針對報表的生成策略,提供了靈活的報表作業(yè)調度的功能。IT監(jiān)控運維系統(tǒng)提供多種運維管理報表,尤其是即拿即用的統(tǒng)一運維報表。通過點擊查看各類運維信息。運維報告可以導出為EXCEL、PDF、CVS、Flash等各類文件格式。華誼集團維護人員根據(jù)需要設置多種報告作業(yè),如日報、周報、月報、季報、年報等。也可以根據(jù)需要,設置不定期的報告作業(yè)。個性化支持,提供自定義管理面板和報表統(tǒng)一管理門戶支持多種個性化管理定制,通過報表和管理模板設計器,可以定制運維所需的各種個性化的運維報表的管理面板。性能報表設計器提供性能報表設計器,可以通過簡單拖拽的方式,快速生成所需的新的運維管理報表。該報表的設計生成,無需編程,只需要通過簡單的拖拽既可以實現(xiàn)。選擇所需的數(shù)據(jù),拖拽到下面的報表中,即可生成所需要的報表。修改報表標題,添加新報表,將報表保存后,以備以后直接查看。列表設計器通過列表設計器,可以實現(xiàn)定制各類設備報表,實現(xiàn)列表數(shù)據(jù)的展現(xiàn)。管理面板設計器通過管理面板設計器,運維人員可以設計自己所需的管理面板。IT監(jiān)控運維系統(tǒng)提供管理面板的設計指南,并提供強大的設計功能。運維人員無需編程,即可以實現(xiàn)個性化管理面板的設計和生成。將生成的管理儀表板保存后,可以發(fā)布給相關的人員來使用。SLA設計器IT監(jiān)控運維系統(tǒng)提供了靈活的SLA設計器。運維人員客戶根據(jù)需要,將各類性能指標作為QoS指標,通過多個Qos指標的組合生成所需要的SLO項,再將多個SLO項組合生成所需要的SLA項。通過SLA設計器,無需編程和定制開發(fā),即可以靈活的設定各類SLA,從而滿足CIO、IT主管和運維人員的運維管理需要。支持多租戶,不同用戶查看不同的內容IT監(jiān)控運維系統(tǒng)支持多種用戶權限和密碼的管理,供運維人員選擇使用。登錄UMP后,點擊賬號和密碼管理。既可以實現(xiàn)對不同用戶的權限和密碼的修改和管理。易用性,用戶DIY管理風格IT監(jiān)控運維系統(tǒng)功能靈活、易于使用,運維人員可以根據(jù)自己的需要,通過簡單的添加頁面和portlet,DIY具有自己管理風格的管理界面和管理內容。同時也可通過頁面管理定制自己的展現(xiàn)內容和展現(xiàn)風格。重點問題分析開放的管理體系IT監(jiān)控運維系統(tǒng)具有開放的管理體系,可以實現(xiàn)多個層面的系統(tǒng)集成,從而擴展管理范圍和管理能力。IT監(jiān)控運維系統(tǒng)支持通過CMDB集成的方式、網關的方式、基于WEBServiceAPI的方式、門戶集成的方式來集成第三方監(jiān)控工具,實現(xiàn)將第三方監(jiān)控(例如空調、門禁、UPS或特定應用管理工具等)完全變?yōu)楸O(jiān)控系統(tǒng)的一部分。此外,IT監(jiān)控運維系統(tǒng)還提供了豐富的SDK開發(fā)包,支持SHELL、C、VB、J2EE、.NET、Perl等多種開發(fā)語言。擴展性IT監(jiān)控運維系統(tǒng)具有良好的可擴展性,不僅提供了基于WEBService的API,還提供了豐富的SDK開發(fā)包,支持SHELL、C、VB、J2EE、.NET、Perl等多種開發(fā)語言。從而實現(xiàn)監(jiān)控資源的二次開發(fā)。兼容性IT監(jiān)控運維系統(tǒng)提供統(tǒng)一的事件管理平臺,并提供多種兼容集成網關,既可以實現(xiàn)與CA自身的ServiceDeskManager服務臺的集成,也可以實現(xiàn)與第三方服務臺如BMCRemedy、HPServiceManager的集成。此外,IT監(jiān)控運維系統(tǒng)還提供了基于WEBService的API和多種SDK開發(fā)包,允許通過接口開發(fā)的方式實現(xiàn)與基于ITIL的服務臺和流程管理的集成。系統(tǒng)高度可配置IT監(jiān)控運維系統(tǒng)自身可以安裝在Windows、Linux、Solaris操作系統(tǒng)上,后臺數(shù)據(jù)庫支持SQLSERVER、MYSQL、Oracle等。IT監(jiān)控運維系統(tǒng)的配置性極強,可以根據(jù)運維管理需要靈活的配置。所有配置手段都向運維人員開放。運維人員可以根據(jù)需要配置數(shù)據(jù)采集規(guī)則、預警規(guī)則、預警方式、以及用戶報表和管理門戶內容等。安全性安全方案的實現(xiàn),離不開管理,所謂“三分技術、七分管理”。管理的有效性,可以解決許多技術層次解決不了的安全性問題。人員是管理的核心。日常的交互與操作安全管理,涉及到系統(tǒng)運作時的方方面面,它的基本原則是:要求發(fā)生在系統(tǒng)內的所有行為都是有定義行為,并且符合程序控制的要求,所有行為的發(fā)生都有審計記錄。要實現(xiàn)對全網設備的安全管理,必須集中管理超級用戶口令,這也是IT運維管理系統(tǒng)所必須的,同時要定期更改口令,并且采取建議的口令選擇方式。IT運維管理系統(tǒng)除了自身的用戶身份管理外,提供與LDAP等身份認證機制集成的用戶身份管理接口,用戶可以根據(jù)不用的監(jiān)控人員身份,定義各監(jiān)控人員的權限和性能監(jiān)控界面。另外,對于IT運維管理系統(tǒng)本身,由于其特殊性,即具有管理其他網絡設備和主機的權限,因此其自身的安全性更加重要,IT監(jiān)控運維系統(tǒng)具有多級操作員權限控制,不同的操作員管理不同的對象,并且具有不同的權限??梢钥紤]特定的管理員只能管理職權范圍內的設備,根據(jù)人員的多少,可以細分為各種業(yè)務的管理員,如系統(tǒng)管理員,數(shù)據(jù)庫管理員。同時IT運維管理系統(tǒng)由于其自身的特殊權限,可以管理網上所有設備,并在被管理端執(zhí)行命令,因此必須防止冒充管理服務器的行為,這就要求管理服務器與被管節(jié)點間必須采取相互信任的通信方式,管理端與被管節(jié)點上的代理程序Robot間采用加密的SSL通信方式,保證了管理信息的傳輸安全性。在數(shù)據(jù)采集中,IT運維管理系統(tǒng)支持無代理和有代理兩種數(shù)據(jù)采集模式,從而大大提高了數(shù)據(jù)采集的安全性,降低了安全漏洞。另外,IT運維管理系統(tǒng)的管理服務器支持雙機熱備份的HA方式,保證在任何時候都可以管理,而且被管理端的Robot可以在主服務器失敗時將信息發(fā)送到備份服務器,也可以定義在不同時間發(fā)向不同的服務器,保證在任何時間都有人在監(jiān)控這些信息。CAIT監(jiān)控運維系統(tǒng)的方案特點與優(yōu)勢CA公司解決方案為國內外眾多公司多信任華誼集團的運維管理采用CA公司成熟的商業(yè)化解決方案,該解決方案在國外運維管理中有著眾多成功的使用案例。該平臺可以滿足IT運維所有相關產品的監(jiān)控和管理需要。CA公司解決方案作為業(yè)界一流的IT運維管理解決方案在國內外客戶中有著廣泛的客戶群和成功實施的案例。目前,在全球有近一千家用戶成功實施了CA公司的解決方案。全球銀行Top20中的16個、美國銀行Top10中的9個、全球電信Top30中的20個、全球保險Top30中的12個、全球投資行Top10中的5個、全球大型汽車制造業(yè)Top12中的7個都采用了CA公司的解決方案。CA公司以其先進的技術和項目實施能力為世界級企業(yè)所信任。其他,國內如工商銀行、中國電信等國內知名企業(yè)也都采用CA公司的解決方案來管理它們的關鍵業(yè)務和應用。CA公司的實施經驗和最佳實踐華誼集團通過CA公司解決方案可以有效的引進CA公司先進的管理理念和吸收國內公司運維系統(tǒng)實施的經驗,從而降低項目風險,提高項目成功率。提供完整的IT運維管理系統(tǒng)建設規(guī)劃,符合華誼集團建設發(fā)展的需要CA公司在大量的項目經驗的基礎上,形成一套規(guī)范的IT運維管理系統(tǒng)實施方法,可以提升IT系統(tǒng)的整體可用性,降低業(yè)務應用級的故障率,最終保證IT部門創(chuàng)造價值。CA公司支持完整的IT運維管理系統(tǒng)建設藍圖,有成熟的商業(yè)化軟件產品可以實現(xiàn)方法論落地。通過監(jiān)控操作處理層、管理流程調度層、應用展示層和統(tǒng)一配置信息庫,幫助華誼集團逐步建設成熟的基于業(yè)界最佳實踐的IT運維管理系統(tǒng)。提供完備的實施風險保障措施在業(yè)界類似的項目實施過程中,重要的風險因素以及風險評估與控制策略總結如下。人員配合和分布原因:在項目中由于涉及的系統(tǒng)較多,各個系統(tǒng)的實際情況不同,所以存在不同系統(tǒng)之間的系統(tǒng)集成以及不同公司人員的配合問題。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論