




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、2008IT 運維與管理高峰論壇演講劉靜劉靜:非常榮幸今天有機(jī)會在這里跟大家一起探討一IT服務(wù)管理的實踐。實際上從IT 服務(wù)管理的發(fā)展來看,大家在做各種各樣的實踐, 包括在建設(shè)按照ITLI 的最佳實際,結(jié)合國內(nèi)的實際情況來建設(shè)相關(guān)的相關(guān)管理流程,而且不斷地使這樣的管理流程走向更加成熟。即使是這樣,我們?nèi)匀话l(fā)現(xiàn),好象持續(xù)在做這些管理流程的一些實施的話,在我們整個的過程當(dāng)中仍然碰到了困難。比如說我們很難看到一個跟業(yè)務(wù)相關(guān)的視圖,比如說我們說在支持IT 業(yè)務(wù)的運維和發(fā)展,我們怎么樣看到跟IT 業(yè)務(wù)相關(guān)視圖以及業(yè)務(wù)的可持續(xù)化,是我們很難解決的問題。如何利用自動化的驅(qū)動來降低整個的費用,提高服務(wù)的提供和
2、整個服務(wù)的質(zhì)量,保證快速地實施。以及面臨現(xiàn)在不管是應(yīng)用環(huán)境還是IT 自身的架構(gòu)建設(shè)也好,我們面臨了不斷更新的技術(shù)和服務(wù)的發(fā)展。在面臨這樣的服務(wù)和技術(shù)發(fā)展的時候,如何進(jìn)行創(chuàng)新?我們今天的內(nèi)容就IT 服務(wù)管理的一些實踐跟大家交流。首先,這是大家都很熟悉的Gartner 關(guān)于 IT 成熟度的模型,從目前我們國內(nèi)的用戶來講,大家都處在一些被動式的管理,有一部分用戶在于主動式或者是面向服務(wù)的管理,或者是第二層次、第三層次做了工作。比如說主動的監(jiān)控,嘗試做一些容量和能力的規(guī)劃方面的工作。我們來看,從我們最終的IT 的管理怎么樣去面向IT 服務(wù)的管理來講的,舊M的服務(wù)管理提出三個主要的思想,第一個主要的思想
3、是怎么樣實現(xiàn)一個可視化,這是我們在一開始談到的問題。如何能夠把IT 跟我們業(yè)務(wù)之間的關(guān)系,以及對業(yè)務(wù)之間的支持,我們能夠用可視化的方式看到,能夠評估、測量,并且能夠支持我們?nèi)粘5倪\維。第二個方面,我們把它總結(jié)為可控化,我們怎么樣去了解我們現(xiàn)在所有的IT 的資產(chǎn),在這些IT 的資產(chǎn)如何來支持我們?nèi)粘5倪\維,以及 IT 的資產(chǎn)我們?nèi)绾稳λ鲆粋€更重復(fù)地使用,和對他進(jìn)行一個更高效地利用,從而減輕我們的成本和提高我們的服務(wù)質(zhì)量,并且降低在管理過程當(dāng)中的風(fēng)險。第三個問題是自動化,在自動化這點上,我們不是說要有什么樣的產(chǎn)品,或者是在IT 管理建設(shè)服務(wù)某一個點上實施自動化,幫助我們提高效率。從自動化來講,
4、不管是可視化、可控化都貫穿在整個管理的過程當(dāng)中。自動化我們提供流程的自動化怎么實現(xiàn),包括實現(xiàn)運維我們做自動化的部署、監(jiān)控,在整個監(jiān)控的方面,怎么樣去實施自動化,來提高我們的生產(chǎn)效率。首先從可視化這個目標(biāo)來講,我們需要去洞察業(yè)務(wù),我們需要去了解,現(xiàn)在的業(yè)務(wù)的狀態(tài)是什么,我們的 IT 是怎么樣去支持我們的業(yè)務(wù)的,直接能夠從我們的IT 業(yè)務(wù)的支持上面看到可交付的目標(biāo)。從我們的解決方案來講,我們需要提供實時的視圖和實時的dashboard ,包括我們從業(yè)務(wù)合規(guī)、運維整個了解現(xiàn)在資產(chǎn)的管理所需要的可用性,以及這個可用性是不是很好地實現(xiàn)了我們的業(yè)務(wù)目標(biāo)。在我們的右邊是給了大家一些可視化的視圖,后面我們就這
5、些可視化的內(nèi)容進(jìn)行展開溝通。第二個部門可控化,剛才已經(jīng)談到了主要的核心思想是我們怎么樣能夠提供一個完善的控制,能夠去了解到我們的現(xiàn)有的 IT 資產(chǎn)以及如何對我們的IT 資產(chǎn)進(jìn)行優(yōu)化的利用。在講到可控化這部分,大家會想是不是講我們IT 資產(chǎn)的管 理,以及從ITLI來講,更側(cè)重于CMD這樣的管理,從后 面整個運維的角度來講,可控化對IT資產(chǎn)、CMDB勺管理, 不是在資產(chǎn)本身提供一個高效地利用率、管控也好,實際上對我們的運維過程怎么樣實現(xiàn)可視化,怎么樣把紛繁復(fù)雜的基礎(chǔ)架構(gòu)的事件、問題能夠可視化變成業(yè)務(wù)影響。它在這部分來講,提供了非常好的業(yè)務(wù)的技術(shù)支持。最后是自動化,將敏捷性融入到我們的運維當(dāng)中,幫助
6、我們快速地實現(xiàn)運維的目標(biāo)。剛才我們從 舊M服務(wù)管理三個比較核心的思想和觀點,從我們的實踐來講,大家會想到我們現(xiàn)在面臨的是非常復(fù)雜的 IT 的架構(gòu)。 在我們這張圖下面,大家可能看到的是在我們下面的這部分,不管是從我們的主機(jī)、開放平臺、應(yīng)用、網(wǎng)絡(luò)、 語音、 傳輸?shù)鹊日麄€IT 的基礎(chǔ)架構(gòu)。這是我們現(xiàn)在面臨的,從IT 的視角看。從業(yè)務(wù)視角看的話,我所需要的是一個業(yè)務(wù)的交付,從銀行業(yè)來看,我需要的是網(wǎng)上銀行能夠提供我們所承諾的服務(wù)級別,能夠在我們用戶所期望,業(yè)務(wù)目標(biāo)所定義的一些響應(yīng)時間也好,是在指標(biāo)之內(nèi)對我們廣大的用戶,是對業(yè)務(wù)的用戶提供服務(wù)。我們現(xiàn)在IT 和業(yè)務(wù)之間,我們怎么樣來建立這種聯(lián)系,以及怎么
7、樣實現(xiàn)運維,這是我們給出的一個實踐的模型。在這樣實踐的模型當(dāng)中,主要的部分是三個層次,在金字塔模型最上端,是我們的業(yè)務(wù)所要實施的整個業(yè)務(wù)的管理。在中間的層次是一個會聚的運維的管理。下面這個層次來講, 是我們熟悉地傳統(tǒng)IT 的管理領(lǐng)域。我們定義為一個技術(shù)的專業(yè)領(lǐng)域的管理,包括對應(yīng)用、網(wǎng)絡(luò)、主機(jī)、安全、開放平臺、存儲等等的各個支持我們的IT 基礎(chǔ)架構(gòu)的整個環(huán)境的各個專業(yè)領(lǐng)域的管理。我分了兩部分探討,一部分我們會側(cè)重于在講,根據(jù)我們現(xiàn)在運維的環(huán)境,我們怎么樣在基礎(chǔ)架構(gòu)的層次做技術(shù)領(lǐng)域的專業(yè)的管理。另外一部分,探討怎么樣面向業(yè)務(wù)服務(wù)的管理。首先,我們從大家非常熟悉的領(lǐng)域開始,面向一個專業(yè)技 術(shù)領(lǐng)域的管
8、理。當(dāng)我們回到各個專業(yè)技術(shù)領(lǐng)域,回到網(wǎng)絡(luò)、 應(yīng)用、存儲等等這些領(lǐng)域的時候,我們來看這個領(lǐng)域當(dāng)中, 我們的運維目標(biāo)是什么??赡茏鳛橐粋€網(wǎng)絡(luò)部門的領(lǐng)導(dǎo)、 員工來講,我們似乎是說很難去把我們的網(wǎng)絡(luò)跟業(yè)務(wù)之間 做一個非常好的很一致、完全的對應(yīng)。因為網(wǎng)絡(luò)支持著很 多的應(yīng)用的運行,和我們商業(yè)的運行,在這樣的情況下, 我們從我們的運維目標(biāo)來看,作為我們系統(tǒng)專業(yè)的領(lǐng)域, 我們的運維目標(biāo)是什么。在這個地方,我們總結(jié)了兩個方 面的運維目標(biāo)。首先,運維目標(biāo)是要保證我們的系統(tǒng)可用性。一談到可用 性,大家會談到,我們怎么樣去實現(xiàn)一個高可用性,我的 可用性的能力是什么。這個地方我們定義是我們系統(tǒng)的可 用性目標(biāo)是滿足我們的
9、業(yè)務(wù)要求的。其次從運維的角度來 講,我們有非常重要的目標(biāo)是在整個系統(tǒng)的生命周期的建 設(shè)過程當(dāng)中,如何利用這樣科學(xué)的數(shù)據(jù)的分析,來支持整 個系統(tǒng)的持續(xù)地發(fā)展。這是從技術(shù)的專業(yè)領(lǐng)域來講的運維 目標(biāo),從現(xiàn)在不管是國內(nèi)、國外,大家在技術(shù)領(lǐng)域的專業(yè) 的管理領(lǐng)域里面,大家的一些成功的實踐來講,我們主要 分為下面四個方面。第一個方面我們?nèi)ヌ峁┝艘粋€可視化地監(jiān)控,或者說我們 提供了可視化的視圖。第二個方面是提供一個很堅固的事 件基礎(chǔ),這是非常核心的一部分。參考業(yè)務(wù)影響關(guān)系定義 鼓掌分類或級別,以及我們要采取什么措施盡量減輕或者是消除、預(yù)防這些能帶來的影響。第三個方面是對所專注的這個基礎(chǔ)架構(gòu)領(lǐng)域,它的運行的數(shù)據(jù)
10、全面的分析,這些分析是我們要定義哪些我們的 KPI。這些KPI它的運行的績效是怎么支撐業(yè)務(wù)的。第四個是建立流程化的管理平臺,支持運維靈活的要求。從這個層次來講,包括我們跟國內(nèi)很多的用戶來做一些運維方面的工作,在建設(shè)的過程當(dāng)中有很深的體會,有可能你建了非常好的網(wǎng)絡(luò)管理系統(tǒng)、主機(jī)管理系統(tǒng)、存儲管理系統(tǒng)或者是其他基礎(chǔ)架構(gòu)的管理子系統(tǒng)。但是會發(fā)現(xiàn),這個系統(tǒng)很難在良性的環(huán)境下做持續(xù)地更新地滿足我們的運維要求。實際上這方面通常存在的問題是我們只是構(gòu)建這個技術(shù)平臺,我們并沒有去對如何讓這個技術(shù)平臺保證我們的業(yè)務(wù)目標(biāo),實現(xiàn)我們的IT 運維目標(biāo)這方面做相關(guān)的制度、流程化的支持,去使這個技術(shù)平臺如何最大限度地去發(fā)
11、揮它的作用。首先是建立一個堅固的事件基礎(chǔ),從技術(shù)平臺來講,我們是怎么樣能夠去眾多的基礎(chǔ)架構(gòu)事件當(dāng)中進(jìn)行高效地處 理。根據(jù)我們的經(jīng)驗,在一個類似于一個省的規(guī)模的網(wǎng)絡(luò) 當(dāng)中,即使僅僅是網(wǎng)絡(luò)的一個專業(yè)領(lǐng)域一天的事件量,大 概是在幾十萬條左右。這是我們很多用戶一起建設(shè)當(dāng)中做 的統(tǒng)計數(shù)據(jù),如何讓這幾十萬條的數(shù)據(jù)發(fā)生之后,實際上 真正影響到運維、影響到業(yè)務(wù)事件的氛圍并不多。我們怎 么樣在這些事件當(dāng)中抽取出對我們業(yè)務(wù)真正有影響的事 件,并對其進(jìn)行處理。所以這方面我們特別強調(diào)如何建立 一個堅固事件的基礎(chǔ),在一個平臺上,能夠以高效地方式 對它進(jìn)行處理。在建立事件基礎(chǔ),事件量非常大,如果所有的事件都原始 移過來都
12、不行,這樣的話,許多進(jìn)行事件的自動壓縮。我 想強調(diào),這樣的壓縮是不是可以從企業(yè)的需求出發(fā)做定制, 不是說把原來的丟掉了進(jìn)行壓縮。建立堅固事件的基礎(chǔ)還有一部分是我們不需要說某個交換 機(jī)的某個交換端口宕了,我們會進(jìn)行什么影響,我們從事件分析、 關(guān)聯(lián)機(jī)制也好,我們需要從最基礎(chǔ)的IT 事件告訴我們。比如說是某一個營業(yè)部發(fā)生了中斷,這樣的信息會比某一個斷口出現(xiàn)了端口宕這樣的信息。不管是對于IT來講,怎么判斷優(yōu)先級,以及業(yè)務(wù)來講,都要有可視化。從我們的目標(biāo)來講,盡可能地采集更多的事件,但是從紛繁復(fù)雜的事件進(jìn)行分析,告訴我們真正跟業(yè)務(wù)相關(guān)聯(lián)的事件是什么,這些跟業(yè)務(wù)關(guān)聯(lián)產(chǎn)生的事件,才是我們運維過程當(dāng)中需要核心
13、地處理和解決的問題。這是第一個方面建立一個堅固的事件基礎(chǔ)。第二個方面,我們怎么樣從我們各個基礎(chǔ)當(dāng)中做性能的分析支持我們的性能管理、后續(xù)的容量規(guī)劃能力上的管理。這個地方舉了兩個例子,一個是基于基線的性能分析,不是每一個單次、單點的分析,而是從我們整個的業(yè)務(wù)歷史表現(xiàn)看。比如說金融業(yè)來講,像網(wǎng)銀的表現(xiàn),每周一到星期天,以及每天的Array 點到 5 點,整個的流量變化趨勢是不一樣的。我們通過基線的分析,我們怎么樣去獲得優(yōu)化現(xiàn)在系統(tǒng)的容量,以及現(xiàn)在的系統(tǒng)容量是否能夠支持業(yè)務(wù)不斷增長的需要。在性能分析這部分,我們要進(jìn)行一個預(yù)測,我們要從單獨的組件,和整個業(yè)務(wù)應(yīng)用組件的組合里面,我們分析現(xiàn)在提供的容量和性
14、能是不是能夠滿足我們整個業(yè)務(wù)增長的需要。然后大概會在什么點的時候,如果當(dāng)我們的業(yè)務(wù)增長到什么規(guī)模,我現(xiàn)在的IT 基礎(chǔ)架構(gòu)要進(jìn)行擴(kuò)容和升級,這樣的話,我們做預(yù)先的計劃,避免當(dāng)業(yè)務(wù)的快速增長,而使我們的IT 系統(tǒng)造成對業(yè)務(wù)增長的瓶頸。第三個實踐方面來講,怎么樣去了解我們整個的IT 的資產(chǎn)包括我們的網(wǎng)絡(luò)、應(yīng)用、應(yīng)用之間的關(guān)系等等,包括網(wǎng)絡(luò)之間的關(guān)系,從而對我們整個的IT 資產(chǎn)實施控制,并為優(yōu)化地使用提供一個基礎(chǔ)。這是一些例子,關(guān)于 IT 的資產(chǎn)的報表。我們要去了解我們當(dāng)前的使用率是多少,是不是有閑置的,是不是我們的容量。這部分的話,我們會去協(xié)同我們剛才談到的容量的分析,為我們規(guī)劃未來IT 的服務(wù)對業(yè)
15、務(wù)的支撐能力提供基礎(chǔ)。第四個方面,從子系統(tǒng)的管理來講,是怎么樣建立一個流程化的平臺,使大家日常運維的工作可以在流程化的平臺上來進(jìn)行一個可效的實施,所有的運維人員都會定義他的運維角色和運維的職責(zé),最后通過流程化的平臺去履行他運維上的一些要求。這是一些視圖的呈現(xiàn),下面還有一個視圖。在這個地方,前面我們的演講里面也聽到了我們怎么樣對一些績效等等進(jìn)行考量,現(xiàn)在我們看到的視圖,整個故障發(fā)生持續(xù)狀態(tài)的實時的視圖。我們再回憶一下剛才談到金字塔的服務(wù)模型,剛才我們講了最基礎(chǔ)的一部分,也就是說整個IT 專業(yè)領(lǐng)域的管理,以及在這個專業(yè)領(lǐng)域管理上的運維目標(biāo)。有兩點,一個是怎么樣保證整個系統(tǒng)的可控性。第二個是對系統(tǒng)進(jìn)
16、行評估和分析規(guī)劃未來的發(fā)展。另一方面除了兩個運維目標(biāo)來講,跟大家分享了一些在國內(nèi)的建設(shè)當(dāng)中,我們比較多的四個 方面的實踐,建立一個可視化的視圖,以及建立一個非常 好的事件的基礎(chǔ),進(jìn)行性能和容量的分析。最后是說建立 流程化的平臺保證運維可以在一個企業(yè)所要求的一些制度 的環(huán)境下面進(jìn)行非常良好地運行。在后面這部分內(nèi)容里面, 我們會講我們上面的兩層。剛才這部分,我們更多地去看 怎么樣做基礎(chǔ)架構(gòu)的運維,后面來講,我們偏重于怎么樣 把基礎(chǔ)架構(gòu)的運維跟我們的業(yè)務(wù)目標(biāo)來進(jìn)行結(jié)合,最終為我們的業(yè)務(wù)來服務(wù)?,F(xiàn)在大家看到的這張總結(jié)的片子,是說我們對整個會聚管理,就剛才中間的這層,實際上當(dāng)我在講基礎(chǔ)架構(gòu)的各個專業(yè)子系
17、統(tǒng)的管理的時候,大家有一些疑問了,網(wǎng)絡(luò)只看網(wǎng)絡(luò)的,系統(tǒng)只看系統(tǒng)的,應(yīng)用只看應(yīng)用的,存儲只看存儲的,誰來看業(yè)務(wù),誰來對整個的業(yè)務(wù)目標(biāo)負(fù)責(zé),以及保證 IT 運維真正是實現(xiàn)業(yè)務(wù)目標(biāo)的,所以我們要做后面的事情。第一步我們所談到的是做一個會聚的運維管理,在這個管理里面,不管是網(wǎng)絡(luò)的、存儲的、主機(jī)的開放平臺、系統(tǒng)、應(yīng)用、語音等等各個環(huán)境子系統(tǒng)的數(shù)據(jù),實際上是需要送到會聚的平臺,由會聚的平臺進(jìn)行處理,最終實現(xiàn)業(yè)務(wù)目標(biāo)建立我們的服務(wù)模型來服務(wù)。在這個會聚的平臺里面,我們在這個地方也總結(jié)了它的一些運維目標(biāo)。這個時候,我們要做集中的IT 運維管理,不再是網(wǎng)絡(luò)看網(wǎng)絡(luò)、系統(tǒng)看系統(tǒng),網(wǎng)絡(luò)和系統(tǒng)的運維人員在整個體系當(dāng)中變
18、成了二線,在一線來講,我們要看整個IT的狀態(tài),以及對當(dāng)前的IT 的運維來進(jìn)行一個快速響應(yīng)。在這方面來講,我們也總結(jié)了一些成功的建設(shè)實踐,是建立一個整合的事件平臺,這個時候不是面向?qū)I(yè)的子領(lǐng)域的,是面向整個基礎(chǔ)架構(gòu)的整合平臺,以及如何進(jìn)行一些可視化的方式來去看現(xiàn)在的IT 基礎(chǔ)架構(gòu)的狀態(tài),以及現(xiàn)在業(yè)務(wù)的運行狀態(tài)。基于我們現(xiàn)在所談到的一個剛才講了基礎(chǔ)架構(gòu)自身的管理問題,會聚的運維平臺,我們最終是要實現(xiàn)一個更高的目標(biāo)是怎么樣進(jìn)行一個業(yè)務(wù)服務(wù)的管理。在這個地方來講,我們現(xiàn)在看到這張圖跟大家看到基礎(chǔ)架構(gòu)管理的圖非常類似。最下面是我們整個基礎(chǔ)架構(gòu)的內(nèi)容,在基礎(chǔ)架構(gòu)的內(nèi)容來講,我們要通過一些基礎(chǔ)手段對整個數(shù)據(jù)
19、進(jìn)行采集,包括依賴關(guān)系的采集、事件性能的采集、數(shù)據(jù)的采集,其他第三方的數(shù)據(jù)的采集。不管是從業(yè)務(wù)部門看可視化的視圖,還是業(yè)務(wù)部門來看關(guān)注的不僅僅是我們IT 提供的指標(biāo),可能還包括業(yè)務(wù)的基礎(chǔ)指標(biāo),比如說當(dāng)前的環(huán)境下,某一個核心的業(yè)務(wù)吞吐量是什么。所以大家會看到,我們在整個體系管理的時候,大家可以認(rèn)為,前面兩部分是談IT 的數(shù)據(jù), 這邊的數(shù)據(jù)不僅僅是來自IT 系統(tǒng)自身的數(shù)據(jù),還會來自于業(yè)務(wù)系統(tǒng)的數(shù)據(jù)。這些數(shù)據(jù)搜集到之后,我們需要對他們進(jìn)行服務(wù)關(guān)聯(lián)和服務(wù)化。我們怎么樣建立可視化的視圖,它的一些詳細(xì)的情況是什么,業(yè)務(wù)人員所關(guān)注的業(yè)務(wù)的指標(biāo)、當(dāng)前的狀態(tài)是什么,IT 運維的主管領(lǐng)導(dǎo)所關(guān)心的運維指標(biāo)是什么,以
20、及詳細(xì)的運維人員關(guān)注的運維信息又是什么,我們怎么樣去獲得,怎么樣去處理,最終保證我們?nèi)崿F(xiàn)我們的服務(wù)管理的最終的目標(biāo)。在這里,我給了大家一個事例,這個事例看起來是從一個事件的角度我們嘗試去關(guān)注一個基礎(chǔ)架構(gòu)的問題,怎么樣跟我們的業(yè)務(wù)進(jìn)行關(guān)聯(lián)的。在這個事例當(dāng)中,我們看到最上面的事件,從基礎(chǔ)架構(gòu)搜集過來的事件,是發(fā)生在一個服務(wù)器的名字叫做ERP-APP-01是利用率超高的事件,這是 原始的。我們忽略了中間很多傳統(tǒng)的事件,看到最后,可視化的系統(tǒng)告訴了我們什么樣的信息。他告訴我們CPU更用率超高的事件,導(dǎo)致了應(yīng)用服務(wù)器速度的下降,而應(yīng)用服務(wù)器是ERP勺關(guān)鍵組件,它又支持了應(yīng)用,最后,實際 上還在告訴你一
21、些結(jié)論,因為CPU應(yīng)用服務(wù)的下降,導(dǎo)致超過了 1 個 Min 的損失,即使是這樣的事件。先不看對整個高層領(lǐng)導(dǎo)有影響,業(yè)務(wù)人員最后只關(guān)注這一點,我的影響是什么。但是對我們的IT 運維人員來講,這樣的信息非常有意義。我們看到了這些信息我們怎么做我們運維的優(yōu)先級的劃分,我們肯定是能做出來的。這個PPT里面講了怎么樣從第一步到我們現(xiàn)在所看到的業(yè)務(wù)信息的一步中間的一些過程,因為時間的關(guān)系不詳細(xì)做解釋,怎么樣做規(guī)范化、豐富、怎么樣從外部的數(shù)據(jù)當(dāng)中獲得關(guān)聯(lián),最終從一個簡單的信息告訴我們業(yè)務(wù)影響的關(guān)系,怎么樣去做不是我們今天的重點,如果有機(jī)會以后希望能夠跟大家做一些詳細(xì)地細(xì)節(jié)地溝通。我們實際上已經(jīng)從一個事例的
22、角度來看了一下IT 的基礎(chǔ)架構(gòu)跟業(yè)務(wù)之間關(guān)聯(lián)關(guān)系地一角。我們怎么樣來建立一個IT 的基礎(chǔ)架構(gòu)跟IT 之間的關(guān)聯(lián),首先要了解一件事情,現(xiàn)在大家看到左下角基礎(chǔ)架構(gòu)正在發(fā)生什么事情,我們知道發(fā)生了什么事情之后,我們需要采取什么樣的行動做解決,以及這些事情是如何影響到了業(yè)務(wù)。我們把這樣的一個從基礎(chǔ)架構(gòu)的事件的發(fā)生到對業(yè)務(wù)的影響,以及實現(xiàn)我們整個業(yè)務(wù)管理的目標(biāo),我們把它分解為6 個步驟,或者是叫做6 大方面可能會更合適。第一部分是監(jiān)控,監(jiān)控所要實施的主要的目標(biāo)是如何去獲知基礎(chǔ)架構(gòu)現(xiàn)在發(fā)生了什么。第二個步驟是體驗,我除了從監(jiān)控的這個角度上能夠獲取這樣的數(shù)據(jù)之外,我還要知道我們現(xiàn)在的一些應(yīng)用的最終的用戶,他
23、對整個應(yīng)用的體驗是什么,很有可能從基礎(chǔ)架構(gòu)看網(wǎng)絡(luò)、主機(jī)等設(shè)備都是好的,但是有一個問題,用戶訪問這個業(yè)務(wù)訪問不了,或者是非常慢。第二個來講,我們怎么樣看最終用戶或者是IT 的應(yīng)用,我們的業(yè)務(wù)的用戶他的體現(xiàn)。第三個部分是他們之間的依賴關(guān)系,大家回憶一下我講的例子,從簡單的CPU®標(biāo)的事件,到我們整個業(yè)務(wù)詳細(xì)的信息。這塊來講, 如果沒有跟業(yè)務(wù)依賴關(guān)系的關(guān)聯(lián)我們是沒有辦法實現(xiàn)的。這部分來講,有一部分非常重要的是依賴關(guān)系,除了支持可視化的分析之外,還在支持其他方面。第四大方面非常重要的是業(yè)務(wù)指標(biāo),哪些業(yè)務(wù)指標(biāo)是被關(guān)注的,以及IT的基礎(chǔ)架構(gòu)的事件問題,IT 對業(yè)務(wù)指標(biāo)的影響是什么。第五個非常大的
24、方面是視圖,在視圖里面分為兩種,一種是面向業(yè)務(wù)的,另外一種是從IT 的運維來看的運維的視圖。第六步我們叫做行動,包括我們在剛才講的三化當(dāng)中,非常重要的最后的一化自動化。我對這 6 個步驟給大家做一個更詳盡地分解。第一個步驟是監(jiān)視我們服務(wù)的基礎(chǔ)架構(gòu),這個服務(wù)架構(gòu)內(nèi)容里面就包括我們事件從終端用戶來講,安全、網(wǎng)絡(luò)等等過來的基礎(chǔ) 事件。最終通過服務(wù)架構(gòu)監(jiān)控可以看到我們右邊的視圖。 大家看到我右邊的視圖服務(wù)模型已經(jīng)出來了,這塊對基礎(chǔ) 架構(gòu)的監(jiān)控你所能夠看到的只是右上角視圖的左邊的部 分,只能看到發(fā)生了什么,不能準(zhǔn)確獲知發(fā)生的信息跟我 們整個業(yè)務(wù)之間的關(guān)系是什么。現(xiàn)在大家認(rèn)為業(yè)務(wù)模型這 部分對大家來講是不
25、可見的。第二個步驟來講,衡量用戶體驗,主動的探測和主動的用戶體現(xiàn)仿真去獲得我們用戶體現(xiàn)的數(shù)據(jù)。第三個步驟來講,看到整個服務(wù)的依賴關(guān)系,第一個步驟我們只是看到了這張圖的左邊的這部分,IT 的基礎(chǔ)架構(gòu)發(fā)生了什么,而這張,我們做到這樣的步驟來講,實際上整個基礎(chǔ)架構(gòu)之間的關(guān)系,不僅僅是物理連接關(guān)系。而是他們怎么樣支撐我們的應(yīng)用關(guān)系、業(yè)務(wù)關(guān)系,我們可以建立出這樣的服務(wù)模型。當(dāng)我們建立這樣的服務(wù)模型之后,我們的基礎(chǔ)架構(gòu)發(fā)生的事情就可以跟我們的服務(wù)模型進(jìn)行匹配了。第四個步驟當(dāng)中,我們?nèi)タ锤覀儤I(yè)務(wù)相關(guān)的關(guān)鍵的性能的指標(biāo),在查看這些關(guān)鍵性能指標(biāo)里面,我需要強調(diào)的是一個是我們從IT 的角度看我們的應(yīng)能指標(biāo),還要
26、從業(yè)務(wù)來看,包括吞吐量。有一些用戶做了這樣的工作,包括當(dāng)前的 IT 基礎(chǔ)架構(gòu)的性能指標(biāo),跟用戶的數(shù)據(jù)基礎(chǔ)指標(biāo)像吞吐量、 在線交易量,放在一起做分析,去看 IT 基礎(chǔ)架構(gòu)的指標(biāo)是怎么樣對用戶的業(yè)務(wù)指標(biāo)產(chǎn)生影響的。第五個方面來講,我們這些數(shù)據(jù)都有了,我們怎么樣通過非常好的可視化的方法來提供我們服務(wù)的視圖。在這里給了大家一些服務(wù)視圖的事例,這是不同層次的視圖。我們看到了全局的視圖,告訴了我們整個子系統(tǒng)的狀態(tài)和應(yīng)用的狀態(tài)。 每個子系統(tǒng)內(nèi)部的狀態(tài),像這樣的一些視圖來講,更偏向于IT 運維的視圖。我當(dāng)前的事件是什么,以及當(dāng)前的事件對我們應(yīng)用的影響情況是什么。這是基于服務(wù)的一些視圖, 我們 IT 環(huán)境當(dāng)中幫
27、助臺的情況,服務(wù)水平的合規(guī)情況,以及詳細(xì)的整個接觸架構(gòu)關(guān)系的報表情況等等。這是最后一步實施自動化,我需要再強調(diào)一下,自動化不僅僅是我們很容易去理解的自動部署、自動容量、自動探測, 實際上自動化是說在我們整個IT 服務(wù)管理當(dāng)中,是貫穿始終的,你會發(fā)現(xiàn)會貫穿于各個部門的,在其他五個方面都會出現(xiàn)。最后,可能我就再做一下總結(jié),剛才我們主要是從三個層面,首先介紹了舊M服務(wù)管理的三個方面,還有剛才講到的可視化、可控化、自動化等等三個方面。還有一部分,從整個基礎(chǔ)架構(gòu)管理到IT 服務(wù)管理漸進(jìn)的層次來講,給大家介紹了在IT 服務(wù)管理的一些實踐,大家有其他的問題,在會議之后可以進(jìn)行進(jìn)一步地溝通。非常感謝大家的寶貴
28、時間,謝謝。劉靜:非常榮幸今天有機(jī)會在這里跟大家一起探討一IT服務(wù)管理的實踐。實際上從IT 服務(wù)管理的發(fā)展來看,大家在做各種各樣的實踐, 包括在建設(shè)按照ITLI 的最佳實際,結(jié)合國內(nèi)的實際情況來建設(shè)相關(guān)的相關(guān)管理流程,而且不斷地使這樣的管理流程走向更加成熟。即使是這樣,我們?nèi)匀话l(fā)現(xiàn),好象持續(xù)在做這些管理流程的一些實施的話,在我們整個的過程當(dāng)中仍然碰到了困難。比如說我們很難看到一個跟業(yè)務(wù)相關(guān)的視圖,比如說我們說在支持IT 業(yè)務(wù)的運維和發(fā)展,我們怎麼樣看到跟IT 業(yè)務(wù)相關(guān)視圖以及業(yè)務(wù)的可持續(xù)化,是我們很難解決的問題。如何利用自動化的驅(qū)動來降低整個的費用,提高服務(wù)的提供和整個服務(wù)的質(zhì)量,保證快速地實
29、施。以及面臨現(xiàn)在不管是應(yīng)用環(huán)境還是IT 自身的架構(gòu)建設(shè)也好,我們面臨了不斷更新的技術(shù)和服務(wù)的發(fā)展。在面臨這樣的服務(wù)和技術(shù)發(fā)展的時候,如何進(jìn)行創(chuàng)新?我們今天的內(nèi)容就IT 服務(wù)管理的一些實踐跟大家交流。首先,這是大家都很熟悉的Gartner 關(guān)於 IT 成熟度的模型,從目前我們國內(nèi)的用戶來講,大家都處在一些被動式的管理,有一部分用戶在於主動式或者是面向服務(wù)的管理,或者是第二層次、第三層次做了工作。比如說主動的監(jiān)控,嘗試做一些容量和能力的規(guī)劃方面的工作。我們來看,從我們最終的IT 的管理怎麼樣去面向IT 服務(wù)的管理來講的,舊M的服務(wù)管理提出三個主要的思想,第一個主要的思想是怎麼樣實現(xiàn)一個可視化,這是
30、我們在一開始談到的問題。如何能夠把IT 跟我們業(yè)務(wù)之間的關(guān)系,以及對業(yè)務(wù)之間的支持,我們能夠用可視化的方式看到,能夠評估、測量,并且能夠支持我們?nèi)粘5倪\維。第二個方面,我們把它總結(jié)為可控化,我們怎麼樣去了解我們現(xiàn)在所有的IT 的資產(chǎn),在這些IT 的資產(chǎn)如何來支持我們?nèi)粘5倪\維,以及 IT 的資產(chǎn)我們?nèi)绾稳λ鲆粋€更重復(fù)地使用,和對他進(jìn)行一個更高效地利用,從而減輕我們的成本和提高我們的服務(wù)質(zhì)量,并且降低在管理過程當(dāng)中的風(fēng)險。第三個問題是自動化,在自動化這點上,我們不是說要有什麼樣的產(chǎn)品,或者是在IT 管理建設(shè)服務(wù)某一個點上實施自動化,幫助我們提高效率。從自動化來講,不管是可視化、可控化都貫穿在
31、整個管理的過程當(dāng)中。自動化我們提供流程的自動化怎麼實現(xiàn),包括實現(xiàn)運維我們做自動化的部署、監(jiān)控,在整個監(jiān)控的方面,怎麼樣去實施自動化,來提高我們的生產(chǎn)效率。首先從可視化這個目標(biāo)來講,我們需要去洞察業(yè)務(wù),我們需要去了解,現(xiàn)在的業(yè)務(wù)的狀態(tài)是什麼,我們的 IT 是怎麼樣去支持我們的業(yè)務(wù)的,直接能夠從我們的IT 業(yè)務(wù)的支持上面看到可交付的目標(biāo)。從我們的解決方案來講,我們需要提供實時的視圖和實時的dashboard ,包括我們從業(yè)務(wù)合規(guī)、運維整個了解現(xiàn)在資產(chǎn)的管理所需要的可用性,以及這個可用性是不是很好地實現(xiàn)了我們的業(yè)務(wù)目標(biāo)。在我們的右邊是給了大家一些可視化的視圖,彳爰面我們就這些可視化的內(nèi)容進(jìn)行展開溝通
32、。第二個部門可控化,剛才已經(jīng)談到了主要的核心思想是我們怎麼樣能夠提供一個完善的控制,能夠去了解到我們的現(xiàn)有的 IT 資產(chǎn)以及如何對我們的IT 資產(chǎn)進(jìn)行優(yōu)化的利用。在講到可控化這部分,大家會想是不是講我們IT 資產(chǎn)的管理,以及從ITLI來講,更側(cè)重於CMD這樣的管理,從彳爰 面整個運維的角度來講,可控化對IT資產(chǎn)、CMDB勺管理, 不是在資產(chǎn)本身提供一個高效地利用率、管控也好,實際上對我們的運維過程怎麼樣實現(xiàn)可視化,怎麼樣把紛繁復(fù)雜的基礎(chǔ)架構(gòu)的事件、問題能夠可視化變成業(yè)務(wù)影響。它在這部分來講,提供了非常好的業(yè)務(wù)的技術(shù)支持。最彳爰是自動化,將敏捷性融入到我們的運維當(dāng)中,幫助我們快速地實現(xiàn)運維的目標(biāo)
33、。剛才我們從 舊M服務(wù)管理三個比較核心的思想和觀點,從我們的實踐來講,大家會想到我們現(xiàn)在面臨的是非常復(fù)雜的 IT 的架構(gòu)。 在我們這張圖下面,大家可能看到的是在我們下面的這部分,不管是從我們的主機(jī)、開放平臺、應(yīng)用、網(wǎng)絡(luò)、 語音、 傳輸?shù)鹊日麄€IT 的基礎(chǔ)架構(gòu)。這是我們現(xiàn)在面臨的,從IT 的視角看。從業(yè)務(wù)視角看的話,我所需要的是一個業(yè)務(wù)的交付,從銀行業(yè)來看,我需要的是網(wǎng)上銀行能夠提供我們所承諾的服務(wù)級別,能夠在我們用戶所期望,業(yè)務(wù)目標(biāo)所定義的一些響應(yīng)時間也好,是在指標(biāo)之內(nèi)對我們廣大的用戶,是對業(yè)務(wù)的用戶提供服務(wù)。我們現(xiàn)在IT 和業(yè)務(wù)之間,我們怎麼樣來建立這種聯(lián)系,以及怎麼樣實現(xiàn)運維,這是我們給出
34、的一個實踐的模型。在這樣實踐的模型當(dāng)中,主要的部分是三個層次,在金字塔模型最上端,是我們的業(yè)務(wù)所要實施的整個業(yè)務(wù)的管理。在中間的層次是一個會聚的運維的管理。下面這個層次來講, 是我們熟悉地傳統(tǒng)IT 的管理領(lǐng)域。我們定義為一個技術(shù)的專業(yè)領(lǐng)域的管理,包括對應(yīng)用、網(wǎng)絡(luò)、主機(jī)、安全、開放平臺、存儲等等的各個支持我們的IT 基礎(chǔ)架構(gòu)的整個環(huán)境的各個專業(yè)領(lǐng)域的管理。我分了兩部分探討,一部分我們會側(cè)重於在講,根據(jù)我們現(xiàn)在運維的環(huán)境,我們怎麼樣在基礎(chǔ)架構(gòu)的層次做技術(shù)領(lǐng) 域的專業(yè)的管理。另外一部分,探討怎麼樣面向業(yè)務(wù)服務(wù) 的管理。首先,我們從大家非常熟悉的領(lǐng)域開始,面向一個專業(yè)技 術(shù)領(lǐng)域的管理。當(dāng)我們回到各個專
35、業(yè)技術(shù)領(lǐng)域,回到網(wǎng)絡(luò)、 應(yīng)用、存儲等等這些領(lǐng)域的時候,我們來看這個領(lǐng)域當(dāng)中, 我們的運維目標(biāo)是什麼??赡茏鳛橐粋€網(wǎng)絡(luò)部門的領(lǐng)導(dǎo)、 員工來講,我們似乎是說很難去把我們的網(wǎng)絡(luò)跟業(yè)務(wù)之間 做一個非常好的很一致、完全的對應(yīng)。因為網(wǎng)絡(luò)支持著很 多的應(yīng)用的運行,和我們商業(yè)的運行,在這樣的情況下, 我們從我們的運維目標(biāo)來看,作為我們系統(tǒng)專業(yè)的領(lǐng)域, 我們的運維目標(biāo)是什麼。在這個地方,我們總結(jié)了兩個方 面的運維目標(biāo)。首先,運維目標(biāo)是要保證我們的系統(tǒng)可用性。一談到可用 性,大家會談到,我們怎麼樣去實現(xiàn)一個高可用性,我的 可用性的能力是什麼。這個地方我們定義是我們系統(tǒng)的可 用性目標(biāo)是滿足我們的業(yè)務(wù)要求的。其次從運
36、維的角度來 講,我們有非常重要的目標(biāo)是在整個系統(tǒng)的生命周期的建 設(shè)過程當(dāng)中,如何利用這樣科學(xué)的數(shù)據(jù)的分析,來支持整 個系統(tǒng)的持續(xù)地發(fā)展。這是從技術(shù)的專業(yè)領(lǐng)域來講的運維 目標(biāo),從現(xiàn)在不管是國內(nèi)、國外,大家在技術(shù)領(lǐng)域的專業(yè) 的管理領(lǐng)域里面,大家的一些成功的實踐來講,我們主要 分為下面四個方面。第一個方面我們?nèi)ヌ峁┝艘粋€可視化地監(jiān)控,或者說我們提供了可視化的視圖。第二個方面是提供一個很堅固的事件基礎(chǔ),這是非常核心的一部分。參考業(yè)務(wù)影響關(guān)系定義鼓掌分類或級別,以及我們要采取什麼措施盡量減輕或者是消除、預(yù)防這些能帶來的影響。第三個方面是對所專注的這個基礎(chǔ)架構(gòu)領(lǐng)域,它的運行的數(shù)據(jù)全面的分析,這些分析是我們
37、要定義哪些我們的 KPI。這些KPI它的運行的績效是怎麼支撐業(yè)務(wù)的。第四個是建立流程化的管理平臺,支持運維靈活的要求。從這個層次來講,包括我們跟國內(nèi)很多的用戶來做一些運維方面的工作,在建設(shè)的過程當(dāng)中有很深的體會,有可能你建了非常好的網(wǎng)絡(luò)管理系統(tǒng)、主機(jī)管理系統(tǒng)、存儲管理系統(tǒng)或者是其他基礎(chǔ)架構(gòu)的管理子系統(tǒng)。但是會發(fā)現(xiàn),這個系統(tǒng)很難在良性的環(huán)境下做持續(xù)地更新地滿足我們的運維要求。實際上這方面通常存在的問題是我們只是構(gòu)建這個技術(shù)平臺,我們并沒有去對如何讓這個技術(shù)平臺保證我們的業(yè)務(wù)目標(biāo),實現(xiàn)我們的IT 運維目標(biāo)這方面做相關(guān)的制 度、流程化的支持,去使這個技術(shù)平臺如何最大限度地去 發(fā)揮它的作用。首先是建立
38、一個堅固的事件基礎(chǔ),從技術(shù)平臺來講,我們 是怎麼樣能夠去眾多的基礎(chǔ)架構(gòu)事件當(dāng)中進(jìn)行高效地處 理。根據(jù)我們的經(jīng)驗,在一個類似於一個省的規(guī)模的網(wǎng)絡(luò) 當(dāng)中,即使僅僅是網(wǎng)絡(luò)的一個專業(yè)領(lǐng)域一天的事件量,大 概是在幾十萬條左右。這是我們很多用戶一起建設(shè)當(dāng)中做 的統(tǒng)計數(shù)據(jù),如何讓這幾十萬條的數(shù)據(jù)發(fā)生之彳爰,實際上 真正影響到運維、影響到業(yè)務(wù)事件的氛圍并不多。我們怎 麼樣在這些事件當(dāng)中抽取出對我們業(yè)務(wù)真正有影響的事 件,并對其進(jìn)行處理。所以這方面我們特別強調(diào)如何建立 一個堅固事件的基礎(chǔ),在一個平臺上,能夠以高效地方式 對它進(jìn)行處理。在建立事件基礎(chǔ),事件量非常大,如果所有的事件都原始 移過來都不行,這樣的話,許
39、多進(jìn)行事件的自動壓縮。我 想強調(diào),這樣的壓縮是不是可以從企業(yè)的需求出發(fā)做定制, 不是說把原來的丟掉了進(jìn)行壓縮。建立堅固事件的基礎(chǔ)還有一部分是我們不需要說某個交換機(jī)的某個交換端口宕了,我們會進(jìn)行什麼影響,我們從事件分析、 關(guān)聯(lián)機(jī)制也好,我們需要從最基礎(chǔ)的IT 事件告訴我們。比如說是某一個營業(yè)部發(fā)生了中斷,這樣的信息會比某一個斷口出現(xiàn)了端口宕這樣的信息。不管是對於IT來講,怎麼判斷優(yōu)先級,以及業(yè)務(wù)來講,都要有可視化。從我們的目標(biāo)來講,盡可能地采集更多的事件,但是從紛繁復(fù)雜的事件進(jìn)行分析,告訴我們真正跟業(yè)務(wù)相關(guān)聯(lián)的事 件是什麼,這些跟業(yè)務(wù)關(guān)聯(lián)產(chǎn)生的事件,才是我們運維過 程當(dāng)中需要核心地處理和解決的問
40、題。這是第一個方面建 立一個堅固的事件基礎(chǔ)。第二個方面,我們怎麼樣從我們各個基礎(chǔ)當(dāng)中做性能的分 析支持我們的性能管理、彳爰續(xù)的容量規(guī)劃能力上的管理。 這個地方舉了兩個例子,一個是基於基線的性能分析,不 是每一個單次、單點的分析,而是從我們整個的業(yè)務(wù)歷史表現(xiàn)看。比如說金融業(yè)來講,像網(wǎng)銀的表現(xiàn),每周一到星期天,以及每天的Array 點到 5 點,整個的流量變化趨勢是不一樣的。我們通過基線的分析,我們怎麼樣去獲得優(yōu)化現(xiàn)在系統(tǒng)的容量,以及現(xiàn)在的系統(tǒng)容量是否能夠支持業(yè)務(wù)不斷增長的需要。在性能分析這部分,我們要進(jìn)行一個預(yù)測,我們要從單獨的組件,和整個業(yè)務(wù)應(yīng)用組件的組合里面,我們分析現(xiàn)在提供的容量和性能是不
41、是能夠滿足我們整個業(yè)務(wù)增長的需要。然彳爰大概會在什麼點的時候,如果當(dāng)我們的業(yè)務(wù)增長到什麼規(guī)模,我現(xiàn)在的IT 基礎(chǔ)架構(gòu)要進(jìn)行擴(kuò)容和升級,這樣的話,我們做預(yù)先的計劃,避免當(dāng)業(yè)務(wù)的快速增長,而使我們的IT 系統(tǒng)造成對業(yè)務(wù)增長的瓶頸。第三個實踐方面來講,怎麼樣去了解我們整個的IT 的資產(chǎn)包括我們的網(wǎng)絡(luò)、應(yīng)用、應(yīng)用之間的關(guān)系等等,包括網(wǎng)絡(luò)之間的關(guān)系,從而對我們整個的IT 資產(chǎn)實施控制,并為優(yōu)化地使用提供一個基礎(chǔ)。這是一些例子,關(guān)於 IT 的資產(chǎn)的報表。我們要去了解我們當(dāng)前的使用率是多少,是不是有閑置的,是不是我們的容量。這部分的話,我們會去協(xié)同我們剛才談到的容量的分析,為我們規(guī)劃未來IT 的服務(wù)對業(yè)務(wù)的
42、支撐能力提供基礎(chǔ)。第四個方面,從子系統(tǒng)的管理來講,是怎麼樣建立一個流程化的平臺,使大家日常運維的工作可以在流程化的平臺上來進(jìn)行一個可效的實施,所有的運維人員都會定義他的運維角色和運維的職責(zé),最彳爰通過流程化的平臺去履行他運維上的一些要求。這是一些視圖的呈現(xiàn),下面還有一個視圖。在這個地方,前面我們的演講里面也聽到了我們怎麼樣對一些績效等等進(jìn)行考量,現(xiàn)在我們看到的視圖,整個故障發(fā)生持續(xù)狀態(tài)的實時的視圖。我們再回憶一下剛才談到金字塔的服務(wù)模型,剛才我們講了最基礎(chǔ)的一部分,也就是說整個IT 專業(yè)領(lǐng)域的管理,以 及在這個專業(yè)領(lǐng)域管理上的運維目標(biāo)。有兩點,一個是怎 麼樣保證整個系統(tǒng)的可控性。第二個是對系統(tǒng)
43、進(jìn)行評估和 分析規(guī)劃未來的發(fā)展。另一方面除了兩個運維目標(biāo)來講, 跟大家分享了一些在國內(nèi)的建設(shè)當(dāng)中,我們比較多的四個 方面的實踐,建立一個可視化的視圖,以及建立一個非常 好的事件的基礎(chǔ),進(jìn)行性能和容量的分析。最彳麥?zhǔn)钦f建立 流程化的平臺保證運維可以在一個企業(yè)所要求的一些制度 的環(huán)境下面進(jìn)行非常良好地運行。在彳爰面這部分內(nèi)容里面, 我們會講我們上面的兩層。剛才這部分,我們更多地去看 怎麼樣做基礎(chǔ)架構(gòu)的運維,彳爰面來講,我們偏重於怎麼樣 把基礎(chǔ)架構(gòu)的運維跟我們的業(yè)務(wù)目標(biāo)來進(jìn)行結(jié)合,最終為 我們的業(yè)務(wù)來服務(wù)。現(xiàn)在大家看到的這張總結(jié)的片子,是說我們對整個會聚管 理,就剛才中間的這層,實際上當(dāng)我在講基礎(chǔ)架
44、構(gòu)的各個 專業(yè)子系統(tǒng)的管理的時候,大家有一些疑問了,網(wǎng)絡(luò)只看 網(wǎng)絡(luò)的,系統(tǒng)只看系統(tǒng)的,應(yīng)用只看應(yīng)用的,存儲只看存儲的,誰來看業(yè)務(wù),誰來對整個的業(yè)務(wù)目標(biāo)負(fù)責(zé),以及保證IT運維真正是實現(xiàn)業(yè)務(wù)目標(biāo)的,所以我們要做彳爰面的事情。第一步我們所談到的是做一個會聚的運維管理,在這個管理里面,不管是網(wǎng)絡(luò)的、存儲的、主機(jī)的開放平臺、系統(tǒng)、應(yīng)用、語音等等各個環(huán)境子系統(tǒng)的數(shù)據(jù),實際上是需要送到會聚的平臺,由會聚的平臺進(jìn)行處理,最終實現(xiàn)業(yè)務(wù)目標(biāo)建立我們的服務(wù)模型來服務(wù)。在這個會聚的平臺里面,我們在這個地方也總結(jié)了它的一些運維目標(biāo)。這個時候,我們要做集中的IT 運維管理,不再是網(wǎng)絡(luò)看網(wǎng)絡(luò)、系統(tǒng)看系統(tǒng),網(wǎng)絡(luò)和系統(tǒng)的運維人
45、員在整個體系當(dāng)中變成了二線,在一線來講,我們要看整個IT的狀態(tài),以及對當(dāng)前的IT 的運維來進(jìn)行一個快速響應(yīng)。在這方面來講,我們也總結(jié)了一些成功的建設(shè)實踐,是建立一個整合的事件平臺,這個時候不是面向?qū)I(yè)的子領(lǐng)域的,是面向整個基礎(chǔ)架構(gòu)的整合平臺,以及如何進(jìn)行一些可視化的方式來去看現(xiàn)在的IT 基礎(chǔ)架構(gòu)的狀態(tài),以及現(xiàn)在業(yè)務(wù)的運行狀態(tài)?;段覀儸F(xiàn)在所談到的一個剛才講了基礎(chǔ)架構(gòu)自身的管理問題,會聚的運維平臺,我們最終是要實現(xiàn)一個更高的目標(biāo)是怎麼樣進(jìn)行一個業(yè)務(wù)服務(wù)的管理。在這個地方來講,我們現(xiàn)在看到這張圖跟大家看到基礎(chǔ)架構(gòu)管理的圖非常類似。最下面是我們整個基礎(chǔ)架構(gòu)的內(nèi)容,在基礎(chǔ)架構(gòu)的內(nèi)容來講,我們要通過一些
46、基礎(chǔ)手段對整個數(shù)據(jù)進(jìn)行采集,包括依賴關(guān)系的采集、事件性能的采集、數(shù)據(jù)的采集,其他第三方的數(shù)據(jù)的采集。不管是從業(yè)務(wù)部門看可視化的視圖,還是業(yè)務(wù)部門來看關(guān)注的不僅僅是我們IT 提供的指標(biāo),可能還包括業(yè)務(wù)的基礎(chǔ)指標(biāo),比如說當(dāng)前的環(huán)境下,某一個核心的業(yè)務(wù)吞吐量是什麼。所以大家會看到,我們在整個體系管理的時候,大家可以認(rèn)為,前面兩部分是談IT 的數(shù)據(jù), 這邊的數(shù)據(jù)不僅僅是來自IT 系統(tǒng)自身的數(shù)據(jù),還會來自於業(yè)務(wù)系統(tǒng)的數(shù)據(jù)。這些數(shù)據(jù)搜集到之彳爰,我們需要對他們進(jìn)行服務(wù)關(guān)聯(lián)和服務(wù)化。我們怎麼樣建立可視化的視圖,它的一些詳細(xì)的情況是什麼,業(yè)務(wù)人員所關(guān)注的業(yè)務(wù)的指標(biāo)、當(dāng)前的狀態(tài)是什麼,IT 運維的主管領(lǐng)導(dǎo)所關(guān)心
47、的運維指標(biāo)是什麼,以及詳細(xì)的運維人員關(guān)注的運維信息又是什麼,我們怎麼樣去獲得,怎麼樣去處理,最終保證我們?nèi)崿F(xiàn)我們的服務(wù)管理的最終的目標(biāo)。在這里,我給了大家一個事例,這個事例看起來是從一個事件的角度我們嘗試去關(guān)注一個基礎(chǔ)架構(gòu)的問題,怎麼樣跟我們的業(yè)務(wù)進(jìn)行關(guān)聯(lián)的。在這個事例當(dāng)中,我們看到最上面的事件,從基礎(chǔ)架構(gòu)搜集過來的事件,是發(fā)生在一個服務(wù)器的名字叫做ERP-APP-01是利用率超高的事件,這是 原始的。我們忽略了中間很多傳統(tǒng)的事件,看到最彳爰,可 視化的系統(tǒng)告訴了我們什麼樣的信息。他告訴我們CPU吏用率超高的事件,導(dǎo)致了應(yīng)用服務(wù)器速度的下降,而應(yīng)用服務(wù)器是ERP勺關(guān)鍵組件,它又支持了應(yīng)用,最
48、彳爰,實際上還在告訴你一些結(jié)論,因為CPU應(yīng)用服務(wù)的下降,導(dǎo)致超過了 1 個 Min 的損失,即使是這樣的事件。先不看對整個高層領(lǐng)導(dǎo)有影響,業(yè)務(wù)人員最彳爰只關(guān)注這一點,我的影響是什麼。但是對我們的IT 運維人員來講,這樣的信息非常有意義。我們看到了這些信息我們怎麼做我們運維的優(yōu)先級的劃分,我們肯定是能做出來的。這個PPT里面講了怎麼樣從第一步到我們現(xiàn)在所看到的業(yè)務(wù)信息的一步中間的一些過程,因為時間的關(guān)系不詳細(xì)做解釋,怎麼樣做規(guī)范化、豐富、怎麼樣從外部的數(shù)據(jù)當(dāng)中獲得關(guān)聯(lián),最終從一個簡單的信息告訴我們業(yè)務(wù)影響的關(guān)系,怎麼樣去做不是我們今天的重點,如果有機(jī)會以彳爰希望能夠跟大家做一些詳細(xì)地細(xì)節(jié)地溝通。我們實際上已經(jīng)從一個事例的角度來看了一下IT 的基礎(chǔ)架構(gòu)跟業(yè)務(wù)之間關(guān)聯(lián)關(guān)系地一角。我們怎麼樣來建立一個IT 的基礎(chǔ)架構(gòu)跟IT 之間的關(guān)聯(lián),首先要了解一件事情,現(xiàn)在大家看到左下角基礎(chǔ)架構(gòu)正在發(fā)生什麼事情,我們知道發(fā)生了什麼事情之彳爰,我們需要采取什麼樣的行動做解決,以及這些事情是如何影響到了業(yè)務(wù)。我們把這樣的一個從基礎(chǔ)架構(gòu)的事件的發(fā)生到對業(yè)務(wù)的影響,以及實現(xiàn)我們整個業(yè)務(wù)管理的目標(biāo),我們把它分解為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025包頭市喜桂圖文化旅游開發(fā)有限公司招聘講解員15人筆試參考題庫附帶答案詳解
- 2025年企業(yè)安全培訓(xùn)考試試題附參考答案(完整版)
- 2025班組安全培訓(xùn)考試試題答案a4版
- 2025生產(chǎn)經(jīng)營單位安全培訓(xùn)考試試題附參考答案【黃金題型】
- 2025無線網(wǎng)絡(luò)基站租賃合同
- 2025合同自我評估示范文
- 2025上海市新全日制勞動合同書
- 2025復(fù)印機(jī)購銷合同 復(fù)印機(jī)購銷合同范本
- 2025建筑材料供貨合同模板
- 2025年房屋買賣合同范本2
- 影視標(biāo)書模板
- 2024年中國東方航空技術(shù)有限公司招聘筆試參考題庫含答案解析
- 小學(xué)生飛花令大全
- 2024年九省聯(lián)考新高考 數(shù)學(xué)試卷(含答案解析)
- Unit2-social-media-detox課件-高一英語外研版(2019)選擇性必修二
- 2023版設(shè)備管理體系標(biāo)準(zhǔn)
- 空乘 空中老幼孕乘客服務(wù)現(xiàn)狀、困難及對策分析
- 01S201室外消火栓安裝圖集
- 親子溝通主題班會課件:有效的親子溝通
- 雙語 -【白皮書】新時代的中國綠色發(fā)展
- 康復(fù)醫(yī)學(xué)科全新筆記匯總
評論
0/150
提交評論