




已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
文檔標(biāo)題問(wèn)題管理2020年1月8日1 問(wèn)題管理1.1 問(wèn)題管理的目標(biāo)問(wèn)題管理的目標(biāo)是最小化事故的不利影響以及由于IT基礎(chǔ)設(shè)施中的錯(cuò)誤造成的業(yè)務(wù)上的問(wèn)題,阻止與這些錯(cuò)誤相關(guān)的事故的重復(fù)發(fā)生。為了達(dá)到這個(gè)目標(biāo),問(wèn)題管理尋求找到事故的根本原因,采取行動(dòng)改善或糾正這種狀況。問(wèn)題管理流程具有主動(dòng)和被動(dòng)兩個(gè)方面。被動(dòng)的問(wèn)題管理關(guān)注于解決問(wèn)題以響應(yīng)一個(gè)或多個(gè)事故。主動(dòng)問(wèn)題管理關(guān)注于在事故首次出現(xiàn)前就能識(shí)別和解決問(wèn)題以及知名錯(cuò)誤。1.2 問(wèn)題管理的范圍問(wèn)題控制、錯(cuò)誤控制以及主動(dòng)問(wèn)題管理都屬于問(wèn)題管理流程的范圍。較為正式的定義是,問(wèn)題是一個(gè)或多個(gè)事故未知的底層原因,知名錯(cuò)誤是已經(jīng)成功診斷出來(lái)的問(wèn)題,并且為之定義了臨時(shí)措施。圖1 問(wèn)題管理的范圍問(wèn)題管理流程的輸入是:v 來(lái)自事故管理的事故詳細(xì)信息v 來(lái)自配置管理數(shù)據(jù)庫(kù)的詳細(xì)配置信息v 任何定義的臨時(shí)措施(來(lái)自事故管理)問(wèn)題管理的主要活動(dòng)包括:v 問(wèn)題控制v 錯(cuò)誤控制v 問(wèn)題的主動(dòng)預(yù)防v 識(shí)別問(wèn)題趨勢(shì)v 從問(wèn)題管理數(shù)據(jù)中獲得管理信息v 完成主要問(wèn)題的評(píng)估問(wèn)題管理流程的輸出:v 知名錯(cuò)誤v 變更請(qǐng)求(RFC)v 更新后的問(wèn)題記錄(包括解決方案和/或任何可用的臨時(shí)措施)v 關(guān)閉問(wèn)題記錄(對(duì)于解決的問(wèn)題)v 與問(wèn)題和知名錯(cuò)誤匹配的事故的響應(yīng)v 管理信息1.3 基本概念在事故的早期階段,能夠得到相應(yīng)的而且容易應(yīng)用的建議,對(duì)于組織有效地解決事故的能力來(lái)說(shuō),這是最重要的。服務(wù)臺(tái)接收到的事故,對(duì)于支持員工很少是初見(jiàn)的或是神秘的。相似地,處于二線(xiàn)或三線(xiàn)的支持員工中的專(zhuān)家也已經(jīng)解決了許多困難和原始事故和問(wèn)題。花費(fèi)在這些解決方案上的資源的最好使用方式就是將它制作成文檔,這樣一線(xiàn)的員工就可以應(yīng)用它們了。問(wèn)題管理流程試圖降低影響業(yè)務(wù)的事故和問(wèn)題的數(shù)量及危害,因此,問(wèn)題管理的部分職責(zé)是確保以前的信息被記錄在檔,這樣對(duì)一線(xiàn)及其它二線(xiàn)支持員工就已經(jīng)是準(zhǔn)備好可用的了。它不是簡(jiǎn)單地記錄文檔的問(wèn)題,它要求:v 信息應(yīng)該建立索引,以便根據(jù)來(lái)自新事故的簡(jiǎn)單的線(xiàn)索就能容易地查找;v 進(jìn)行例行檢查,以確保持續(xù)的文檔記錄與變更相一致:u 技術(shù)u 可用的外部解決方案u 業(yè)務(wù)實(shí)踐和需求u 內(nèi)部技巧u 重復(fù)事故的頻度和影響u 闡明內(nèi)部最佳實(shí)踐v 進(jìn)行詳細(xì)評(píng)估的流程;v 訓(xùn)練員工使用信息,理解可用信息的深度和作用,以及怎樣訪(fǎng)問(wèn)和理解信息,在提供反饋方面,信息的相關(guān)性和易于使用;v 存貯信息的知識(shí)庫(kù)典型地基于集成的服務(wù)管理工具,使得在登錄后或者在事故處理流程的初始分析階段就能使用知識(shí)。一般地使用“專(zhuān)家系統(tǒng)”軟件來(lái)發(fā)揮問(wèn)題管理流程的作用。然而,重要的是包括專(zhuān)家知識(shí),讓使用系統(tǒng)的員工根據(jù)反饋來(lái)更新:v 被識(shí)別的問(wèn)題和知名錯(cuò)誤;v 分析他們遇到的事故(被動(dòng)問(wèn)題管理);v 按時(shí)間段分析事故(主動(dòng)問(wèn)題管理);v 分析IT基礎(chǔ)架構(gòu);v 提供知識(shí)庫(kù);v 引進(jìn)新產(chǎn)品時(shí)的開(kāi)發(fā)人員和提供商。一般情況下,問(wèn)題是多個(gè)展現(xiàn)出共同特征的事故的結(jié)果。有時(shí)問(wèn)題也可以根據(jù)單個(gè)明顯的事故來(lái)識(shí)別,由單個(gè)錯(cuò)誤引起,雖然原因未知,但影響明顯。知名錯(cuò)誤是對(duì)問(wèn)題的根本原因成功診斷后識(shí)別的,后續(xù)將開(kāi)發(fā)一個(gè)臨時(shí)措施。IT基礎(chǔ)架構(gòu)的結(jié)構(gòu)化分析、來(lái)自支持軟件的報(bào)告以及用戶(hù)組會(huì)議有助于問(wèn)題和知名錯(cuò)誤的識(shí)別。這就是主動(dòng)問(wèn)題管理。問(wèn)題控制重點(diǎn)在于將問(wèn)題轉(zhuǎn)化為知名錯(cuò)誤,錯(cuò)誤控制重點(diǎn)在于通過(guò)變更管理流程結(jié)構(gòu)化地解決知名錯(cuò)誤。1.3.1 事故管理和問(wèn)題管理的不同問(wèn)題管理不同于事故管理,它的主要目標(biāo)是事故底層原因的檢測(cè),提供后續(xù)的解決方案,阻止事故的發(fā)生。在許多情況下,這個(gè)目標(biāo)可能與事故管理的目標(biāo)有直接的沖突,因?yàn)槭鹿使芾淼哪繕?biāo)是盡可能快的為客戶(hù)恢復(fù)服務(wù),經(jīng)常通過(guò)臨時(shí)措施,而不是通過(guò)徹底地解決。因此在這個(gè)方面,找到解決方案的速度是次要的。底層問(wèn)題的調(diào)查需要花費(fèi)時(shí)間,這樣會(huì)推遲服務(wù)的恢復(fù),但阻止了事故的重復(fù)發(fā)生。1.3.2 問(wèn)題控制問(wèn)題控制流程關(guān)注于以有效地方式處理問(wèn)題。問(wèn)題控制的目標(biāo)是識(shí)別根本原因,諸如存在錯(cuò)誤的配置項(xiàng),向服務(wù)臺(tái)提供可用的關(guān)于臨時(shí)措施的信息和建議。問(wèn)題控制流程很相似于,且高度依賴(lài)于事故控制流程的質(zhì)量。事故控制重點(diǎn)在于解決事故,提供臨時(shí)措施,對(duì)特定的事故臨時(shí)修復(fù)。如果對(duì)于一個(gè)或一組事故,識(shí)別出了問(wèn)題,可用的臨時(shí)措施和臨時(shí)修復(fù)應(yīng)該由問(wèn)題控制流程記錄在問(wèn)題記錄中。問(wèn)題控制流程也對(duì)問(wèn)題建議最佳的可用臨時(shí)措施。因?yàn)閱?wèn)題控制關(guān)注于阻止事故的重復(fù)發(fā)生,因此流程的方法應(yīng)該被仔細(xì)地管理和規(guī)劃。管理和規(guī)劃的程度要高于事故控制,因?yàn)樗哪繕?biāo)只是盡快地恢復(fù)正常的服務(wù)。優(yōu)先權(quán)應(yīng)該分配組那些可能引起嚴(yán)重業(yè)務(wù)中斷的問(wèn)題的解決。在事故控制中的活動(dòng)包括:v 問(wèn)題識(shí)別和記錄;v 問(wèn)題分類(lèi);v 問(wèn)題調(diào)查和診斷;1.3.3 錯(cuò)誤控制錯(cuò)誤控制包括的流程是,在變更管理流程的控制下,能過(guò)成功地實(shí)施變更,使知名錯(cuò)誤得以消除。錯(cuò)誤控制的目標(biāo)是發(fā)現(xiàn)錯(cuò)誤、監(jiān)控錯(cuò)誤、在成本合理且可行的時(shí)候排除錯(cuò)誤。錯(cuò)誤控制是開(kāi)發(fā)(包括應(yīng)用開(kāi)發(fā)、功能擴(kuò)展和維護(hù))和生產(chǎn)環(huán)境的橋梁。在開(kāi)發(fā)階段產(chǎn)生的軟件錯(cuò)誤會(huì)影響生產(chǎn)運(yùn)營(yíng),在開(kāi)發(fā)和維護(hù)環(huán)境識(shí)別的知名錯(cuò)誤會(huì)被移交到生產(chǎn)環(huán)境。錯(cuò)誤控制中的活動(dòng)包括:v 錯(cuò)誤鑒定和記錄;v 錯(cuò)誤評(píng)估;v 記錄錯(cuò)誤的解決(方案調(diào)查、提出變更請(qǐng)求);v 關(guān)閉錯(cuò)誤;v 監(jiān)控問(wèn)題和錯(cuò)誤的解決進(jìn)展。在實(shí)踐中,問(wèn)題管理的每個(gè)流程要求仔細(xì)的管理和控制,不同的操作對(duì)象應(yīng)用在不同的流程中。1.3.4 主動(dòng)問(wèn)題管理主動(dòng)問(wèn)題管理中各項(xiàng)活動(dòng)的目的是,在事故發(fā)生前識(shí)別和解決問(wèn)題。這些活動(dòng)有:趨勢(shì)分析;定位支持行動(dòng);向組織提供信息;通過(guò)將IT部門(mén)的作用從被動(dòng)地解決大量事故,重定位到阻止事故,它將向客戶(hù)提供更好的服務(wù),使得IT支持部門(mén)的資源得到更有效地利用。1.3.5 主要問(wèn)題評(píng)價(jià)通過(guò)對(duì)主要問(wèn)題進(jìn)行事后的評(píng)價(jià),有助于服務(wù)的提升。1.4 問(wèn)題管理的益處采取正式的方法進(jìn)行問(wèn)題管理帶來(lái)以下益處:* 提升IT服務(wù)質(zhì)量問(wèn)題管理有助于形成迅速提高IT服務(wù)質(zhì)量良性循環(huán)。高質(zhì)量可靠的服務(wù)有益于IT的業(yè)務(wù)用戶(hù)、有益于生產(chǎn)力的提高、有益于IT服務(wù)提供者的士氣。* 事故數(shù)量下降問(wèn)題管理是降低造成業(yè)務(wù)中斷的事故數(shù)量的利器。* 永久的解決方案隨著問(wèn)題和知名錯(cuò)誤被解決,它們的數(shù)量及影響會(huì)逐步減少。* 提高了組織的知識(shí)問(wèn)題管理流程基礎(chǔ)于從過(guò)去的經(jīng)驗(yàn)獲得知識(shí)的概念。這些流程提供了歷史數(shù)據(jù)來(lái)識(shí)別趨勢(shì),阻止錯(cuò)誤的出現(xiàn),降低錯(cuò)誤的影響,從而提高了用戶(hù)生產(chǎn)力。* 提高服務(wù)臺(tái)第一時(shí)間修復(fù)率在客戶(hù)打進(jìn)電話(huà)時(shí),服務(wù)臺(tái)通過(guò)存貯在知識(shí)庫(kù)中事故解決方案和臨時(shí)措施,在第一時(shí)間在服務(wù)臺(tái)解決事故。相反地,沒(méi)有實(shí)施問(wèn)題管理流程的成本可能包括:v 一個(gè)純粹的被動(dòng)支持的組織,只有在客戶(hù)的服務(wù)被中斷時(shí)才面對(duì)問(wèn)題;v 面對(duì)重復(fù)發(fā)生的事故,IT用戶(hù)部門(mén)會(huì)對(duì)IT支持部門(mén)的服務(wù)質(zhì)量失去信任;v 因?yàn)橄嗨频氖鹿什坏貌环磸?fù)地被解決,而沒(méi)有提供結(jié)構(gòu)化的解決方案,所以成為一個(gè)高成本、缺乏員工積極性、無(wú)效率的支持部門(mén)。1.5 規(guī)劃與實(shí)施1.5.1 時(shí)機(jī)和規(guī)劃時(shí)機(jī)和規(guī)劃是很重要的,因?yàn)椋簐 良好的問(wèn)題管理在很程度上依賴(lài)已經(jīng)實(shí)施且有效的事故管理流程。因此,與事故管理流程并行或在它之后實(shí)施問(wèn)題管理是明智的;v 如果缺乏資源,建議首先實(shí)施問(wèn)題和錯(cuò)誤控制(被動(dòng)問(wèn)題管理)。當(dāng)這些活動(dòng)成熟時(shí),資源可以直接轉(zhuǎn)向主動(dòng)問(wèn)題管理。主動(dòng)問(wèn)題管理的質(zhì)量非常依賴(lài)成功地實(shí)施了服務(wù)監(jiān)控活動(dòng)以及因此獲得的基礎(chǔ)數(shù)據(jù);v 較小規(guī)模的組織通過(guò)聚集于日常的“前十名”事故實(shí)現(xiàn)被動(dòng)問(wèn)題管理。這被證明有有效的,因?yàn)榻?jīng)驗(yàn)表明20%的問(wèn)題引起了80%的服務(wù)降低。1.5.2 關(guān)鍵成功因素考慮要點(diǎn)包括:v 有效的事故自動(dòng)登記、有效的事故分類(lèi),是問(wèn)題管理成功的基礎(chǔ);v 設(shè)置可完成的目標(biāo),利用既有員工解決問(wèn)題的才能是個(gè)關(guān)鍵的活動(dòng)??紤]“兼職”問(wèn)題管理,讓員工看到隨著問(wèn)題的解決,他們遠(yuǎn)離每天“救火”的壓力;v 考慮事故管理和問(wèn)題管理間潛在的沖突,在兩個(gè)流程間進(jìn)行良好的協(xié)調(diào)是必要的。同時(shí)兩者又都有可能彼此幫助的配合。參與兩個(gè)流程的支持職員應(yīng)該意識(shí)到平衡兩者的活動(dòng)的重要性;1.5.3 風(fēng)險(xiǎn)問(wèn)題管理的益處會(huì)被以下因素減弱:v 沒(méi)有良好的事故控制流程,這樣就缺乏關(guān)于事故的詳細(xì)信息(這對(duì)正確的問(wèn)題識(shí)別是必要的);v 不能夠?qū)⑹鹿视涗浥c問(wèn)題/錯(cuò)誤記錄連接起來(lái),意味著失去了許多潛在的益處。在從被動(dòng)支持向更有規(guī)劃和主動(dòng)支持轉(zhuǎn)移方面,這是關(guān)鍵的功能;v 缺乏管理,因此支持職員(通常也參與在被事故控制流動(dòng)中)不能分配充分的時(shí)間在結(jié)構(gòu)化的問(wèn)題解決活動(dòng)中;v 削弱服務(wù)臺(tái)的角色。問(wèn)題管理職員應(yīng)該僅從授權(quán)的發(fā)起者那里接受支持請(qǐng)求。如果流程處理來(lái)自許多發(fā)起者的請(qǐng)求就會(huì)出現(xiàn)困難,因?yàn)橄嗤虻亩鄠€(gè)事故報(bào)告可能會(huì)被以不同的方式來(lái)解釋?zhuān)籿 不能留出時(shí)間來(lái)建立和維護(hù)知識(shí)庫(kù)將限制問(wèn)題管理的益處;v 沒(méi)有能力準(zhǔn)確地判斷事故和問(wèn)題的業(yè)務(wù)影響,導(dǎo)致對(duì)業(yè)務(wù)而言關(guān)鍵的事故和問(wèn)題沒(méi)有給予正確的優(yōu)先級(jí)。1.6 問(wèn)題控制的活動(dòng)實(shí)際上,由于計(jì)算機(jī)設(shè)備和通信線(xiàn)路的偶然出錯(cuò),發(fā)生事故是不可避免的。許多其它事故不是由隨機(jī)產(chǎn)生的故障引起的,而是由組織日益復(fù)雜的IT基礎(chǔ)架構(gòu)某處錯(cuò)誤造成的。即使可預(yù)料的計(jì)算或通信設(shè)備故障也會(huì)由于提供商的產(chǎn)品中的錯(cuò)誤,導(dǎo)致無(wú)法接受的影響。被動(dòng)問(wèn)題控制關(guān)注于識(shí)別事故真正的底層原因,以阻止將來(lái)的重復(fù)發(fā)生。在問(wèn)題控制流程中有三個(gè)階段:v 問(wèn)題的識(shí)別和記錄;v 問(wèn)題的分類(lèi)根據(jù)對(duì)業(yè)務(wù)的影響;v 問(wèn)題的調(diào)查和診斷。圖2 問(wèn)題控制當(dāng)檢測(cè)到根本原因時(shí),就開(kāi)始錯(cuò)誤控制流程。1.6.1 問(wèn)題識(shí)別和記錄問(wèn)題識(shí)別發(fā)生在:v 在事故的初始支持和分類(lèi)階段,不能夠找到匹配的既有問(wèn)題和知名錯(cuò)誤;v 事故數(shù)據(jù)的分析揭示了重復(fù)發(fā)生的事故;v 事故數(shù)據(jù)的分析揭示了還存在沒(méi)有與能夠與既有的問(wèn)題和知名錯(cuò)誤匹配的事故;v IT基礎(chǔ)架構(gòu)的分析表明存在可能導(dǎo)致事故的問(wèn)題;v 重大或明顯的事故(對(duì)客戶(hù)的服務(wù)具有嚴(yán)重的不利影響)發(fā)生,需要找到結(jié)構(gòu)化的解決方案。注意有些問(wèn)題可能在問(wèn)題管理小組之外被某個(gè)識(shí)別,如在能力管理中。無(wú)論如何,所有的問(wèn)題應(yīng)該通知問(wèn)題管理流程被記錄??捎眯怨芾砹鞒痰脑S多方面關(guān)注于IT基礎(chǔ)架構(gòu)中的問(wèn)題和事故的檢測(cè)和避免,這兩個(gè)領(lǐng)域的配合對(duì)提高服務(wù)質(zhì)量具有重大的價(jià)值。* 要點(diǎn)問(wèn)題管理要求效力和資源,因此是昂貴的。組織要能夠判定對(duì)某些類(lèi)型的未能匹配的事故付出努力和成本是劃算的例如能夠快速解決,影響較小或重復(fù)發(fā)生的可能性很小的事故。在這種情況下,可以在CMDB中引入虛構(gòu)的問(wèn)題記錄,關(guān)聯(lián)到所有有聯(lián)系的事故、知名錯(cuò)誤、變更請(qǐng)求以及配置項(xiàng)。問(wèn)題記錄需要記錄在數(shù)據(jù)庫(kù)(理想情況下是CMDB),這一點(diǎn)類(lèi)似于事故記錄。它們通常不包括某些不適用的標(biāo)準(zhǔn)事故數(shù)據(jù)(如用戶(hù)數(shù)據(jù))。然而問(wèn)題記錄應(yīng)該連接到所有相關(guān)的事故記錄。事故的解決方案和臨時(shí)措施應(yīng)該被記錄在相關(guān)的問(wèn)題記錄中,以便另外相關(guān)的事故發(fā)生時(shí)能夠訪(fǎng)問(wèn)。圖3 事故匹配處理流程問(wèn)題識(shí)別的流程如上圖所示,包括基本的問(wèn)題分類(lèi)。受影響的配置項(xiàng)的數(shù)據(jù)應(yīng)該準(zhǔn)確地追加到這個(gè)基本分類(lèi)數(shù)據(jù)中。理想情況下,這些配置可被單獨(dú)修改的最低層的項(xiàng)目例如,應(yīng)用代碼塊或硬件組件。然而在問(wèn)題識(shí)別階段對(duì)于有問(wèn)題的配置項(xiàng)的識(shí)別達(dá)到這個(gè)層次經(jīng)常是不可能的。1.6.2 問(wèn)題的分級(jí)當(dāng)問(wèn)題被識(shí)別時(shí),需要較大的努力來(lái)檢測(cè)和恢復(fù)斷定存在故障的配置項(xiàng)。因此意識(shí)到問(wèn)題對(duì)既有服務(wù)水平的影響是很重要的。這個(gè)流程被稱(chēng)為“分級(jí)”(classification)。在實(shí)踐中,支持努力被分配到連接到單個(gè)事故的小面積的問(wèn)題上。問(wèn)題分級(jí)的步驟類(lèi)似于事故分級(jí)的步驟,這些步驟決定:v 類(lèi)別v 影響v 緊急程度v 優(yōu)先級(jí)問(wèn)題被歸類(lèi)到相關(guān)的組或域(例如硬件、軟件、支持軟件以及相應(yīng)的其它種類(lèi))。這些組能夠與機(jī)構(gòu)的職責(zé)匹配,或者以用戶(hù)和客戶(hù)為基礎(chǔ)歸類(lèi),是將問(wèn)題分配給支持職員的基礎(chǔ)。附錄A給出一個(gè)簡(jiǎn)單但對(duì)問(wèn)題歸類(lèi)有效的結(jié)構(gòu)。新問(wèn)題的識(shí)別應(yīng)該在受其影響的對(duì)象(也就是它對(duì)業(yè)務(wù)的影響)分析之后。登記在CMDB中的IT基礎(chǔ)架構(gòu)中的組件間的關(guān)系有助于判斷問(wèn)題的影響。組織應(yīng)該根據(jù)它們的業(yè)務(wù)需要設(shè)計(jì)自己的影響代碼系統(tǒng)。影響代碼對(duì)于有效地分配支持力度是最有用的機(jī)制。更進(jìn)一步包括優(yōu)先級(jí)、從屬影響,提供了全面的控制機(jī)制。當(dāng)判斷問(wèn)題的影響時(shí),登記在CMDB中的IT基礎(chǔ)架構(gòu)中組件間的關(guān)系是個(gè)極大的幫助。通過(guò)查詢(xún)CMDB,可能識(shí)別事故涉及到IT基礎(chǔ)架構(gòu)中的配置項(xiàng),以及同樣的或依賴(lài)的配置項(xiàng)。緊急程度是指問(wèn)題或錯(cuò)誤的解決所能承受的延遲程度,它不應(yīng)該與優(yōu)先級(jí)混淆。優(yōu)先級(jí)指明一系列項(xiàng)目無(wú)論是事故、問(wèn)題、變更或錯(cuò)誤應(yīng)該被解決的相應(yīng)次序。這會(huì)受到風(fēng)險(xiǎn)的考慮和資源可用性的影響,但更主要地是由緊急程度和影響的組合來(lái)決定。盡管較低的業(yè)務(wù)影響,但要求緊急解決的事情經(jīng)常要放在較高的潛在業(yè)務(wù)影響但較低的緊急程度的事情之前處理。為每個(gè)方面分配數(shù)字值有幫助的,由此衍生出數(shù)字優(yōu)先級(jí),但是,對(duì)于所有的服務(wù)管理,這樣的數(shù)字是憑人的直覺(jué)和業(yè)務(wù)意識(shí)來(lái)修改的。然而,對(duì)每個(gè)問(wèn)題的緊急程度和影響賦予14的數(shù)值,對(duì)它們求和給出相應(yīng)的優(yōu)先級(jí),是一個(gè)簡(jiǎn)單而實(shí)用的起點(diǎn)。那樣做了,組織應(yīng)該精密地監(jiān)控和檢查計(jì)算出的優(yōu)先級(jí),監(jiān)控對(duì)應(yīng)需求的功能。影響緊急程度的方面如:v 臨時(shí)修復(fù)的可用性;v 存在臨時(shí)措施;v 計(jì)劃推遲解決的可能性;v 對(duì)業(yè)務(wù)未來(lái)影響的意識(shí),如支持月末處理的設(shè)備需求。每個(gè)事故、問(wèn)題和變更將都會(huì)對(duì)業(yè)務(wù)服務(wù)和緊急程度有影響:v 影響描述了業(yè)務(wù)受到破壞的可能;v 緊急程度表明了可用來(lái)轉(zhuǎn)移或降低影響的時(shí)間。* 要點(diǎn)在最早的時(shí)機(jī)為所有問(wèn)題分配影響代碼。當(dāng)這項(xiàng)工作完成后,重要的是在詳細(xì)調(diào)查開(kāi)始前,使所有問(wèn)題歸屬到被管理的職員分配流程。被分配的人負(fù)責(zé)問(wèn)題的解決,成為協(xié)調(diào)問(wèn)題解決活動(dòng)的中心。根據(jù)影響計(jì)劃工作量,重要問(wèn)題要立即引起注意。對(duì)低影響的問(wèn)題可以允許超出特定的時(shí)間限制。影響分析流程遭遇一個(gè)重大的約束:它只反映當(dāng)時(shí)的看法。雖然一個(gè)問(wèn)題被正確地分配了低影響代碼,但接下來(lái)屬于該問(wèn)題的事故數(shù)量陡然上升可能要求這個(gè)問(wèn)題需要立即引起注意。需要設(shè)置事故限制來(lái)解決這個(gè)困難。如圖3所示,問(wèn)題管理流程被設(shè)計(jì)要維護(hù)與問(wèn)題(和知名錯(cuò)誤)記錄匹配的事故的數(shù)量。問(wèn)題和錯(cuò)誤控制系統(tǒng)周期性?huà)呙柽@個(gè)數(shù)值,將它與預(yù)先定義的限制值比較。當(dāng)數(shù)量等于或超出這個(gè)限制,這樣的問(wèn)題/知名錯(cuò)誤應(yīng)該被升級(jí)到立即注意。然而,注意數(shù)量并不總是等于重要:當(dāng)你發(fā)現(xiàn)訂單不能輸入超過(guò)$999,999.99的值,即使這樣的情況只有0.5%,也必須被看做是關(guān)鍵的問(wèn)題。1.6.3 問(wèn)題調(diào)查和診斷問(wèn)題調(diào)查流程類(lèi)似于事故調(diào)查流程但是這兩個(gè)流程的基本目標(biāo)明顯不同。事故管理的目的是迅速恢復(fù)服務(wù),而問(wèn)題管理的目的是診斷出底層原因。調(diào)查活動(dòng)應(yīng)該包括與該問(wèn)題相關(guān)事故可用的臨時(shí)措施,它登記在事故記錄數(shù)據(jù)庫(kù)。問(wèn)題管理活動(dòng)還包括更改問(wèn)題記錄中推薦的臨時(shí)措施,以支持事故控制。診斷結(jié)果經(jīng)常表明問(wèn)題的原因不是登記的配置項(xiàng)(硬件、軟件、文檔或程序)的錯(cuò)誤,而是過(guò)程上的。例如,發(fā)布的程序版本不正確。這種情況下,問(wèn)題以適當(dāng)?shù)姆诸?lèi)代碼來(lái)關(guān)閉,但不會(huì)達(dá)到有知名錯(cuò)誤的狀態(tài)。為了確保這類(lèi)問(wèn)題有章可循,采取措施解決它們,考慮為這種過(guò)失過(guò)程創(chuàng)建虛構(gòu)的配置項(xiàng),作為一個(gè)知名錯(cuò)誤重新分級(jí)問(wèn)題,或產(chǎn)生變更請(qǐng)求。診斷揭示了原因是登記的配置項(xiàng)的錯(cuò)誤,這時(shí)應(yīng)該自動(dòng)將問(wèn)題的狀態(tài)轉(zhuǎn)成知名錯(cuò)誤,由錯(cuò)誤控制系統(tǒng)和過(guò)程接管。正如前面所指出的,問(wèn)題調(diào)查的目標(biāo)經(jīng)常會(huì)與事故解決的目標(biāo)相沖突。例如,問(wèn)題調(diào)查可能要求詳細(xì)的診斷數(shù)據(jù),這些數(shù)據(jù)只有在事故出現(xiàn)時(shí)才能得到,而獲得這些數(shù)據(jù)可能會(huì)明顯地推遲正常服務(wù)的恢復(fù)。確保將事故控制與計(jì)算機(jī)操作或網(wǎng)絡(luò)控制功能緊密聯(lián)系,對(duì)于此類(lèi)的活動(dòng)給予適當(dāng)?shù)臅r(shí)間平衡。1.6.4 問(wèn)題分析的方法一些文獻(xiàn)對(duì)于結(jié)構(gòu)化問(wèn)題分析和診斷提供了許多方法。這樣的文獻(xiàn)有:v Kepner and Tregoe (參見(jiàn)附錄B) v Ishikawa diagrams (參見(jiàn)附錄C) v 頭腦風(fēng)暴會(huì)話(huà)v 流程圖方法 問(wèn)題管理應(yīng)該選擇最適合本組織目的的方法。1.6.5 問(wèn)題控制的要點(diǎn)以下是在問(wèn)題控制中值得記住的要點(diǎn):v 事故分類(lèi)是向問(wèn)題定義發(fā)展的第一步,因此問(wèn)題管理應(yīng)該與事故管理緊密關(guān)聯(lián),考慮建立公用的事故和問(wèn)題分類(lèi)。對(duì)于報(bào)告的事故以及最終檢測(cè)的原因應(yīng)該給予適當(dāng)?shù)姆诸?lèi),事故分類(lèi)應(yīng)該用“客戶(hù)術(shù)語(yǔ)”,而檢測(cè)的原因歸類(lèi)用“IT術(shù)語(yǔ)”來(lái)表達(dá)。v 如果可能的話(huà),建立具有不同經(jīng)驗(yàn)的人的小組,例如問(wèn)題管理,在調(diào)查的時(shí)候,大家盡可能從不同的角度來(lái)參與。v 為了參與的支持專(zhuān)家能夠有效地執(zhí)行他們的任務(wù),確保他們有合適的工具和診斷協(xié)助工具。v 如果問(wèn)題不是由系統(tǒng)組件中的錯(cuò)誤引起的,而是由于沒(méi)有對(duì)用戶(hù)培訓(xùn)引起的,解決并關(guān)閉問(wèn)題記錄。另外,創(chuàng)建新的配置項(xiàng)記錄在這個(gè)例子中是“培訓(xùn)問(wèn)題”按照通常的方法將問(wèn)題轉(zhuǎn)化為知名錯(cuò)誤。確保檢測(cè)的原因反映實(shí)際狀況,例如,缺乏用戶(hù)知識(shí)培訓(xùn)。v 在事故或問(wèn)題控制流程的診斷過(guò)程中,要求IT基礎(chǔ)架構(gòu)中的所有產(chǎn)品的文檔可用,以支持職員在處理過(guò)程中作為參考。這些文檔包括:u 應(yīng)用系統(tǒng)u 系統(tǒng)軟件u 內(nèi)部工具程序u 網(wǎng)絡(luò)硬件和軟件u 全局配置/網(wǎng)絡(luò)圖表v 除了產(chǎn)品信息,具有有效的過(guò)程來(lái)收集診斷以解決問(wèn)題也是必要的。支持職員熟悉這些過(guò)程特別重要,因?yàn)樵谑鹿侍幚淼倪^(guò)程中不適當(dāng)?shù)氖褂脮?huì)推遲正常IT服務(wù)的恢復(fù)。因此需要這些過(guò)程來(lái)支持和加強(qiáng)流程的需求這些過(guò)程可能包括適當(dāng)?shù)呐嘤?xùn)、認(rèn)證等。v 支持專(zhuān)家會(huì)經(jīng)常同時(shí)參與事故管理流程和問(wèn)題管理流程,切記這兩個(gè)流程的目標(biāo)不同(快速解決對(duì)結(jié)構(gòu)化解決),在這兩個(gè)流程中,將專(zhuān)家的時(shí)間按固定的百分比分配證明是有用的,可能是事故管理占80%,問(wèn)題管理占20%。這可以防止支持專(zhuān)家完全陷入被動(dòng)事故管理。v 在事故和問(wèn)題的診斷過(guò)程中,問(wèn)題管理職員也要求精確地記錄最近的變更,因?yàn)檫@些可能是問(wèn)題的原因。1.7 錯(cuò)誤控制的活動(dòng)錯(cuò)誤控制包括了成功地糾正知名錯(cuò)誤的流程。其目標(biāo)是變更IT組件,消除影響IT基礎(chǔ)架構(gòu)中知名錯(cuò)誤,防止事故的重復(fù)發(fā)生。許多IT部門(mén)關(guān)注于生產(chǎn)環(huán)境和開(kāi)發(fā)環(huán)境的錯(cuò)誤控制,它直接與變更管理流程接口。圖4示例了錯(cuò)誤控制的三個(gè)階段。監(jiān)控和跟蹤階段包括全部的問(wèn)題/錯(cuò)誤生命周期。圖4 錯(cuò)誤控制1.7.1 錯(cuò)誤識(shí)別和記錄當(dāng)有故障的配置項(xiàng)(引起或可能引起事故的配置項(xiàng))被檢測(cè)到就識(shí)別了錯(cuò)誤。當(dāng)問(wèn)題的根本原因被發(fā)現(xiàn)就被賦予知名錯(cuò)誤的狀態(tài),同時(shí)開(kāi)發(fā)臨時(shí)措施。流入錯(cuò)誤控制系統(tǒng)的知名錯(cuò)誤有兩個(gè)來(lái)源,一個(gè)是生產(chǎn)系統(tǒng)中的問(wèn)題控制子系統(tǒng),另一個(gè)是相應(yīng)的開(kāi)發(fā)環(huán)境。在生產(chǎn)操作中發(fā)現(xiàn)的錯(cuò)誤,就如在問(wèn)題控制活動(dòng)調(diào)查和診斷中所描述的,被識(shí)別和記錄。在這種情況下,問(wèn)題記錄形成了知名錯(cuò)誤記錄的基礎(chǔ)(事實(shí)上,它確實(shí)只是狀態(tài)的改變)。知名錯(cuò)誤的第二來(lái)源是開(kāi)發(fā)活動(dòng)。例如,新應(yīng)用或打包發(fā)布的實(shí)施可能包括了在開(kāi)發(fā)階段形成的已知但未解決的錯(cuò)誤。當(dāng)應(yīng)用或發(fā)布包實(shí)施時(shí),來(lái)自于開(kāi)發(fā)的知名錯(cuò)誤相關(guān)的數(shù)據(jù)應(yīng)該對(duì)生產(chǎn)環(huán)境的管理人員可用。許多IT部門(mén)參與過(guò)這樣一系列事件。問(wèn)題管理系統(tǒng)應(yīng)該記錄所有解決活動(dòng),向支持職員提供監(jiān)控與跟蹤工具。也應(yīng)該提供全面的審計(jì)記錄,從事故到問(wèn)題、到知名錯(cuò)誤、到變更請(qǐng)求或重大變更實(shí)施。1.7.2 錯(cuò)誤評(píng)估問(wèn)題管理職員協(xié)同專(zhuān)業(yè)職員,對(duì)解決錯(cuò)誤的方法進(jìn)行初始的評(píng)估。如果必要,接下他們根據(jù)變更管理過(guò)程,完成變更請(qǐng)求。變更請(qǐng)求的優(yōu)先組根據(jù)錯(cuò)誤在業(yè)務(wù)上的緊急程度和影響來(lái)決定。變更請(qǐng)求的標(biāo)識(shí)符應(yīng)該被包括在知名錯(cuò)誤記錄中,以便維護(hù)一個(gè)完全的審計(jì)路徑,或者將兩者連接。錯(cuò)誤解決的最終進(jìn)程影響分析、需要執(zhí)行的解決步驟的詳細(xì)評(píng)估、配置項(xiàng)錯(cuò)誤的改正、變更的測(cè)試要在變更管理的控制下執(zhí)行。在極端情況下,緊急的解決方案,進(jìn)行授權(quán)執(zhí)行是必要的。* 第三方產(chǎn)品中的錯(cuò)誤賣(mài)方維護(hù)的產(chǎn)品中的問(wèn)題可能被問(wèn)題管理或?qū)<抑С中〗M識(shí)別,應(yīng)該向賣(mài)方支持的負(fù)責(zé)人報(bào)告。應(yīng)該監(jiān)控賣(mài)方支持,確保在合理的時(shí)間內(nèi)收到對(duì)問(wèn)題報(bào)告的響應(yīng)。在設(shè)置了軟件維護(hù)的目標(biāo)諸如修復(fù)的合理和最長(zhǎng)時(shí)間,以及IT基礎(chǔ)架構(gòu)相關(guān)的可靠性和可服務(wù)性應(yīng)該在合同或許可條件中明確,應(yīng)該由第三方發(fā)起補(bǔ)救措施,以免受到抱怨。當(dāng)購(gòu)買(mǎi)軟件時(shí),特別是在業(yè)務(wù)上具有競(jìng)爭(zhēng)的情況下,明確維護(hù)目標(biāo)的可能性應(yīng)該具備。注意解決軟件錯(cuò)誤的必要的變更歸屬于變更管理,與內(nèi)部產(chǎn)品一樣。* 軟件環(huán)境中的錯(cuò)誤控制在生產(chǎn)環(huán)境和開(kāi)發(fā)環(huán)境中的問(wèn)題和錯(cuò)誤控制流程在本質(zhì)上是一樣的。前面對(duì)生產(chǎn)環(huán)境中的問(wèn)題管理所描述的支持工具,也適合于開(kāi)發(fā)環(huán)境中所要求的。圖5顯示了在生產(chǎn)和開(kāi)發(fā)環(huán)境中的錯(cuò)誤控制間的循環(huán)關(guān)系。協(xié)同集成的問(wèn)題管理系統(tǒng)促進(jìn)這種情況的處理。圖5 生產(chǎn)與開(kāi)發(fā)環(huán)境中的錯(cuò)誤周期在生產(chǎn)運(yùn)營(yíng)期間發(fā)現(xiàn)的錯(cuò)誤導(dǎo)致變更求的積累,發(fā)布策略(參見(jiàn)發(fā)布管理)允許最終創(chuàng)建一個(gè)發(fā)布協(xié)同授權(quán)的變更修正系統(tǒng)中的錯(cuò)誤。開(kāi)發(fā)職員應(yīng)該注意與打包發(fā)布相關(guān)的所有知名錯(cuò)誤和問(wèn)題,當(dāng)知名錯(cuò)誤被改正后要求被刪除,加入到修訂的錯(cuò)誤數(shù)據(jù)庫(kù)(或CMDB)。當(dāng)完成新的發(fā)布,這個(gè)修訂的錯(cuò)誤數(shù)據(jù)庫(kù)替換以前版本的數(shù)據(jù)庫(kù)作生產(chǎn)版本。當(dāng)新的錯(cuò)誤在生產(chǎn)運(yùn)營(yíng)中被發(fā)現(xiàn),重復(fù)這個(gè)周期。1.7.3 記錄錯(cuò)誤解決方案每個(gè)知名錯(cuò)誤的解決過(guò)程應(yīng)該記錄在問(wèn)題管理系統(tǒng)。與所有知名錯(cuò)誤相關(guān)的配置項(xiàng)數(shù)據(jù)、癥狀、解決方案或防止措施保存在知名錯(cuò)誤數(shù)據(jù)庫(kù)是很關(guān)鍵的。這些數(shù)據(jù)對(duì)于事故匹配、在將來(lái)的診斷解決事故以及防止事故方面提供指導(dǎo)、提供管理信息等方面都是有用的。1.7.4 關(guān)閉錯(cuò)誤在成功地實(shí)施變更解決錯(cuò)誤后,相應(yīng)的知名錯(cuò)誤記錄被關(guān)閉,同時(shí)任何相關(guān)的事故或問(wèn)題記錄也一起被關(guān)閉??梢钥紤]在事故、知名錯(cuò)誤和問(wèn)題記錄中插入一個(gè)中間狀態(tài)“關(guān)閉但未進(jìn)行實(shí)施后評(píng)價(jià)(Closed pending PIR)”,確保修正已經(jīng)實(shí)際起作用。實(shí)施后評(píng)價(jià)(Post-Implementation Review,PIR)能確認(rèn)最終關(guān)閉前解決的效果。對(duì)于事故,除了打電話(huà)給用戶(hù)確保他們已經(jīng)滿(mǎn)意就沒(méi)有別的了,對(duì)于嚴(yán)重的問(wèn)題和知名錯(cuò)誤,要求進(jìn)行正式的評(píng)價(jià)。1.7.5 監(jiān)控問(wèn)題/錯(cuò)誤的解決變更管理負(fù)責(zé)處理變更請(qǐng)求,同時(shí)錯(cuò)誤控制負(fù)責(zé)監(jiān)控解決知名錯(cuò)誤的進(jìn)展。在整個(gè)的解決過(guò)程中,問(wèn)題管理應(yīng)該從解決問(wèn)題和錯(cuò)誤的變更管理進(jìn)展中獲得日常報(bào)告。問(wèn)題管理應(yīng)該監(jiān)控問(wèn)題和知名錯(cuò)誤對(duì)用戶(hù)服務(wù)的持續(xù)影響。在影響變得嚴(yán)重的事件中,問(wèn)題管理應(yīng)該升級(jí)問(wèn)題,可能要咨詢(xún)變更咨詢(xún)委員會(huì)提升變更請(qǐng)求的優(yōu)先級(jí),在適當(dāng)?shù)臅r(shí)候?qū)嵤┚o急變更。問(wèn)題解決的進(jìn)展應(yīng)該結(jié)合SLA一起被監(jiān)控。典型地,SLA規(guī)定在每個(gè)測(cè)量間隔內(nèi)(一般為四周)在每個(gè)嚴(yán)重級(jí)別上不應(yīng)該有特定數(shù)量的突出錯(cuò)誤。如果在某個(gè)嚴(yán)重級(jí)別上問(wèn)題或錯(cuò)誤的數(shù)量達(dá)到預(yù)先定義的限制,可能引起與SLA的不一致,就必須升級(jí)。1.7.6 錯(cuò)誤控制的要點(diǎn)在錯(cuò)誤控制中切記以下要點(diǎn):v 不是所有的知名錯(cuò)誤需要被解決。組織能夠決定允許保留知名錯(cuò)誤例如,因?yàn)榻鉀Q的成本太高、技術(shù)上不可能或要求太多的時(shí)間來(lái)解決。實(shí)踐中,錯(cuò)誤控制關(guān)注于選擇合理的投資來(lái)解決問(wèn)題;v 準(zhǔn)備變更請(qǐng)求是錯(cuò)誤控制的責(zé)任之一。解決方法經(jīng)常是技術(shù)上的調(diào)整,但不要忘記,變更請(qǐng)求也可能需要包括對(duì)過(guò)程、工作方法和/或組織結(jié)構(gòu)的修正;v 對(duì)于日常的硬件故障,考慮根據(jù)特定的設(shè)備或設(shè)備分類(lèi)創(chuàng)建標(biāo)準(zhǔn)的錯(cuò)誤記錄。使用這些來(lái)維持對(duì)故障鑒定的快速指導(dǎo)盡管多數(shù)信息(例如故障和宕機(jī)間的平均時(shí)間)來(lái)自于事故數(shù)據(jù);v 許多硬件故障的糾正在事故控制下執(zhí)行,并不通過(guò)錯(cuò)誤控制和變更管理。然而對(duì)硬件規(guī)格的任何改變應(yīng)該從屬于正常的變更管理過(guò)程;v 理想情況下,應(yīng)該在生產(chǎn)和開(kāi)發(fā)環(huán)境中的事故、問(wèn)題和錯(cuò)誤控制中使用公用工具。如果因?yàn)樵陂_(kāi)發(fā)環(huán)境使用特定的CASE工具而使這不可能,那么設(shè)計(jì)和開(kāi)發(fā)一個(gè)可行的轉(zhuǎn)移機(jī)制是必要的;v In practice, the level of detail usually required for development Configuration Management often precludes a viable shared system. The key thing is to share the data, especially in terms of passing to the live environment information on Problems, Known Errors and ongoing Changes that are being handed over with any new or changed software. 1.8 主動(dòng)問(wèn)題管理迄今為止在問(wèn)題和錯(cuò)誤控制中所描述的活動(dòng)主要是被動(dòng)的。主動(dòng)問(wèn)題管理活動(dòng)涉及到在事故出現(xiàn)前識(shí)別和解決問(wèn)題和知名錯(cuò)誤,這樣最小化對(duì)服務(wù)的不利影響,最小化業(yè)務(wù)相關(guān)的成本。問(wèn)題防止的范圍從單個(gè)問(wèn)題的防止到策略的決定。后者可能要求較大的開(kāi)銷(xiāo)來(lái)實(shí)施,例如投資優(yōu)化網(wǎng)絡(luò)。問(wèn)題防止也包括向客戶(hù)提供信息以消除將來(lái)請(qǐng)求幫助的需求。問(wèn)題分析集中在為問(wèn)題解決人員提供改進(jìn)的建議,例如,在線(xiàn)技術(shù)工具的提供減少了解決問(wèn)題花費(fèi)的時(shí)間,因此使電話(huà)時(shí)間的長(zhǎng)度明顯減短。主動(dòng)問(wèn)題管理流程中的主要活動(dòng)是趨勢(shì)分析和定位防止措施。1.8.1 趨勢(shì)分析事故和問(wèn)題的分析報(bào)告為采取主動(dòng)措施提高服務(wù)質(zhì)量提供信息。其目標(biāo)是識(shí)別IT基礎(chǔ)架構(gòu)中“脆弱”的組件,調(diào)查其脆弱的原因在這里“脆弱”是相對(duì)于如果配置項(xiàng)出錯(cuò)對(duì)業(yè)務(wù)的影響而言的。事故和問(wèn)題分析能夠識(shí)別:v 趨勢(shì),諸如特定問(wèn)題類(lèi)型變更后出現(xiàn)的情況;v 特定類(lèi)型的初期故障;v 特定類(lèi)型或某個(gè)配置項(xiàng)重復(fù)出現(xiàn)的問(wèn)題;v 客戶(hù)對(duì)培訓(xùn)的需求或?qū)Ω梦臋n的需求;事故和問(wèn)題的分類(lèi),以及積極的分析可以揭露趨勢(shì),識(shí)別出需要進(jìn)一步調(diào)查的特定(或潛在)的問(wèn)題區(qū)域。例如,分析可能指出與最近安裝的客戶(hù)服務(wù)器系統(tǒng)相關(guān)的事故是個(gè)問(wèn)題區(qū)域,對(duì)客戶(hù)業(yè)務(wù)的負(fù)面影響增長(zhǎng)最快。分析例如對(duì)來(lái)自系統(tǒng)管理工具的事件的分析,對(duì)文獻(xiàn)的分析,對(duì)來(lái)自用戶(hù)組的討論和反饋的分析也能夠揭示可能的問(wèn)題,需要進(jìn)一步的調(diào)查。組織與重要客戶(hù)的討論會(huì)或進(jìn)行客戶(hù)調(diào)查也能識(shí)別趨勢(shì)和(潛在的)問(wèn)題區(qū)域。問(wèn)題管理數(shù)據(jù)的分析可以揭示:v 在一個(gè)平臺(tái)出現(xiàn)的問(wèn)題可能在另一個(gè)平臺(tái)出現(xiàn)例如,在一個(gè)中型系統(tǒng)上的網(wǎng)絡(luò)軟件的問(wèn)題也可以是主機(jī)系統(tǒng)上的明顯的問(wèn)題;v 存在重復(fù)出現(xiàn)的問(wèn)題例如,如果因?yàn)橥瑯拥墓收希齻€(gè)路由器被連續(xù)替換,它可能表明這種路由器類(lèi)型不合適,應(yīng)該用另一種類(lèi)型替換,或者當(dāng)or when a software application is involved then complete redevelopment might be necessary which would be classed as a major Change. 1.8.2 定位防止措施趨勢(shì)分析能夠識(shí)別IT基礎(chǔ)架構(gòu)中的故障,接下來(lái)正如在問(wèn)題和錯(cuò)誤控制中所描述的能夠被分析和糾正。趨勢(shì)分析也能夠識(shí)別需要支持人員注意的問(wèn)題區(qū)域。按照組織的財(cái)務(wù)成本來(lái)表達(dá),可以做出有意義的比較。為了將不足的資源最有效地用于服務(wù)支持(從中獲得最大的業(yè)務(wù)利益),調(diào)查哪個(gè)問(wèn)題區(qū)域最需要支持人員注意是值得的。對(duì)于主動(dòng)問(wèn)題管理,這是個(gè)典型的任務(wù)。為了能夠估計(jì)特定問(wèn)題區(qū)域的事故對(duì)業(yè)務(wù)的影響,事實(shí)證明引入事故的“pain factor”這個(gè)概念作為衡量是很有用的。使用這個(gè)概念,對(duì)每個(gè)事故分類(lèi)給予一個(gè)pain value作為公式的基礎(chǔ),用于記帳,例如:v 事故的數(shù)量v 受影響的客戶(hù)數(shù)量v 解決事故的持續(xù)時(shí)間和相關(guān)的成本v 業(yè)務(wù)成本這可能是所有因素中最重要的這個(gè)方法避免將精力集中放在這樣一組事故上,相對(duì)而言數(shù)量較大,而對(duì)提供的服務(wù)水平?jīng)]有較高的影響;相反地,將精力放在調(diào)查一小組而更有益的事故上,它可能對(duì)組織的業(yè)務(wù)有很高的影響。在需要注意的問(wèn)題區(qū)域被識(shí)別后,問(wèn)題管理應(yīng)該啟動(dòng)適當(dāng)?shù)拇胧_@些措施包括:v 提出變更請(qǐng)求v 提供關(guān)于測(cè)試、過(guò)程、培訓(xùn)和文檔的反饋v 啟動(dòng)客戶(hù)教育和培訓(xùn)v 啟動(dòng)服務(wù)支持職員教育和培訓(xùn)v 確保問(wèn)題管理和事故管理過(guò)程相連接v 改進(jìn)流程或過(guò)程1.8.3 主動(dòng)問(wèn)題管理的要點(diǎn)下面的要點(diǎn)值得注意:v 當(dāng)積累了充分的歷史數(shù)據(jù),在配置項(xiàng)的強(qiáng)壯度方面的趨勢(shì)分析才會(huì)有增值;v 來(lái)自許多廠商的操作系統(tǒng)的操作報(bào)告提供了系統(tǒng)中固有問(wèn)題的信息。這些報(bào)告應(yīng)該經(jīng)常檢查,以便在問(wèn)題出現(xiàn)前識(shí)別潛在的硬件問(wèn)題。理想情況下,提供商職員應(yīng)該做這項(xiàng)工作(可能通過(guò)遠(yuǎn)程的方式),但是在任何事件中,還是由問(wèn)題管理負(fù)責(zé)確保完成這項(xiàng)工作。這些報(bào)告能夠用于在硬件配置項(xiàng)實(shí)際出現(xiàn)故障前,引發(fā)對(duì)它們的修復(fù)和替換;v 主動(dòng)問(wèn)題管理不必作為一個(gè)全職的任務(wù),對(duì)于較小的IT服務(wù)組織,每半年分配一個(gè)支持專(zhuān)家兩周的時(shí)間來(lái)分析事故和問(wèn)題數(shù)據(jù),再花兩周的時(shí)間啟動(dòng)變更請(qǐng)求,這就足夠了。1.8.4 主要問(wèn)題回顧當(dāng)每個(gè)主要問(wèn)題的解決完成后,問(wèn)題管理應(yīng)該完成主要問(wèn)題的回顧。解決過(guò)程中參與的適當(dāng)?shù)娜艘黄饋?lái)回顧,確定:v 哪些做得正確;v 哪些做得錯(cuò)誤;v 哪些能夠下次做得更好;v 怎樣防止問(wèn)題再次發(fā)生。1.9 向支持部門(mén)提供信息問(wèn)題管理提供有關(guān)識(shí)別的問(wèn)題、知名錯(cuò)誤和發(fā)出的變更請(qǐng)求的信息。這些信息可以是隨機(jī)的或周期性的。這些信息和報(bào)告經(jīng)常是為了在管理中監(jiān)控問(wèn)題管理流程的質(zhì)量。然而,提供給業(yè)務(wù)和IT管理的報(bào)告也有助于組織內(nèi)的決策支持。除此之外,報(bào)告也可以傳遞給其它流程和服務(wù)臺(tái)。1.9.1 提供管理信息管理信息應(yīng)該使了解組織花費(fèi)在調(diào)查、診斷和解決問(wèn)題及知名錯(cuò)誤上的努力和資源。除此,了解到問(wèn)題處理的進(jìn)展和結(jié)果也是很重要的。度量方式必要仔細(xì)地選擇,只有通過(guò)仔細(xì)和有目的的度量才能形成關(guān)于流程質(zhì)量的意見(jiàn)。1.9.2 將信息分級(jí)臨時(shí)措施、永久修正或關(guān)于解決進(jìn)展的簡(jiǎn)要信息應(yīng)該分級(jí)給報(bào)告問(wèn)題的人。這些信息也必須分級(jí)給其它客戶(hù),因?yàn)橛绊懺S多人的問(wèn)題可能僅由一個(gè)人報(bào)告。傳播這些信息是服務(wù)臺(tái)的基本任務(wù)。問(wèn)題管理應(yīng)該為此向服務(wù)臺(tái)提供充分的信息和支持。通過(guò)將這些信息輸入到既有的服務(wù)管理工具和數(shù)據(jù)庫(kù),問(wèn)題管理能夠發(fā)布相應(yīng)的信息給服務(wù)臺(tái)和支持部門(mén)。為了有效地傳播信息,問(wèn)題管理流程應(yīng)該訪(fǎng)問(wèn)配置管理信息,諸如,誰(shuí)在使用什么,什么時(shí)候使用,他們處在什么位置,加上所有必要的聯(lián)系人明細(xì)。問(wèn)題管理要求的某些明細(xì)能夠從事故管理流程的電話(huà)記錄中的獲得,然而,對(duì)于問(wèn)題管理,在問(wèn)題出現(xiàn)前,使用約定的聯(lián)系地圖和正式的溝通渠道經(jīng)常是更有效果。這種類(lèi)型的信息也經(jīng)常在協(xié)商(或重協(xié)商)SLA的時(shí)候獲得。另一個(gè)來(lái)源是日常服務(wù)回顧,它是服務(wù)水平管理的一部分。1.10 度量通過(guò)維護(hù)來(lái)自事故控制和問(wèn)題/錯(cuò)誤控制的信息,從而可能得到表示服務(wù)質(zhì)量和流程效率的度量標(biāo)準(zhǔn)。1.10.1 問(wèn)題/錯(cuò)誤控制報(bào)告關(guān)于這方面的管理信息包括:v 提出的RFC的數(shù)量以及這些RFC在涉及到的服務(wù)的可用性和可靠性方面的影響;v 根據(jù)問(wèn)題類(lèi)型劃分,每個(gè)部門(mén)或廠商花費(fèi)在調(diào)查和診斷上的時(shí)間;v 在根本問(wèn)題被關(guān)閉或知名錯(cuò)誤被確認(rèn)前,事故發(fā)生的數(shù)量和影響;v 在問(wèn)題管理中,被動(dòng)的支持效果與計(jì)劃的支持效果的比率;v 解決問(wèn)題的資源規(guī)劃:u 人u 其它使用的資源u 成本(相對(duì)于預(yù)算)v 所采取行動(dòng)的簡(jiǎn)單描述關(guān)于IT基礎(chǔ)架構(gòu)中不牢固的組件的信息、違背與業(yè)務(wù)協(xié)定的服務(wù)水平的信息以及與廠商定的服務(wù)水平信息都涉及到可用性管理。問(wèn)題出現(xiàn)的頻度和持續(xù)時(shí)間是相對(duì)于服務(wù)水平的效率的度量標(biāo)準(zhǔn)。要求的信息包括:v 根據(jù)以下方面劃分的問(wèn)題和錯(cuò)誤的數(shù)量:u 狀態(tài)u 服務(wù)u 影響u 分類(lèi)u 用戶(hù)組v 關(guān)閉問(wèn)題上花費(fèi)的全部時(shí)間;v 重大問(wèn)題花費(fèi)的時(shí)間;v 從產(chǎn)生問(wèn)題記錄開(kāi)始,到關(guān)閉問(wèn)題或確認(rèn)知名錯(cuò)誤,花費(fèi)的平均時(shí)間和最長(zhǎng)時(shí)間,可以根據(jù)影響代碼和支持組(包括提供商)劃分;v 任何臨時(shí)解決行動(dòng);v 重大問(wèn)題期望的解決時(shí)間;定期審計(jì)流程要求要求對(duì)所有操作和過(guò)程進(jìn)行定期審計(jì)。審計(jì)的目的是確認(rèn)問(wèn)題管理和支持小組執(zhí)行了預(yù)定義的過(guò)程。審計(jì)應(yīng)該分析主要的問(wèn)題回顧,檢查:v 根據(jù)協(xié)定的計(jì)劃產(chǎn)生和分析報(bào)告;v 具有代表性的事故例子,校驗(yàn)相關(guān)的問(wèn)題已經(jīng)被正確地識(shí)別和記錄;v 具有代表性的問(wèn)題例子,校驗(yàn)問(wèn)題被正確診斷,而且是在規(guī)定的時(shí)期內(nèi);v 具有代表性的知名錯(cuò)誤的例子,校驗(yàn)知名錯(cuò)誤已經(jīng)被授權(quán)的對(duì)配置的變更所清除,并且在規(guī)定的時(shí)期內(nèi);v 升級(jí)的限制被堅(jiān)持執(zhí)行;v 文檔被正確地維護(hù)由問(wèn)題管理職員更新,被接收的人執(zhí)行;v 管理報(bào)告有規(guī)律地生成,并且有明確的目的;v 對(duì)于趨勢(shì)分析表明的跡象,采取了防止措施;v 職員培訓(xùn)記錄。1.10.2 度量的要點(diǎn)下面是有關(guān)度量的要點(diǎn):v 在制定規(guī)范期間,為流程定義想要達(dá)到的效果的度量。計(jì)劃在問(wèn)題管理運(yùn)營(yíng)開(kāi)始的時(shí)候使用它們作為控制,以評(píng)估效果,并客觀地估計(jì)趨勢(shì)。如果可能的話(huà),提前或都在運(yùn)營(yíng)開(kāi)始的前幾周設(shè)置實(shí)際的目標(biāo)。如果可能,還可以從當(dāng)前支持活動(dòng)中獲得統(tǒng)計(jì)數(shù)據(jù),作為設(shè)置目標(biāo)的基礎(chǔ)。這些有助于以后鑒定引入問(wèn)題管理后所增加的益處;v 不要設(shè)置不可衡量的目標(biāo);v 當(dāng)購(gòu)買(mǎi)支持工具時(shí),在產(chǎn)品評(píng)估和系統(tǒng)設(shè)計(jì)階段,拿相應(yīng)的度量來(lái)估計(jì),盡量獲得能夠提供必要統(tǒng)計(jì)的工具;v 對(duì)于關(guān)鍵效果標(biāo)準(zhǔn),開(kāi)發(fā)生產(chǎn)報(bào)表的過(guò)程。問(wèn)題管理應(yīng)該有規(guī)律地(如一月一次)將實(shí)際達(dá)到的效果與所有設(shè)置的目標(biāo)比較回顧。記錄每次回顧的結(jié)果,以用于審計(jì)。如果目標(biāo)必須降低,要確認(rèn)原因是目標(biāo)太高,而實(shí)際運(yùn)營(yíng)太差。問(wèn)題管理運(yùn)營(yíng)中的任何不足應(yīng)該被回溯,使之在源頭恢復(fù)正常;v 規(guī)劃設(shè)立正式的流程效果和效率的回顧,特別注意客戶(hù)的需求。確保運(yùn)營(yíng)中的流程能夠滿(mǎn)足所有支持需求;v 規(guī)劃逐步設(shè)置更困難的目標(biāo),這要與引入問(wèn)題管理流程預(yù)期的益處一起考慮;v 監(jiān)視成功的問(wèn)題管理系統(tǒng)對(duì)職員工作量的影響,經(jīng)驗(yàn)表明有效的流程,特別是再加上有效的變更管理和發(fā)布質(zhì)量控制,迅速地降低了事故和問(wèn)題的影響范圍。事故數(shù)量的降低,以及由此來(lái)的支持請(qǐng)求的減少,導(dǎo)致了職員人數(shù)的下降。新的應(yīng)用和新的用戶(hù)會(huì)增加問(wèn)題和事故,因此,問(wèn)題管理應(yīng)該被告知任何影響工作量的預(yù)期的變更,以便做
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 材料力學(xué)與智能材料重點(diǎn)基礎(chǔ)知識(shí)點(diǎn)
- 高考數(shù)學(xué)應(yīng)試技巧試題及答案輔導(dǎo)
- 信息處理技術(shù)員考前指導(dǎo)試題及答案
- 斗輪機(jī)火災(zāi)應(yīng)急預(yù)案(3篇)
- 行政法與民主體制的關(guān)系試題及答案
- 護(hù)士火災(zāi)應(yīng)急預(yù)案問(wèn)題分析(3篇)
- 高考作文撬動(dòng)未來(lái)的試題與答案
- 網(wǎng)絡(luò)協(xié)議與實(shí)現(xiàn)試題及答案
- 高考數(shù)學(xué)細(xì)節(jié)題型與答案2023解析
- 高考數(shù)學(xué)讓人困擾的試題及答案
- 電氣控制及PLC應(yīng)用技術(shù)(基于西門(mén)子S7-1200)活頁(yè)式 課件 項(xiàng)目九 西門(mén)子S7-1200高級(jí)應(yīng)用
- 初中函數(shù)-圖像練習(xí)坐標(biāo)紙(A4)直接打印版本
- 各級(jí)無(wú)塵室塵埃粒子測(cè)量表
- 成人本科學(xué)士學(xué)位英語(yǔ)詞匯
- 第7課《溜索》一等獎(jiǎng)創(chuàng)新教學(xué)設(shè)計(jì)
- WMO五年級(jí)初級(jí)測(cè)評(píng)專(zhuān)項(xiàng)訓(xùn)練
- 班主任節(jié)PPT幻燈片課件
- 北師大高中英語(yǔ)必修一 (Celebrations)課件(第8課時(shí))
- 中興(ZXA10-XPON)高級(jí)工程師認(rèn)證考試題庫(kù)(含答案)
- 單值-移動(dòng)極差X-MR控制圖-模板
- 建筑水電安裝施工專(zhuān)項(xiàng)方案
評(píng)論
0/150
提交評(píng)論