數(shù)據(jù)中心監(jiān)控故障管理辦法-1.0_第1頁(yè)
數(shù)據(jù)中心監(jiān)控故障管理辦法-1.0_第2頁(yè)
數(shù)據(jù)中心監(jiān)控故障管理辦法-1.0_第3頁(yè)
數(shù)據(jù)中心監(jiān)控故障管理辦法-1.0_第4頁(yè)
數(shù)據(jù)中心監(jiān)控故障管理辦法-1.0_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、內(nèi)部資料注意保密監(jiān)控設(shè)備故障管理辦法 第一章總則第一條為提升監(jiān)控設(shè)備維護(hù)水平,提高監(jiān)控設(shè)備故障處理能 力,提升動(dòng)力、空調(diào)維護(hù)的支撐能力,特制訂本管理辦法。第二條本管理辦法所涉及的設(shè)備特指集成管理平臺(tái)包含的設(shè)備。第三條設(shè)備故障處理工作的基本任務(wù):(一)加強(qiáng)設(shè)備維護(hù)管理,做好預(yù)防性維護(hù),保證集健康系統(tǒng)穩(wěn)定、可靠地運(yùn)行;(二)及時(shí)排除安全隱患,防止重大安全事故的發(fā)生;(三)完善應(yīng)急保障方案,減少故障歷時(shí);(四)積極采用新技術(shù),改進(jìn)維護(hù)方法,提高工作效率;(五)合理調(diào)整系統(tǒng)配置,提高效率,延長(zhǎng)集成管理平臺(tái)設(shè)備使 用壽命。第四條本管理辦法是監(jiān)控設(shè)備故障管理的規(guī)章制度,各相關(guān)專業(yè)處理有關(guān)監(jiān)控設(shè)備的故障問(wèn)題

2、,以本辦法為準(zhǔn)。第二章故障分類第五條故障級(jí)別分為重大故障、嚴(yán)重故障和一般故障三類。第六條重大故障:集成管理平臺(tái)設(shè)備發(fā)生以下任意一種情況的即為嚴(yán)重故障:(一)監(jiān)控軟件故障,導(dǎo)致系統(tǒng)癱瘓;(二)接入層交換機(jī)故障,導(dǎo)致被監(jiān)控的設(shè)備大范圍通訊中斷;(三)監(jiān)控下掛的某個(gè)子系統(tǒng)重要功能癱瘓,使該子系統(tǒng)失去主要作用;(四)監(jiān)控兩臺(tái)主、備核心交換機(jī)同時(shí)宕機(jī),導(dǎo)致系統(tǒng)癱瘓;(五)監(jiān)控?cái)?shù)據(jù)庫(kù)宕機(jī),導(dǎo)致系統(tǒng)癱瘓;(六)監(jiān)控服務(wù)器宕機(jī),導(dǎo)致系統(tǒng)癱瘓;(七)串口服務(wù)器故障,導(dǎo)致大量機(jī)房無(wú)法監(jiān)控;(八)監(jiān)控供電異常導(dǎo)致設(shè)備斷電,系統(tǒng)癱瘓;(九)由于網(wǎng)絡(luò)原因,導(dǎo)致監(jiān)控?zé)o法正常使用;第七條嚴(yán)重故障:監(jiān)控設(shè)備發(fā)生以下任意一種情

3、況的即為嚴(yán)重故障:(一)監(jiān)控兩臺(tái)主、備交換機(jī)其中一臺(tái)宕機(jī);(二)接入層交換機(jī)故障,導(dǎo)致少量被監(jiān)控的設(shè)備通訊中斷;(三)串口服務(wù)器故障,導(dǎo)致少量機(jī)房無(wú)法監(jiān)控;(四)監(jiān)控下掛的某個(gè)子系統(tǒng)發(fā)生故障,導(dǎo)致該子系統(tǒng)部分功能3D模型等功能無(wú)法使用,但不影失效,但不影響監(jiān)控;(五)由于系統(tǒng)故障導(dǎo)致報(bào)表、響監(jiān)控;(六)監(jiān)控桌面云客戶端發(fā)生故障,導(dǎo)致所有集成管理平臺(tái)客戶 端無(wú)法使用;(七)監(jiān)控系統(tǒng)發(fā)生間歇性、隨機(jī)性、重復(fù)性的退出操作,導(dǎo)致 監(jiān)控工作無(wú)法正常開展;第八條一般故障:除重大故障和嚴(yán)重故障外監(jiān)控發(fā)生的其他故障即為一般故障。第三章故障管理職責(zé)第九條故障管理職責(zé):(一)監(jiān)控值班人員負(fù)責(zé)故障的實(shí)時(shí)監(jiān)控、上報(bào)、

4、跟蹤處理及閉 環(huán)管理,負(fù)責(zé)故障處理記錄、分析報(bào)告、典型案例的歸口管理。(二)IT維護(hù)支撐人員負(fù)責(zé)系統(tǒng)軟硬件故障的排查與處理,對(duì)于 無(wú)法解決的疑難問(wèn)題,上報(bào)運(yùn)維主管 /項(xiàng)目經(jīng)理弁聯(lián)系系統(tǒng)廠家請(qǐng)求 技術(shù)支持。故障處理完成后,IT維護(hù)負(fù)責(zé)故障處理記錄、故障分析報(bào) 告、故障典型案例的撰寫弁報(bào)送運(yùn)維主管項(xiàng)目經(jīng)理審核,審核通過(guò) 后送監(jiān)控值班人員歸檔。第四章故障報(bào)告制度第十條設(shè)備故障統(tǒng)計(jì):(一)監(jiān)控的設(shè)備出現(xiàn)故障,應(yīng)及時(shí)做好各項(xiàng)記錄,弁定期對(duì)故 障處理情況進(jìn)行跟蹤統(tǒng)計(jì)。(二)設(shè)備故障處理記錄內(nèi)容應(yīng)包括故障現(xiàn)象、故障類型、故障 起始時(shí)間、故障修復(fù)時(shí)間、故障歷時(shí)、故障原因分析及解決情況、 故障處理情況及責(zé)任分析

5、、故障處理人等。(三)故障應(yīng)定期進(jìn)行匯總統(tǒng)計(jì),匯總統(tǒng)計(jì)時(shí)應(yīng)根據(jù)故障類型, 進(jìn)行分類匯總。對(duì)涉及設(shè)備質(zhì)量方面的問(wèn)題,應(yīng)及時(shí)上報(bào)項(xiàng)目經(jīng)理。(四)定期(每季度或每月)統(tǒng)計(jì)發(fā)生的監(jiān)控系統(tǒng)設(shè)備故障、故 障原因、故障處理辦法、故障歷時(shí)等,形成月報(bào)表進(jìn)行匯報(bào)。第十一條故障上報(bào)制度:(一)監(jiān)控值班人員發(fā)現(xiàn)故障后,應(yīng)對(duì)故障進(jìn)行預(yù)判斷與分析, 弁對(duì)故障進(jìn)行預(yù)處理,10分鐘內(nèi)將故障情況通知IT維護(hù)支撐人員。(二)IT維護(hù)支撐人員接到通知后,應(yīng)對(duì)故障現(xiàn)象進(jìn)行分析,對(duì) 影響范圍進(jìn)行判斷,確定故障級(jí)別。重大故障應(yīng)10分鐘內(nèi)上報(bào)動(dòng)力維護(hù)處項(xiàng)目經(jīng)理,嚴(yán)重故障應(yīng) 30分鐘內(nèi)上報(bào)項(xiàng)目經(jīng)理,一般故障在 處理完畢后上報(bào)項(xiàng)目經(jīng)理。(三

6、)運(yùn)維項(xiàng)目經(jīng)理按照故障級(jí)別與故障的影響程度,上報(bào)甲方 主管,重大故障需上報(bào)公司分管領(lǐng)導(dǎo)。第五章故障處理第十二條 故障處理原則:當(dāng)監(jiān)控系統(tǒng)設(shè)備出現(xiàn)故障時(shí),應(yīng)首 先保障系統(tǒng)的正常運(yùn)行,在不影響系統(tǒng)運(yùn)行的前提下,進(jìn)行設(shè)備故 障的搶修。第十三條監(jiān)控系統(tǒng)設(shè)備故障時(shí),監(jiān)控值班人員要立即通知IT維護(hù)支撐人員,IT維護(hù)支撐人員根據(jù)故障現(xiàn)象判斷故障影響程度,進(jìn)行故障的處理。監(jiān)控值班人員負(fù)責(zé)組織協(xié)調(diào)故障處理工作,弁主動(dòng) 跟蹤故障處理過(guò)程,直至故障處理完畢。第十四條 監(jiān)控系統(tǒng)設(shè)備故障處理流程分為故障發(fā)現(xiàn)階段、故 障處理階段、故障結(jié)束階段三個(gè)階段:(三)故障發(fā)現(xiàn)階段:監(jiān)控值班人員發(fā)現(xiàn)監(jiān)控出現(xiàn)故障,應(yīng)首先 對(duì)出現(xiàn)的故障

7、進(jìn)行判斷,在5分鐘內(nèi)通知IT維護(hù)支撐人員,IT維護(hù)支 撐人員負(fù)責(zé)后續(xù)故障處理。(四)故障處理階段:分為初級(jí)處理、專業(yè)處理、技術(shù)支援處理 三個(gè)步驟。初級(jí)處理:監(jiān)控值班人員監(jiān)測(cè)到故障發(fā)生后,監(jiān)控值班人 員應(yīng)根據(jù)實(shí)際情況對(duì)故障進(jìn)行分析與預(yù)處理。專業(yè)處理:IT維護(hù)支撐人員按故障處理原則對(duì)集成管理平 臺(tái)設(shè)備故障組織搶修,監(jiān)控值班人員向上級(jí)機(jī)構(gòu)說(shuō)明故障原因和處理過(guò)程及結(jié)果。技術(shù)支援處理:IT維護(hù)支撐人員如不能對(duì)集成管理平臺(tái)設(shè) 備出現(xiàn)的故障作出有效處理時(shí), 需升級(jí)到技術(shù)支援階段。IT維護(hù)人員 將相關(guān)情況上報(bào)動(dòng)力維護(hù)處項(xiàng)目經(jīng)理,動(dòng)力維護(hù)處項(xiàng)目經(jīng)理協(xié)調(diào)系 統(tǒng)廠家進(jìn)行技術(shù)支持,IT維護(hù)支撐人員負(fù)責(zé)跟進(jìn)系統(tǒng)廠家的處

8、理過(guò) 程,弁在故障處理結(jié)束后生成故障分析報(bào)告。(五)故障結(jié)束階段:根據(jù)故障處理情況可細(xì)分為故障恢復(fù)確認(rèn)、 故障總結(jié)、故障質(zhì)檢歸檔入知識(shí)庫(kù)、故障延期督辦共四項(xiàng)任務(wù)。故障恢復(fù)確認(rèn):規(guī)范故障恢復(fù)的確認(rèn)過(guò)程。監(jiān)控人員和IT維護(hù)人員協(xié)調(diào)配合故障處理,負(fù)責(zé)對(duì)故障恢復(fù)結(jié)果進(jìn)行測(cè)試確認(rèn), 確定故障完全恢復(fù)。故障總結(jié):故障恢復(fù)后,需及時(shí)對(duì)故障進(jìn)行分析總結(jié),IT維護(hù)支撐人員需在故障處理完畢后一周內(nèi)生成故障處理記錄、故障 分析報(bào)告、故障典型案例(只針對(duì)重大故障與嚴(yán)重故障),監(jiān)控值 班人員負(fù)責(zé)以上報(bào)告的歸口管理。故障入知識(shí)庫(kù)、質(zhì)檢歸檔:故障解決后,如果有新的經(jīng)驗(yàn) 積累,或形成系統(tǒng)的解決方案,監(jiān)控值班人員負(fù)責(zé)將故障處理經(jīng)驗(yàn) 歸檔,供相關(guān)班組成員學(xué)習(xí)使用。故障的延期解決與督辦:對(duì)于集成管理平臺(tái)設(shè)備故障已有 解決方案但是短期內(nèi)因客觀條件限制尚無(wú)法解決的故障,如

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論