信息網(wǎng)絡(luò)運(yùn)行維護(hù)管理規(guī)范_第1頁
信息網(wǎng)絡(luò)運(yùn)行維護(hù)管理規(guī)范_第2頁
信息網(wǎng)絡(luò)運(yùn)行維護(hù)管理規(guī)范_第3頁
信息網(wǎng)絡(luò)運(yùn)行維護(hù)管理規(guī)范_第4頁
信息網(wǎng)絡(luò)運(yùn)行維護(hù)管理規(guī)范_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余47頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、信息系統(tǒng)運(yùn)維事件管理規(guī)范1.1 適用范圍本規(guī)范適用于信息系統(tǒng)運(yùn)維事件,包括對信息系統(tǒng)的使用咨詢,系統(tǒng)故障,以及有關(guān)業(yè)務(wù)應(yīng)用的支持要求。1.2 定義與術(shù)語術(shù)語術(shù)語解釋?shí)徫籄B1一個崗位安排兩個人,其中一個主要負(fù)責(zé),稱為A角,當(dāng)Aft不能履行職責(zé)時,由B角替代.呼叫中心接收用戶運(yùn)維請求的受理平臺。事件管理和呼叫中心一起組成事件處理流程,有效解決各類IT突發(fā)事件,盡快恢復(fù)IT服務(wù)。配置管理管理各IT資產(chǎn)系統(tǒng)(配置元素,配置項)的流程,包括相互間的關(guān)聯(lián)與依賴關(guān)系。配置管理數(shù)據(jù)庫對所有IT組件、組件的不同版本和狀態(tài)以及組件之間的相互關(guān)系進(jìn)行跟蹤、記錄。運(yùn)維管理知識庫操作指南,開發(fā)文檔、技術(shù)文檔、驗收文檔

2、等技術(shù)資料的集合。影響程度問題造成對IT環(huán)境的影響范圍,包括對其他IT系統(tǒng),對相關(guān)人員等。優(yōu)先級問題需要找到解決方法和處理措施的緊急程度。重人故障在各系統(tǒng)的系統(tǒng)故障分級中定義為一級故障的故障現(xiàn)象,均視為重人故障。一般故障在各系統(tǒng)的系統(tǒng)故障分級中定義為二、三級故障的故障現(xiàn)象,視為一般故障。1.3 角色與職責(zé)本過程設(shè)立運(yùn)維負(fù)責(zé)人、支持受理人、問題反映人、各系統(tǒng)管理崗,崗位設(shè)立AB角,負(fù)責(zé)信息系統(tǒng)運(yùn)維事件的管理,具體職責(zé)要求如下:廳P角色名稱定義/職責(zé)1運(yùn)維負(fù)責(zé)人1 .全面負(fù)責(zé)運(yùn)維各項工作.2 .審核審批各項運(yùn)行維護(hù)制度規(guī)范和工作流程,負(fù)責(zé)協(xié)調(diào)各部門間的工作。3 .負(fù)責(zé)與其他部門間的協(xié)調(diào)工作.4 .

3、負(fù)責(zé)建立健全本級運(yùn)維與上級運(yùn)維部門、本級運(yùn)維與下級運(yùn)維之間高級技術(shù)支持之間的順暢溝通機(jī)制。5 .負(fù)責(zé)本級運(yùn)維隊伍的管理、培訓(xùn)工作.6 .決責(zé)落實(shí)上級運(yùn)維部門提出的運(yùn)行維護(hù)任務(wù)。7 .管理運(yùn)行維護(hù)部門員工的工作。8 .通過呼叫中心事件管理報告,監(jiān)控事件管理的效率,改善運(yùn)維服務(wù)質(zhì)量.9 .負(fù)責(zé)系統(tǒng)重大故障及緊急事件的處理,并負(fù)責(zé)組織進(jìn)行相關(guān)事故原因的調(diào)查分析,形成事故分析se告和相應(yīng)的解決方案.10 .在業(yè)務(wù)部門,信息中心領(lǐng)導(dǎo),以及信息中心內(nèi)部維持良好的溝通渠道。11 .完善和維護(hù)事件管理系統(tǒng)。2支持受理人1 .負(fù)責(zé)接收用戶反映的信息系統(tǒng)問題,并對問題記錄、整理。2 .負(fù)責(zé)對事件分類和提供初始的支

4、持。3 .將問題的解決步驟文檔化。4 .將服務(wù)請求分派給適當(dāng)?shù)墓ぷ鹘M。5 .跟蹤服務(wù)請求的處理過程以確保在規(guī)定的時間內(nèi)解決問題,同時在系統(tǒng)里更新相應(yīng)信息.6 .對于無法解答的技術(shù)問題,及時轉(zhuǎn)送其他相關(guān)人員;廳P角色名稱定義/職責(zé)對于無法解答的業(yè)務(wù)問題,及時提交運(yùn)維負(fù)責(zé)人。7 .與服務(wù)請求的提交者進(jìn)行直接的溝通,通報事件的處理情況。8 .在結(jié)束事件之前要確認(rèn)服務(wù)請求的提交者對事件的解決過程及結(jié)果是否滿意。9 .作為事件的責(zé)任人,監(jiān)控,跟蹤所有的事件處理過程,并作為和客戶溝通的唯一聯(lián)系點(diǎn)。10 .編制管理信息報告。3問題反應(yīng)人1 .對于本級運(yùn)維解決有困難的問題,負(fù)責(zé)向上級運(yùn)維中心、高級技術(shù)支持或國

5、家電網(wǎng)運(yùn)維部門及時準(zhǔn)確地上報。2 .對于緊急、重大故障問題,負(fù)責(zé)向上級運(yùn)維中心、高級技術(shù)支持或國家電網(wǎng)運(yùn)維部門及時準(zhǔn)確地上報。3 .負(fù)責(zé)全程配合、協(xié)助國家電網(wǎng)解決上報問題,并跟蹤問題的進(jìn)展、解決、落實(shí)過程。4系統(tǒng)管理員1 .在規(guī)定的時間內(nèi)解決服務(wù)請求。2 .對禾1用“臨時方案”解決的服務(wù)需求,在資源及時間允許時應(yīng)找到問題根源。3 .在需要時(有重大故障及升級需求時),及時利用其它資源(開發(fā)商或供應(yīng)商)幫助用戶解決問題。4 .將服務(wù)請求的解決方案的步驟文檔化,并錄入系統(tǒng)。5 .更新文檔記錄。6 .和主機(jī)管理人、存儲管理人、數(shù)據(jù)庫管理人、中間件管理人一道,對業(yè)務(wù)系統(tǒng)實(shí)行全方位的管理。1.4 工作流

6、程與活動參與事件管理、服務(wù)請求管理、重大故障處理、事件升級、一般事件處理、服務(wù)報告管理流程涉及的系統(tǒng)運(yùn)維工作.具體工作內(nèi)容如下:1.3.1事件管理運(yùn)維事件管理的總體流程如圖1問題響應(yīng)管理總體流程所示:1 .支持受理人接受來自各種渠道的服務(wù)請求、告警、故障事件等;2 .通過服務(wù)請求管理系統(tǒng)將事件進(jìn)行記錄、分類、確定優(yōu)先級;3 .根據(jù)預(yù)定義的重大故障分類,判斷是否啟動重大故障處理流程(見圖3);4 .如遇緊急事件,則直接執(zhí)行升級流程(見圖4),由運(yùn)維負(fù)責(zé)人直接調(diào)用適當(dāng)資源盡快處理;一般事件則執(zhí)行一般事件處理流程(見圖5)。(圖1問題響應(yīng)管理總體流程)1.3.2服務(wù)請求管理1 .支持受理人接受來自各

7、種渠道提交的有關(guān)信息系統(tǒng)運(yùn)維的服務(wù)請求、告警、故障事件等;2 .確認(rèn)事件請求人是否屬于服務(wù)對象.如果不是,則拒絕服務(wù)轉(zhuǎn)交其它部門處理;問題概要需要在服務(wù)請求記錄表(見附錄1)中進(jìn)行詳細(xì)的記錄,如詳細(xì)情況描述;1)按照預(yù)定義的“系統(tǒng)服務(wù)分類”對事件涉及的系統(tǒng)進(jìn)行分類,如:網(wǎng)絡(luò)系統(tǒng),主機(jī)系統(tǒng)、營銷系統(tǒng)等;2)根據(jù)預(yù)定義的配置管理數(shù)據(jù)庫的相關(guān)內(nèi)容,將事件與配置項聯(lián)系起來;3)選擇事件的影響程度:低:造成個別用戶不能正常訪問。中:局域網(wǎng)內(nèi)超過5%的用戶不能正常訪問。高:營銷系統(tǒng)、“95598"系統(tǒng)等核心業(yè)務(wù)系統(tǒng)大面積癱瘓,不能正常對公眾提供服務(wù),造成負(fù)面的社會影響.4)選擇優(yōu)先級:無優(yōu)先級:

8、無時限要求,在方便的時候排除故障。低:24小時內(nèi)排除故障.中:8小時內(nèi)排除故障。高:4小時內(nèi)排除故障。最高:2小時內(nèi)排除故障。服務(wù)請求管理流程如圖4所示(圖2服務(wù)請求流程)1.3.3重大故障管理支持受理人完成服務(wù)請求流程后,如果事件是屬于影響程度最高的故障,則即刻啟動重大故障處理流程;1 .向最終用戶發(fā)出服務(wù)中斷通知;2 .支持受理人同時要盡快將故障情況向運(yùn)維負(fù)責(zé)人匯報;3 .運(yùn)維負(fù)責(zé)人應(yīng)立刻通知相關(guān)領(lǐng)導(dǎo)以及災(zāi)難恢復(fù)領(lǐng)導(dǎo)小組(由主要業(yè)務(wù)部門領(lǐng)導(dǎo),信息中心領(lǐng)導(dǎo),主管領(lǐng)導(dǎo)等組成),決定本故障是否通過上級運(yùn)維部門才能解決,如果是,則由問題反映者聯(lián)系上級運(yùn)維中心,上級運(yùn)維部門根據(jù)有關(guān)流程予以解決;4

9、.如果不用上級運(yùn)維部門解決,則根據(jù)恢復(fù)時間標(biāo)準(zhǔn)確定是否啟動應(yīng)急預(yù)案;確定需要啟動應(yīng)急預(yù)案后,由應(yīng)急預(yù)案小組執(zhí)行恢復(fù)計劃,使系統(tǒng)盡快恢復(fù)運(yùn)作;5 .同時運(yùn)維負(fù)責(zé)人要召集所有相關(guān)技術(shù)專家(項目組技術(shù)負(fù)責(zé)人,服務(wù)商,廠商以及各系統(tǒng)管理員)進(jìn)行集中診斷,制定系統(tǒng)修復(fù)方案.并由相關(guān)系統(tǒng)管理人聯(lián)合服務(wù)商一起執(zhí)行系統(tǒng)修復(fù)方案;6 .系統(tǒng)修復(fù)并經(jīng)測試成功后,支持受理人發(fā)布系統(tǒng)服務(wù)恢復(fù)通告;7 .聯(lián)合系統(tǒng)管理員在服務(wù)請求系統(tǒng)中將故障的所有信息進(jìn)行更新,如解決方案,關(guān)閉代碼,如果在呼叫登記階段錄入的配置項目,分類等有誤,需要一并修正;8 .聯(lián)合相關(guān)系統(tǒng)管理員準(zhǔn)備“重大故障責(zé)任報告”并提出整改措施;9 .運(yùn)維負(fù)責(zé)人

10、負(fù)責(zé)審閱批準(zhǔn)重大事件責(zé)任報告,并向相關(guān)領(lǐng)導(dǎo)分發(fā)此報告;10 .運(yùn)維負(fù)責(zé)人負(fù)責(zé)跟進(jìn)整改措施。重大故障管理流程如圖5所示.(圖(圖3重大故障處理流程)1.3.4事件升級如果支持受理人接到緊急的服務(wù)請求(優(yōu)先級最高),或在一般事件處理流程中,事件的完成時限超過了承諾的服務(wù)時限時,支持受理人可以啟動升級流程。1,支持受理人通知運(yùn)維負(fù)責(zé)人,請求支持;2.運(yùn)維負(fù)責(zé)人協(xié)調(diào)相關(guān)資源解決問題;3,支持受理人負(fù)責(zé)跟蹤事件進(jìn)度以及確定事件狀態(tài);4.事件解決后,由支持受理人與服務(wù)請求者確認(rèn)并更新事件記錄;5,支持受理人關(guān)閉事件。事件升級流程如圖4所示。(圖4事件升級流程)1.3.5 一般事件處理1、支持受理人接受的服

11、務(wù)請求如果不屬于“重大故障”或“緊急事件”,按照一般事件處理流程完成事件的處理。一般事件處理流程如圖6所示。2、如果服務(wù)請求屬于指定工作組的責(zé)任,支持受理人直接將服務(wù)請求分派給各工作組。對分派給指定工作組的事件,支持受理人要負(fù)責(zé)跟蹤事件的解決狀態(tài),并定期監(jiān)督相關(guān)服務(wù)人員盡快完成。如果相關(guān)服務(wù)組在接近服務(wù)時限(可定為超過服務(wù)時限的80%的時間)仍沒有確定的解決方案,支持受理人需請求相關(guān)專家協(xié)助完成。對不能在服務(wù)時限內(nèi)完成的事件,支持受理人應(yīng)通過升級流程加快事件的解決速度。事件解決后,支持受理人通過電話等方式與呼叫者進(jìn)行確認(rèn),并更新事件記錄,關(guān)閉事件,3、對于非指定工作組處理的事件,支持受理人對事

12、件進(jìn)行診斷分析,嘗試解決.4、對不能在線及時解決的事件,支持受理人應(yīng)先在運(yùn)維管理知識庫中查找相應(yīng)解決方案,找到解決方案后,盡快完成服務(wù)請求。不能解決的事件,請盡快根據(jù)服務(wù)范圍職責(zé)劃分(服務(wù)支持流程人員表),將事件升級給二線支持人員,并跟蹤事件處理狀態(tài)。如果相關(guān)二線支持服務(wù)組在接近服務(wù)時限的最后期限(可定為超過服務(wù)時限的80%的時間)仍沒有確定的解決方案,相應(yīng)系統(tǒng)管理人則需判斷是否需要報請上級運(yùn)維部門予以解決。如果需要,則通過問題反映者向上級運(yùn)維部門報告,上級運(yùn)維部門則按有關(guān)流程予以解決,如果不需要則請求三線支持人員協(xié)助完成,對不能在服務(wù)時限內(nèi)完成的事件,支持受理人應(yīng)通過升級流程加快事件的解決。

13、事件解決后,支持受理人通過電話等方式與服務(wù)請求者進(jìn)行確認(rèn),并更新事件記錄,關(guān)閉事件。(圖5一般事件處理流程)支持受理人是事件管理流程的一線支持.各應(yīng)用系統(tǒng)管理員、網(wǎng)絡(luò)管理員、主機(jī)管理員等是事件管理流程的二線支持工程師開發(fā)商、集成商、設(shè)備供應(yīng)商等外部服務(wù)專家是事件管理流程的三線支持。1.3.6 服務(wù)報告管理服務(wù)主管每月利用服務(wù)記錄表,按照服務(wù)管理的指標(biāo)分類整理各類數(shù)據(jù),形成服務(wù)請求管理報告,提交給運(yùn)維負(fù)責(zé)人進(jìn)行審閱。運(yùn)維負(fù)責(zé)人負(fù)責(zé)與相關(guān)部門及業(yè)務(wù)部門針對服務(wù)管理報告進(jìn)行溝通,如果必要提出諸如用戶培訓(xùn)、系統(tǒng)優(yōu)化等建議,并負(fù)責(zé)跟進(jìn)改進(jìn)計劃。1.5 管理原則1、運(yùn)維中心應(yīng)設(shè)立呼叫中心,做為IT服務(wù)管理

14、與用戶的接口,受理并處理用戶的服務(wù)請求。沒條件設(shè)立呼叫中心的服務(wù)機(jī)構(gòu)應(yīng)設(shè)立服務(wù)熱線.2、除非特別的服務(wù)說明,任何事件處理不應(yīng)繞過服務(wù)熱線來解決。3、所有最終用戶的服務(wù)請求應(yīng)由統(tǒng)一的系統(tǒng)記錄在案,并通過系統(tǒng)完成工作分派,監(jiān)測跟蹤,事件升級管理和質(zhì)量管理。4、呼叫系統(tǒng)應(yīng)包含對事件處理進(jìn)行跟蹤及監(jiān)控的流程.5、負(fù)責(zé)呼叫系統(tǒng)的員工應(yīng)盡最大可能在一線解決用戶的問題。6、對所有問題的解決方法應(yīng)在呼叫系統(tǒng)所使用的系統(tǒng)工具中存檔。7、應(yīng)盡量將服務(wù)請求與配置項目聯(lián)系起來。8、應(yīng)及時向提交問題的最終用戶通報問題的處理情況,系統(tǒng)維護(hù)服務(wù)的進(jìn)度和情況也應(yīng)由服務(wù)請求支持員工與最終用戶進(jìn)行溝通。9、服務(wù)請求完成后應(yīng)確定最

15、終用戶對事件解決方案的滿意程度.10、應(yīng)完整的描述和記錄當(dāng)前信息中心為其它部門所提供的服務(wù)、服務(wù)級別、以及提供響應(yīng)的流程文檔.1.6 附錄1.6.1 附表1服務(wù)請求記錄表服務(wù)請求記錄表請求信息報修時間故障地點(diǎn)客戶電話IP地址記錄人系統(tǒng)服務(wù)分類:口網(wǎng)絡(luò)系統(tǒng)口安全系統(tǒng)口主機(jī)系統(tǒng)口存儲備份系統(tǒng)口“95598”系統(tǒng)口營銷系統(tǒng)口生產(chǎn)管理系統(tǒng)DOA系統(tǒng)口人力資源系統(tǒng)口財務(wù)系統(tǒng)事件影響程度:口高口中口低優(yōu)先級:最高口高口中口低口無優(yōu)先級故障現(xiàn)象處理過程:信息系統(tǒng)網(wǎng)絡(luò)管理規(guī)范3.1適用范圍本規(guī)范適用于公司本部和基層單位主機(jī)房內(nèi)的網(wǎng)絡(luò)設(shè)備,包括各種路由器、交換機(jī)、防火墻、樓層交換機(jī)以及邊界路由器和將來投入使用的

16、網(wǎng)絡(luò)設(shè)備的管理工作。3.2定于與術(shù)語術(shù)語術(shù)語解釋?shí)徫籄B1一個崗位安排兩個人,其中一個主要負(fù)責(zé),稱為A角,當(dāng)A角不能履行職責(zé)時,由Bt替代.網(wǎng)絡(luò)事件由于網(wǎng)絡(luò)故障,如路由故障、交換故障、IP地址沖突,線路故障、網(wǎng)絡(luò)設(shè)備故障等造成網(wǎng)絡(luò)中斷或服務(wù)質(zhì)量下降的任何事件。3.3角色與職責(zé)設(shè)立網(wǎng)絡(luò)管理崗,崗位設(shè)立AB角,負(fù)責(zé)網(wǎng)絡(luò)和網(wǎng)絡(luò)設(shè)備的運(yùn)行維護(hù)管理和監(jiān)控保障網(wǎng)絡(luò)通訊的暢通。具體職責(zé)要求如下廳P角色職責(zé)1支持受理人將服務(wù)請求分派給適當(dāng)?shù)墓芾砣藛T.2網(wǎng)絡(luò)管理員1、負(fù)責(zé)網(wǎng)絡(luò)基礎(chǔ)運(yùn)維工作,包括參與網(wǎng)絡(luò)規(guī)劃與建設(shè);版本發(fā)布;網(wǎng)絡(luò)設(shè)備用戶管理;負(fù)責(zé)IP地址規(guī)劃、分配和管理;協(xié)助安全管理員對網(wǎng)絡(luò)安全狀況進(jìn)行評估,提出

17、安全解決方案;參與網(wǎng)絡(luò)災(zāi)備管理;定期向運(yùn)維負(fù)責(zé)人提交網(wǎng)絡(luò)系統(tǒng)運(yùn)行管理報告等。2、完成網(wǎng)絡(luò)配置工作,如:路由、交換協(xié)議的配置等;負(fù)責(zé)IP地址的規(guī)劃、分配和管理;進(jìn)行網(wǎng)絡(luò)設(shè)備用戶管理.3、分析解決網(wǎng)絡(luò)故障;對于重大、緊急網(wǎng)絡(luò)問題,應(yīng)立廳p角色職責(zé)即向運(yùn)維負(fù)責(zé)人匯報.對于外部(傷J如電信局)原因造成的網(wǎng)絡(luò)故障,應(yīng)立即向運(yùn)維負(fù)責(zé)人匯報,并及時通知有關(guān)部門予以解決。4、定期進(jìn)行網(wǎng)絡(luò)檢查,檢查的內(nèi)容應(yīng)包括:網(wǎng)絡(luò)設(shè)備狀況、網(wǎng)絡(luò)設(shè)備日志錯誤報告、網(wǎng)絡(luò)設(shè)備配置備份、IOS版本、補(bǔ)丁級別等.5、定期編寫網(wǎng)絡(luò)維護(hù)報告,主要包括網(wǎng)絡(luò)帶寬性能報告,網(wǎng)絡(luò)設(shè)備預(yù)防性維護(hù)報告,網(wǎng)絡(luò)資源調(diào)整報告.6、配置信息管理:對目前使用的

18、網(wǎng)絡(luò)設(shè)備進(jìn)行配置管理,記錄設(shè)備的基本信息,如:主機(jī)名、序列號、操作系統(tǒng)和版本號、內(nèi)存、容量、模塊信息、剩余插槽、管理IP、端口IP、端口的連接信息等;記錄設(shè)備的維護(hù)信息,如:購買時間、上線時間、退役時間、廠商、集成商、服務(wù)提供商、維修記錄等;及時變更配置信息。7、故障監(jiān)控:監(jiān)控所有網(wǎng)絡(luò)環(huán)境內(nèi)設(shè)備的拓?fù)湫畔⒑捅O(jiān)控關(guān)鍵鏈路的狀態(tài);接收網(wǎng)絡(luò)設(shè)備發(fā)送的trap信息和日志,并進(jìn)行分析、報警.監(jiān)控的網(wǎng)絡(luò)設(shè)備的事件應(yīng)至少包括:鏈路狀態(tài):通/斷,網(wǎng)絡(luò)設(shè)備:DOW/UP,網(wǎng)絡(luò)設(shè)備故障:如模塊down,電源、風(fēng)扇故障,性能監(jiān)控中超出閾值的事件,重復(fù)IP等。8、性能監(jiān)控:監(jiān)控廣域網(wǎng)鏈路的性能,性能指標(biāo)應(yīng)包括流量、丟

19、包、錯包、ping延遲等;監(jiān)控網(wǎng)絡(luò)設(shè)備的性能,性能指標(biāo)應(yīng)包括CPlffl用率、內(nèi)存等。9、網(wǎng)絡(luò)管理員為應(yīng)用、操作系統(tǒng)管理員提供網(wǎng)絡(luò)方面的支持.10、網(wǎng)絡(luò)管理員應(yīng)配合安全管理員定期檢查非法訪問、廳P角色職責(zé)網(wǎng)絡(luò)入侵檢測工作,如,失敗的非法登錄、網(wǎng)絡(luò)流量分析等,并保留記錄,歸檔備查.9、其他相關(guān)網(wǎng)絡(luò)管理工作。3運(yùn)維負(fù)責(zé)人負(fù)責(zé)組織相關(guān)資源對重大故障及緊急故障進(jìn)行事故原因的調(diào)查分析。3.4網(wǎng)絡(luò)系統(tǒng)當(dāng)前配置基線3.3.1 網(wǎng)絡(luò)設(shè)備資產(chǎn)信息網(wǎng)絡(luò)設(shè)備實(shí)行分級管理的原則,分為核心層設(shè)備,匯聚層設(shè)備,接入層設(shè)備。其中核心層設(shè)備是網(wǎng)絡(luò)流量的最終承受者和匯聚者,包括網(wǎng)絡(luò)中的核心交換機(jī)和路由器設(shè)備(如公司本部的Qui

20、dwayS8512,CISCO6509交換機(jī),C72067513M雙網(wǎng)絡(luò)核心層設(shè)備),保障核心層網(wǎng)絡(luò)設(shè)備的正常運(yùn)行是網(wǎng)絡(luò)運(yùn)維工作的核心所在匯聚層設(shè)備用于為核心層和接入層提供橋梁作用,通常實(shí)現(xiàn)網(wǎng)絡(luò)管理,防止廣播風(fēng)暴,快速交換數(shù)據(jù)包等功能,公司本部匯聚層設(shè)備為所有邊界路由器。接入層主要功能是為最終用戶提供對網(wǎng)絡(luò)訪問的途徑,接入層設(shè)備包括各設(shè)備問接入交換機(jī)。網(wǎng)絡(luò)設(shè)備資產(chǎn)配置基線詳見附表1網(wǎng)絡(luò)設(shè)備資產(chǎn)列表3.3.2 核心層網(wǎng)絡(luò)設(shè)備配置信息保障核心層設(shè)備的正常工作是運(yùn)維工作的重中之中,核心層網(wǎng)絡(luò)設(shè)備配置表的通常目標(biāo)是為了更好的維護(hù)核心層設(shè)備,提供網(wǎng)絡(luò)中使用的核心硬件和軟件組成的列表,其組成詳見附表2核心

21、層網(wǎng)絡(luò)設(shè)備配置表3.3.3 網(wǎng)絡(luò)拓?fù)鋱D1 .廣域網(wǎng)拓?fù)浣Y(jié)構(gòu)2 .公司本部局域網(wǎng)拓?fù)浣Y(jié)構(gòu)3.5工作流程與活動3.5.1 網(wǎng)絡(luò)事件管理1 .服務(wù)請求受理人接收用戶報告的網(wǎng)絡(luò)相關(guān)事件,根據(jù)問題響應(yīng)流程一服務(wù)請求流程將事件分派給網(wǎng)絡(luò)管理員。2 .網(wǎng)絡(luò)管理員根據(jù)事件的范圍、影響和緊急程度對網(wǎng)絡(luò)事件進(jìn)行分級。(1)一級故障:廣域網(wǎng)絡(luò)因鏈路中斷或質(zhì)量嚴(yán)重下降(丟包率50%),網(wǎng)管、業(yè)務(wù)不可用,且持續(xù)等效停機(jī)時間4小時。局域網(wǎng)絡(luò)由于設(shè)備或鏈路故障造成關(guān)鍵應(yīng)用不能被訪問,業(yè)務(wù)中斷時間4小時。(2)二級故障:廣域網(wǎng)絡(luò)因鏈路中斷或質(zhì)量嚴(yán)重下降(丟包率50%,業(yè)務(wù)不可用,且持續(xù)等效停機(jī)時間2小時。局域網(wǎng)絡(luò)由于設(shè)備或鏈

22、路故障造成關(guān)鍵應(yīng)用不能被訪問,業(yè)務(wù)中斷時間2小時.(3)三級故障:廣域網(wǎng)絡(luò)因鏈路中斷或質(zhì)量嚴(yán)重下降(丟包率50%),業(yè)務(wù)不可用,且持續(xù)等效停機(jī)時間005小時.局域網(wǎng)絡(luò)由于設(shè)備或鏈路故障造成業(yè)務(wù)中斷時間0.5小時。3 .遇有一、二級網(wǎng)絡(luò)故障,網(wǎng)絡(luò)管理員須立刻將事件升級到信息中心運(yùn)維負(fù)責(zé)人。4 .運(yùn)維負(fù)責(zé)人協(xié)調(diào)、組織相關(guān)資源,處理網(wǎng)絡(luò)事件,并通告相關(guān)部門。(1)事件受理人向用戶發(fā)出通知,通報發(fā)生的網(wǎng)絡(luò)事件及進(jìn)展。(2)網(wǎng)絡(luò)管理員聯(lián)合系統(tǒng)服務(wù)商,各系統(tǒng)管理員負(fù)責(zé)相應(yīng)的系統(tǒng),對事件進(jìn)行診斷、定位,查找問題根源。(3)找到原因后需要確定受影響的系統(tǒng)范圍,進(jìn)行緊急修復(fù),如系統(tǒng)隔離、設(shè)置防火墻、路由器規(guī)則,

23、更新系統(tǒng)補(bǔ)丁等。在進(jìn)行修復(fù)時應(yīng)注意采取措施進(jìn)行證據(jù)的收集和保全,記錄或復(fù)制入侵證據(jù)、破壞和損失,歸檔備查.(4)恢復(fù)系統(tǒng)服務(wù)和數(shù)據(jù),網(wǎng)絡(luò)管理員聯(lián)合網(wǎng)絡(luò)服務(wù)商和系統(tǒng)管理員對受到影響的系統(tǒng)進(jìn)行全面評估,并對存在類似隱患的所有系統(tǒng)進(jìn)行分析統(tǒng)計,制定相應(yīng)的解決方案,并由網(wǎng)絡(luò)管理員負(fù)責(zé)跟進(jìn)落實(shí)。5 .對于三級網(wǎng)絡(luò)故障,由網(wǎng)絡(luò)管理員進(jìn)行調(diào)查處理,必要時聯(lián)合系統(tǒng)服務(wù)商和各系統(tǒng)管理員。6 .進(jìn)行網(wǎng)絡(luò)故障修復(fù)、加固防護(hù)所進(jìn)行的配置和更改工作,都需要進(jìn)行相關(guān)測試。故障恢復(fù)后要網(wǎng)絡(luò)管理員要負(fù)責(zé)填寫并維護(hù)網(wǎng)絡(luò)系統(tǒng)故障登記表,負(fù)責(zé)網(wǎng)絡(luò)事件的跟蹤管理。3.5.2 網(wǎng)絡(luò)基礎(chǔ)運(yùn)維管理1、規(guī)劃與建設(shè)。參與網(wǎng)絡(luò)的規(guī)劃、建設(shè)工作,

24、對網(wǎng)絡(luò)建設(shè)中的一些重大問題提出參考意見、建議.提出具體實(shí)施方案并負(fù)責(zé)執(zhí)行。2、版本發(fā)布。網(wǎng)絡(luò)管理員參與項目的測試和發(fā)布,根據(jù)項目要求完成測試網(wǎng)絡(luò)環(huán)境的搭建、測試及維護(hù)工作。3、管理報告.網(wǎng)絡(luò)管理員定期向運(yùn)維負(fù)責(zé)人提交網(wǎng)絡(luò)運(yùn)行狀況報告,報告的內(nèi)容包括當(dāng)期網(wǎng)絡(luò)故障情況、帶寬的使用率和網(wǎng)絡(luò)維護(hù)的任務(wù)完成情況等。4、災(zāi)備計劃。網(wǎng)絡(luò)管理員參與災(zāi)備管理工作,在創(chuàng)建網(wǎng)絡(luò)的災(zāi)難恢復(fù)計劃時,負(fù)責(zé)制定有關(guān)網(wǎng)絡(luò)層面的災(zāi)難恢復(fù)計劃及測試該計劃;在災(zāi)難恢復(fù)計劃的演練時,負(fù)責(zé)網(wǎng)絡(luò)的恢復(fù)演練;在網(wǎng)絡(luò)有大的變更時,負(fù)責(zé)更新災(zāi)難恢復(fù)計劃的相應(yīng)部分;災(zāi)難發(fā)生時,負(fù)責(zé)網(wǎng)絡(luò)的恢復(fù)、切換工作.網(wǎng)絡(luò)災(zāi)備計劃參見網(wǎng)絡(luò)應(yīng)急預(yù)案。5、系統(tǒng)資源

25、變更。在操作系統(tǒng),數(shù)據(jù)庫或各應(yīng)用系統(tǒng)等提出變更需求時,若需要網(wǎng)絡(luò)作相應(yīng)變更,網(wǎng)絡(luò)管理員協(xié)助完成相關(guān)變更。6、用戶管理。創(chuàng)建和維護(hù)網(wǎng)絡(luò)設(shè)備的用戶帳號,定期檢查網(wǎng)絡(luò)設(shè)備用戶權(quán)限,對網(wǎng)絡(luò)設(shè)備的用戶密碼進(jìn)行變更。7、安全管理。網(wǎng)絡(luò)管理員應(yīng)定期評估網(wǎng)絡(luò)設(shè)備及相關(guān)協(xié)議的的安全性,更新IOS補(bǔ)丁,使用訪問控制列表對協(xié)議、端口進(jìn)行配置。8、配置管理。網(wǎng)絡(luò)管理員定期備份網(wǎng)絡(luò)設(shè)備配置文件,按照配置管理的要求提供網(wǎng)絡(luò)的操作系統(tǒng),硬件和配置信息,并以書面形式和電子文檔形式交給機(jī)房值班人員保管,當(dāng)配置信息變更時,及時更新。對于需要保密的部分信息可以采取加密等適當(dāng)?shù)姆绞竭M(jìn)行保護(hù)。3.5.3 網(wǎng)絡(luò)巡查管理3.5.4.1 每

26、天例行工作內(nèi)容檢查核心層設(shè)備硬件運(yùn)行情況,巡查的內(nèi)容包括:硬件設(shè)備狀況,路由狀態(tài)、VLAN犬態(tài)、VRRP犬態(tài)、端口狀態(tài)等.網(wǎng)絡(luò)管理員巡查結(jié)束后提交網(wǎng)絡(luò)設(shè)備巡查報告給運(yùn)維負(fù)責(zé)人,并抄送信息中心負(fù)責(zé)人。3.5.4.2 每周例行工作內(nèi)容檢查網(wǎng)絡(luò)匯聚層硬件運(yùn)行情況,巡查的內(nèi)容包括:硬件設(shè)備狀況,路由狀態(tài)、VLAN犬態(tài)、端口狀態(tài)等。網(wǎng)絡(luò)管理員巡查結(jié)束后提交網(wǎng)絡(luò)設(shè)備巡查報告給運(yùn)維負(fù)責(zé)人,并抄送信息中心負(fù)責(zé)人。3.5.4.3 每月例行工作內(nèi)容對本單位核心層和匯聚層設(shè)備進(jìn)行全面檢查,檢查內(nèi)容包括硬件運(yùn)行情況,日志錯誤報告,網(wǎng)絡(luò)設(shè)備配置備份,IOS版本等.網(wǎng)絡(luò)管理員巡查結(jié)束后提交網(wǎng)絡(luò)設(shè)備巡查報告給運(yùn)維負(fù)責(zé)人,并

27、抄送信息中心負(fù)責(zé)人。對接入層設(shè)備進(jìn)行抽查,檢查內(nèi)容包括接入層設(shè)備硬件運(yùn)行情況,指示燈狀態(tài),網(wǎng)絡(luò)連通狀態(tài)等。3.5.4.4 網(wǎng)絡(luò)故障處理網(wǎng)絡(luò)管理員分析和解決由支持受理人或機(jī)房值班員分派的網(wǎng)絡(luò)故障.故障解決后,將故障原因,解決辦法等信息反饋給支持受理人或機(jī)房值班員。并根據(jù)需要維護(hù)運(yùn)維管理知識庫相關(guān)內(nèi)容。一級故障需在故障恢復(fù)后填寫附表4網(wǎng)絡(luò)系統(tǒng)故障處理報告,提交給運(yùn)維負(fù)責(zé)人。3.5.4.1 故障處理步驟(1)收集故障癥狀,判斷故障原因1)分析現(xiàn)存癥狀2)判斷所屬3)窄化范圍4)判定癥狀5)記錄癥狀(2)分離問題1)從物理層開始向上排查,直到應(yīng)用層。常用于懷疑問題發(fā)生在物理層,或在處理復(fù)雜網(wǎng)絡(luò)問題時使

28、用。2)從應(yīng)用層開始向下排查故障,用于懷疑問題發(fā)生在軟件部分。3)選才¥OSI模型的特定層(數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層)開始故障處理,確定問題是在該層、還是上層或下層(3)糾正問題3.5.4.2 線路故障處理方法1 .當(dāng)線路發(fā)生故障時,首先通過使用ping命令快速判斷是線路運(yùn)營商方面的原因,還是用戶方面的原因,以便分清責(zé)任,盡快加以解決。2 .若屬于線路運(yùn)營商方面的原因,網(wǎng)絡(luò)管理員應(yīng)及時通知運(yùn)營商對問題進(jìn)行診斷,定位,并協(xié)助運(yùn)營商查找問題根源,恢復(fù)網(wǎng)絡(luò)。3 .若鏈路故障是因為對端網(wǎng)絡(luò)中斷引起的,網(wǎng)絡(luò)管理員應(yīng)及時通知對端網(wǎng)絡(luò)管理員對問題進(jìn)行診斷,定位,并協(xié)助對端網(wǎng)絡(luò)管理員查找問題根源,

29、恢復(fù)網(wǎng)絡(luò)4 .若鏈路故障是因本端網(wǎng)絡(luò)引起的,網(wǎng)絡(luò)管理員應(yīng)對問題進(jìn)行診斷、定位、查找問題根源。5 .執(zhí)行系統(tǒng)修復(fù)和測試。詳細(xì)操作步驟可參見附表73.5.4.3 設(shè)備故障處理方法1 .當(dāng)發(fā)生設(shè)備故障時,網(wǎng)絡(luò)管理員首先確認(rèn)是軟件故障還是硬件故障。2 .如判斷為軟件故障,如配置文件丟失或非法更改,網(wǎng)絡(luò)管理員利用事先的備份配置文件重新配置設(shè)備并進(jìn)行測試。3 .如判斷為硬件故障,首先檢查設(shè)備的端口的LED狀態(tài)指示燈是否正常,如端口指示燈顯示故障,將該端口網(wǎng)線連接到其他冗余端口,如端口指示燈正常,則需要繼續(xù)查找。4 .其次查看特定部件,如為板卡故障,切換到備用板卡并進(jìn)行配置和測試,故障板卡報修;5 .如為主

30、引擎故障,緊急切換到備用交換機(jī),并進(jìn)行相應(yīng)配置和測試,整機(jī)進(jìn)行保修。6 .執(zhí)行系統(tǒng)修復(fù)和測試。詳細(xì)操作步驟可參見附表7。3.6考核辦法3.7.2考核目的信息網(wǎng)絡(luò)系統(tǒng)作為四川電力公司信息化系統(tǒng)基礎(chǔ)設(shè)施,在電力系統(tǒng)已起到至關(guān)重要的作用。為保障網(wǎng)絡(luò)系統(tǒng)的正常運(yùn)行以及確保本規(guī)范明確的各項工作要求在實(shí)際工作中得到貫徹和落實(shí),信息網(wǎng)絡(luò)系統(tǒng)運(yùn)維知識的培訓(xùn)、管理、考核工作應(yīng)是必不可少的。3.7.2考核內(nèi)容網(wǎng)絡(luò)系統(tǒng)管理員的考核是由部門運(yùn)維負(fù)責(zé)人直接考核,其主要內(nèi)容應(yīng)包含:(1) 是否對信息網(wǎng)絡(luò)系統(tǒng)進(jìn)行監(jiān)控與巡查,并嚴(yán)格按照規(guī)定記錄相關(guān)信息;(2) 是否對故障以及問題進(jìn)行及時的解決;(3) 是否按照規(guī)定對系統(tǒng)進(jìn)行

31、備份;(4) 在維護(hù)流程中是否按照規(guī)定,進(jìn)行書面申請或記錄;3.7附錄3.8.1附表1網(wǎng)絡(luò)設(shè)備資產(chǎn)列表網(wǎng)絡(luò)設(shè)備資產(chǎn)列表序號設(shè)備分級設(shè)備分類設(shè)備型號序列號管理IPIOS版本位置管理人/使用人維護(hù)合同設(shè)備原1商/聯(lián)系方式集成商/聯(lián)系方式開始使用時間結(jié)束使用時間備注1核心層交換機(jī)QuidwayS8512公司本部中心機(jī)房華為/2交換機(jī)c6509公司本部中心機(jī)房CISCO3路由器C7206公司本部中心機(jī)房CISCO4路由器R7513MX梨花街CISCO5匯聚層6接入層7防火墻8入侵檢測設(shè)備9許可證軟件103.8.2附表2核心層網(wǎng)絡(luò)設(shè)備配置表核心層網(wǎng)絡(luò)設(shè)備配置表分級項目詳細(xì)信息備注一般息設(shè)備名稱設(shè)備型號C

32、PU類型FLASHDRAM接口描述用戶名口令第1層介質(zhì)類型速率雙工模式接口號連接插座或端口第2層MAC地址STP狀態(tài)STP根橋速端口信息VLAN分級項目詳細(xì)信息備注Etherchannel配置封裝中繼狀態(tài)接口類型端口安全VTP狀態(tài)VTP模式第3層IP地址HSRP地址子網(wǎng)掩碼路由協(xié)議ACL隧道信息環(huán)路接口附:收集配置信息操作指南(以CISCO設(shè)備為例):1、收集路由器和第3層交換機(jī)網(wǎng)絡(luò)配置信息showversion;顯示設(shè)備型號、Flash、DRAMIOS版本showipinterfacebrief;顯示接口簡要信息(類型、狀態(tài)、協(xié)議狀態(tài)、IP地址)showinterfacee0/0;顯示某接口

33、詳細(xì)信息(MACIP、MASK)showipprotocols;顯示IP路由協(xié)議信息showipinterfacee0/0;顯示接口的IP協(xié)議信息(狀態(tài)、IP地址、ACL)2、收集交換機(jī)配置信息交換機(jī)網(wǎng)絡(luò)配置表包含的信息:設(shè)備名、型號、位置、Flash、DRAMCATO跋本、管理地址、VTP域、VTP模式、端口號、端口速率、端口雙工、VLANSTP狀態(tài)、速端口狀態(tài)、中繼狀態(tài)、showversion;顯示IOS或CATO微本、DRAMFlashshowvtpdomain;(CatOS)顯示VTP域和VTP模式showvtpstatus;(IOS)showinterface;(CatOS)顯示管理

34、接口信息showport;(CatOS)顯示每個端口的簡要信息(號、VLAN雙工、)showinterface;(IOS)showtrunk;(CatOS)顯示中繼信息(模式、封裝、允許端口、剪裁、)showinterfacetrunk;(IOS)showspantree45;(CatOS)顯示端口的STP模式、類型、狀態(tài)、速端口、)showspanning-tree45;(IOS)3、發(fā)現(xiàn)相鄰CISCO設(shè)備的信息CDP(CiscoDiscoveryProtocol)是CISCO的專用協(xié)議,用于識別直接相鄰的CISCO備信息,CDP工作在第2層。Showcdpneighbor;顯示相鄰CISC

35、O設(shè)備的簡要信息(ID、相鄰接口、平臺、)Showcdpneighbordetail;顯示相鄰CISCO設(shè)備的詳細(xì)信息(包含第3層信息)3.8.3 附表3網(wǎng)絡(luò)系統(tǒng)巡檢報告1、網(wǎng)絡(luò)系統(tǒng)每天例行巡檢報告設(shè)備型號:核心層設(shè)備型號名稱巡檢時間:每天例行巡檢內(nèi)容巡查項目正常不止常設(shè)備運(yùn)行狀態(tài)燈:設(shè)備各模塊狀況:設(shè)備運(yùn)行溫度:CPU?用率及內(nèi)存利用率:路由狀況檢查:HSRPK態(tài)檢查:VLAN犬態(tài)檢查:Trunk和Channel:動態(tài)路由狀態(tài)檢查:spanningtree檢查:以太接口故障檢查:路由器廣域口故障檢查:網(wǎng)絡(luò)連通性檢查(采用PING和tracert命令):網(wǎng)絡(luò)流量檢查(合法流量和非法流量):本次

36、巡撿發(fā)現(xiàn)的問題解決方法及措施巡撿人:簽字:年月運(yùn)維負(fù)責(zé)人:簽字:年月日日2、網(wǎng)絡(luò)系統(tǒng)每周例行巡檢報告設(shè)備型號:匯聚層設(shè)備型號巡檢時間:每周例行巡檢內(nèi)容巡查項目正常不止常設(shè)備運(yùn)行狀態(tài)燈:設(shè)備各模塊狀況:路由狀況檢查:路由器廣域口故障檢查:網(wǎng)絡(luò)連通性檢查(采用PING和tracert命令):網(wǎng)絡(luò)流量檢查(合法流量和非法流量):本次巡撿發(fā)現(xiàn)的問題解決方法及措施簽字:簽字:巡撿人:年月日運(yùn)維負(fù)責(zé)人:年月日3、網(wǎng)絡(luò)系統(tǒng)每月例行巡檢報告設(shè)備型號:巡檢時間:每月例行巡檢內(nèi)容巡查項目正常不止常設(shè)備運(yùn)行是否正常是否對IOS及系統(tǒng)配置進(jìn)行備份是否啟多余設(shè)備連接到網(wǎng)絡(luò)中設(shè)備重啟是否有異常報錯或者無法正常重啟本次巡撿

37、發(fā)現(xiàn)的問題解決方法及措施巡撿人:簽字:年月曰運(yùn)維負(fù)責(zé)人:簽字:年月曰3.8.4 附表4網(wǎng)絡(luò)系統(tǒng)故障處理報告網(wǎng)絡(luò)系統(tǒng)故障處理報告故障基本信息設(shè)備名稱設(shè)備型號/序列號故障日期年月日發(fā)生具體時問時分秒登記日期年月日登記人故障類別口線路故障口設(shè)備故障口病毒攻擊口網(wǎng)絡(luò)入侵口其他故障現(xiàn)象描述故障恢復(fù)情況故障原因分析故障恢復(fù)步驟故障恢復(fù)結(jié)果故障恢復(fù)時間系統(tǒng)管理員意見簽字:年月日運(yùn)維負(fù)責(zé)人意見簽字:年月日3.8.5 附表5計劃性維護(hù)申請表計劃性維護(hù)申請表申請人申請日期年月日維護(hù)設(shè)備網(wǎng)絡(luò)設(shè)備口服務(wù)器設(shè)備口精密空調(diào)口PS口其他設(shè)備名稱網(wǎng)絡(luò)中斷時間網(wǎng)絡(luò)恢復(fù)時間檢查項目操作步驟維護(hù)結(jié)果系統(tǒng)管理員年月日運(yùn)維負(fù)責(zé)人年月日

38、3.8.6 附表6常用網(wǎng)絡(luò)維護(hù)命令1、識別數(shù)據(jù)鏈路層問題的癥狀數(shù)據(jù)鏈路層問題包括:不正常的幀類型(不相符的封裝)、重復(fù)的MACM址、換換層設(shè)備的不當(dāng)行為。第2層和第3層測試工具(CDRPING可以幫助檢驗并校驗數(shù)據(jù)鏈路層問題。2、用于識別物理層和數(shù)據(jù)鏈路層問題的命令:(1)通用命令:Pinghost|ip-address;Arp-a;Netstat-rn;Ipconfig/all;Tracert;Winipcfg;Ifconfig-a;Traceroute;(2)CiscoIOS命令Ping;Traceroute;Debug;Showversion;Showipinterfacebrief;S

39、howinterfacee1;Showcdpneighbordetail;Showcontrollers;Showarp;Debugarp|lapb|stun;3、識別并糾正網(wǎng)絡(luò)層問題1)通用命令:pingarpanetstat2) WINDOWSRouteprintIpconfig/allTracertWinipcfg3) UNIX&MACIfconfig-aTracerouteRoute-n4) 分離網(wǎng)絡(luò)層問題的CiscoIOS命令1)通用:pingtracedebugshowrunningconfig2) ARPShowiparpDebugarp3)路由表showiprouted

40、ebugiprouting4) IP接口Showipinterfacebrief5) IP流量ShowiptrafficDebugipicmpDebugippacket6) IP訪問列表Showipaccess-list3.8.7附表7常見故障處理方法(1)線路故障處理方法當(dāng)線路發(fā)生故障時,首先要快速判斷是線路運(yùn)營商方面的原因,還是用戶方面的原因,以便分清責(zé)任,盡快加以解決。1)登錄到路由器或三層交換機(jī),使用擴(kuò)展Ping命令,向?qū)Χ寺酚善鲝V域口地址發(fā)送大量數(shù)據(jù)包進(jìn)行測試。如果上述測試沒有發(fā)生丟包現(xiàn)象,則說明線路運(yùn)營商提供的線路是好的,引起故障的原因在于用戶自身,需要進(jìn)一步查找。如果上述測試發(fā)生

41、丟包現(xiàn)象,則說明故障是由線路供應(yīng)商提供的線路引起的,需要與線路供應(yīng)商聯(lián)系盡快解決。2)當(dāng)確定引起線路故障的原因是用戶方面的原因時,需要進(jìn)一步判斷到底是廣域網(wǎng)線路哪一端用戶的原因。可以使用“Ping本地網(wǎng)關(guān)-1”命令,檢查本端計算機(jī)到本端網(wǎng)關(guān)的連通性.如果此測試發(fā)生丟包現(xiàn)象,則說明故障是由本端引起的,需要進(jìn)一步查找。否則說明故障是由對端引起的,需要對端用戶進(jìn)一步查找.3)在確認(rèn)故障是由線路的某一端引起之后,可以采取以下兩種方法快速準(zhǔn)確地定位引起故障的具體位置所在。一是采用“設(shè)備替換”法,利用一臺新的路由器、交換機(jī)等網(wǎng)絡(luò)設(shè)備替換現(xiàn)有的網(wǎng)絡(luò)設(shè)備,如果線路恢復(fù)正常,則說明是該網(wǎng)絡(luò)設(shè)備發(fā)生故障。否則需要

42、繼續(xù)查找。二是采用“網(wǎng)線插拔”法,利用一臺運(yùn)行正常的計算機(jī),輸入“ping對方計算機(jī)-t”命令,同時逐一插拔路由器或交換機(jī)上的每一根網(wǎng)線。如果看到在斷開某一根網(wǎng)線后整個線路恢復(fù)正常,則說明故障和這個端口有直接關(guān)系。冉將這根網(wǎng)線插到交換機(jī)上的其它端口進(jìn)行測試,如果線路恢復(fù)正常,則說明是交換機(jī)上的這個端口發(fā)生故障。否則說明連接這個端口的計算機(jī)或網(wǎng)線發(fā)生故障,需要繼續(xù)查找。4)在將故障定位到交換機(jī)上的具體某個端口以后,首先檢查與該端口相連接的計算機(jī)運(yùn)行是否正常??梢噪p擊網(wǎng)卡,查看該網(wǎng)卡的發(fā)送包和接收包的數(shù)量,如果發(fā)現(xiàn)網(wǎng)卡的發(fā)包數(shù)在快速增加,則說明這臺計算機(jī)感染了蠕蟲病毒,應(yīng)立即切斷該計算機(jī)與網(wǎng)絡(luò)的連

43、接,進(jìn)行病毒的查殺處理。否則說明該計算機(jī)的網(wǎng)卡或網(wǎng)線發(fā)生故障,需要更換新的網(wǎng)卡或網(wǎng)線。(2)設(shè)備故障處理方法當(dāng)發(fā)生設(shè)備故障時,網(wǎng)絡(luò)管理員首先確認(rèn)是軟件故障還是硬件故障。如判斷為軟件故障,如配置文件丟失或非法更改,網(wǎng)絡(luò)管理員利用事先的備份配置文件重新配置設(shè)備并進(jìn)行測試.如判斷為硬件故障,首先檢查設(shè)備的端口的LED狀態(tài)指示燈是否正常,在正常工作時一般狀態(tài)指示燈為綠色常亮,故障時LED狀態(tài)將關(guān)閉、閃爍或其它顏色。如端口指示燈顯示故障,將該端口網(wǎng)線連接到其他冗余端口,如端口指示燈正常,則說明原端口故障,否則需要繼續(xù)查找.其次查看特定部件,如為板卡故障,切換到備用板卡并進(jìn)行配置和測試,故障板卡報修;如為

44、主引擎故障,緊急切換到備用交換機(jī),并進(jìn)行相應(yīng)配置和測試,整機(jī)進(jìn)行保修.(3)路由器接口故障處理方法1)串口故障當(dāng)路由器串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從showinterfaceserial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種:1.串口運(yùn)行、線路協(xié)議運(yùn)行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息。2,串口運(yùn)行、線路協(xié)議關(guān)閉,這個顯示說明路由器與提供載波檢測信號的設(shè)備連接,表明載波信號出現(xiàn)在本地和遠(yuǎn)程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息。

45、可能的故障發(fā)生在路由器配置問題、線路問題或遠(yuǎn)程路由器故障。3.串口和線路協(xié)議都關(guān)閉,可能是電信部門的線路故障、電纜故障。4,串口管理性關(guān)閉和線路協(xié)議關(guān)閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入noshutdown命令,打開管理性關(guān)閉。5.接口和線路協(xié)議都運(yùn)行的狀況下,雖然串口鏈路的基本通信建立起來了,但仍然可能由于信息包丟失和信息包錯誤時會出現(xiàn)許多潛在的故障問題。正常通信時接口輸入或輸出信息包不應(yīng)該丟失,或者丟失的量非常小,而且不會增加.如果信息包丟失有規(guī)律性增加,表明通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。查找其它原因發(fā)生的信息包丟失,查

46、看showinterfaceserial命令的輸出報告中的輸入輸出保持隊列的狀態(tài)。當(dāng)發(fā)現(xiàn)保持隊列中信息包數(shù)量達(dá)到了信息的最大允許值,可以增加保持隊列設(shè)置的大小.2)以太網(wǎng)接口故障以太接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數(shù)頻繁;使用不兼容的幀類型。使用showinterfaceethernet命令可以查看該接口的吞吐量、碰撞沖突、信息包丟失、和幀類型的有關(guān)內(nèi)容等。通過查看接口的吞吐量可以檢測網(wǎng)絡(luò)的帶寬利用狀況。如果網(wǎng)絡(luò)廣播信息包的百分比很高,網(wǎng)絡(luò)性能開始下降。光纖網(wǎng)轉(zhuǎn)換到以太網(wǎng)段的信息包可能會淹沒以太口?;ヂ?lián)網(wǎng)發(fā)生這種情況可以采用優(yōu)化接口的措施,即在以太接口使用noiproute-c

47、ache命令,禁用快速轉(zhuǎn)換,并且調(diào)整緩沖區(qū)和保持隊列的設(shè)置。機(jī)房值班管理規(guī)范1.1.1 范圍本規(guī)范適用于公司本部及基層單位中心機(jī)房內(nèi)的設(shè)備、網(wǎng)絡(luò)、主機(jī)以及應(yīng)用系統(tǒng)等日常操作管理工作.1.1.2 與職責(zé)機(jī)房值班管理設(shè)立機(jī)房管理/監(jiān)控崗,負(fù)責(zé)對機(jī)房的設(shè)備進(jìn)行日常管理以及負(fù)責(zé)完成各信息系統(tǒng)的日常操作管理工作,崗位設(shè)立AB崗.具體職責(zé)如下:1廳P角色職責(zé)1機(jī)房值班員1、執(zhí)行規(guī)定的操作任務(wù),包括日常手工操作,系統(tǒng)手工監(jiān)控等2、對機(jī)房環(huán)境狀況進(jìn)行監(jiān)控,對機(jī)房進(jìn)出人員、設(shè)備進(jìn)行登記冷3、根據(jù)設(shè)置好的備份/歸檔任務(wù),進(jìn)行備份介質(zhì)的管理及對備仔介質(zhì)的驗證。4、執(zhí)行由本單位運(yùn)維部門分配的任務(wù)。5、根據(jù)監(jiān)控系統(tǒng)產(chǎn)生

48、的事件,執(zhí)行相應(yīng)的操作,如重新啟動操作系統(tǒng),對應(yīng)用系統(tǒng)進(jìn)行檢查和基本的故障處理等。1.1.3 流程與活動4.4.1 每天例行工作內(nèi)容1、機(jī)房環(huán)境狀況檢查。每次當(dāng)班人員負(fù)責(zé)檢查計算機(jī)機(jī)房內(nèi)設(shè)備的運(yùn)行情況并記錄相關(guān)設(shè)備的狀況,例如空調(diào)機(jī)的溫度和濕度情況、消防、閉路監(jiān)控系統(tǒng)報警情況、UPS供配電情況及漏水檢測報警等,詳見中心機(jī)房狀況日志。2、系統(tǒng)檢查。使用適當(dāng)?shù)募夹g(shù)手段對服務(wù)器系統(tǒng)情況、應(yīng)用系統(tǒng)情況、應(yīng)用系統(tǒng)備份情況進(jìn)行檢查,如有異常情況及時記錄到值班記錄表并通知系統(tǒng)管理員3、負(fù)責(zé)計算機(jī)機(jī)房出入人員的管理登記工作。非計算機(jī)信息中心人員應(yīng)登記來人單位和陪同的人員.4.4.2 每周例行工作內(nèi)容根據(jù)有關(guān)系

49、統(tǒng)的系統(tǒng)管理員的要求,每周定期由值班員做相關(guān)工作。4.4.3 每月例行工作內(nèi)容1、每月定期由值班人員負(fù)責(zé)組織空調(diào)檢修人員對機(jī)房空調(diào)進(jìn)行檢修。2、每月定期由值班人員負(fù)責(zé)組織清潔人員,對機(jī)房抗靜電地板表面、墻面、天花板以及各類設(shè)備表面進(jìn)行除塵。4.4.4 每季例行工作內(nèi)容每季定期由值班人員負(fù)責(zé)組織清潔人員,對機(jī)房進(jìn)行全面除塵,包括抗靜電地板下面設(shè)施.4.4.5 機(jī)房管理員在完成規(guī)定的工作后,根據(jù)情況需填寫系列表格:1、進(jìn)行人員、設(shè)備進(jìn)出機(jī)房登記,填寫非值班人員進(jìn)出中心機(jī)房情況記錄表和設(shè)備進(jìn)出中心機(jī)房記錄表。2、進(jìn)行機(jī)房環(huán)境設(shè)備監(jiān)控,填寫中心機(jī)房狀況日志.3、進(jìn)行值班情況交接,填寫中心機(jī)房值班記錄表

50、。4.4.6 如果出現(xiàn)任務(wù)執(zhí)行失敗或者系統(tǒng)出現(xiàn)異常。根據(jù)事件管理流程,向本單位運(yùn)維負(fù)責(zé)人報案。在非工作時間發(fā)現(xiàn)任務(wù)執(zhí)行失敗或系統(tǒng)異常,直接聯(lián)系系統(tǒng)管理員或者供應(yīng)商等進(jìn)行故障恢復(fù).4.4.7 機(jī)房值班員妥善保存相應(yīng)日志和各種表格,作為歸檔記錄。4.4.8 緊急情況處理程序1.1.1 UPSft配電系統(tǒng)發(fā)生緊急情況時處理步驟發(fā)生緊急情況時,首先請示運(yùn)維部門領(lǐng)導(dǎo),需要關(guān)閉應(yīng)用系統(tǒng)時,由各系統(tǒng)管理員關(guān)閉相關(guān)系統(tǒng)或經(jīng)授權(quán)后啟用密碼封進(jìn)行關(guān)閉系統(tǒng),同時聯(lián)系設(shè)備供應(yīng)商進(jìn)行緊急事故處理。當(dāng)UPSB要停機(jī)或故障排除后,如需開機(jī)時,都必須嚴(yán)格按照規(guī)定的步驟操作。事件處理完畢后,要做好事故記錄,報告給運(yùn)維部門領(lǐng)導(dǎo)。

51、1.1.2 自然災(zāi)害處理必須針對機(jī)房管理制定詳細(xì)的自然災(zāi)害(如:火災(zāi)、水災(zāi)等)發(fā)生時的應(yīng)急處理方案,在災(zāi)害發(fā)生時,機(jī)房值班人員按照相應(yīng)的處理方案進(jìn)行處理。4.5 管理原則1、要建立各種災(zāi)難的應(yīng)急預(yù)案。2、各系統(tǒng)管理員可以授權(quán)機(jī)房值班員執(zhí)行指定的工作。機(jī)房管理員必須嚴(yán)格按照規(guī)定的步驟操作機(jī)房內(nèi)的所有軟、硬件設(shè)備.4.6 附錄:4.6.1 附表1非值班人員進(jìn)(出)中心機(jī)房情況記錄表非值班人員進(jìn)(出)中心機(jī)房情況記錄表序號日期進(jìn)入機(jī)房人員進(jìn)入機(jī)房事由進(jìn)入機(jī)房時間離開機(jī)房時間信息中心監(jiān)管人值班人本次操作后相關(guān)系統(tǒng)是合止常本次操作正常確認(rèn)簽名備注1月日2月日3月日4月日5月日6月日4.6.2 附表2設(shè)備進(jìn)出中心機(jī)房記錄表設(shè)備進(jìn)出中心機(jī)房記錄表進(jìn)出種類(遷入/遷出)設(shè)備型號及數(shù)量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論