




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
運(yùn)營維護(hù)管理體系和制度規(guī)范目錄1、總則 32、編制辦法 33、運(yùn)維工作職責(zé) 34、運(yùn)維服務(wù)管理體系 54.1運(yùn)維服務(wù)管理對(duì)象 64.2運(yùn)維系統(tǒng)功能框架 64.3運(yùn)維管理組織構(gòu)造 74.3.1項(xiàng)目負(fù)責(zé)人 84.3.2項(xiàng)目經(jīng)理 84.3.3技術(shù)主管 94.3.4服務(wù)臺(tái) 94.3.5網(wǎng)絡(luò)管理員 104.3.5應(yīng)用、數(shù)據(jù)庫管理員 104.3.7終端管理員 114.4運(yùn)維服務(wù)流程 114.4.1項(xiàng)目運(yùn)維服務(wù)工作流程圖 124.4.2服務(wù)臺(tái) 123.4.3事件管理 134.4.4工單管理 134.4.5問題管理 144.4.6變更管理 144.4.7配備管理 144.4.8知識(shí)庫管理 154.4.9記錄及工作報(bào)告 155、運(yùn)維服務(wù)內(nèi)容 155.1服務(wù)目的 155.2 資產(chǎn)記錄服務(wù) 165.3網(wǎng)絡(luò)、安全系統(tǒng)運(yùn)維服務(wù) 165.4主機(jī)、存儲(chǔ)系統(tǒng)運(yùn)維服務(wù) 175.5數(shù)據(jù)庫系統(tǒng)運(yùn)維服務(wù) 185.6中間件運(yùn)維服務(wù) 195.7終端、外設(shè)運(yùn)維服務(wù) 196、應(yīng)急服務(wù)響應(yīng)辦法 196.1應(yīng)急預(yù)案實(shí)行基本流程 206.2突發(fā)事件應(yīng)急方略 207、服務(wù)管理制度規(guī)范 217.1服務(wù)時(shí)間 217.2行為規(guī)范 221、總則為保障實(shí)驗(yàn)室系統(tǒng)軟硬件設(shè)備良好運(yùn)營,使員工運(yùn)維工作制度化、流程化、規(guī)范化,特制定本制度。運(yùn)維工作總體目的:立足主線促發(fā)展,開拓運(yùn)維新局面。在公司發(fā)展壯大時(shí)期,通過網(wǎng)絡(luò)、桌面、系統(tǒng)等運(yùn)維,增進(jìn)公司穩(wěn)定可持續(xù)性發(fā)展。運(yùn)維管理制度合用范疇:運(yùn)維人員。2、編制辦法本實(shí)行細(xì)則涉及運(yùn)維服務(wù)全生命周期管理辦法、管理原則/規(guī)范、管理模式、管理支撐工具、管理對(duì)象以及基于流程管理辦法。本實(shí)行細(xì)則以ITIL/ISO0為基本,以信息化項(xiàng)目運(yùn)維為目的,以管理支撐工具為手段,以流程化、規(guī)范化、原則化管理為辦法,以全生命周期PDCA循環(huán)為提高途徑,體現(xiàn)了對(duì)運(yùn)維服務(wù)全過程體系化管理。3、運(yùn)維部工作職責(zé)一、負(fù)責(zé)網(wǎng)站運(yùn)維和技術(shù)支持(一)依照網(wǎng)站運(yùn)營戰(zhàn)略和目的,負(fù)責(zé)網(wǎng)站整體架構(gòu)、欄目、應(yīng)用系統(tǒng)等技術(shù)開發(fā)方案制定和組織開發(fā),保障網(wǎng)站技術(shù)穩(wěn)定性和先進(jìn)性。(二)負(fù)責(zé)網(wǎng)站欄目和應(yīng)用系統(tǒng)使用培訓(xùn)和操作使用指南編寫,對(duì)顧客使用過程中浮現(xiàn)問題溝通和解決。(三)網(wǎng)站設(shè)備和軟件購買籌劃書擬定,涉及采購數(shù)量、品牌規(guī)格、技術(shù)參數(shù)。會(huì)同行政部進(jìn)行采購。(四)網(wǎng)站設(shè)備和軟件操作規(guī)程和應(yīng)用管理制度制定,并負(fù)責(zé)監(jiān)督執(zhí)行。(五)網(wǎng)站設(shè)備和軟件安裝、調(diào)試和驗(yàn)收,使用培訓(xùn)和維修保養(yǎng)。(六)網(wǎng)站尋常運(yùn)營過程中信息安全和技術(shù)問題協(xié)調(diào)解決,保障網(wǎng)站24小時(shí)安全穩(wěn)定運(yùn)營。(七)網(wǎng)站技術(shù)服務(wù)外包管理,重要涉及技術(shù)外包開發(fā)、運(yùn)營服務(wù)托管和空間域名管理。(八)負(fù)責(zé)網(wǎng)站管理系統(tǒng)及設(shè)備保密口令設(shè)立和保存,保密口令設(shè)立后報(bào)中心主任備案,保密口令設(shè)定后任何人不得隨意更改,保密口令每季度更新一次。(九)負(fù)責(zé)網(wǎng)站新程序、新系統(tǒng)和網(wǎng)站改版升級(jí)方案技術(shù)設(shè)計(jì)開發(fā)。二、負(fù)責(zé)網(wǎng)站信息和技術(shù)安全(一)執(zhí)行國家和省上關(guān)于網(wǎng)絡(luò)信息技術(shù)安全法律法規(guī),與通信管理和網(wǎng)絡(luò)安全監(jiān)管部門聯(lián)系,及時(shí)解決網(wǎng)站信息技術(shù)安全面存在問題,保證網(wǎng)站安全、穩(wěn)定、可靠運(yùn)營。(二)網(wǎng)站信息技術(shù)安全保密制度和工作流程制定,貫徹信息技術(shù)安全保密責(zé)任制,執(zhí)行“誰主管、誰負(fù)責(zé),誰主辦、誰負(fù)責(zé)”原則,責(zé)任到人。(三)在服務(wù)器和計(jì)算機(jī)之間設(shè)立硬件防火墻,在服務(wù)器及工作站上均安裝防病毒軟件,進(jìn)行硬件和技術(shù)雙保護(hù),保證網(wǎng)站不受病毒和黑客襲擊。(四)負(fù)責(zé)網(wǎng)站信息技術(shù)安全應(yīng)急解決預(yù)案制定和實(shí)行。(五)安排專人監(jiān)控網(wǎng)站各頻道,各頁面,各版塊,各欄目信息內(nèi)容,建立網(wǎng)站信息技術(shù)安全監(jiān)控值班登記制度,發(fā)現(xiàn)問題及時(shí)解決,并登記問題和解決成果登記;(六)建立多機(jī)備份網(wǎng)站信息服務(wù)系統(tǒng)機(jī)制,一旦主系統(tǒng)遇到故障或受到襲擊導(dǎo)致不能正常運(yùn)營,可以在最短時(shí)間內(nèi)替代主系統(tǒng)提供服務(wù)。(七)建立網(wǎng)站系統(tǒng)集中式權(quán)限管理,按照崗位職責(zé)設(shè)定工作人員操作權(quán)限,針對(duì)不同應(yīng)用系統(tǒng)、終端、操作人員,設(shè)立共享數(shù)據(jù)庫信息訪問權(quán)限,并設(shè)立密碼。不同操作人員設(shè)定不同顧客名,且定期更換,禁止操作人員泄漏密碼。4、運(yùn)維服務(wù)管理體系運(yùn)維服務(wù)管理體系規(guī)定了運(yùn)維活動(dòng)涉及各類實(shí)體,以及這些實(shí)體間互有關(guān)系。有關(guān)實(shí)體按照運(yùn)維服務(wù)管理體系進(jìn)行有機(jī)組織,并協(xié)調(diào)工作,按照服務(wù)合同規(guī)定提供不同級(jí)別IT運(yùn)維服務(wù)。4.1運(yùn)維服務(wù)管理對(duì)象運(yùn)維服務(wù)管理對(duì)象涉及基本設(shè)施、應(yīng)用系統(tǒng)、顧客、研發(fā)部門以及IT運(yùn)維部門和人員,詳細(xì)內(nèi)容如下:(1)基本設(shè)施涉及網(wǎng)絡(luò)、主機(jī)系統(tǒng)、存儲(chǔ)系統(tǒng)、安全系統(tǒng)等。(2)應(yīng)用系統(tǒng)涉及uap云管理平臺(tái)、cloud門戶、demo、zabbix、機(jī)房設(shè)備管理系統(tǒng)、vmware以及yum源等。(3)顧客涉及使用如上應(yīng)用系統(tǒng)顧客。(4)研發(fā)部門涉及Iaas平臺(tái)研發(fā)部門。(5)運(yùn)維部門和人員涉及內(nèi)部參加運(yùn)維活動(dòng)有關(guān)部門和人員,以及提供運(yùn)維服務(wù)公司和有關(guān)人員。4.2運(yùn)維系統(tǒng)功能框架依照建設(shè)單位系統(tǒng)構(gòu)造和業(yè)務(wù)開展需要,運(yùn)維項(xiàng)目組將項(xiàng)目維護(hù)框架分為9個(gè)詳細(xì)構(gòu)成某些,分別為:服務(wù)臺(tái)、事件管理、工單管理、問題管理、變更管理、配備管理、工程師考核、知識(shí)庫管理、記錄、系統(tǒng)管理等9個(gè)子項(xiàng)。而詳細(xì)運(yùn)維流程將以此為根據(jù)開展工作。4.3運(yùn)維管理組織構(gòu)造本運(yùn)維項(xiàng)目運(yùn)維管理構(gòu)造位三層模式,詳細(xì)如下圖所示。由項(xiàng)目負(fù)責(zé)人與甲方進(jìn)行業(yè)務(wù)范疇接洽,并將溝通成果向下傳遞。項(xiàng)目經(jīng)理負(fù)責(zé)項(xiàng)目整體運(yùn)維工作,涉及各種制度制定和實(shí)行。運(yùn)維工程師則在項(xiàng)目經(jīng)理指引下開展維護(hù)工作。4.3.1運(yùn)維負(fù)責(zé)人職責(zé):負(fù)責(zé)項(xiàng)目商務(wù)、整體協(xié)調(diào)事宜。職位描述:1)、整體負(fù)責(zé)建設(shè)單位運(yùn)維項(xiàng)目服務(wù)籌劃制定,領(lǐng)導(dǎo)項(xiàng)目經(jīng)理并安排項(xiàng)目工作,指引項(xiàng)目經(jīng)理完畢詳細(xì)維護(hù)工作,每周聽取項(xiàng)目經(jīng)理工作報(bào)告,負(fù)責(zé)考核項(xiàng)目經(jīng)理工作完畢狀況。2)、協(xié)助建設(shè)單位完畢新增項(xiàng)目調(diào)研、方案設(shè)計(jì)并指引項(xiàng)目經(jīng)理進(jìn)行詳細(xì)實(shí)行。4.3.2運(yùn)維主管職責(zé):規(guī)劃、執(zhí)行、完善信息化項(xiàng)目運(yùn)維工作,指引網(wǎng)絡(luò)、數(shù)據(jù)庫維護(hù)工程師開展工作。職位描述:1、依照公司戰(zhàn)略目的,指引下屬工程師開展客戶服務(wù)工作,保證運(yùn)維工作可以滿足客戶實(shí)際需要;2、建立和持續(xù)完善運(yùn)維管理體系,優(yōu)化運(yùn)維流程流程,解決運(yùn)維服務(wù)中浮現(xiàn)特殊問題;3、規(guī)劃并提高運(yùn)維工程師專業(yè)服務(wù)能力,在整體上提高客戶滿意度;4、制定和持續(xù)完善績(jī)效考核體系;5、制定整頓運(yùn)維項(xiàng)目應(yīng)急預(yù)案系統(tǒng),并指引運(yùn)維工程師實(shí)行;6、提高自身專業(yè)技能,在業(yè)務(wù)方面予以網(wǎng)絡(luò)管理員和數(shù)據(jù)庫管理員指引。4.3.3系統(tǒng)管理員職責(zé):操作系統(tǒng)、應(yīng)用、數(shù)據(jù)庫管理,oracle性能調(diào)優(yōu),實(shí)現(xiàn)應(yīng)用負(fù)載均衡。職位描述:技術(shù)主管非項(xiàng)目常駐人員,依照項(xiàng)目需要進(jìn)行專業(yè)方面指引;負(fù)責(zé)數(shù)據(jù)庫性能分析與調(diào)優(yōu),數(shù)據(jù)庫運(yùn)營狀態(tài)監(jiān)控,及時(shí)發(fā)現(xiàn)異常并迅速解決。純熟掌握Oracle10GRAC技術(shù),可以實(shí)現(xiàn)布置及調(diào)優(yōu)。掌握WAS、Weblogic、Tomcat、websphere等中間件工作原理,可以實(shí)現(xiàn)布置調(diào)優(yōu)及故障解決。純熟掌握red-flag、redhat等linux操作系統(tǒng),布置oracle10g、mysql數(shù)據(jù)庫。純熟掌握dataguard技術(shù),保證oracle數(shù)據(jù)庫冗災(zāi)、數(shù)據(jù)保護(hù)、故障恢復(fù)。負(fù)責(zé)應(yīng)用負(fù)載均衡布置和調(diào)試。負(fù)責(zé)指引數(shù)據(jù)庫工程師管理員開展工作。4.3.4網(wǎng)絡(luò)管理員職責(zé):維護(hù)建設(shè)單位網(wǎng)絡(luò)系統(tǒng)正常,解決網(wǎng)絡(luò)有關(guān)故障。職位描述:1、對(duì)既有服務(wù)器、局域網(wǎng)絡(luò)及機(jī)房、配線間尋常管理維護(hù);2、對(duì)信息安全建設(shè)提出有關(guān)建議,保證網(wǎng)絡(luò)安全;3、保證外網(wǎng)光纖線路正常,保證局域網(wǎng)運(yùn)營正常;4、對(duì)網(wǎng)絡(luò)系統(tǒng)和網(wǎng)絡(luò)設(shè)備運(yùn)營狀態(tài)進(jìn)行監(jiān)控;5、純熟掌握域方略設(shè)立、DHCP、DNS、FTP服務(wù)器、NTFS權(quán)限設(shè)立等;6、編寫網(wǎng)絡(luò)某些應(yīng)用解決預(yù)案并實(shí)行。7、工作認(rèn)真、細(xì)致,積極積極有條理性,具備良好溝通能力及團(tuán)隊(duì)合伙精神.4.3.5應(yīng)用、數(shù)據(jù)庫管理員職責(zé):維護(hù)建設(shè)單位業(yè)務(wù)系統(tǒng)運(yùn)營正常,解決應(yīng)用和數(shù)據(jù)庫故障。職位描述:1、監(jiān)測(cè)業(yè)務(wù)系統(tǒng)運(yùn)營狀況,應(yīng)用、數(shù)據(jù)庫性能監(jiān)視及優(yōu)化,作必要調(diào)節(jié);2、規(guī)劃不同數(shù)據(jù)生命周期,制定備份、恢復(fù)、遷移和災(zāi)備方略,依照業(yè)務(wù)需要執(zhí)行數(shù)據(jù)轉(zhuǎn)換及遷移等操作;3、保證應(yīng)用和數(shù)據(jù)庫系統(tǒng)安全性、完整性和運(yùn)營效率。4、負(fù)責(zé)數(shù)據(jù)庫平臺(tái)整體架構(gòu)及解決方案制定和實(shí)行;5、工作認(rèn)真、細(xì)致,積極積極有條理性,具備良好溝通能力及團(tuán)隊(duì)合伙精神.4.4運(yùn)維服務(wù)原則流程IT運(yùn)維服務(wù)管理流程涉及事件管理、問題管理、配備管理、變更管理、發(fā)布管理、服務(wù)級(jí)別管理、財(cái)務(wù)管理、能力管理、可用性管理、服務(wù)持續(xù)性管理、知識(shí)管理及供應(yīng)商管理等,隨著運(yùn)維活動(dòng)不斷進(jìn)一步和持續(xù)改進(jìn),其她流程也許會(huì)逐漸獨(dú)立并規(guī)范。4.4.1項(xiàng)目運(yùn)維服務(wù)工作原則流程圖4.4.2服務(wù)臺(tái)(暫無)服務(wù)臺(tái)是支持運(yùn)維服務(wù)核心功能,與各個(gè)流程聯(lián)系密切。所有管理流程都要通過服務(wù)臺(tái)為顧客提供單點(diǎn)聯(lián)系,解答顧客有關(guān)問題和需求,或?yàn)轭櫩椭\求相應(yīng)支持人員。在本系統(tǒng)中,服務(wù)臺(tái)是接受各種來源服務(wù)祈求和有關(guān)信息反饋唯一入口和出口,同步服務(wù)臺(tái)還負(fù)責(zé)普通祈求、通過知識(shí)庫(歷史事件)可以解決祈求;她也是復(fù)雜問題二線解決橋梁。由于當(dāng)前人員局限性,服務(wù)臺(tái)工作暫時(shí)由運(yùn)維工程師統(tǒng)一解決。4.4.3事件管理事件管理流程重要目的是盡快恢復(fù)服務(wù)提供并減少其對(duì)業(yè)務(wù)不利影響,盡量保證最佳服務(wù)質(zhì)量和可用性級(jí)別。事件管理流程普通涉及事件偵測(cè)和記錄、事件分類和支持、事件調(diào)查和診斷、事件解決和恢復(fù)以及事件關(guān)閉。本系統(tǒng)把所有服務(wù)祈求和報(bào)警歸結(jié)為事件。事件管理是提供服務(wù)臺(tái)和事件管理者對(duì)于事件記錄、解決、查詢、審核、派發(fā)等功能。它也涉及通過和第三方監(jiān)控系統(tǒng)對(duì)接,把其發(fā)送報(bào)警形成事件功能。4.4.4工單管理工單管理:工單是現(xiàn)場(chǎng)運(yùn)維、二線支持任務(wù)載體,運(yùn)維工程根據(jù)所接受工單進(jìn)行運(yùn)維工作。工單管理是對(duì)工單實(shí)現(xiàn)創(chuàng)立、變更、查詢?yōu)g覽、派發(fā)、監(jiān)督等功能模塊。4.4.5問題管理問題管理流程重要目的是防止問題和事故再次發(fā)生,并將未能解決事件影響減少到最小。問題管理流程涉及診斷事件主線因素和擬定問題解決方案所需要活動(dòng),通過適當(dāng)控制過程,特別是變更管理和發(fā)布管理,負(fù)責(zé)保證解決方案實(shí)行。問題管理還將維護(hù)關(guān)于問題、應(yīng)急方案和解決方案信息。問題管理是針對(duì)已解決事件遺留問題或解決事件方案只是治標(biāo)不治本不能徹底解決問題而考慮模塊。依照事件、及解決方案,問題解決人通過調(diào)查、診斷并提出最后解決辦法。4.4.6變更管理變更管理實(shí)現(xiàn)所有基本設(shè)施和應(yīng)用系統(tǒng)變更,變更管理應(yīng)記錄并對(duì)所有規(guī)定變更進(jìn)行分類,應(yīng)評(píng)估變更祈求風(fēng)險(xiǎn)、影響和業(yè)務(wù)收益。其重要目的是以對(duì)服務(wù)最小干擾實(shí)既有益變更。變更管理是要對(duì)重大資源新增、變更、升級(jí)等運(yùn)維活動(dòng)進(jìn)行審核功能,以免這些活動(dòng)對(duì)既有資源可用性導(dǎo)致沒有必要影響和破壞;同步,她還要實(shí)當(dāng)前工單中產(chǎn)生變化進(jìn)行后審計(jì)功能。4.4.7配備管理配備管理流程負(fù)責(zé)核算基本設(shè)施和應(yīng)用系統(tǒng)中實(shí)行變更以及配備項(xiàng)之間關(guān)系與否已經(jīng)被對(duì)的記錄下來;保證配備管理數(shù)據(jù)庫可以精確地反映現(xiàn)存配備項(xiàng)實(shí)際版本狀態(tài)。配備管理事實(shí)上是所有資源統(tǒng)一管理功能,涉及資源整個(gè)生命周期參數(shù)或配備變化記錄管理。管理信息重要涉及分類、型號(hào)、版本、位置,狀態(tài)、有關(guān)資料等基本信息還涉及核心參數(shù)等4.4.8知識(shí)庫管理運(yùn)維知識(shí)經(jīng)驗(yàn)總結(jié)、維護(hù)和共享是提高員工運(yùn)維技能水平、增強(qiáng)單位凝聚力重要手段,也是把寶貴經(jīng)驗(yàn)教訓(xùn)從支持人員頭腦逐漸沉淀、固化重要方式。知識(shí)庫管理:知識(shí)庫是提供應(yīng)運(yùn)維人員重要技術(shù)資料內(nèi)容,她匯集在工作遇到典型案例歸納總結(jié)知識(shí)要點(diǎn)和全面實(shí)用資料手冊(cè)。在本系統(tǒng)中,知識(shí)庫管理提供便于使用人機(jī)接口、迅速查詢技術(shù)手段和維護(hù)手段。4.4.9記錄及工作報(bào)告運(yùn)維管理系統(tǒng)提供一線解決率記錄、客戶滿意度記錄、按分類事件匯總記錄、工作報(bào)告生成功能,按照一定格式依照事件數(shù)據(jù)、工單數(shù)據(jù)、問題數(shù)據(jù)、配備數(shù)據(jù)、變更數(shù)據(jù)可以協(xié)助運(yùn)維管理者能把運(yùn)維所做工作內(nèi)容清晰羅列出來。5、運(yùn)維服務(wù)內(nèi)容5.1運(yùn)維服務(wù)目的實(shí)驗(yàn)室運(yùn)維部門提供運(yùn)營維護(hù)服務(wù)涉及,虛擬機(jī)、主機(jī)設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)安全設(shè)備和存儲(chǔ)設(shè)備運(yùn)營維護(hù)服務(wù),保證云管理平臺(tái)正常運(yùn)營,減少整體管理成本,提高Iaas平臺(tái)整體服務(wù)水平。同步依照尋常維護(hù)數(shù)據(jù)和記錄,給研發(fā)部門提供Iaas平臺(tái)優(yōu)化及改進(jìn)建議。實(shí)驗(yàn)室運(yùn)維構(gòu)成重要可分為兩類:硬件設(shè)備和軟件系統(tǒng)。硬件設(shè)備涉及網(wǎng)絡(luò)設(shè)備、安全設(shè)備、主機(jī)設(shè)備、存儲(chǔ)設(shè)備等;軟件設(shè)備可分為云管理平臺(tái)、操作系統(tǒng)、典型應(yīng)用軟件(如:數(shù)據(jù)庫軟件等)等。服務(wù)項(xiàng)目范疇覆蓋信息系統(tǒng)資源如下方面核心狀態(tài)及參數(shù)指標(biāo):運(yùn)營狀態(tài)、故障狀況配備信息可用性狀況及健康狀況性能指標(biāo)IT資產(chǎn)記錄服務(wù)服務(wù)內(nèi)容涉及:硬件設(shè)備型號(hào)、數(shù)量、版本等信息記錄記錄軟件產(chǎn)品型號(hào)、版本和補(bǔ)丁等信息記錄記錄網(wǎng)絡(luò)構(gòu)造、網(wǎng)絡(luò)路由、網(wǎng)絡(luò)IP地址記錄記錄綜合布線系統(tǒng)構(gòu)造圖繪制其他附屬設(shè)備記錄記錄5.3網(wǎng)絡(luò)、安全系統(tǒng)運(yùn)維服務(wù)從網(wǎng)絡(luò)連通性、網(wǎng)絡(luò)性能、網(wǎng)絡(luò)監(jiān)控管理三個(gè)方面實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)系統(tǒng)運(yùn)維管理,網(wǎng)絡(luò)設(shè)備位于IT架構(gòu)骨干位置,下面是需要監(jiān)控指標(biāo),及相應(yīng)健康狀況故障后來也許引起問題。設(shè)備基本性能檢測(cè):cpu、內(nèi)存使用狀況監(jiān)測(cè)。當(dāng)cpu、內(nèi)存使用率過高,會(huì)導(dǎo)致顧客網(wǎng)絡(luò)訪問質(zhì)量下降,丟包、時(shí)延較高等狀況產(chǎn)生。闡明當(dāng)前網(wǎng)絡(luò)設(shè)備負(fù)載較高,需要對(duì)下行設(shè)備進(jìn)行遷移,分流,減輕負(fù)載。設(shè)備日記查看;當(dāng)設(shè)備日記浮現(xiàn)異常時(shí),也許是設(shè)備浮現(xiàn)異常訪問或者異常配備,也許會(huì)導(dǎo)致網(wǎng)絡(luò)中斷。需要檢測(cè)防火墻等安全設(shè)備狀態(tài)。設(shè)備snmp、telnet狀態(tài);當(dāng)snmp、telnet都不可達(dá)時(shí),普通是設(shè)備脫網(wǎng)狀況產(chǎn)生,會(huì)導(dǎo)致網(wǎng)絡(luò)中斷。需要人工查看設(shè)備運(yùn)營狀態(tài)。測(cè)試Ping,tracert等工具連通性;當(dāng)ping丟包率過高,闡明網(wǎng)絡(luò)訪問質(zhì)量有問題,需要tracert查看網(wǎng)絡(luò)途徑是哪一跳相應(yīng)IP設(shè)備時(shí)延較高或者不可達(dá)。分析是哪個(gè)網(wǎng)關(guān)路由或者方略引起問題。網(wǎng)絡(luò)安全方略應(yīng)用與否正常;安全方略異常會(huì)導(dǎo)致網(wǎng)絡(luò)設(shè)備遭受入侵,會(huì)影響整個(gè)網(wǎng)絡(luò)訪問。Internet帶寬流量實(shí)時(shí)監(jiān)測(cè);流量所占帶寬比較高,會(huì)導(dǎo)致當(dāng)前網(wǎng)絡(luò)設(shè)備相應(yīng)端口網(wǎng)關(guān)所有網(wǎng)絡(luò)訪問質(zhì)量下降。需要抓包查看是哪些設(shè)備相應(yīng)訪問流量較高,決定是加大帶寬還是服務(wù)器中毒。網(wǎng)絡(luò)拓?fù)滏溌窢顟B(tài)監(jiān)測(cè);鏈路狀態(tài)異常闡明網(wǎng)絡(luò)中某個(gè)設(shè)備異常,需要查看鏈路相應(yīng)網(wǎng)絡(luò)設(shè)備健康狀況,結(jié)合其她指標(biāo)分析問題所在。異常網(wǎng)絡(luò)數(shù)據(jù)包流量、Dos、ddos等網(wǎng)絡(luò)襲擊狀況監(jiān)測(cè);存在異常網(wǎng)絡(luò)數(shù)據(jù)流量包等,會(huì)導(dǎo)致正常網(wǎng)絡(luò)質(zhì)量下降,闡明網(wǎng)絡(luò)也許受到襲擊,需要結(jié)合netflow和流量狀況查看異常流量訪問網(wǎng)段,從路由方略或者防火墻限制該網(wǎng)段訪問光纖光口光功率、光電口誤碼率大小。光功率值不在光模塊默認(rèn)光功率范疇內(nèi),會(huì)導(dǎo)致光口不可用,也許是光模塊浮現(xiàn)故障,需要聯(lián)系廠家查看光模塊與否正常5.4主機(jī)、存儲(chǔ)系統(tǒng)運(yùn)維服務(wù)提供主機(jī)、存儲(chǔ)系統(tǒng)運(yùn)維服務(wù)涉及:主機(jī)、存儲(chǔ)設(shè)備尋常監(jiān)控,設(shè)備運(yùn)營狀態(tài)監(jiān)控,故障解決,操作系統(tǒng)維護(hù),補(bǔ)丁升級(jí)等內(nèi)容。進(jìn)行監(jiān)控管理內(nèi)容涉及:CPU性能管理;GPU指標(biāo)過高,會(huì)導(dǎo)致服務(wù)器程序運(yùn)營緩慢,浮現(xiàn)卡死狀況。需要查看引起GPU過高因素,做虛機(jī)遷移等操作,減輕服務(wù)器壓力。內(nèi)存使用狀況管理;內(nèi)存使用率過大,會(huì)導(dǎo)致服務(wù)器崩潰,需要及時(shí)擴(kuò)充內(nèi)存資源,或者回收不再使用虛機(jī)資源。硬盤運(yùn)用狀況管理;硬盤使用率過高,會(huì)導(dǎo)致開始啟動(dòng)失敗,需要定期清理服務(wù)器暫時(shí)文獻(xiàn),或者擴(kuò)充服務(wù)器硬盤。系統(tǒng)進(jìn)程管理;服務(wù)器核心進(jìn)程運(yùn)營與否正常,異常會(huì)導(dǎo)致服務(wù)器崩潰,需要查看進(jìn)程異常因素。實(shí)時(shí)監(jiān)控主機(jī)電源、電扇使用狀況及主機(jī)機(jī)箱內(nèi)部溫度;電源狀態(tài)異常,也許會(huì)導(dǎo)致服務(wù)器斷電,電扇異常,主機(jī)穩(wěn)定過高會(huì)導(dǎo)致服務(wù)器重啟,需要與廠商聯(lián)系,查看硬件與否正常監(jiān)控主機(jī)硬盤運(yùn)營狀態(tài);硬盤讀寫狀態(tài)等標(biāo)記硬盤可用性,需要查看與否硬盤壓力過大,考慮更換存儲(chǔ)類型ssd等監(jiān)控主機(jī)網(wǎng)卡等硬件狀態(tài);主機(jī)網(wǎng)卡down掉,會(huì)影響服務(wù)器網(wǎng)絡(luò)訪問,硬件異常會(huì)影響服務(wù)器正常運(yùn)營,需要聯(lián)系廠商做硬件檢測(cè)。監(jiān)控主機(jī)HA運(yùn)營狀況;災(zāi)備系統(tǒng)運(yùn)營異常,會(huì)導(dǎo)致HA切換異常,需要查看引起HA異常因素,是軟件問題還是硬件問題,逐漸排除因素。5.5數(shù)據(jù)庫系統(tǒng)運(yùn)維服務(wù)提供數(shù)據(jù)庫運(yùn)營維護(hù)服務(wù)是涉及積極數(shù)據(jù)庫性能管理,數(shù)據(jù)庫積極性能管理對(duì)系統(tǒng)運(yùn)維非常重要。通過積極式性能管理可理解數(shù)據(jù)庫尋常運(yùn)營狀態(tài),辨認(rèn)數(shù)據(jù)庫性能問題發(fā)生在什么地方,有針對(duì)性地進(jìn)行性能優(yōu)化。同步,密切注意數(shù)據(jù)庫系統(tǒng)變化,積極地防止也許發(fā)生問題。進(jìn)行監(jiān)控管理內(nèi)容涉及:數(shù)據(jù)庫基本信息:文獻(xiàn)系統(tǒng)、碎片、死鎖、CPU占用率較大或時(shí)間較長(zhǎng)SQL語句。存在上面會(huì)導(dǎo)致業(yè)務(wù)訪問緩慢,需要定位那些SQL占用內(nèi)存較大或者死鎖,針對(duì)詳細(xì)狀況進(jìn)行優(yōu)化代碼。表空間使用信息監(jiān)測(cè);表空間占用太大會(huì)影響查詢效率,需要優(yōu)化存儲(chǔ)構(gòu)造,將集中存儲(chǔ)換為單表文獻(xiàn),索引依照實(shí)際業(yè)務(wù)進(jìn)行優(yōu)化,與否需要索引,或者索引刪除重建,或者建立分區(qū)表。數(shù)據(jù)庫文獻(xiàn)I/0讀寫狀況;數(shù)據(jù)庫I/0反映數(shù)據(jù)庫瓶頸,查看引起I/O較大因素是業(yè)務(wù)量較大還是服務(wù)器I/O當(dāng)前,更換存儲(chǔ)類型,必要狀況下更換內(nèi)存數(shù)據(jù)庫等。Session連接數(shù)量監(jiān)控;Session長(zhǎng)鏈接數(shù)量較大會(huì)導(dǎo)致數(shù)據(jù)庫負(fù)載較高,需要考慮將長(zhǎng)鏈接更換為短連接。數(shù)據(jù)庫監(jiān)聽運(yùn)營狀態(tài)監(jiān)測(cè);數(shù)據(jù)庫運(yùn)營狀態(tài)為down會(huì)導(dǎo)致業(yè)務(wù)中斷,查看是業(yè)務(wù)層還是網(wǎng)絡(luò)層引起問題,如果為網(wǎng)絡(luò)層,需要對(duì)網(wǎng)絡(luò)狀況排除,如果為業(yè)務(wù)層導(dǎo)致,要進(jìn)行SQL優(yōu)化。查看每日數(shù)據(jù)備份、數(shù)據(jù)同步與否正常;數(shù)據(jù)庫備份異常,會(huì)導(dǎo)致備份數(shù)據(jù)丟失,對(duì)于數(shù)據(jù)庫遷移,和數(shù)據(jù)恢復(fù)導(dǎo)致不可恢復(fù)影響,需要詳細(xì)查看引起該問題是數(shù)據(jù)庫自身還是服務(wù)器問題,詳細(xì)問題詳細(xì)分析解決。對(duì)表和索引進(jìn)行Analyze,檢查表空間碎片;數(shù)據(jù)庫表和索引占用量太大會(huì)影響查詢效率,需要調(diào)節(jié)表構(gòu)造或者索引刪除重建。數(shù)據(jù)庫對(duì)象空間擴(kuò)展?fàn)顩r監(jiān)測(cè);表空間擴(kuò)展太快會(huì)導(dǎo)致數(shù)據(jù)庫服務(wù)器存儲(chǔ)空間占滿,數(shù)據(jù)庫down掉等異常狀況,需要優(yōu)化表構(gòu)造。5.6云管理平臺(tái)運(yùn)維服務(wù)云管理平臺(tái)重要涉及管理節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)、存儲(chǔ)節(jié)點(diǎn)運(yùn)維。同步,實(shí)時(shí)監(jiān)控重點(diǎn)虛擬機(jī),保證重要業(yè)務(wù)不中斷。重要內(nèi)容涉及:ManagementServer狀態(tài)及性能監(jiān)控(cpu、內(nèi)存、磁盤、io、mysql數(shù)據(jù)庫、系統(tǒng)及應(yīng)用日記等);虛擬化主機(jī)agent狀態(tài)監(jiān)控;主存儲(chǔ)及二級(jí)存儲(chǔ)使用率監(jiān)控;數(shù)據(jù)中心虛擬資源(cpu、內(nèi)存、磁盤)使用量監(jiān)控;單臺(tái)計(jì)算節(jié)點(diǎn)cpu、內(nèi)存分派及實(shí)際使用量監(jiān)控;單臺(tái)存儲(chǔ)節(jié)點(diǎn)硬盤分派及實(shí)際使用量監(jiān)控;虛擬機(jī)模版、網(wǎng)絡(luò)、方案方略制定;系統(tǒng)虛擬機(jī)、虛機(jī)路由狀態(tài)監(jiān)控;非計(jì)費(fèi)顧客閑置虛擬資源回收;顧客資源審批、賬戶充值及余額管理;虛擬機(jī)外網(wǎng)網(wǎng)絡(luò)及端口開通;計(jì)算節(jié)點(diǎn)主機(jī)及存儲(chǔ)節(jié)點(diǎn)擴(kuò)容;5.7運(yùn)維工具監(jiān)控工具實(shí)驗(yàn)室選用開源運(yùn)維工具Zabbix,Zabbix是一種基于WEB界面提供分布式系統(tǒng)監(jiān)控以及網(wǎng)絡(luò)監(jiān)控功能公司級(jí)開源運(yùn)維平臺(tái),也是當(dāng)前國內(nèi)互聯(lián)網(wǎng)顧客中使用最廣監(jiān)控軟件。 Grafana-zabbix展示效果入門容易、上手簡(jiǎn)樸、功能強(qiáng)大并且開源免費(fèi)是對(duì)Zabbix最直觀評(píng)價(jià)。Zabbix易于管理和配備,能生成比較美麗數(shù)據(jù)圖,其自動(dòng)發(fā)現(xiàn)功能大大減輕尋常管理工作量,豐富數(shù)據(jù)采集方式和API接口可以讓顧客靈活進(jìn)行數(shù)據(jù)采集,而分布式系統(tǒng)架構(gòu)可以支持監(jiān)控更多設(shè)備。理論上,通過Zabbix提供插件式架構(gòu),可以滿足公司任何需求。長(zhǎng)處:1.支持多平臺(tái)公司級(jí)分布式開源監(jiān)控軟件;2.安裝布置簡(jiǎn)樸、管理以便;3.功能強(qiáng)大,監(jiān)控靈活,可實(shí)現(xiàn)復(fù)雜多條件告警;4.各種數(shù)據(jù)采集插件,靈活集成;5.自帶畫圖功能,得到數(shù)據(jù)可以繪成圖形;6.同步支持調(diào)用腳本,很以便;7.提供各種API接口,定制化最高監(jiān)控軟件;8.浮現(xiàn)問題時(shí)可自動(dòng)遠(yuǎn)程執(zhí)行命令(需對(duì)agent設(shè)立執(zhí)行權(quán)限);缺陷:1.項(xiàng)目批量修改不以便;2.社區(qū)雖然成熟,但是中文資料相對(duì)較少,服務(wù)支持有限;3.入門容易,能實(shí)現(xiàn)基本監(jiān)控,但是深層次需求需要非常熟悉Zabbix并進(jìn)行大量二次定制開發(fā),難度較大;4.系統(tǒng)級(jí)別報(bào)警設(shè)立相對(duì)比較多,如果不篩選話報(bào)警郵件會(huì)諸多;并且自定義項(xiàng)目報(bào)警需要自己設(shè)立,過程比較繁瑣;5.缺少數(shù)據(jù)匯總功能,如無法查看一組\o"服務(wù)器"服務(wù)器平均值,需進(jìn)行二次開發(fā);6.數(shù)據(jù)報(bào)表需要特殊二次開發(fā)定義;實(shí)驗(yàn)室監(jiān)控體系也有集中式監(jiān)控?cái)U(kuò)展到分布式監(jiān)控,監(jiān)控系統(tǒng)之間耦合性逐漸減少。在分布式系統(tǒng)中,整個(gè)系統(tǒng)有一種監(jiān)控中心服務(wù)器,若干個(gè)子監(jiān)控服務(wù)器和被監(jiān)控對(duì)象構(gòu)成,每一種子監(jiān)控服務(wù)器負(fù)責(zé)監(jiān)控屬于它所屬子系統(tǒng),不同子系統(tǒng)之間也不完全獨(dú)立,她們之間規(guī)模也不大,產(chǎn)生數(shù)據(jù)也不是很大。這樣就大大減小中心監(jiān)控服務(wù)器工作壓力。圖:分布式監(jiān)控架構(gòu)分布式監(jiān)控重要分三個(gè)層次,最底層是需要監(jiān)控節(jié)點(diǎn),她通過啟動(dòng)snmp服務(wù)或者積極發(fā)送trapped或者啟動(dòng)agent進(jìn)程。收集每個(gè)節(jié)點(diǎn)狀態(tài)信息,并向監(jiān)控子服務(wù)器發(fā)送收集信息。中間層是proxy服務(wù)器層,它負(fù)責(zé)收集每個(gè)節(jié)點(diǎn)發(fā)送給它監(jiān)控信息,然后向中心監(jiān)控服務(wù)器發(fā)送收集到監(jiān)控信息。最上面一層是中心監(jiān)控服務(wù)器,它重要負(fù)責(zé)收集每個(gè)子監(jiān)控服務(wù)器數(shù)據(jù),然后存入數(shù)據(jù)庫,再通過web服務(wù)器發(fā)送提供呈現(xiàn)、查詢、等服務(wù)。分布式監(jiān)控構(gòu)造將大量數(shù)據(jù)采集工作分散到每個(gè)監(jiān)控子系統(tǒng)中,從而極大減少了監(jiān)控中心服務(wù)器壓力,減少了網(wǎng)絡(luò)負(fù)載,但是也也許帶來一定系統(tǒng)延遲。Zabbix性能優(yōu)化:性能指標(biāo)采集方式依照不同指標(biāo)類型進(jìn)行指標(biāo)分組,如CPU組、內(nèi)存組、文獻(xiàn)系統(tǒng)組、進(jìn)程組等,每個(gè)性能組又相應(yīng)若干個(gè)性能,依照不同顧客對(duì)于不同指標(biāo)關(guān)注度不同,指標(biāo)采集力度也不同,如CPU內(nèi)存等實(shí)時(shí)度規(guī)定比較高,需要1分鐘采集一次,而相應(yīng)存儲(chǔ)硬盤檢測(cè)也許趨勢(shì)變化不大,因此采集力度也許比較大一周或者一月。而隨著設(shè)備量增長(zhǎng),虛機(jī)擴(kuò)張變快,zabbix服務(wù)器優(yōu)化不得不加入考慮,Zabbix雖然采用分布式構(gòu)造,但是指標(biāo)計(jì)算(按照通用指標(biāo)記錄):2500(服務(wù)器數(shù)量)*15(指標(biāo)數(shù)量)*3600(一天)=Zabbixserver性能同過查看指標(biāo),每秒解決數(shù)和等待隊(duì)列長(zhǎng)度Zabbix數(shù)據(jù)庫調(diào)優(yōu):使用innodb,為每一張數(shù)據(jù)庫表使用一種文獻(xiàn),修改my.cfinnodb_file_per_table=1;使用分區(qū)表關(guān)閉houerkeeper,zabbix_server.conf參數(shù)DisableHousekeeper=1;使用分區(qū)表,需要建立分區(qū)有關(guān)表f配備文獻(xiàn)有關(guān)樣例如下圖:6、應(yīng)急服務(wù)響應(yīng)辦法運(yùn)維項(xiàng)目組制定了詳盡應(yīng)急解決預(yù)案,整個(gè)流程嚴(yán)謹(jǐn)而有序。但在服務(wù)維護(hù)過程中,意外狀況將難以完全避免。咱們將對(duì)項(xiàng)目實(shí)行突發(fā)風(fēng)險(xiǎn)進(jìn)行詳細(xì)分析,并且針對(duì)各類突發(fā)事件,設(shè)計(jì)了相應(yīng)防止與解決辦法,同步提供了完整
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)生數(shù)學(xué)學(xué)習(xí)進(jìn)度安排計(jì)劃
- 停車設(shè)備制造企業(yè)質(zhì)量提升計(jì)劃
- 湘教版七年級(jí)數(shù)學(xué)家長(zhǎng)溝通計(jì)劃
- 中小學(xué)師德建設(shè)培訓(xùn)計(jì)劃
- 小學(xué)開學(xué)初心理健康教育線上線下計(jì)劃
- 小學(xué)英語趣味學(xué)習(xí)計(jì)劃
- 2025年中國墓碑燈籠市場(chǎng)調(diào)查研究報(bào)告
- 花城版五年級(jí)上冊(cè)學(xué)科交叉教學(xué)計(jì)劃
- 2025年中國卡通工藝臺(tái)燈市場(chǎng)調(diào)查研究報(bào)告
- 工地安全隱患與防止跌倒措施
- 人教版四年級(jí)英語下冊(cè)教學(xué)課件-四下recycle1 第一課時(shí)
- 職業(yè)教育數(shù)字化轉(zhuǎn)型
- 2024年電子商務(wù)新興業(yè)態(tài)探討試題及答案
- 2024-2025學(xué)年全國版圖知識(shí)競(jìng)賽考試題庫 (含答案)
- 2024年山東省濟(jì)南市中考數(shù)學(xué)模擬試卷(三)(含答案)
- (正式版)SHT 3046-2024 石油化工立式圓筒形鋼制焊接儲(chǔ)罐設(shè)計(jì)規(guī)范
- 近視眼的防控課件
- 食品添加劑 亞硫酸鈉標(biāo)準(zhǔn)文本(食品安全國家標(biāo)準(zhǔn))
- 抖音直播運(yùn)營團(tuán)隊(duì)薪酬績(jī)效考核管理方案(直播帶貨團(tuán)隊(duì)薪酬績(jī)效提成方案)
- 風(fēng)生水起的投資年報(bào)
- “緬懷先烈,感恩前行”清明節(jié)主題班會(huì)ppt課件
評(píng)論
0/150
提交評(píng)論