已閱讀5頁,還剩92頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
某某公司某某公司 災難備份系統(tǒng)集成項目災難備份系統(tǒng)集成項目 技術響應文件技術響應文件 1 目目 錄錄 1 1 項目簡介項目簡介4 1.1 項目概述.4 1.2 項目目標與原則.4 1.2.1 項目目標4 1.2.2 項目建設原則.5 1.2.3 項目建設內(nèi)容.8 2 2 技術方案描述技術方案描述.9 2.1 技術方案設計.9 2.1.1 用戶現(xiàn)狀分析.9 2.1.2 技術方案設計原則.9 2.1.3 技術方案拓撲圖.10 2.1.4 技術方案概述.11 2.1.5 技術方案優(yōu)勢總結(jié).12 2.1.6 災難恢復方案.12 2.1.6.1 關鍵業(yè)務系統(tǒng)中普遍存在的問題14 2.1.6.2 實施業(yè)務連續(xù)性方案的意義15 2.1.6.3 惠普災難恢復方法17 2.1.6.3.1 什么是容災系統(tǒng).17 2.1.6.5.2.3 某某公司系統(tǒng)數(shù)據(jù)容災的遠程復制18 2.1.6.4 容災系統(tǒng)的管理 .19 2.1.6.4.1 組織機構(gòu).19 2.1.6.4.2 管理制度和操作規(guī)程.20 2.1.6.4.3 災難的預防.20 2.1.6.4.4 災難恢復計劃的測試、試運行和維護21 2.1.6.5 培訓測試及維護 .22 2.1.6.5.1 培訓.22 2.1.6.5.2 測試災難恢復計劃.22 2.1.6.5.3 測試方法.23 2.1.6.5.4 測試的頻率.23 2.1.6.5.5 可能引起變化的因素.23 2.1.6.5.6 測試流程的制定.23 2.1.6.5.7 維護.24 2.1.6.6 惠普公司容災實施服務內(nèi)容25 2.1.6.6.1 方案實施核心服務(core service) .25 2.1.6.6.2 方案實施增值服務(value-added service)27 2.1.6.7 客戶收益 .29 2.1.6.8 hp 容災解決方案優(yōu)勢.29 2.1.6.9 產(chǎn)品配置 .30 2.2 軟件系統(tǒng)方案.32 2 2.2.1 實現(xiàn)容災系統(tǒng)的軟件配置.34 2.2.2 數(shù)據(jù)復制模式及實時性.35 2.2.3 容災數(shù)據(jù)的使用.36 2.2.4 容災數(shù)據(jù)的一致性.37 2.2.5 容災方案的恢復時間及恢復點.38 2.2.6 系統(tǒng)升級39 2.2.7 vxvm及vvr復制對系統(tǒng)的性能影響.40 2.2.8 容災技術對照.41 2.2.9 symantec/veritas系統(tǒng)實施案例42 2.3 hp eva8400 磁盤陣列特性.43 2.3.1 eva8400與ibm 4800的比較優(yōu)勢:.44 2.3.2 概述48 2.3.3 新特性.48 2.3.4 功能與優(yōu)勢49 2.3.5 虛擬化概述:.50 2.3.6 軟件解決方案.52 2.3.7 eva8400的保修服務53 2.3.8 技術規(guī)格55 2.4 災備管理及應用服務器.56 2.4.1 設備選型56 2.4.2 機架式服務器配置設計.57 2.4.3 機架式服務器選型.57 2.4.4 惠普服務器管理系統(tǒng).60 2.4.4.1 虛擬連接管理 .60 2.4.4.2 服務器系統(tǒng)管理軟件67 2.4.4.2.1 遠程管理及控制.67 2.4.4.2.2 分發(fā)及部署.68 2.4.4.2.3 安全管理.68 2.4.4.2.4 虛擬環(huán)境管理.68 2.4.4.2.5 性能管理.68 3 3 惠普技術服務實施方案惠普技術服務實施方案69 3.1 技術服務實施計劃.69 3.1.1 技術服務實施概述.69 3.1.1.1 技術服務實施總體要求69 3.1.1.2 服務范圍和服務內(nèi)容69 3.1.2 項目人員組成.70 3.1.2.1 項目組織結(jié)構(gòu)圖 .70 3.1.2.2 惠普項目組成員職責70 3.1.3 服務實施計劃進度表.71 3.1.4 服務準備階段.72 3.1.5 技術服務現(xiàn)場實施階段.73 3 4 4 培訓服務培訓服務 78 4.1 培訓服務內(nèi)容.78 4.2 課程介紹.79 4.2.1 eva磁盤陣列管理培訓79 4.2.2 備份系統(tǒng)培訓.80 4.2.3 災難恢復培訓.80 5 5 技術支持與售后服務技術支持與售后服務81 5.1 中國惠普技術支持機構(gòu)分布狀況.81 5.1.1 惠普上海支持中心及主要成員介紹.81 5.2 設備質(zhì)保期內(nèi)售后服務方案.82 5.2.1 保修內(nèi)容82 5.2.2 保修期內(nèi)服務流程.84 5.2.3 保修期內(nèi)緊急故障處理流程.85 5.3 保修期后服務內(nèi)容.86 5.3.1 基于服務器或存儲設備的軟硬件支持服務.87 5.3.2 基于服務器或存儲設備的主動式服務.90 5.3.3 可訂購的技術服務.90 5.3.4 設備質(zhì)保期后服務價格.92 5.4 免費技術支持.92 6 6 設備清單設備清單 93 4 1 1 項目簡介項目簡介 1.1 項目概述項目概述 隨著社會飛速發(fā)展,在越來越多的企業(yè)實現(xiàn)了數(shù)據(jù)、應用大集中以后,數(shù) 據(jù)的安全、業(yè)務的連續(xù)性等就成了企業(yè)管理者必須認真思考的問題。自然災害、 人為失誤,這些大大小小、似乎是防不勝防的災難事件給我們的正常生活和工 作帶來了許多負面的影響,比如經(jīng)濟損失、信譽受損,甚至可能導致企業(yè)倒閉。 為了避免或者盡量減輕這些事故或者災難對業(yè)務的影響,企業(yè)必須建設完善的 數(shù)據(jù)備份及災難恢復系統(tǒng)。 災難恢復對企業(yè)而言,已不再以單純的 it 環(huán)境為對象,而是將快速恢復整 個業(yè)務流程及運營作為最終目的,其中的關鍵,就是恢復核心數(shù)據(jù)及關鍵業(yè)務 應用的運行。所以,企業(yè)的災難備份策略,要圍繞“快速恢復整個業(yè)務流程及運 營”這個最終目的。 而災難備份方案,則要緊緊扣住“恢復核心數(shù)據(jù)及關鍵業(yè)務應用的運行”這 個關鍵點。首先是數(shù)據(jù)級的災難備份與恢復,緊接著是主要業(yè)務應用的災難備 份與恢復。 災備系統(tǒng)應能達到:一旦主系統(tǒng)出現(xiàn)問題,能在數(shù)秒鐘內(nèi)自動而正確無誤 地切換到災備系統(tǒng),保持整個系統(tǒng)繼續(xù)運行;待主系統(tǒng)修復之后能很方便地復 原,使整亇系統(tǒng)繼續(xù)正常運行。 1.2 項目目標與原則項目目標與原則 1.2.1 項目目標項目目標 結(jié)合某某公司 it 基礎架構(gòu)的現(xiàn)狀,規(guī)劃將 ibm 4800 上的數(shù)據(jù)容災至容災 5 中心的新磁盤陣列上。具體需要實現(xiàn)以下具體目標: (1)高可靠性保障 系統(tǒng)數(shù)據(jù)容災之后必須保證其正確性和完整性,不能有任何數(shù)據(jù)丟失,盡 可能減少業(yè)務系統(tǒng)的停機時間。 (2)高性能設計 新的存儲上線后將面臨大量的用戶業(yè)務請求,和不斷新增的業(yè)務內(nèi)容,用戶 同樣不能忍受任何性能瓶頸,因此要求提供的存儲設備是在大吞吐量以及海量 數(shù)據(jù)環(huán)境中具有高性能設計的產(chǎn)品。 (3)高擴展性 系統(tǒng)數(shù)據(jù)量在未來會有不斷增長,因此要求提供的存儲設備具有容量以及 處理能力上無縫的擴展能力,存儲設備的初始容量要能夠滿足未來 3-5 年的數(shù) 據(jù)存儲要求。 (4)數(shù)據(jù)安全性 磁盤、raid 級別的故障,業(yè)務不中斷,數(shù)據(jù)不丟失;陣列級別的故障, 業(yè)務中斷不超過 1 小時,數(shù)據(jù)不丟失;機房級別的故障,業(yè)務中斷時間可預見, 數(shù)據(jù)丟失為分鐘級;發(fā)生誤刪除、病毒等邏輯錯誤,數(shù)據(jù)在小時級別恢復; (5)高效易管理性 通過靈活高效的災難恢復技術,可以將災難恢復系統(tǒng)設備和災難恢復流程 統(tǒng)一的管理起來,降低管理的復雜度,滿足系統(tǒng)對恢復點目標和恢復時間目標 的要求。 1.2.2 項目建設原則項目建設原則 在系統(tǒng)的建設過程中,我們遵循的建設原則是: 統(tǒng)一規(guī)劃,分步實施,目標明確;堅持科學性、先進性、實用性、可靠性 和標準化等原則;調(diào)動各方面的積極性;制定嚴格的網(wǎng)絡安全機制、用戶使用 原則和違約處理原則;特別強調(diào)應用與服務。 (1)統(tǒng)一性原則 為了能夠更好地實施某某公司災難恢復系統(tǒng),我們堅持某某公司統(tǒng)一領導 6 的原則;根據(jù)實際業(yè)務流程和管理范圍,對系統(tǒng)規(guī)劃、系統(tǒng)實施進行統(tǒng)一的部 署;系統(tǒng)建設要統(tǒng)一組織實施,即體現(xiàn)在主要業(yè)務軟件統(tǒng)一開發(fā)、使用人員統(tǒng) 一培訓等方面。 (2)持續(xù)發(fā)展原則 工程設計方案應立足當前,著眼長遠;適應電信設備進網(wǎng)管理系統(tǒng)業(yè)務發(fā) 展的需要,樹立全局意識;進行統(tǒng)一、長遠的規(guī)劃,逐步實施。 (3)科學性原則 應用系統(tǒng)的設計遵循科學性原則,包括數(shù)據(jù)結(jié)構(gòu)和標準體系要符合辦公系 統(tǒng)信息的內(nèi)在邏輯體系,同時,要充分考慮人的的認知結(jié)構(gòu)。 選用適用的標準和科學的方法是本方案遵循的科學性原則。 以軟件工程理論以及當前軟件開發(fā)技術的理論為基礎,應用系統(tǒng)架構(gòu)完全 采用這些已經(jīng)得到實踐證明的科學技術,以科學理論為準繩,來指導我們的系 統(tǒng)設計和開發(fā)工作。 (4)標準化原則 系統(tǒng)建設將遵守國際標準、國家標準及行業(yè)標準,使系統(tǒng)具有良好的兼容 性。 從計算機技術和網(wǎng)絡技術以及通信技術的發(fā)展來看,標準化無疑是技術突 飛猛進的一個重要因素,只有采用標準化的技術和標準化的協(xié)議才能和國際接 軌,才能和全球信息高速公路接軌,交換數(shù)據(jù)和信息資源,才能保證系統(tǒng)的開 放性。 系統(tǒng)平臺的選型、系統(tǒng)的接口、數(shù)據(jù)庫標準等等必須采用相關的國際標準、 國家標準。沒有國際、國家標準的地方根據(jù)應用的要求需要制定自己的標準, 以保證將來系統(tǒng)的擴展性。 系統(tǒng)平臺必須采用國際標準的數(shù)據(jù)庫來實現(xiàn)空間數(shù)據(jù)的管理,對各類應用 服務提供標準的服務接口和規(guī)范,支持開放性技術,以方便不同應用需求。保 證設計實現(xiàn)的質(zhì)量,以及便于日常維護和系統(tǒng)的擴展。 系統(tǒng)應建立完備的數(shù)據(jù)標準,數(shù)據(jù)的組織應符合相關主要國際和國家標準; 對于未有明確規(guī)范的部分,則建立自己的標準并予以規(guī)范。 7 (5)先進性原則 系統(tǒng)開發(fā)需采用成熟的高新科技,以目前較為先進的方法實現(xiàn)需要的功能, 既反應當今科技的先進水平,又具有發(fā)展?jié)摿Α?(6)實用性原則 實用性就是能夠最大限度地滿足實際工作要求,是每個信息系統(tǒng)在建設過 程中所必須考慮的一種系統(tǒng)性能,它是自動化系統(tǒng)對用戶最基本的承諾。所以, 從實際應用的角度來看,這個性能更加重要,為了提高辦公自動化和管理信息 系統(tǒng)中系統(tǒng)的實用性,應該考慮如下幾個方面: 系統(tǒng)總體設計要充分考慮用戶當前各業(yè)務層次、各環(huán)節(jié)管理中數(shù)據(jù)處 理的便利性和可行性,把滿足業(yè)務需求作為第一要素進行考慮; 采取總體設計、分步實施的技術方案,在總體設計的前提下,系統(tǒng)實 施中可首先進行業(yè)務處理層及管理中的低層管理,穩(wěn)步向中高層管理 及全面自動化過渡,這樣做可以使系統(tǒng)始終與用戶的實際需求緊密連 在一起,不但增加了系統(tǒng)的實用性,而且可使系統(tǒng)建設保持很好的連 貫性; 全部人機操作設計均應充分考慮不同用戶的實際需要; 用戶接口及界面設計將充分考慮人體結(jié)構(gòu)特征及視覺特征進行優(yōu)化設 計,切合實際的了解工作人員和用戶的使用習慣,界面盡可能美觀大 方,及具有良好可操控性。 (7)可靠性原則 系統(tǒng)設計時,首先考慮選用穩(wěn)定可靠的產(chǎn)品和技術,使其具有必要的糾錯 能力,并且適合計算機網(wǎng)絡通信技術的更新?lián)Q代。各應用系統(tǒng)的運行,365 天 不間斷,要求系統(tǒng)能長期穩(wěn)定可靠地工作。在系統(tǒng)發(fā)生故障時,要有及時有效 的備份辦法處理,使其不影響其它應用系統(tǒng)的運行,保證系統(tǒng)數(shù)據(jù)不丟失和迅 速恢復。 (8)可擴展性原則 計算機技術、網(wǎng)絡技術、通信技術正處于一個不斷飛速發(fā)展的時期,隨著 公司信息化建設的不斷推進,所涉及的業(yè)務的需求會不斷的飛速上升,可以預 8 料需求也是不斷增長變化的。在軟件結(jié)構(gòu)設計過程中,必須充分考慮未來信息 的增長趨勢,盡量選用可升級的結(jié)構(gòu),為系統(tǒng)功能的擴充和技術的平滑升級提 供極大的方便。因此整個系統(tǒng)的建設要遵循可擴展性的原則:系統(tǒng)適應靈活多 變的業(yè)務邏輯,充分發(fā)揮數(shù)據(jù)與應用邏輯相分離的思想,適應用戶不斷變化的 業(yè)務和功能上的拓展。系統(tǒng)具有安全方便的移植能力,為用戶系統(tǒng)的升級提供 保證。 另外,服務端的發(fā)展是有一個過程的,相應的負荷也是一個由小到大的過 程。按最經(jīng)濟的原則,將系統(tǒng)規(guī)劃成一個擴展性很強、且在擴容升級時浪費最 少的系統(tǒng)。遵循開放性原則,能夠支持多種硬件設備和網(wǎng)絡系統(tǒng),軟件支持二 次開發(fā)。應用系統(tǒng)采用標準數(shù)據(jù)接口,具有與其他信息系統(tǒng)進行數(shù)據(jù)交換和數(shù) 據(jù)共享的能力等。 應用軟件順應當今軟件設計發(fā)展方向,采用瀏覽器服務器(b/s)結(jié)構(gòu)和模 塊化設計,采用模塊化,標準二次可開發(fā)的組件設計思路保證所設計的內(nèi)容具 有最好的可擴展性。 (9)安全性原則 在線業(yè)務系統(tǒng)的特點決定了安全性將是軟件系統(tǒng)設計中首要考慮的因素。 系統(tǒng)操作權限要有嚴格設定,數(shù)據(jù)庫的安全措施是保證系統(tǒng)的安全運行的基礎。 除了在硬件/網(wǎng)絡、操作系統(tǒng)、數(shù)據(jù)庫一級提供可靠的安全保密措施以外,上層 應用系統(tǒng)的設計也必須進一步強化確保用戶數(shù)據(jù)在存儲、傳輸、查詢等過程中 的絕對安全,杜絕非法用戶未經(jīng)授權地對數(shù)據(jù)進行修改和操作數(shù)據(jù) (10)可管理原則 系統(tǒng)應具備安裝快速簡捷、配置方便容易、使用簡單方便等特點。系統(tǒng)用 戶的素質(zhì)千差萬別,系統(tǒng)建成后,一定要適用于廣大的系統(tǒng)使用人員。 1.2.3 項目建設項目建設內(nèi)容內(nèi)容 項目建設內(nèi)容包括: 在災備中心建設一套系統(tǒng)的數(shù)據(jù)級別災難恢復系統(tǒng),防范本地機房站 9 點級災難,同時開發(fā)一套數(shù)據(jù)級災難恢復計劃,并做相應的災難恢復 演練和災難恢復培訓,規(guī)范后續(xù)災難恢復計劃的管理、維護和更新。 購置一套高性能、高可靠性、高可擴展性磁盤陣列 eva8400,用于容災 中心。 2 2 技術方案描述技術方案描述 2.1 技術方案設計技術方案設計 2.1.1 用戶現(xiàn)狀分析用戶現(xiàn)狀分析 某某公司在本地本地和異地均有服務器和交換機,本地和異地之間, 通過光纖連接,在本地有一臺 ibm 4800 存儲,現(xiàn)在需要在異地新購一臺存儲 設備,以實現(xiàn)本地和異地之間的存儲容災。在本地災難發(fā)生時,使數(shù)據(jù)和應用 在一定時間內(nèi), 2.1.2 技術方案設計原則技術方案設計原則 根據(jù)我們對某某公司災難恢復系統(tǒng)建設需求的了解和以往實施各大型項目 的經(jīng)驗,我們認為,本系統(tǒng)在規(guī)劃和設計過程中,應遵循以下一些原則: 開放性和標準性 考慮到存儲系統(tǒng)未來引進新的業(yè)務系統(tǒng),使用的通信協(xié)議和數(shù)據(jù)格式都有 可能不同,因此,系統(tǒng)須支持多種標準的通信協(xié)議和數(shù)據(jù)格式,并完成數(shù)據(jù)格 式的統(tǒng)一轉(zhuǎn)換。同時,系統(tǒng)采用的計算機網(wǎng)絡體系結(jié)構(gòu)以及通信協(xié)議要符合國 家安全標準要求。我們將依據(jù)國際標準和國家標準,為用戶建立一個開放、完 善的系統(tǒng),有效地保護用戶投資。 成熟性與先進性 系統(tǒng)要真正發(fā)揮出作用,首先必須能夠穩(wěn)定、正常地運行,這就需要建立 在成熟的技術基礎之上。而在兼顧系統(tǒng) 10 成熟性的前提下,采用業(yè)界先進的技術,才能保證系統(tǒng)的先進性,使計算機系 統(tǒng)發(fā)揮最大的效率,并隨著技術的不斷發(fā)展得到相應的更新。 可靠性與可用性 采用計算機系統(tǒng)的目的就是為了提高工作效率,更好地實現(xiàn)本工程的各類 建設目標。因此在系統(tǒng)的設計過程中,我們將努力采用各種先進技術來加強系 統(tǒng)的高可靠性和高可用性,以保證系統(tǒng)連續(xù)、正常地工作。 可擴展性 根據(jù)某某公司業(yè)務發(fā)展的要求,現(xiàn)有系統(tǒng)的設計必須具有一定的擴展能力, 留有升級的余地,以滿足業(yè)務的發(fā)展和快速、方便的聯(lián)網(wǎng)。我們將采用結(jié)構(gòu)化、 開放的、易于擴展的體系結(jié)構(gòu),在充分利用現(xiàn)有資源、保護現(xiàn)有投資的前提下, 保證系統(tǒng)的可擴充性,適應業(yè)務的持續(xù)發(fā)展需要。 安全性和保密性 建設系統(tǒng)軟、硬件的選型和建設模式的制定都必須充分考慮采用成熟、可 靠的產(chǎn)品和技術措施,保證系統(tǒng)的安全。同時在通過采用各種手段保證敏感信 息的安全。 易操作性和可維護性 現(xiàn)代計算機系統(tǒng)越來越復雜,這就對操作管理人員提出了更高的要求。一 個技術再尖端的計算機系統(tǒng),如果用戶不能自如地進行操作管理,也不可能成 為一個好的系統(tǒng),甚至會導致系統(tǒng)僅僅成為一個擺設。因此,我們的系統(tǒng)將貫 徹面向最終用戶的原則,建立友好的用戶界面,使操作簡單、直觀、靈活,易 于學習掌握,便于用戶使用和管理,以發(fā)揮系統(tǒng)的最大實際效益。 2.1.3 技術方案拓撲圖技術方案拓撲圖 根據(jù)某某公司系統(tǒng)災難恢復要求設計的架構(gòu)如下圖: 11 veritas volume manager e ev va a8 84 40 00 0 備備用用 2.1.4 技術方案概述技術方案概述 結(jié)合系統(tǒng)對災難恢復數(shù)據(jù)級容災的要求, 該方案采用新購買一臺高性能的 eva8400,做為對原有的 ibm 4800 的容災,采用 dl580 服務器作為災備管理的 應用服務器,采用 veritas 的 veritas volume manager 軟件,做為兩臺陣列之 間的容災軟件。 存儲和備份系統(tǒng)設備配置方案如下: 設備編號設備編號設備名稱設備名稱數(shù)量數(shù)量備注備注 1磁盤陣列1 臺 hp eva8400,32 個 300g 15k fc 硬盤, 配管 理小家電,配 cv 管理軟件 10t 容量許可證,10 根 15 米的 lc 到 lc 接口的光纖線,原廠機柜。 3 年 7*24 小時級別服務。 2容災軟件1 套veritas veritas volume manager 軟件。 3災備服務器8 套hp dl580r05 12 2.1.5 技術方案優(yōu)勢總結(jié)技術方案優(yōu)勢總結(jié) 惠普災難恢復解決方案針對 it 系統(tǒng)對于企業(yè)業(yè)務起關鍵作用的客戶以 及監(jiān)管審計機構(gòu)對業(yè)務連續(xù)和災難恢復有明確要求的客戶量身打造, 涵蓋電信、銀行、稅務、電力、社保、保險、證券、基金、制造業(yè)等 重點行業(yè)。業(yè)務連續(xù)和災難恢復解決方案是惠普公司專為希望采用遠 程災難恢復的方式實現(xiàn)關鍵業(yè)務數(shù)據(jù)保護的企業(yè)用戶提供實施幫助而 設計的,它通過惠普公司業(yè)務連續(xù)專家,項目管理專家和一系列經(jīng)過 驗證的分析、設計、實施以及測試服務步驟為您提供全面和詳盡的容 災方案部署和應用,并幫助客戶從技術、流程、人員三方面提高業(yè)務 持續(xù)能力,保證企業(yè)的正常運作和發(fā)展,其服務內(nèi)容主要涵蓋高可用 的信息技術基礎平臺建設、日常運作流程設計、突發(fā)事件管理、大型 災害的應對計劃和策略以及業(yè)務持續(xù)性管理團隊建設與咨詢、應急指 揮中心和通訊系統(tǒng)等。 hp eva8400 企業(yè)虛擬陣列旨在為大中型企業(yè)市場中的客戶提供領先 的高性能、高容量和高可用性“虛擬”陣列存儲解決方案。 與傳統(tǒng)架 構(gòu)的存儲相比,這些解決方案不但可以降低 it 成本和復雜性,而且可 以節(jié)約時間、空間和總體擁有成本。eva 專為迫切需要提高存儲利用 率和可擴展性的數(shù)據(jù)中心而設計,能夠提供始終如一的高性能交易 i/o,滿足具體應用的需求,可輕松進行容量擴展,同時還提供即時復 制功能和簡化的存儲管理功能。 2.1.6 災難恢復方案災難恢復方案 惠普公司為上海制造廠提供的災難恢復方案具有以下特點和優(yōu)勢:惠普公司為上海制造廠提供的災難恢復方案具有以下特點和優(yōu)勢: hp 根據(jù)二十多年業(yè)務連續(xù)和災難恢復建設經(jīng)驗總結(jié)歸納了業(yè)務連續(xù) 和災難恢復建設方法論,可以系統(tǒng)的指導容災系統(tǒng)的建設 完整詳盡的數(shù)據(jù)遠程備份和災難恢復方案,惠普能夠提供從服務器、 13 網(wǎng)絡、存儲、san、監(jiān)控、遠程集群等全面解決方案。避免容災實 施只是片面實施了存儲復制 容災實施內(nèi)容包括技術、流程、人員三個方面,并可以協(xié)助用戶制 定災難恢復計劃(drp) 大量實施案例,經(jīng)過驗證的容災系統(tǒng)實施和支持能力,豐富的實施 經(jīng)驗和人員,強大的專人支持 hp 全球超過 5000 名關鍵系統(tǒng)支持工程師和 600 名通過認證的 san 工程師。 hp 公司目前在中國有 40 名售前技術工程師,70 名資深的技術咨詢工程師,和 超過 300 名有豐富經(jīng)驗的安裝調(diào)試人員和故障處理工程師,并有 20 多位容災咨 詢顧問和多位通過國際容災協(xié)會認證專家。 以 xp/eva 為基礎的災難恢復解決方案作為惠普公司成熟的數(shù)據(jù)保護解決 方案之一,已經(jīng)在國內(nèi)為許多用戶進行安裝運行。我們希望利用最好的資源協(xié) 助某某公司建立災難恢復/恢復系統(tǒng),并且在日常的維護中給予及時的響應,確 保整個系統(tǒng)實施和運轉(zhuǎn)正常。 在今天的科技社會中,it 技術的運用已經(jīng)滲透到了我們生活和工作的各個 層面,為我們帶來了以往任何一次技術革命都沒有的便利和迅捷,可以說,由 于采用了 it 技術的新的生產(chǎn)方式已經(jīng)基本上代替了原來的生產(chǎn)方式,成為現(xiàn)代 社會運作和發(fā)展的主流,我們對計算機系統(tǒng)的依賴超過了以往任何一種技術。 然而計算機系統(tǒng)在為業(yè)務的迅猛發(fā)展提供信息技術基礎架構(gòu)的同時,也帶 來了以往我們不曾發(fā)覺的負面因素。例如由于信息和處理的高度集中使業(yè)務運 轉(zhuǎn)過度依賴于 it 系統(tǒng),并會因為 it 系統(tǒng)的突發(fā)問題而受到很大影響,嚴重的 甚至可以導致業(yè)務系統(tǒng)無法正常進行。這些問題包括了進行系統(tǒng)檢修和升級帶 來長時間的系統(tǒng)停機,系統(tǒng)自身的或者人為的因素或事故發(fā)生連鎖性的擴大, 以及不可預見的故障和突發(fā)性災難等等。 如何避免業(yè)務運轉(zhuǎn)受到影響,或者使業(yè)務影響盡可能降到最低,這是每一 個企業(yè)管理者必須考慮和重視的問題。某某公司經(jīng)過長期的思考,如何切實有 效的保障綜合營帳等關鍵業(yè)務系統(tǒng)的連續(xù)運行已經(jīng)成為某某公司管理層十分關 14 注的問題。 本方案涵蓋高可用的信息技術基礎平臺建設、日常運作流程設計、突發(fā)事 件管理和大型災害的應對計劃和策略,業(yè)務持續(xù)性管理團隊建設和咨詢等諸多 方面的服務,可以幫助客戶從技術、流程、人員三方面提高業(yè)務持續(xù)能力,保 證企業(yè)的正常運作和發(fā)展。 2.1.6.1 關鍵業(yè)務系統(tǒng)中普遍存在的問題關鍵業(yè)務系統(tǒng)中普遍存在的問題 提高 it 系統(tǒng)的高可靠性以及 it 系統(tǒng)的容災建設早已不再是新鮮的話題了, 隨著許多電信運營商用戶實施業(yè)務系統(tǒng)大集中,針對 it 系統(tǒng)的高可靠性和容災 能力的需求日漸突出,很多電信運營商都已經(jīng)實施了有針對性的容災系統(tǒng),并 且更多討論的是如何實現(xiàn)業(yè)務數(shù)據(jù)的有效保護和電信業(yè)務的連續(xù)性運行。 然而,目前大多數(shù)容災系統(tǒng)的建設還是存在許多問題的。這些問題中不僅 有技術層面的缺陷,更多的是在流程和人員方面的不足。這些問題可能導致的 直接后果就是當發(fā)生災難時,根本無法實現(xiàn)應用系統(tǒng)的快速恢復,甚至可能導 致業(yè)務運轉(zhuǎn)的長時間災難性中斷。我們可以列舉出其中的一些: 1 僅從產(chǎn)品功能層面考慮問題,最終建設的容災環(huán)境僅是一個多種 產(chǎn)品的堆積。僅實現(xiàn)了數(shù)據(jù)的遠程復制或者離線存放,沒有進行災難的各 種場景測試和災難預演,并缺乏災難恢復機制和危機應對流程。發(fā)生災難 時,不知道到底數(shù)據(jù)或者系統(tǒng)能否恢復正常。 2 進行了一定的測試和預演,但是缺少相應的災難恢復計劃和特殊 情況下的行動指南,更沒有全面的業(yè)務連續(xù)性計劃。在真正發(fā)生災難時, 百廢待興、千頭萬緒的情況下,沒有依據(jù)和參考,可能無法順利進行有關 操作。 3 有了災難恢復計劃等必要文檔,但是沒有及時的將 it 系統(tǒng),業(yè)務 流程和管理人員等不斷變化的信息更新,導致容災手冊成為一紙空文。 4 具備了以上的要素,但是容災系統(tǒng)的建設局限在 it 部門,缺少業(yè) 15 務部門的參與和管理高層的介入和全力支持。發(fā)生災害時,it 系統(tǒng)能夠恢 復但是業(yè)務流程仍無法恢復運轉(zhuǎn)。 除了以上列出的問題之外,還有許多問題如容災系統(tǒng)的負載能力估計不足, 實施過程中沒有嚴格遵循高可靠標準,實施過程工作界面過多溝通不足,日常 運維管理方面存在不足和漏洞,缺少廠商、系統(tǒng)集成商的后續(xù)支持服務等等都 可能導致業(yè)務持續(xù)性系統(tǒng)建設的失敗。 除了以上的問題之外,另一類問題是項目小組僅將目光放在了大型災難等 突發(fā)事件的應對之上,而忽略了計劃性停機對業(yè)務運行的影響。根據(jù)有關統(tǒng)計, 非計劃性停機只占 13%的停機概率,而在非計劃停機中大型自然災難占的比例 就更低了。所以在項目實施時,未能很好的優(yōu)化現(xiàn)有系統(tǒng)和流程,沒有充分發(fā) 掘現(xiàn)有潛力,未能將日常操作流程和業(yè)務持續(xù)性目標充分整合,雖然實現(xiàn)了容 災但是仍沒有從本質(zhì)上解決持續(xù)性問題。 hp 公司提供的業(yè)務連續(xù)性解決方案是基于 hp 公司長期的實踐經(jīng)驗和業(yè)界 公認的業(yè)務持續(xù)方法論(bcp) ,結(jié)合客戶的具體實際情況,采用業(yè)界先進成熟 的產(chǎn)品和技術,由資深顧問和技術專家構(gòu)成的實施小組遵循 it 服務管理 (itsm)理念進行實施。充分考慮了以上普遍性問題,保證了項目目標的成功 實現(xiàn),同時 hp 公司可以提供整個容災項目的整體解決方案單點后續(xù)支持服務, 這一點完全不同于業(yè)界其他友商僅能提供單一產(chǎn)品支持的服務模式。 2.1.6.2 實施業(yè)務連續(xù)性方案的意義實施業(yè)務連續(xù)性方案的意義 某某公司業(yè)務發(fā)展的速度是非常驚人的,這點可從業(yè)務連續(xù)多年快速的發(fā) 展反映出來。這樣的飛速發(fā)展使某某公司在單位時間內(nèi)的盈利水平不斷提高, 因此,業(yè)務的間斷直接意味著收入損失;另一方面,提供高可靠性、高水準的 客戶服務也是某某公司保持競爭能力和市場份額的重要手段;隨著支撐某某公 司業(yè)務運營的 it 系統(tǒng)建設的不斷發(fā)展,某某公司在享受 it 支撐系統(tǒng)帶來的高 效率、高盈利的優(yōu)勢的同時,其業(yè)務運作也更加依賴于 it 系統(tǒng)的穩(wěn)定運行,其 結(jié)果是,一旦發(fā)生大的災難,it 系統(tǒng)及其所支持的關鍵業(yè)務系統(tǒng)將處于癱瘓, 16 用戶信息、運營數(shù)據(jù)等也隨之丟失,這樣的后果,顯然是某某公司不愿意看到 的。所以某某公司對其計算機業(yè)務系統(tǒng)的連續(xù)運行,業(yè)務系統(tǒng)、業(yè)務數(shù)據(jù)的高 可用性以及業(yè)務計算機系統(tǒng)抵御災難能力的要求也必然急劇提高。 綜上所述,某某公司建設災難備份中心有如下的意義: 重要業(yè)務數(shù)據(jù)在災難發(fā)生后得以保護。 重要業(yè)務在災難發(fā)生后可以在一定的時間內(nèi)恢復,連續(xù)運行。對 于 hp 提供的方案,即使在本地的 ibm 4800 發(fā)生宕機,數(shù)據(jù)仍可持續(xù)進行 讀寫,完全不影響業(yè)務的進行,切換時間為零。 業(yè)務計算機系統(tǒng)抵御災難的級別提高。 提升了關鍵業(yè)務系統(tǒng)的高可用性,減少計劃性停機對業(yè)務的影響。 進一步提高某某公司在行業(yè)中的聲譽,增強客戶及潛在客戶對企 業(yè)的信心。 增加對競爭對手的優(yōu)勢。 eva 8400 較之 ibm 4800,性能指標上更加先進(具體見本方案 第 44 頁“eva 8400 與 ibm 4800 優(yōu)勢比較表” ) 。能使容災系統(tǒng)地高性能 運轉(zhuǎn)。 17 2.1.6.3 惠普惠普災難恢復方法災難恢復方法 2.1.6.3.1 什么是容災系統(tǒng)什么是容災系統(tǒng) 容災系統(tǒng)是業(yè)務永續(xù)運行的重要的組成部分。所謂災難,通常是指引起關 鍵業(yè)務的信息服務中斷,且中斷的時間及造成的損失超出企業(yè)所能承受的范圍 之外的意外情況。引起災難的因素很多,可以是系統(tǒng)環(huán)境中的軟件、硬件故障, 有意或過失的人為破壞,還可能是因火災、颶風、地震而引起的數(shù)據(jù)處理設備 的損壞等等,只要造成了關鍵業(yè)務的中斷,都是災難。而容災就是通過預先建 立的備份中心、備份設備和備份數(shù)據(jù)等,在可以容忍的時間內(nèi)恢復業(yè)務系統(tǒng)的 正常運行,將企業(yè)因業(yè)務中斷而導致的損失降低到預定的程度。 相對于業(yè)務永續(xù)運行來說,容災強調(diào)的是企業(yè)的關鍵業(yè)務在災難發(fā)生時的 應對能力和恢復能力,即通過盡可能快速的、全面的企業(yè)業(yè)務恢復運作,將因 災難造成的損失降低到最小程度。顯然,它并不保證業(yè)務的零間斷能力;實際 上,容災系統(tǒng)的整個災難恢復過程必須會造成一段時間的業(yè)務中斷。另外,也 正是因為可以容忍一段時間的業(yè)務間斷,所以其實施難度、周期和規(guī)模都要遠 遠小于實現(xiàn)業(yè)務持續(xù)性系統(tǒng)的建設。 從廣義上講,任何提高系統(tǒng)可用性的努力,都可稱之為容災。本地容災, 例如主機集群:當某臺主機出現(xiàn)故障,不能正常工作時,其他的主機可以替代 該主機,繼續(xù)進行正常工作。而我們平時講到的容災,尤其是值得重視的容災, 一般都是指遠程容災。遠程容災可以這樣理解:在各行業(yè)企業(yè)用戶的 it 系統(tǒng)中, 必然有一部分(尤其是核心部分)是非常重要的,我們叫它生產(chǎn)中心。人們往 往給生產(chǎn)中心配備一個備份中心,該備份中心是遠程的,并且在生產(chǎn)中心的內(nèi) 部,已經(jīng)實施了各種各樣的數(shù)據(jù)保護。不論采取什么方式進行保護,當火災、 地震這類突發(fā)性災難發(fā)生時,一旦生產(chǎn)中心癱瘓了,備份中心將能接管生產(chǎn)系 統(tǒng),繼續(xù)提供網(wǎng)絡服務。比如,全國鐵路調(diào)度中心網(wǎng)絡系統(tǒng),當發(fā)生火災、地 18 震等災難性事件時,該系統(tǒng)仍要保持正常進行,不能因為調(diào)度中心出現(xiàn)災難性 事件,全國的鐵路系統(tǒng)就處于癱瘓狀態(tài),讓災難不合理地蔓延。 我們認為,一個有效的高可靠性計算環(huán)境應該能夠做到: 數(shù)據(jù)中心任何計算機系統(tǒng)硬件,軟件及應用的單點故障將不會影 響整個數(shù)據(jù)中心的處理工作; 數(shù)據(jù)中心由于災難(火災、地震、斷電)等原因無法工作時,應有 一個備份數(shù)據(jù)中心能夠迅速接管關鍵應用,繼續(xù)運行; 主數(shù)據(jù)中心恢復后,應用系統(tǒng)、業(yè)務數(shù)據(jù)應能迅速切換回主中心 運行。 2.1.6.5.2.3 某某公司系統(tǒng)某某公司系統(tǒng)數(shù)據(jù)容災的遠程復制數(shù)據(jù)容災的遠程復制 通常說來,對于遠程災難恢復方案建議用戶建立兩個數(shù)據(jù)中心,主中心和 備份中心。正常情況下,應用運行在主數(shù)據(jù)中心的計算機系統(tǒng)上,數(shù)據(jù)也存放 在主中心的存儲系統(tǒng)中。當主數(shù)據(jù)中心由于斷電,火災甚至地震等災難無法工 作時,則立即采取一系列相關措施,將網(wǎng)絡、電話線路切換至備份中心,并且 利用備份中心計算機系統(tǒng)重新啟動應用系統(tǒng)。 而這里最關鍵的問題就是切換過程時間最短,同時盡可能保持主數(shù)據(jù)中心 和備份中心數(shù)據(jù)的連續(xù)性和完整性。而由于財務數(shù)據(jù)的重要性,如何解決主、 備中心數(shù)據(jù)庫數(shù)據(jù)備份,恢復則是災難恢復方案的重點。 傳統(tǒng)的磁帶備份方式一般采取定點備份,而當系統(tǒng)崩潰時。距最近一次備 份時間之間的數(shù)據(jù)將全部丟失。無法恢復。而且磁盤備份、恢復時間比較長由 于速度饅,缺乏實時性,無法滿足用戶大數(shù)據(jù)量數(shù)據(jù)恢復及數(shù)據(jù)庫連續(xù)性,實 時性的要求。 而現(xiàn)在流行的災難恢復方案主要是采用實時的數(shù)據(jù)備份的方式。它的主要 原理是通過通信線路,實時地將主中心更新數(shù)據(jù)拷貝至備份中心存儲系統(tǒng)中, 保證主、備中心數(shù)據(jù)的實時一致性。當主中心無法工作時,備份中心可以立即 接管業(yè)務,并且確保數(shù)據(jù)的最大完整性。根據(jù)用戶現(xiàn)狀,其主要實施方法有: 19 a.通過高端存儲陣列容災:例如 ibm 的 erm 鏡像軟件,可以實 現(xiàn)主數(shù)據(jù)中心和備份中心的操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫的實時拷貝維護。 不占用主機 cpu,內(nèi)存,i/o 資源,其缺點是本地的存儲設備一旦發(fā)生損 壞,則容災中心的容災存儲設備不能實時啟動,本地災難發(fā)生后,必須斷 開與遠程的鏈接,且由于容災中心的數(shù)據(jù)均為裸數(shù)據(jù),所以重新啟動應用 需要一定的時間,視數(shù)據(jù)類型的不同,此切換時間,在數(shù)分鐘至數(shù)十分鐘, 且在此時間內(nèi),會發(fā)生數(shù)據(jù)丟失現(xiàn)象。 b.采用 veritas 的 storage foundation 軟件,同時將數(shù)據(jù)寫到本 地和遠程的數(shù)據(jù)中心。采用這種方式與應用和存儲都無關,可實現(xiàn)異構(gòu)存 儲且不需修改應用,分別使用 hp eva 8400 和 ibm ds4800 的其一部分的存 儲空間通過 veritas storage foundation 進行磁盤卷的鏡像。使得 ibm ds4800 發(fā)生得任何失效,最后一刻的數(shù)據(jù)都在數(shù)據(jù)容災中心的 hp eva 8400 磁盤存儲上存在。并且如果服務器并未發(fā)生停機,則所有應用皆可正 常運行,沒有任何的停機及切換時間存在。 容災方式比較采用 ibm 4800采用 hp eva8400 加 veritas 軟件 數(shù)據(jù)丟失本地存儲宕機后,數(shù) 據(jù)可能產(chǎn)生丟失 本地存儲宕機后,數(shù)據(jù) 不丟失。 應用啟動時間本地存儲宕機后,異 地啟動應用,需要一 定時間,從數(shù)分鐘到 數(shù)十分鐘不等。 本地存儲宕機后,所有 應用均可正常運行,沒 有任何的停機及切換時 間存在。 存儲ibm 4800指標更優(yōu)秀的 eva 8400 20 根據(jù)某某公司系統(tǒng)的現(xiàn)狀,我們認為采用采用根據(jù)某某公司系統(tǒng)的現(xiàn)狀,我們認為采用采用 veritas volume manager 進進 行異構(gòu)系統(tǒng)的容災方案才是符合某某公司實際需求行異構(gòu)系統(tǒng)的容災方案才是符合某某公司實際需求。 2.1.6.4 容災系統(tǒng)的管理容災系統(tǒng)的管理 2.1.6.4.1 組織機構(gòu)組織機構(gòu) 容災備份系統(tǒng)需要由專門機構(gòu)(指定現(xiàn)有相關部門或者設立新機構(gòu))負責 日常的管理、維護、以及災難發(fā)生后的系統(tǒng)恢復等工作。該機構(gòu)的主要職責、 職能主要包括: (1)備份系統(tǒng)的日常維護工作,確保當前備份系統(tǒng)是正常、有效的、以 及數(shù)據(jù)備份的完整性、一致性; (2)測試及研究工作。測試工作包括對當前備份系統(tǒng)、備份數(shù)據(jù)有效性、 可用性的測試、以及對應用軟件的升級測試等;研究與容災備份相關的技術方 案優(yōu)化以及相關制度、規(guī)程的完善; (3)日常管理、協(xié)調(diào)職能。負責本部門的日常管理工作,并負責與主用 中心、以及相關方面的協(xié)調(diào)工作; (4)災難發(fā)生后的系統(tǒng)恢復以及生產(chǎn)組織職能; 2.1.6.4.2 管理制度和操作規(guī)程管理制度和操作規(guī)程 容災備份系統(tǒng)的管理、維護、系統(tǒng)恢復、生產(chǎn)組織等需要完善的管理制度 和嚴密的操作規(guī)程予以約束、規(guī)范,以確保備份系統(tǒng)的可用性和生產(chǎn)恢復的有 效性。 在建設容災備份系統(tǒng)的同時,應結(jié)合自身情況建立并不斷完善相關的管理 制度、操作規(guī)程,其中包括: (1)容災備份工作的領導與組織分工; 21 (2)容災備份中心機構(gòu)的職能、職責;人員崗位責任制度; (3)日常維護管理制度和操作規(guī)程; (4)測試管理制度;(包括備份系統(tǒng)有效性測試、應用軟件升級測試等) (5)災難/故障的監(jiān)測與分析、報告制度、以及審批流程規(guī)定; (6)系統(tǒng)恢復/切換的操作流程和規(guī)范; (7)備份系統(tǒng)恢復運行后的生產(chǎn)組織制度;(其中應包含數(shù)據(jù)的安全與 備份) (8)主用系統(tǒng)重新恢復工作的管理與組織制度。 2.1.6.4.3 災難的預防災難的預防 系統(tǒng)容災應包含災難預防的內(nèi)容,即研究相應對策將災難帶來的損失降低 到最小程度,這包括: (1)系統(tǒng)技術設計方案的不斷優(yōu)化,在不斷提升系統(tǒng)自身安全可靠性的 同時,使系統(tǒng)和數(shù)據(jù)備份的實施、管理、操作更簡便、運行更可靠; (2)容災備份策略和技術方案的不斷完善,不斷提高備份數(shù)據(jù)的一致性、 完整性,縮短系統(tǒng)運行中斷的時間; (3)相關管理制度、操作流程和規(guī)程的不斷完善、改進; (4)努力減少系統(tǒng)的安全隱患; (5)可能也包括備份系統(tǒng)機房地點的合理選擇等。 2.1.6.4.4 災難恢復計劃的測試、試運行和維護災難恢復計劃的測試、試運行和維護 通過測試、試運行可檢驗災難恢復系統(tǒng)功能是否達到設計要求。測試和模 擬試運行可以檢驗災難恢復計劃文檔資料的完整性,恢復策略的正確性,可以 提高工作人員的操作熟練程度。應選擇適當?shù)臑碾y恢復計劃測試策略。通過測 試可以提高災難恢復計劃的質(zhì)量,改進災難恢復過程,可以使相關部門配合有 序,同時由于應用系統(tǒng)環(huán)境如系統(tǒng)環(huán)境、網(wǎng)絡配置、應用系統(tǒng)恢復的優(yōu)先級不 22 斷變化,災難恢復計劃也應隨之進行修改。 23 2.1.6.5 培訓測試及維護培訓測試及維護 經(jīng)過努力建立起的災難恢復計劃系統(tǒng),某某公司必須通過內(nèi)部培訓和周期 性的測試才能為各層次參予人員所了解、掌握。同時隨著某某公司 it 數(shù)據(jù)中心 業(yè)務的不斷完善和發(fā)展,各方面的條件和情況亦會變化,因此還需要有穩(wěn)定可 靠的維護。 2.1.6.5.1 培訓培訓 成立專門的災難恢復計劃小組; 選定一些對業(yè)務或技術非常熟悉的關鍵人員作為災難恢復小組參予 人員。以保證在危機處理的正確、高效。 制定培訓計劃: 讓大家了解項目的背景,以及各人在災難發(fā)生時的相應責任,應掌 握的知識與技能; 計劃培訓進度與日程; 協(xié)調(diào)各相關部門負責人,保證培訓時間; 管理培訓質(zhì)量。 2.1.6.5.2 測試災難恢復計劃測試災難恢復計劃 測試災難恢復計劃,不僅可以驗證計劃的有效性、完整性,亦可以幫助大 家熟悉過程,做好準備工作。歸納如下: 驗證計劃過程與策略,發(fā)現(xiàn)疵暇之處 可以獲得具體的恢復時間概念(如網(wǎng)絡是如何被恢復的,速度如何) 可以測試備份主機系統(tǒng)與網(wǎng)絡系統(tǒng)的效率 可以向領導、審計、管理、媒體等展示 可以使整個隊伍熟練其各自的角色與責任 24 2.1.6.5.3 測試方法測試方法 測試的很重要的一個原則是不停生產(chǎn)機,采用獨立或并行的方式進行。如 果是并行則可以與生產(chǎn)環(huán)境比較結(jié)果。 測試的第二個原則是按模塊進行,即將龐大的系統(tǒng)分解開來,按模塊獨立 測試,而非一開始就動員全行測試。由于各模塊的相對獨立性,測試是可以分 解成一個一個模塊進行的。這樣的難度較小,也易于組織與管理。 2.1.6.5.4 測試的頻率測試的頻率 測試目標是為了保持系統(tǒng)的現(xiàn)時性,即系統(tǒng)能跟上變化的步伐,但同時亦 要考慮費用問題等。 2.1.6.5.5 可能引起變化的因素可能引起變化的因素 主要操作系統(tǒng)的升級 重要應用軟件和改變 主要硬件改變 人員變動 2.1.6.5.6 測試流程的制定測試流程的制定 測試流程的制定是在測試中最為重要的一環(huán),只有測試是在可控的前提下, 測試才具備檢驗系統(tǒng)安全性、鍛煉應急隊伍的意義。因此客戶測試流程的制訂 需要在最終客戶、相關設備的供應商和災備系統(tǒng)實施方三方共同協(xié)商確定,已 確保原有系統(tǒng)的穩(wěn)定運行。 25 2.1.6.5.7 維護維護 為保證災難恢復計劃的穩(wěn)定可靠運行,需要有明確的維護政策,保證人員 及資金的適當投入。并定期檢查報告,管理層可以了解其狀態(tài)。 26 2.1.6.6 惠普公司容災實施服務惠普公司容災實施服務內(nèi)容內(nèi)容 hp 公司為某某公司提供的遠程災難備份解決方案由目前業(yè)界技術最為先進 的 hp eva 系列磁盤陣列以及相應的光纖交換機和用來連接主數(shù)據(jù)中心和備份數(shù) 據(jù)中心的光纖網(wǎng)絡設備組成。 在某某公司容災項目的實施過程中,hp 公司將委派具有豐富項目實施經(jīng)驗的 項目經(jīng)理,使用項目管理的方法對容災方案的實施進行高效的統(tǒng)一管理;并利用 hp 容災專家豐富的容災知識和實施經(jīng)驗,結(jié)合廣泛驗證的容災方法和設計技術 將大大縮短實現(xiàn)容災方案的時間,確保實現(xiàn)容災方案的設計目標,并盡量減少和 避免在容災方案的實施過程中對用戶業(yè)務系統(tǒng)的影響,從而全面降低容災實施過 程中的風險,確保某某公司的容災方案能夠得到平穩(wěn)順利的高質(zhì)量實施。 2.1.6.6.1 方案實施核心服務(方案實施核心服務(core service) 項目管理服務項目管理服務 由惠普項目經(jīng)理對容災項目的整體實施過程進行管理,包括項目啟 動、制定項目實施計劃、項目采購管理、項目資源管理、項目的整 體進度管理以及跟蹤項目進展并執(zhí)行變更和應急情形管理。 容災方案規(guī)劃設計容災方案規(guī)劃設計 在確認容災的恢復策略之后,惠普和客戶將合作進行恢復技術方案 的詳細設計,詳細方案包括具體的服務器配置、存儲配置、san配 置、容災軟件配置、網(wǎng)絡配置、數(shù)據(jù)復制對應關系、備份策略、災 難切換方案。 容災系統(tǒng)產(chǎn)品及主機代理軟件安裝配置服務容災系統(tǒng)產(chǎn)品及主機代理軟件安裝配置服務 容災系統(tǒng)的安裝服務,除了基本的相關存儲設備及存儲系統(tǒng)軟件的 安裝,還包括數(shù)據(jù)復制軟件的安裝和ltu激活、相關邏輯卷,文件 系統(tǒng)及應用數(shù)據(jù)庫的配置、系統(tǒng)主機代理軟件包的安裝和配置。 遠程遠程san互聯(lián)服務(光纖直連)互聯(lián)服務(光纖直連) 27 容災系統(tǒng)遠程連接鏈路的搭建服務,基本服務中只包括光纖直連的 方式。服務內(nèi)容除了光纖交換機的基本安裝,還包括san的綜合布 線、跨區(qū)域遠程san的配置,zoning的劃分和合并、光纖數(shù)據(jù)復制 鏈路功能測試以及光纖網(wǎng)絡容災參數(shù)配置服務。 災難切換腳本開發(fā)災難切換腳本開發(fā) 開發(fā)容災系統(tǒng)切換所需要的腳本,服務內(nèi)容包括設計容災系統(tǒng)的切 換策略,并與用戶討論確定;編寫腳本,形成指令切換或自動切換; 各種腳本的測試和驗證、優(yōu)化工作。 技術切換測試技術切換測試 在容災系統(tǒng)搭建完成后,對容災系統(tǒng)的基本切換功能進行測試。包 括建立、檢驗及執(zhí)行異地故障切換機制、系統(tǒng)測試方案的設計,并 與用戶討論確定、容災系統(tǒng)切換及回切測試。 災難恢復技術切換流程開發(fā)災難恢復技術切換流程開發(fā) 對容災系統(tǒng)日常維護和災難發(fā)生時的技術恢復流程進行設計,包括 容災系統(tǒng)維護方案設計、業(yè)務部門恢復數(shù)據(jù)的步驟和所需資源的設 計、故障流程觸發(fā)模式、升級模式的設計。 容災系統(tǒng)現(xiàn)場培訓服務容災系統(tǒng)現(xiàn)場培訓服務 針對用戶容災系統(tǒng)提供的現(xiàn)場技術培訓,在項目實施過程中提供1天 的現(xiàn)場培訓(不限人數(shù)) 。培訓形式為惠普顧問和工程師就容災系統(tǒng) 的安裝配置現(xiàn)場指導用戶it技術人員。 容災演習服務一次容災演習服務一次 容災演習服務將幫助客戶準備和執(zhí)行模擬的災難恢復演習。惠普通 過實施這一服務幫助客戶制定演習的恢復目標、描述災難場景、制 定演習計劃,并完成一次災難恢復演習。服務內(nèi)容包括為測試演習 而模擬的故障或災難的設計、制定系統(tǒng)整體演習的測試計劃、召開 演習前的溝通會議、建立測試小組,觀察測試過程及提出建議、按 照測試計劃進行容災演習以及演習后的總結(jié)。 28 2.1.6.6.2 方案實施增值服務(方案實施增值服務(value-added service) 災難風險評估(災難風險評估(ra) 本服務主要是對客戶現(xiàn)有的風險及災難管理能力和水平進行評估, 其目的是為了了解客戶災難控制和預防的現(xiàn)狀,從風險管理的角度 了解要提高客戶的災難規(guī)避和控制能力還需作的努力和工作,作為 確定具體項目實施目標的依據(jù)。服務內(nèi)容包括: 了解用戶部門現(xiàn)有的風險和災難管理手段評估 組織專題工作組 制作問卷 現(xiàn)場實地訪談 總結(jié)內(nèi)部報告 確定所有潛在的災難威脅 評估各種災難威脅的可能性 評估目前的災難緩解能力 確定未被控制的災難會對用戶部門系統(tǒng)造成的影響 分析新建立的風險控制手段對用戶部門系統(tǒng)的價值 確定項目周期內(nèi)要實施或改進的風險控制手段 制作報告并匯報講解 業(yè)務影響分析(業(yè)務影響分析(bia) 本服務主要是指在風險管理評估的基礎上,對各種可能無法規(guī)避的 災難對客戶業(yè)務的影響力進行具體的評估,包括無形的影響力(如 企業(yè)形象、客戶滿意度等)和可量化的影響(如收入損失、資產(chǎn)損 失等) 。服務內(nèi)容包括: 首先制定針對用戶 it 部門,并由用戶認可的業(yè)務影響分析 (bia)的調(diào)研問卷; 在調(diào)研問卷的基礎上,惠普咨詢專家聯(lián)合用戶的 it 技術人 員將與使用各業(yè)務應用系統(tǒng)的相關各業(yè)務主管,進行一次 29 正式的調(diào)研訪談,確定關鍵的量化指標,包括認可的 rto,rpo; 根據(jù)訪談的結(jié)果進行分析,得出相關分析結(jié)果并提供分析 報告。 容災策略制定容災策略制定 通過災難風險評估(ra)和業(yè)務影響分析(bia)確定了客戶需求, 檢查現(xiàn)有的架構(gòu)和運行管理的現(xiàn)狀,確定實現(xiàn)客戶災難恢復需求的 差距并惠普將提出相關的災難恢復策略,包括建議恢復策略下的系 統(tǒng)架構(gòu),關鍵應用系統(tǒng)的恢復策略級別(hot/warm/cold) ,關鍵應 用系統(tǒng)的恢復技術的選擇(數(shù)據(jù)庫復制,存儲區(qū)域網(wǎng)絡復制,磁帶 恢復,服務器集群高可用性技術等)等內(nèi)容。 災難恢復計劃災難恢復計劃 drp 開發(fā)開發(fā) 業(yè)務持續(xù)性計劃/災難恢復計劃是一套高級管理和規(guī)章流程,使一個 組織在突發(fā)性事件面前能夠迅速做出反應,以確保關鍵業(yè)務功能可 以持續(xù),而不造成業(yè)務中斷或業(yè)務流程本質(zhì)的改變。本服務主要是 完成具體的業(yè)務連續(xù)計劃/災難恢復計劃的設計和開發(fā),任務包括定 義詳細的災難恢復流程,明確所需的環(huán)境和資源,以及相應的容災 團隊建設。 遠程容災鏈路集成服務遠程容災鏈路集成服務 對復雜的容災鏈路進行搭建工作,對非光纖直連的遠程 san,ip 路 由方案進行實施,包括 dwdm 設備安裝和鏈路調(diào)試,相關管理軟 件的安裝調(diào)試,鏈路功能測試,性能調(diào)優(yōu)服務。 容災集群實施服務(容災集群實施服務(dtcs) 數(shù)據(jù)高可用集群服務是惠普根據(jù)用戶需求,協(xié)助客戶設計和實施本 地集群、校園級集群、同城集群和洲際集群。服務內(nèi)容包括: 容災集群方案設計:首先了解客戶當前的 it 環(huán)境以及容災 需求分析的結(jié)果(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度米面產(chǎn)品冷鏈物流配送服務合同4篇
- 2025年度模特影視廣告模特聘用合同協(xié)議
- 二零二五年度奶牛養(yǎng)殖信息化管理系統(tǒng)采購合同4篇
- 2025年度藝術品抵押貸款服務合同
- 杯間乾坤酒中情懷中國傳統(tǒng)文化之酒文化講解
- 2025年度個人房產(chǎn)托管服務合同范本2篇
- 上海國資國企創(chuàng)新基地2024年度區(qū)塊鏈創(chuàng)新應用白皮書
- 二零二五年度環(huán)保污染治理設施運營合同4篇
- 二零二五年度房地產(chǎn)項目營銷策劃合同
- 課題申報參考:農(nóng)村婦女土地權益特殊保障制度研究-基于浙江、四川、貴州12區(qū)縣的實證分析
- GB/T 16895.3-2024低壓電氣裝置第5-54部分:電氣設備的選擇和安裝接地配置和保護導體
- 安徽省合肥市2025年高三第一次教學質(zhì)量檢測地理試題(含答案)
- 計劃合同部部長述職報告范文
- 風光儲儲能項目PCS艙、電池艙吊裝方案
- 人教版高一地理必修一期末試卷
- GJB9001C質(zhì)量管理體系要求-培訓專題培訓課件
- 二手車車主寄售協(xié)議書范文范本
- 窗簾采購投標方案(技術方案)
- 基于學習任務群的小學語文單元整體教學設計策略的探究
- 高中英語原版小說整書閱讀指導《奇跡男孩》(wonder)-Part one 講義
- GB/T 9755-2001合成樹脂乳液外墻涂料
評論
0/150
提交評論