版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、XXX數(shù)據(jù)大集中容災(zāi)系統(tǒng)建設(shè)方案XXXXXXX科技有限責(zé)任公司2010年4月目 錄1概述32信息系統(tǒng)可用性風(fēng)險(xiǎn)和技術(shù)分析42.1計(jì)劃內(nèi)停機(jī)維護(hù)對(duì)IT系統(tǒng)的影響分析和技術(shù)解決方案42.2意外事件對(duì)IT系統(tǒng)的影響分析和技術(shù)解決方案52.3各種技術(shù)解決方案對(duì)企業(yè)信息高可用性的保護(hù)覆蓋范圍63XXXXXXX應(yīng)用級(jí)容災(zāi)系統(tǒng)建設(shè)方案93.1方案綜述93.2容災(zāi)方案的功能特點(diǎn)說(shuō)103.3容災(zāi)系統(tǒng)的工作原理113.4容災(zāi)工作過(guò)程詳解173.5應(yīng)用級(jí)容災(zāi)系統(tǒng)費(fèi)用估算214XXXXXXX數(shù)據(jù)級(jí)容災(zāi)系統(tǒng)建設(shè)方案224.1方案綜述224.2Symantec遠(yuǎn)程鏡像數(shù)據(jù)容災(zāi)原理224.3Symantec遠(yuǎn)程鏡像數(shù)據(jù)容災(zāi)
2、系統(tǒng)故障和災(zāi)難的響應(yīng)244.3.1當(dāng)生產(chǎn)中心數(shù)據(jù)系統(tǒng)故障254.3.2災(zāi)備中心數(shù)據(jù)系統(tǒng)故障以及生產(chǎn)中心和災(zāi)備中心SAN鏈路故障264.3.3故障修復(fù)后的恢復(fù)(遠(yuǎn)程鏡像快速恢復(fù))264.4系統(tǒng)容災(zāi)方案結(jié)構(gòu)和實(shí)現(xiàn)274.5應(yīng)用級(jí)容災(zāi)系統(tǒng)費(fèi)用估算275容災(zāi)系統(tǒng)外包285.1我公司的容災(zāi)外包服務(wù)方式285.1.1初級(jí)數(shù)據(jù)保護(hù)服務(wù)實(shí)現(xiàn)方式305.1.2中級(jí)數(shù)據(jù)保護(hù)服務(wù)實(shí)現(xiàn)方式315.1.3高級(jí)數(shù)據(jù)保護(hù)服務(wù)實(shí)現(xiàn)方式325.2我公司的數(shù)據(jù)災(zāi)備專(zhuān)業(yè)服務(wù)模式355.2.1運(yùn)維及管理的組織機(jī)構(gòu)365.2.2運(yùn)維及管理的規(guī)范395.2.3應(yīng)急服務(wù)流程405.2.4災(zāi)難演練流程設(shè)計(jì)475.2.5日常運(yùn)行維護(hù)管理策略5
3、25.3服務(wù)外包費(fèi)用估算571 概述隨著XXXXXXX業(yè)務(wù)量快速增長(zhǎng),業(yè)務(wù)系統(tǒng)越來(lái)越依賴他們的信息技術(shù)服務(wù),信息服務(wù)的可用性對(duì)于政府服務(wù)公眾越來(lái)越重要。同時(shí),隨著政府信息化的不斷完善,信息服務(wù)管理人員(信息中心)開(kāi)始意識(shí)到,僅有一個(gè)可用的IT系統(tǒng)遠(yuǎn)遠(yuǎn)無(wú)法滿足業(yè)務(wù)的需要,政府機(jī)構(gòu)的信息服務(wù)應(yīng)當(dāng)基于一個(gè)高可用的架構(gòu),以確保信息系統(tǒng)具備在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)持續(xù)執(zhí)行其功能的能力。尤其是XXXXXXX關(guān)鍵業(yè)務(wù)系統(tǒng)停頓時(shí)間決對(duì)不能超過(guò)1分鐘,目標(biāo)是永不宕機(jī),而XXXXXXX的業(yè)務(wù)系統(tǒng)作為關(guān)鍵應(yīng)用,業(yè)務(wù)停頓時(shí)間不能超過(guò)半個(gè)小時(shí),目標(biāo)是5分鐘的時(shí)間。無(wú)論何時(shí)何地我們對(duì)于IT系統(tǒng)的追求都是在降低成本的前提下,I
4、T系統(tǒng)宕機(jī)時(shí)間越短越好。而目前傳統(tǒng)的架構(gòu)是難以滿足這樣的要求的,從經(jīng)驗(yàn)判斷:在建設(shè)了政務(wù)信息系統(tǒng)后,管理人員開(kāi)始發(fā)現(xiàn),盡管在系統(tǒng)建設(shè)的時(shí)候,已經(jīng)充分地考慮的服務(wù)器以及存儲(chǔ)設(shè)備的硬件冗余,但信息系統(tǒng)還是經(jīng)常由于種種原因而不得不停止正常的服務(wù)。事實(shí)上,IT系統(tǒng)的可用性是一種“鏈”,即使最簡(jiǎn)單的一個(gè)信息服務(wù)系統(tǒng),也是由諸多軟、硬模塊共同組合而成,在“鏈”中的任意一個(gè)環(huán)節(jié)的不可用對(duì)于用戶而言,其結(jié)果都是一樣的無(wú)法使用信息服務(wù)在IT建設(shè)階段,用戶通常會(huì)將系統(tǒng)可用性的注意力集中在Network和Server層面上,以構(gòu)建一個(gè)穩(wěn)健的硬件架構(gòu);但當(dāng)系統(tǒng)投入使用后,用戶逐漸意識(shí)到Application/Data
5、base/OS/Storage的可用性往往顯得更為重要,企業(yè)信息系統(tǒng)幾乎90%以上的停機(jī)事件是由于系統(tǒng)/存儲(chǔ)/應(yīng)用程序等方面原因造成的。IT系統(tǒng)的停機(jī)事件可以基本分為2大類(lèi):1計(jì)劃內(nèi)停機(jī)維護(hù)2意外事件造成的停機(jī)故障2 信息系統(tǒng)可用性風(fēng)險(xiǎn)和技術(shù)分析2.1 計(jì)劃內(nèi)停機(jī)維護(hù)對(duì)IT系統(tǒng)的影響分析和技術(shù)解決方案在IT系統(tǒng)運(yùn)行的過(guò)程中,企業(yè)需要周期性地停止IT系統(tǒng)的服務(wù),對(duì)系統(tǒng)的軟硬件以及存儲(chǔ)進(jìn)行一定的調(diào)整,技術(shù)上我們稱(chēng)這種停機(jī)事件為計(jì)劃內(nèi)停機(jī)維護(hù),它通常包含以下一些內(nèi)容:n 系統(tǒng)的一般性檢查維護(hù),包括:網(wǎng)絡(luò)設(shè)備檢測(cè)、主機(jī)硬件設(shè)備自檢、磁盤(pán)數(shù)據(jù)校驗(yàn)、OS一般性告警事件檢查,或更換工作不正常的部件,添加部件
6、以改善性能等n 硬件Firmware和主機(jī)系統(tǒng)OS的升級(jí),打補(bǔ)丁等需要重啟硬件設(shè)備的操作,或相關(guān)可能對(duì)系統(tǒng)造成潛在嚴(yán)重影響,但又必須完成的例行工作(比如某些安全補(bǔ)丁或固件升級(jí)會(huì)造成系統(tǒng)的崩潰或運(yùn)行不正常)n 應(yīng)用系統(tǒng)或數(shù)據(jù)庫(kù)的軟件升級(jí),通常需要停止相應(yīng)的信息服務(wù)n 存儲(chǔ)系統(tǒng)的調(diào)整,比如添加/替換磁盤(pán),調(diào)整存儲(chǔ)空間,調(diào)整存儲(chǔ)網(wǎng)絡(luò)但隨著企業(yè)業(yè)務(wù)可用性的要求不斷增長(zhǎng),允許系統(tǒng)管理者進(jìn)行停機(jī)維護(hù)的時(shí)間越來(lái)越短,甚至要求在進(jìn)行上述正常周期性維護(hù)的時(shí)候,不能停止信息服務(wù),面對(duì)這樣的需求,通常會(huì)采用一些高可用技術(shù)方案來(lái)滿足:n 采用冗余的,支持熱插拔的硬件設(shè)備,當(dāng)需要進(jìn)行固件升級(jí)的時(shí)候,將硬件插拔到其他系統(tǒng)
7、進(jìn)行。n 構(gòu)建共享存儲(chǔ)的Cluster群集環(huán)境,包括購(gòu)買(mǎi)群集軟件,添加冗余的主機(jī)設(shè)備,當(dāng)需要進(jìn)行系統(tǒng)維護(hù)時(shí),將信息服務(wù)系統(tǒng)切換到熱備的主機(jī)上,繼續(xù)提供服務(wù),待系統(tǒng)維護(hù)完成后,再切換回原系統(tǒng)。n 購(gòu)買(mǎi)專(zhuān)業(yè)的存儲(chǔ)管理軟件,升級(jí)磁盤(pán)陣列系統(tǒng),構(gòu)建彈性的企業(yè)存儲(chǔ)平臺(tái)2.2 意外事件對(duì)IT系統(tǒng)的影響分析和技術(shù)解決方案信息系統(tǒng)的意外事件其實(shí)包含著許多因素:n 人為的錯(cuò)誤,比如誤操作或誤刪除數(shù)據(jù)造成信息服務(wù)的不可用n OS、應(yīng)用程序、硬件設(shè)備的失效或任何一個(gè)環(huán)節(jié)發(fā)生改變后所造成的不兼容問(wèn)題都會(huì)導(dǎo)致信息服務(wù)不可用n 由于軟件設(shè)計(jì)過(guò)程的原因,造成運(yùn)行一段時(shí)間后服務(wù)提供能力出現(xiàn)下降,也會(huì)導(dǎo)致信息服務(wù)不可用n 由于
8、軟件設(shè)計(jì)原因,導(dǎo)致當(dāng)出現(xiàn)某種特定事件時(shí),數(shù)據(jù)發(fā)生邏輯上的不一致,將直接導(dǎo)致該應(yīng)用的不可用n 戰(zhàn)爭(zhēng)、自然災(zāi)害、公共設(shè)施等非可抗力原因也會(huì)造成信息系統(tǒng)長(zhǎng)時(shí)間甚至永久的不可用針對(duì)上面的意外事件因素,企業(yè)信息管理者需要在2個(gè)技術(shù)層面來(lái)保障系統(tǒng)可用性:1在存儲(chǔ)上保證應(yīng)用數(shù)據(jù)的可用性,包括:n 通過(guò)存儲(chǔ)快照技術(shù)來(lái)防范應(yīng)用邏輯錯(cuò)誤以及人為失誤帶來(lái)的數(shù)據(jù)不可用風(fēng)險(xiǎn)n 通過(guò)存儲(chǔ)鏡像技術(shù)來(lái)防范磁盤(pán)或磁盤(pán)陣列失效帶來(lái)的存儲(chǔ)系統(tǒng)不可用風(fēng)險(xiǎn)n 通過(guò)存儲(chǔ)多路徑技術(shù),防范由于網(wǎng)卡板卡端口故障帶來(lái)的存儲(chǔ)系統(tǒng)不可用風(fēng)險(xiǎn)n 通過(guò)數(shù)據(jù)復(fù)制技術(shù),防范災(zāi)難帶來(lái)的數(shù)據(jù)損毀風(fēng)險(xiǎn)2在應(yīng)用上保證程序運(yùn)行的不間斷性,包括:n 采用并行計(jì)算技術(shù)提
9、高應(yīng)用程序的可用性級(jí)別n 采用HA群集軟件,讓備份系統(tǒng)可以迅速接管不可用的應(yīng)用系統(tǒng)2.3 各種技術(shù)解決方案對(duì)企業(yè)信息高可用性的保護(hù)覆蓋范圍綜合上面的分析,我們可以發(fā)現(xiàn),合適的部件冗余,群集技術(shù)和存儲(chǔ)鏡像、快照、復(fù)制技術(shù)是構(gòu)建一個(gè)高可用企業(yè)IT平臺(tái)的必要技術(shù)手段,雖然沒(méi)有任何一種單一技術(shù)可以解決企業(yè)信息系統(tǒng)的全部高可用需求,但通過(guò)靈活組合這些高可用技術(shù)并形成高可用的解決方案,可以滿足企業(yè)用戶的高可用需求,各種高可用技術(shù)的分析如下表:高可用技術(shù)保護(hù)覆蓋范圍無(wú)法防范的停機(jī)因素硬件冗余主機(jī)服務(wù)器失效操作系統(tǒng)失效SAN 網(wǎng)絡(luò)失效應(yīng)用程序錯(cuò)誤機(jī)房故障/失效邏輯數(shù)據(jù)不一致RAID磁盤(pán)故障多磁盤(pán)同時(shí)故障,陣列
10、故障主機(jī)服務(wù)器失效操作系統(tǒng)失效機(jī)房故障/失效邏輯數(shù)據(jù)不一致存儲(chǔ)快照邏輯數(shù)據(jù)不一致多磁盤(pán)同時(shí)故障,陣列故障主機(jī)服務(wù)器失效操作系統(tǒng)失效機(jī)房故障/失效群集技術(shù)應(yīng)用程序錯(cuò)誤 主機(jī)服務(wù)器失效操作系統(tǒng)失效邏輯數(shù)據(jù)不一致存儲(chǔ)失效數(shù)據(jù)復(fù)制/廣域群集機(jī)房故障自然災(zāi)害邏輯數(shù)據(jù)不一致但是,信息系統(tǒng)管理員的挑戰(zhàn)不僅限于發(fā)現(xiàn)這些能提高企業(yè)IT可用性的技術(shù),而在于有效利用這些技術(shù),來(lái)提高最終信息服務(wù)的可用性,比如:主機(jī)操作系統(tǒng)或應(yīng)用系統(tǒng)需要支持所配置的冗余部件,否則就無(wú)法達(dá)到高可用目的;存儲(chǔ)管理軟件需要支持多路徑技術(shù),否則就無(wú)法抵御存儲(chǔ)網(wǎng)絡(luò)的意外風(fēng)險(xiǎn),盡管已經(jīng)部署了冗余的網(wǎng)絡(luò)結(jié)構(gòu);群集系統(tǒng)需要支持快照及存儲(chǔ)冗余技術(shù),否則
11、就無(wú)法實(shí)現(xiàn)應(yīng)用程序的高可用性。這說(shuō)明只有整合這些高可用的技術(shù),簡(jiǎn)化在部署這些高可用組件的過(guò)程中,所帶來(lái)的額外的復(fù)雜性問(wèn)題,才能夠在信息服務(wù)的整體高度層面上實(shí)現(xiàn)高可用架構(gòu)的規(guī)劃。傳統(tǒng)的IT架構(gòu)采用單一服務(wù)器作為應(yīng)用系統(tǒng)的承載平臺(tái),而這樣的架構(gòu)面臨著巨大的挑戰(zhàn),多數(shù)大型企業(yè)已經(jīng)放棄這一架構(gòu),轉(zhuǎn)而采用更為高性能、高安全性、高擴(kuò)展的應(yīng)用及安全承載方案建立集中的數(shù)據(jù)中心以及后臺(tái)存儲(chǔ)系統(tǒng),面向應(yīng)用的提供統(tǒng)一的數(shù)字資源共享服務(wù)。在系統(tǒng)建設(shè)中面臨如何實(shí)現(xiàn)海量、高性能、安全開(kāi)放的數(shù)據(jù)存儲(chǔ)、如何保障系統(tǒng)擴(kuò)展性、關(guān)鍵數(shù)據(jù)安全等問(wèn)題。各應(yīng)用的關(guān)鍵性較強(qiáng),是整體的核心應(yīng)用。應(yīng)用系統(tǒng)的數(shù)據(jù)量將不斷增長(zhǎng),在線訪問(wèn)人數(shù)也將不
12、斷增加,對(duì)于存儲(chǔ)系統(tǒng)的建設(shè),提出了較高要求。因此,核心存儲(chǔ)系統(tǒng)應(yīng)具有高端的處理性、海量存儲(chǔ)、性能與容量在線擴(kuò)容等能力,以支撐業(yè)務(wù)發(fā)展的需求。長(zhǎng)期以來(lái),對(duì)企業(yè)而言,建立一套可行的容災(zāi)系統(tǒng)相當(dāng)困難,主要是高昂的成本和技術(shù)實(shí)現(xiàn)的復(fù)雜度。鑒于此,從可行性而言,必須具有良好的性能價(jià)格比。 建立異地容災(zāi)系統(tǒng),即指建立遠(yuǎn)程的數(shù)據(jù)中心,通過(guò)配置遠(yuǎn)程容災(zāi)系統(tǒng)將本地?cái)?shù)據(jù)實(shí)時(shí)進(jìn)行遠(yuǎn)程復(fù)制,同時(shí)實(shí)現(xiàn)本地系統(tǒng)故障時(shí)應(yīng)用系統(tǒng)的遠(yuǎn)程啟動(dòng),確保系統(tǒng)的不中斷運(yùn)行。 建立異地容災(zāi)中心的優(yōu)勢(shì)在于: 強(qiáng)大的一級(jí)災(zāi)難抗御能力。 有效防止物理設(shè)備損傷產(chǎn)生的災(zāi)難后果。 提供99.9999%的安全機(jī)制。 實(shí)時(shí)數(shù)據(jù)復(fù)制提供強(qiáng)大的數(shù)據(jù)交換能力。
13、隨著數(shù)據(jù)安全技術(shù)的發(fā)展,Cluster(HA)的技術(shù)越來(lái)越成熟,Cluster 的部署越來(lái)越普及,Cluster 技術(shù)確實(shí)解決了用戶系統(tǒng)的高可用性問(wèn)題,為業(yè)務(wù)的良性發(fā)展提供了穩(wěn)定的基石。隨著業(yè)務(wù)的發(fā)展,商業(yè)環(huán)境對(duì)服務(wù)供應(yīng)商提出的要求也越來(lái)越苛刻,這必將使應(yīng)用系統(tǒng)及其數(shù)據(jù)對(duì)高可用性的要求走上一個(gè)新的臺(tái)階。 一個(gè)本地Cluster 系統(tǒng)理論上可以提供99.99%以上的系統(tǒng)高可用性,但一旦發(fā)生火災(zāi)、自然災(zāi)害、人為破壞等意外事件,服務(wù)商將如何應(yīng)對(duì)呢?如果沒(méi)有必要的準(zhǔn)備和應(yīng)對(duì)手段,這樣的一次意外對(duì)服務(wù)上來(lái)說(shuō)將是災(zāi)難性的。對(duì)于IT 部門(mén)來(lái)講,要提高自己的抗災(zāi)能力,其必要的技術(shù)就是建立起一個(gè)容災(zāi)系統(tǒng)。 容災(zāi)
14、系統(tǒng)的歸類(lèi)在另一個(gè)方面要由其最終達(dá)到的效果來(lái)決定。從其對(duì)系統(tǒng)的保護(hù)程度來(lái)分,我們可以將容災(zāi)系統(tǒng)分為:數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)。 所謂數(shù)據(jù)容災(zāi),就是指建立一個(gè)異地的數(shù)據(jù)系統(tǒng),該系統(tǒng)是本地關(guān)鍵應(yīng)用數(shù)據(jù)的一個(gè)實(shí)時(shí)復(fù)制。在本地?cái)?shù)據(jù)及整個(gè)應(yīng)用系統(tǒng)出現(xiàn)災(zāi)難時(shí),系統(tǒng)至少在異地保存有一份可用的關(guān)鍵業(yè)務(wù)的數(shù)據(jù)。該數(shù)據(jù)可以是與本地生產(chǎn)數(shù)據(jù)的完全實(shí)時(shí)復(fù)制,也可以比本地?cái)?shù)據(jù)略微落后,但一定是可用的。 所謂應(yīng)用容災(zāi),是在數(shù)據(jù)容災(zāi)的基礎(chǔ)上,在異地建立一套完整的與本地生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng)(可以是互為備份)。建立這樣一個(gè)系統(tǒng)相對(duì)比較復(fù)雜,不僅需要一份可用的數(shù)據(jù)復(fù)制,還要有包括網(wǎng)絡(luò)、主機(jī)、應(yīng)用、甚至IP 等資源,以及各資源之間
15、的良好協(xié)調(diào)。應(yīng)用容災(zāi)應(yīng)該說(shuō)是真正意義上的容災(zāi)系統(tǒng)。3 XXXXXXX應(yīng)用級(jí)容災(zāi)系統(tǒng)建設(shè)方案3.1 方案綜述1. 目前XXXXXXX已建立了生產(chǎn)節(jié)點(diǎn)的高可用系統(tǒng),生產(chǎn)節(jié)點(diǎn)的2臺(tái)數(shù)據(jù)庫(kù)服務(wù)器主機(jī)構(gòu)成一個(gè)高可用集群,2臺(tái)應(yīng)用服務(wù)器構(gòu)成1個(gè)高可用集群,通過(guò)SAN連接到高可用磁盤(pán)陣列,在提業(yè)務(wù)高可用性同時(shí)為應(yīng)用容災(zāi)做好準(zhǔn)備。2. 建立容災(zāi)節(jié)點(diǎn)的高可用系統(tǒng)。新購(gòu)兩臺(tái)服務(wù)器主機(jī)(和生產(chǎn)中心的服務(wù)器為同一品牌)和新購(gòu)一臺(tái)存儲(chǔ)設(shè)備;并建立生產(chǎn)節(jié)點(diǎn)和容災(zāi)節(jié)點(diǎn)之間的以太網(wǎng)鏈路及FC SAN鏈路。3. 在所有相關(guān)主機(jī)(包括生產(chǎn)節(jié)點(diǎn)的4臺(tái)服務(wù)器和容災(zāi)節(jié)點(diǎn)的2臺(tái)服務(wù)器)上安裝Veritas基礎(chǔ)套件(Storage Fou
16、ndation HADR),以完成數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)全部功能。4. 將生產(chǎn)節(jié)點(diǎn)主機(jī)的數(shù)據(jù)(邏輯卷),通過(guò)適當(dāng)?shù)姆绞剑ㄍ?異步)復(fù)制到容災(zāi)節(jié)點(diǎn)的容災(zāi)主機(jī)上,從而實(shí)現(xiàn)數(shù)據(jù)容災(zāi)。5. 生產(chǎn)節(jié)點(diǎn)和容災(zāi)節(jié)點(diǎn)均為高可用集群環(huán)境,通過(guò)全局集群管理模塊GCO管理生產(chǎn)節(jié)點(diǎn)和容災(zāi)節(jié)點(diǎn)集群的切換;當(dāng)生產(chǎn)節(jié)點(diǎn)發(fā)生災(zāi)難時(shí),整個(gè)業(yè)務(wù)集群環(huán)境可以切換到容災(zāi)節(jié)點(diǎn),從而實(shí)現(xiàn)應(yīng)用容災(zāi)。3.2 容災(zāi)方案的功能特點(diǎn)說(shuō)為便于描述,按照系統(tǒng)可能出現(xiàn)的各種故障和潛在風(fēng)險(xiǎn),說(shuō)明本方案對(duì)各種情況下的數(shù)據(jù)保護(hù)措施:1 生產(chǎn)中心的物理故障:生產(chǎn)中心為無(wú)單點(diǎn)故障的系統(tǒng),所以能夠從容應(yīng)對(duì)各種可能性的物理故障。服務(wù)器故障:1臺(tái)數(shù)據(jù)服務(wù)器故障,1臺(tái)應(yīng)用
17、服務(wù)器故障,網(wǎng)絡(luò)通信故障,均能快速切換到本地的備用服務(wù)器上,保持系統(tǒng)正常運(yùn)行。光纖交換機(jī)故障:這里采用兩臺(tái)光纖交換機(jī)作雙連接,徹底消除SAN環(huán)境下的存儲(chǔ)連接的單點(diǎn)故障。磁盤(pán)陣列故障:解決磁盤(pán)陣列單點(diǎn)故障的方式有兩種,方式一、采用雙陣列,通過(guò)VERITAS的軟件實(shí)現(xiàn)跨陣列的數(shù)據(jù)鏡像,(兩臺(tái)陣列還可跨越到不同的大樓中,最遠(yuǎn)可達(dá)100公里)任何一臺(tái)陣列失效,系統(tǒng)照樣運(yùn)行;方式二、采用高可用的無(wú)單點(diǎn)故障的陣列,該陣列具備雙電源,雙控制卡,雙通路等,磁盤(pán)仍然劃成鏡像的數(shù)據(jù)卷,仍然能夠?qū)崿F(xiàn)無(wú)單點(diǎn)故障,和方式一實(shí)現(xiàn)的效果相同,但缺點(diǎn)是鏡像的數(shù)據(jù)盤(pán)只能在一個(gè)機(jī)柜中,不能放到較遠(yuǎn)的地方。(本方案由于生產(chǎn)中心在一
18、個(gè)大樓里,故采用方式二)2 生產(chǎn)中心災(zāi)難生產(chǎn)中心發(fā)生毀滅性的災(zāi)難時(shí),由于數(shù)據(jù)是采用VVR實(shí)時(shí)復(fù)制到容災(zāi)中心,容災(zāi)中心保留了生產(chǎn)中心的最新的實(shí)時(shí)數(shù)據(jù)拷貝;同時(shí)容災(zāi)中心建立了與生產(chǎn)中心相同的高可用集群環(huán)境,通過(guò)GCO的控制可立刻啟動(dòng)容災(zāi)中心的高可用系統(tǒng),接管生產(chǎn)中心的全部應(yīng)用。3.3 容災(zāi)系統(tǒng)的工作原理本章將就該方案的每個(gè)細(xì)節(jié)進(jìn)行討論,包括方案的詳細(xì)講解,軟件的實(shí)際配置方法等。通過(guò)閱讀和理解本章,您將了解VERITAS容災(zāi)解決方案的實(shí)現(xiàn)方法,并清楚地知道VERITAS容災(zāi)解決方案是切實(shí)可行的,并且有相關(guān)的實(shí)施案例和實(shí)施經(jīng)驗(yàn)。我們假設(shè)原來(lái)就已經(jīng)按照雙機(jī)系統(tǒng)設(shè)計(jì),那么本方案僅需要增加不同地點(diǎn)間的廣域連
19、接,不需要增加其它硬件。軟件方面要用VERITAS高可用軟件替換原有的HA/Cluster軟件,新增Volume Manager、VERITAS Volume Replicator和Global Cluster Manager,該模塊均包含在DR套件中。在介紹功能前,需要強(qiáng)調(diào)的的是:VERITAS提供的是完整的容災(zāi)解決方案。各個(gè)軟件的功能完全集成在一起,建立一個(gè)容遠(yuǎn)程數(shù)據(jù)復(fù)制、本地容災(zāi)、遠(yuǎn)程應(yīng)用切換于一體的方案。1 VERITAS Volume Manager(簡(jiǎn)稱(chēng)VxVM) 將在物理磁盤(pán)上建立多個(gè)或一個(gè)邏輯卷(Volume)。以裸設(shè)備的方式使用卷,或在卷上建立文件系統(tǒng)。將數(shù)據(jù)(特別是需要進(jìn)行
20、遠(yuǎn)程復(fù)制的相關(guān)文件系統(tǒng)、數(shù)據(jù)庫(kù))存放在卷上。由于數(shù)據(jù)復(fù)制是基于卷的,所以,Volume 是進(jìn)行復(fù)制的基礎(chǔ)。2 VERITAS Volume Replicator(簡(jiǎn)稱(chēng)VVR)負(fù)責(zé)遠(yuǎn)程數(shù)據(jù)復(fù)制。VVR復(fù)制基于Volume進(jìn)行。復(fù)制的數(shù)據(jù)可以是數(shù)據(jù)庫(kù)中的數(shù)據(jù)(文件方式或裸設(shè)備方式)和文件。復(fù)制的示意圖見(jiàn)圖。1) VVR與VxVM完全集成在一起。用VxVM管理界面和命令統(tǒng)一配置管理;由于VVR僅僅將Volume上每次I/O的實(shí)際數(shù)據(jù)實(shí)時(shí)復(fù)制到遠(yuǎn)程節(jié)點(diǎn),所以在網(wǎng)絡(luò)線路上傳輸?shù)臄?shù)據(jù)量很少,對(duì)帶寬的需求也很小。;2) 將各個(gè)業(yè)務(wù)系統(tǒng)中需要進(jìn)行遠(yuǎn)程復(fù)制的多個(gè)或一個(gè)卷定義為一個(gè)Replicated Volum
21、e Group(簡(jiǎn)稱(chēng)RVG);3) 在Site A定義一條RLINK,指向Site B;在Site B也定義一條指向Site A的RLINK。RLINK是單向的;需要進(jìn)行復(fù)制的兩個(gè)系統(tǒng)各定義一個(gè)指向?qū)Ψ降腞LINK;每個(gè)RVG定義一個(gè)RLINK。例如有Site A和Site B兩套系統(tǒng)同時(shí)用Site C的系統(tǒng)作為備份。在Site A定義一個(gè)RVGa,包含需要進(jìn)行數(shù)據(jù)復(fù)制的卷;在Site B定義一個(gè)RVGb,包含需要進(jìn)行數(shù)據(jù)復(fù)制的卷;在Site C定義兩個(gè)RVG,名為RVGa和RVGb,分別作為Site A RVGa和Site B RVGb的備份。然后,在Site A定義RLINK to_c1,
22、指向Site C;在Site B定義RLINK to_c2,指向Site C;在Site C定義兩個(gè)RLINK,一個(gè)to_a,指向Site A,另一個(gè)to_b,指向Site B。 4)Storage Replicator Log(簡(jiǎn)稱(chēng)SRL)是VVR中的重要部件。將數(shù)據(jù)復(fù)制各方的某個(gè)卷定義為一個(gè)SRL。需要復(fù)制的數(shù)據(jù)首先要寫(xiě)入SRL,然后傳到異地。VVR通過(guò)SRL保證數(shù)據(jù)復(fù)制嚴(yán)格按照寫(xiě)順序進(jìn)行,這在異步工作方式下非常重要。當(dāng)網(wǎng)絡(luò)中斷或異地系統(tǒng)出現(xiàn)故障時(shí),本地?cái)?shù)據(jù)將記錄在SRL中,等系統(tǒng)恢復(fù)正常時(shí)再將SRL中的數(shù)據(jù)按照先進(jìn)先出的順序傳送到異地。當(dāng)SRL滿后,VVR將通過(guò)Data Chang Ma
23、p(簡(jiǎn)稱(chēng)DCM)記錄變化過(guò)的數(shù)據(jù)塊的塊號(hào)。 VVR數(shù)據(jù)流程見(jiàn): 5)Data Change Map(簡(jiǎn)稱(chēng)DCM)與主節(jié)點(diǎn)的RVG相關(guān),它其中的內(nèi)容是位圖信息,記錄某一時(shí)間點(diǎn)后修改過(guò)的數(shù)據(jù)塊位置。DCM在正常情況下不使用,在SRL滿后記錄變化的數(shù)據(jù)塊的塊號(hào),當(dāng)恢復(fù)正常復(fù)制后,等SRL中的數(shù)據(jù)傳送完后,將DCM中記錄的塊傳送到異地。災(zāi)難恢復(fù)后的反向復(fù)制也用到DCM。6)數(shù)據(jù)復(fù)制的工作模式缺省為同步/異步自適應(yīng),即在網(wǎng)絡(luò)延時(shí)情況較好、數(shù)據(jù)能夠及時(shí)復(fù)制時(shí),工作在同步方式,完全保證兩邊數(shù)據(jù)的一致性;當(dāng)網(wǎng)絡(luò)延時(shí)情況較差、數(shù)據(jù)不能及時(shí)復(fù)制時(shí),工作在異步方式下,保證主節(jié)點(diǎn)的I/O性能。數(shù)據(jù)復(fù)制根據(jù)實(shí)際情況,自
24、行在兩種工作模式之間切換。 如果數(shù)據(jù)復(fù)制的線路帶寬有限,出于保證本地服務(wù)器讀寫(xiě)性能的考慮,可以將復(fù)制工作模式定義為異步。由于VVR的數(shù)據(jù)復(fù)制嚴(yán)格按照I/O的修改順序進(jìn)行,所以,無(wú)論在同步還是異步工作方式下,都能保證數(shù)據(jù)的完整性。對(duì)于數(shù)據(jù)庫(kù)系統(tǒng),該復(fù)制機(jī)制能夠保證災(zāi)備節(jié)點(diǎn)的數(shù)據(jù)庫(kù)在災(zāi)難發(fā)生時(shí)正常啟動(dòng)并提供服務(wù)。7)后備節(jié)點(diǎn)的完全同步,即所謂的”建立基線”。在主節(jié)點(diǎn)往后備節(jié)點(diǎn)正常復(fù)制數(shù)據(jù)前,必須逐塊逐塊地將主節(jié)點(diǎn)中需要復(fù)制的數(shù)據(jù)拷貝到后備節(jié)點(diǎn),也就是說(shuō),將雙方的RVG進(jìn)行同步。 后備節(jié)點(diǎn)的完全同步分為兩種情況,一是復(fù)制時(shí)主節(jié)點(diǎn)應(yīng)用不進(jìn)行數(shù)據(jù)更改,二是復(fù)制時(shí)主節(jié)點(diǎn)應(yīng)用進(jìn)行數(shù)據(jù)更改。兩種情況下,都可以
25、采用自動(dòng)同步方式或采用備份和檢查點(diǎn)(Check Point)結(jié)合的方法。 自動(dòng)同步是指通過(guò)網(wǎng)絡(luò)將數(shù)據(jù)從主節(jié)點(diǎn)(Primary)復(fù)制到備份節(jié)點(diǎn)(Secondary)。方法很簡(jiǎn)單,只要進(jìn)行一步操作即可完成。自動(dòng)同步對(duì)帶寬要求較高,否則,將無(wú)法完成完全同步。自動(dòng)同步要求RVG中的每個(gè)卷都有DCM。 對(duì)于網(wǎng)絡(luò)帶寬較小,或者需要完全同步的數(shù)據(jù)量太大時(shí),使用備份與檢查點(diǎn)結(jié)合的方法。在備份開(kāi)始前,在主節(jié)點(diǎn)設(shè)置檢查點(diǎn),該檢查點(diǎn)記錄在SRL中,然后將數(shù)據(jù)備份到活動(dòng)硬盤(pán)、光盤(pán)、磁帶或其它介質(zhì)上。備份完成后,將檢查點(diǎn)取消。將備份的數(shù)據(jù)恢復(fù)到后備節(jié)點(diǎn)上。然后將RLINK連接掛上,主節(jié)點(diǎn)SRL中記錄的的數(shù)據(jù)傳送到后備節(jié)
26、點(diǎn),完成后,兩邊數(shù)據(jù)一致,進(jìn)入正常數(shù)據(jù)復(fù)制狀態(tài)。用該方法進(jìn)行數(shù)據(jù)完全同步,要求SRL卷大些,等完成后,再將SRL卷通過(guò)Volume Manager在線縮小。8) 當(dāng)某些嚴(yán)重意外情況發(fā)生后,后備節(jié)點(diǎn)會(huì)變成新的主節(jié)點(diǎn),稱(chēng)為角色轉(zhuǎn)換。在災(zāi)難期間,不進(jìn)行數(shù)據(jù)復(fù)制,新的主節(jié)點(diǎn)用DCM記錄變化數(shù)據(jù)位置。9) 當(dāng)原來(lái)的主節(jié)點(diǎn)在災(zāi)難后恢復(fù)正常,需要進(jìn)行數(shù)據(jù)反向同步和角色轉(zhuǎn)換。反向同步有兩種情況,一種是在災(zāi)難發(fā)生時(shí)刻,原主節(jié)點(diǎn)與災(zāi)備節(jié)點(diǎn)的數(shù)據(jù)是同步的(即無(wú)未復(fù)制的數(shù)據(jù));第二種是在災(zāi)難發(fā)生時(shí)刻,原主節(jié)點(diǎn)與災(zāi)備節(jié)點(diǎn)的數(shù)據(jù)不是完全同步的(即主節(jié)點(diǎn)有數(shù)據(jù)尚未復(fù)制到災(zāi)備節(jié)點(diǎn))。第二種情況在反向同步開(kāi)始時(shí)第一步首先要進(jìn)行
27、重置,指將原主節(jié)點(diǎn)SRL和DCM中數(shù)據(jù)(這些數(shù)據(jù)在災(zāi)難發(fā)生時(shí)尚未來(lái)得及傳送)的位置信息修改當(dāng)前主節(jié)點(diǎn)(即原后備節(jié)點(diǎn))的DCM。然后,將DCM中指向的數(shù)據(jù)全部傳送到原主節(jié)點(diǎn)。而第一種情況的話,直接進(jìn)行第二步工作。傳送完成后,將當(dāng)前主節(jié)點(diǎn)的數(shù)據(jù)庫(kù)和應(yīng)用停止,將雙方角色復(fù)原,并在原主節(jié)點(diǎn)提供正常服務(wù)。 10)脫機(jī)處理。通過(guò)使用VVR的In-Band Control(IBC)消息、Snapshot、以及Volume Manager(VxVM)的FastResync(簡(jiǎn)稱(chēng)FR,即快速同步)功能,可以實(shí)現(xiàn)數(shù)據(jù)的脫機(jī)處理。 脫機(jī)處理主要指對(duì)后備節(jié)點(diǎn)種的數(shù)據(jù)進(jìn)行處理,例如進(jìn)行備份、打印報(bào)表、數(shù)據(jù)倉(cāng)庫(kù)處理等。脫
28、機(jī)處理由打破后備節(jié)點(diǎn)的鏡像卷、對(duì)鏡像數(shù)據(jù)進(jìn)行處理、重鏡像等幾個(gè)過(guò)程組成。 11)雙收條(雙重確認(rèn))機(jī)制。指后備節(jié)點(diǎn)對(duì)復(fù)制數(shù)據(jù)的接收確認(rèn)有兩個(gè)階段。第一個(gè)確認(rèn)當(dāng)后備節(jié)點(diǎn)收到數(shù)據(jù)后發(fā)出;第二個(gè)確認(rèn)當(dāng)后備節(jié)點(diǎn)數(shù)據(jù)成功寫(xiě)入硬盤(pán)后發(fā)出。當(dāng)主節(jié)點(diǎn)收到第二個(gè)確認(rèn)后,將SRL中的相應(yīng)數(shù)據(jù)清空。3 VERITAS Cluster Server(簡(jiǎn)稱(chēng)VCS)是用于本地容災(zāi)的集群軟件,支持多達(dá)32個(gè)節(jié)點(diǎn)的應(yīng)用級(jí)切換,保證本地業(yè)務(wù)系統(tǒng)的軟硬件高可用性。VCS以其出色的可靠性和易管理性聞名。VCS的功能特點(diǎn)請(qǐng)見(jiàn)附錄。在本方案中,VCS主要負(fù)責(zé)以下功能:2) VCS負(fù)責(zé)監(jiān)控和管理硬件系統(tǒng)和操作系統(tǒng),當(dāng)出現(xiàn)故障時(shí)進(jìn)行切換。
29、3) 通過(guò)數(shù)據(jù)庫(kù)代理(Agent)監(jiān)控和管理數(shù)據(jù)庫(kù)系統(tǒng),當(dāng)出現(xiàn)故障時(shí)進(jìn)行切換。4) 通過(guò)API或腳本編寫(xiě)針對(duì)性客戶化應(yīng)用代理,監(jiān)控和管理應(yīng)用系統(tǒng),當(dāng)出現(xiàn)故障時(shí)進(jìn)行切換。5) 通過(guò)Replicator 代理監(jiān)控和管理數(shù)據(jù)復(fù)制過(guò)程,當(dāng)主服務(wù)器數(shù)據(jù)復(fù)制發(fā)生故障時(shí),自動(dòng)將數(shù)據(jù)復(fù)制工作切換到后備服務(wù)器,保證數(shù)據(jù)復(fù)制過(guò)程的連續(xù)性。這點(diǎn)對(duì)于容災(zāi)系統(tǒng)非常重要。該代理充分說(shuō)明VERITAS提供的是完整的容災(zāi)解決方案。6) 主節(jié)點(diǎn)和備份節(jié)點(diǎn)的VCS集群系統(tǒng)都在Global Cluster Manager的統(tǒng)一監(jiān)控和管理下,從而實(shí)現(xiàn)集群系統(tǒng)間的遠(yuǎn)程應(yīng)用切換。GCM在VCS中以兩個(gè)服務(wù)組(指GCM Master和GC
30、M Slave)的形式存在。4 Global Cluster Server(簡(jiǎn)稱(chēng)GCM)可以稱(chēng)為Clusters Cluster(集群的集群)。它負(fù)責(zé)對(duì)多個(gè)不同地點(diǎn)的多達(dá)32個(gè)集群系統(tǒng)進(jìn)行監(jiān)控和管理,在發(fā)生嚴(yán)重災(zāi)難時(shí),進(jìn)行site的切換(即應(yīng)用的遠(yuǎn)程切換)。GCM Console為Web界面,通過(guò)瀏覽器管理各個(gè)Cluster系統(tǒng),并在管理界面中主動(dòng)控制或響應(yīng)遠(yuǎn)程切換。3.4 容災(zāi)工作過(guò)程詳解為方便論述,本節(jié)模擬地點(diǎn)A和B,兩地各有一套建立在VCS雙節(jié)點(diǎn)集群上的業(yè)務(wù)系統(tǒng),以B地點(diǎn)的系統(tǒng)作為A地點(diǎn)的備份。切換示意圖見(jiàn)。1 正常情況下:1) 業(yè)務(wù)系統(tǒng)運(yùn)行在地點(diǎn)A,包括數(shù)據(jù)庫(kù)實(shí)例、有關(guān)的文件、數(shù)據(jù)庫(kù)數(shù)
31、據(jù)、應(yīng)用軟件。A節(jié)點(diǎn)對(duì)外提供服務(wù)。2) A節(jié)點(diǎn)所有的有關(guān)的數(shù)據(jù)通過(guò)VVR實(shí)時(shí)復(fù)制到B節(jié)點(diǎn)。3) 兩地的VCS對(duì)的各自節(jié)點(diǎn)內(nèi)的兩臺(tái)服務(wù)器的主機(jī)情況、數(shù)據(jù)庫(kù)服務(wù)、應(yīng)用軟件進(jìn)行實(shí)時(shí)監(jiān)控和管理,其中,VCS還對(duì)VVR數(shù)據(jù)復(fù)制服務(wù)進(jìn)行監(jiān)控。4) GCM 監(jiān)控兩地Cluster系統(tǒng)的運(yùn)行。2 當(dāng)A地點(diǎn)的主服務(wù)器發(fā)生硬件或軟件故障,導(dǎo)致主服務(wù)器無(wú)法提供正常服務(wù):1) VCS進(jìn)行本地切換,將主服務(wù)器的數(shù)據(jù)庫(kù)服務(wù)、應(yīng)用軟件、VVR數(shù)據(jù)復(fù)制服務(wù)切換到本地后備節(jié)點(diǎn)。2) 整個(gè)系統(tǒng)運(yùn)行在本地后備節(jié)點(diǎn),包括VVR數(shù)據(jù)復(fù)制服務(wù),由后備服務(wù)器提供對(duì)外服務(wù)和數(shù)據(jù)復(fù)制服務(wù)。3) GCM將監(jiān)控到該切換事件的發(fā)生。4) 如果僅僅是
32、主服務(wù)器數(shù)據(jù)復(fù)制服務(wù)發(fā)生故障,可以不進(jìn)行切換,只需將復(fù)制服務(wù)修復(fù)并正常運(yùn)行。3 如果A地點(diǎn)的主服務(wù)器恢復(fù)正常,整個(gè)系統(tǒng)將重新運(yùn)行在正常情況下。4 如果在情況二的狀態(tài)下,A地點(diǎn)的后備服務(wù)器也發(fā)生硬件或軟件故障,整個(gè)A地點(diǎn)無(wú)法正常提供服務(wù):1) GCM 將監(jiān)控到該嚴(yán)重災(zāi)難的發(fā)生,將對(duì)接收到的Site A down事件進(jìn)行處理:發(fā)出嚴(yán)重告警,并在管理界面上彈出服務(wù)災(zāi)難性切換(及服務(wù)切換到遠(yuǎn)程地點(diǎn))等待確認(rèn)畫(huà)面。2) 在有關(guān)人員確認(rèn)后,在GCM切換等待確認(rèn)畫(huà)面上按確認(rèn)按鈕,將進(jìn)行地點(diǎn)間的容災(zāi)切換。3) A地點(diǎn)的業(yè)務(wù)將在B地點(diǎn)正常提供服務(wù)。4) 數(shù)據(jù)復(fù)制暫停。5) Site B的VVR將從Seconda
33、ry變成New Primary,使用DCM記錄所有變化的數(shù)據(jù)塊。5 如果A、B地點(diǎn)間網(wǎng)絡(luò)發(fā)生故障:1) VVR心跳檢測(cè)將發(fā)現(xiàn)該故障,A地點(diǎn)VVR將根據(jù)事先的配置進(jìn)行處理。我們的建議是VVR將網(wǎng)絡(luò)故障期間所有數(shù)據(jù)的更改記錄在SRL。2) 如果在一段較長(zhǎng)時(shí)間內(nèi),網(wǎng)絡(luò)故障無(wú)法恢復(fù)。當(dāng)VVR的SRL卷接近滿時(shí),VVR將使用DCM,記錄變化的數(shù)據(jù)塊位圖。3) 在網(wǎng)絡(luò)故障發(fā)生后,GCM將探測(cè)到,并對(duì)Network Down 事件進(jìn)行處理:向有關(guān)管理員發(fā)出告警。6 如果A、B地點(diǎn)間網(wǎng)絡(luò)在短時(shí)間內(nèi)恢復(fù)正常。1) VVR將把A的SRL中積累的數(shù)據(jù)傳送到B。2) VVR處于正常工作狀態(tài)。3) GCM處于正常工作狀
34、態(tài)。7 如果A、B地點(diǎn)間網(wǎng)絡(luò)在很長(zhǎng)時(shí)間內(nèi)仍無(wú)法恢復(fù)正常:1) VVR停止遠(yuǎn)程數(shù)據(jù)復(fù)制。2) GCM無(wú)法對(duì)兩地間的Cluster運(yùn)行進(jìn)行監(jiān)控。8 災(zāi)難復(fù)原。當(dāng)A地點(diǎn)的系統(tǒng)恢復(fù)正常后,需要進(jìn)行整個(gè)系統(tǒng)的回遷。數(shù)據(jù)反向復(fù)制時(shí)只復(fù)制災(zāi)難期間變化的數(shù)據(jù)而不是所有的數(shù)據(jù),這是本方案優(yōu)勢(shì)之一。1) 在災(zāi)難期間,B地點(diǎn)是VVR的New Primary,B的DCM記錄所有變化的數(shù)據(jù)塊。2) A系統(tǒng)正常后,VVR重新建立與B節(jié)點(diǎn)的RLINK連接,并自動(dòng)變成Pseudo Secondary(偽后備節(jié)點(diǎn))。3) GCM 發(fā)現(xiàn)A、B地點(diǎn)Cluster恢復(fù)正常,對(duì)它們進(jìn)行正常管理。以下過(guò)程將在腳本中自動(dòng)完成。4) 進(jìn)行反
35、向同步的第一步是將A節(jié)點(diǎn)的Pseudo Secondary狀態(tài)轉(zhuǎn)成Secondary狀態(tài)。5) 第二步將進(jìn)行A的SRL和DCM的重置(Replay),修改B的DCM。因?yàn)樵贏節(jié)點(diǎn)發(fā)生災(zāi)難時(shí),有可能A的SRL中有沒(méi)來(lái)得及進(jìn)行傳送得數(shù)據(jù),甚至DCM中標(biāo)記的數(shù)據(jù)塊沒(méi)來(lái)得及進(jìn)行傳送。也就是說(shuō),A中有一些本地已經(jīng)修改,而B(niǎo)還未修改的數(shù)據(jù)。所以,要保持A、B數(shù)據(jù)的一致性,一定要首先對(duì)這些數(shù)據(jù)進(jìn)行處理。處理方法成為重置(Replay)。重置將把A節(jié)點(diǎn)SRL中數(shù)據(jù)或DCM中標(biāo)記的數(shù)據(jù)位圖信息傳送到B節(jié)點(diǎn)。B節(jié)點(diǎn)將進(jìn)行判斷,根據(jù)數(shù)據(jù)塊是否有新的修改,對(duì)DCM進(jìn)行置位。6) 重置完成后,將進(jìn)行數(shù)據(jù)的反向同步,將災(zāi)
36、難期間B節(jié)點(diǎn)變化的數(shù)據(jù)(和需要A節(jié)點(diǎn)重置的數(shù)據(jù))傳送到A。7) 以上的過(guò)程中,B的數(shù)據(jù)庫(kù)和應(yīng)用都處于正常運(yùn)行狀態(tài)。8) 當(dāng)反向同步完成后,數(shù)據(jù)庫(kù)和應(yīng)用將停止運(yùn)行。9) GCM控制進(jìn)行整個(gè)系統(tǒng)的反向切換。10) A節(jié)點(diǎn)重新成為VVR的Primary,進(jìn)行正常復(fù)制。11) A節(jié)點(diǎn)整個(gè)業(yè)務(wù)系統(tǒng)恢復(fù)正常運(yùn)行。3.5 應(yīng)用級(jí)容災(zāi)系統(tǒng)費(fèi)用估算序號(hào)項(xiàng)目描述數(shù)量單價(jià)(萬(wàn)元)合計(jì)(萬(wàn)元)1機(jī)房建設(shè)20平米,機(jī)房裝飾裝修、供配電系統(tǒng)、防雷系統(tǒng)、地線系統(tǒng)、消防火災(zāi)自動(dòng)報(bào)警及滅火系統(tǒng)、綜合布線系統(tǒng)、空調(diào)新風(fēng)及機(jī)房防災(zāi)害處理措施1套40402網(wǎng)絡(luò)設(shè)備一臺(tái)三層交換機(jī),一臺(tái)路由器1套30303小型機(jī)和中心同一檔次2臺(tái)255
37、04光纖交換機(jī)和中心同一檔次2臺(tái)10205存儲(chǔ)和中心同一檔次1臺(tái)60606集群容災(zāi)軟件實(shí)現(xiàn)服務(wù)器應(yīng)用切合和數(shù)據(jù)復(fù)制(VRTS STORAGE FOUNDATION ENTERPRISE HA/DR 5.0 AIX)1套65657總計(jì)人民幣貳佰陸拾伍元整265備注:以上費(fèi)用不含光纖線纜架設(shè)或租賃的費(fèi)用4 XXX數(shù)據(jù)級(jí)容災(zāi)系統(tǒng)建設(shè)方案4.1 方案綜述1. 目前XXXXXXX已建立了生產(chǎn)節(jié)點(diǎn)的高可用系統(tǒng),生產(chǎn)節(jié)點(diǎn)的2臺(tái)數(shù)據(jù)庫(kù)服務(wù)器主機(jī)構(gòu)成一個(gè)高可用集群,2臺(tái)應(yīng)用服務(wù)器構(gòu)成1個(gè)高可用集群,通過(guò)SAN連接到高可用磁盤(pán)陣列,在提業(yè)務(wù)高可用性同時(shí)為應(yīng)用容災(zāi)做好準(zhǔn)備。2. 建立容災(zāi)節(jié)點(diǎn)的高可用系統(tǒng)。新購(gòu)兩臺(tái)光
38、纖交換機(jī)和新購(gòu)一臺(tái)存儲(chǔ)設(shè)備;并建立生產(chǎn)節(jié)點(diǎn)和容災(zāi)節(jié)點(diǎn)之間的FC SAN鏈路。3. 在生產(chǎn)節(jié)點(diǎn)的4臺(tái)服務(wù)器上安裝Veritas基礎(chǔ)套件(Storage Foundation),以完成數(shù)據(jù)容災(zāi)功能。4. 將生產(chǎn)節(jié)點(diǎn)主機(jī)的數(shù)據(jù)(邏輯卷),通過(guò)適當(dāng)?shù)姆绞剑ㄍ?異步)復(fù)制到容災(zāi)節(jié)點(diǎn)的容災(zāi)主機(jī)上,從而實(shí)現(xiàn)數(shù)據(jù)容災(zāi)。4.2 Symantec遠(yuǎn)程鏡像數(shù)據(jù)容災(zāi)原理Symantec建議利用VERITAS Storage Foundation系列軟件的鏡像技術(shù),來(lái)構(gòu)建容災(zāi)方案。利用VERITAS Storage Foundation的鏡像技術(shù)構(gòu)建容災(zāi)系統(tǒng)是非常簡(jiǎn)單的,它只有一個(gè)條件,就是將生產(chǎn)中心和災(zāi)備中心之間的
39、SAN存儲(chǔ)區(qū)域網(wǎng)絡(luò)通過(guò)光纖連接起來(lái),建立城域SAN存儲(chǔ)網(wǎng)絡(luò)。然后,我們就可以通過(guò)Storage Foundation提供的非常成熟的跨陣列磁盤(pán)鏡像技術(shù)來(lái)實(shí)現(xiàn)同城容災(zāi)了,容災(zāi)方案的結(jié)構(gòu)如下圖所示:從鏡像原理上講,在城域SAN存儲(chǔ)網(wǎng)絡(luò)上的兩套磁盤(pán)系統(tǒng)之間的鏡像,和在一個(gè)機(jī)房?jī)?nèi)的SAN上的兩個(gè)磁盤(pán)系統(tǒng)之間的鏡像并沒(méi)有任何區(qū)別。利用裸光纖將生產(chǎn)中心和災(zāi)備中心的SAN網(wǎng)絡(luò)連接起來(lái),構(gòu)成城域SAN網(wǎng)絡(luò)以后,利用 VERITAS Storage Foundation的先進(jìn)的邏輯卷管理功能,我們就可以非常方便的實(shí)現(xiàn)生產(chǎn)中心磁盤(pán)系統(tǒng)和災(zāi)備中心磁盤(pán)系統(tǒng)之間的鏡像了。如下圖所示。我們可以看到,利用VERITAS S
40、torage Foundation,我們可以創(chuàng)建任意一個(gè)邏輯卷(Volume)供業(yè)務(wù)主機(jī)使用,實(shí)際上是由兩個(gè)完全對(duì)等的,容量相同的磁盤(pán)片構(gòu)成的,兩個(gè)磁盤(pán)片上的數(shù)據(jù)完全一樣,業(yè)務(wù)主機(jī)對(duì)該Volume的任意修改,都將同時(shí)被寫(xiě)到位于生產(chǎn)中心和災(zāi)備中心的兩個(gè)磁盤(pán)系統(tǒng)上。采用這種方式,生產(chǎn)中心的磁盤(pán)陣列與同城容災(zāi)中心的磁盤(pán)陣列對(duì)于兩地的主機(jī)而言是完全同等的。利用城域SAN存儲(chǔ)網(wǎng)絡(luò)和VERITAS Storage Foundation鏡像功能,我們可以非常輕松的實(shí)現(xiàn)數(shù)據(jù)系統(tǒng)的異地容災(zāi)。并且消除了復(fù)制技術(shù)(無(wú)論是同步還是異步)的切換的動(dòng)作,從而保證零停機(jī)時(shí)間,零數(shù)據(jù)損失的實(shí)現(xiàn)。4.3 Symantec遠(yuǎn)程鏡
41、像數(shù)據(jù)容災(zāi)系統(tǒng)故障和災(zāi)難的響應(yīng)一個(gè)完整的災(zāi)備系統(tǒng),除了在數(shù)據(jù)災(zāi)難發(fā)生時(shí),能夠完成災(zāi)備的使命,需要考慮災(zāi)備系統(tǒng)本身的可維護(hù)性和可操作性,以及對(duì)系統(tǒng)盡可能快的恢復(fù)。下面,我們來(lái)看一下,數(shù)據(jù)系統(tǒng)故障和災(zāi)難情況下,Symantec 的遠(yuǎn)程鏡像容災(zāi)系統(tǒng)是怎樣響應(yīng)的。4.3.1 當(dāng)生產(chǎn)中心數(shù)據(jù)系統(tǒng)故障生產(chǎn)中心數(shù)據(jù)系統(tǒng)故障意味著災(zāi)難,磁盤(pán)故障,鏈路故障,或者數(shù)據(jù)系統(tǒng)的計(jì)劃內(nèi)停機(jī)時(shí)間,也就一切導(dǎo)致主機(jī)無(wú)法訪問(wèn)生產(chǎn)中心數(shù)據(jù)系統(tǒng)的情況。我們來(lái)看一下我們推薦的容災(zāi)方案是如何響應(yīng)的,見(jiàn)下圖:當(dāng)生產(chǎn)中心的磁盤(pán)系統(tǒng)發(fā)生故障(災(zāi)難)時(shí),由于同城容災(zāi)中心的磁盤(pán)是它的鏡像,所以操作系統(tǒng)會(huì)自動(dòng)隔離生產(chǎn)中心的磁盤(pán),轉(zhuǎn)而對(duì)容災(zāi)中心的
42、數(shù)據(jù)進(jìn)行訪問(wèn)。從上圖我們看到,業(yè)務(wù)系統(tǒng)可以通過(guò)城域SAN網(wǎng)絡(luò)直接訪問(wèn)災(zāi)備中心的磁盤(pán)系統(tǒng)的數(shù)據(jù),而不需要有任何針對(duì)業(yè)務(wù)系統(tǒng)的動(dòng)作。也就是說(shuō),生產(chǎn)中心磁盤(pán)系統(tǒng)的災(zāi)難,對(duì)業(yè)務(wù)系統(tǒng)是透明的,應(yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)樯a(chǎn)中心磁盤(pán)系統(tǒng)的故障而停止;更重要的是,因?yàn)閼?yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)闉?zāi)難而異常中止,從而避免了發(fā)生數(shù)據(jù)庫(kù)損壞(數(shù)據(jù)一致性風(fēng)險(xiǎn))的可能。值得注意的是:整個(gè)過(guò)程對(duì)應(yīng)用完全透明,不需要也不會(huì)中斷業(yè)務(wù)系統(tǒng)的正常運(yùn)行。這是基于磁盤(pán)系統(tǒng)間復(fù)制技術(shù)構(gòu)建的容災(zāi)系統(tǒng)無(wú)法實(shí)現(xiàn)的。4.3.2 災(zāi)備中心數(shù)據(jù)系統(tǒng)故障以及生產(chǎn)中心和災(zāi)備中心SAN鏈路故障災(zāi)備中心數(shù)據(jù)系統(tǒng)故障,以及生產(chǎn)中心到災(zāi)備中心的鏈路故障,我們都可以把其看
43、成是容災(zāi)部分的故障,其原理和后果與生產(chǎn)中的數(shù)據(jù)系統(tǒng)故障相同。都是導(dǎo)致了鏡像的破壞。而后,系統(tǒng)將自動(dòng)的只與狀態(tài)健康的磁盤(pán)陣列繼續(xù)工作。整個(gè)過(guò)程對(duì)應(yīng)用完全透明。4.3.3 故障修復(fù)后的恢復(fù)(遠(yuǎn)程鏡像快速恢復(fù))磁盤(pán)系統(tǒng)故障修復(fù)之后,我們需要盡可能快的將遠(yuǎn)程鏡像系統(tǒng)恢復(fù)起來(lái),以確保容災(zāi)的功能繼續(xù)得以實(shí)現(xiàn),同時(shí),在整個(gè)鏡像恢復(fù)的過(guò)程中,勢(shì)必會(huì)對(duì)應(yīng)用造成影響。因?yàn)榇疟P(pán)數(shù)據(jù)的同步,一定會(huì)造成I/O的極度繁忙而導(dǎo)致應(yīng)用性能下降,如果鏡像恢復(fù)無(wú)法快速完成,其后果跟系統(tǒng)應(yīng)用停機(jī)也非常接近了。因此,如何快速有效的實(shí)現(xiàn)鏡像的重新同步,同樣是一個(gè)容災(zāi)方案是否成功的關(guān)鍵因素。傳統(tǒng)的鏡像技術(shù)(如OS的鏡像技術(shù)),在鏡像鏈路
44、被中斷以后,中斷的鏡像會(huì)被認(rèn)為完全作廢,在鏈路恢復(fù)以后,我們不得不將數(shù)據(jù)完整地從生產(chǎn)中心拷貝一份到容災(zāi)中心。這種方式,對(duì)于用戶的的應(yīng)用是無(wú)法接受的。鏈路方面的故障如果經(jīng)常發(fā)生,我們就需要不斷的重復(fù)將生產(chǎn)中心的數(shù)據(jù)全部同步到災(zāi)備中心的磁盤(pán)系統(tǒng)上,實(shí)際上,這種方案不具有可實(shí)施性和可維護(hù)性,是不現(xiàn)實(shí)的。這也是什么主機(jī)廠商雖然也有類(lèi)似鏡像功能,但不會(huì)用于容災(zāi)的的根本原因。為了解決這個(gè)問(wèn)題,VERITAS Storage Foundation提供了DCO+FMR技術(shù),其中DCO(Data Change Object)是一種針對(duì)鏡像的Log技術(shù),該技術(shù)允許Storage Foundation在鏡像鏈路中斷
45、后記錄邏輯卷的數(shù)據(jù)變化情況,以便在鏡像鏈路恢復(fù)后,由FMR實(shí)現(xiàn)數(shù)據(jù)的增量恢復(fù)。所謂FMR,其全稱(chēng)是Fast Mirror Resync,意思就是“鏡像的快速再同步”,F(xiàn)MR是和DCO技術(shù)對(duì)應(yīng)的鏡像快速恢復(fù)技術(shù),利用VERITAS Storage Foundation 的DCO和FMR技術(shù),我們現(xiàn)在可以不用再擔(dān)心容災(zāi)系統(tǒng)本身的可維護(hù)性了。利用DCO和FMR,我們的應(yīng)對(duì)步驟如下:1 一切故障,導(dǎo)致鏡像被破壞。2 生產(chǎn)中心的Storage Foundation利用 DCO日志記錄因業(yè)務(wù)數(shù)據(jù)的變化而變化的數(shù)據(jù)塊。3 一旦故障被修復(fù),Storage Foundation的FMR功能模塊,會(huì)根據(jù) DCO日
46、志記錄的情況,將鏈路中斷后更新的業(yè)務(wù)數(shù)據(jù)(變化量)同步到災(zāi)難端實(shí)現(xiàn)增量更新。4 鏡像快速同步的過(guò)程中,用戶的應(yīng)用始終可以正常工作。整個(gè)過(guò)程的發(fā)起,只需要執(zhí)行一條命令即刻完成。整個(gè)過(guò)程的速度,由于只是同步增量,時(shí)間遠(yuǎn)遠(yuǎn)小于整個(gè)數(shù)據(jù)系統(tǒng)的完全同步。從而大大減小對(duì)用戶應(yīng)用的影響,這也是傳統(tǒng)鏡像技術(shù)如OS鏡像所以不具備的。4.4 系統(tǒng)容災(zāi)方案結(jié)構(gòu)和實(shí)現(xiàn)根據(jù)上面的闡述,我們提出了在SAN環(huán)境下,基于Veritas Storage Foundation遠(yuǎn)程鏡像的數(shù)據(jù)容災(zāi)方案:1 生產(chǎn)中心與容災(zāi)中心通過(guò)裸光纖將兩邊的SAN 環(huán)境聯(lián)接起來(lái)。2 容災(zāi)中心增加一臺(tái)磁盤(pán)陣列。利用Storage Foundation
47、 的鏡像技術(shù),建立基于磁盤(pán)系統(tǒng)間鏡像的容災(zāi)系統(tǒng)。3 每個(gè)使用需要容災(zāi)的數(shù)據(jù)的主機(jī),都需要部署一套Storage Foundation 系列軟件。4 如果距離較遠(yuǎn),無(wú)法直接部署光纖聯(lián)接,可以租用運(yùn)營(yíng)商光纖將生產(chǎn)中心和災(zāi)備中心的SAN網(wǎng)絡(luò)連接起來(lái)。常用的技術(shù)有DWDM技術(shù)。5 根據(jù)實(shí)際容災(zāi)需求,如果希望實(shí)現(xiàn)應(yīng)用級(jí)容災(zāi),需要在災(zāi)備中心布置和生產(chǎn)中心處理能力相當(dāng)?shù)挠糜跒?zāi)備的服務(wù)器系統(tǒng)。4.5 應(yīng)用級(jí)容災(zāi)系統(tǒng)費(fèi)用估算序號(hào)項(xiàng)目描述數(shù)量單價(jià)(萬(wàn)元)合計(jì)(萬(wàn)元)1機(jī)房建設(shè)20平米,機(jī)房裝飾裝修、供配電系統(tǒng)、防雷系統(tǒng)、地線系統(tǒng)、消防火災(zāi)自動(dòng)報(bào)警及滅火系統(tǒng)、綜合布線系統(tǒng)、空調(diào)新風(fēng)及機(jī)房防災(zāi)害處理措施1套40402
48、光纖交換機(jī)和中心同一檔次2臺(tái)10203存儲(chǔ)和中心同一檔次1臺(tái)60604容災(zāi)軟件實(shí)現(xiàn)數(shù)據(jù)復(fù)制(VRTS STORAGE FOUNDATION ENTERPRISE 5.0 AIX)1套35355總計(jì)人民幣壹佰伍拾伍元整155備注:以上費(fèi)用不含光纖線纜架設(shè)或租賃的費(fèi)用5 容災(zāi)系統(tǒng)外包5.1 我公司的容災(zāi)外包服務(wù)方式為了滿足災(zāi)備業(yè)務(wù)發(fā)展需要和未來(lái)的擴(kuò)容要求,將用戶接入采用模塊化設(shè)計(jì),將用戶的數(shù)據(jù)保護(hù)需求分為三個(gè)等級(jí),每個(gè)等級(jí)采用相應(yīng)災(zāi)備等級(jí)的接入方式,主要包括備份軟件接入模塊、主機(jī)保護(hù)軟件或集中存儲(chǔ)接入模塊、虛擬化連續(xù)數(shù)據(jù)保護(hù)接入模塊。將客戶接入等級(jí)服務(wù)分為初級(jí)、中級(jí)、高級(jí),分別對(duì)應(yīng)于國(guó)標(biāo)GB/T
49、20988-2007信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范規(guī)定的災(zāi)難恢復(fù)能力等級(jí)16級(jí)。備份軟件接入模塊利用客戶已有的備份軟件或新購(gòu)備份軟件,為客戶提供基于備份策略的備份方式,備份數(shù)據(jù)保存到統(tǒng)一的虛擬磁帶庫(kù)中,然后定期向磁帶庫(kù)歸檔;方案適用范圍:1、RPO、RTO要求不高,2、災(zāi)備投資相對(duì)較少;3、用戶接受備份方式,并認(rèn)可備份方式的等級(jí);集中存儲(chǔ)接入模塊是面向具有中高級(jí)數(shù)據(jù)保護(hù)需求的用戶的備份方式,通過(guò)將用戶的數(shù)據(jù)集中存儲(chǔ)到高性能的IP SAN存儲(chǔ)中,利用存儲(chǔ)的遠(yuǎn)程復(fù)制功能將業(yè)務(wù)數(shù)據(jù)復(fù)制到災(zāi)備中心,對(duì)整個(gè)系統(tǒng)數(shù)據(jù)提供基于時(shí)間點(diǎn)的數(shù)據(jù)保護(hù),保障在非常短的時(shí)間內(nèi)恢復(fù)數(shù)據(jù)和系統(tǒng);方案適用范圍:1、無(wú)集中存儲(chǔ)(SAN)
50、,服務(wù)器采用本地硬盤(pán)或者DAS陣列,需要對(duì)本地硬盤(pán)進(jìn)行實(shí)時(shí)保護(hù)。2、投資較少,不做本地備份。虛擬化接入模塊面向各種不同的異構(gòu)系統(tǒng)平臺(tái),將數(shù)據(jù)從異構(gòu)平臺(tái)中抽取出來(lái),自適應(yīng)復(fù)制到本地或遠(yuǎn)程災(zāi)備中心,并提供基于時(shí)間周期或數(shù)據(jù)增量的數(shù)據(jù)快照保護(hù),保障客戶最小的RTO和RPO要求,為客戶提供最高等級(jí)的數(shù)據(jù)保護(hù)。方案適用的范圍:1、已采用集中存儲(chǔ),要求近線存儲(chǔ)可快速的恢復(fù)業(yè)務(wù);2、對(duì)數(shù)據(jù)保護(hù)要求較高,不能容忍或者只能容忍極小部分的數(shù)據(jù)丟失;3、對(duì)業(yè)務(wù)的實(shí)時(shí)性要求較高,并希望及時(shí)業(yè)務(wù)恢復(fù)。下面將詳細(xì)的對(duì)這三種接入方式進(jìn)行闡述:5.1.1 初級(jí)數(shù)據(jù)保護(hù)服務(wù)實(shí)現(xiàn)方式對(duì)于現(xiàn)有信息存儲(chǔ)容量不大,對(duì)數(shù)據(jù)信息容災(zāi)要求不
51、高的用戶,可以采用初級(jí)數(shù)據(jù)保護(hù)接入方案?jìng)浞蒈浖?虛擬磁帶庫(kù)+物理磁帶庫(kù)的方式進(jìn)行實(shí)施,即利用已有或購(gòu)置的新的備份軟件將數(shù)據(jù)備份到虛擬磁帶庫(kù),進(jìn)而備份到災(zāi)備中心物理磁帶庫(kù)方案。虛擬磁帶庫(kù)作為主存儲(chǔ)系統(tǒng)與物理磁帶庫(kù)之間的高速緩沖,備份軟件不需要增加投資。通過(guò)備份軟件把服務(wù)器上的數(shù)據(jù)快速備份到虛擬磁帶庫(kù)上,虛擬磁帶庫(kù)與物理磁帶庫(kù)通過(guò)SCSI接口或者FC接口進(jìn)行數(shù)據(jù)的導(dǎo)入和導(dǎo)出。數(shù)據(jù)從虛擬磁帶上導(dǎo)到物理磁帶庫(kù)以上,定期把物理磁帶庫(kù)里的磁帶通過(guò)運(yùn)輸工具搬遷到統(tǒng)一災(zāi)備中心進(jìn)行保存。同時(shí)虛擬磁帶庫(kù)通過(guò)IP網(wǎng)絡(luò)將備份數(shù)據(jù)復(fù)制到容災(zāi)中心的遠(yuǎn)程虛擬磁帶庫(kù)上。需要注意的是備份軟件的配置信息要進(jìn)行保存。遠(yuǎn)程備份方案圖
52、1、組網(wǎng)說(shuō)明通過(guò)在災(zāi)備中心部署虛擬磁帶庫(kù),可以直接將用戶的數(shù)據(jù)通過(guò)裸光纖備份到災(zāi)備中心,提高備份速度,同時(shí)也能將客戶原有的磁帶庫(kù)搬運(yùn)到容災(zāi)中心利用起來(lái),實(shí)現(xiàn)遠(yuǎn)程數(shù)據(jù)災(zāi)備?;謴?fù)時(shí)可以直接在災(zāi)備中心利用磁帶庫(kù)恢復(fù)。2、數(shù)據(jù)備份過(guò)程通過(guò)備份軟件把集中存儲(chǔ)上的數(shù)據(jù)通過(guò)滿足帶寬需求的鏈路快速備份到災(zāi)備中心的虛擬磁帶庫(kù)上,虛擬磁帶庫(kù)與物理磁帶庫(kù)通過(guò)SCSI接口或者FC接口進(jìn)行數(shù)據(jù)的導(dǎo)入和導(dǎo)出。將客戶的物理磁帶庫(kù)搬運(yùn)到容災(zāi)中心,數(shù)據(jù)從虛擬磁帶上導(dǎo)到物理磁帶庫(kù)以上,寫(xiě)好數(shù)據(jù)的磁帶放到單獨(dú)保密柜中保存。另外,需要對(duì)備份軟件的相關(guān)配置信息進(jìn)行保存,以免當(dāng)生產(chǎn)中心發(fā)生災(zāi)難時(shí),備份軟件的相關(guān)配置信息也一起丟失。3、數(shù)
53、據(jù)恢復(fù)過(guò)程當(dāng)生產(chǎn)中心主存儲(chǔ)發(fā)生故障時(shí),在主存儲(chǔ)恢復(fù)以后,通過(guò)備份軟件將遠(yuǎn)程虛擬磁帶庫(kù)的數(shù)據(jù)恢復(fù)到主存儲(chǔ)中,物理磁帶庫(kù)中磁帶用于恢復(fù)歸檔數(shù)據(jù)。5.1.2 中級(jí)數(shù)據(jù)保護(hù)服務(wù)實(shí)現(xiàn)方式對(duì)于業(yè)務(wù)處理連續(xù)性要求較高,本地?zé)o集中存儲(chǔ)的用戶,數(shù)據(jù)的災(zāi)難備份采用中級(jí)數(shù)據(jù)保護(hù)接入方案:集中存儲(chǔ)備份的方式,將數(shù)據(jù)直接集中保存在由本地存儲(chǔ)設(shè)備提供的統(tǒng)一存儲(chǔ)資源上。本地存儲(chǔ)設(shè)備到災(zāi)備中心的備份通過(guò)基于IP網(wǎng)絡(luò)的遠(yuǎn)程復(fù)制實(shí)現(xiàn)。集中存儲(chǔ)備份圖說(shuō)明:本地新增存儲(chǔ)設(shè)備作為一個(gè)統(tǒng)一的存儲(chǔ),為多臺(tái)主機(jī)提供IP SAN的集中存儲(chǔ)接入。本地的主機(jī)通過(guò)安裝普通網(wǎng)卡及免費(fèi)的軟件iSCSI驅(qū)動(dòng)程序,或者直接使用硬件iSCSI HBA卡來(lái)連接
54、IX系列存儲(chǔ)設(shè)備。本地存儲(chǔ)設(shè)備與災(zāi)備中心之間通過(guò)網(wǎng)絡(luò)建立遠(yuǎn)程復(fù)制連接。兩地?cái)?shù)據(jù)間初始化同步的實(shí)現(xiàn)方式有兩種,第一種是在本地使用另一臺(tái)存儲(chǔ)設(shè)備,完成所有需要備份主機(jī)的數(shù)據(jù)初始化同步后,再將存儲(chǔ)設(shè)備搬到災(zāi)備中心與本地建立起復(fù)制連接。第二種方法則通過(guò)網(wǎng)絡(luò)直接進(jìn)行數(shù)據(jù)同步,不需要進(jìn)行磁盤(pán)陣列異地運(yùn)輸,本期工程擬用裸光纖進(jìn)行連接,因此可以直接利用網(wǎng)絡(luò)進(jìn)行同步。復(fù)制策略可分為變化量觸發(fā)和周期觸發(fā)。在災(zāi)難發(fā)生時(shí),本地和災(zāi)備中心之間上一次數(shù)據(jù)復(fù)制后的新增業(yè)務(wù)數(shù)據(jù)將丟失,無(wú)法恢復(fù)。因此策略選擇的適中能使用戶本地和災(zāi)備中心的數(shù)據(jù)盡可能保持一致。5.1.3 高級(jí)數(shù)據(jù)保護(hù)服務(wù)實(shí)現(xiàn)方式1、方案一對(duì)于數(shù)據(jù)量存儲(chǔ)較大,且對(duì)
55、應(yīng)用及其數(shù)據(jù)在業(yè)務(wù)連續(xù)性和數(shù)據(jù)重要性上要求都非常高的用戶,采用高級(jí)數(shù)據(jù)接入的技術(shù)實(shí)現(xiàn)方案即可靠性最高的虛擬化方案進(jìn)行災(zāi)備實(shí)施。利用虛擬化引擎對(duì)現(xiàn)有存儲(chǔ)虛擬化為統(tǒng)一存儲(chǔ)池,然后通過(guò)同步鏡像將現(xiàn)有存儲(chǔ)卷與加密存儲(chǔ)卷同步,利用CDP持續(xù)性數(shù)據(jù)保護(hù)到災(zāi)備中心,虛擬化設(shè)備可以直接將災(zāi)備中心提升為生產(chǎn)存儲(chǔ)。2、方案二卷管理軟件可以在主機(jī)的磁盤(pán)和分區(qū)之上建立一個(gè)邏輯層,為文件系統(tǒng)屏蔽下層磁盤(pán)分區(qū)布局,提供給主機(jī)一個(gè)抽象的盤(pán)卷,能夠提高磁盤(pán)分區(qū)管理的靈活性。有許多廠家可以提供卷管理軟件,比如微軟的卷管理器,Veritas的VERITAS Volume Manager,HP/IBM的LVM等,這些軟件都具備RA
56、ID、磁盤(pán)鏡象和群集等功能。在卷管理軟件方式備份方案中,通過(guò)卷管理軟件將主機(jī)上的數(shù)據(jù)同步鏡像到本地存儲(chǔ)設(shè)備上,然后利用存儲(chǔ)設(shè)備的復(fù)制功能實(shí)現(xiàn)基于IP網(wǎng)絡(luò)的遠(yuǎn)程復(fù)制,將數(shù)據(jù)連續(xù)備份到災(zāi)備中心。組網(wǎng)說(shuō)明:本地備份節(jié)點(diǎn)部署一臺(tái)或多臺(tái)存儲(chǔ)設(shè)備,并在每臺(tái)需要進(jìn)行數(shù)據(jù)備份的主機(jī)上安裝卷管理軟件。主機(jī)的數(shù)據(jù)依然保存在原有磁盤(pán)上,原有存儲(chǔ)方式并不作修改。存儲(chǔ)設(shè)備通過(guò)IP SAN的接入方式為主機(jī)提供與原有磁盤(pán)相同容量的邏輯磁盤(pán),主機(jī)上的卷管理軟件將這兩個(gè)磁盤(pán)配置為鏡像關(guān)系,并完成初始同步。新增數(shù)據(jù)量在寫(xiě)入原有磁盤(pán)的同時(shí)會(huì)同步寫(xiě)入存儲(chǔ)設(shè)備,因此兩個(gè)磁盤(pán)上的數(shù)據(jù)內(nèi)容能夠保持完全一致。 本地的存儲(chǔ)設(shè)備與災(zāi)備中心建立遠(yuǎn)程復(fù)制連接,復(fù)制過(guò)程以及需要考慮的兩地?cái)?shù)據(jù)卷初始化和帶寬問(wèn)題,與集中存儲(chǔ)備份模式中考慮的一致。軟硬件配置需求:1、本地配置一臺(tái)或多臺(tái)存儲(chǔ)產(chǎn)品,并配置遠(yuǎn)程復(fù)制功能;2、每臺(tái)需要數(shù)據(jù)復(fù)制的主機(jī)上安裝卷管理軟件;3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度企業(yè)國(guó)有知識(shí)產(chǎn)權(quán)侵權(quán)賠償合同模板
- 2025年度漫畫(huà)改編舞臺(tái)劇合作制作合同二零二五版協(xié)議4篇
- 二零二五版網(wǎng)絡(luò)安全培訓(xùn)與應(yīng)急響應(yīng)合同2篇
- 2025年度商業(yè)廚房承包合同范本4篇
- 2025年度城市軌道交通沉降監(jiān)測(cè)與應(yīng)急預(yù)案合同4篇
- 二零二四年度醫(yī)療設(shè)備融資租賃管理協(xié)議3篇
- 2025年度新能源項(xiàng)目投資合作協(xié)議書(shū)
- 2025年電晶水口項(xiàng)目投資可行性研究分析報(bào)告
- 二零二五版跨境貿(mào)易數(shù)據(jù)保密協(xié)議翻譯服務(wù)合同3篇
- 2025年內(nèi)墻轉(zhuǎn)項(xiàng)目投資可行性研究分析報(bào)告
- GB/T 45120-2024道路車(chē)輛48 V供電電壓電氣要求及試驗(yàn)
- 春節(jié)文化常識(shí)單選題100道及答案
- 24年追覓在線測(cè)評(píng)28題及答案
- 2024年全國(guó)職業(yè)院校技能大賽高職組(藥學(xué)技能賽項(xiàng))考試題庫(kù)(含答案)
- 2024至2030年中國(guó)氫氧化鈣行業(yè)市場(chǎng)全景調(diào)查及發(fā)展趨勢(shì)分析報(bào)告
- 魚(yú)菜共生課件
- 《陸上風(fēng)電場(chǎng)工程概算定額》NBT 31010-2019
- 初中物理八年級(jí)下冊(cè)《動(dòng)能和勢(shì)能》教學(xué)課件
- 心肌梗死診療指南
- 原油脫硫技術(shù)
- GB/T 2518-2019連續(xù)熱鍍鋅和鋅合金鍍層鋼板及鋼帶
評(píng)論
0/150
提交評(píng)論