集群及雙機(jī)熱備_第1頁(yè)
集群及雙機(jī)熱備_第2頁(yè)
集群及雙機(jī)熱備_第3頁(yè)
集群及雙機(jī)熱備_第4頁(yè)
集群及雙機(jī)熱備_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、集群系統(tǒng)實(shí)現(xiàn)方案詳解 有一種常見(jiàn)的方法可以大幅提高服務(wù)器的安全性,這 就是集群。1 、 集群的基本概念Cluster 集群技術(shù)可如下定義:一組相互獨(dú)立的 服務(wù)器在網(wǎng)絡(luò)中表現(xiàn)為單一的系統(tǒng),并以單一系統(tǒng)的 模式加以管理。此單一系統(tǒng)為客戶工作站提供高可靠 性的服務(wù)。大多數(shù)模式下,集群中所有的計(jì)算機(jī)擁有一個(gè)共 同的名稱,集群內(nèi)任一系統(tǒng)上運(yùn)行的服務(wù)可被所有的 網(wǎng)絡(luò)客戶所使用。 Cluster 必須可以協(xié)調(diào)管理各分離 的組件的錯(cuò)誤和失敗,并可透明地向 Cluster 中加入 組件。一個(gè) Cluster 包含多臺(tái)(至少二臺(tái))擁有共享數(shù) 據(jù)存儲(chǔ)空間的服務(wù)器。任何一臺(tái)服務(wù)器運(yùn)行一個(gè)應(yīng)用 時(shí),應(yīng)用數(shù)據(jù)被存儲(chǔ)在共享

2、的數(shù)據(jù)空間內(nèi)。每臺(tái)服務(wù) 器的操作系統(tǒng)和應(yīng)用程序文件存儲(chǔ)在其各自的本地儲(chǔ) 存空間上。Cluster 內(nèi)各節(jié)點(diǎn)服務(wù)器通過(guò)一內(nèi)部局域網(wǎng)相互 通訊。當(dāng)一臺(tái)節(jié)點(diǎn)服務(wù)器發(fā)生故障時(shí),這臺(tái)服務(wù)器上 所運(yùn)行的應(yīng)用程序?qū)⒃诹硪还?jié)點(diǎn)服務(wù)器上被自動(dòng)接 管。當(dāng)一個(gè)應(yīng)用服務(wù)發(fā)生故障時(shí),應(yīng)用服務(wù)將被重新啟動(dòng)或被另一臺(tái)服務(wù)器接管。 當(dāng)以上任一故障發(fā)生時(shí), 客戶將能很快連接到新的應(yīng)用服務(wù)上。2 、 集群的硬件配置鏡像服務(wù)器雙機(jī) 集群中鏡像服務(wù)器雙機(jī)系統(tǒng)是硬件配置最簡(jiǎn)單和 價(jià)格最低廉的解決方案,通常鏡像服務(wù)的硬件配置需 要兩臺(tái)服務(wù)器,在每臺(tái)服務(wù)器有獨(dú)立操作系統(tǒng)硬盤和 數(shù)據(jù)存貯硬盤,每臺(tái)服務(wù)器有與客戶端相連的網(wǎng)卡, 另有一對(duì)鏡像卡

3、或完成鏡像功能的網(wǎng)卡。鏡像服務(wù)器具有配置簡(jiǎn)單,使用方便,價(jià)格低廉 諸多優(yōu)點(diǎn),但由于鏡像服務(wù)器需要采用網(wǎng)絡(luò)方式鏡像 數(shù)據(jù),通過(guò)鏡像軟件實(shí)現(xiàn)數(shù)據(jù)的同步,因此需要占用 網(wǎng)絡(luò)服務(wù)器的 CPU 及內(nèi)存資源,鏡像服務(wù)器的性能比 單一服務(wù)器的性能要低一些。有一些鏡像服務(wù)器集群系統(tǒng)采用內(nèi)存鏡像的技 術(shù),這個(gè)技術(shù)的優(yōu)點(diǎn)是所有的應(yīng)用程序和網(wǎng)絡(luò)操作系 統(tǒng)在兩臺(tái)服務(wù)器上鏡像同步,當(dāng)主機(jī)出現(xiàn)故障時(shí),備 份機(jī)可以在幾乎沒(méi)有感覺(jué)的情況下接管所有應(yīng)用程 序。因?yàn)閮蓚€(gè)服務(wù)器的內(nèi)存完全一致,但當(dāng)系統(tǒng)應(yīng)用 程序帶有缺陷從而導(dǎo)致系統(tǒng)宕機(jī)時(shí),兩臺(tái)服務(wù)器會(huì)同 步宕機(jī)。這也是內(nèi)存鏡像卡或網(wǎng)卡實(shí)現(xiàn)數(shù)據(jù)同步,在 大數(shù)據(jù)量讀寫(xiě)過(guò)程中兩臺(tái)服務(wù)器在

4、某些狀態(tài)下會(huì)產(chǎn)生 數(shù)據(jù)不同步,因此鏡像服務(wù)器適合那些預(yù)算較少、對(duì) 集群系統(tǒng)要求不高的用戶。硬件配置范例:? 網(wǎng)絡(luò)服務(wù)器 兩臺(tái)? 服務(wù)器操作系統(tǒng)硬盤 兩塊? 服務(wù)器數(shù)據(jù)存貯硬盤 視用戶需要確定? 服務(wù)器鏡像卡(部分軟件可使用標(biāo)準(zhǔn)網(wǎng)卡) 兩塊 ? 網(wǎng)絡(luò)服務(wù)網(wǎng)卡 兩塊 雙機(jī)與磁盤陣列柜與鏡像服務(wù)器雙機(jī)系統(tǒng)相比,雙機(jī)與磁盤陣列柜 互聯(lián)結(jié)構(gòu)多出了第三方生產(chǎn)的磁盤陣列柜,目前,豪 威公司、精業(yè)公司等許多公司都生產(chǎn)有磁盤陣列柜, 在磁盤陣列柜中安裝有磁盤陣列控制卡,陣列柜可以 直接將柜中的硬盤配置成為邏輯盤陣。磁盤陣列柜通 過(guò) SCSI 電纜與服務(wù)器上普通 SCSI 卡相連,系統(tǒng)管 理員需直接在磁盤柜上配置

5、磁盤陣列。雙機(jī)與磁盤陣列柜互聯(lián)結(jié)構(gòu)不采用內(nèi)存鏡像技術(shù),因此需要有一定的切換時(shí)間(通常為60180秒),它可以有郊的避免由于應(yīng)用程序自身的缺陷導(dǎo) 致系統(tǒng)全部宕機(jī),同時(shí)由于所有的數(shù)據(jù)全部存貯在中 置的磁盤陣列柜中,當(dāng)工作機(jī)出現(xiàn)故障時(shí),備份機(jī)接 替工作機(jī),從磁盤陣列中讀取數(shù)據(jù),所以不會(huì)產(chǎn)生數(shù) 據(jù)不同步的問(wèn)題,由于這種方案不需要網(wǎng)絡(luò)鏡像同步, 因此這種集群方案服務(wù)器的性能要比鏡像服務(wù)器結(jié)構(gòu) 高出很多。 雙機(jī)與磁盤陣列柜互聯(lián)結(jié)構(gòu)的缺點(diǎn)是 在系統(tǒng)當(dāng)中存在單點(diǎn)錯(cuò)的缺陷,所謂單點(diǎn)錯(cuò)是指當(dāng)系 統(tǒng)中某個(gè)部件或某個(gè)應(yīng)用程序出現(xiàn)故障時(shí),導(dǎo)致所有 系統(tǒng)全部宕機(jī)。在這個(gè)系統(tǒng)中磁盤陣列柜是會(huì)導(dǎo)致單 點(diǎn)錯(cuò),當(dāng)磁盤陣列柜出現(xiàn)邏

6、輯或物理故障時(shí),所有存 貯的數(shù)據(jù)會(huì)全部丟失,因此,在選配這種方案時(shí),需 要選用一個(gè)品質(zhì)與售后服務(wù)較好的產(chǎn)品。硬件配置范例:? 網(wǎng)絡(luò)服務(wù)器 兩臺(tái)? 服務(wù)器操作系統(tǒng)硬盤 兩塊? 第三方生產(chǎn)的磁盤陣列柜 一臺(tái)? 磁盤柜專用 SCSI 電線 兩根? 磁盤陣列柜數(shù)據(jù)存貯硬盤 視用戶需求確定? 網(wǎng)絡(luò)服務(wù)網(wǎng)卡 兩塊 除此之外,一些廠商還有更優(yōu)秀的技術(shù)的解決方案, 比如 HP。HP 雙機(jī)雙控容錯(cuò)系統(tǒng)HP NetServer 為雙機(jī)雙控容錯(cuò)系統(tǒng)提供了高品 質(zhì)和高可靠的硬件基礎(chǔ)。HP 雙機(jī)雙控容錯(cuò)系統(tǒng)結(jié)合了 HP 服務(wù)器產(chǎn)品的 安全可靠性與 Cluster 技術(shù)的優(yōu)點(diǎn),相互配合二者的 優(yōu)勢(shì)。硬件配置范例:? HP

7、 L 系統(tǒng)的網(wǎng)絡(luò)服務(wù)器 兩臺(tái)? 服務(wù)器操作系統(tǒng)硬盤 兩塊? HP 硬盤存貯柜( SS/6 , RS/8 ,RS/12 ) 一臺(tái)? 磁盤柜專用 SCSI 集群適配電纜 兩根? 磁盤柜數(shù)據(jù)存貯硬盤 視用戶需求確定? HP 集群專用陣列卡 兩塊? 網(wǎng)絡(luò)服務(wù)網(wǎng)卡 兩塊HP 光纖通道雙機(jī)雙控集群系統(tǒng) 光纖通道是一種連接標(biāo)準(zhǔn),可以作為 SCSI 的一 種替代解決方案, 光纖技術(shù)具有高帶寬、 抗電磁干擾、 傳輸距離遠(yuǎn)、質(zhì)量高、擴(kuò)展能力強(qiáng)等特性,目前在 FC-AL 仲裁環(huán)路上可接入 126 個(gè)設(shè)備。光纖設(shè)備提供了多種增強(qiáng)的連接技術(shù),大大方便 了用戶使用。服務(wù)器系統(tǒng)可以通過(guò)光纜遠(yuǎn)程連接,最 大可跨越 10 公里

8、的距離。它允許鏡像配置,這樣可 以改善系統(tǒng)的容錯(cuò)能力。服務(wù)器系統(tǒng)的規(guī)模將更加靈 活多變。SCSI每條通道最多可連接15個(gè)設(shè)備,而光 纖仲裁環(huán)路最多可以連接 126 個(gè)設(shè)備。光纖集群系統(tǒng)組成:HP 光纖集群系統(tǒng)硬件設(shè)備包括有兩臺(tái) HP 服務(wù) 器(需支持光纖卡, 目前有 LC2000 、LH3000 、LH4 、 LH6000 、LT6000 、LXr8000 、LXR8500 )及光纖 適配卡,可以使用 RS/12FC 光纖磁盤陣列柜,需另 加一對(duì)或兩對(duì)網(wǎng)卡用于心跳檢測(cè)和與客戶端連接。在 配置過(guò)程中還需另外選配光纖卡到光纖存貯設(shè)備的光 纖電纜。硬件配置:? HP L系統(tǒng)的網(wǎng)絡(luò)服務(wù)器 兩臺(tái)? 服務(wù)

9、器操作系統(tǒng)硬盤 兩塊? HP光纖陣列存貯柜(RS/12FC)一臺(tái)? 光纖磁盤柜專用光纖電纜 兩根? 光纖磁盤柜數(shù)據(jù)存貯硬盤 視用戶需求確定? HP光纖適配卡兩塊? 網(wǎng)絡(luò)服務(wù)網(wǎng)卡 兩塊3、集群的軟件配置基于 NT 平臺(tái)的集群軟件microsoft 的 MSCS ,也有許多第三方的專業(yè)軟 件公司開(kāi)發(fā)的集群軟件,如豪威的 DATAWARE ,VINCA 公司的 STANDBY SERVER ,NSI 公司的 DOUBLE TAKE 。MS WolfPack 的特點(diǎn)MS WolfPack 是MS Cluster server 的別稱, 是微軟針對(duì) Cluster 技術(shù)研制開(kāi)發(fā)的雙機(jī)軟件。它集 成在 N

10、T SERVER 上,支持由二臺(tái)機(jī)器組成的雙機(jī)系 統(tǒng),提供一種高可用且易管理的應(yīng)用環(huán)境。主要特點(diǎn):? 自動(dòng)檢測(cè)和修復(fù)服務(wù)器或應(yīng)用程序的錯(cuò)誤? 可實(shí)現(xiàn)對(duì)服務(wù)器中應(yīng)用程序的切換? 可通過(guò) TCP/IP 連接各種客戶端,如 MS-DOS 、 WINDOWS 3.X/9X/NT , Apple Macintosh 、 UNIX 等? 生產(chǎn)主機(jī)無(wú)需人工干涉即可自動(dòng)恢復(fù)數(shù)據(jù)并接管 任務(wù)? 易管理性:? 可自動(dòng)審核服務(wù)器和應(yīng)用程序的工作狀態(tài)? 可建立高可用性的應(yīng)用程序、 文件共享、 打印請(qǐng)求 等? 可靈活設(shè)置應(yīng)用程序和數(shù)據(jù)的恢復(fù)策略? 簡(jiǎn)單操作即可進(jìn)行應(yīng)用程序的離線, 重新再線, 服 務(wù)器間的遷移。目前,W

11、INDOWS 2000 Advaneed Server與 WINDOWS 2000 DataCe nter Server都集成有更先進(jìn)集群技術(shù)。其它的網(wǎng)絡(luò)操作系統(tǒng)平臺(tái)上也有許多集群軟件, 比如:基于novell平臺(tái)的集群軟件有Novell HAServer、Novell SFT III基于sco UNIX 平臺(tái)的集群軟件有 Sentinel集群軟件基于Linux平臺(tái)的集群軟件有 TurboCluster給服務(wù)器找個(gè)替身 實(shí)戰(zhàn)雙機(jī)熱備不間斷10分鐘、幾小時(shí)甚至幾系統(tǒng)故障可能由各種原因引起,服務(wù)器若想恢復(fù)正??赡苄枰?天。我原來(lái)的單位作為北京市某區(qū)的網(wǎng)絡(luò)核心,針對(duì)不同的業(yè)務(wù)部門的應(yīng)用平臺(tái)就有20多

12、個(gè)。而重要部門的外網(wǎng)網(wǎng)站和內(nèi)部的OA也有20余個(gè)。其中政府網(wǎng)絡(luò)自動(dòng)化 辦公平臺(tái)搭建于2001年初,經(jīng)過(guò)了 5年的升級(jí)改造后,現(xiàn)在運(yùn)行的已經(jīng)是第四版了。這個(gè)平臺(tái)不但作為 區(qū)內(nèi)所有政府單位、 各委辦局、街道辦事處等等部門的信息通訊平臺(tái),同時(shí)也是整個(gè)公文的流轉(zhuǎn)載體,地位之重可想而知。給服務(wù)器找個(gè)替身某日,該區(qū)的核心服務(wù)器出現(xiàn)嚴(yán)重故障, 導(dǎo)致數(shù)據(jù)丟失。我作為一名有十年工作經(jīng)驗(yàn)的 信息主管,對(duì)于這臺(tái)服務(wù)器幾年內(nèi)遇到的故障問(wèn)題可謂是膽戰(zhàn)心驚,想必大家也都清楚一個(gè)網(wǎng)絡(luò)管理的常識(shí),那就是使用率越高,故障率也越高。在修復(fù)服務(wù)器之后的一個(gè)月,單位派我參加網(wǎng)絡(luò)安全的學(xué)習(xí)班。其實(shí)我早就聽(tīng)說(shuō)過(guò)雙機(jī)熱備”這個(gè)名詞,不過(guò)真

13、正了解它還是得益于學(xué)習(xí)班中的保障業(yè)務(wù)連續(xù)性”的內(nèi)容。很多廠商為我們解釋的零”時(shí)間轉(zhuǎn)換,其實(shí)是不可能做到的,從實(shí)際應(yīng)用的效果當(dāng)中,或者從一些真實(shí)的案例中我們不難看到這只是一種相對(duì)的零”時(shí)間。一般的系統(tǒng)能夠保持1分鐘進(jìn)行主機(jī)轉(zhuǎn)換已經(jīng)是一種比較好的設(shè)計(jì)了。雙機(jī)熱備由備用的服務(wù)器解決了在主服務(wù)器故障時(shí)服務(wù)不中斷的問(wèn)題,但在實(shí)際應(yīng)用中,可能會(huì)出現(xiàn)多臺(tái)服務(wù)器的情況,即服務(wù)器群集”。(這里我需要說(shuō)明一下,根據(jù)Cluster的正確翻譯我們應(yīng)當(dāng)將這種多服務(wù)器正是命名為一一群集,而不是集群)如果我們更加具體的解釋雙機(jī)熱備系統(tǒng),那么就可以理解為Active(活動(dòng))與Standby(備用)方式存在的兩臺(tái)服務(wù)器,它們共

14、同使用一個(gè)共享的存儲(chǔ)設(shè)備。在同一時(shí)間內(nèi)只有一臺(tái)服務(wù)器運(yùn)行,當(dāng)其中運(yùn)行著的一臺(tái)服務(wù)器出現(xiàn)故障無(wú)法啟動(dòng)時(shí),另一臺(tái)備份服務(wù)器會(huì)通過(guò)軟件診測(cè)(通常叫做心跳診斷)將備用服務(wù)器激活,保證應(yīng)用在短時(shí)間內(nèi)完全恢復(fù)正常使用。準(zhǔn)備部署雙機(jī)熱備系統(tǒng)從學(xué)習(xí)班回來(lái)后,我們單位按例召開(kāi)每月的工作交流會(huì),借助我區(qū)建立安全信息平臺(tái)的計(jì)劃,我提出了建立雙機(jī)熱備的必要性。我們系統(tǒng)部每天接到的系統(tǒng)故障保修電話不下30個(gè),這些故障類型繁多,如設(shè)備故障、操作系統(tǒng)故障、軟件系統(tǒng)故障等等。網(wǎng)絡(luò)操作人員和系統(tǒng)管理員人為的恢復(fù)服務(wù)器正??赡苄枰?0分鐘、幾小時(shí)甚至幾天。而如果技術(shù)人員不在現(xiàn)場(chǎng),則恢復(fù)服務(wù)的時(shí)間就更長(zhǎng)了。這次0A的故障實(shí)屬特殊,

15、可能有些系統(tǒng)工程師干一輩子都遭遇不到這樣的情景:RAID5磁盤陣列中的兩塊硬盤同時(shí)掉線;備份系統(tǒng)剛剛遷移到新的機(jī)房。當(dāng)時(shí)感到的壓力是從來(lái)沒(méi)有遇到過(guò)的,在感謝IBM工程師及時(shí)修復(fù)的同時(shí),我感到建立更加完善的保障體系更加重要。大家都清楚一個(gè)道理:服務(wù)器故障率要比交換機(jī)、存儲(chǔ)設(shè)備的故障高得多。原因很容易理 解,服務(wù)器是比交換機(jī)、 存儲(chǔ)設(shè)備復(fù)雜得多的設(shè)備,它既包括硬件,還要包括操作系統(tǒng)合應(yīng)用軟件系統(tǒng)。決定是否使用雙機(jī)熱備,正確的方法是要分析現(xiàn)有系統(tǒng)的重要性以及對(duì)服務(wù)中 斷的容忍程度,以此來(lái)決定是否使用雙機(jī)熱備。不僅設(shè)備故障可能引起服務(wù)中斷,而且軟件方面的問(wèn)題也可能導(dǎo)致服務(wù)器不能正常工 作。決定采用雙機(jī)

16、熱備系統(tǒng)的 最終條件=用戶容忍時(shí)間-系統(tǒng)恢復(fù)時(shí)間”,根據(jù)以前的調(diào)查表, 和每天接到的咨詢電話,0A的用戶端最長(zhǎng)的等待時(shí)間不超過(guò)一小時(shí),而我們要從備份中恢 復(fù)的最快時(shí)間要超過(guò) 6小時(shí)。由此可見(jiàn),建立雙機(jī)熱備系統(tǒng)勢(shì)在必行。選擇部署雙機(jī)熱備的方式報(bào)告也打了,資金也批了,到了開(kāi)始組建階段我到犯了難。我了解到雙機(jī)熱備有兩種實(shí)現(xiàn)模式,猶豫的原因是到底選擇哪種方式建立?一種是基于共享的存儲(chǔ)設(shè)備的方式,另一種是沒(méi)有共享的存儲(chǔ)設(shè)備的方式,一般稱為純軟件方式。存儲(chǔ)共享式對(duì)于這種方式,采用兩臺(tái)服務(wù)器,使用共享的存儲(chǔ)設(shè)備(磁盤陣列柜或存儲(chǔ)區(qū)域網(wǎng) SAN) 組成。在對(duì)外提供服務(wù)過(guò)程中,兩臺(tái)服務(wù)器將以一個(gè)虛擬的IP地址對(duì)外提供服務(wù),當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),另一臺(tái)服務(wù)器根據(jù)心跳偵測(cè)的情況做出判斷,并進(jìn)行切換,接管服務(wù)。 由于使用共享的存儲(chǔ)設(shè)備,因此兩臺(tái)服務(wù)器使用的實(shí)際上是一樣的數(shù)據(jù),由雙機(jī)或集群軟件對(duì)其進(jìn)行管理。純軟件方式簡(jiǎn)單地講,純軟件方式就是通過(guò)鏡像軟件,將數(shù)據(jù)實(shí)時(shí)復(fù)制到另一臺(tái)服務(wù)器上,這樣同樣的數(shù)據(jù)就在兩臺(tái)服務(wù)器上各存在一份,如果一臺(tái)服務(wù)器出現(xiàn)故障, 可以及時(shí)切換到另一臺(tái)服務(wù)器。還有一種情況,群集也不需要使用共享的存儲(chǔ)設(shè)備,而可以直接使用雙機(jī)或群集軟件即可。但這種情況其實(shí)與鏡像軟件無(wú)關(guān),只不過(guò)是上面的共享模式下的一種變化而已。1. 0A

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論