容錯與集群的比較_第1頁
容錯與集群的比較_第2頁
容錯與集群的比較_第3頁
容錯與集群的比較_第4頁
容錯與集群的比較_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

容錯與集群系統(tǒng)的對比分析關鍵應用服務器選型原則第一、 系統(tǒng)安全可靠性第二、 系統(tǒng)可管理性第三、 系統(tǒng)維護性第四、 系統(tǒng)擴展性第五、 系統(tǒng)實用性第五、 系統(tǒng)經(jīng)濟性第六、 其他A類服務器可選方案高可用性方案—HA方案(HighAvailability)服務器集群方案雙機雙柜方案—硬件無單點故障雙機單柜方案—外置存儲柜單點故障Unix、Windows平臺連續(xù)可用性方案—CA方案(ContinuousAvailability)容錯服務器方案硬件無單點故障,操作系統(tǒng)經(jīng)過強化獨自開發(fā)的專用容錯系統(tǒng)(Tendem、Stratus)Unix、Windows容錯系統(tǒng)(Stratus)HA和CA技術的發(fā)展60‘70‘80‘90‘2000‘專有容錯系統(tǒng)軟件容錯系統(tǒng)硬件容錯系統(tǒng)單機雙機ClusterTruUnixClusterUnix,Windows集群HA方案

80年代末到90年代初DEC的TruUnix上開始發(fā)展90年代末開始在Windows上發(fā)展容錯CA方案80開始發(fā)展純硬件容錯技術

天騰和容錯兩家公司

專用容錯系統(tǒng)、專用領域91年容錯公司推出Unix容錯機98年天騰被康柏收購01年容錯公司推出Windows容錯機02年康柏被惠普收購

計算機業(yè)界對可靠性的定義方案可靠性99.999%99.99%99.9%99%容錯服務器獨立服務器使用外部磁陣的獨立服務器簡易的集群系統(tǒng)消除單點故障的集群系統(tǒng)大型主機集群和容錯方案的概念比較內容集群HA方案容錯CA方案故障類型僅避免永久性故障避免永久性和瞬間性故障,其中瞬間性故障占硬件故障的90%(IBM服務器專家實驗結果)可靠性指標99.9%-99.99%,具體水平依賴于實施水平、應用類型、數(shù)據(jù)規(guī)模、切換原因等許多不確定因素,難保證99.999%以上,所有容錯系統(tǒng)(公司)必須承諾的指標,容錯公司統(tǒng)計數(shù)據(jù)達到99.9998%非計劃停機時間平均每年53分鐘到9小時平均每年5分鐘,容錯公司統(tǒng)計數(shù)據(jù)小于2分鐘冗余性級別系統(tǒng)級別冗余,軟件執(zhí)行機制部件級別冗余,硬件執(zhí)行機制設計目的避免服務器的硬件故障避免服務器的硬件故障、提高操作系統(tǒng)的可用性數(shù)學基礎平行式結構,避錯設計架橋式結構,容錯設計方案表現(xiàn)聽任故障造成停機,只能采取從災難中恢復的方法容忍故障出現(xiàn),預防災難發(fā)生可靠性級別AL2-AL3,中等級別AL4,最高級別集群HA方案是高可用性方案,但這并不是真正意義上的容錯!

集群和容錯方案的拓撲結構比較心跳線系統(tǒng)結構復雜環(huán)節(jié)過多,外部連接故障發(fā)生點多系統(tǒng)結構簡單如同單機,內部連接故障發(fā)生點少無單點故障的集群方案無單點故障的容錯方案數(shù)據(jù)鏡像操作系統(tǒng)SCSIENETSMMMPU,Memory住服務器集群軟件中間件應用軟件操作系統(tǒng)SCSIENETSMMMPU,Memory備用服務器集群軟件中間件應用軟件磁盤陣列心跳線定期偵測集群和容錯方案硬軟件結構比較CPUMemoryCPUMemoryI/OI/O操作系統(tǒng)中間件應用軟件硬軟件結構復雜依賴集群軟件對所有軟件和硬件要求苛刻切換機制只能覆蓋部分實際應用情況硬軟件結構簡單純硬件容錯結構對所有軟件無特殊要求時鐘同步,無需切換HACA數(shù)據(jù)丟失CPU中正在處理的數(shù)據(jù)內存中駐留的重要數(shù)據(jù)I/O中正等待寫入/出的數(shù)據(jù)選擇新平臺進行切換業(yè)務延滯等待檢測故障出現(xiàn)永久故障瞬間故障故障恢復集群和容錯方案的工作原理比較實踐證明切換不是總能成功的!集群和容錯硬軟件可靠性實測比較Source:StandishGroup,June2002.Datacollectedovera12monthperiodfrom1,893enterpriseproductionsystems.Downtimenumbersincludeplanneddowntimeandunplanneddowntimeduetooperatorerrors,networkandenvironmentalissuesaswellassystemsoftwareandhardwareproblems.結論是:容錯服務器的硬軟件可靠性是最高的集群略微提高了硬件的可靠性但反而降低了軟件的可靠性!2003美國供電中斷是由于集群切換的失敗區(qū)域供電中斷13分鐘集群和容錯方案的對比(一)

技術對比內容集群HA方案容錯CA方案硬件結構冗余服務器和磁盤柜,通過集群軟件,設計切換機制,由軟件來執(zhí)行故障的恢復100%部件冗余,計算機指令時鐘同步,通過比較或表決線路,由硬件執(zhí)行容錯,預防故障發(fā)生軟件結構集群系統(tǒng)對所有軟件的要求比較高,包括數(shù)據(jù)庫軟件和應用軟件,而其集群造成軟件結構復雜,必須編制腳本,增加故障的不確定因素單軟件映像,強化驅動和熱插拔支持,軟件結構像單機這么簡單,無需做特殊處理停機故障類型所有故障,包括永久和瞬間故障絕大部分故障都不會造成停機故障造成停機時間幾分鐘—幾十分鐘不等,根據(jù)服務器之間的切換時間和應用復雜程度,來決定停機時間零切換時間,故障不會造成停機數(shù)據(jù)完整性故障發(fā)生導致動態(tài)實時數(shù)據(jù)丟失,切換不完善導致數(shù)據(jù)不一致沒有數(shù)據(jù)丟失,保證數(shù)據(jù)完整性和一致性應用軟件測試所有應用軟件必須經(jīng)過嚴格切換測試,模擬故障不全無需進行切換測試,所有軟件對客戶是透明的集群和容錯方案的對比(二)

系統(tǒng)計劃實施對比內容集群HA方案容錯CA方案系統(tǒng)設計復雜,必須考慮所有硬軟件在集群系統(tǒng)下的可用性設計簡單,只需考慮單機應用安裝步驟硬件結構復雜,現(xiàn)場組裝時間長,軟件必須安裝兩次,而且現(xiàn)場必須編制切換的腳本程序模塊化設計,插拔式安裝,時間短,軟件一次安裝完成,無需現(xiàn)場編制任何腳本程序安裝時間一天3小時左右測試必須經(jīng)過嚴格的所有硬件故障模擬測試,所有軟件故障模擬測試,以及故障導致切換的測試只需經(jīng)過硬件熱插拔測試,由于軟件由其開發(fā)商以經(jīng)過長期嚴格測試,無需在現(xiàn)場測試測試時間模擬故障不能完全考慮到現(xiàn)場的實際應用狀況,故嚴格的測試需要一周左右時間幾分鐘的模擬硬件故障測試技術要求安裝實施工程師必須對集群技術、微軟技術和應用軟件的技術非常熟悉,并具有豐富的經(jīng)驗只需要了解單機技術和微軟技術即可,無需經(jīng)過特殊的專業(yè)培訓集群和容錯方案的對比(三)

系統(tǒng)管理對比內容集群HA方案容錯CA方案設備管理本身包含設備多,管理復雜,尤其除了管理服務器以外,還必須對磁盤柜進行管理設備單一,管理簡單,如同管理單機一樣管理系統(tǒng)檢測一般只有在開機時,服務器才會進行自檢,正常使用時,不具備實時檢測和糾錯功能具有實時自我檢測功能,并且能自動隔離故障,無須人工檢測管理方式必須現(xiàn)場進行管理,而且嚴格上來講,必須7x24小時現(xiàn)場有工程師管理可配置遠程管理功能,由于故障不會導致系統(tǒng)癱瘓,即使故障發(fā)生,也無需立即到達現(xiàn)場處理故障運行中測試集群在實際應用中必須定期進行故障模擬和切換測試,以確保一旦故障出現(xiàn),系統(tǒng)能夠順利切換,一般兩周到一個月必須測試一次只需對系統(tǒng)進行定期常規(guī)的健康檢查,一般不需要測試人員要求對系統(tǒng)管理員必須經(jīng)過專業(yè)技術培訓,熟悉硬件和軟件技術,以及時在現(xiàn)場作出故障處理不需要經(jīng)過專門的技術培訓集群和容錯方案的對比(四)

系統(tǒng)維護對比內容集群HA方案容錯CA方案易難程度由于設備多,維護難度大,需要專業(yè)工程師維護維護容易,無須經(jīng)過專業(yè)培訓,故障出現(xiàn)一般無須立即響應故障修復拆機后替換式故障診斷,故障定位后,替換故障備件,現(xiàn)場可能一次不能完成,修復時間長模塊化設計,系統(tǒng)自動提示故障位置,故障部件所在的模塊一起更換,故障定位和備件更換快熱插拔一般只有電源、風扇和硬盤支持熱插拔,除以上部件外,均須停機拆卸更換所有部件支持熱插拔,包括CPU、內存、電源、風扇、I/O板卡,甚至底板均可連同模塊一起熱插拔,可在線進行部件更換故障修復后測試集群系統(tǒng)在任何故障修復后均必須再進行切換測試,保證故障再次發(fā)生,系統(tǒng)能夠順利切換故障修復后只需進行常規(guī)健康檢查服務形式被動式服務,一般采取人工電話咨詢、工程師現(xiàn)場故障判斷和備件更換,無法進行遠程維護和自動報警主動式服務,一旦機器出現(xiàn)故障,機器會自動監(jiān)測和隔離故障,并主動向容錯公司的維護網(wǎng)絡報警,工程師也可以進行遠程維護備件送達服務容錯服務器的主動式服務4.ftServer?會將新?lián)Q上的部件自動進行同步并始終保持系統(tǒng)的運行3.隨后,新的“客戶可自行更換單元”即會被送出1.當部件發(fā)生故障,系統(tǒng)將自動隔離故障并使用冗余的部件繼續(xù)運行2.“主動通知”技術將自動向Stratus公司的客戶服務中心報告故障雙向客戶服務中心主動通知集群和容錯方案的對比(五)

擁有成本對比內容集群HA方案容錯CA方案硬件采購成本有雙機雙柜和雙機單柜選擇,平均成本較低一般硬件采購成本較高軟件采購成本(參考市場價格:下頁)操作系統(tǒng):Windows企業(yè)版兩套數(shù)據(jù)庫:SQL企業(yè)版兩套集群軟件:雙機雙柜必須另購一套應用軟件:企業(yè)版一套操作系統(tǒng):Windows企業(yè)版一套數(shù)據(jù)庫:SQL標準版或企業(yè)版一套應用軟件:標準版一套切換軟件:不需要實施成本集群一般需要專業(yè)的工程師到現(xiàn)場安裝實施,集成費用、測試費用一般比較高實施成本低,基本無測試成本,就如同單機集成開發(fā)成本軟件二次開發(fā)后須經(jīng)過集群環(huán)境測試,開發(fā)成本高,另外系統(tǒng)投產后如果需要增加軟件和修改軟件,也會產生開發(fā)成本沒有特殊的軟件開發(fā)生命周期一般使用周期為3-4年一般使用周期為4-6年管理維護成本對人員數(shù)量、技術水平、培訓要求高人員數(shù)量少,無須特殊技術和培訓集群和容錯方案的對比(六)

擁有成本對比典型IT環(huán)境的構建與運行費用分析

一個IT環(huán)境5年總費用的典型例子“Thesmallestelementofthecostofrunningservers

isactualserverpurchaseprice.”

JayBretzmannDirectorofIBM’sxSeriesMarketing“服務器硬件購買成本實際上是最少的成本因素!”初期投資整個生命周期中的總體成本容錯服務器集群服務器HACA時間經(jīng)濟效益集群和容錯方案的對比(七)

采購成本對比內容集群HA方案容錯CA方案雙機雙柜價格雙機單柜價格ftServer價格硬件價格HPDL580G3雙lInteXeon3.66GHz/1MB4GB內存,2個73GB硬盤雙網(wǎng)卡,冗余電源HPMSA1000F200146GB硬盤6塊¥480000HPDL580G3雙lntelXeon3.66GHz/1MB4GB內存,2個73GB硬盤雙網(wǎng)卡,冗余電源HPMSA1000F100146GB硬盤3塊¥330000Stratusft4600雙IntelXeon3.6GHz/2MBCPU(邏輯),4GB內存(邏輯),2個74GB硬盤,4個160GB硬盤雙網(wǎng)卡¥1180000軟件價格Windwos2003企業(yè)版:2套¥60000Windwos2003企業(yè)版:2套¥60000Windwos2003企業(yè)版1套2CPUSQL企業(yè)版:2套¥6800002CPUSQL企業(yè)版:2套¥6800002CPUSQL標準版1套¥100000集群軟件:1套¥140000安

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論