批注版1基于hadoop的混合raid容錯(cuò)機(jī)制設(shè)計(jì)與實(shí)現(xiàn)_第1頁
批注版1基于hadoop的混合raid容錯(cuò)機(jī)制設(shè)計(jì)與實(shí)現(xiàn)_第2頁
批注版1基于hadoop的混合raid容錯(cuò)機(jī)制設(shè)計(jì)與實(shí)現(xiàn)_第3頁
批注版1基于hadoop的混合raid容錯(cuò)機(jī)制設(shè)計(jì)與實(shí)現(xiàn)_第4頁
已閱讀5頁,還剩7頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于Hadoop的混合RAID容錯(cuò)機(jī)制的設(shè)計(jì)與實(shí)現(xiàn)程校猛課題意義為什么Hadoop要有容錯(cuò)機(jī)制: Hadoop的文件系統(tǒng)HDFS作為一個(gè)分布式的存儲(chǔ)系統(tǒng),存儲(chǔ)節(jié)點(diǎn)出現(xiàn)故障是非常有可能的,一旦出現(xiàn),如果沒有容錯(cuò)機(jī)制,將造成數(shù)據(jù)永久丟失。當(dāng)前Hadoop的容錯(cuò)機(jī)制是什么: 當(dāng)前Hadoop默認(rèn)的是3-way的三備份容錯(cuò)機(jī)制,原始數(shù)據(jù)被復(fù)制成三分存放在不同節(jié)點(diǎn)上。當(dāng)前Hadoop容錯(cuò)機(jī)制的缺點(diǎn)是什么: 1.冗余大,存儲(chǔ)效率只有1/3 2.恢復(fù)的時(shí)候不同節(jié)點(diǎn)之間需要移動(dòng)的數(shù)據(jù)塊較多,恢復(fù)帶寬比較大國內(nèi)外研究現(xiàn)況及發(fā)展趨勢Facebook Hadoop現(xiàn)在Facebook正在運(yùn)行世界第二大Hadoop集

2、群系統(tǒng)。在寫這篇文章的時(shí)候,我們在Hadoop上存放的數(shù)據(jù)超過了2 PB,每天給它加載的數(shù)據(jù)超過10 TB。我們的Hadoop系統(tǒng)具有2400個(gè)內(nèi)核,大約9 TB的內(nèi)存,并且在一天之中的很多時(shí)間點(diǎn),這些硬件設(shè)備都是滿負(fù)荷運(yùn)行的。 國內(nèi)外研究現(xiàn)況及發(fā)展趨勢Raid HDFSHDFS-RAID 是Facebook基于hadoop-20-append分支(第一代Hadoop)開發(fā)的raid方案,就是對N個(gè)數(shù)據(jù)塊就行運(yùn)算,產(chǎn)生K個(gè)校驗(yàn)塊。這N+K個(gè)塊可以同時(shí)最多容忍K個(gè)塊的丟失,丟失的塊可以從其余的塊中的任意N個(gè)恢復(fù)出來。在HDFS-RAID里面,N叫做stripeLength,K叫做parityLe

3、ngth。國內(nèi)外研究現(xiàn)況及發(fā)展趨勢主要的發(fā)展趨勢:1.最小化I/O 數(shù)據(jù)恢復(fù)過程中需要大量訪問磁盤,因此,最小化I/O能夠帶來性能的提升2.最小化帶寬 在網(wǎng)絡(luò)受限或者帶寬是性能瓶頸的情況下,最小化帶寬的受益也是很大的3.并發(fā)恢復(fù) 并發(fā)恢復(fù)能夠極大提高恢復(fù)性能方案原理方案原理混合RAID容錯(cuò)機(jī)制 和 傳統(tǒng)RAID5容錯(cuò)機(jī)制,3-way三備份機(jī)制對比(以存儲(chǔ)ABCD四個(gè)塊為例)備份數(shù)量恢復(fù)讀取的塊的數(shù)目冗余備份數(shù)單節(jié)點(diǎn)故障需要讀取的塊數(shù)目混合RAID容錯(cuò)機(jī)制10個(gè)塊1個(gè)塊傳統(tǒng)RAID5容錯(cuò)機(jī)制5個(gè)塊4個(gè)塊3-way三備份容錯(cuò)機(jī)制12個(gè)塊1個(gè)塊方案設(shè)計(jì)當(dāng)某個(gè)節(jié)點(diǎn)故障時(shí),利用基于RAID1的修復(fù)方案來修復(fù)方案設(shè)計(jì)當(dāng)多個(gè)節(jié)點(diǎn)故障時(shí),首先利用基于RAID1的修復(fù)方案來修復(fù),再用基于RAID5的修復(fù)方案來修復(fù)。方案目標(biāo)功能目標(biāo)實(shí)現(xiàn)混合容錯(cuò)上的文件寫:機(jī)架間先RAID1機(jī)架內(nèi)再RAID5實(shí)現(xiàn)混合容錯(cuò)上的修復(fù)功能:單節(jié)點(diǎn)修復(fù)多節(jié)點(diǎn)修復(fù)性能目標(biāo):通過實(shí)驗(yàn),比較備份、RAID6和混合容錯(cuò)機(jī)制的恢復(fù)時(shí)間。通過設(shè)計(jì)單節(jié)點(diǎn)的機(jī)架內(nèi)修復(fù),來優(yōu)化混合機(jī)制下的修復(fù)性能課題研究進(jìn)度安排學(xué)期周次工作任務(wù)2016-2017第一學(xué)期文獻(xiàn)閱讀、翻譯基本環(huán)境的搭建、測試2016-2017第二學(xué)期第1周-第3周基本實(shí)現(xiàn)方案討論與確定第4周-第5周文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論