存儲備份技術(shù)探析_第1頁
存儲備份技術(shù)探析_第2頁
存儲備份技術(shù)探析_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、存儲備份技術(shù)探析摘要:隨著互聯(lián)網(wǎng)絡(luò)飛速發(fā)展,數(shù)據(jù)量呈現(xiàn)海量增長,單機存儲無法滿足需求,分布式存儲 m運而生并且取得了較人的發(fā)展。系統(tǒng)屮的數(shù)據(jù)由于自然災(zāi)害、異常故障等原因會遭到破壞, 因而需要對數(shù)據(jù)進行備份加以保護。以基于分布式文件服務(wù)器的存儲備選份恢復(fù)系統(tǒng)為研究 對象,探討了分布式存儲下海量數(shù)據(jù)備份恢復(fù)的關(guān)鍵問題:存儲備份恢復(fù)的高效性、一-致性 和可靠性。 關(guān)鍵詞:備份;存儲;分布式;p2p;技術(shù)1存儲與備份技術(shù)的高效性1. 1高性能多源下載過程(1)服務(wù)器根據(jù)和關(guān)信息返回存儲需要下載文件的slave的貝體信息;(2)根據(jù)文件大小和slave的負載狀態(tài),選擇合適的slave建立 socket連

2、接對文件進行分塊下載;(3)下載完成后把各個文件塊合并成為原始文件。1.2靜態(tài)下載在靜態(tài)下載中,不考慮備份文件的大小,服務(wù)器的負荷雖,采取統(tǒng)一的模型進行下載。算法如下:(1)得到備份文件所在服務(wù)器的個數(shù)n,以及每個服務(wù)器的ip地 址和端口號;(2)得到文件的總大小size,按照文件分割算法,把文件分割為n塊;(3)與 每個服務(wù)器建立連接,從每個服務(wù)器上下載一塊文件;(4)卞載完成后,把所有文件塊合并 成一個完整的文件,存儲在備份介質(zhì)上;(5)保存?zhèn)浞菸募南嚓P(guān)元數(shù)據(jù)信息;(6)文件下載、備份完成。1.3動態(tài)下載在動態(tài)下載模型小,要綜合考慮各方面因素,動態(tài)決定文件是否分塊進行多源下載,以及文件塊

3、的大小,提高系統(tǒng)資源利用率,進而提高 備份效率。對于沒有冗余的文件,只能從一個節(jié)點上下載。対于較小的文件,使用單線程卞 載;對于較大的文件,可以采用多線程下載。對于有多個冗余的文件,可以動態(tài)選取從負荷 量較低的節(jié)點進行下載。偽算法表示如下:首先定義如下變量:文件大小閥值t1,當(dāng)文件大小大于t1時釆用多源下載;節(jié)點標(biāo)準(zhǔn)負荷t2,若節(jié)點負荷大于t2,則節(jié)點處于重負 荷狀態(tài);文件大小size文件冗余數(shù)no算法表示如下:if (文件沒有冗余)無須分塊下載,可以采用多線程從存儲文件的節(jié)點上下載文件;elseif (文件大小size<閥值t1) 無須多源卜-載,從存儲文件的節(jié)點中選取負荷最小

4、的節(jié)點,下載文件; elsel得到存儲文件的n個節(jié)點的信息;從n個節(jié)點上選擇負荷小于閥值t2的節(jié)點,節(jié)點數(shù)目為哄利用文件分割算法把文件分割為m塊;與選屮的m個節(jié)點建立連接,從每個節(jié)點上下載一個文件塊;下載完成后,把m個文件塊合并成為完整的文件;把文件存儲在備份介質(zhì);2存儲與備份技術(shù)的一致性2.1鎖和快照技術(shù)鎖就是當(dāng)進行數(shù)據(jù)備份時,對需要備份的數(shù)據(jù)加鎖,此時禁止對數(shù)據(jù)進行修改。由丁備份時禁止對數(shù)據(jù)的修改,鎖技術(shù)對數(shù)據(jù)的可用性會造成一定的影響,會影響到系統(tǒng)的效率。快照 就是在相當(dāng)短的時間內(nèi)生成原存儲系統(tǒng)的瞬時映像,該映像生成之后,備份就可以根據(jù)該映 像來進行,而不用擔(dān)心數(shù)據(jù)的不一致性??煺占夹g(shù)的實

5、現(xiàn)有兩種方式:更新復(fù)制方式和 split-mirror方式。更新復(fù)制技術(shù)就是當(dāng)進行快照時,并不立刻復(fù)制數(shù)據(jù),只有當(dāng)數(shù)據(jù)發(fā)生 變化時才進行復(fù)制。split-mirror是使用和主存儲系統(tǒng)一樣的快照存儲系統(tǒng),數(shù)據(jù)同時保存 在主存儲系統(tǒng)和快照系統(tǒng),此時快照系統(tǒng)就可作為備份數(shù)據(jù)。 2.2在線備份 在 分布式文件訪問平臺中,存在著海量的文件,文件的信息較多,若把文件的信息逐個復(fù)制則 要浪費人量的時間、空間,對系統(tǒng)的可訪問性造成影響。wafl文件系統(tǒng)使川了更新復(fù)制技術(shù)。 當(dāng)創(chuàng)建系統(tǒng)快照時,并不立刻復(fù)制所有文件信息,而是創(chuàng)建新的快照根節(jié)點,它與原文件系 統(tǒng)根節(jié)點冇相同的信息,文件系統(tǒng)中根節(jié)點的了節(jié)點也為快照

6、根節(jié)點的了節(jié)點。此時以快照 根節(jié)點為根節(jié)點生成了一棵快照樹,它和原文件系統(tǒng)樹除了根節(jié)點以外,其余部分相同。當(dāng) 文件信息需要修改時,創(chuàng)建新的節(jié)點,把文件信息賦給此節(jié)點,并把節(jié)點作為快照節(jié)點插入 快照樹中,同時修改原節(jié)點的信息,具體分為以下情況: (1)修改文件信息:當(dāng)對文件的基本信息進行修改時,如更改文件名稱等,此種情況下比較簡單,偽算法如下:if修改文件) 創(chuàng)建新的節(jié)點作為快照節(jié)點; 把原節(jié)點的信息復(fù)制 到快照節(jié)點; 把快照樹中指向原節(jié)點的指針指向快照節(jié)點; 快照節(jié)點兒子節(jié)點 的指針指向原節(jié)點的兒了節(jié)點; 修改原節(jié)點的信息; 修改文件信息具體 過程如圖3: (2)移動文件:當(dāng)把文件或者目錄從一

7、個目錄移動到另外一個目錄 下時,具體偽算法如下: if移動文件) 創(chuàng)建新的快照節(jié)點; 把 原節(jié)點的信息復(fù)制到快照節(jié)點; 復(fù)制原父h錄的信息,添加到快照樹中; 把快 照樹中指向原節(jié)點的指針指向快照節(jié)點; 快照節(jié)點兒子節(jié)點的指針指向原節(jié)點的兒子 節(jié)點; 復(fù)制新父目錄的信息,修改子節(jié)點,添加到快照樹屮; 修改原節(jié)點的信 息,把原節(jié)點移動到新的忖錄下; 移動文件過程如圖4所示: (3) 新建文件:當(dāng)新建文件時,具體偽算法如下: if (新建文件) 創(chuàng)建新的 節(jié)點,并給節(jié)點賦予相應(yīng)的文件信息; 在文件系統(tǒng)樹屮找到節(jié)點的父目錄; if (若父目錄己經(jīng)創(chuàng)建了副本), 把創(chuàng)建的節(jié)點插在文件系統(tǒng)樹小父目錄節(jié)點下

8、; else 父h錄創(chuàng)建副木; 副本賦予相應(yīng)的信息; 父冃錄副本兒子節(jié)點即為父目錄的兒子節(jié)點;快照樹中指向原來父目錄的指針指向副本;2.3備份的實現(xiàn)在創(chuàng)建好快照樹之后,就可以進行在線備份。快照樹保存的信息就是開始備份瞬間所有文件的信息,進行在線備份時,首先從快照樹的根節(jié)點開 始,逐個訪問節(jié)點,按順序?qū)煺諛溥M行遍丿力、備份,保證了數(shù)據(jù)的一-致性,并且可以在備 份的同時允許對數(shù)據(jù)進行修改,不影響用戶的訪問。3存儲與備份的可靠性在分布式系統(tǒng)屮存儲著海量的數(shù)據(jù),數(shù)據(jù)量人,備份的時間較長,在備份的過程屮町能會岀 現(xiàn)錯誤情況或者發(fā)生意外的屮斷。因此備份過程屮需要隨時記錄備份的進度,這樣在備份發(fā) 生錯誤或

9、者異常時,下次備份能夠在上次備份的出錯點繼續(xù)進行,實行斷點備份,而不用重 新開始備份。斷點備份過程中,使用日,忐表來記錄備份過程,把每次備份的信息寫入hl志表。 日志表如表1:3.1偽算法if (h志表為空) 無須查找斷點位置,直接開始備份,備份時把每一個文件的備份信息添加到h志花 elsewhile (日志表尚未查找完畢)對于表中每一項,查找此項對應(yīng)文件在樹中的具體位置;if (此文件尚未備份完成)記錄此文件,即為斷點位置;當(dāng)fi志表查找完成后,即可得到未備份完成的文件;從斷點位置開始繼續(xù)備份,并把文件備份信息添加到日志表; 木次備份完成后把日志表清空名稱定義 id文件獨一無二的id typ

10、e備份類型,可以是完全備份、增量備份、差量備 份 stary_t1me開始備份時間 finished是否完成 1sf0lder是否為文件夾parent1d文件父節(jié)點1d 3. 2算法復(fù)雜度若h志表屮的記錄個數(shù)為k,文件總數(shù)為n。則對于每一個記錄項,要查找其在文件樹中的位置,當(dāng)前一個記錄項查找到時,市于遍歷 的順序性,示一個記錄項可以從前一個的位置繼續(xù)向后查找,這樣,可以保證k個記錄項杏 找次數(shù)為k,也即為0(n)。當(dāng)備份發(fā)生錯誤或者中斷時,通過此算法,能夠在相當(dāng)少的時間 內(nèi),找到斷點位置,下一次備份吋可以直接從斷點位置繼續(xù)進行,實現(xiàn)斷點備份,保證了備京:機械工業(yè)出版社,2007.2張聯(lián)峰,劉乃安,張玉清.p2p技術(shù)j.計算機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論