




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
主講:朱佳目錄01移動(dòng)數(shù)據(jù)02實(shí)現(xiàn)歸檔存儲移動(dòng)數(shù)據(jù)1移動(dòng)數(shù)據(jù)可以將數(shù)據(jù)從Hot存儲策略遷移到Warm存儲策略,然后再遷移到Cold存儲策略。請注意,可以將數(shù)據(jù)集的一個(gè)、兩個(gè)或所有副本移動(dòng)到不同的存儲層,以優(yōu)化對HDFS存儲容量的使用。可以在一種類型的存儲層上保留特定數(shù)據(jù)集的一些副本,其余的副本存儲在其他存儲類型上。訪問數(shù)據(jù)的應(yīng)用程序完全忽略使用多個(gè)存儲層的事實(shí)。由于ARCHIVE層被設(shè)計(jì)為不具有太多(或任何)處理能力,因此在提供DISK存儲的節(jié)點(diǎn)上運(yùn)行的mapper任務(wù)需要從提供ARCHIVE存儲的節(jié)點(diǎn)讀取數(shù)據(jù)。這當(dāng)然意味著集群會產(chǎn)生額外的網(wǎng)絡(luò)流量用來移動(dòng)數(shù)據(jù)。移動(dòng)數(shù)據(jù)以下是存儲策略工作原理的總結(jié):當(dāng)更新文件或目錄的存儲策略時(shí),HDFS不會自動(dòng)強(qiáng)制執(zhí)行新的存儲策略。不僅可以在創(chuàng)建文件時(shí)強(qiáng)制執(zhí)行存儲策略,也可以在以后執(zhí)行。首次在集群中存儲數(shù)據(jù)時(shí),存儲在默認(rèn)的DISK層中。基于數(shù)據(jù)的分類(由配置的存儲策略指定),一個(gè)或多個(gè)副本將隨時(shí)間的推移被移動(dòng)到ARCHIVE層。移動(dòng)數(shù)據(jù)新mover工具可以將數(shù)據(jù)從一個(gè)存儲層移動(dòng)到另一個(gè)存儲層。它的工作原理與HDFS平衡器非常相似,只不過它是在不同的存儲類型之間移動(dòng)塊副本??梢允褂胢over工具掃描HDFS文件,以確定塊位置是否與配置的存儲策略匹配。如果一個(gè)塊未根據(jù)配置的存儲策略存放,則mover會將副本移動(dòng)到相應(yīng)的存儲類型。可以如下使用mover工具遷移集群中的數(shù)據(jù):$hdfsmover[-p<files/dirs>l-f<localfilename>]mover移動(dòng)數(shù)據(jù)此命令將根目錄(/)作為默認(rèn)路徑。mover命令的關(guān)鍵選項(xiàng)說明如下:可以使用-p選項(xiàng)指定HDFS文件或目錄的遷移列表,該選項(xiàng)接受以空格分隔的文件和目錄列表。還可以使用包含HDFS文件和目錄列表的本地文件來遷移數(shù)據(jù),使用–f選項(xiàng)指定該文件。除了HDFS路徑和目標(biāo)參數(shù)之外,mover還接受replicacount作為參數(shù)。移動(dòng)數(shù)據(jù)可以定期運(yùn)行mover,將所有文件遷移到使用存儲策略配置的存儲類型中。如果將某些數(shù)據(jù)劃歸為ARCHIVE存儲類型,但隨后發(fā)現(xiàn)使用此數(shù)據(jù)的應(yīng)用程序使用的頻率遠(yuǎn)超出了預(yù)期,則可以將該數(shù)據(jù)重新分類為“Hot”或“Warm”數(shù)據(jù)。可以將一個(gè)或多個(gè)副本移動(dòng)到更快的DISK存儲,而不會帶來從ARCHIVE節(jié)點(diǎn)讀取數(shù)據(jù)所造成的額外網(wǎng)絡(luò)開銷。假設(shè)管理員將Cold存儲策略應(yīng)用于要存儲在歸檔存儲層節(jié)點(diǎn)上的數(shù)據(jù)集。由于數(shù)據(jù)集已經(jīng)存在,因此mover通過將歸檔數(shù)據(jù)從Warm存儲轉(zhuǎn)移到Cold存儲來實(shí)施Cold存儲策略。將所有冷數(shù)據(jù)移入Hadoop歸檔存儲是一個(gè)很好的做法。實(shí)現(xiàn)歸檔存儲2實(shí)現(xiàn)歸檔存儲可以在每個(gè)DataNode上單獨(dú)設(shè)置歸檔存儲。步驟如下。1.停止DataNode:$HADOOP_PREFIX/sbin/hadoop-daemon.shstopdatanode2.在hdfs-site.xml文件中指定.dir參數(shù)將歸檔存儲類型分配給DataNode。由于DISK是默認(rèn)存儲類型,因此不必設(shè)置DISK存儲類型。但是,如果指定DataNode使用ARCHIVE存儲,則必須在本地文件系統(tǒng)路徑的開頭插入[ARCHIVE],如下所示:<property><name>dfs.data.dir</name><value>[ARCHIVE]file:///u01/data/dfs/</value></property>實(shí)現(xiàn)歸檔存儲3.使用-setstoragePolicy命令設(shè)置存儲策略,如下所示:$hdfsdfsadmin-setstoragePolicy/cold1COLD4.啟動(dòng)DataNodehadoop-daemon.shstartda
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 拍賣平臺合作協(xié)議
- 壁畫繪制服務(wù)合同
- 提升免疫力的養(yǎng)生方法
- 頭盔交通安全
- 阿勒泰地區(qū)2024-2025學(xué)年數(shù)學(xué)三下期末達(dá)標(biāo)檢測試題含解析
- 阿爾山市2025屆三年級數(shù)學(xué)第二學(xué)期期末達(dá)標(biāo)檢測模擬試題含解析
- 隴南師范高等??茖W(xué)?!吨袊饨皇贰?023-2024學(xué)年第二學(xué)期期末試卷
- 強(qiáng)化管理創(chuàng)建一流
- 陜西國際商貿(mào)學(xué)院《中國古代文學(xué)作品選與中學(xué)語文(一)》2023-2024學(xué)年第二學(xué)期期末試卷
- 陜西學(xué)前師范學(xué)院《西方音樂史與作品欣賞(二)》2023-2024學(xué)年第一學(xué)期期末試卷
- 腰痛的中醫(yī)適宜技術(shù)
- 2024年電力交易員(高級工)職業(yè)鑒定理論考試題庫(單選題、多選題、判斷題)
- GA/T 2133.2-2024便攜式微型計(jì)算機(jī)移動(dòng)警務(wù)終端第2部分:安全監(jiān)控組件技術(shù)規(guī)范
- 婦科三基考試題
- 畢業(yè)設(shè)計(jì)-基于stm32的智能小車設(shè)計(jì)
- 淋巴水腫相關(guān)知識及治療(手法引流及繃帶包扎)
- 股票賬戶托管合同
- 富血小板血漿(PRP)簡介
- 人教版(2019)必修第二冊高一化學(xué)練習(xí)第五章第二節(jié)氮及其化合物鞏固與檢測(附參考答案)
- “沾化冬棗”優(yōu)勢特色產(chǎn)業(yè)培育方案(2021-2025年)
- 配音技巧知識課件
評論
0/150
提交評論