




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Hadoop技術(shù)2017薛喬毓1.
2.
3.
4.Hadoop架構(gòu)HDFS通信原理HDFS
APIMR
WordCount目錄CONCENTS01Hadoop架構(gòu)大數(shù)據(jù)時代大數(shù)據(jù)時代來源Hadoop作為Apache基金會資助的開源項目,由DougCutting帶領(lǐng)的團(tuán)隊進(jìn)行開發(fā),基于Lucene和Nutch等開源項目,實現(xiàn)了Google的GFS和Hadoop能夠穩(wěn)定運(yùn)行在20個節(jié)點(diǎn)的集群;2006年1月,DougCutting加入雅虎公司,同年2月ApacheHadoop項目正式支持HDFS和MapReduce的獨(dú)立開發(fā)。同時,新興公司Cloudera為Hadoop提供了商業(yè)支持,幫助企業(yè)實現(xiàn)標(biāo)準(zhǔn)化安裝,并志愿貢獻(xiàn)社區(qū)。
揭開面紗主要組成:分布式文件系統(tǒng)HDFS和MapReduce計算框架作者:Doung
CuttingHadoop是一個開源的、可靠的、可擴(kuò)展的分布式并行計算框架語言:Java、支持多種編程語言、如Python、C++等生態(tài)圈特點(diǎn)Hadoop主要在多節(jié)點(diǎn)集群環(huán)境下以數(shù)據(jù)存儲為基礎(chǔ)最大限度兼容結(jié)構(gòu)化數(shù)據(jù)格式以數(shù)據(jù)處理為目的其數(shù)據(jù)操作技術(shù)多樣化
Hadoop構(gòu)成分布式存儲系統(tǒng)HDFS(Hadoop
Distributed
File
System)高可靠性高擴(kuò)展性高吞吐性資源管理系統(tǒng)Yarn(Yet
Another
Resource
Nogitator)負(fù)責(zé)集群資源的統(tǒng)一管理和調(diào)度分布式計算框架MapReduce高可靠性高可靠性高可靠性
HDFS
YARN
Map
ReduceMap:對一些獨(dú)立元素組成的列表的每一個元素進(jìn)行指定的操作,可以高度并行Reduce:對一個列表的元素進(jìn)行合并一個簡單的MapReduce程序只需要指定Map()、Reduce()、輸入和輸出,剩下的事由框架幫你搞定內(nèi)核構(gòu)成MapReduce(分布式離線計算框架)HDFS(分布式文件系統(tǒng))YARN(集群資源管理系統(tǒng))部署模式單機(jī)模式:只有一個JVM進(jìn)程,沒有分布式,通常用于調(diào)試偽分布式模式:只有一臺機(jī)器,每個Hadoop守護(hù)進(jìn)程都是一個獨(dú)立的JVM進(jìn)程完全分布式模式:運(yùn)行于多臺機(jī)器上,真實環(huán)境02通信機(jī)制HDFS架構(gòu)圖術(shù)語NameNode主節(jié)點(diǎn),存儲文件的元如文件名,文件目錄結(jié)構(gòu),文件屬性(生成時間,副本數(shù),文件權(quán)限)以及每個文件的塊列表和塊所在的DataNode等。DataNode分布式文件系統(tǒng)中的每一個文件,都被切分成若干個數(shù)據(jù)塊,每一個數(shù)據(jù)塊都被存儲在不同的服務(wù)器上,此服務(wù)器稱之為數(shù)據(jù)服務(wù)器。SecondaryNameNode用來監(jiān)控HDFS狀態(tài)的輔助后臺程序,每隔一段時間獲取HDFS元數(shù)據(jù)的快照。Block每個文件都會被切分成若干個塊(默認(rèn)128MB)每一塊都有連續(xù)的一段文件內(nèi)容,是存儲的基本單位。HDFS讀文件HDFS寫文件Secondary
NameNodeHDFS架構(gòu)圖03HDFS
APIHDFS
Shell調(diào)用文件系統(tǒng)Shell命令使用bin/hdfsdfs的形式查看根目錄:hdfsdfs–ls/創(chuàng)建文件:hdfsdfs–touchz/文件名刪除文件:hdfsdfs–rm/文件名上傳文件:hdfsdfs–put/localPath/查看文件:hdfsdfs–cat/文件名追加文件內(nèi)容:hdfsdfs–appendToFile/localPath/文件名管理命令:hdfsdfsadmin查看集群的命令:hdfsdfsadmin-report04WordCountMORETHANTEMPLATEClickheretoaddyoutothecenterofthenarrativeThoughtClickheretoaddyoutothecenterofthenarrativethoughtClickheretoaddyoutothecenterofthenarrativethoughtMORETHANTEMPLATEClickheretoaddyoutothecenterofthenarrativeThoughtClickheretoaddyoutothecenterofthenarrativethoughtClickheretoaddyoutothecenterofthenarrativethoughtMORETHANTEMPLATEClickheretoaddyoutothecenterofthenarrativeThoughtClickheretoaddyoutothecenterofthenarrativethoughtClickheretoaddyoutothecenterofthenarrativethought輸入標(biāo)題KEYWORDKEYWORDKEYWORDKEYWORD
MORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethought
MORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethought
MORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethought
MORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethought輸入標(biāo)題MORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethoughtMORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethoughtMORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethoughtMORETHANTEMPLATEClickheretoaddyoutotheCenterofthenarrativethoughtMORETHANT
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度產(chǎn)品召回風(fēng)險承擔(dān)協(xié)議書
- 2025年度生物科技私下股份分配與成果轉(zhuǎn)化協(xié)議書
- 2025年度再婚家庭婚姻和解及子女撫養(yǎng)協(xié)議
- 2025年度企業(yè)年鑒圖文編纂及出版協(xié)議
- 2025年度安防系統(tǒng)智能化升級與維護(hù)合同
- 2025年度企業(yè)內(nèi)部控制體系建設(shè)咨詢合同模板
- 旅游景區(qū)民宿租賃居間合同
- 2025年度保險銷售人員勞動合同解除與賠償規(guī)范
- 2025年度三年勞動合同漲薪與員工職業(yè)規(guī)劃輔導(dǎo)合同
- 2025年度雙方經(jīng)濟(jì)糾紛一次性解決及確認(rèn)協(xié)議
- 鑄牢中華民族共同體意識主題班會教案
- 第2章導(dǎo)游(課件)《導(dǎo)游業(yè)務(wù)》(第五版)
- 成品倉主管述職報告
- 血液透析誘導(dǎo)期健康宣教
- 第十六章二次根式單元復(fù)習(xí)題-2023-2024學(xué)年人教版八年級數(shù)學(xué)下冊
- 2023-2024新版北師大七年級數(shù)學(xué)下冊全冊教案
- 風(fēng)電場升壓站培訓(xùn)課件
- 無人機(jī)固定翼行業(yè)報告
- 小區(qū)門窗拍攝方案
- 初中歷史期中考試分析報告
- 企業(yè)反商業(yè)賄賂法律法規(guī)培訓(xùn)
評論
0/150
提交評論