




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1基于Hadoop的云存儲 隨時(shí)隨地訪問您的應(yīng)用2云存儲的數(shù)據(jù)管理特點(diǎn)與挑戰(zhàn)特點(diǎn)挑戰(zhàn)計(jì)算資源是可伸縮的數(shù)據(jù)具有備份數(shù)據(jù)存儲在大量分布的節(jié)點(diǎn)之上數(shù)據(jù)的自我管理和自調(diào)優(yōu)基于大量節(jié)點(diǎn)的查詢優(yōu)化算法基于大量節(jié)點(diǎn)的索引結(jié)構(gòu)資源調(diào)度和負(fù)載均衡多租戶情況3我們面臨的問題您如何來管理大量的應(yīng)用程序?運(yùn)行任務(wù)來處理100百萬兆字節(jié)的數(shù)據(jù)花費(fèi)11天在一臺電腦上讀取數(shù)據(jù)需要大量低價(jià)的計(jì)算機(jī)故障處理速度問題(15分鐘修復(fù)1000臺計(jì)算機(jī)),但可靠性問題在大型計(jì)算機(jī)集群中,每天都有計(jì)算機(jī)出現(xiàn)故障集群的規(guī)模不斷變化需要通用的基礎(chǔ)架構(gòu)必須是高效且可靠的4解決方案開源的Apache項(xiàng)目Hadoop主要包括:Distribut
2、ed 分布的數(shù)據(jù)Map/Reduce 分布的應(yīng)用程序使用Java開發(fā)運(yùn)行在 Linux, Mac OS/X, Windows, and Solaris廉價(jià)的硬件設(shè)備5Typically in 2 level architectureNodes are commodity PCs40 nodes/rackUplink from rack is 8 gigabitRack-internal is 1 gigabit Hardware Cluster of Hadoop6Distributed Single namespace for entire clusterManaged by a singl
3、e namenode.Files are single-writer and append-only.Optimized for streaming reads of large files.Files are broken in to large blocks.Typically 128 MBReplicated to several datanodes, for reliabilityAccess from Java, C, or command line.7Block PlacementDefault is 3 replicas, but settableBlocks are place
4、d (writes are pipelined):On same nodeOn different rackOn the other rackClients read from closest replicaIf the replication for a block drops below target, it is automatically re-replicated.8How is Yahoo using Hadoop?Started with building better applicationsScale up web scale batch applications (sear
5、ch, ads, )Factor out common code from existing systems, so new applications will be easier to writeManage the many clusters9Running Production WebMapSearch needs a graph of the “known” webInvert edges, compute link text, whole graph heuristicsPeriodic batch job using Map/ReduceUses a chain of 100 ma
6、p/reduce jobsScale1 trillion edges in graphLargest shuffle is 450 TBFinal output is 300 TB compressedRuns on 10,000 coresRaw disk used 5 PB10Terabyte Sort BenchmarkStarted by Jim Gray at Microsoft in 1998Sorting 10 billion 100 byte recordsHadoop won the general category in 209 seconds910 nodes2 quad
7、-core Xeons 2.0Ghz / node4 SATA disks / node8 GB ram / node1 gb ethernet / node40 nodes / rack8 gb ethernet uplink / rackPrevious records was 297 seconds11Hadoop clustersWe have 20,000 machines running HadoopOur largest clusters are currently 2000 nodesSeveral petabytes of user data (compressed, unreplicated)We run hundreds of thousands of jobs every month12Research Cluster Usage13Who Uses Hadoop?Amazon/A9AOLFacebookFox
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國炊具市場發(fā)展現(xiàn)狀及前景趨勢分析報(bào)告
- 2025-2030年中國汽車剎車鉗市場發(fā)展趨勢規(guī)劃分析報(bào)告
- 科技產(chǎn)品開發(fā)中的專利保護(hù)策略研究
- 2025-2030年中國桂圓市場運(yùn)行動態(tài)及發(fā)展建議分析報(bào)告
- 2025-2030年中國智能機(jī)器人行業(yè)運(yùn)營狀況與投資戰(zhàn)略研究報(bào)告
- 2025-2030年中國無機(jī)酸制造行業(yè)市場運(yùn)行趨勢及發(fā)展戰(zhàn)略研究報(bào)告
- 2025-2030年中國插秧機(jī)市場發(fā)展?fàn)顩r及營銷戰(zhàn)略研究報(bào)告
- 2025-2030年中國廢棄資源行業(yè)發(fā)展動態(tài)規(guī)劃分析報(bào)告
- 2025-2030年中國富鈰氯化稀土行業(yè)十三五規(guī)劃及投資戰(zhàn)略研究報(bào)告
- 2025-2030年中國外指紋考勤機(jī)行業(yè)發(fā)展現(xiàn)狀與前景趨勢研究報(bào)告
- 數(shù)據(jù)結(jié)構(gòu)英文教學(xué)課件:chapter7 Searching
- 護(hù)理核心制度及重點(diǎn)環(huán)節(jié)-PPT課件
- 夾套管現(xiàn)場施工方法
- 部編版語文五年級下冊形近字組詞參考
- 經(jīng)銷商授權(quán)協(xié)議合同書(中英文對照)
- 第三章走向混沌的道路
- 化探野外工作方法及要求
- 2006年事業(yè)單位工資改革工資標(biāo)準(zhǔn)表及套改表2
- 江蘇省特種設(shè)備安全條例2021
- 青島海洋地質(zhì)研究所公開招聘面試答辯PPT課件
- 常見導(dǎo)管的固定與維護(hù)PPT課件
評論
0/150
提交評論