




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
副研究員博士 主要需求和目標(biāo)實(shí)現(xiàn)為程序員隱藏系統(tǒng)層細(xì)需要考慮的細(xì)節(jié)技術(shù)問(wèn)題如何管理 數(shù)據(jù)?如何劃分?jǐn)?shù)據(jù)如何調(diào)度計(jì)算任務(wù)并分配map和reduce節(jié)點(diǎn)如果節(jié)點(diǎn)間需要共享或交換數(shù)據(jù)如何如何掌控節(jié)點(diǎn)的執(zhí)行完成情況?如何收集中間和最終的結(jié)果節(jié)點(diǎn)失效如何處理?如何恢復(fù)數(shù)節(jié)點(diǎn)擴(kuò)充后如何保證原有程序仍能正常運(yùn) 系統(tǒng)性能提升 TextText1:theweatheris Text2:todayisText3:goodweatheris Text4:todayhasgoodString[]text=args[0];HashTableht=newHashTable();for(i=0;i<3;++i){StringTokenizerst=newStringTokenizer(text[i]);while(st.hasMoreTokens()){Stringword=if(!ht.containsKey(word)){ht.put(word,newInteger(1));}else{intwc((Integer)ht.get(word)).intValue()+1;//計(jì)數(shù)加1ht.put(word,new}}}for(Iteratoritr=ht.KeySet().iterator();itr.hasNext();{Stringword=System.out.print(word+“:”+ }輸出:good: has:1;is: the: today: weather:
鍵值
鍵值
海量數(shù)
鍵值
初始鍵值
Barrier:AggregationBarrier:Aggregationand
中間結(jié)
計(jì)算結(jié)MapReducemap:(k1;v1)→[(k2;reduce:(k2;[v2])→[(k3;)][最終的某種形式的結(jié)果輸出[(k3;v3)]輸出:最終輸出結(jié)果[(k3;使用4個(gè)map節(jié)點(diǎn)map節(jié)點(diǎn)輸入:(text1theweatheris輸出:(the1weather1(is1(goodmap節(jié)點(diǎn)輸入:(text2todayismap節(jié)點(diǎn)map節(jié)點(diǎn)reduce節(jié)點(diǎn)輸入:(good,1),(good,1),(good,1),(good1),(good(is,1),(is,輸出(is,1),(is,輸出good:is:3weather:reduce節(jié)點(diǎn)輸入:(has,1),輸出:(has,1),(is,輸入:(the,1),today1),(today,(weather,1),(weather,1),(weather,輸出:(the,1),(today,2),weatherreduce節(jié)點(diǎn)輸入:(good,1),(good,1),(good,2)(good,(is,1),(is,輸出(is,1),(is,輸出good:is:3weather:reduce節(jié)點(diǎn)輸入:(has,1),輸出:(has,1),(is,輸入:(the,1),today1),(today,(weather,1),(weather,1),(weather,輸出:(the,1),(today,2),weatherHadoop:Mapper&ReducerHadoop:DriverHadoop:Run HadoopMapReducesplitsplitsplitsplit
partpartpartpartsplitsplitReducershas3primaryphases:shuffle,sortandHadoop:HowmanyTasksetuptakesawhile,soitisbestifthemapstakeatleastaminuteto用戶(hù)可以顯示配置Configuration.set(MRjobConfig.NUM_MAPSintbutitonlyprovidesahinttotheframework10TBofinputdata,blocksizeisYouwillendupwith80KHadoop:HowmanyThenumberofreducersforthejobissetbytheuserTherightnumberofreducesseemstobe0.95or1.75multipliedby(<no.of<no. umcontainersperWith0.95allofthereducescanlaunch yandstarttransferringmapoutputsthemapsWith1.75thefasternodeswillfinishtheirfirstroundofreducesandlaunchasecondwave ngamuchbetterjobofloadIncreasingthenumberofreducesincreasestheframeworkoverhead,butloadbalancingandlowersthecostofHadoop:PartitionercontrolsthepartitioningofthekeysoftheintermediateThetotalnumberofpartitionsisthesameasthenumberofreducetasksforthejob.Hencethiscontrolswhichofthemreducetaskstheintermediatekey(andhencetherecord)issenttoforreductionHashPartitioneristhedefaultHadoop:JobJobrepresentsaMapReducejobJobistheprimaryinterfaceforausertodescribeaMapReducejobtoHadoopframeworkforJobistypicallyusedtoHadoop:JobOptionally,JobisusedtospecifyotheradvancedfacetsofthejobsuchFilestobeputintheWhetherintermediateand/orjoboutputsaretobecompressed(andWhetherjobtaskscanbeexecutedinaspeculativeumnumberofattemptsperUserscanuseConfiguration.set(String,String)/Configuration.get(String)toset/getarbitraryparametersneededbyapplicationsCountersrepresentglobalCounterscouldbedefinedMapReduceInthemapand/orreducemethods,applicationscandefinearbitraryCounters(oftypeEnum)andupdatethemvia:Counters.incrCounter(Enum,Counters.incrCounter(String,String,ThesecountersarethengloballyaggregatedbytheHadoop:CurrentlyFileInputFormat,TextInputFormat,SequenceFileInputFormat,CombineFileInputFormat,CombineSequenceFileInputFormat,CombineTextInputFormat,CompositeInputFormat,FixedLengthInputFormat,SequenceFileAsBinaryInputFormat,Seq
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于調(diào)酒師考試的流行飲品新趨勢(shì)-試題及答案
- 2002專(zhuān)業(yè)設(shè)計(jì)合同范例
- 公司訂立合同樣本作用
- 個(gè)人兼職會(huì)計(jì)勞務(wù)合同樣本
- 亞鋁型材訂單合同樣本
- 修補(bǔ)房子合同標(biāo)準(zhǔn)文本
- 2025企業(yè)內(nèi)部股權(quán)轉(zhuǎn)讓合同爭(zhēng)議
- 簡(jiǎn)單抵押的合同范本
- 2025至2030年中國(guó)單軸自動(dòng)裁切機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)單相多功能電能表檢定裝置市場(chǎng)調(diào)查研究報(bào)告
- 2024年 中國(guó)人壽保險(xiǎn)股份有限公司招聘筆試參考題庫(kù)含答案解析
- 2023年浙江衢州柯城區(qū)選調(diào)公務(wù)員事業(yè)單位工作人員35人歷年高頻難易度、易錯(cuò)點(diǎn)模擬試題(共500題)附帶答案詳解
- 氟喹諾酮類(lèi)藥物合理使用規(guī)范
- 風(fēng)濕免疫疾病的多學(xué)科綜合診斷與治療
- 中國(guó)近代史人物介紹孫中山
- 腎癌切除術(shù)后護(hù)理查房課件
- 用戶(hù)體驗(yàn)測(cè)試方案
- 消防車(chē)輛采購(gòu)?fù)稑?biāo)方案(技術(shù)標(biāo))
- 農(nóng)產(chǎn)品食品檢驗(yàn)員(三級(jí)高級(jí)工)技能鑒定備考(重點(diǎn))題庫(kù)及答案
- 人教版小學(xué)道德與法治《開(kāi)天辟地的大事變》教學(xué)設(shè)計(jì)
- 《極致挑逗:雙人共撫全圖解120招》讀書(shū)筆記模板
評(píng)論
0/150
提交評(píng)論