![云計算-cloud l主要需求和目標_第1頁](http://file4.renrendoc.com/view/3d4c1921f377c4044f322aacb00199a2/3d4c1921f377c4044f322aacb00199a21.gif)
![云計算-cloud l主要需求和目標_第2頁](http://file4.renrendoc.com/view/3d4c1921f377c4044f322aacb00199a2/3d4c1921f377c4044f322aacb00199a22.gif)
![云計算-cloud l主要需求和目標_第3頁](http://file4.renrendoc.com/view/3d4c1921f377c4044f322aacb00199a2/3d4c1921f377c4044f322aacb00199a23.gif)
![云計算-cloud l主要需求和目標_第4頁](http://file4.renrendoc.com/view/3d4c1921f377c4044f322aacb00199a2/3d4c1921f377c4044f322aacb00199a24.gif)
![云計算-cloud l主要需求和目標_第5頁](http://file4.renrendoc.com/view/3d4c1921f377c4044f322aacb00199a2/3d4c1921f377c4044f322aacb00199a25.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
副研究員博士 主要需求和目標實現(xiàn)為程序員隱藏系統(tǒng)層細需要考慮的細節(jié)技術問題如何管理 數(shù)據(jù)?如何劃分數(shù)據(jù)如何調度計算任務并分配map和reduce節(jié)點如果節(jié)點間需要共享或交換數(shù)據(jù)如何如何掌控節(jié)點的執(zhí)行完成情況?如何收集中間和最終的結果節(jié)點失效如何處理?如何恢復數(shù)節(jié)點擴充后如何保證原有程序仍能正常運 系統(tǒng)性能提升 TextText1:theweatheris Text2:todayisText3:goodweatheris Text4:todayhasgoodString[]text=args[0];HashTableht=newHashTable();for(i=0;i<3;++i){StringTokenizerst=newStringTokenizer(text[i]);while(st.hasMoreTokens()){Stringword=if(!ht.containsKey(word)){ht.put(word,newInteger(1));}else{intwc((Integer)ht.get(word)).intValue()+1;//計數(shù)加1ht.put(word,new}}}for(Iteratoritr=ht.KeySet().iterator();itr.hasNext();{Stringword=System.out.print(word+“:”+ }輸出:good: has:1;is: the: today: weather:
鍵值
鍵值
海量數(shù)
鍵值
初始鍵值
Barrier:AggregationBarrier:Aggregationand
中間結
計算結MapReducemap:(k1;v1)→[(k2;reduce:(k2;[v2])→[(k3;)][最終的某種形式的結果輸出[(k3;v3)]輸出:最終輸出結果[(k3;使用4個map節(jié)點map節(jié)點輸入:(text1theweatheris輸出:(the1weather1(is1(goodmap節(jié)點輸入:(text2todayismap節(jié)點map節(jié)點reduce節(jié)點輸入:(good,1),(good,1),(good,1),(good1),(good(is,1),(is,輸出(is,1),(is,輸出good:is:3weather:reduce節(jié)點輸入:(has,1),輸出:(has,1),(is,輸入:(the,1),today1),(today,(weather,1),(weather,1),(weather,輸出:(the,1),(today,2),weatherreduce節(jié)點輸入:(good,1),(good,1),(good,2)(good,(is,1),(is,輸出(is,1),(is,輸出good:is:3weather:reduce節(jié)點輸入:(has,1),輸出:(has,1),(is,輸入:(the,1),today1),(today,(weather,1),(weather,1),(weather,輸出:(the,1),(today,2),weatherHadoop:Mapper&ReducerHadoop:DriverHadoop:Run HadoopMapReducesplitsplitsplitsplit
partpartpartpartsplitsplitReducershas3primaryphases:shuffle,sortandHadoop:HowmanyTasksetuptakesawhile,soitisbestifthemapstakeatleastaminuteto用戶可以顯示配置Configuration.set(MRjobConfig.NUM_MAPSintbutitonlyprovidesahinttotheframework10TBofinputdata,blocksizeisYouwillendupwith80KHadoop:HowmanyThenumberofreducersforthejobissetbytheuserTherightnumberofreducesseemstobe0.95or1.75multipliedby(<no.of<no. umcontainersperWith0.95allofthereducescanlaunch yandstarttransferringmapoutputsthemapsWith1.75thefasternodeswillfinishtheirfirstroundofreducesandlaunchasecondwave ngamuchbetterjobofloadIncreasingthenumberofreducesincreasestheframeworkoverhead,butloadbalancingandlowersthecostofHadoop:PartitionercontrolsthepartitioningofthekeysoftheintermediateThetotalnumberofpartitionsisthesameasthenumberofreducetasksforthejob.Hencethiscontrolswhichofthemreducetaskstheintermediatekey(andhencetherecord)issenttoforreductionHashPartitioneristhedefaultHadoop:JobJobrepresentsaMapReducejobJobistheprimaryinterfaceforausertodescribeaMapReducejobtoHadoopframeworkforJobistypicallyusedtoHadoop:JobOptionally,JobisusedtospecifyotheradvancedfacetsofthejobsuchFilestobeputintheWhetherintermediateand/orjoboutputsaretobecompressed(andWhetherjobtaskscanbeexecutedinaspeculativeumnumberofattemptsperUserscanuseConfiguration.set(String,String)/Configuration.get(String)toset/getarbitraryparametersneededbyapplicationsCountersrepresentglobalCounterscouldbedefinedMapReduceInthemapand/orreducemethods,applicationscandefinearbitraryCounters(oftypeEnum)andupdatethemvia:Counters.incrCounter(Enum,Counters.incrCounter(String,String,ThesecountersarethengloballyaggregatedbytheHadoop:CurrentlyFileInputFormat,TextInputFormat,SequenceFileInputFormat,CombineFileInputFormat,CombineSequenceFileInputFormat,CombineTextInputFormat,CompositeInputFormat,FixedLengthInputFormat,SequenceFileAsBinaryInputFormat,Seq
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綠城地產(chǎn)代建合同(2025年):住宅項目精裝修代建合作協(xié)議
- 2025年度教材售后服務與技術支持合同
- 2025年度危險化學品安全生產(chǎn)管理咨詢合同
- 2025年度工程造價咨詢業(yè)務風險防控合同
- 2025年度綠色金融項目評估與咨詢服務合同
- 2025年度借條補充協(xié)議(數(shù)字經(jīng)濟產(chǎn)業(yè)投資合作)
- 二零二五年平房建筑拆除與重建施工合同4篇
- 2025年度離婚協(xié)議書中的財產(chǎn)分割與子女生活費用合同
- 2025年度互聯(lián)網(wǎng)+教育項目合伙人合作協(xié)議
- 2025年度降水井設備租賃及維修服務合同范本
- 全名校北師大版數(shù)學五年級下冊第三單元達標測試卷(含答案)
- 新員工入職通識考試(中軟國際)
- 四星級酒店工程樣板房裝修施工匯報
- 圓翳內障病(老年性白內障)中醫(yī)診療方案
- 中考物理復習備考策略
- 博士后進站申請書博士后進站申請書八篇
- 小報:人工智能科技科學小報手抄報電子小報word小報
- GB/T 41509-2022綠色制造干式切削工藝性能評價規(guī)范
- 公安系防暴安全03安檢
- 孫權勸學教案全國一等獎教學設計
- 企業(yè)生產(chǎn)現(xiàn)場6S管理知識培訓課件
評論
0/150
提交評論