hadoop實驗報告可編輯范本

上傳人：1*** IP屬地：湖北上傳時間：2024-11-18 格式：DOC 頁數(shù)：9 大?。?26.54KB 積分：6 舉報 版權(quán)申訴

已閱讀5頁，還剩4頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

PAGEPAGE9基于haｄｏop的大規(guī)模文本處理技術(shù)實驗專業(yè)班級：軟件１10２學生姓名:張國宇學號：２０1116０40２２1ＳetuｐHadooponUｂｕntu１1。0464—ｂiｔ提示：前面的putty軟件安裝省略；直接進入ＪDK的安裝。1.ＩnstallSunＪＤK<安裝JDK〉由于SunJDK在ubｕntu的軟件中心中無法找到,我們必須使用外部的PPＡ。打開終端并且運行以下命令:sudoadd-ａpt—repｏsitoryppａ:ferrａmrｏbeｒto/ｊavaｓudｏａpt-getupdaｔesudｏａpt－getiｎｓtａllsｕｎ-jaｖa６—ｂinsｕｄoapｔ-getｉnstallｓuｎ—java6—jｄkＡｄｄJAVA_ＨOＭＥvaｒiablｅ<配置環(huán)境變量〉：先輸入粘貼下面文字:sudovi／ｅｔc/eｎｖirｏｎment再將下面的文字輸入進去:按i鍵添加，eｓc鍵退出,X保存退出;如下圖:expｏrｔJAVA_HOME=”/usｒ/lib／ｊvｍ／javａ—６—sun－１.6.0。26"ＴestthesuccｅssofiｎｓｔaｌlａｔｉｏnｉnＴeｒmｉnaｌ〈在終端測試安裝是否成功〉：sudo．／ｅtc/enｖironｍeｎｔjaｖａ–verｓioｎ2.ＣhecｋＳＳＨSetting〈檢查ssｈ的設(shè)置>sｓｈｌｏcalhost如果出現(xiàn)“ｃｏnnecｔionｒefusｅd”,你最好重新安裝sｓｈ（如下命令可以安裝):sｕdｏapt—getinsｔallopｅnssh-serveropenssh-client如果你沒有通行證ssｈ到主機，執(zhí)行下面的命令：ssh—keｙgｅｎ—tdsa-Ｐ’'－f～/.ssh／id_dsaｃａt(yī)~/．ssh／id_dsa。pub>〉～／.ssh／authoｒizeｄ＿ｋeys３。SetupHａdｏoｐ<安裝hadoop>安裝apａche2ｓudoａｐt—getｉnstallapacｈｅ2下載haｄoop：sudowgeｔｈｔｔp://apａcｈe。cs。ｕtａｈ.edu/hadoop／cｏmmｏn/hadoop-１．0。４／ｈaｄooｐ-１。0.4.tａr.gｚ解壓hadoｏp所下載的文件包:taｒxvfzhａdoop-1。0。4.ｔar.gz下載最近的一個穩(wěn)定版本，解壓。編輯／hａdooｐ—eｎv。ｓh定義java_homｅ“use／lｉbrａry/jaｖａ-６-sun-1。6。0.2６"Ｓｕdoviｃoｎｆ／ｈａdoｏｐ—ｅnv。sh將以下內(nèi)容加到文件最后:＃Thejaｖａimpｌementａｔｉontouse。Required．expｏrtＪAVA_ＨOMＥ=/usr/ｌｉb/jvm／java—6—sｕn-1.6。0.26Pseudo-DistributｅｄOperation（Sｉｎｇｌe—NodeClustｅr)＜偽分布式操作(單節(jié)點集群)〉:將下面中間部分插入:（得到如圖:)catｃoｎｆ/cｏrｅ－site。xml:＜conｆiｇuratiｏn〉〈property〉〈ｎame>fs．ｄefaｕlt.ｎame〈/naｍe><ｖalue〉ｈdfs://lｏcalhosｔ：９00０</value></properｔｙ〉〈/confｉgｕratｉon〉cａt(yī)ｃonf/ｈdfs—sｉｔｅ。xｍl:<coｎfiguratｉｏn>〈properｔy＞＜ｎame〉dfｓ.replicａt(yī)ion＜／ｎaｍｅ><value〉1</value＞＜/properｔy></coｎｆｉｇｕｒatｉｏn>catｃonf/mapreｄ-siｔe。ｘml:<ｃonfiguration〉〈propｅｒｔy>〈ｎａme〉mapreｄ。jｏb.tｒacｋer〈／name><value>loｃalｈost:900１</vaｌue＞＜/prｏperty>〈/confｉguration〉Switchtohaｄoｏｐrootdｉrectoryａｎdfｏｒmａｔａnewdistrｉbutｅdfｉlesysｔeｍ〈轉(zhuǎn)向根目錄，格式化一個新的文件分布式系統(tǒng)〉:bin/hａdooｐnａｍｅnoｄe–ｆormａｔ注意:這一步一定不能掉，否則后面會出錯！Yｏｕ’llgｅtinfolikｅ“Ｓtoraｇｅdｉrecｔｏry/tmp/hadoop—uｂuntu/dfs/ｎamehaｓbeｅnｓuccessfｕllyfｏrmａt(yī)ｔed?！盧ｅmeｍbｅrtｈispaｔhｉｓtheHＤFＳhomediｒｅcｔoryoｆnameｎodｅ。（你會得到提示：你已經(jīng)成功格式化．）Starｔandstoｐhadoopdaｅｍons（啟動和終止進程.）：bｉn/staｒt—aｌｌ。sh（stａrttheｈａdoｏp）bin/stop—aｌl。sh(stopthehadooｐ)ＷeｂinｔerfacesfｏrｔｈeNameNodｅａndtｈeJobＴrａckｅr:NameNode–HYPＥＲＬINK”http:/／ｌocalhosｔ:5００7０/＂http：//locaｌhｏｓt:500７0/＝〉http://［IＰaddresｓ｜ｄoｍａｉｎname]:500７０提示:如果前面沒有格式化成功,這個網(wǎng)址會出現(xiàn)就不去的現(xiàn)象!!!如果進不去就先結(jié)束進程，重新格式化然后再開始進程。ＪｏｂＴrａckeｒ–HYPERLINK”hｔtp:／/locａlhｏst：50030/”hｔtｐ:/／locａlhoｓt:50０30／=>http：//[IＰaｄｄress|ｄomａｉnnamｅ]:5003０4。DｅployAｎExampleMap－RｅduｃeJob＜布置Ma-ｒｅduceJｏb的一個例子＞創(chuàng)建路徑”/ｈome/ubuntu／mａｐrｅduｃe/ｗordｃｏｕnt/”，并在該目錄下放置文本文件worlｄcoｕｎｔ.tｘt。然后將這些文件復制到HDFS目錄:ｂiｎ/hａdooｐdfｓ—coｐｙFｒomLocａl／home/uｂuntu/ｍapreduce/wordcounｔ/tmp／hadooｐ—ubuntu/dｆs/naｍe/wｏrdcountｂin/hａdｏoｐdfｓ—ｌs/tｍp/hａdoop-ｕｂuntu/dｆs/ｎame／wordｃountRunthejob:ｂin/hａｄoopｊaｒhadｏop*examplｅｓ*。jaｒwｏrdcount/tmｐ／hadoｏp—ubuntu/dfs/ｎaｍe/wordｃount/tｍp/hadoop-ｕbｕntｕ/dｆｓ/namｅ/ｗoｒdcounｔ—ouｔpuｔIftheｏuｔｐｕtiｎｆoｌｏｏｋsnoｐroblem,cｏpytｈeoutｐutfｉlefromＨDＦＳtolocaｌdirectｏry＜如果輸出信息看起來沒有問題，從HＤFＳ輸出復制文件到本地目錄的：〉：bin/hadｏｏpｄfｓ—geｔmeｒｇe/tmｐ/haｄｏｏp-ubuntu/dfs/ｎaｍe/wordcoｕnt—ouｔput/ｈome/ubuｎtu/maprｅduce/wｏrdｃｏunt/Ｎｏwｙｏucanoｐentheoutputfｉleinｙourlｏcａｌdiｒecｔorｙtovie

人人文庫> 全部分類> 應用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

hadoop實驗報告可編輯范本

文檔簡介

溫馨提示

最新文檔

評論

hadoop實驗報告可編輯范本

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔