實驗3-熟悉常用的HDFS操作-答案_第1頁
實驗3-熟悉常用的HDFS操作-答案_第2頁
實驗3-熟悉常用的HDFS操作-答案_第3頁
實驗3-熟悉常用的HDFS操作-答案_第4頁
實驗3-熟悉常用的HDFS操作-答案_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、實驗2 熟悉常用的HDFS操作實驗手冊實驗2熟悉常用的HDFS操作1 實驗目的1.理解HDFS在Hadoop體系結(jié)構(gòu)中的角色;2.熟練使用HDFS操作常用的Shell命令;3.熟悉HDFS操作常用的Java API。2 實驗平臺操作系統(tǒng):LinuxHadoop版本:2.6.0或以上版本JDK版本:1.6或以上版本Java IDE:Eclipse3 實驗內(nèi)容和要求1. 編程實現(xiàn)以下指定功能,并利用Hadoop提供的Shell命令完成相同任務:提示:1) 部分Shell命令的參數(shù)路徑只能是本地路徑或者HDFS路徑。2) 若Shell命令的參數(shù)既可以是本地路徑,也可以是HDFS路徑時,務必注意區(qū)分。

2、為保證操作正確,可指定路徑前綴 hdfs:/ 或者 file:/3) 注意區(qū)分相對路徑與絕對路徑4) 具體命令的說明可參考教材或 /docs/stable/hadoop-project-dist/hadoop-common/FileSystemShell.html(1) 向HDFS中上傳任意文本文件,如果指定的文件在HDFS中已經(jīng)存在,由用戶指定是追加到原有文件末尾還是覆蓋原有的文件;Shell命令:檢查文件是否存在: ./hdfs dfs -test -e text.txt(執(zhí)行完這一句不會輸出結(jié)果,需要繼續(xù)輸入命令" echo $?&

3、quot;)追加命令: ./hdfs dfs -appendToFile local.txt text.txt覆蓋命令1: ./hdfs dfs -copyFromLocal -f local.txt text.txt覆蓋命令2: ./hdfs dfs -cp -f file:/home/hadoop/local.txt text.txt也可以使用如下命令實現(xiàn):(如下代碼可視為一行代碼,在終端中輸入第一行代碼后,直到輸入 fi 才會真正執(zhí)行):if $(./hdfs dfs -test -e text.txt);then $(./hdfs dfs -appendToFile local.txt

4、 text.txt);else $(./hdfs dfs -copyFromLocal -f local.txt text.txt);fiJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Configuration conf, String path) throws IOException FileSystem fs =

5、FileSystem.get(conf); return fs.exists(new Path(path); /* * 復制文件到指定路徑 * 若路徑已存在,則進行覆蓋 */ public static void copyFromLocalFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path localPath = new Path(localFilePath); Path remote

6、Path = new Path(remoteFilePath); /* fs.copyFromLocalFile 第一個參數(shù)表示是否刪除源文件,第二個參數(shù)表示是否覆蓋 */ fs.copyFromLocalFile(false, true, localPath, remotePath); fs.close(); /* * 追加文件內(nèi)容 */ public static void appendToFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException FileSystem f

7、s = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); /* 創(chuàng)建一個文件讀入流 */ FileInputStream in = new FileInputStream(localFilePath); /* 創(chuàng)建一個文件輸出流,輸出的內(nèi)容將追加到文件末尾 */ FSDataOutputStream out = fs.append(remotePath); /* 讀寫文件內(nèi)容 */ byte data = new byte1024; int read = -1; while ( (read = in.read(d

8、ata) > 0 ) out.write(data, 0, read); out.close(); in.close(); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String localFilePath = "/home/hadoop/text.txt" / 本地路

9、徑String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑String choice = "append" / 若文件存在則追加到文件末尾/String choice = "overwrite" / 若文件存在則覆蓋try /* 判斷文件是否存在 */Boolean fileExists = false;if (HDFSApi.test(conf, remoteFilePath) fileExists = true;System.out.println(remoteFilePat

10、h + " 已存在."); else System.out.println(remoteFilePath + " 不存在.");/* 進行處理 */if ( !fileExists) / 文件不存在,則上傳HDFSApi.copyFromLocalFile(conf, localFilePath, remoteFilePath);System.out.println(localFilePath + " 已上傳至 " + remoteFilePath); else if ( choice.equals("overwrite&q

11、uot;) ) / 選擇覆蓋HDFSApi.copyFromLocalFile(conf, localFilePath, remoteFilePath);System.out.println(localFilePath + " 已覆蓋 " + remoteFilePath); else if ( choice.equals("append") ) / 選擇追加HDFSApi.appendToFile(conf, localFilePath, remoteFilePath);System.out.println(localFilePath + "

12、 已追加至 " + remoteFilePath); catch (Exception e) e.printStackTrace();(2) 從HDFS中下載指定文件,如果本地文件與要下載的文件名稱相同,則自動對下載的文件重命名;Shell命令:if $(./hdfs dfs -test -e file:/home/hadoop/text.txt);then $(./hdfs dfs -copyToLocal text.txt ./text2.txt); else $(./hdfs dfs -copyToLocal text.txt ./text.txt); fiJava代碼:imp

13、ort org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 下載文件到本地 * 判斷本地路徑是否已存在,若已存在,則自動進行重命名 */ public static void copyToLocal(Configuration conf, String remoteFilePath, String localFilePath) throws IOException FileSystem fs = FileSystem.get(c

14、onf); Path remotePath = new Path(remoteFilePath); File f = new File(localFilePath); /* 如果文件名存在,自動重命名(在文件名后面加上 _0, _1 .) */ if (f.exists() System.out.println(localFilePath + " 已存在."); Integer i = 0; while (true) f = new File(localFilePath + "_" + i.toString(); if (!f.exists() loca

15、lFilePath = localFilePath + "_" + i.toString(); break; System.out.println("將重新命名為: " + localFilePath); / 下載文件到本地 Path localPath = new Path(localFilePath); fs.copyToLocalFile(remotePath, localPath); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = n

16、ew Configuration(); conf.set("","hdfs:/localhost:9000");String localFilePath = "/home/hadoop/text.txt" / 本地路徑String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑try HDFSApi.copyToLocal(conf, remoteFilePath, localFilePath);System.out.println(

17、"下載完成"); catch (Exception e) e.printStackTrace();(3) 將HDFS中指定文件的內(nèi)容輸出到終端中;Shell命令:./hdfs dfs -cat text.txtJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 讀取文件內(nèi)容 */ public static void cat(Configuration conf, String r

18、emoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); FSDataInputStream in = fs.open(remotePath); BufferedReader d = new BufferedReader(new InputStreamReader(in); String line = null; while ( (line = d.readLine() != null ) System.out.print

19、ln(line); d.close(); in.close(); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑try System.out.println("

20、;讀取文件: " + remoteFilePath);HDFSApi.cat(conf, remoteFilePath);System.out.println("n讀取完成"); catch (Exception e) e.printStackTrace();(4) 顯示HDFS中指定的文件的讀寫權(quán)限、大小、創(chuàng)建時間、路徑等信息;Shell命令:./hdfs dfs -ls -h text.txtJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;impo

21、rt java.io.*;import java.text.SimpleDateFormat;public class HDFSApi /* * 顯示指定文件的信息 */ public static void ls(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); FileStatus fileStatuses = fs.listStatus(remotePa

22、th); for (FileStatus s : fileStatuses) System.out.println("路徑: " + s.getPath().toString(); System.out.println("權(quán)限: " + s.getPermission().toString(); System.out.println("大小: " + s.getLen(); /* 返回的是時間戳,轉(zhuǎn)化為時間日期格式 */ Long timeStamp = s.getModificationTime(); SimpleDateForma

23、t format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); String date = format.format(timeStamp); System.out.println("時間: " + date); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs

24、:/localhost:9000");String remoteFilePath = "/user/hadoop/text.txt" / HDFS路徑try System.out.println("讀取文件信息: " + remoteFilePath);HDFSApi.ls(conf, remoteFilePath);System.out.println("n讀取完成"); catch (Exception e) e.printStackTrace();(5) 給定HDFS中某一個目錄,輸出該目錄下的所有文件的讀寫權(quán)限、大小

25、、創(chuàng)建時間、路徑等信息,如果該文件是目錄,則遞歸輸出該目錄下所有文件相關(guān)信息;Shell命令:./hdfs dfs -ls -R -h /user/hadoopJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;import java.text.SimpleDateFormat;public class HDFSApi /* * 顯示指定文件夾下所有文件的信息(遞歸) */ public static void lsDir(Configuration

26、conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new Path(remoteDir); /* 遞歸獲取目錄下的所有文件 */ RemoteIterator<LocatedFileStatus> remoteIterator = fs.listFiles(dirPath, true); /* 輸出每個文件的信息 */ while (remoteIterator.hasNext() FileStatus s = remoteIterator.

27、next(); System.out.println("路徑: " + s.getPath().toString(); System.out.println("權(quán)限: " + s.getPermission().toString(); System.out.println("大小: " + s.getLen(); /* 返回的是時間戳,轉(zhuǎn)化為時間日期格式 */ Long timeStamp = s.getModificationTime(); SimpleDateFormat format = new SimpleDateFormat

28、("yyyy-MM-dd HH:mm:ss"); String date = format.format(timeStamp); System.out.println("時間: " + date); System.out.println(); fs.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localho

29、st:9000");String remoteDir = "/user/hadoop" / HDFS路徑try System.out.println("(遞歸)讀取目錄下所有文件的信息: " + remoteDir);HDFSApi.lsDir(conf, remoteDir);System.out.println("讀取完成"); catch (Exception e) e.printStackTrace();(6) 提供一個HDFS內(nèi)的文件的路徑,對該文件進行創(chuàng)建和刪除操作。如果文件所在目錄不存在,則自動創(chuàng)建目錄;She

30、ll命令:if $(./hdfs dfs -test -d dir1/dir2);then $(./hdfs dfs -touchz dir1/dir2/filename); else $(./hdfs dfs -mkdir -p dir1/dir2 && hdfs dfs -touchz dir1/dir2/filename); fi刪除文件:./hdfs dfs -rm dir1/dir2/filenameJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;impo

31、rt java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Configuration conf, String path) throws IOException FileSystem fs = FileSystem.get(conf); return fs.exists(new Path(path); /* * 創(chuàng)建目錄 */ public static boolean mkdir(Configuration conf, String remoteDir) throws IOException F

32、ileSystem fs = FileSystem.get(conf); Path dirPath = new Path(remoteDir); boolean result = fs.mkdirs(dirPath); fs.close(); return result; /* * 創(chuàng)建文件 */ public static void touchz(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Pa

33、th(remoteFilePath); FSDataOutputStream outputStream = fs.create(remotePath); outputStream.close(); fs.close(); /* * 刪除文件 */ public static boolean rm(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); boolean

34、 result = fs.delete(remotePath, false); fs.close(); return result; /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteFilePath = "/user/hadoop/input/text.txt" / HDFS路徑

35、String remoteDir = "/user/hadoop/input" / HDFS路徑對應的目錄try /* 判斷路徑是否存在,存在則刪除,否則進行創(chuàng)建 */if ( HDFSApi.test(conf, remoteFilePath) ) HDFSApi.rm(conf, remoteFilePath); / 刪除System.out.println("刪除路徑: " + remoteFilePath); else if ( !HDFSApi.test(conf, remoteDir) ) / 若目錄不存在,則進行創(chuàng)建HDFSApi.mkdi

36、r(conf, remoteDir);System.out.println("創(chuàng)建文件夾: " + remoteDir);HDFSApi.touchz(conf, remoteFilePath);System.out.println("創(chuàng)建路徑: " + remoteFilePath); catch (Exception e) e.printStackTrace();(7) 提供一個HDFS的目錄的路徑,對該目錄進行創(chuàng)建和刪除操作。創(chuàng)建目錄時,如果目錄文件所在目錄不存在則自動創(chuàng)建相應目錄;刪除目錄時,由用戶指定當該目錄不為空時是否還刪除該目錄;Shell

37、命令:創(chuàng)建目錄:./hdfs dfs -mkdir -p dir1/dir2刪除目錄(如果目錄非空則會提示not empty,不執(zhí)行刪除):./hdfs dfs -rmdir dir1/dir2強制刪除目錄:./hdfs dfs -rm -R dir1/dir2Java代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Config

38、uration conf, String path) throws IOException FileSystem fs = FileSystem.get(conf); return fs.exists(new Path(path); /* * 判斷目錄是否為空 * true: 空,false: 非空 */ public static boolean isDirEmpty(Configuration conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new

39、 Path(remoteDir); RemoteIterator<LocatedFileStatus> remoteIterator = fs.listFiles(dirPath, true); return !remoteIterator.hasNext(); /* * 創(chuàng)建目錄 */ public static boolean mkdir(Configuration conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new Path(re

40、moteDir); boolean result = fs.mkdirs(dirPath); fs.close(); return result; /* * 刪除目錄 */ public static boolean rmDir(Configuration conf, String remoteDir) throws IOException FileSystem fs = FileSystem.get(conf); Path dirPath = new Path(remoteDir); /* 第二個參數(shù)表示是否遞歸刪除所有文件 */ boolean result = fs.delete(dir

41、Path, true); fs.close(); return result; /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteDir = "/user/hadoop/input" / HDFS目錄Boolean forceDelete = false; / 是否強制刪除try

42、/* 判斷目錄是否存在,不存在則創(chuàng)建,存在則刪除 */if ( !HDFSApi.test(conf, remoteDir) ) HDFSApi.mkdir(conf, remoteDir); / 創(chuàng)建目錄System.out.println("創(chuàng)建目錄: " + remoteDir); else if ( HDFSApi.isDirEmpty(conf, remoteDir) | forceDelete ) / 目錄為空或強制刪除HDFSApi.rmDir(conf, remoteDir);System.out.println("刪除目錄: " + r

43、emoteDir); else / 目錄不為空System.out.println("目錄不為空,不刪除: " + remoteDir); catch (Exception e) e.printStackTrace();(8) 向HDFS中指定的文件追加內(nèi)容,由用戶指定內(nèi)容追加到原有文件的開頭或結(jié)尾;Shell命令:追加到文件末尾:./hdfs dfs -appendToFile local.txt text.txt追加到文件開頭:(由于沒有直接的命令可以操作,方法之一是先移動到本地進行操作,再進行上傳覆蓋):./hdfs dfs -get text.txtcat text

44、.txt >> local.txt./hdfs dfs -copyFromLocal -f text.txt text.txtJava代碼:import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import java.io.*;public class HDFSApi /* * 判斷路徑是否存在 */ public static boolean test(Configuration conf, String path) throws IOException FileSystem fs =

45、FileSystem.get(conf); return fs.exists(new Path(path); /* * 追加文本內(nèi)容 */ public static void appendContentToFile(Configuration conf, String content, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); /* 創(chuàng)建一個文件輸出流,輸出的內(nèi)容將追加到文件末尾 */ F

46、SDataOutputStream out = fs.append(remotePath); out.write(content.getBytes(); out.close(); fs.close(); /* * 追加文件內(nèi)容 */ public static void appendToFile(Configuration conf, String localFilePath, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(re

47、moteFilePath); /* 創(chuàng)建一個文件讀入流 */ FileInputStream in = new FileInputStream(localFilePath); /* 創(chuàng)建一個文件輸出流,輸出的內(nèi)容將追加到文件末尾 */ FSDataOutputStream out = fs.append(remotePath); /* 讀寫文件內(nèi)容 */ byte data = new byte1024; int read = -1; while ( (read = in.read(data) > 0 ) out.write(data, 0, read); out.close(); in

48、.close(); fs.close(); /* * 移動文件到本地 * 移動后,刪除源文件 */ public static void moveToLocalFile(Configuration conf, String remoteFilePath, String localFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); Path localPath = new Path(localFilePath); fs.move

49、ToLocalFile(remotePath, localPath); /* * 創(chuàng)建文件 */ public static void touchz(Configuration conf, String remoteFilePath) throws IOException FileSystem fs = FileSystem.get(conf); Path remotePath = new Path(remoteFilePath); FSDataOutputStream outputStream = fs.create(remotePath); outputStream.close(); fs

50、.close(); /* * 主函數(shù) */public static void main(String args) Configuration conf = new Configuration(); conf.set("","hdfs:/localhost:9000");String remoteFilePath = "/user/hadoop/text.txt" / HDFS文件String content = "新追加的內(nèi)容n"String choice = "after" /追加到文件末尾/String choice = "before" / 追加到文件開頭try /* 判斷文件是否存在 */if ( !HDFSApi.test(conf, remoteFilePath) ) System.out.println("文件不存在: " + remoteFilePath); else if ( choice.equals("after") ) / 追加在文件末尾HDFSApi.app

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論