版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
導出實驗中:將以前做過的日志按照省匯總量的輸出mysql(最后實驗sqoop(如果出問題Sqoophadoop(hdfs/hive/hbase)和關系數(shù)據(jù)庫(mysql/oracle等)數(shù)據(jù)互導的工具。本實驗學習Sqoop1.4.6。、1sqoop-1.4.6.binhadoop-2.0.4-alpha.tar.gz壓(app)、(4#號去掉,設置對應值,可從.bash_profile中拷貝)#Setpathtowherebin/hadoopis #Setpathtowherehadoop-*-core.jarisavailableexportHADOOP_MAPRED_HOME=/home/hadoop/app/hadoop-2.7.1#setthepathtowherebin/hbaseisavailableexportHBASE_HOME=/home/hadoop/app/hbase-1.1.5#Setthepathtowherebin/hiveisavailable4、把mysql驅動添加到$SQOOP_HOME/lib5、測試與mysql首先啟動mysql服務,面實驗中我們已經(jīng)把mysql服務設置為開機啟動。通過systemctlstatusmariadb.service可以查看sqooplist-databases--connectjdbc:mysql://127.0.0.1:3306/--usernameroot--輸入mysql用戶root的root,能看到mysql下面練習mysqlhdfs(hive)數(shù)據(jù)互導,導入(import)和導mysql為導出。需要將在關系數(shù)據(jù)庫的數(shù)據(jù)傳給hadoop。mysqlteststudent1表導入到hdfs test,構(describestudent1),內容(select*fromstudent1)。hdfs和yarn啟動:start-dfs.shstart-下面通過命令將student1hdfs --usernameroot--P--tablestudent1--target-dir然后輸入root:root,執(zhí)行任 --usernameroot--passwordroot--table "生物%"' 用--querysql oding=utf-8"--usernameroot--passwordroot --query"selectxm '李 --target-dir'/sqoop/student1'--drivercom.mysql.jdbc.Driver-mCREATETABLE`t1` `id`int(11)NOTNULL PRIMARYKEY(`id`) --usernameroot--password --tablet1--target-dir --usernameroot--password --tablet1--target-dir--drivercom.mysql.jdbc.Driver-m1--check-columnid--incrementalappend--last-value1CREATETABLE`t2` `id`int(11)NOTNULL`uname`varchar(20)DEFAULTNULL,`lastmodi`datetime PRIMARYKEY(`id`)); --usernameroot--password --tablet2--target-dir mysql展示,需要將hdfs數(shù)據(jù)傳到mysql中供webhdfsmysql下建立同結構新開 窗口在mysql的test數(shù)據(jù)庫下建立表格sqoopex登錄 -uroot-建表:createtablesqoop1(idint,xhvarchar(20),xmvarchar(20),xb ding=utf-8"--usernameroot--passwordroot--export-dir'/sqoop/sqoopex1.txt'--tablesqoop1--drivercom.mysql.jdbc.Driver導出默認是插入模式(insertmode,要使用更新模式allowinsert可加--update-key子句。hdfszhangsanzhangsan1(需要重新上傳。以更新模式導出: ding=utf-8"--usernameroot--passwordroot--export-'/sqoop/sqoopex1.txt'--tablesqoop1--driver練習:將以前做過的日志按照省匯總量的輸出數(shù)據(jù)導出到mysql(pageviewbyprovince.txt)命令需要加上參數(shù)--input-fields-terminated-by'\t'8mysql Hive將mysql中student1hivehive1sqoopimport--connect--usernameroot--passwordroot--tablestudent1--hivehive-tablestudent1--hive-databasehive1--drivercom.mysql.jdbc.Driver--delete-target-dir-m1sqoopimport--connect--usernameroot--passwordroot--tablestudent1--columns'xm,bj'--where'bjlike"生物%"'--hive-import--hive-tablestudent1--hive-databasehive1--drivercom.mysql.jdbc.Driver--delete-target-dir-m9、導出(hive10sqoopjob以前面增量導入(按自動增長字段)令為例:先將hdfs下 hdfsfs–rm–r/sqoop/t1mysqlt1表保留前兩條記錄意,以.打頭是隱藏文件,起更好的作用)echo-n"root">.mysql.password注意用上面命令寫入,不能直接在文件中輸入。jobsqoopjob--createjob1--import--connectjdbc:mysql://localhost:3306/test--usernameroot--password-file--tablet1--target-dir/sqoop/t1--drivercom.mysql.jdbc.Driver-m--check-columnid--incrementalappend--last-value0 sqoopjob–showsqoopjobsqoopjob--execid3,4sqoopjobdeletejob1(job1后面會用到,此步驟省略11調度sqooplinuxcrontabsqoop #! /usrdata/users/SDAU/010277/soft/sqoop-1.4.6.bin/usrdata/users/SDAU/010277/soft/sqoop-1.4.6.binhadoop-2.0.4-alpha/bin/sqoopjob--execjob1>/usrdata/users/SDA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)如何合法解除勞動合同
- 山塘水庫承包合同樣本(2篇)
- 廣州-PEP-2024年10版小學3年級英語第三單元真題試卷
- 探究小學數(shù)學教學中德育教育現(xiàn)狀與解決辦法
- 學校體育器材購銷合同(2篇)
- 淺談園林建筑過程中綠化工程
- 愛情婚姻咨詢合作協(xié)議
- 《企業(yè)員工保險協(xié)議》
- 在線商城半年銷售工作總結
- 道路交通工程綠色施工方案
- 小學道德與法治研修活動方案
- 五下音樂《瑤族舞曲(簡譜、五線譜)》課件
- 運用PDCA縮短ST段抬高型急性心肌梗死病人在急診停留時間
- 2024-2030年中國GIS行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- SRM容災解決專項方案
- 2024-2030年熊膽粉產(chǎn)業(yè)市場深度調研及發(fā)展趨勢與投資前景預測研究分析報告
- 可靠性教材工程師模擬考試(4)附有答案
- GB/T 18029.8-2024輪椅車第8部分:靜態(tài)強度、沖擊強度及疲勞強度的要求和測試方法
- 小學道德與法治四年級上冊第二單元作業(yè)設計
- 2020新青島版(六三制)四年級上冊科學課件(全冊).p
- 腦血管供血不足患者的護理查房
評論
0/150
提交評論