![Hadoop大數(shù)據(jù)技術與項目實戰(zhàn)王小潔課后參考答案_第1頁](http://file4.renrendoc.com/view12/M00/39/1F/wKhkGWYSmaeAW3PiAAEgpn7mUCo577.jpg)
![Hadoop大數(shù)據(jù)技術與項目實戰(zhàn)王小潔課后參考答案_第2頁](http://file4.renrendoc.com/view12/M00/39/1F/wKhkGWYSmaeAW3PiAAEgpn7mUCo5772.jpg)
![Hadoop大數(shù)據(jù)技術與項目實戰(zhàn)王小潔課后參考答案_第3頁](http://file4.renrendoc.com/view12/M00/39/1F/wKhkGWYSmaeAW3PiAAEgpn7mUCo5773.jpg)
![Hadoop大數(shù)據(jù)技術與項目實戰(zhàn)王小潔課后參考答案_第4頁](http://file4.renrendoc.com/view12/M00/39/1F/wKhkGWYSmaeAW3PiAAEgpn7mUCo5774.jpg)
![Hadoop大數(shù)據(jù)技術與項目實戰(zhàn)王小潔課后參考答案_第5頁](http://file4.renrendoc.com/view12/M00/39/1F/wKhkGWYSmaeAW3PiAAEgpn7mUCo5775.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
思考與練習一、判斷題
1、云主機和物理機的壽命都是永久性的。()
2、對于實時性要求高的應用,需要應用實時處理架構。()
3、數(shù)據(jù)倉庫是用來存儲數(shù)據(jù)的而不是分析數(shù)據(jù)的。()
4、在DWS層中,用戶行為日志數(shù)據(jù)分為公共字段和事件字段。()
二、單選題
1、項目實施流程中沒有哪一步()
A.下載數(shù)據(jù)
B.數(shù)據(jù)倉庫設計開發(fā)
C.數(shù)據(jù)導出D.數(shù)據(jù)訪問
2、數(shù)據(jù)分析在企業(yè)中的作用()
A.幫助企業(yè)經(jīng)營者平衡企業(yè)的收益
B.干預經(jīng)營者的決策
C.直接的獲取經(jīng)營的利潤
D.幫助企業(yè)經(jīng)營者減少投入
3、數(shù)據(jù)結構中哪項不是頁面入口的來源()
A.應用首頁
B.登錄頁
C.push
D.詳情頁
三、多選題
1、Hadoop的三大發(fā)行版本是()
A.Apache
B.CDH
C.HDP
D.Java
2、流量分析常見指標有哪些方面()
A.來源分析
B.受訪分析
C.訪客分析
D.轉化路徑分析3、網(wǎng)站流量數(shù)據(jù)分析的意義有哪些()
A.幫助網(wǎng)站運營人員獲取網(wǎng)站流量信息
B.從多方面提供網(wǎng)站分析的數(shù)據(jù)依據(jù)
C.幫助提高網(wǎng)站流量
D.提升網(wǎng)站用戶體驗
參考答案一、判斷題
1.錯2.對3.錯4.對
二、單選題
1.A2.C3.B
三、多選題
1.ABC2.ABCD3.ABCD思考與練習一、判斷題
1、Hadoop是一種分布式系統(tǒng)基礎架構,主要解決海量數(shù)據(jù)存儲和海量數(shù)據(jù)計算兩大
問題。()2、在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()
3、在Hadoop分布式集群中,不需要對集群中的每一個節(jié)點都進行ip規(guī)劃。()
4、利用HDFS操作命令可以將數(shù)據(jù)文件從本地上傳到HDFS上,也可以將數(shù)據(jù)文件
從HDFS下載到本地。()
5、在HDFSAPI操作中,closeFileSystem方法的功能是釋放文件系統(tǒng)對象的資源。
()
6、MapReduce詞頻統(tǒng)計案例中,執(zhí)行map任務的最后階段,會將緩沖區(qū)的數(shù)據(jù)全部
寫入到磁盤。()
7、Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系統(tǒng),可用于海量
日志采集、聚合和傳輸。()
二、單選題
1、能在網(wǎng)絡中安全傳輸文件的軟件是()。
A.VMware
B.Xshell
C.IDEA
D.Xftp
2、創(chuàng)建了bigdata用戶的命令是()。
A.subigdata
B.bigdataALL
C.useraddbigdata
D.Sudoers
3、論文(),主要論證的核心是如何采用分布式的架構對海量數(shù)據(jù)進行分布式計算。A.GFS
B.BigTable
C.MapReduce
D.HDFS
4、假如我們設定HDFS塊的大小是128M,那么,一個大小為500M的數(shù)據(jù)文件,將會被
拆分成()個分片
A.2
B.3
C.4
D.5
5、在Linux命令行中,使用()命令格式化hive元數(shù)據(jù)庫
A.format
B.schematool
C.clear
D.del
6、在Hive中給表添加數(shù)據(jù),使用()方式給表添加數(shù)據(jù)效率更高。
A.insertinto
B.Load
C.append
D.Add
7、關系型數(shù)據(jù)庫與HDFS之間相互數(shù)據(jù)遷移的工具是()。
A.distcpB.fsck
C.fastcopy
D.sqoop
三、多選題
1、Notepad++功能有()。
A.制作一般的純文字說明文件
B.編寫計算機程序代碼
C.語法高亮度顯示、語法折疊功能、支持宏、擴充基本功能的外掛模組
D.可以連接虛擬機,對虛擬機中的文件進行編輯。
2、Hadoop主要包含()三大功能組件。
A.YARN
B.Hadoop
C.MapReduce
D.HDFS
3、Hadoop具有()優(yōu)勢。
A.高可靠性
B.高效性
C.高容錯性
D.高擴展性
4、下面說法正確的是()。
A.JDK是Java語言的開發(fā)環(huán)境
B.JDK包含JRE和JVMC.JRE是java運行時的類庫
D.Java編程的核心就是JVM,JVM是JRE的一部分,它是一個虛擬出來的計算機。
5、在分布式文件系統(tǒng)HDFS當中提供了兩種操作命令,是()。
A.hadoopfs
B.Hadoopdfs
C.hdfsdfs
D.hdfsfs
6、Hive是基于Hadoop技術的數(shù)據(jù)倉庫工具,用來對數(shù)據(jù)進行()。
A.提取
B.轉化
C.加載
D.分析
7、使用beeline客戶端遠程訪問Hive之前,需要啟動的兩個服務是()。
A.hive--servicemetastore
B.hive--servermetastore
C.hive--servicehiveserver2
D.hive--servicehiveserver
8、Hive的復雜數(shù)據(jù)類型有()三種
A.ARRAY
B.MAP
C.STRUCT
D.Char9、成功安裝Zookeeper集群后,查看各節(jié)點的角色信息時,會看到1個、多個()。
A.leader
B.follower
C.zookeeper
D.zkServer
10、Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),是Apache基金會開源的消息隊列,
該框架由()編寫而成。
A.C++
B.Java
C.Scala
D.Python
參考答案一、判斷題
1.對2.對3.錯4.對5.對6.對7.對
二、單選題
1.D2.C3.C4.C5.B6.B7.D
三、多選題1.ABCD 2.ACD 3.ABCD 4.ABCD 5.AC 6.ABCD 7.BC 8.ABC 9.AB 10.BC思考與練習
一、判斷題
1、業(yè)務字段指的是每個移動端固定的、共有的字段;公共字段代表的是用戶在app中
執(zhí)行過的所有操作。()
2、在Flume過程中,F(xiàn)lume對接本地磁盤文件,通過tailDir類型實時監(jiān)控當前數(shù)據(jù)文
件中數(shù)據(jù)內(nèi)容的變化。()
3、ETL攔截器主要用于過濾時間戳不合法和json數(shù)據(jù)不完整的日志。()
4、Flume分流標記攔截器主要是用于區(qū)分啟動日志和事件日志。()
二、單選題
1、以下關于Flume的說法正確的是____。()
A.Event是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
B.Sink是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
C.Channel是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
D.Source是Flume數(shù)據(jù)傳輸?shù)幕締卧?/p>
2、Flume通過內(nèi)部的采集數(shù)據(jù)傳輸機制進行快速的數(shù)據(jù)傳輸,傳輸完之后會將數(shù)據(jù)就
存儲到____中。()
A.Source
B.Channel
C.Kafka
D.HDFS
3、可以使用____命令,啟動Kafka的一個消費者。()。
A.kafka-console-consumer.shB.kafka-server-start.sh
C.kafka-topics.sh
D.kafka-console-producer.sh
4、在Flume消費的整體流程中,第一部分是別名配置,在別名配置的過程當中,配置了兩
個數(shù)據(jù)流用來處理()。
A.ETL和分流標記攔截器
B.啟動日志數(shù)據(jù)和事件日志數(shù)據(jù)
C.Flume環(huán)境變量
D.Flume數(shù)據(jù)消費腳本
三、多選題
1、在Flume數(shù)據(jù)傳輸?shù)倪^程中,當source將數(shù)據(jù)傳遞給channel時,數(shù)據(jù)會先后經(jīng)過
()兩個攔截器。
A.ETL攔截器
B.時間戳攔截器
C.Flume分流標記攔截器
D.UUID攔截器
2、Flume的安裝與部署可以分為下列哪三個步驟()。
A.將Flume安裝包上傳至Linux操作系統(tǒng)
B.解壓到指定目錄,進行環(huán)境變量的配置
C.在Flume的配置文件中修改指定配置
D.啟動Flume數(shù)據(jù)消費腳本參考答案
一、判斷題
1.錯2.對3.對4.對
二、單選題
1.A2.C3.A4.B
三、多選題
1.AC2.ABC思考與練習
一、判斷題
1、在數(shù)據(jù)倉庫中,ODS層的作用是保持數(shù)據(jù)原貌,不做任何修改,起到備份數(shù)據(jù)的作
用()
2、在數(shù)據(jù)倉庫中,DWD層的作用是對數(shù)據(jù)進行清洗()
3、在ADS層中,通過在啟動日志中統(tǒng)計不同設備ID出現(xiàn)的次數(shù)來分析用戶活躍?
()
4、在ADS層中,按照設備ID對日活表分組,登錄次數(shù)為1,且在一周前登錄的這種分析方式,分析沉默用戶?()
5、DWS層統(tǒng)計各個主題對象的當天行為,服務于DWT層的主題寬表。DWS層的寬
表字段,是站在不同維度的角度去看事實表,重點關注事實表的度量值,通過與之關聯(lián)的事
實表,獲得不同的事實表的度量值()
二、單選題
1、在數(shù)據(jù)倉庫項目中,我們在DWD層使用()手段清洗數(shù)據(jù)
A.RDD
B.Kettle
C.SQL
D.Python
2、在數(shù)據(jù)倉庫中,用于數(shù)據(jù)清洗的是哪個層()
A.ODS
B.DWD
C.DWS
D.DWT
三、多選題
1、數(shù)據(jù)倉庫一般分為()
A.ODS
B.DWD
C.DWS
D.DWT
E.ADS2、在數(shù)據(jù)倉庫DWD層中,需要清洗哪些數(shù)據(jù)()
A.空值的去除
B.過濾核心字段
C.將用戶行為寬表和業(yè)務表進行數(shù)據(jù)一致處理
D.創(chuàng)建分區(qū)表
3、在數(shù)據(jù)倉庫中,ODS層做了什么業(yè)務()
A.保持數(shù)據(jù)原貌
B.采用LZO壓縮
C.創(chuàng)建分區(qū)表
D.空去除
參考答案
一、判斷題
1.對2.對3.對4.對5.對
二、單選題
1.C2.B
三、多選題1.ABCDE2.ABC3.ABC思考與練習一、判斷題
1、使用pyecharts工具繪圖時,可直接進行圖表的繪制,無需在程序中導入對應的
圖表類。()
2、使用pyecharts工具繪圖時,可以通過設置初始化配置項中的圖表ID,設置圖表
的唯一標識,以此來區(qū)分多個圖表。()
3、餅圖常用于表示不同分類的占比情況,通過弧度大小來對比各種分類。()
二、單選題
1、MySQL中,用于創(chuàng)建數(shù)據(jù)庫的命令是()。
A.dropdatabase數(shù)據(jù)庫名
B.use數(shù)據(jù)庫名
C.createtable數(shù)據(jù)庫名
D.createdatabase數(shù)據(jù)庫名
2、使用sqoop進行從Hive到MySQL數(shù)據(jù)庫的數(shù)據(jù)遷移時,其命令為()。125
第1章
A.sqoopimport
B.sqoopexport
C.sqoopjob
D.sqoopmerge
3、pyecharts中,柱狀圖類是()。
A.Bar
B.Line
C.Pie
D.Liquid
4、pyecharts中,餅圖類是()。
A.Bar
B.Line
C.Pie
D.Liquid
5、全局配置項可通過()方法設置。
A.add_yaxis
B.set_global_op
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度演員廣告代言合同
- 2025年度醫(yī)療機構藥品采購委托代購合同
- 農(nóng)業(yè)綠色發(fā)展行動計劃
- 養(yǎng)老院合同協(xié)議書
- 用戶體驗設計原則及實踐
- 簡易買賣合同
- 云計算在企業(yè)資源規(guī)劃中的應用
- 三農(nóng)產(chǎn)品追溯系統(tǒng)建設方案
- 模具設計與制造技術作業(yè)指導書
- 建房勞務人工的合同
- 中國哲學史(新)課件
- 考古繪圖緒論課件
- 小耳畸形課件
- 新人教版初中初三中考數(shù)學總復習課件
- 機械制造有限公司組織架構圖模板
- 嘩啦啦庫存管理系統(tǒng)使用說明
- 小學生讀書卡模板
- 8.3 摩擦力 同步練習-2021-2022學年人教版物理八年級下冊(Word版含答案)
- 《現(xiàn)代漢語詞匯》PPT課件(完整版)
- 生理學教學大綱
- 環(huán)保鐵1215物質(zhì)安全資料表MSDS
評論
0/150
提交評論