數(shù)據(jù)工程師培訓(xùn)題庫(kù)四_第1頁(yè)
數(shù)據(jù)工程師培訓(xùn)題庫(kù)四_第2頁(yè)
數(shù)據(jù)工程師培訓(xùn)題庫(kù)四_第3頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、TDH數(shù)據(jù)平臺(tái)認(rèn)證工程師試題姓名:分?jǐn)?shù):【說(shuō)明】a)客觀題30題,每題2分,總計(jì)60分b)主觀題4題,每題10分,總計(jì)40分c)滿分100分?!静欢?xiàng)選擇題(每題 2分共60分)】1、下列與HDFS有關(guān)的說(shuō)法正確的是()A. HDFS DataNode節(jié)點(diǎn)上的磁盤(pán)需要做 RAID1,用來(lái)保證數(shù)據(jù)的可靠性B. HDFS可以在磁盤(pán)之間通過(guò) balanee操作,平衡磁盤(pán)之間的負(fù)載情況C. HDFS建議DataNode之間的數(shù)據(jù)盤(pán)個(gè)數(shù)、容量大小不一致,以體現(xiàn)HDFS的負(fù)載 均衡能力D. 規(guī)劃HDFS集群時(shí),建議 Active NameNode和Standby NameNode分配在不同的 機(jī)架上2、

2、以下哪個(gè)服務(wù)作為 HDFS高可靠協(xié)調(diào)服務(wù)的共享存儲(chǔ)?()A.ZooKeeperB.Journ alNodesC.NameNodeD.ZKFailoverCo ntroller3、 在集群中配置 HDFS的副本數(shù)為3,設(shè)置數(shù)據(jù)塊大小為 128M,此時(shí)我們上傳一份 64M 的數(shù)據(jù)文件,該數(shù)據(jù)文件占用HDFS空間大小為()A . 64MB . 128MC . 384MD . 192M4、 在Yarn服務(wù)中,不包含以下哪種角色()A . ResourceMa nagerB . NodeMa nagerC . Applicatio nM asterD . Con tia ner5、 ResourceMa

3、nager是YARN的主要組成部分,有關(guān)其功能描述不正確的是()A .它直接將集群所擁有的資源按需分配給運(yùn)行在YARN上的應(yīng)用程序B. 它負(fù)責(zé)將集群中的所有資源進(jìn)行統(tǒng)一管理和分配C. 它接受各個(gè)節(jié)點(diǎn)的資源匯報(bào)信息D. 它把資源按照策略分配給各應(yīng)用6、 當(dāng)前用戶提交了一個(gè)wordcount詞頻統(tǒng)計(jì)的任務(wù),最后任務(wù)執(zhí)行失敗,可能的原因有哪些()A .當(dāng)前集群中沒(méi)有足夠的資源,不足以滿足當(dāng)前wordcount任務(wù)的需求B .執(zhí)行該任務(wù)的用戶沒(méi)有權(quán)限訪問(wèn)HDFS上的數(shù)據(jù)文件C .用戶在執(zhí)行任務(wù)之前在HDFS相應(yīng)的目錄下創(chuàng)建了提交任務(wù)時(shí)指定的輸出目錄D.以上原因都有可能7、 以下關(guān)于外表和托管表描述正確

4、的是()A、 外表的數(shù)據(jù)存儲(chǔ)在本地,托管表的數(shù)據(jù)存儲(chǔ)在hdfs上B、 刪除托管表只會(huì)刪除Inceptor上的元數(shù)據(jù)不會(huì)刪除數(shù)據(jù)文件,刪除外表兩者都會(huì) 被刪除C、 刪除外表只會(huì)刪除Inceptor上的元數(shù)據(jù)不會(huì)刪除數(shù)據(jù)文件,刪除托管表兩者都會(huì) 被刪除D、 刪除托管表或外表,incepotr上的元數(shù)據(jù)和數(shù)據(jù)文件都會(huì)被刪除& SQL運(yùn)行中如果出現(xiàn)maptask數(shù)據(jù)特別多,執(zhí)行時(shí)間又很短時(shí)可以通過(guò)小文件合并來(lái) 進(jìn)行優(yōu)化,以下是合并參數(shù)有()A. SET n gmr.partiti on .automerge = TRUE;B. SET n gmr.partitio n. mergesize = n;C

5、. SET n gmr.partiti on .mergesize.mb = m;D.9、 以下關(guān)于inceptor日志信息描述正確的有()A. Inceptor server 日志存放于各節(jié)點(diǎn)的 /var/log/inceptorsqlx/hive -server.logB. 可以通過(guò)inceptor server 4040查看SQL錯(cuò)誤日志C. Excutor 日志存放于 excutor 節(jié)點(diǎn)的 /var/log/inceptorsqlx/spark -excutor.logD. ExcutorGC 日志存放于 excutor 節(jié)點(diǎn)的 /var/log/inceptorsqlx/spark

6、 -excutor.gcog10、 tableA有10G的數(shù)據(jù),tableB有100G的數(shù)據(jù),兩個(gè)表通過(guò)共有的id列做關(guān)聯(lián)查詢 name列,以下方式可以優(yōu)化計(jì)算效率的是(A. select /*+MAPJOIN(a)*/ a. name,b. name from tableA a join tableB b on a.id=b.idB. select /*+MAPJOIN(b)*/ a. name,b. name from tableA a join tableB b on a.id=b.idC. 建表時(shí)將tableA和tableB根據(jù)id字段分相同數(shù)量的桶D. 建表時(shí)將tableA和tabl

7、eB根據(jù)name字段分相同數(shù)量的桶11、以下屬于 HMaster功能的是()A. 為 Region Server 分酉己 regionB. 存儲(chǔ)數(shù)據(jù)元信息C. 對(duì)region 進(jìn)行 compact 操作D. 管理用戶對(duì)table的增刪改查操作12、Hyperbase與Inceptor的關(guān)系,描述正確的是()A.兩者不可或缺,Inceptor保證Hyperbase的服務(wù)的正常運(yùn)仃B.兩者沒(méi)有任何關(guān)系C. Inceptor可以訪問(wèn)HyperbaseD.兩者相輔相成13、下列創(chuàng)建全局索引的語(yǔ)句,正確的是()A. add_index t1, index_name,COMBINE_INDEX|INDEX

8、ED=f1:q1:9|rowKey:rowKey:10,UPDATE=trueB. add_global_indext1, in dex_ nameCOMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=trueC. add_fulltext_index t1, index_name,COMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=true COMBINE_INDEX|INDEXED=f1:q1:9|rowKey:rowKey:10,UPDATE=trueD. create_glob

9、al_indext1, in dex_ name14、以下對(duì)流處理計(jì)算框架描述不正確的是()A. Spark Streaming 是基于 二微批(batch)對(duì)數(shù)據(jù)進(jìn)行處理的B. Apache Storm:時(shí)間(event)對(duì)數(shù)據(jù)進(jìn)行處理的C. Transwarp StreamSQL可基于微批或事件對(duì)數(shù)據(jù)進(jìn)行處理D. 以上說(shuō)法都不對(duì)15、某交通部門(mén)通過(guò)使用流監(jiān)控全市過(guò)往24小時(shí)各個(gè)卡口數(shù)據(jù),要求每分鐘更新一次,原始流為A.org_stream,以下實(shí)現(xiàn)正確的是()CREATE STREAMWINDOW traffic_stream AS SELECT* FROM original_stream

10、 STREAM w1 AS (length 1 minute slide 24 hour);B.CREATE STREAM traffic_stream AS SELECT * FROM original_stream STREAMWINDOW w1 AS (length 1 minute slide 24 hour);C.CREATE STREAM traffic_stream AS SELECT * FROM original_stream STREAMWINDOW w1 AS (len gth 24 hour slide 1 min ute);D.CREATE STREAM traffi

11、c_stream AS SELECT * FROM origi nal_stream AS (le ngth 24 sec ond slide 1 minu te);16、Zookeeper服務(wù)描述正確的為()A . Zookeeper 中每一個(gè) server 互為 leader。B . Zookeeper中只有一個(gè)leader,并通過(guò)備份機(jī)制產(chǎn)生。C . Zookeeper中不存在leader,所有server共同提供服務(wù)。D . Zookeeper通過(guò)選舉機(jī)制確定leader,有且僅有一個(gè)。17、通過(guò)Hue修改HDFS目錄或文件的權(quán)限可以通過(guò)以下哪些方式實(shí)現(xiàn)()A. Hdfs相應(yīng)的權(quán)限B.

12、 通過(guò)Hue超級(jí)用戶hue登錄C. 以hdfs用戶登錄D. 以上都可以18、通過(guò)Oozie使用ssh,必須滿足以下條件()A. 以root用戶登錄各個(gè)節(jié)點(diǎn)B. Oozie用戶可以免密鑰登錄C. Oozie用戶必須要有 bash權(quán)限D(zhuǎn) .所訪問(wèn)必須是集群的節(jié)點(diǎn)19、有關(guān)使用sqoop抽取數(shù)據(jù)的原理的描述不正確的是()A . sqoop在抽取數(shù)據(jù)的時(shí)候可以指定map的個(gè)數(shù),map的個(gè)數(shù)決定在hdfs生成的數(shù)據(jù)文件的個(gè)數(shù)B . sqoop抽取數(shù)據(jù)是個(gè)多節(jié)點(diǎn)并行抽取的過(guò)程,因此map的個(gè)數(shù)設(shè)置的越多性能越好C . sqoop任務(wù)的切分是根據(jù) split字段的(最大值-最小值)/map數(shù)D . sqoo

13、p抽取數(shù)據(jù)的時(shí)候需要保證執(zhí)行當(dāng)前用戶有權(quán)限執(zhí)行相應(yīng)的操作20、在使用sqoop連接關(guān)系型數(shù)據(jù)時(shí),下面哪個(gè)命令可以查看關(guān)系型數(shù)據(jù)庫(kù)中有哪些表?()A. sqoop list-databases-user name root-password 111111B. sqoop list-databases-user name root-P/C. sqoop list-databases-user name root-password-file file:/root/.pwd/D. sqoop list-tables-user name root-password 11111121、 要將采集的日志數(shù)據(jù)

14、作為kafka的數(shù)據(jù)源,則flume sink需要設(shè)置為下列哪項(xiàng)參數(shù)( )A . hdfsB . kafkaD . topic name22、下列是關(guān)于flume和sqoop對(duì)比的描述,不正確的是()A . flume主要用來(lái)采集日志而 sqoop主要用來(lái)做數(shù)據(jù)遷移B . flume主要采集流式數(shù)據(jù)而sqoop主要用來(lái)遷移規(guī)范化數(shù)據(jù)C . flume和sqoop都是分布式處理任務(wù)D . flume主要用于采集多數(shù)據(jù)源小數(shù)據(jù)而sqoop用來(lái)遷移單數(shù)據(jù)源數(shù)據(jù)23、有關(guān)Elasticsearch描述有誤的一項(xiàng)是()A. 它會(huì)利用多播形式發(fā)現(xiàn)節(jié)點(diǎn)。B. 主節(jié)點(diǎn)(master node)通過(guò)選舉方式產(chǎn)生

15、。C. 主節(jié)點(diǎn)(master node)進(jìn)行集群的管理,只負(fù)責(zé)集群節(jié)點(diǎn)添加和刪除。D. 主節(jié)點(diǎn)會(huì)去讀集群狀態(tài)信息,必要的時(shí)候進(jìn)行恢復(fù)工作。24、 下面措施中,不能保證 kafka數(shù)據(jù)可靠性的是()A . kafka會(huì)將所有消息持久化到硬盤(pán)中保證其數(shù)據(jù)可靠性B . kafka通過(guò)Topic Partition設(shè)置Replication來(lái)保證其數(shù)據(jù)可靠性C . kafka通過(guò)設(shè)置消息重發(fā)機(jī)制保證其數(shù)據(jù)可靠性D . kafka無(wú)法保證數(shù)據(jù)可靠性25、 TDH提供哪幾種認(rèn)證模式?()A. 所有服務(wù)使用簡(jiǎn)單認(rèn)證模式一一所有服務(wù)都無(wú)需認(rèn)證即可互相訪問(wèn)B. 所有服務(wù)都啟用 Kerberos認(rèn)證,用戶要提供K

16、erberos principal和密碼(或者keytab )來(lái)訪問(wèn)各個(gè)服務(wù)C. 所有服務(wù)都啟用 Kerberos同時(shí)Inceptor 啟用LDAP認(rèn)證D. 所有服務(wù)都啟用LDAP認(rèn)證26、 開(kāi)啟LDAP后,應(yīng)該使用哪個(gè)命令連接Inceptor ()A. tran swarp -t -h $ip。B. beeli ne -u jdbc:hive2:/$ip:10000 -n $user name -p $password。C. beeli ne -u jdbc:hive2:/$ip:10000/default;pri ncipal=hive/node1TDH。D. beeli ne -u jd

17、bc:hive2:/$ip:10000/default;pri ncipal=user1TDH。27、Inceptor server服務(wù)無(wú)法啟動(dòng)時(shí),該如何查看日志是()A. 查看 TDH manager所在節(jié)點(diǎn) /var/log/inceptorsql*/ 目錄下的 hive-server2.log 日志B. 查看 inceptor server 所在節(jié)點(diǎn) /var/log/inceptorsql*/ 目錄下的 hive-server2.log 日志C. 查看 Resource Manager 所在節(jié)點(diǎn) /var/log/Yarn*/ 目錄下的 yarn-yarn-resourcema nag

18、er-poc- no del .log 日志D. 查看任意節(jié)點(diǎn) /var/log/inceptorsql*/目錄下的 hive-server2.log 日志28、 現(xiàn)有一批數(shù)據(jù)需要進(jìn)行清洗,要求對(duì)其中null通過(guò)update轉(zhuǎn)換為0,刪除重復(fù)的記錄,添加部分新的記錄,則該表應(yīng)該設(shè)計(jì)為()A. Tex表B. Orc 表C. Orc事務(wù)表D. Holodesk 表29、 現(xiàn)有一個(gè)表數(shù)據(jù)要存儲(chǔ)在hyperbase上,并創(chuàng)建全文索引,原表數(shù)據(jù)10GB, HDFS配置為3副本,hyperbase壓縮比例按1:3計(jì)算,索引數(shù)據(jù)量為20GB, ES副本數(shù)為1,ES壓縮比按1:3計(jì)算,則該表需要多大的存儲(chǔ)空間存儲(chǔ)()A.16.67GBB.23.33GBC.30GBD.70GB30、下面哪些工作不屬于集群預(yù)安裝工作()A.為集群中每個(gè)節(jié)點(diǎn)的安裝操作系統(tǒng)B .選一個(gè)節(jié)點(diǎn)作為管理節(jié)點(diǎn),修改其 /etc/hosts文件C .安裝Transwarp Manager管理界面D.配置集群安全模式【客觀簡(jiǎn)答題(每題 10分,共40分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論