大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）

上傳人：r*** IP屬地：山東上傳時(shí)間：2023-08-06 格式：DOCX 頁(yè)數(shù)：128 大小：112.93KB 積分：15 舉報(bào) 版權(quán)申訴

大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）_第2頁(yè)

大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）_第3頁(yè)

大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）_第4頁(yè)

大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）_第5頁(yè)

已閱讀5頁(yè)，還剩123頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE1大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）一、單選題1.Spark是用以下那種編程語(yǔ)言實(shí)現(xiàn)的？A、cB、C++C、javaD、Scala答案：D解析：Spark中用Scala開(kāi)發(fā)語(yǔ)法簡(jiǎn)潔許多，且支持類(lèi)型推斷，可大大提升開(kāi)發(fā)效率。2.在FusinInsightManager界面中，對(duì)Lader的操作不包括下列哪個(gè)選項(xiàng)（）A、切換Lader主備節(jié)點(diǎn)B、啟動(dòng)Lader實(shí)例C、配置Lader參數(shù)D、查看Lader服務(wù)狀態(tài)答案：A解析：在FusinInsight界面中，對(duì)Lader的操作不包括切換Lader主備節(jié)點(diǎn)3.Hive不適用于以下哪個(gè)場(chǎng)景單選A、非實(shí)時(shí)分析，例如日析B、數(shù)據(jù)挖掘，例如用戶(hù)析，區(qū)域展示C、數(shù)據(jù)匯總，例如母天,每擊數(shù)，點(diǎn)擊排行D、實(shí)時(shí)在線數(shù)答案：D解析：Hive不適用于實(shí)時(shí)在線數(shù)單選。由于hive主要用于數(shù)據(jù)分析，因此延時(shí)比較高，不適用于實(shí)時(shí)場(chǎng)景，適用于離線大數(shù)據(jù)分析4.Hadp平臺(tái)中HBase的Regin是由哪個(gè)服務(wù)進(jìn)程來(lái)管理？A、HMasterB、DataNdeC、ReginServerD、Zkeeper答案：C解析：Hadp平臺(tái)中HBase的Regin是由ReginServer管理5.Hadp組件在企業(yè)應(yīng)用中，能用于大數(shù)據(jù)集實(shí)時(shí)查詢(xún)的產(chǎn)品有（）。A、HiveB、PigC、MahutD、Hbase答案：D解析：Hadp組件在企業(yè)應(yīng)用中，能用于大數(shù)據(jù)集實(shí)時(shí)查詢(xún)的產(chǎn)品有Hbase。6.下列選項(xiàng)中無(wú)法通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是？（）A、商業(yè)模式發(fā)現(xiàn)B、信用評(píng)估C、商品推薦D、運(yùn)營(yíng)分析答案：A解析：商業(yè)模式發(fā)現(xiàn)無(wú)法通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)7.日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)錯(cuò)誤的是（）。A、進(jìn)度性B、規(guī)范性C、時(shí)效性D、全面性答案：D解析：日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)有進(jìn)度性，規(guī)范性，時(shí)效性。https://zhuanlan.zhihu./p/53857057日常數(shù)據(jù)通報(bào)是以定期數(shù)據(jù)分析報(bào)表為依據(jù)，反映計(jì)劃執(zhí)行情況，并分析影響和形成原因的一種數(shù)據(jù)分析報(bào)告。這種數(shù)據(jù)分析報(bào)告一般是按日、周、月、季、年等時(shí)間階段定期進(jìn)行，所以也叫定期分析報(bào)告。8.HBase依賴(lài)()提供強(qiáng)大的計(jì)算能力A、PrtbufB、JavaC、KafkaD、Chubby答案：D解析：谷歌收購(gòu)云計(jì)算公司CuldSimple強(qiáng)化云計(jì)算能力9.以下關(guān)于Hive操作描述不正確的是（）。A、Hive是一個(gè)建立在hadp文件系統(tǒng)上的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)，可以用其對(duì)HDFS上B、Hive依賴(lài)于MapReduce處理數(shù)據(jù)C、Hive的加載數(shù)據(jù)時(shí)候，可以用lcal進(jìn)行修飾，表示從某個(gè)本地目錄下加載數(shù)據(jù)D、Hive—般可以用于實(shí)時(shí)的查詢(xún)分析答案：D解析：Hive不可以用于實(shí)時(shí)的查詢(xún)分析10.以下關(guān)于繼承的敘述正確的是（）A、在Java中類(lèi)只允許單一繼承B、在Java中一個(gè)類(lèi)只能實(shí)現(xiàn)一個(gè)接nC、在Java中一個(gè)類(lèi)不能同時(shí)繼承一個(gè)類(lèi)和實(shí)現(xiàn)一個(gè)接口D、在Java中接口只允許單一繼承答案：A解析：繼承分為單繼承和多繼承兩種形式。單繼承允許一個(gè)類(lèi)可以有多個(gè)子類(lèi)，但只能有一個(gè)父類(lèi)；多繼承則允許一個(gè)類(lèi)不僅可以有多個(gè)子類(lèi)，還可以有多個(gè)父類(lèi)。但需要注意一點(diǎn)，Java只支持單繼承，但可以通過(guò)接口實(shí)現(xiàn)多繼承的功能。一個(gè)類(lèi)可以同時(shí)繼承一個(gè)類(lèi)和實(shí)現(xiàn)一個(gè)接口。11.關(guān)于HIVE的描述不正確的？A、Hive最佳使用景是大數(shù)據(jù)的批處理作業(yè)B、Hive可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)C、Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上，Hadp通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量開(kāi)銷(xiāo)D、Hive查詢(xún)操作過(guò)程嚴(yán)格遵循HadpMapreduce的作用執(zhí)行模型.Hive將用戶(hù)的HveQL語(yǔ)句通過(guò)解釋器轉(zhuǎn)換為MapreduceHadp集群上答案：B解析：Hive不可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)。Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上，Hadp通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開(kāi)銷(xiāo)。因此，hive并不能夠在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)12.MapReduce的Shuffle過(guò)程以下中哪個(gè)操作是最后做的？A、排序B、合并C、分區(qū)D、溢寫(xiě)答案：B解析：map階段shuffle過(guò)程就是將map結(jié)果進(jìn)行分區(qū)、排序、合并13.以下哪個(gè)方法用于定義線程的執(zhí)行體？A、start()B、init()C、run()D、synchrnized()答案：C解析：run()方法是用來(lái)定義這個(gè)線程在啟動(dòng)的時(shí)候需要做什么，但是，直接執(zhí)行run()方法那就不是線程，必須使用start()啟動(dòng)，那樣才是線程。線程是進(jìn)程中的實(shí)體，一個(gè)進(jìn)程可以擁有多個(gè)線程，一個(gè)線程必須有一個(gè)父進(jìn)程。線程不擁有系統(tǒng)資源，只有運(yùn)行必須的一些數(shù)據(jù)結(jié)構(gòu)；與父進(jìn)程的其它線程共享該進(jìn)程所擁有的全部資源。線程可以創(chuàng)建和撤消線程，從而實(shí)現(xiàn)程序的并發(fā)執(zhí)行。一般，線程具有就緒、阻塞和運(yùn)行三種基本狀態(tài)。14.以下哪種不是Hive支持的數(shù)據(jù)類(lèi)型？A、StructB、IntC、MapD、Lng答案：D解析：Hive不支持Lng類(lèi)型，Lng是Java里面的，在Hive里L(fēng)ng對(duì)應(yīng)的應(yīng)該是BIGINT。15.下面說(shuō)法錯(cuò)誤的是（）。A、Hadp集群采用的是Master/Slave工作模式B、DataNde上保存著的是元數(shù)據(jù)，真正的數(shù)據(jù)是存放在NameNde上的C、HDFS采用了一種對(duì)文件切割后分別存放的存儲(chǔ)方式。D、HDFS是為高數(shù)據(jù)吞吐量應(yīng)用優(yōu)化的。答案：B解析：DataNde上數(shù)據(jù)塊以文件形式存儲(chǔ)在磁盤(pán)上,包括兩個(gè)文件,一個(gè)是數(shù)據(jù)本身,一個(gè)是數(shù)據(jù)塊元數(shù)據(jù)包括長(zhǎng)度、校驗(yàn)、時(shí)間戳;16.請(qǐng)問(wèn)以下哪個(gè)命令組成是錯(cuò)誤的？A、sbin/stp-dfs.shB、sbin/hdfsdfsadmin-reprtC、bin/hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/my.txt答案：B解析：A選項(xiàng)，sbin/stp-dfs.sh是用來(lái)停止日志相關(guān)服務(wù)。C選項(xiàng)，它負(fù)責(zé)管理文件系統(tǒng)的命名空間,維護(hù)文件系統(tǒng)的文件樹(shù)以及所有的文件和目錄的元數(shù)據(jù)。D選項(xiàng)，文件目錄有關(guān)。B選項(xiàng)命令不存在。所以選B。17.YARN中默認(rèn)的資源調(diào)度器是？A、FIF調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全不是答案：B解析：YARN中默認(rèn)的資源調(diào)度器是容量調(diào)度器18.關(guān)于相關(guān)性rA,B說(shuō)法錯(cuò)誤的是（）。A、rA,B>0,正相關(guān)。A隨B的值得增大而增大B、rA,B=0不相關(guān)。AB無(wú)關(guān)C、rA,B<0,負(fù)相關(guān)。A隨B的值得增大而減少D、不能單純依據(jù)rA,B<0fig定AB相關(guān)性答案：D解析：不能單純依據(jù)rA,B<0fig定AB相關(guān)性是錯(cuò)誤的r為相關(guān)系數(shù)19.HDFS有一個(gè)gzip文件大小75MB,客戶(hù)端設(shè)置Blck大小為64MB。當(dāng)運(yùn)行mapreduce任務(wù)讀取該文件時(shí)inputsplit大小為？A、—個(gè)map取64MB,另外一個(gè)map取11MBB、128MBC、64MBD、75MB答案：D解析：gzip不支持split,所以inputsplit大小為文件大小20.以下關(guān)于fusininsightCTbase的描述不正確的是？A、CThase的讀寫(xiě)數(shù)據(jù)接口，統(tǒng)一封裝了行定義的接口，自動(dòng)進(jìn)行冷字段的合并和解析,不需要在應(yīng)用程序中進(jìn)行合并和解釋B、CTHBase是基于Hbase的聚簇表開(kāi)發(fā)框架。云HBASE數(shù)據(jù)庫(kù)（CT-Hbase）基于開(kāi)源HBase引擎，支持NSQL和二級(jí)索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。C、CTHbase提供了一套Webui進(jìn)行元數(shù)據(jù)定義，提供了只管醫(yī)用的表設(shè)計(jì)工具，降低表設(shè)D、CTHbase的javaAPI提供一套Hbas鏈接池管理的接口,內(nèi)部進(jìn)行連接共享,減少客戶(hù)端應(yīng)用開(kāi)發(fā)難度。答案：B解析：CTHBase不是基于Hbase的聚簇表開(kāi)發(fā)框架。云HBASE數(shù)據(jù)庫(kù)(CT-Hbase)基于開(kāi)源HBase引擎,支持NSQL和二級(jí)索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。21.在Webhcat架構(gòu)中，用戶(hù)能夠通過(guò)安全的HTTPS協(xié)議執(zhí)行以下哪些操作？A、執(zhí)行HiveDDL操作B、運(yùn)行Mapreduce任務(wù)C、運(yùn)行HiveHL任務(wù)D、以上全都正確答案：D解析：在Webhcat架構(gòu)中，用戶(hù)能夠通過(guò)安全的HTTPS協(xié)議執(zhí)行HiveDDL操作、運(yùn)行Mapreduce任務(wù)、運(yùn)行HiveHL任務(wù)22.HBase依賴(lài)()提供消息通信機(jī)制A、ZkeeperB、ChubbyC、RPCD、Scket答案：A解析：ZKeeper是一個(gè)分布式的，開(kāi)放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù)，是Ggle的Chubby一個(gè)開(kāi)源的實(shí)現(xiàn)，是Hadp和Hbase的重要組件。它是一個(gè)為分布式應(yīng)用提供一致性服務(wù)的軟件，提供的功能包括：配置維護(hù)、域名服務(wù)、分布式同步、組服務(wù)等。23.在Mapper類(lèi)中，共有4個(gè)函數(shù)：setup()、map()、()、run()。A、Reducer()B、cleanup()C、Split()D、lcal()答案：B解析：在Mapper類(lèi)中，共有4個(gè)函數(shù)：setup（）、map（）、cleanup（）、run（）。24.kafka-clustermirrring工具可以實(shí)現(xiàn)以下哪個(gè)功能（）A、kafka集群數(shù)據(jù)同步方案B、kafka單集群內(nèi)數(shù)據(jù)備份C、kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全部不對(duì)答案：A解析：kafka-clustermirrring工具可以實(shí)現(xiàn)kafka集群數(shù)據(jù)同步方案25.FusininsightHD系統(tǒng)中Hive不支持的存儲(chǔ)格式包括？A、TextfileB、SequencefileC、RCFILED、Hfile答案：D解析：FusininsightHD系統(tǒng)中Hive不支持的存儲(chǔ)格式包括Hfile。Textfile文本文件SequencefilesequenceFile文件是Hadp用來(lái)存儲(chǔ)二進(jìn)制形式的[Key,Value]對(duì)而設(shè)計(jì)的一種平面文件(FlatFile)。RCFile文件格式是FaceBk開(kāi)源的一種Hive的文件存儲(chǔ)格式，首先將表分為幾個(gè)行組，對(duì)每個(gè)行組內(nèi)的數(shù)據(jù)進(jìn)行按列存儲(chǔ)，每一列的數(shù)據(jù)都是分開(kāi)存儲(chǔ)，正是先水平劃分，再垂直劃分的理念。HFile是HBase存儲(chǔ)數(shù)據(jù)的文件組織形式。26.關(guān)于數(shù)據(jù)分析報(bào)告錯(cuò)誤的是（）。A、展示分析結(jié)果B、驗(yàn)證分析質(zhì)量C、展示分析過(guò)程D、提供決策依據(jù)答案：C解析：數(shù)據(jù)分析報(bào)告用來(lái)展示分析結(jié)果，驗(yàn)證分析質(zhì)量以及提供決策依據(jù)https://zhuanlan.zhihu./p/53857057數(shù)據(jù)分析報(bào)告—項(xiàng)目可行性判斷的重要依據(jù)。27.UMP系統(tǒng)中的角色不包括A、Cntrller服務(wù)器B、Prxy服務(wù)器C、Agent服務(wù)器D、HDFS服務(wù)器答案：D解析：UMP系統(tǒng)中的角色包括Cntrller服務(wù)器、Web控制臺(tái)、Prxy服務(wù)器、Agent服務(wù)器、日志分析服務(wù)器、信息統(tǒng)計(jì)服務(wù)器、愚公系統(tǒng)；依賴(lài)的開(kāi)源組件包括Mnesia、RabbitMQ、ZKeeper和LVS。28.Hive是基于Hadp的數(shù)據(jù)倉(cāng)庫(kù)軟件，可以査詢(xún)和管理PB級(jí)別的分布式數(shù)據(jù)。以下關(guān)于hive特性的描述不正確的是？A、靈活方便的ETLB、易用易編程C、可直接訪可HDFS文件以及HbaseD、僅支持mapreducet計(jì)算引擎答案：D解析：目前Hive支持MapReduce、Tez和Spark3種計(jì)算引擎29.創(chuàng)建Lader作業(yè)中，可以在以下哪個(gè)步驟中設(shè)置過(guò)濾器類(lèi)型（）A、輸入設(shè)置B、轉(zhuǎn)換C、基本信息D、輸出答案：A解析：創(chuàng)建Lader作業(yè)中，可以在輸入設(shè)置中設(shè)置過(guò)濾器類(lèi)型30.YARN的基于標(biāo)準(zhǔn)調(diào)度，是對(duì)下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化？A、AppmasterB、ResurcemanagerC、NdemanagerD、Cntainer答案：C解析：YARN的基于標(biāo)準(zhǔn)調(diào)度，是對(duì)Ndemanager進(jìn)行標(biāo)簽化31.下列哪些語(yǔ)句關(guān)于Java內(nèi)存回收的說(shuō)明是正確的？A、程序員必須創(chuàng)建一個(gè)線程來(lái)釋放內(nèi)存B、內(nèi)存回收程序負(fù)責(zé)釋放無(wú)用內(nèi)存C、內(nèi)存回收程序允許程序員直接釋放內(nèi)存D、內(nèi)存回收程序可以在指定的時(shí)間釋放內(nèi)存對(duì)象答案：B解析：A：垃圾回收程序是一般是在堆上分配空間不夠的時(shí)候會(huì)自己進(jìn)行一次GC（垃圾收集），程序員不需要也不能主動(dòng)釋放內(nèi)存。B：Java的內(nèi)存釋放由垃圾回收程序來(lái)進(jìn)行釋放C：在Java里，內(nèi)存的釋放由垃圾回收程序進(jìn)行管理，程序員不能直接進(jìn)行釋放。D：程序員可以調(diào)用System.gc()運(yùn)行垃圾回收器，但是不能指定時(shí)間。32.Hadp集群中存在的最主要瓶頸是（）。A、CPUB、網(wǎng)絡(luò)C、磁盤(pán)I0D、內(nèi)存答案：C解析：面對(duì)大數(shù)據(jù)，讀取數(shù)據(jù)需要經(jīng)過(guò)I，這里可以把I理解為水的管道。管道越大越強(qiáng)，我們對(duì)于T級(jí)的數(shù)據(jù)讀取就越快。所以I的好壞，直接影響了集群對(duì)于數(shù)據(jù)的處理。33.下面與Zkeepe類(lèi)似的框架是哪一個(gè)？（）A、PrtbufB、JavaC、KafkaD、Chubby答案：D解析：顧名思義zkeeper就是動(dòng)物園管理員，他是用來(lái)管hadp（大象）、Hive(蜜蜂)、pig(小豬)的管理員，Zkeeper:是一個(gè)分布式的、開(kāi)源的程序協(xié)調(diào)服務(wù)，是hadp項(xiàng)目下的一個(gè)子項(xiàng)目。他提供的主要功能包括：配置管理、名字服務(wù)、分布式鎖、集群管理。A：PrtclBuffers是一種輕便高效的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)格式，可以用于結(jié)構(gòu)化數(shù)據(jù)串行化，或者說(shuō)序列化。B：面向?qū)ο蟮木幊陶Z(yǔ)言；C：Kafka是由Apache軟件基金會(huì)開(kāi)發(fā)的一個(gè)開(kāi)源流處理平臺(tái)，由Scala和Java編寫(xiě)。D：Chubby是一個(gè)面向松耦合分布式系統(tǒng)的鎖服務(wù)，通常用于為一個(gè)由大量小型計(jì)算機(jī)構(gòu)成的松耦合分布式系統(tǒng)提供高可用的鎖服務(wù)。一個(gè)分布式鎖服務(wù)的目的是允許他的客戶(hù)端進(jìn)程同步彼此的操作，并對(duì)當(dāng)前所處環(huán)境的基本狀態(tài)信息達(dá)成一致。34.以下哪個(gè)部分不是一篇數(shù)據(jù)分析報(bào)告必須有的。（）A、標(biāo)題B、正文C、結(jié)論與建議D、附錄答案：D解析：附錄不是一篇數(shù)據(jù)分析報(bào)告必須有的。35.以下關(guān)于Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫(xiě)流程說(shuō)法正確的是？A、僅寫(xiě)入內(nèi)存B、同時(shí)寫(xiě)入磁盤(pán)和內(nèi)存C、先寫(xiě)入內(nèi)存再寫(xiě)入磁盤(pán)D、先寫(xiě)磁盤(pán)再寫(xiě)內(nèi)存答案：D解析：Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫(xiě)流程是先寫(xiě)磁盤(pán)再寫(xiě)內(nèi)存36.在fusinlnsigh產(chǎn)品中,關(guān)于kafka的tpic,以下描述不正確的是？A、tpic的partitin數(shù)量可以創(chuàng)建時(shí)配置B、每個(gè)tpic只能被分成一個(gè)partitin區(qū)C、每條發(fā)布到kafka的消息都有一個(gè)類(lèi)別,這個(gè)類(lèi)別被稱(chēng)為tpic.也可以理解為一個(gè)存儲(chǔ)消息的隊(duì)列D、每個(gè)partitin在存儲(chǔ)層面對(duì)應(yīng)一個(gè)lg文件,lg文件中記錄了所有的消息數(shù)據(jù)答案：B解析：Kafka中Tpic被分成多個(gè)Partitin分區(qū)。tpic是一個(gè)邏輯概念，Partitin是最小的存儲(chǔ)單元，掌握著一個(gè)Tpic的部分?jǐn)?shù)據(jù)。每個(gè)Partitin都是一個(gè)單獨(dú)的lg文件，每條記錄都以追加的形式寫(xiě)入。37.HBase表中每個(gè)cell的多版本是通過(guò)（）表示的。A、timestampB、rwkeyC、blckidD、cellid答案：A解析：HBase通過(guò)以下幾個(gè)要素來(lái)定位一個(gè)cell：表（table），行（rwkey），列族（clumnfamily），列標(biāo)識(shí)（clumnqualifier），時(shí)間戳（timestamp）。每個(gè)Cell可能有多個(gè)版本，它們之間用時(shí)間戳（TimeStamp）區(qū)分。38.FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類(lèi)型是以下哪項(xiàng)？A、graph-fileB、binary-fileC、text-fileD、sequence-file答案：B解析：binary-file是FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類(lèi)型39.下面與HDFS類(lèi)似的框架是？A、NTFSB、FAT32C、GFSD、EXT3答案：C解析：HDF（HarmnySDriverFundatin）驅(qū)動(dòng)框架，為驅(qū)動(dòng)開(kāi)發(fā)者提供驅(qū)動(dòng)框架能力，包括驅(qū)動(dòng)加載、驅(qū)動(dòng)服務(wù)管理和驅(qū)動(dòng)消息機(jī)制。40.關(guān)于Dataset,下列說(shuō)法不正確的是？A、Dataset不需要反序列化就可執(zhí)行大部分操作B、Dataset是一個(gè)由特定域的對(duì)象組成的強(qiáng)類(lèi)型集合C、Dataset與RDD高度類(lèi)似＞性能比RDD好D、Dataset執(zhí)行srt,filter,shuffle登操作需要進(jìn)行反序列化答案：D解析：Dataset執(zhí)行srt,filter,shuffle登操作不需要進(jìn)行反序列化。Java序列化就是指把Java對(duì)象轉(zhuǎn)換為字節(jié)序列的過(guò)程Java反序列化就是指把字節(jié)序列恢復(fù)為Java對(duì)象的過(guò)程。序列化最重要的作用：在傳遞和保存對(duì)象時(shí).保證對(duì)象的完整性和可傳遞性。對(duì)象轉(zhuǎn)換為有序字節(jié)流,以便在網(wǎng)絡(luò)上傳輸或者保存在本地文件中。反序列化的最重要的作用：根據(jù)字節(jié)流中保存的對(duì)象狀態(tài)及描述信息，通過(guò)反序列化重建對(duì)象。41.Zkeeper在分布式應(yīng)用中主要的作用不包括以下哪些選項(xiàng)？A、選舉Master節(jié)點(diǎn)B、保證各節(jié)點(diǎn)上數(shù)據(jù)的C、分配集群資源D、存儲(chǔ)及群中答案：C解析：資源分配是Spark任務(wù)中需要深入理解42.Hive是以（）技術(shù)為基礎(chǔ)的數(shù)據(jù)倉(cāng)庫(kù)。A、HDFSB、MAPREDUCEC、HADPD、HBASE答案：C解析：Hive是基于Hadp的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具，用來(lái)進(jìn)行數(shù)據(jù)提取、轉(zhuǎn)化、加載，這是一種可以存儲(chǔ)、查詢(xún)和分析存儲(chǔ)在Hadp中的大規(guī)模數(shù)據(jù)的機(jī)制。A:Hadp分布式文件系統(tǒng)(HDFS)是指被設(shè)計(jì)成適合運(yùn)行在通用硬件上的分布式文件系統(tǒng)。B:MapReduce是一種編程模型，用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算。D:HBase是一個(gè)分布式的、面向列的開(kāi)源數(shù)據(jù)庫(kù)43.關(guān)于fusinInsightHDStreaming的Supervisr描述正確的是（）A、Supervisr是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件B、Supervisr負(fù)責(zé)接受Nimbus分配的任務(wù),啟動(dòng)和停止屬于自己管理的Wrker進(jìn)程C、Supervisr負(fù)責(zé)資源分配和任務(wù)調(diào)度D、supervisr是運(yùn)行具體處理邏輯的過(guò)程答案：B解析：Blt是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件；Nimbus:負(fù)責(zé)資源分配和任務(wù)調(diào)度；Supervisr:負(fù)責(zé)接收Nimbus分配的任務(wù)44.在Spark生態(tài)組件中，哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。（）A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案：A解析：1.在Spark生態(tài)組件中，sparkcre可用于復(fù)雜的批量數(shù)據(jù)處理2.SparkStreaming是一個(gè)對(duì)實(shí)時(shí)數(shù)據(jù)流進(jìn)行高吞吐、高容錯(cuò)的流式處理系統(tǒng)3.MLlib：是Spark實(shí)現(xiàn)一些常見(jiàn)的機(jī)器學(xué)習(xí)算法和實(shí)用程序4.SparkSQL是基于sparkcre提供的一個(gè)用來(lái)處理結(jié)構(gòu)化數(shù)據(jù)的模塊（庫(kù)）45.關(guān)于hive與傳統(tǒng)據(jù)倉(cāng)庫(kù)的對(duì)比，以下描述錯(cuò)誤的是？A、數(shù)據(jù)存儲(chǔ)獨(dú)位于數(shù)據(jù)存儲(chǔ)之外，從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高，而傳統(tǒng)數(shù)據(jù)，靈活性低B、Hive基于HDFS存儲(chǔ)理論上存儲(chǔ)量可無(wú)限擴(kuò)展，而傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)量會(huì)有上限C、由于hive的數(shù)據(jù)存儲(chǔ)在HDFS中，所以可以保證數(shù)據(jù)的高容錯(cuò)，高可靠D、由于Hive基于大數(shù)據(jù)平臺(tái)，所以查詢(xún)效率比傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)快答案：D解析：Hive在加載數(shù)據(jù)的過(guò)程中不會(huì)對(duì)數(shù)據(jù)進(jìn)行任何處理，甚至不會(huì)對(duì)數(shù)據(jù)進(jìn)行掃描，因此也沒(méi)有對(duì)數(shù)據(jù)中的某些Key建立索引。Hive要訪問(wèn)數(shù)據(jù)中滿(mǎn)足條件的特定值時(shí)，需要暴力掃描整個(gè)數(shù)據(jù)，因此訪問(wèn)延遲較高46.關(guān)于HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)的區(qū)別說(shuō)法錯(cuò)誤的是A、數(shù)據(jù)類(lèi)型：關(guān)系數(shù)據(jù)庫(kù)采用關(guān)系模型，具有豐富的數(shù)據(jù)類(lèi)型和存儲(chǔ)方式，HBase則采用了更加簡(jiǎn)單的數(shù)據(jù)模型，它把數(shù)據(jù)存儲(chǔ)為未經(jīng)解釋的字符串B、數(shù)據(jù)操作：關(guān)系數(shù)據(jù)庫(kù)中包含了豐富的操作，其中會(huì)涉及復(fù)雜的多表連接。HBase則不存在復(fù)雜的表與表之間的關(guān)系，只有簡(jiǎn)單的插入、查詢(xún)、刪除、清空等，因?yàn)镠Base在設(shè)計(jì)上就避免了復(fù)雜的表和表之間的關(guān)系C、存儲(chǔ)模式：關(guān)系數(shù)據(jù)庫(kù)是基于行模式存儲(chǔ)的。HBase是基于列存儲(chǔ)的，每個(gè)列族都由幾個(gè)文件保存，不同列族的文件是分離的D、數(shù)據(jù)維護(hù)：在關(guān)系數(shù)據(jù)庫(kù)中執(zhí)行更新操作時(shí)，并不會(huì)刪除數(shù)據(jù)舊的版本，而是生成一個(gè)新的版本，舊有的版本仍然保留。在HBase中，更新操作會(huì)用最新的當(dāng)前值去替換記錄中原來(lái)的舊值，舊值被覆蓋后就不會(huì)存在。答案：D解析：數(shù)據(jù)維護(hù)：在關(guān)系數(shù)據(jù)庫(kù)中，更新操作會(huì)用最新的當(dāng)前值去替換記錄中的原來(lái)的舊值，舊值被覆蓋夠就不會(huì)存在，而在HBase中執(zhí)行更新操作時(shí)，不糊并不會(huì)刪除數(shù)據(jù)舊的版本，而是生成一個(gè)新的版本，舊的有的版本保留。47.以下哪類(lèi)數(shù)據(jù)不屬于半結(jié)構(gòu)化數(shù)據(jù)？A、HTMLB、XMLC、二維表D、JSN答案：C解析：二維表,數(shù)據(jù)結(jié)構(gòu),是一個(gè)關(guān)系名,意思是指關(guān)系模型中,數(shù)據(jù)結(jié)構(gòu)的表示方法48.在Hadp生態(tài)組件中，哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。（）A、MapReduce、HiveB、ImpalaC、StrmD、Mahut答案：A解析：在Hadp生態(tài)組件中，MapReduce、Hive可用于復(fù)雜的批量數(shù)據(jù)處理。49.以下關(guān)于HiveSQL基本操作描述正確的是（）A、創(chuàng)建外部表必須要指定Lcatin信息B、創(chuàng)建外部表使用external關(guān)鍵字，創(chuàng)建普通表需要指定internal關(guān)鍵字C、加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)必須是HDFS的一個(gè)路徑D、創(chuàng)建表時(shí)可以指定列分割符答案：D解析：建立外部表可以不指定Lcatin，會(huì)在默認(rèn)在/hive/warehuse/數(shù)據(jù)庫(kù)名稱(chēng)/表名,建立目錄。創(chuàng)建內(nèi)部表時(shí)不需要關(guān)鍵字。加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)不一定是HDFS的一個(gè)路徑50.HDFS的副本放置策略中，同一機(jī)架不同的服務(wù)器之間的距離是（）A、3B、2C、1D、4答案：B解析：HDFS的副本放置策略中，同一機(jī)架不同的服務(wù)器之間的距離是251.關(guān)于HBaseRegin的定位說(shuō)法錯(cuò)誤的是A、元數(shù)據(jù)表，又名.META.表，存儲(chǔ)了Regin和Regin服務(wù)器的映射關(guān)系。當(dāng)HBase表很大時(shí)，.META.表也會(huì)被分裂成多個(gè)ReginB、為了加快訪問(wèn)速度，.META.表的全部Regin都會(huì)被保存在內(nèi)存中C、根數(shù)據(jù)表，又名-RT-表，記錄所有元數(shù)據(jù)的具體位置。-RT-表只有唯一一個(gè)Regin，名字是在程序中被寫(xiě)死的。Zkeeper文件記錄了-RT-表的位置D、為了加速尋址，客戶(hù)端會(huì)緩存位置信息，尋址過(guò)程客戶(hù)端只需要詢(xún)問(wèn)Zkeeper服務(wù)器，不需要連接Master服務(wù)器，由于數(shù)據(jù)放在內(nèi)存中，因此不存在緩存失效問(wèn)題。答案：D解析：客戶(hù)端訪問(wèn)數(shù)據(jù)時(shí)的“三級(jí)尋址”?為了加速尋址，客戶(hù)端會(huì)緩存位置信息，同時(shí)，需要解決緩存失效問(wèn)題?尋址過(guò)程客戶(hù)端只需要詢(xún)問(wèn)Zkeeper服務(wù)器，不需要連接Master服務(wù)器52.HBasett靠()存儲(chǔ)底層數(shù)據(jù)A、HDFSB、HadpC、MemryD、MapReduce答案：A解析：首先HBase不同于一般的關(guān)系數(shù)據(jù)庫(kù),它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫(kù).另一個(gè)不同的是HBase基于列的而不是基于行的模式.53.關(guān)于HBase下面說(shuō)法正確的是（）。A、HBase?一個(gè)稀疏、多維度、排序的映射表，這張表的索引是行鍵、列B、每個(gè)值是一個(gè)未經(jīng)解釋的字符串，沒(méi)有數(shù)據(jù)類(lèi)型，程序員要自己去對(duì)它進(jìn)C、用戶(hù)在表中存儲(chǔ)數(shù)據(jù)，每一行都有一個(gè)可排序的行鍵和任意多的列D、以上說(shuō)法都正確答案：D解析：Hbase是HadpDatabase的簡(jiǎn)稱(chēng)，Hbase是分布式、面向列的開(kāi)源數(shù)據(jù)庫(kù)（準(zhǔn)確是面向列族）。HDFS為Hbase提供可靠的底層數(shù)據(jù)存儲(chǔ)服務(wù)，MapReduce為Hbase提供高性能的計(jì)算能力，Zkeeper為Hbaset提供穩(wěn)定服務(wù)和Failver機(jī)制，因?yàn)槲覀冋f(shuō)Hbase是一個(gè)通過(guò)大量廉價(jià)的機(jī)器解決海量數(shù)據(jù)的高速存儲(chǔ)和讀取的分布式數(shù)據(jù)庫(kù)解決方案。Hbase的特點(diǎn)：1，海量存儲(chǔ)2，列式存儲(chǔ)3，極易擴(kuò)張4，高并發(fā)5，稀疏（主要針對(duì)Hbase的靈活性）54.下列不可作為java語(yǔ)言標(biāo)識(shí)符的是A、a1B、1C、1D、11答案：D解析：Java標(biāo)識(shí)符由數(shù)字，字母和下劃線（_），美元符號(hào)（$）或人民幣符號(hào)（￥）組成。在Java中是區(qū)分大小寫(xiě)的，而且還要求首位不能是數(shù)字。55.從數(shù)據(jù)表中查找記錄用以下哪一項(xiàng)（）A、UPDATEB、FINDC、SELECTD、CREATE答案：C解析：SELECT用于查找記錄56.LSM更能保證哪種操作的性能？A、讀B、寫(xiě)C、隨機(jī)讀D、合并答案：B解析：B+索引樹(shù)和lg型（append）文件操作（數(shù)據(jù)庫(kù)WAL日志）是數(shù)據(jù)讀寫(xiě)的兩個(gè)極端。B+樹(shù)讀效率高而寫(xiě)效率差；lg型文件操作寫(xiě)效率高而讀效率差；因此要在排序和lg型文件操作之間做個(gè)折中，于是就引入了lg-structedmergetree模型，通過(guò)名稱(chēng)可以看出LSM既有日志型的文件操作，提升寫(xiě)效率，又在每個(gè)sstable中排序，保證了查詢(xún)效率。57.查看kafkaMTpic的partitin詳細(xì)信息時(shí),使用如下那個(gè)命令？A、bin/kakfa-tpicssh—createB、bin/kakfa-tpicssh—deleteC、bin/kakfa-tpics.sh-listD、bin/kakfa-tpics.sh—describe答案：D解析：使用bin/kakfa-tpicssh—describe查看kafkaMTpic的partitin詳細(xì)信息58.關(guān)于HBaseshell命令，哪個(gè)命令是使表無(wú)效。（）A、alertB、disableC、drpD、以上都不是答案：B解析：1.alter:修改列族模式2.disable：使表無(wú)效3.drp：刪除表59.Kafka集群中，Kafka服務(wù)端部署的角色是A、PrducerB、CnsumerC、ZKeeperD、Brker答案：D解析：一臺(tái)kafka服務(wù)器節(jié)點(diǎn)就是一個(gè)brker,負(fù)責(zé)處理消息讀、寫(xiě)請(qǐng)求,存儲(chǔ)消息,在kafkacluster這一層這里,其實(shí)里面是有很多個(gè)brker一個(gè)集群由多個(gè)brker組成。prducer是向kafkabrker發(fā)消息的客戶(hù)端,cnsumer是向kafkabrker取消息的客戶(hù)端60.LSM含義是？A、日志結(jié)構(gòu)合并樹(shù)B、二叉樹(shù)C、平衡二叉樹(shù)D、長(zhǎng)平衡二叉樹(shù)答案：A解析：LSM-Tree全稱(chēng)是LgStructuredMergeTree，是一種分層，有序，面向磁盤(pán)的數(shù)據(jù)結(jié)構(gòu)，其核心思想是充分了利用了，磁盤(pán)批量的順序?qū)懸h(yuǎn)比隨機(jī)寫(xiě)性能高出很多61.FusininsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作？A、手動(dòng)清除告警B、啟停服務(wù)實(shí)例C、查詢(xún)歷史監(jiān)控D、刪除服務(wù)實(shí)例答案：C解析：FusininsightHD系統(tǒng)審計(jì)日志不可以記錄查詢(xún)歷史監(jiān)控62.關(guān)于hive建表基本描述正確的是()A、不可再修改表名B、可再增加新列C、創(chuàng)建外部表需要制定external關(guān)鍵字D、不可再修改列名答案：C解析：創(chuàng)建外部表需要制定external關(guān)鍵字63.Hbase中以下對(duì)于LSM的描述正確的是（）。A、LSM的讀操作和寫(xiě)操作是獨(dú)立B、LSM的讀操作和寫(xiě)操作不是獨(dú)立C、LSM并不區(qū)分讀和寫(xiě)D、LSM中讀寫(xiě)是同一種操作答案：A解析：LSM中讀操作和寫(xiě)操作相互獨(dú)立，且并不相同64.有一段java應(yīng)用程序，它的主類(lèi)名是a1,那么保存它的源文件名可以是A、a1.javaB、a1.classC、a1D、都對(duì)答案：A解析：1、必須以java結(jié)尾。這樣才能被編輯器javacexe所編輯。2、源文件中如果只有一個(gè)類(lèi)，文件名必須與該類(lèi)名相同。3、輸入命令：pushd路徑（此命令可將當(dāng)前目錄設(shè)為所希望的任一個(gè)已存在的路徑）。4、輸入命令：e：轉(zhuǎn)移到e盤(pán)，然后再輸入cd轉(zhuǎn)移到所希望的已知路徑。65.關(guān)于MapReduce框架中一個(gè)作業(yè)的reduce任務(wù)數(shù)，下列說(shuō)法正確的是（）A、由自定義的Partitiner來(lái)確定B、是分塊總數(shù)目的一半C、可以由用戶(hù)來(lái)自定義，通過(guò)JbCnf.setNumReducetTask（int）來(lái)設(shè)定一個(gè)作業(yè)中reduce的任務(wù)數(shù)目D、由MapReduce隨機(jī)確定其數(shù)目答案：C解析：一個(gè)jb的ReduceTasks數(shù)量是通過(guò)mapreduce.jb.reduces參數(shù)設(shè)置也可以通過(guò)編程的方式，調(diào)用Jb對(duì)象的setNumReduceTasks()方法來(lái)設(shè)置目66.以下命令組成錯(cuò)誤的是（）。A、vim/etc/prfileB、surce/etc/prfileC、hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/y/txt答案：D解析：394、vim/etc/prfile雖然可以進(jìn)入prfile文件,但是對(duì)于普通用戶(hù),無(wú)法修改；etc/prfile:在登錄時(shí),操作系統(tǒng)定制用戶(hù)環(huán)境時(shí)使用的第一個(gè)文件,此文件為系統(tǒng)的每個(gè)用戶(hù)設(shè)置環(huán)境信息,當(dāng)用戶(hù)第一次登錄時(shí),該文件被執(zhí)行。使用命令hadpnamende-frmat對(duì)namende進(jìn)行格式化。hadpfs-cat>從DFS多個(gè)part文件合并拷貝文件到本地文件系統(tǒng)。67.不屬于HDFS優(yōu)勢(shì)是（）?A、時(shí)間快B、超大文件C、大量小文件D、商用硬件答案：A解析：HDFS優(yōu)勢(shì)：1、海量數(shù)據(jù)存儲(chǔ)：HDFS可橫向擴(kuò)展，其存儲(chǔ)的文件可以支持PB級(jí)別或更高級(jí)別的數(shù)據(jù)存儲(chǔ)。2、高容錯(cuò)性：數(shù)據(jù)保存多個(gè)副本，副本丟失后自動(dòng)恢復(fù)?？蓸?gòu)建在廉價(jià)的機(jī)器上，實(shí)現(xiàn)線性擴(kuò)展。當(dāng)集群增加新節(jié)點(diǎn)之后，namende也可以感知，進(jìn)行負(fù)載均衡，將數(shù)據(jù)分發(fā)和備份數(shù)據(jù)均衡到新的節(jié)點(diǎn)上。3、商用硬件：Hadp并不需要運(yùn)行在昂貴且高可靠的硬件4、大文件存儲(chǔ)68.在創(chuàng)建對(duì)象時(shí)必須A、先聲明對(duì)象，然后才能使用對(duì)象B、先聲明對(duì)象，為對(duì)象分配內(nèi)存空間，然后才能使用對(duì)象C、先聲明對(duì)象，為對(duì)象分配內(nèi)存空間，對(duì)對(duì)象初始化，然后才能使用對(duì)象D、上述說(shuō)法都對(duì)答案：C解析：Java就是這樣規(guī)定的69.Hbase的某張表的Rwkey劃分splitkey為9.E.a.z請(qǐng)問(wèn)表里面有幾個(gè)Regin?A、6B、3C、5D、4答案：C解析：Hbase的某張表的Rwkey劃分splitkey為9.E.a.z表里面有5個(gè)Regin70.在Zkeeper和Yarn的協(xié)同工作中，當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí)，StandbyResurcemanager會(huì)從以下哪個(gè)目錄中獲取Applicatin相關(guān)信息（）A、metastreB、StatestreC、StreageD、Warehuse答案：B解析：在Zkeeper和Yarn的協(xié)同工作中，當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí)，StandbyResurcemanager會(huì)從Statestre目錄中獲取Applicatin相關(guān)信息（）71.Kafka集群在運(yùn)行期間直接依賴(lài)于下面哪些組件？A、sparkB、zkeeperC、hdfsD、hbase答案：B解析：ZKeeper作為給分布式系統(tǒng)提供協(xié)調(diào)服務(wù)的工具被kafka所依賴(lài)72.下面與Zkeepe淡似的框架是？A、PrtbufB、JavaC、KafkaD、Chubby答案：D解析：，ZKeeper是一個(gè)分布式服務(wù)框架，是ApacheHadp的一個(gè)子項(xiàng)目，主要用來(lái)解決分布式應(yīng)用中經(jīng)常遇到的一些數(shù)據(jù)管理問(wèn)題，如：統(tǒng)一命名服務(wù)、配置管理、集群管理、分布式鎖、發(fā)布/訂閱等。73.HFile數(shù)據(jù)格式中的KeyValue數(shù)據(jù)格式中Value部分是()。A、擁有復(fù)雜結(jié)構(gòu)的字符串B、字符串C、二進(jìn)制數(shù)據(jù)D、壓縮數(shù)據(jù)答案：C解析：元數(shù)據(jù)是key-value類(lèi)型的值，但元數(shù)據(jù)快只保存元數(shù)據(jù)的value值，元數(shù)據(jù)的key值保存在第五項(xiàng)（元數(shù)據(jù)索引塊）中。74.解壓.tar.gziS尾的HBase壓縮包使用的Linux命令是？A、tar-zxvfB、tar-zxC、tar-sD、tar-nf答案：A解析：tar-zxvf75.Flume用于收集數(shù)據(jù)，其傳輸?shù)臄?shù)據(jù)基本單位是？A、SplitB、BlckC、EventD、Packet答案：C解析：Flume用于收集數(shù)據(jù)，其傳輸?shù)臄?shù)據(jù)基本單位是Event。76.下面哪個(gè)進(jìn)程負(fù)責(zé)MapReduce任務(wù)調(diào)度。A、NameNdeB、JbtrackerC、TaskTrackerD、SecndaryNameNde答案：B解析：Jbtracer負(fù)責(zé)MapReduce任務(wù)調(diào)度77.HFile數(shù)據(jù)格式中的Magic字段用于()。A、存儲(chǔ)隨機(jī)數(shù)，防止數(shù)據(jù)損壞B、存儲(chǔ)數(shù)據(jù)的起點(diǎn)C、存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)D、指定字段的長(zhǎng)度答案：A解析：每一個(gè)HFile內(nèi)部包括多種不同類(lèi)型的塊結(jié)構(gòu)，這些塊結(jié)構(gòu)從邏輯上來(lái)講可歸并為兩類(lèi)。分別用于數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)索引(簡(jiǎn)稱(chēng)數(shù)據(jù)塊和索引塊)78.LSM的讀操作和寫(xiě)操作是獨(dú)立的？A、是。B、否。C、LSM并不區(qū)分讀和寫(xiě)D、LSM中讀寫(xiě)是同一種操作答案：A解析：如果我們對(duì)寫(xiě)性能特別敏感，我們最好怎么做？——Appendnly：所有寫(xiě)操作都是將數(shù)據(jù)添加到文件末尾。這樣做的寫(xiě)性能是最好的，大約等于磁盤(pán)的理論速度（200~300MB/s）。79.fusininsight對(duì)于管理操作，下列錯(cuò)誤的是？A、可對(duì)服務(wù)進(jìn)行啟停重啟B、可以添加和卸載服務(wù)C、常用服務(wù)隱藏或顯示D、可查看服務(wù)的當(dāng)前狀態(tài)答案：C解析：可設(shè)置不常用的服務(wù)隱藏或顯示80.Hive中的數(shù)據(jù)類(lèi)型，下面說(shuō)正確的是（）。A、TINYINT,1個(gè)字節(jié)（8位）有符號(hào)整數(shù)B、SMALLINT，2字節(jié)（16位）有符號(hào)整數(shù)C、INT,4個(gè)字節(jié)（32位）有符號(hào)整數(shù)D、以上都正確答案：D解析：1.Hive中的數(shù)據(jù)類(lèi)型分為兩類(lèi)：基本類(lèi)型和復(fù)雜類(lèi)型2.基本類(lèi)型包含：tinyint，smallint，int，bigint，flat，duble，blean，string，timestamp，binary3.復(fù)雜類(lèi)型：array，map和structa.array：數(shù)組類(lèi)型，對(duì)應(yīng)了Java中的集合或者數(shù)組。81.以下哪個(gè)不是HDFS的守護(hù)進(jìn)程A、SecndaryNameNdeB、NameNdeC、MrappMaster/YarnChildD、DataNde答案：C解析：namende\Secndnamende\Datande\Jbtracker\Tasktracker都是守護(hù)進(jìn)程82.以下哪個(gè)channel類(lèi)型的數(shù)據(jù)不會(huì)持久化（）?A、FileChannelB、MemryChannelC、JDBCChannelD、HDFSChannel答案：B解析：JDBCChannel的數(shù)據(jù)類(lèi)型不會(huì)持久化83.hadp系統(tǒng)中YARN資源的抽象是用什么表示？A、內(nèi)存B、CPUC、CntainerD、磁盤(pán)空間答案：C解析：hadp系統(tǒng)中YARN資源的抽象是用Cntainer表示84.Spark是用以下哪種編程語(yǔ)言實(shí)現(xiàn)的（）？A、CB、C++C、JAVAD、Scala答案：D解析：Scala是Spark的原生語(yǔ)言85.關(guān)系數(shù)據(jù)庫(kù)已經(jīng)流行很多年，Hadp已經(jīng)有了HDFS和MapReduce，關(guān)于需要HBase說(shuō)法錯(cuò)誤的是A、Hadp可以很好地解決大規(guī)模數(shù)據(jù)的離線批量處理問(wèn)題，但是，受限于HadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制，使得Hadp無(wú)法滿(mǎn)足大規(guī)模數(shù)據(jù)實(shí)時(shí)處理應(yīng)用的需求B、HDFS面向隨機(jī)訪問(wèn)模式，不是批量訪問(wèn)模式C、傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫(kù)無(wú)法應(yīng)對(duì)在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問(wèn)題（分庫(kù)分表也不能很好解決）D、傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù)；空列浪費(fèi)存儲(chǔ)空間答案：B解析：Hadp可以很少地解決大規(guī)模數(shù)據(jù)的離線批量處理問(wèn)題，但是，受限于hadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制，使得hadp無(wú)法滿(mǎn)足大規(guī)模數(shù)據(jù)實(shí)施處理應(yīng)用的需求HDFS面向批量訪問(wèn)模式，不是隨機(jī)訪問(wèn)模式。傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫(kù)無(wú)法應(yīng)對(duì)在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問(wèn)題（分庫(kù)分表也不能很好的解決）傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù)，空列浪費(fèi)存儲(chǔ)空間因此，業(yè)界出現(xiàn)了一類(lèi)面向半結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和處理的高擴(kuò)展、低寫(xiě)入、查詢(xún)延遲的系統(tǒng)，例如，鍵值數(shù)據(jù)庫(kù)、文檔數(shù)據(jù)庫(kù)和列族數(shù)據(jù)庫(kù)（如BigTable和HDase）Hbase已經(jīng)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域和傳統(tǒng)行業(yè)的眾多在線模式數(shù)據(jù)分析處理系統(tǒng)中86.HBase表中每個(gè)cell的多版本是通過(guò)（）表示的？A、timestampB、rwkeyC、blckidD、cellid答案：A解析：每個(gè)Cell可能有多個(gè)版本，它們之間用時(shí)間戳（TimeStamp）區(qū)分。87.為了保障流應(yīng)用的快照存儲(chǔ)的可靠性，快照主要存儲(chǔ)在哪里？A、jbmanager的內(nèi)存中B、可靠性高的單機(jī)數(shù)據(jù)庫(kù)中C、本地文件系統(tǒng)中D、hdfs中答案：D解析：為了保障流應(yīng)用的快照存儲(chǔ)的可靠性，快照主要存儲(chǔ)在hdfs中88.關(guān)于HBase的HLg工作原理說(shuō)法錯(cuò)誤的是A、分布式環(huán)境必須要考慮系統(tǒng)出錯(cuò)。HBase采用HLg保證系統(tǒng)恢復(fù)B、HBase系統(tǒng)為每個(gè)Regin服務(wù)器配置了一個(gè)HLg文件，它是一種預(yù)寫(xiě)式日志（WriteAheadLg）C、用戶(hù)更新數(shù)據(jù)不需要先寫(xiě)入日志后，才能寫(xiě)入MemStre緩存，并且，直到MemStre緩存內(nèi)容對(duì)應(yīng)的日志已經(jīng)寫(xiě)入磁盤(pán)，該緩存內(nèi)容才能被刷寫(xiě)到磁盤(pán)D、發(fā)生故障后，系統(tǒng)會(huì)根據(jù)每條日志記錄所屬的Regin對(duì)象對(duì)HLg數(shù)據(jù)進(jìn)行拆分，分別放到相應(yīng)Regin對(duì)象的目錄下，然后，再將失效的Regin重新分配到可用的Regin服務(wù)器中，并把與該Regin對(duì)象相關(guān)的HLg日志記錄也發(fā)送給相應(yīng)的Regin服務(wù)器答案：C解析：Regin服務(wù)器領(lǐng)取到分配給自己的Regin對(duì)象以及與之相關(guān)的HLg日志記錄以后，會(huì)重新做一遍日志記錄中的各種操作，把日志記錄中的數(shù)據(jù)寫(xiě)入到MemStre緩存中，然后，刷新到磁盤(pán)的StreFile文件中，完成數(shù)據(jù)恢復(fù)。89.釆用Flume傳輸數(shù)據(jù)過(guò)程中，為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù)，推薦使用以下哪種channel類(lèi)型？A、MemryChannelsB、FileChannelC、JDBCChannelD、HDFSChannel答案：B解析：釆用Flume傳輸數(shù)據(jù)過(guò)程中，為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù)，推薦使用FileChannel90.加載數(shù)據(jù)到Hive表，哪種方式不正確？A、直接將本地路徑的文件lad到Hive表中B、將HDFS上的文件lad到Hive表中C、Hive支持Insertint單條記錄的方法，所以可以直接在命令行插入單條記錄D、將其他表的結(jié)果集insertint到Hive表答案：C解析：Hive不支持Insertint單條記錄的方法91.關(guān)于HadpMapReduce分片（spit）概念，下列說(shuō)法不正確的是（）。A、Hadp為每個(gè)split創(chuàng)建一個(gè)Map任務(wù)B、split的多少?zèng)Q定了Map任務(wù)的數(shù)目C、大多數(shù)情況下，理想的分片大小是一個(gè)HDFS塊對(duì)應(yīng)一個(gè)spitD、split是一個(gè)物理概念答案：D解析：split不是一個(gè)物理概念，是一個(gè)概念上的切片，blck是物理概念。92.以下選項(xiàng)中，不屬于信息時(shí)代的定律的是()A、吉爾德定律B、摩爾定律C、麥特卡爾夫定律D、達(dá)律多定律答案：A解析：吉爾德定律(Gilder'sLaw)又稱(chēng)為勝利者浪費(fèi)定律，由喬治·吉爾德提出，最為成功的商業(yè)運(yùn)作模式是價(jià)格最低的資源將會(huì)被盡可能的消耗，以此來(lái)保存最昂貴的資源。.吉爾德定律(Gilder'sLaw)被描述為：在未來(lái)25年，主干網(wǎng)的帶寬每6個(gè)月增長(zhǎng)一倍，12個(gè)月增長(zhǎng)兩倍。.其增長(zhǎng)速度是摩爾定律預(yù)測(cè)的CPU增長(zhǎng)速度的3倍，并預(yù)言將來(lái)上網(wǎng)會(huì)免費(fèi)。.93.Javaapplicatin中的主類(lèi)需包含main方法，main方法的返回類(lèi)型是什么？A、intB、flatC、dubleD、vid答案：D解析：vid，即不返回對(duì)象，main方法是程序執(zhí)行的入口，main方法也不需要初始化對(duì)象就能執(zhí)行94.關(guān)于Hadp生態(tài)系統(tǒng)軟件說(shuō)法錯(cuò)誤的是A、HDFS是分布式文件系統(tǒng)B、YARN是資源管理和調(diào)度器C、Tez是運(yùn)行在YARN之上的下一代Hadp查詢(xún)處理框架D、Hive是Hadp上的數(shù)據(jù)倉(cāng)庫(kù)，為了提高效率，可以越過(guò)HDFS直接管理數(shù)據(jù)的存儲(chǔ)答案：D解析：hive的表使用的默認(rèn)存儲(chǔ)是hdfs的文件系統(tǒng)，相當(dāng)于表的數(shù)據(jù)是存儲(chǔ)在hdfs文件系統(tǒng)中的。因此無(wú)法越過(guò)HDFS直接管理數(shù)據(jù)的存儲(chǔ)95.以下哪個(gè)方法用于定義線程的執(zhí)行體？A、start()B、init()C、run()D、synchrnized()答案：C解析：通過(guò)繼承Thread類(lèi)來(lái)創(chuàng)建并啟動(dòng)線程的步驟如下：定義Thread類(lèi)的子類(lèi)，并重寫(xiě)該類(lèi)的run()方法,該run()方法將作為線程執(zhí)行體。創(chuàng)建Thread子類(lèi)的實(shí)例，即創(chuàng)建了線程對(duì)象。調(diào)用線程對(duì)象的start()方法來(lái)啟動(dòng)該線程。96.哪個(gè)命令是刪除文件的？A、dfs-clearB、dfs-IsC、dfs-rmD、dfs-del答案：C解析：dfs-rm命令是用來(lái)刪除文件的。dfs-clear沒(méi)找到dfs-Is沒(méi)找到dfs-del沒(méi)找到97.大數(shù)據(jù)的核心價(jià)值是（）。A、數(shù)據(jù)交易B、數(shù)據(jù)分析C、數(shù)據(jù)融合D、數(shù)據(jù)處理答案：B解析：大數(shù)據(jù)的核心價(jià)值是數(shù)據(jù)分析98.HDFS中的數(shù)據(jù)塊（blck）默認(rèn)保存幾份？（）A、3份B、2份C、1份D、不確定答案：A解析：HDFS中的數(shù)據(jù)塊（blck）默認(rèn)保存3份，每份默認(rèn)為128M99.Kafka集群中,Kafka服務(wù)端的角色是？A、BrkerB、CnsumerC、ZkeeperD、Prducer答案：A解析：Kafka集群中,Kafka服務(wù)端的角色是Brker。Cnsumer就是負(fù)責(zé)從Kafka集群中消費(fèi)消息數(shù)據(jù)的應(yīng)用程序Zkeeperl是一個(gè)開(kāi)源的分布式的，為分布式框架提供協(xié)調(diào)服務(wù)的Apache項(xiàng)目。Prducer就是負(fù)責(zé)向Kafka集群中寫(xiě)入消息數(shù)據(jù)的應(yīng)用程序100.萬(wàn)維網(wǎng)之父是（）。A、彼得?德魯克B、舍恩伯格C、蒂姆■伯納斯-李D、斯科特■布朗答案：C解析：萬(wàn)維網(wǎng)之父是蒂姆·伯納斯·李101.關(guān)于HDFS集群中的DataNde的描述不正確的是？A、—個(gè)DataNde上存儲(chǔ)的所有數(shù)據(jù)塊可以有相同的B、存儲(chǔ)客戶(hù)端上傳的數(shù)據(jù)的數(shù)據(jù)塊C、DataNde之間可以互相通信D、響應(yīng)客戶(hù)端的所有讀寫(xiě)數(shù)據(jù)請(qǐng)求,為客戶(hù)端的存儲(chǔ)和讀取數(shù)據(jù)提供支撐答案：A解析：出于安全性和高可用性考慮，并不會(huì)把一個(gè)blck的多個(gè)副本放在同一個(gè)datande上102.下列關(guān)于HadpAPI的說(shuō)法錯(cuò)誤的是（）。A、Hadp的API只適用于HDFS文件系統(tǒng)B、Cnfiguratin類(lèi)的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D、FSDatalnputStream是java.i.DatalnputStream的子類(lèi)答案：A解析：Hadp的API是通用的，既可以適用于HDFS，又可以適用于Hbase、Mapreduce等103.下列數(shù)據(jù)結(jié)構(gòu)具有記憶功能的是？A、隊(duì)列B、循環(huán)隊(duì)列C、棧D、順序表答案：C解析：具有記憶功能的是棧104.FusininsightHD系統(tǒng)中，下面哪個(gè)方法不能查看到Lader作業(yè)執(zhí)行的結(jié)果（）A、通過(guò)LaderUI界面查看B、通過(guò)YARN任務(wù)管理C、Ndemanager查看D、通過(guò)Manager的查看答案：C解析：FusininsightHD系統(tǒng)中，使用Ndemanager查看不能查看到Lader作業(yè)執(zhí)行的結(jié)果105.Hbase中的Regin是由哪個(gè)服務(wù)進(jìn)程來(lái)管理的？A、HreginserverB、ZkeeperC、MasterD、Datande答案：A解析：Hbase中的Regin是由Hreginserver來(lái)管理的106.如下哪項(xiàng)不是ZKeeper的關(guān)鍵特性（）?A、最終一致性B、延時(shí)性C、可靠性D、等待無(wú)關(guān)性答案：B解析：ZKeeper的關(guān)鍵特性包括最終一致性，可靠性，等待無(wú)關(guān)性107.使用Hbase客戶(hù)端批量寫(xiě)入10條數(shù)據(jù)，某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,請(qǐng)問(wèn)寫(xiě)入這10條數(shù)據(jù)需要向該HreginServer發(fā)送幾次RPC請(qǐng)求？A、10B、6C、2D、1答案：D解析：使用Hbase客戶(hù)端批量寫(xiě)入10條數(shù)據(jù)，某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,寫(xiě)入這10條數(shù)據(jù)需要向該HreginServer發(fā)送1次RPC請(qǐng)求108.以下哪個(gè)不屬于Hadp中Mapreduce組件的特點(diǎn)？A、高容錯(cuò)B、良好的擴(kuò)展性C、實(shí)時(shí)計(jì)算D、易于編程答案：C解析：高度抽象的編程思想，良好的擴(kuò)展性，高容錯(cuò)性，適用于并行計(jì)算和離線計(jì)算109.關(guān)于HBase和BigTable說(shuō)法錯(cuò)誤的是A、HBase是一個(gè)高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫(kù)，是谷歌BigTable的開(kāi)源實(shí)現(xiàn)，主要用來(lái)存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)B、BigTable和HBase均采用Chubby提供協(xié)同服務(wù)管理C、BigTable和HBase都是一個(gè)分布式存儲(chǔ)系統(tǒng)D、HBase的目標(biāo)是處理非常龐大的表，可以通過(guò)水平擴(kuò)展的方式，利用廉價(jià)計(jì)算機(jī)集群處理由超過(guò)10億行數(shù)據(jù)和數(shù)百萬(wàn)列元素組成的數(shù)據(jù)表答案：B解析：BigTable是一個(gè)分布式存儲(chǔ)系統(tǒng)，它利用谷歌提出的MapReduce分布式并行計(jì)算模型來(lái)處理海量數(shù)據(jù)，使用谷歌分布式文件系統(tǒng)GFS作為底層數(shù)據(jù)存儲(chǔ)，采用Chubby提供協(xié)同服務(wù)管理。HadpDatabase，是一個(gè)高可靠性、高性能、面向列、可伸縮、實(shí)時(shí)讀寫(xiě)的分布式數(shù)據(jù)庫(kù)。利用HadpHDFS作為其文件存儲(chǔ)系統(tǒng),利用Zkeeper作為其分布式協(xié)同服務(wù)主要用來(lái)存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)。110.使用JAVAAPI進(jìn)行HBase表數(shù)據(jù)添加操作，以下命令輸寫(xiě)正確的是()。cA、HTable.add(newPut(Bytes.tBytes(rw));B、HTable.insert(newPut(Bytes.tBytes(rw))C、HTable.putfnewPut(Bytes.tBytes(rw));D、HTable.updatefnewPut(Bytes.tBytes(rw))答案：C解析：即table.get(table).scan();111.在Java中，一個(gè)類(lèi)可同時(shí)定義許多同名的方法，這些方法的形式參數(shù)個(gè)數(shù)、類(lèi)型或順序各不相同，傳回的值也可以不相同。這種面向?qū)ο蟪绦虻奶匦苑Q(chēng)為A、隱藏B、覆蓋C、重載D、Java不支持此特性答案：C解析：一個(gè)類(lèi)可以定義多個(gè)同名的方法，只要這些方法的參數(shù)列表不完全相同，這稱(chēng)為方法重載。112.HBase依賴(lài)（）技術(shù)框架提供消息通信機(jī)制。A、ZkeeperB、ChubbyC、RPCD、Scket答案：A解析：“hbase依賴(lài)“Zkeeper”提供消息通信機(jī)制113.用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是（）。A、專(zhuān)題分析報(bào)告B、綜合分析報(bào)告C、日常數(shù)據(jù)通報(bào)D、實(shí)時(shí)運(yùn)營(yíng)報(bào)告答案：C解析：用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是日常數(shù)據(jù)通報(bào)114.LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲(chǔ)在()0A、硬盤(pán)上B、內(nèi)存中C、磁盤(pán)陣列中D、閃存中答案：B解析：LSM樹(shù)的核心特點(diǎn)是利用順序?qū)憗?lái)提高寫(xiě)性能，但因?yàn)榉謱?此處分層是指的分為內(nèi)存和文件兩部分)的設(shè)計(jì)會(huì)稍微降低讀性能，但是通過(guò)犧牲小部分讀性能換來(lái)高性能寫(xiě)，使得LSM樹(shù)成為非常流行的存儲(chǔ)結(jié)構(gòu)。115.哪一項(xiàng)不屬于Hive的流控特性（）？A、已經(jīng)建立的總連接數(shù)閾值控制B、某個(gè)特定用戶(hù)已經(jīng)建立的連接數(shù)閾值控制C、每個(gè)用戶(hù)已經(jīng)建立的連接數(shù)閾值控制D、單位時(shí)間內(nèi)所建立的連接數(shù)閾值控制答案：B解析：某個(gè)特定用戶(hù)已經(jīng)建立的連接數(shù)閾值控制不屬于Hive的流控特性116.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是？（）A、一個(gè)barrier將本周期快照的數(shù)據(jù)與下一個(gè)周期快照的數(shù)據(jù)分隔開(kāi)來(lái)B、barrier是F1ink快照的核心C、在插入barrier的時(shí)候，會(huì)暫時(shí)阻斷數(shù)據(jù)流D、barrier周期性插入到數(shù)據(jù)流中，并作為數(shù)海流的一部分隨之流動(dòng)答案：C解析：在插入barrier的時(shí)候，不會(huì)暫時(shí)阻斷數(shù)據(jù)流117.如果要給隊(duì)列QueueA設(shè)置容量為30%,應(yīng)該設(shè)置哪個(gè)參數(shù)（）?A、yarn.scheduler.capacity.rt.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.rt.QueueD.user-limit-factrC、yarn.scheduler.capacity.rt.QueueA.capacityD、yarn.scheduler.capacity.rt.QueueA.state答案：C解析：在YARN中應(yīng)設(shè)置為yarn.scheduler.capacity.rt.QueueA.capacity118.Hadptnryarnschedulercapacity,rt.Queueafinim.m-user-limit-percent設(shè)置為50,下面說(shuō)法錯(cuò)誤的是？A、一個(gè)用戶(hù)提交任務(wù)，可以使用QueueA的100%的資源。B、如果QueueA中已經(jīng)有2個(gè)用戶(hù)的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶(hù)提交的任務(wù)需要等待釋放資源。C、QueueA中必須保障毎個(gè)用戶(hù)至少得到50%的資源D、QueueA中的每個(gè)用戶(hù)最多只能獲得50%的資源答案：D解析：如果有資源需求，每個(gè)隊(duì)列都會(huì)對(duì)分配給用戶(hù)的資源百分比實(shí)施限制。用戶(hù)限制可以在最小值和最大值之間變化。前者（最小值）設(shè)置為該屬性值，后者（最大值）取決于已提交應(yīng)用程序的用戶(hù)數(shù)。例如，假設(shè)此屬性的值為25。如果兩個(gè)用戶(hù)已將應(yīng)用程序提交到隊(duì)列，用戶(hù)不可以使用超過(guò)50％的隊(duì)列資源。如果第三位用戶(hù)提交了一個(gè)應(yīng)用程序，用戶(hù)都不能使用超過(guò)33％的隊(duì)列資源。如果有4個(gè)或更多用戶(hù)，用戶(hù)都不能使用超過(guò)25％的隊(duì)列資源。值100表示??未施加用戶(hù)限制。默認(rèn)值為100。值指定為整數(shù)。119.下列論據(jù)中，能夠支撐“大數(shù)據(jù)無(wú)所不能”的觀點(diǎn)的是（）A、互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B、大數(shù)據(jù)存在泡沫C、大數(shù)據(jù)具有非常高的成本D、個(gè)人隱私泄露與信息安全擔(dān)憂(yōu)答案：D解析：“個(gè)人隱私泄露與信息安全擔(dān)憂(yōu)”能夠支撐“大數(shù)據(jù)無(wú)所不能”的觀點(diǎn)120.關(guān)于MapReduceShuffle過(guò)程合并（bine）操作，兩個(gè)健值對(duì)<"a"，1＞和＜"a"，1＞經(jīng)過(guò)合并操作結(jié)果為（）。A、<"a"，2>B、<"a",<1,1>>C、<"a,a",2>D、<"a,a",<1,1>>答案：A解析：關(guān)于MapReduceShuffle過(guò)程合并（bine）操作，兩個(gè)健值對(duì)<"a"，1＞和＜"a"，1＞經(jīng)過(guò)合并操作結(jié)果為<"a"，2>。歸并的結(jié)果是<"a",<1,1>>。121.KafkaClusterMirrring工具可以實(shí)現(xiàn)以下哪些功能？A、Kafka數(shù)據(jù)同步方案B、Kafka單集群內(nèi)數(shù)據(jù)備份C、Kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全不正確答案：A解析：可使用MirrrMaker工具創(chuàng)建從源Kafka群集（源群集）到目標(biāo)Kafka群集（目標(biāo)群集）的鏡像，從而實(shí)現(xiàn)數(shù)據(jù)同步122.HBase是分布式列式存儲(chǔ)系統(tǒng)，記錄按什么集中存放。A、列族B、列C、行D、不確定答案：A解析：HBase是一個(gè)分布式列式存儲(chǔ)系統(tǒng),記錄按列簇集中存放,通過(guò)主鍵(rw,key)和主鍵的range來(lái)檢索數(shù)據(jù)。123.HFile數(shù)據(jù)格式中的Metalndex字段用于()。A、Meta塊的長(zhǎng)度B、Meta塊的結(jié)束點(diǎn)C、Meta塊數(shù)據(jù)內(nèi)容D、Meta塊的起始點(diǎn)答案：D解析：HFile是參照谷歌的SSTable存儲(chǔ)格式進(jìn)行設(shè)計(jì)的。全部的數(shù)據(jù)記錄都是通過(guò)它來(lái)完畢持久化，其內(nèi)部主要採(cǎi)用分塊的方式進(jìn)行存儲(chǔ)124.以下哪個(gè)操作是hive不支持的？（）A、表增加列B、表刪除列C、表修改列D、修改表名答案：B解析：hive不支持表刪除列125.Fusininsight產(chǎn)品中，關(guān)乎Kafka說(shuō)法不正確的是（）A、Kafka強(qiáng)依賴(lài)ZkeeperB、Kafka的服務(wù)端可以產(chǎn)生消息C、Kafka的部署的實(shí)例個(gè)數(shù)不得小于2D、Cnsumer作為Kafka的客戶(hù)端角色專(zhuān)門(mén)進(jìn)行消息的消費(fèi)答案：B解析：Kafka的服務(wù)端不可以產(chǎn)生消息126.Hadp平臺(tái)中啟用YARN組件的日志聚集功能，需要配置哪個(gè)參數(shù)？A、yarn.ndemanager.lcal-dirsB、yarn.ndemanager.lg-dirsC、yarn.acl.enableD、yarn.lg-aggregatin-enable答案：D解析：Hadp平臺(tái)中啟用YARN組件的日志聚集功能，需要配置yarn.lg-aggregatin-enable參數(shù)127.下列國(guó)家的大數(shù)據(jù)發(fā)展行動(dòng)中，集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國(guó)家是（）。A、美國(guó)B、日本C、中國(guó)D、韓國(guó)答案：D解析：國(guó)家的大數(shù)據(jù)發(fā)展行動(dòng)中，集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國(guó)家是韓國(guó)128.關(guān)于Kafka的基本概念描述錯(cuò)誤的是（）?A、Kafka集群包含一個(gè)或多個(gè)服務(wù)實(shí)例，這些服務(wù)實(shí)例被稱(chēng)為BrkerB、每條發(fā)布到Kafka集群的消息都有一個(gè)類(lèi)別，這個(gè)類(lèi)別被稱(chēng)為T(mén)picC、每個(gè)Cnsumer屬于多個(gè)的CnsumerGrupD、Kafka將Tpic分成一個(gè)或者多個(gè)Partitin,每個(gè)Partitin在物理上對(duì)應(yīng)一個(gè)文件夾，該文件夾下存儲(chǔ)這個(gè)Partitin的所有消息答案：C解析：每個(gè)Cnsumer進(jìn)程都會(huì)劃歸到一個(gè)邏輯的CnsumerGrup中129.以下關(guān)于Zkeeper關(guān)鍵特性中的原子性說(shuō)法正確的是？A、客戶(hù)端發(fā)送的更新會(huì)按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、更新只能全部完成或失敗，不會(huì)部分完成C、一條消息被一個(gè)server接收，將被所有server接收D、集群中無(wú)論哪臺(tái)服務(wù)器，對(duì)外示均是同一視圖答案：B解析：數(shù)據(jù)更新原子性：一次數(shù)據(jù)更新要么成功，要么失敗。130.SQL語(yǔ)言中，刪除一個(gè)表中所有數(shù)據(jù)，但保留表結(jié)構(gòu)的命令是（）。A、DELETEB、DRPC、DRPD、REMRE答案：A解析：2、truncate和delete只刪除數(shù)據(jù)不刪除表的結(jié)構(gòu)(定義)。DeleteFrmCustmer;DrptableCustmer;drptable表名稱(chēng)；truncatetable表名稱(chēng)；deletefrm表名稱(chēng)where列名稱(chēng)=值131.Hbase元數(shù)據(jù)MetaRegin/路由信息保存在哪里？A、ZkeeperB、Meta表C、HMasterD、Rt表答案：B解析：Hbase元數(shù)據(jù)MetaRegin/路由信息保存在Meta表中132.在數(shù)據(jù)安全及處理效率方面，不適宜大數(shù)據(jù)分析的軟件是（）。A、SASB、StataC、MatLabD、SPSS答案：D解析：在數(shù)據(jù)安全及處理效率方面，不適宜大數(shù)據(jù)分析的軟件是SPSSSAS（是全球最大的私營(yíng)軟件公司之一，是由美國(guó)北卡羅來(lái)納州立大學(xué)1966年開(kāi)發(fā)的統(tǒng)計(jì)分析軟件。SPSS是由SPSS公司推出的軟件“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件。Stata是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專(zhuān)業(yè)圖表的完整及整合性統(tǒng)計(jì)軟件。MATLAB是美國(guó)MathWrks公司出品的商業(yè)數(shù)學(xué)軟件，用于數(shù)據(jù)分析、無(wú)線通信、深度學(xué)習(xí)、圖像處理與計(jì)算機(jī)視覺(jué)、信號(hào)處理、量化金融與風(fēng)險(xiǎn)管理、機(jī)器人，控制系統(tǒng)等領(lǐng)域。133.硬件故障被認(rèn)為是常態(tài)，為了解決這個(gè)問(wèn)題.HDFS設(shè)計(jì)了副本機(jī)制。默認(rèn)情況下HDFS會(huì)存()份？A、3B、5C、2D、4答案：A解析：默認(rèn)情況下HDFS會(huì)存3份134.在HBaseShell操作中，可以使用下面哪個(gè)命令對(duì)數(shù)據(jù)表進(jìn)行行數(shù)統(tǒng)計(jì)()。A、selectcunt(0)frm'users'B、sum'users'C、cunt'users'D、truncate'users'答案：C解析：HBase'users'屬性唯一，通過(guò)cunt語(yǔ)句，可統(tǒng)計(jì)有多少行數(shù)135.如果需要對(duì)HBase表中的數(shù)據(jù)進(jìn)行列表查看，可以使用()命令進(jìn)行操作。A、cuntB、scanC、putD、get答案：B解析：get命令是用來(lái)獲取Hbase表中某行的數(shù)據(jù)136.在Fusininsight產(chǎn)品中，關(guān)于創(chuàng)建Kafka的Tpic,以下哪些描述是正確的？A、在創(chuàng)建Kafka的Tpic時(shí),必須設(shè)置Partitin個(gè)數(shù)B、在創(chuàng)建Kafka的tpic時(shí),必須設(shè)置Partitin副本個(gè)數(shù)C、設(shè)置多副本可以増強(qiáng)Kafka服務(wù)的容災(zāi)能力D、以上全都正確答案：C解析：kafka的partitin可以在創(chuàng)建時(shí)候指定，也可以alter（kafka-tpic.sh里面的參數(shù)），但是，這個(gè)修改只能增加partitin數(shù)目，并不能減少137.關(guān)于HBase用戶(hù)讀寫(xiě)數(shù)據(jù)過(guò)程說(shuō)法錯(cuò)誤的是A、用戶(hù)寫(xiě)入數(shù)據(jù)時(shí)，被分配到相應(yīng)Regin服務(wù)器去執(zhí)行B、用戶(hù)數(shù)據(jù)首先被寫(xiě)入到MemStre和Hlg中C、只有當(dāng)操作寫(xiě)入Hlg之后，mit()調(diào)用才會(huì)將其返回給客戶(hù)端D、當(dāng)用戶(hù)讀取數(shù)據(jù)時(shí)，先去磁盤(pán)上面的StreFile中尋找答案：D解析：數(shù)據(jù)讀寫(xiě)的過(guò)程：?用戶(hù)寫(xiě)入數(shù)據(jù)時(shí)，被分配到相應(yīng)Regin服務(wù)器去執(zhí)行?用戶(hù)數(shù)據(jù)首先被寫(xiě)入到MemStre和Hlg中?只有當(dāng)操作寫(xiě)入Hlg之后，mit()調(diào)用才會(huì)將其返回給客戶(hù)端?當(dāng)用戶(hù)讀取數(shù)據(jù)時(shí)，Regin服務(wù)器會(huì)首先訪問(wèn)MemStre緩存，如果找不到，再去磁盤(pán)上面的StreFile中尋找138.如果我們現(xiàn)有一個(gè)安裝26.5版本的hadp集群，在不修改默認(rèn)配置的情況下存儲(chǔ)200個(gè)每個(gè)200M的文本文件，請(qǐng)問(wèn)最終會(huì)在集群中產(chǎn)生多少個(gè)數(shù)據(jù)塊（包括副本）A、200B、40000C、400D、1200答案：D解析：?jiǎn)栕罱K會(huì)在集群中產(chǎn)生1200個(gè)數(shù)據(jù)塊139.Hadp中MapReduce組件擅長(zhǎng)處理哪種場(chǎng)景的計(jì)算任務(wù)？A、迭代計(jì)算B、離線計(jì)算C、實(shí)時(shí)交互計(jì)算D、流式計(jì)算答案：B解析：海量數(shù)據(jù)在單機(jī)上處理因?yàn)橛布Y源限制，無(wú)法勝任。而一旦將單機(jī)版程序擴(kuò)展到集群來(lái)分布式運(yùn)行，將極大增加程序的復(fù)雜度和開(kāi)發(fā)難度。引入mapreduce框架后，開(kāi)發(fā)人員可以將絕大部分工作集中在業(yè)務(wù)邏輯的開(kāi)發(fā)上，而將分布式計(jì)算中的復(fù)雜性交由框架來(lái)處理。140.下哪種不是Hive支持的數(shù)據(jù)類(lèi)型（）。A、structB、intC、mapD、lng答案：D解析：Hive支持原始數(shù)據(jù)類(lèi)型和復(fù)雜類(lèi)型，原始類(lèi)型包括數(shù)值型，Blean，字符串，時(shí)間戳,int。復(fù)雜類(lèi)型包括數(shù)組，map，struct。141.hadp平臺(tái)中要查看Yarn服務(wù)中一個(gè)applicatin的信息，通常需要使用什么命令？A、cntainerB、jarC、applicatin-attemptD、Applicatin答案：D解析：hadp平臺(tái)中要查看Yarn服務(wù)中一個(gè)applicatin的信息，通常需要使用Applicatin命令。Cntainer將內(nèi)存、CPU、磁盤(pán)、網(wǎng)絡(luò)等資源封裝在一起，這樣可以起到限定資源邊界的作用。把本地的java文件打包成jar包，然后放在linux集群上，通過(guò)hadp命令來(lái)運(yùn)行該jar包。142.HBase來(lái)源于哪篇博文？A、TheGgleFileSystemB、MapReduceC、BigTableD、Chubby答案：C解析：Bigtable是一種用于管理結(jié)構(gòu)化數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)，旨在擴(kuò)展到非常大的尺寸：對(duì)數(shù)千臺(tái)商品服務(wù)器上的PB數(shù)據(jù)進(jìn)行服務(wù)。Bigtable不支持完整的關(guān)系數(shù)據(jù)模型，相反，它為客戶(hù)端提供了一個(gè)簡(jiǎn)單的數(shù)據(jù)模型，支持對(duì)數(shù)據(jù)布局和格式的動(dòng)態(tài)控制，并允許客戶(hù)端推理底層存儲(chǔ)中表示的數(shù)據(jù)的局部屬性。用戶(hù)在Bigtable中可以使用是任意字符串的行和列名稱(chēng)對(duì)數(shù)據(jù)進(jìn)行索引。Bigtable還將數(shù)據(jù)視為字符串，盡管客戶(hù)端通常將各種形式的結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)序列化到這些字符串中。143.FusinninsigetHD系統(tǒng)中，F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過(guò)哪個(gè)組件？A、SurceB、SinkC、TpicD、channel答案：C解析：FusinninsigetHD系統(tǒng)中，F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過(guò)Tpic組件。在節(jié)點(diǎn)的內(nèi)部，agent由surce、channel和sink組成。surce負(fù)責(zé)消費(fèi)從上游節(jié)點(diǎn)獲取的events，并將其放到channel中，目前Flume支持Avr、Thrift、Syslg、Netcat等數(shù)據(jù)流。channel分為兩種類(lèi)型，一種是memrychannel，它適合高吞吐量場(chǎng)景，但節(jié)點(diǎn)掛掉后數(shù)據(jù)可能會(huì)丟失。另一種是filechannel，也就是channel里的數(shù)據(jù)會(huì)同步到硬盤(pán)里，節(jié)點(diǎn)意外掛掉后數(shù)據(jù)可恢復(fù)，但處理時(shí)間會(huì)稍長(zhǎng)一些，F(xiàn)lume默認(rèn)使用filechannel。sink從channel取數(shù)據(jù)并將其放入下游節(jié)點(diǎn)。144.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇以下哪種消息發(fā)布策略（）？A、局部字段分組B、廣播分組C、直接分組D、全局分組答案：C解析：如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇直接分組發(fā)布策略145.Hadpffl件在企業(yè)應(yīng)用中，能用于數(shù)據(jù)挖掘的產(chǎn)品有（）。A、HiveB、PigC、MahutD、Hbase答案：C解析：Mahut可用于數(shù)據(jù)挖掘，Hive和Hbase是數(shù)據(jù)存儲(chǔ)，pig是一種語(yǔ)言。146.若需要定義一個(gè)類(lèi)域或類(lèi)方法，應(yīng)使用哪種修飾符？A、staticB、packageC、privateD、public答案：A解析：類(lèi)域類(lèi)方法全局變量全局方法147.以下關(guān)于Flink關(guān)鍵特性描述不正確的是（）A、Sparkstreaming與Flink相比，時(shí)延更低B、F1ink流式處理引撃能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C、與FusininghtHD中的Streaming相比Flink具有更高的吞吐量D、checkpint實(shí)現(xiàn)了Flink的容錯(cuò)答案：A解析：Flink會(huì)比SparkStreaming有更低的流處理延遲性148.關(guān)于Hive中的桶說(shuō)法不正確的是（）？A、每個(gè)桶是一個(gè)目錄B、建表時(shí)指定桶個(gè)數(shù)，桶內(nèi)可排序C、數(shù)據(jù)按照某個(gè)字段的值Hash后放入某個(gè)桶中D、對(duì)于數(shù)據(jù)抽樣、特定jin的優(yōu)化很有意義答案：A解析：一個(gè)分區(qū)就是一個(gè)目錄，而不是桶149.FusininsightManager用戶(hù)權(quán)限管理不支持哪個(gè)配置？A、給用戶(hù)配置角色B、給用戶(hù)組配置角色C、給角色配量權(quán)限D(zhuǎn)、給用戶(hù)組配置權(quán)限答案：D解析：FusininsightManager用戶(hù)權(quán)限管理不支持給用戶(hù)組配置權(quán)限150.Flink中的（）接口用于流數(shù)據(jù)處理,（）接口用于批處理？A、DatabatchAPI,DatastreamAPIB、StreamAPI,BatchAPIC、DatastreamAPI,DatasetAPID、BatchAPI,StreamAPI答案：C解析：Flink中的DatastreamAPI接口用于流數(shù)據(jù)處理,DatasetAPI接口用于批處理151.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成（）？A、channelB、TransfrmatinC、sinkD、surce答案：B解析：Flink的數(shù)據(jù)轉(zhuǎn)換操作在Transfrmatin完成152.部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署幾個(gè)？A、1B、3C、4D、2答案：D解析：部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署2個(gè)153.整型數(shù)據(jù)類(lèi)型中，需要內(nèi)存空間最少的是A、shrtB、lngC、intD、byte答案：D解析：byte，一個(gè)字節(jié)（八個(gè)二進(jìn)制位）154.數(shù)據(jù)倉(cāng)庫(kù)的最終目的是（）A、收集業(yè)務(wù)需求B、開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用分析C、建立數(shù)據(jù)倉(cāng)庫(kù)邏輯模型D、為用戶(hù)和業(yè)務(wù)部門(mén)提供決策支持答案：A解析：數(shù)據(jù)倉(cāng)庫(kù)的最終目的是收集業(yè)務(wù)需求155.為了保證流應(yīng)用的快照存儲(chǔ)的可靠性，快照主要存儲(chǔ)在（）？A、本地文件系統(tǒng)中B、Jbmanager的內(nèi)存中C、HDFS中D、可靠性高的單機(jī)數(shù)據(jù)庫(kù)中答案：C解析：為了保證流應(yīng)用的快照存儲(chǔ)的可靠性，快照主要存儲(chǔ)在HDFS中156.在Spark生態(tài)組件中，哪個(gè)產(chǎn)品可用于基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理（）。A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案：C解析：SparkStreaming基于實(shí)時(shí)數(shù)據(jù)流157.使用JAVAAPI進(jìn)行HBaseS表掃描操作，以下命令輸寫(xiě)正確的是()。A、table.getScanner(scan);B、table.scan(table);C、table.get(table).scan();D、table.Scanner(get);答案：A解析：使用table.getScanner(scan)進(jìn)行掃描158.在數(shù)據(jù)庫(kù)模型中，可以指定條件對(duì)記錄進(jìn)行排序，使用的方法是（）。A、rder_byB、filterC、rderD、grup()答案：A解析：保證結(jié)果集中的行已排序的方法是使用RDERBY子句159.關(guān)于HBase實(shí)現(xiàn)的三個(gè)主要的功能組件說(shuō)法錯(cuò)誤的是A、主服務(wù)器Master負(fù)責(zé)管理和維護(hù)HBase表的分區(qū)信息，維護(hù)Regin服務(wù)器列表，分配Regin，負(fù)載均衡B、Regin服務(wù)器負(fù)責(zé)存儲(chǔ)和維護(hù)分配給自己的Regin，處理來(lái)自客

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)（含答案）

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔