大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)_第1頁(yè)
大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)_第2頁(yè)
大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)_第3頁(yè)
大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)_第4頁(yè)
大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)_第5頁(yè)
已閱讀5頁(yè),還剩123頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE1大數(shù)據(jù)分析師理論知識(shí)考試復(fù)習(xí)題庫(kù)(含答案)一、單選題1.Spark是用以下那種編程語(yǔ)言實(shí)現(xiàn)的?A、cB、C++C、javaD、Scala答案:D解析:Spark中用Scala開(kāi)發(fā)語(yǔ)法簡(jiǎn)潔許多,且支持類(lèi)型推斷,可大大提升開(kāi)發(fā)效率。2.在FusinInsightManager界面中,對(duì)Lader的操作不包括下列哪個(gè)選項(xiàng)()A、切換Lader主備節(jié)點(diǎn)B、啟動(dòng)Lader實(shí)例C、配置Lader參數(shù)D、查看Lader服務(wù)狀態(tài)答案:A解析:在FusinInsight界面中,對(duì)Lader的操作不包括切換Lader主備節(jié)點(diǎn)3.Hive不適用于以下哪個(gè)場(chǎng)景單選A、非實(shí)時(shí)分析,例如日析B、數(shù)據(jù)挖掘,例如用戶(hù)析,區(qū)域展示C、數(shù)據(jù)匯總,例如母天,每擊數(shù),點(diǎn)擊排行D、實(shí)時(shí)在線數(shù)答案:D解析:Hive不適用于實(shí)時(shí)在線數(shù)單選。由于hive主要用于數(shù)據(jù)分析,因此延時(shí)比較高,不適用于實(shí)時(shí)場(chǎng)景,適用于離線大數(shù)據(jù)分析4.Hadp平臺(tái)中HBase的Regin是由哪個(gè)服務(wù)進(jìn)程來(lái)管理?A、HMasterB、DataNdeC、ReginServerD、Zkeeper答案:C解析:Hadp平臺(tái)中HBase的Regin是由ReginServer管理5.Hadp組件在企業(yè)應(yīng)用中,能用于大數(shù)據(jù)集實(shí)時(shí)查詢(xún)的產(chǎn)品有()。A、HiveB、PigC、MahutD、Hbase答案:D解析:Hadp組件在企業(yè)應(yīng)用中,能用于大數(shù)據(jù)集實(shí)時(shí)查詢(xún)的產(chǎn)品有Hbase。6.下列選項(xiàng)中無(wú)法通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)的是?()A、商業(yè)模式發(fā)現(xiàn)B、信用評(píng)估C、商品推薦D、運(yùn)營(yíng)分析答案:A解析:商業(yè)模式發(fā)現(xiàn)無(wú)法通過(guò)大數(shù)據(jù)技術(shù)實(shí)現(xiàn)7.日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)錯(cuò)誤的是()。A、進(jìn)度性B、規(guī)范性C、時(shí)效性D、全面性答案:D解析:日常數(shù)據(jù)通報(bào)型報(bào)告的特點(diǎn)有進(jìn)度性,規(guī)范性,時(shí)效性。https://zhuanlan.zhihu./p/53857057日常數(shù)據(jù)通報(bào)是以定期數(shù)據(jù)分析報(bào)表為依據(jù),反映計(jì)劃執(zhí)行情況,并分析影響和形成原因的一種數(shù)據(jù)分析報(bào)告。這種數(shù)據(jù)分析報(bào)告一般是按日、周、月、季、年等時(shí)間階段定期進(jìn)行,所以也叫定期分析報(bào)告。8.HBase依賴(lài)()提供強(qiáng)大的計(jì)算能力A、PrtbufB、JavaC、KafkaD、Chubby答案:D解析:谷歌收購(gòu)云計(jì)算公司CuldSimple強(qiáng)化云計(jì)算能力9.以下關(guān)于Hive操作描述不正確的是()。A、Hive是一個(gè)建立在hadp文件系統(tǒng)上的數(shù)據(jù)倉(cāng)庫(kù)架構(gòu),可以用其對(duì)HDFS上B、Hive依賴(lài)于MapReduce處理數(shù)據(jù)C、Hive的加載數(shù)據(jù)時(shí)候,可以用lcal進(jìn)行修飾,表示從某個(gè)本地目錄下加載數(shù)據(jù)D、Hive—般可以用于實(shí)時(shí)的查詢(xún)分析答案:D解析:Hive不可以用于實(shí)時(shí)的查詢(xún)分析10.以下關(guān)于繼承的敘述正確的是()A、在Java中類(lèi)只允許單一繼承B、在Java中一個(gè)類(lèi)只能實(shí)現(xiàn)一個(gè)接nC、在Java中一個(gè)類(lèi)不能同時(shí)繼承一個(gè)類(lèi)和實(shí)現(xiàn)一個(gè)接口D、在Java中接口只允許單一繼承答案:A解析:繼承分為單繼承和多繼承兩種形式。單繼承允許一個(gè)類(lèi)可以有多個(gè)子類(lèi),但只能有一個(gè)父類(lèi);多繼承則允許一個(gè)類(lèi)不僅可以有多個(gè)子類(lèi),還可以有多個(gè)父類(lèi)。但需要注意一點(diǎn),Java只支持單繼承,但可以通過(guò)接口實(shí)現(xiàn)多繼承的功能。一個(gè)類(lèi)可以同時(shí)繼承一個(gè)類(lèi)和實(shí)現(xiàn)一個(gè)接口。11.關(guān)于HIVE的描述不正確的?A、Hive最佳使用景是大數(shù)據(jù)的批處理作業(yè)B、Hive可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)C、Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上,Hadp通常有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量開(kāi)銷(xiāo)D、Hive查詢(xún)操作過(guò)程嚴(yán)格遵循HadpMapreduce的作用執(zhí)行模型.Hive將用戶(hù)的HveQL語(yǔ)句通過(guò)解釋器轉(zhuǎn)換為MapreduceHadp集群上答案:B解析:Hive不可以實(shí)現(xiàn)大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)。Hive構(gòu)建在基于靜態(tài)批處理的Hadp之上,Hadp通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開(kāi)銷(xiāo)。因此,hive并不能夠在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢(xún)12.MapReduce的Shuffle過(guò)程以下中哪個(gè)操作是最后做的?A、排序B、合并C、分區(qū)D、溢寫(xiě)答案:B解析:map階段shuffle過(guò)程就是將map結(jié)果進(jìn)行分區(qū)、排序、合并13.以下哪個(gè)方法用于定義線程的執(zhí)行體?A、start()B、init()C、run()D、synchrnized()答案:C解析:run()方法是用來(lái)定義這個(gè)線程在啟動(dòng)的時(shí)候需要做什么,但是,直接執(zhí)行run()方法那就不是線程,必須使用start()啟動(dòng),那樣才是線程。線程是進(jìn)程中的實(shí)體,一個(gè)進(jìn)程可以擁有多個(gè)線程,一個(gè)線程必須有一個(gè)父進(jìn)程。線程不擁有系統(tǒng)資源,只有運(yùn)行必須的一些數(shù)據(jù)結(jié)構(gòu);與父進(jìn)程的其它線程共享該進(jìn)程所擁有的全部資源。線程可以創(chuàng)建和撤消線程,從而實(shí)現(xiàn)程序的并發(fā)執(zhí)行。一般,線程具有就緒、阻塞和運(yùn)行三種基本狀態(tài)。14.以下哪種不是Hive支持的數(shù)據(jù)類(lèi)型?A、StructB、IntC、MapD、Lng答案:D解析:Hive不支持Lng類(lèi)型,Lng是Java里面的,在Hive里L(fēng)ng對(duì)應(yīng)的應(yīng)該是BIGINT。15.下面說(shuō)法錯(cuò)誤的是()。A、Hadp集群采用的是Master/Slave工作模式B、DataNde上保存著的是元數(shù)據(jù),真正的數(shù)據(jù)是存放在NameNde上的C、HDFS采用了一種對(duì)文件切割后分別存放的存儲(chǔ)方式。D、HDFS是為高數(shù)據(jù)吞吐量應(yīng)用優(yōu)化的。答案:B解析:DataNde上數(shù)據(jù)塊以文件形式存儲(chǔ)在磁盤(pán)上,包括兩個(gè)文件,一個(gè)是數(shù)據(jù)本身,一個(gè)是數(shù)據(jù)塊元數(shù)據(jù)包括長(zhǎng)度、校驗(yàn)、時(shí)間戳;16.請(qǐng)問(wèn)以下哪個(gè)命令組成是錯(cuò)誤的?A、sbin/stp-dfs.shB、sbin/hdfsdfsadmin-reprtC、bin/hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/my.txt答案:B解析:A選項(xiàng),sbin/stp-dfs.sh是用來(lái)停止日志相關(guān)服務(wù)。C選項(xiàng),它負(fù)責(zé)管理文件系統(tǒng)的命名空間,維護(hù)文件系統(tǒng)的文件樹(shù)以及所有的文件和目錄的元數(shù)據(jù)。D選項(xiàng),文件目錄有關(guān)。B選項(xiàng)命令不存在。所以選B。17.YARN中默認(rèn)的資源調(diào)度器是?A、FIF調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全不是答案:B解析:YARN中默認(rèn)的資源調(diào)度器是容量調(diào)度器18.關(guān)于相關(guān)性rA,B說(shuō)法錯(cuò)誤的是()。A、rA,B>0,正相關(guān)。A隨B的值得增大而增大B、rA,B=0不相關(guān)。AB無(wú)關(guān)C、rA,B<0,負(fù)相關(guān)。A隨B的值得增大而減少D、不能單純依據(jù)rA,B<0fig定AB相關(guān)性答案:D解析:不能單純依據(jù)rA,B<0fig定AB相關(guān)性是錯(cuò)誤的r為相關(guān)系數(shù)19.HDFS有一個(gè)gzip文件大小75MB,客戶(hù)端設(shè)置Blck大小為64MB。當(dāng)運(yùn)行mapreduce任務(wù)讀取該文件時(shí)inputsplit大小為?A、—個(gè)map取64MB,另外一個(gè)map取11MBB、128MBC、64MBD、75MB答案:D解析:gzip不支持split,所以inputsplit大小為文件大小20.以下關(guān)于fusininsightCTbase的描述不正確的是?A、CThase的讀寫(xiě)數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動(dòng)進(jìn)行冷字段的合并和解析,不需要在應(yīng)用程序中進(jìn)行合并和解釋B、CTHBase是基于Hbase的聚簇表開(kāi)發(fā)框架。云HBASE數(shù)據(jù)庫(kù)(CT-Hbase)基于開(kāi)源HBase引擎,支持NSQL和二級(jí)索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。C、CTHbase提供了一套Webui進(jìn)行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計(jì)工具,降低表設(shè)D、CTHbase的javaAPI提供一套Hbas鏈接池管理的接口,內(nèi)部進(jìn)行連接共享,減少客戶(hù)端應(yīng)用開(kāi)發(fā)難度。答案:B解析:CTHBase不是基于Hbase的聚簇表開(kāi)發(fā)框架。云HBASE數(shù)據(jù)庫(kù)(CT-Hbase)基于開(kāi)源HBase引擎,支持NSQL和二級(jí)索引的實(shí)時(shí)數(shù)據(jù)分析服務(wù)。21.在Webhcat架構(gòu)中,用戶(hù)能夠通過(guò)安全的HTTPS協(xié)議執(zhí)行以下哪些操作?A、執(zhí)行HiveDDL操作B、運(yùn)行Mapreduce任務(wù)C、運(yùn)行HiveHL任務(wù)D、以上全都正確答案:D解析:在Webhcat架構(gòu)中,用戶(hù)能夠通過(guò)安全的HTTPS協(xié)議執(zhí)行HiveDDL操作、運(yùn)行Mapreduce任務(wù)、運(yùn)行HiveHL任務(wù)22.HBase依賴(lài)()提供消息通信機(jī)制A、ZkeeperB、ChubbyC、RPCD、Scket答案:A解析:ZKeeper是一個(gè)分布式的,開(kāi)放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù),是Ggle的Chubby一個(gè)開(kāi)源的實(shí)現(xiàn),是Hadp和Hbase的重要組件。它是一個(gè)為分布式應(yīng)用提供一致性服務(wù)的軟件,提供的功能包括:配置維護(hù)、域名服務(wù)、分布式同步、組服務(wù)等。23.在Mapper類(lèi)中,共有4個(gè)函數(shù):setup()、map()、()、run()。A、Reducer()B、cleanup()C、Split()D、lcal()答案:B解析:在Mapper類(lèi)中,共有4個(gè)函數(shù):setup()、map()、cleanup()、run()。24.kafka-clustermirrring工具可以實(shí)現(xiàn)以下哪個(gè)功能()A、kafka集群數(shù)據(jù)同步方案B、kafka單集群內(nèi)數(shù)據(jù)備份C、kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全部不對(duì)答案:A解析:kafka-clustermirrring工具可以實(shí)現(xiàn)kafka集群數(shù)據(jù)同步方案25.FusininsightHD系統(tǒng)中Hive不支持的存儲(chǔ)格式包括?A、TextfileB、SequencefileC、RCFILED、Hfile答案:D解析:FusininsightHD系統(tǒng)中Hive不支持的存儲(chǔ)格式包括Hfile。Textfile文本文件SequencefilesequenceFile文件是Hadp用來(lái)存儲(chǔ)二進(jìn)制形式的[Key,Value]對(duì)而設(shè)計(jì)的一種平面文件(FlatFile)。RCFile文件格式是FaceBk開(kāi)源的一種Hive的文件存儲(chǔ)格式,首先將表分為幾個(gè)行組,對(duì)每個(gè)行組內(nèi)的數(shù)據(jù)進(jìn)行按列存儲(chǔ),每一列的數(shù)據(jù)都是分開(kāi)存儲(chǔ),正是先水平劃分,再垂直劃分的理念。HFile是HBase存儲(chǔ)數(shù)據(jù)的文件組織形式。26.關(guān)于數(shù)據(jù)分析報(bào)告錯(cuò)誤的是()。A、展示分析結(jié)果B、驗(yàn)證分析質(zhì)量C、展示分析過(guò)程D、提供決策依據(jù)答案:C解析:數(shù)據(jù)分析報(bào)告用來(lái)展示分析結(jié)果,驗(yàn)證分析質(zhì)量以及提供決策依據(jù)https://zhuanlan.zhihu./p/53857057數(shù)據(jù)分析報(bào)告—項(xiàng)目可行性判斷的重要依據(jù)。27.UMP系統(tǒng)中的角色不包括A、Cntrller服務(wù)器B、Prxy服務(wù)器C、Agent服務(wù)器D、HDFS服務(wù)器答案:D解析:UMP系統(tǒng)中的角色包括Cntrller服務(wù)器、Web控制臺(tái)、Prxy服務(wù)器、Agent服務(wù)器、日志分析服務(wù)器、信息統(tǒng)計(jì)服務(wù)器、愚公系統(tǒng);依賴(lài)的開(kāi)源組件包括Mnesia、RabbitMQ、ZKeeper和LVS。28.Hive是基于Hadp的數(shù)據(jù)倉(cāng)庫(kù)軟件,可以査詢(xún)和管理PB級(jí)別的分布式數(shù)據(jù)。以下關(guān)于hive特性的描述不正確的是?A、靈活方便的ETLB、易用易編程C、可直接訪可HDFS文件以及HbaseD、僅支持mapreducet計(jì)算引擎答案:D解析:目前Hive支持MapReduce、Tez和Spark3種計(jì)算引擎29.創(chuàng)建Lader作業(yè)中,可以在以下哪個(gè)步驟中設(shè)置過(guò)濾器類(lèi)型()A、輸入設(shè)置B、轉(zhuǎn)換C、基本信息D、輸出答案:A解析:創(chuàng)建Lader作業(yè)中,可以在輸入設(shè)置中設(shè)置過(guò)濾器類(lèi)型30.YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)下列選項(xiàng)中的哪個(gè)進(jìn)行標(biāo)簽化?A、AppmasterB、ResurcemanagerC、NdemanagerD、Cntainer答案:C解析:YARN的基于標(biāo)準(zhǔn)調(diào)度,是對(duì)Ndemanager進(jìn)行標(biāo)簽化31.下列哪些語(yǔ)句關(guān)于Java內(nèi)存回收的說(shuō)明是正確的?A、程序員必須創(chuàng)建一個(gè)線程來(lái)釋放內(nèi)存B、內(nèi)存回收程序負(fù)責(zé)釋放無(wú)用內(nèi)存C、內(nèi)存回收程序允許程序員直接釋放內(nèi)存D、內(nèi)存回收程序可以在指定的時(shí)間釋放內(nèi)存對(duì)象答案:B解析:A:垃圾回收程序是一般是在堆上分配空間不夠的時(shí)候會(huì)自己進(jìn)行一次GC(垃圾收集),程序員不需要也不能主動(dòng)釋放內(nèi)存。B:Java的內(nèi)存釋放由垃圾回收程序來(lái)進(jìn)行釋放C:在Java里,內(nèi)存的釋放由垃圾回收程序進(jìn)行管理,程序員不能直接進(jìn)行釋放。D:程序員可以調(diào)用System.gc()運(yùn)行垃圾回收器,但是不能指定時(shí)間。32.Hadp集群中存在的最主要瓶頸是()。A、CPUB、網(wǎng)絡(luò)C、磁盤(pán)I0D、內(nèi)存答案:C解析:面對(duì)大數(shù)據(jù),讀取數(shù)據(jù)需要經(jīng)過(guò)I,這里可以把I理解為水的管道。管道越大越強(qiáng),我們對(duì)于T級(jí)的數(shù)據(jù)讀取就越快。所以I的好壞,直接影響了集群對(duì)于數(shù)據(jù)的處理。33.下面與Zkeepe類(lèi)似的框架是哪一個(gè)?()A、PrtbufB、JavaC、KafkaD、Chubby答案:D解析:顧名思義zkeeper就是動(dòng)物園管理員,他是用來(lái)管hadp(大象)、Hive(蜜蜂)、pig(小豬)的管理員,Zkeeper:是一個(gè)分布式的、開(kāi)源的程序協(xié)調(diào)服務(wù),是hadp項(xiàng)目下的一個(gè)子項(xiàng)目。他提供的主要功能包括:配置管理、名字服務(wù)、分布式鎖、集群管理。A:PrtclBuffers是一種輕便高效的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)格式,可以用于結(jié)構(gòu)化數(shù)據(jù)串行化,或者說(shuō)序列化。B:面向?qū)ο蟮木幊陶Z(yǔ)言;C:Kafka是由Apache軟件基金會(huì)開(kāi)發(fā)的一個(gè)開(kāi)源流處理平臺(tái),由Scala和Java編寫(xiě)。D:Chubby是一個(gè)面向松耦合分布式系統(tǒng)的鎖服務(wù),通常用于為一個(gè)由大量小型計(jì)算機(jī)構(gòu)成的松耦合分布式系統(tǒng)提供高可用的鎖服務(wù)。一個(gè)分布式鎖服務(wù)的目的是允許他的客戶(hù)端進(jìn)程同步彼此的操作,并對(duì)當(dāng)前所處環(huán)境的基本狀態(tài)信息達(dá)成一致。34.以下哪個(gè)部分不是一篇數(shù)據(jù)分析報(bào)告必須有的。()A、標(biāo)題B、正文C、結(jié)論與建議D、附錄答案:D解析:附錄不是一篇數(shù)據(jù)分析報(bào)告必須有的。35.以下關(guān)于Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫(xiě)流程說(shuō)法正確的是?A、僅寫(xiě)入內(nèi)存B、同時(shí)寫(xiě)入磁盤(pán)和內(nèi)存C、先寫(xiě)入內(nèi)存再寫(xiě)入磁盤(pán)D、先寫(xiě)磁盤(pán)再寫(xiě)內(nèi)存答案:D解析:Zkeeper的Leader節(jié)點(diǎn)在收到數(shù)據(jù)變更請(qǐng)求后的讀寫(xiě)流程是先寫(xiě)磁盤(pán)再寫(xiě)內(nèi)存36.在fusinlnsigh產(chǎn)品中,關(guān)于kafka的tpic,以下描述不正確的是?A、tpic的partitin數(shù)量可以創(chuàng)建時(shí)配置B、每個(gè)tpic只能被分成一個(gè)partitin區(qū)C、每條發(fā)布到kafka的消息都有一個(gè)類(lèi)別,這個(gè)類(lèi)別被稱(chēng)為tpic.也可以理解為一個(gè)存儲(chǔ)消息的隊(duì)列D、每個(gè)partitin在存儲(chǔ)層面對(duì)應(yīng)一個(gè)lg文件,lg文件中記錄了所有的消息數(shù)據(jù)答案:B解析:Kafka中Tpic被分成多個(gè)Partitin分區(qū)。tpic是一個(gè)邏輯概念,Partitin是最小的存儲(chǔ)單元,掌握著一個(gè)Tpic的部分?jǐn)?shù)據(jù)。每個(gè)Partitin都是一個(gè)單獨(dú)的lg文件,每條記錄都以追加的形式寫(xiě)入。37.HBase表中每個(gè)cell的多版本是通過(guò)()表示的。A、timestampB、rwkeyC、blckidD、cellid答案:A解析:HBase通過(guò)以下幾個(gè)要素來(lái)定位一個(gè)cell:表(table),行(rwkey),列族(clumnfamily),列標(biāo)識(shí)(clumnqualifier),時(shí)間戳(timestamp)。每個(gè)Cell可能有多個(gè)版本,它們之間用時(shí)間戳(TimeStamp)區(qū)分。38.FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類(lèi)型是以下哪項(xiàng)?A、graph-fileB、binary-fileC、text-fileD、sequence-file答案:B解析:binary-file是FusininsightHD中Lader從SFTP服務(wù)器導(dǎo)入文件時(shí)不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類(lèi)型39.下面與HDFS類(lèi)似的框架是?A、NTFSB、FAT32C、GFSD、EXT3答案:C解析:HDF(HarmnySDriverFundatin)驅(qū)動(dòng)框架,為驅(qū)動(dòng)開(kāi)發(fā)者提供驅(qū)動(dòng)框架能力,包括驅(qū)動(dòng)加載、驅(qū)動(dòng)服務(wù)管理和驅(qū)動(dòng)消息機(jī)制。40.關(guān)于Dataset,下列說(shuō)法不正確的是?A、Dataset不需要反序列化就可執(zhí)行大部分操作B、Dataset是一個(gè)由特定域的對(duì)象組成的強(qiáng)類(lèi)型集合C、Dataset與RDD高度類(lèi)似>性能比RDD好D、Dataset執(zhí)行srt,filter,shuffle登操作需要進(jìn)行反序列化答案:D解析:Dataset執(zhí)行srt,filter,shuffle登操作不需要進(jìn)行反序列化。Java序列化就是指把Java對(duì)象轉(zhuǎn)換為字節(jié)序列的過(guò)程Java反序列化就是指把字節(jié)序列恢復(fù)為Java對(duì)象的過(guò)程。序列化最重要的作用:在傳遞和保存對(duì)象時(shí).保證對(duì)象的完整性和可傳遞性。對(duì)象轉(zhuǎn)換為有序字節(jié)流,以便在網(wǎng)絡(luò)上傳輸或者保存在本地文件中。反序列化的最重要的作用:根據(jù)字節(jié)流中保存的對(duì)象狀態(tài)及描述信息,通過(guò)反序列化重建對(duì)象。41.Zkeeper在分布式應(yīng)用中主要的作用不包括以下哪些選項(xiàng)?A、選舉Master節(jié)點(diǎn)B、保證各節(jié)點(diǎn)上數(shù)據(jù)的C、分配集群資源D、存儲(chǔ)及群中答案:C解析:資源分配是Spark任務(wù)中需要深入理解42.Hive是以()技術(shù)為基礎(chǔ)的數(shù)據(jù)倉(cāng)庫(kù)。A、HDFSB、MAPREDUCEC、HADPD、HBASE答案:C解析:Hive是基于Hadp的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,用來(lái)進(jìn)行數(shù)據(jù)提取、轉(zhuǎn)化、加載,這是一種可以存儲(chǔ)、查詢(xún)和分析存儲(chǔ)在Hadp中的大規(guī)模數(shù)據(jù)的機(jī)制。A:Hadp分布式文件系統(tǒng)(HDFS)是指被設(shè)計(jì)成適合運(yùn)行在通用硬件上的分布式文件系統(tǒng)。B:MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集的并行運(yùn)算。D:HBase是一個(gè)分布式的、面向列的開(kāi)源數(shù)據(jù)庫(kù)43.關(guān)于fusinInsightHDStreaming的Supervisr描述正確的是()A、Supervisr是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件B、Supervisr負(fù)責(zé)接受Nimbus分配的任務(wù),啟動(dòng)和停止屬于自己管理的Wrker進(jìn)程C、Supervisr負(fù)責(zé)資源分配和任務(wù)調(diào)度D、supervisr是運(yùn)行具體處理邏輯的過(guò)程答案:B解析:Blt是在Tplgy中接受數(shù)據(jù)然后執(zhí)行處理的組件;Nimbus:負(fù)責(zé)資源分配和任務(wù)調(diào)度;Supervisr:負(fù)責(zé)接收Nimbus分配的任務(wù)44.在Spark生態(tài)組件中,哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。()A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案:A解析:1.在Spark生態(tài)組件中,sparkcre可用于復(fù)雜的批量數(shù)據(jù)處理2.SparkStreaming是一個(gè)對(duì)實(shí)時(shí)數(shù)據(jù)流進(jìn)行高吞吐、高容錯(cuò)的流式處理系統(tǒng)3.MLlib:是Spark實(shí)現(xiàn)一些常見(jiàn)的機(jī)器學(xué)習(xí)算法和實(shí)用程序4.SparkSQL是基于sparkcre提供的一個(gè)用來(lái)處理結(jié)構(gòu)化數(shù)據(jù)的模塊(庫(kù))45.關(guān)于hive與傳統(tǒng)據(jù)倉(cāng)庫(kù)的對(duì)比,以下描述錯(cuò)誤的是?A、數(shù)據(jù)存儲(chǔ)獨(dú)位于數(shù)據(jù)存儲(chǔ)之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,而傳統(tǒng)數(shù)據(jù),靈活性低B、Hive基于HDFS存儲(chǔ)理論上存儲(chǔ)量可無(wú)限擴(kuò)展,而傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)量會(huì)有上限C、由于hive的數(shù)據(jù)存儲(chǔ)在HDFS中,所以可以保證數(shù)據(jù)的高容錯(cuò),高可靠D、由于Hive基于大數(shù)據(jù)平臺(tái),所以查詢(xún)效率比傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)快答案:D解析:Hive在加載數(shù)據(jù)的過(guò)程中不會(huì)對(duì)數(shù)據(jù)進(jìn)行任何處理,甚至不會(huì)對(duì)數(shù)據(jù)進(jìn)行掃描,因此也沒(méi)有對(duì)數(shù)據(jù)中的某些Key建立索引。Hive要訪問(wèn)數(shù)據(jù)中滿(mǎn)足條件的特定值時(shí),需要暴力掃描整個(gè)數(shù)據(jù),因此訪問(wèn)延遲較高46.關(guān)于HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)的區(qū)別說(shuō)法錯(cuò)誤的是A、數(shù)據(jù)類(lèi)型:關(guān)系數(shù)據(jù)庫(kù)采用關(guān)系模型,具有豐富的數(shù)據(jù)類(lèi)型和存儲(chǔ)方式,HBase則采用了更加簡(jiǎn)單的數(shù)據(jù)模型,它把數(shù)據(jù)存儲(chǔ)為未經(jīng)解釋的字符串B、數(shù)據(jù)操作:關(guān)系數(shù)據(jù)庫(kù)中包含了豐富的操作,其中會(huì)涉及復(fù)雜的多表連接。HBase則不存在復(fù)雜的表與表之間的關(guān)系,只有簡(jiǎn)單的插入、查詢(xún)、刪除、清空等,因?yàn)镠Base在設(shè)計(jì)上就避免了復(fù)雜的表和表之間的關(guān)系C、存儲(chǔ)模式:關(guān)系數(shù)據(jù)庫(kù)是基于行模式存儲(chǔ)的。HBase是基于列存儲(chǔ)的,每個(gè)列族都由幾個(gè)文件保存,不同列族的文件是分離的D、數(shù)據(jù)維護(hù):在關(guān)系數(shù)據(jù)庫(kù)中執(zhí)行更新操作時(shí),并不會(huì)刪除數(shù)據(jù)舊的版本,而是生成一個(gè)新的版本,舊有的版本仍然保留。在HBase中,更新操作會(huì)用最新的當(dāng)前值去替換記錄中原來(lái)的舊值,舊值被覆蓋后就不會(huì)存在。答案:D解析:數(shù)據(jù)維護(hù):在關(guān)系數(shù)據(jù)庫(kù)中,更新操作會(huì)用最新的當(dāng)前值去替換記錄中的原來(lái)的舊值,舊值被覆蓋夠就不會(huì)存在,而在HBase中執(zhí)行更新操作時(shí),不糊并不會(huì)刪除數(shù)據(jù)舊的版本,而是生成一個(gè)新的版本,舊的有的版本保留。47.以下哪類(lèi)數(shù)據(jù)不屬于半結(jié)構(gòu)化數(shù)據(jù)?A、HTMLB、XMLC、二維表D、JSN答案:C解析:二維表,數(shù)據(jù)結(jié)構(gòu),是一個(gè)關(guān)系名,意思是指關(guān)系模型中,數(shù)據(jù)結(jié)構(gòu)的表示方法48.在Hadp生態(tài)組件中,哪個(gè)產(chǎn)品可用于復(fù)雜的批量數(shù)據(jù)處理。()A、MapReduce、HiveB、ImpalaC、StrmD、Mahut答案:A解析:在Hadp生態(tài)組件中,MapReduce、Hive可用于復(fù)雜的批量數(shù)據(jù)處理。49.以下關(guān)于HiveSQL基本操作描述正確的是()A、創(chuàng)建外部表必須要指定Lcatin信息B、創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字C、加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)必須是HDFS的一個(gè)路徑D、創(chuàng)建表時(shí)可以指定列分割符答案:D解析:建立外部表可以不指定Lcatin,會(huì)在默認(rèn)在/hive/warehuse/數(shù)據(jù)庫(kù)名稱(chēng)/表名,建立目錄。創(chuàng)建內(nèi)部表時(shí)不需要關(guān)鍵字。加載數(shù)據(jù)到Hive時(shí)源數(shù)據(jù)不一定是HDFS的一個(gè)路徑50.HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是()A、3B、2C、1D、4答案:B解析:HDFS的副本放置策略中,同一機(jī)架不同的服務(wù)器之間的距離是251.關(guān)于HBaseRegin的定位說(shuō)法錯(cuò)誤的是A、元數(shù)據(jù)表,又名.META.表,存儲(chǔ)了Regin和Regin服務(wù)器的映射關(guān)系。當(dāng)HBase表很大時(shí),.META.表也會(huì)被分裂成多個(gè)ReginB、為了加快訪問(wèn)速度,.META.表的全部Regin都會(huì)被保存在內(nèi)存中C、根數(shù)據(jù)表,又名-RT-表,記錄所有元數(shù)據(jù)的具體位置。-RT-表只有唯一一個(gè)Regin,名字是在程序中被寫(xiě)死的。Zkeeper文件記錄了-RT-表的位置D、為了加速尋址,客戶(hù)端會(huì)緩存位置信息,尋址過(guò)程客戶(hù)端只需要詢(xún)問(wèn)Zkeeper服務(wù)器,不需要連接Master服務(wù)器,由于數(shù)據(jù)放在內(nèi)存中,因此不存在緩存失效問(wèn)題。答案:D解析:客戶(hù)端訪問(wèn)數(shù)據(jù)時(shí)的“三級(jí)尋址”?為了加速尋址,客戶(hù)端會(huì)緩存位置信息,同時(shí),需要解決緩存失效問(wèn)題?尋址過(guò)程客戶(hù)端只需要詢(xún)問(wèn)Zkeeper服務(wù)器,不需要連接Master服務(wù)器52.HBasett靠()存儲(chǔ)底層數(shù)據(jù)A、HDFSB、HadpC、MemryD、MapReduce答案:A解析:首先HBase不同于一般的關(guān)系數(shù)據(jù)庫(kù),它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫(kù).另一個(gè)不同的是HBase基于列的而不是基于行的模式.53.關(guān)于HBase下面說(shuō)法正確的是()。A、HBase?一個(gè)稀疏、多維度、排序的映射表,這張表的索引是行鍵、列B、每個(gè)值是一個(gè)未經(jīng)解釋的字符串,沒(méi)有數(shù)據(jù)類(lèi)型,程序員要自己去對(duì)它進(jìn)C、用戶(hù)在表中存儲(chǔ)數(shù)據(jù),每一行都有一個(gè)可排序的行鍵和任意多的列D、以上說(shuō)法都正確答案:D解析:Hbase是HadpDatabase的簡(jiǎn)稱(chēng),Hbase是分布式、面向列的開(kāi)源數(shù)據(jù)庫(kù)(準(zhǔn)確是面向列族)。HDFS為Hbase提供可靠的底層數(shù)據(jù)存儲(chǔ)服務(wù),MapReduce為Hbase提供高性能的計(jì)算能力,Zkeeper為Hbaset提供穩(wěn)定服務(wù)和Failver機(jī)制,因?yàn)槲覀冋f(shuō)Hbase是一個(gè)通過(guò)大量廉價(jià)的機(jī)器解決海量數(shù)據(jù)的高速存儲(chǔ)和讀取的分布式數(shù)據(jù)庫(kù)解決方案。Hbase的特點(diǎn):1,海量存儲(chǔ)2,列式存儲(chǔ)3,極易擴(kuò)張4,高并發(fā)5,稀疏(主要針對(duì)Hbase的靈活性)54.下列不可作為java語(yǔ)言標(biāo)識(shí)符的是A、a1B、1C、1D、11答案:D解析:Java標(biāo)識(shí)符由數(shù)字,字母和下劃線(_),美元符號(hào)($)或人民幣符號(hào)(¥)組成。在Java中是區(qū)分大小寫(xiě)的,而且還要求首位不能是數(shù)字。55.從數(shù)據(jù)表中查找記錄用以下哪一項(xiàng)()A、UPDATEB、FINDC、SELECTD、CREATE答案:C解析:SELECT用于查找記錄56.LSM更能保證哪種操作的性能?A、讀B、寫(xiě)C、隨機(jī)讀D、合并答案:B解析:B+索引樹(shù)和lg型(append)文件操作(數(shù)據(jù)庫(kù)WAL日志)是數(shù)據(jù)讀寫(xiě)的兩個(gè)極端。B+樹(shù)讀效率高而寫(xiě)效率差;lg型文件操作寫(xiě)效率高而讀效率差;因此要在排序和lg型文件操作之間做個(gè)折中,于是就引入了lg-structedmergetree模型,通過(guò)名稱(chēng)可以看出LSM既有日志型的文件操作,提升寫(xiě)效率,又在每個(gè)sstable中排序,保證了查詢(xún)效率。57.查看kafkaMTpic的partitin詳細(xì)信息時(shí),使用如下那個(gè)命令?A、bin/kakfa-tpicssh—createB、bin/kakfa-tpicssh—deleteC、bin/kakfa-tpics.sh-listD、bin/kakfa-tpics.sh—describe答案:D解析:使用bin/kakfa-tpicssh—describe查看kafkaMTpic的partitin詳細(xì)信息58.關(guān)于HBaseshell命令,哪個(gè)命令是使表無(wú)效。()A、alertB、disableC、drpD、以上都不是答案:B解析:1.alter:修改列族模式2.disable:使表無(wú)效3.drp:刪除表59.Kafka集群中,Kafka服務(wù)端部署的角色是A、PrducerB、CnsumerC、ZKeeperD、Brker答案:D解析:一臺(tái)kafka服務(wù)器節(jié)點(diǎn)就是一個(gè)brker,負(fù)責(zé)處理消息讀、寫(xiě)請(qǐng)求,存儲(chǔ)消息,在kafkacluster這一層這里,其實(shí)里面是有很多個(gè)brker一個(gè)集群由多個(gè)brker組成。prducer是向kafkabrker發(fā)消息的客戶(hù)端,cnsumer是向kafkabrker取消息的客戶(hù)端60.LSM含義是?A、日志結(jié)構(gòu)合并樹(shù)B、二叉樹(shù)C、平衡二叉樹(shù)D、長(zhǎng)平衡二叉樹(shù)答案:A解析:LSM-Tree全稱(chēng)是LgStructuredMergeTree,是一種分層,有序,面向磁盤(pán)的數(shù)據(jù)結(jié)構(gòu),其核心思想是充分了利用了,磁盤(pán)批量的順序?qū)懸h(yuǎn)比隨機(jī)寫(xiě)性能高出很多61.FusininsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作?A、手動(dòng)清除告警B、啟停服務(wù)實(shí)例C、查詢(xún)歷史監(jiān)控D、刪除服務(wù)實(shí)例答案:C解析:FusininsightHD系統(tǒng)審計(jì)日志不可以記錄查詢(xún)歷史監(jiān)控62.關(guān)于hive建表基本描述正確的是()A、不可再修改表名B、可再增加新列C、創(chuàng)建外部表需要制定external關(guān)鍵字D、不可再修改列名答案:C解析:創(chuàng)建外部表需要制定external關(guān)鍵字63.Hbase中以下對(duì)于LSM的描述正確的是()。A、LSM的讀操作和寫(xiě)操作是獨(dú)立B、LSM的讀操作和寫(xiě)操作不是獨(dú)立C、LSM并不區(qū)分讀和寫(xiě)D、LSM中讀寫(xiě)是同一種操作答案:A解析:LSM中讀操作和寫(xiě)操作相互獨(dú)立,且并不相同64.有一段java應(yīng)用程序,它的主類(lèi)名是a1,那么保存它的源文件名可以是A、a1.javaB、a1.classC、a1D、都對(duì)答案:A解析:1、必須以java結(jié)尾。這樣才能被編輯器javacexe所編輯。2、源文件中如果只有一個(gè)類(lèi),文件名必須與該類(lèi)名相同。3、輸入命令:pushd路徑(此命令可將當(dāng)前目錄設(shè)為所希望的任一個(gè)已存在的路徑)。4、輸入命令:e:轉(zhuǎn)移到e盤(pán),然后再輸入cd轉(zhuǎn)移到所希望的已知路徑。65.關(guān)于MapReduce框架中一個(gè)作業(yè)的reduce任務(wù)數(shù),下列說(shuō)法正確的是()A、由自定義的Partitiner來(lái)確定B、是分塊總數(shù)目的一半C、可以由用戶(hù)來(lái)自定義,通過(guò)JbCnf.setNumReducetTask(int)來(lái)設(shè)定一個(gè)作業(yè)中reduce的任務(wù)數(shù)目D、由MapReduce隨機(jī)確定其數(shù)目答案:C解析:一個(gè)jb的ReduceTasks數(shù)量是通過(guò)mapreduce.jb.reduces參數(shù)設(shè)置也可以通過(guò)編程的方式,調(diào)用Jb對(duì)象的setNumReduceTasks()方法來(lái)設(shè)置目66.以下命令組成錯(cuò)誤的是()。A、vim/etc/prfileB、surce/etc/prfileC、hadpnamende-frmatD、bin/hadpfs-cat/hadpdata/y/txt答案:D解析:394、vim/etc/prfile雖然可以進(jìn)入prfile文件,但是對(duì)于普通用戶(hù),無(wú)法修改;etc/prfile:在登錄時(shí),操作系統(tǒng)定制用戶(hù)環(huán)境時(shí)使用的第一個(gè)文件,此文件為系統(tǒng)的每個(gè)用戶(hù)設(shè)置環(huán)境信息,當(dāng)用戶(hù)第一次登錄時(shí),該文件被執(zhí)行。使用命令hadpnamende-frmat對(duì)namende進(jìn)行格式化。hadpfs-cat>從DFS多個(gè)part文件合并拷貝文件到本地文件系統(tǒng)。67.不屬于HDFS優(yōu)勢(shì)是()?A、時(shí)間快B、超大文件C、大量小文件D、商用硬件答案:A解析:HDFS優(yōu)勢(shì):1、海量數(shù)據(jù)存儲(chǔ):HDFS可橫向擴(kuò)展,其存儲(chǔ)的文件可以支持PB級(jí)別或更高級(jí)別的數(shù)據(jù)存儲(chǔ)。2、高容錯(cuò)性:數(shù)據(jù)保存多個(gè)副本,副本丟失后自動(dòng)恢復(fù)??蓸?gòu)建在廉價(jià)的機(jī)器上,實(shí)現(xiàn)線性擴(kuò)展。當(dāng)集群增加新節(jié)點(diǎn)之后,namende也可以感知,進(jìn)行負(fù)載均衡,將數(shù)據(jù)分發(fā)和備份數(shù)據(jù)均衡到新的節(jié)點(diǎn)上。3、商用硬件:Hadp并不需要運(yùn)行在昂貴且高可靠的硬件4、大文件存儲(chǔ)68.在創(chuàng)建對(duì)象時(shí)必須A、先聲明對(duì)象,然后才能使用對(duì)象B、先聲明對(duì)象,為對(duì)象分配內(nèi)存空間,然后才能使用對(duì)象C、先聲明對(duì)象,為對(duì)象分配內(nèi)存空間,對(duì)對(duì)象初始化,然后才能使用對(duì)象D、上述說(shuō)法都對(duì)答案:C解析:Java就是這樣規(guī)定的69.Hbase的某張表的Rwkey劃分splitkey為9.E.a.z請(qǐng)問(wèn)表里面有幾個(gè)Regin?A、6B、3C、5D、4答案:C解析:Hbase的某張表的Rwkey劃分splitkey為9.E.a.z表里面有5個(gè)Regin70.在Zkeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí),StandbyResurcemanager會(huì)從以下哪個(gè)目錄中獲取Applicatin相關(guān)信息()A、metastreB、StatestreC、StreageD、Warehuse答案:B解析:在Zkeeper和Yarn的協(xié)同工作中,當(dāng)ActiveResurcemanager產(chǎn)生故障時(shí),StandbyResurcemanager會(huì)從Statestre目錄中獲取Applicatin相關(guān)信息()71.Kafka集群在運(yùn)行期間直接依賴(lài)于下面哪些組件?A、sparkB、zkeeperC、hdfsD、hbase答案:B解析:ZKeeper作為給分布式系統(tǒng)提供協(xié)調(diào)服務(wù)的工具被kafka所依賴(lài)72.下面與Zkeepe淡似的框架是?A、PrtbufB、JavaC、KafkaD、Chubby答案:D解析:,ZKeeper是一個(gè)分布式服務(wù)框架,是ApacheHadp的一個(gè)子項(xiàng)目,主要用來(lái)解決分布式應(yīng)用中經(jīng)常遇到的一些數(shù)據(jù)管理問(wèn)題,如:統(tǒng)一命名服務(wù)、配置管理、集群管理、分布式鎖、發(fā)布/訂閱等。73.HFile數(shù)據(jù)格式中的KeyValue數(shù)據(jù)格式中Value部分是()。A、擁有復(fù)雜結(jié)構(gòu)的字符串B、字符串C、二進(jìn)制數(shù)據(jù)D、壓縮數(shù)據(jù)答案:C解析:元數(shù)據(jù)是key-value類(lèi)型的值,但元數(shù)據(jù)快只保存元數(shù)據(jù)的value值,元數(shù)據(jù)的key值保存在第五項(xiàng)(元數(shù)據(jù)索引塊)中。74.解壓.tar.gziS尾的HBase壓縮包使用的Linux命令是?A、tar-zxvfB、tar-zxC、tar-sD、tar-nf答案:A解析:tar-zxvf75.Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是?A、SplitB、BlckC、EventD、Packet答案:C解析:Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是Event。76.下面哪個(gè)進(jìn)程負(fù)責(zé)MapReduce任務(wù)調(diào)度。A、NameNdeB、JbtrackerC、TaskTrackerD、SecndaryNameNde答案:B解析:Jbtracer負(fù)責(zé)MapReduce任務(wù)調(diào)度77.HFile數(shù)據(jù)格式中的Magic字段用于()。A、存儲(chǔ)隨機(jī)數(shù),防止數(shù)據(jù)損壞B、存儲(chǔ)數(shù)據(jù)的起點(diǎn)C、存儲(chǔ)數(shù)據(jù)塊的起點(diǎn)D、指定字段的長(zhǎng)度答案:A解析:每一個(gè)HFile內(nèi)部包括多種不同類(lèi)型的塊結(jié)構(gòu),這些塊結(jié)構(gòu)從邏輯上來(lái)講可歸并為兩類(lèi)。分別用于數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)索引(簡(jiǎn)稱(chēng)數(shù)據(jù)塊和索引塊)78.LSM的讀操作和寫(xiě)操作是獨(dú)立的?A、是。B、否。C、LSM并不區(qū)分讀和寫(xiě)D、LSM中讀寫(xiě)是同一種操作答案:A解析:如果我們對(duì)寫(xiě)性能特別敏感,我們最好怎么做?——Appendnly:所有寫(xiě)操作都是將數(shù)據(jù)添加到文件末尾。這樣做的寫(xiě)性能是最好的,大約等于磁盤(pán)的理論速度(200~300MB/s)。79.fusininsight對(duì)于管理操作,下列錯(cuò)誤的是?A、可對(duì)服務(wù)進(jìn)行啟停重啟B、可以添加和卸載服務(wù)C、常用服務(wù)隱藏或顯示D、可查看服務(wù)的當(dāng)前狀態(tài)答案:C解析:可設(shè)置不常用的服務(wù)隱藏或顯示80.Hive中的數(shù)據(jù)類(lèi)型,下面說(shuō)正確的是()。A、TINYINT,1個(gè)字節(jié)(8位)有符號(hào)整數(shù)B、SMALLINT,2字節(jié)(16位)有符號(hào)整數(shù)C、INT,4個(gè)字節(jié)(32位)有符號(hào)整數(shù)D、以上都正確答案:D解析:1.Hive中的數(shù)據(jù)類(lèi)型分為兩類(lèi):基本類(lèi)型和復(fù)雜類(lèi)型2.基本類(lèi)型包含:tinyint,smallint,int,bigint,flat,duble,blean,string,timestamp,binary3.復(fù)雜類(lèi)型:array,map和structa.array:數(shù)組類(lèi)型,對(duì)應(yīng)了Java中的集合或者數(shù)組。81.以下哪個(gè)不是HDFS的守護(hù)進(jìn)程A、SecndaryNameNdeB、NameNdeC、MrappMaster/YarnChildD、DataNde答案:C解析:namende\Secndnamende\Datande\Jbtracker\Tasktracker都是守護(hù)進(jìn)程82.以下哪個(gè)channel類(lèi)型的數(shù)據(jù)不會(huì)持久化()?A、FileChannelB、MemryChannelC、JDBCChannelD、HDFSChannel答案:B解析:JDBCChannel的數(shù)據(jù)類(lèi)型不會(huì)持久化83.hadp系統(tǒng)中YARN資源的抽象是用什么表示?A、內(nèi)存B、CPUC、CntainerD、磁盤(pán)空間答案:C解析:hadp系統(tǒng)中YARN資源的抽象是用Cntainer表示84.Spark是用以下哪種編程語(yǔ)言實(shí)現(xiàn)的()?A、CB、C++C、JAVAD、Scala答案:D解析:Scala是Spark的原生語(yǔ)言85.關(guān)系數(shù)據(jù)庫(kù)已經(jīng)流行很多年,Hadp已經(jīng)有了HDFS和MapReduce,關(guān)于需要HBase說(shuō)法錯(cuò)誤的是A、Hadp可以很好地解決大規(guī)模數(shù)據(jù)的離線批量處理問(wèn)題,但是,受限于HadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制,使得Hadp無(wú)法滿(mǎn)足大規(guī)模數(shù)據(jù)實(shí)時(shí)處理應(yīng)用的需求B、HDFS面向隨機(jī)訪問(wèn)模式,不是批量訪問(wèn)模式C、傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫(kù)無(wú)法應(yīng)對(duì)在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問(wèn)題(分庫(kù)分表也不能很好解決)D、傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù);空列浪費(fèi)存儲(chǔ)空間答案:B解析:Hadp可以很少地解決大規(guī)模數(shù)據(jù)的離線批量處理問(wèn)題,但是,受限于hadpMapReduce編程框架的高延遲數(shù)據(jù)處理機(jī)制,使得hadp無(wú)法滿(mǎn)足大規(guī)模數(shù)據(jù)實(shí)施處理應(yīng)用的需求HDFS面向批量訪問(wèn)模式,不是隨機(jī)訪問(wèn)模式。傳統(tǒng)的通用關(guān)系型數(shù)據(jù)庫(kù)無(wú)法應(yīng)對(duì)在數(shù)據(jù)規(guī)模劇增時(shí)導(dǎo)致的系統(tǒng)擴(kuò)展性和性能問(wèn)題(分庫(kù)分表也不能很好的解決)傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)在數(shù)據(jù)結(jié)構(gòu)變化時(shí)一般需要停機(jī)維護(hù),空列浪費(fèi)存儲(chǔ)空間因此,業(yè)界出現(xiàn)了一類(lèi)面向半結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)和處理的高擴(kuò)展、低寫(xiě)入、查詢(xún)延遲的系統(tǒng),例如,鍵值數(shù)據(jù)庫(kù)、文檔數(shù)據(jù)庫(kù)和列族數(shù)據(jù)庫(kù)(如BigTable和HDase)Hbase已經(jīng)成功應(yīng)用于互聯(lián)網(wǎng)服務(wù)領(lǐng)域和傳統(tǒng)行業(yè)的眾多在線模式數(shù)據(jù)分析處理系統(tǒng)中86.HBase表中每個(gè)cell的多版本是通過(guò)()表示的?A、timestampB、rwkeyC、blckidD、cellid答案:A解析:每個(gè)Cell可能有多個(gè)版本,它們之間用時(shí)間戳(TimeStamp)區(qū)分。87.為了保障流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在哪里?A、jbmanager的內(nèi)存中B、可靠性高的單機(jī)數(shù)據(jù)庫(kù)中C、本地文件系統(tǒng)中D、hdfs中答案:D解析:為了保障流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在hdfs中88.關(guān)于HBase的HLg工作原理說(shuō)法錯(cuò)誤的是A、分布式環(huán)境必須要考慮系統(tǒng)出錯(cuò)。HBase采用HLg保證系統(tǒng)恢復(fù)B、HBase系統(tǒng)為每個(gè)Regin服務(wù)器配置了一個(gè)HLg文件,它是一種預(yù)寫(xiě)式日志(WriteAheadLg)C、用戶(hù)更新數(shù)據(jù)不需要先寫(xiě)入日志后,才能寫(xiě)入MemStre緩存,并且,直到MemStre緩存內(nèi)容對(duì)應(yīng)的日志已經(jīng)寫(xiě)入磁盤(pán),該緩存內(nèi)容才能被刷寫(xiě)到磁盤(pán)D、發(fā)生故障后,系統(tǒng)會(huì)根據(jù)每條日志記錄所屬的Regin對(duì)象對(duì)HLg數(shù)據(jù)進(jìn)行拆分,分別放到相應(yīng)Regin對(duì)象的目錄下,然后,再將失效的Regin重新分配到可用的Regin服務(wù)器中,并把與該Regin對(duì)象相關(guān)的HLg日志記錄也發(fā)送給相應(yīng)的Regin服務(wù)器答案:C解析:Regin服務(wù)器領(lǐng)取到分配給自己的Regin對(duì)象以及與之相關(guān)的HLg日志記錄以后,會(huì)重新做一遍日志記錄中的各種操作,把日志記錄中的數(shù)據(jù)寫(xiě)入到MemStre緩存中,然后,刷新到磁盤(pán)的StreFile文件中,完成數(shù)據(jù)恢復(fù)。89.釆用Flume傳輸數(shù)據(jù)過(guò)程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),推薦使用以下哪種channel類(lèi)型?A、MemryChannelsB、FileChannelC、JDBCChannelD、HDFSChannel答案:B解析:釆用Flume傳輸數(shù)據(jù)過(guò)程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),推薦使用FileChannel90.加載數(shù)據(jù)到Hive表,哪種方式不正確?A、直接將本地路徑的文件lad到Hive表中B、將HDFS上的文件lad到Hive表中C、Hive支持Insertint單條記錄的方法,所以可以直接在命令行插入單條記錄D、將其他表的結(jié)果集insertint到Hive表答案:C解析:Hive不支持Insertint單條記錄的方法91.關(guān)于HadpMapReduce分片(spit)概念,下列說(shuō)法不正確的是()。A、Hadp為每個(gè)split創(chuàng)建一個(gè)Map任務(wù)B、split的多少?zèng)Q定了Map任務(wù)的數(shù)目C、大多數(shù)情況下,理想的分片大小是一個(gè)HDFS塊對(duì)應(yīng)一個(gè)spitD、split是一個(gè)物理概念答案:D解析:split不是一個(gè)物理概念,是一個(gè)概念上的切片,blck是物理概念。92.以下選項(xiàng)中,不屬于信息時(shí)代的定律的是()A、吉爾德定律B、摩爾定律C、麥特卡爾夫定律D、達(dá)律多定律答案:A解析:吉爾德定律(Gilder'sLaw)又稱(chēng)為勝利者浪費(fèi)定律,由喬治·吉爾德提出,最為成功的商業(yè)運(yùn)作模式是價(jià)格最低的資源將會(huì)被盡可能的消耗,以此來(lái)保存最昂貴的資源。.吉爾德定律(Gilder'sLaw)被描述為:在未來(lái)25年,主干網(wǎng)的帶寬每6個(gè)月增長(zhǎng)一倍,12個(gè)月增長(zhǎng)兩倍。.其增長(zhǎng)速度是摩爾定律預(yù)測(cè)的CPU增長(zhǎng)速度的3倍,并預(yù)言將來(lái)上網(wǎng)會(huì)免費(fèi)。.93.Javaapplicatin中的主類(lèi)需包含main方法,main方法的返回類(lèi)型是什么?A、intB、flatC、dubleD、vid答案:D解析:vid,即不返回對(duì)象,main方法是程序執(zhí)行的入口,main方法也不需要初始化對(duì)象就能執(zhí)行94.關(guān)于Hadp生態(tài)系統(tǒng)軟件說(shuō)法錯(cuò)誤的是A、HDFS是分布式文件系統(tǒng)B、YARN是資源管理和調(diào)度器C、Tez是運(yùn)行在YARN之上的下一代Hadp查詢(xún)處理框架D、Hive是Hadp上的數(shù)據(jù)倉(cāng)庫(kù),為了提高效率,可以越過(guò)HDFS直接管理數(shù)據(jù)的存儲(chǔ)答案:D解析:hive的表使用的默認(rèn)存儲(chǔ)是hdfs的文件系統(tǒng),相當(dāng)于表的數(shù)據(jù)是存儲(chǔ)在hdfs文件系統(tǒng)中的。因此無(wú)法越過(guò)HDFS直接管理數(shù)據(jù)的存儲(chǔ)95.以下哪個(gè)方法用于定義線程的執(zhí)行體?A、start()B、init()C、run()D、synchrnized()答案:C解析:通過(guò)繼承Thread類(lèi)來(lái)創(chuàng)建并啟動(dòng)線程的步驟如下:定義Thread類(lèi)的子類(lèi),并重寫(xiě)該類(lèi)的run()方法,該run()方法將作為線程執(zhí)行體。創(chuàng)建Thread子類(lèi)的實(shí)例,即創(chuàng)建了線程對(duì)象。調(diào)用線程對(duì)象的start()方法來(lái)啟動(dòng)該線程。96.哪個(gè)命令是刪除文件的?A、dfs-clearB、dfs-IsC、dfs-rmD、dfs-del答案:C解析:dfs-rm命令是用來(lái)刪除文件的。dfs-clear沒(méi)找到dfs-Is沒(méi)找到dfs-del沒(méi)找到97.大數(shù)據(jù)的核心價(jià)值是()。A、數(shù)據(jù)交易B、數(shù)據(jù)分析C、數(shù)據(jù)融合D、數(shù)據(jù)處理答案:B解析:大數(shù)據(jù)的核心價(jià)值是數(shù)據(jù)分析98.HDFS中的數(shù)據(jù)塊(blck)默認(rèn)保存幾份?()A、3份B、2份C、1份D、不確定答案:A解析:HDFS中的數(shù)據(jù)塊(blck)默認(rèn)保存3份,每份默認(rèn)為128M99.Kafka集群中,Kafka服務(wù)端的角色是?A、BrkerB、CnsumerC、ZkeeperD、Prducer答案:A解析:Kafka集群中,Kafka服務(wù)端的角色是Brker。Cnsumer就是負(fù)責(zé)從Kafka集群中消費(fèi)消息數(shù)據(jù)的應(yīng)用程序Zkeeperl是一個(gè)開(kāi)源的分布式的,為分布式框架提供協(xié)調(diào)服務(wù)的Apache項(xiàng)目。Prducer就是負(fù)責(zé)向Kafka集群中寫(xiě)入消息數(shù)據(jù)的應(yīng)用程序100.萬(wàn)維網(wǎng)之父是()。A、彼得?德魯克B、舍恩伯格C、蒂姆■伯納斯-李D、斯科特■布朗答案:C解析:萬(wàn)維網(wǎng)之父是蒂姆·伯納斯·李101.關(guān)于HDFS集群中的DataNde的描述不正確的是?A、—個(gè)DataNde上存儲(chǔ)的所有數(shù)據(jù)塊可以有相同的B、存儲(chǔ)客戶(hù)端上傳的數(shù)據(jù)的數(shù)據(jù)塊C、DataNde之間可以互相通信D、響應(yīng)客戶(hù)端的所有讀寫(xiě)數(shù)據(jù)請(qǐng)求,為客戶(hù)端的存儲(chǔ)和讀取數(shù)據(jù)提供支撐答案:A解析:出于安全性和高可用性考慮,并不會(huì)把一個(gè)blck的多個(gè)副本放在同一個(gè)datande上102.下列關(guān)于HadpAPI的說(shuō)法錯(cuò)誤的是()。A、Hadp的API只適用于HDFS文件系統(tǒng)B、Cnfiguratin類(lèi)的默認(rèn)實(shí)例化方法是以HDFS系統(tǒng)的資源配置為基礎(chǔ)的C、FileStatus對(duì)象存儲(chǔ)文件和目錄的元數(shù)據(jù)D、FSDatalnputStream是java.i.DatalnputStream的子類(lèi)答案:A解析:Hadp的API是通用的,既可以適用于HDFS,又可以適用于Hbase、Mapreduce等103.下列數(shù)據(jù)結(jié)構(gòu)具有記憶功能的是?A、隊(duì)列B、循環(huán)隊(duì)列C、棧D、順序表答案:C解析:具有記憶功能的是棧104.FusininsightHD系統(tǒng)中,下面哪個(gè)方法不能查看到Lader作業(yè)執(zhí)行的結(jié)果()A、通過(guò)LaderUI界面查看B、通過(guò)YARN任務(wù)管理C、Ndemanager查看D、通過(guò)Manager的查看答案:C解析:FusininsightHD系統(tǒng)中,使用Ndemanager查看不能查看到Lader作業(yè)執(zhí)行的結(jié)果105.Hbase中的Regin是由哪個(gè)服務(wù)進(jìn)程來(lái)管理的?A、HreginserverB、ZkeeperC、MasterD、Datande答案:A解析:Hbase中的Regin是由Hreginserver來(lái)管理的106.如下哪項(xiàng)不是ZKeeper的關(guān)鍵特性()?A、最終一致性B、延時(shí)性C、可靠性D、等待無(wú)關(guān)性答案:B解析:ZKeeper的關(guān)鍵特性包括最終一致性,可靠性,等待無(wú)關(guān)性107.使用Hbase客戶(hù)端批量寫(xiě)入10條數(shù)據(jù),某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,請(qǐng)問(wèn)寫(xiě)入這10條數(shù)據(jù)需要向該HreginServer發(fā)送幾次RPC請(qǐng)求?A、10B、6C、2D、1答案:D解析:使用Hbase客戶(hù)端批量寫(xiě)入10條數(shù)據(jù),某個(gè)Hreginserver節(jié)點(diǎn)上包含該表的2個(gè)Regin,分別為A和B,10條數(shù)據(jù)中有6條屬于A.4條屬于B,寫(xiě)入這10條數(shù)據(jù)需要向該HreginServer發(fā)送1次RPC請(qǐng)求108.以下哪個(gè)不屬于Hadp中Mapreduce組件的特點(diǎn)?A、高容錯(cuò)B、良好的擴(kuò)展性C、實(shí)時(shí)計(jì)算D、易于編程答案:C解析:高度抽象的編程思想,良好的擴(kuò)展性,高容錯(cuò)性,適用于并行計(jì)算和離線計(jì)算109.關(guān)于HBase和BigTable說(shuō)法錯(cuò)誤的是A、HBase是一個(gè)高可靠、高性能、面向列、可伸縮的分布式數(shù)據(jù)庫(kù),是谷歌BigTable的開(kāi)源實(shí)現(xiàn),主要用來(lái)存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)B、BigTable和HBase均采用Chubby提供協(xié)同服務(wù)管理C、BigTable和HBase都是一個(gè)分布式存儲(chǔ)系統(tǒng)D、HBase的目標(biāo)是處理非常龐大的表,可以通過(guò)水平擴(kuò)展的方式,利用廉價(jià)計(jì)算機(jī)集群處理由超過(guò)10億行數(shù)據(jù)和數(shù)百萬(wàn)列元素組成的數(shù)據(jù)表答案:B解析:BigTable是一個(gè)分布式存儲(chǔ)系統(tǒng),它利用谷歌提出的MapReduce分布式并行計(jì)算模型來(lái)處理海量數(shù)據(jù),使用谷歌分布式文件系統(tǒng)GFS作為底層數(shù)據(jù)存儲(chǔ),采用Chubby提供協(xié)同服務(wù)管理。HadpDatabase,是一個(gè)高可靠性、高性能、面向列、可伸縮、實(shí)時(shí)讀寫(xiě)的分布式數(shù)據(jù)庫(kù)。利用HadpHDFS作為其文件存儲(chǔ)系統(tǒng),利用Zkeeper作為其分布式協(xié)同服務(wù)主要用來(lái)存儲(chǔ)非結(jié)構(gòu)化和半結(jié)構(gòu)化的松散數(shù)據(jù)。110.使用JAVAAPI進(jìn)行HBase表數(shù)據(jù)添加操作,以下命令輸寫(xiě)正確的是()。cA、HTable.add(newPut(Bytes.tBytes(rw));B、HTable.insert(newPut(Bytes.tBytes(rw))C、HTable.putfnewPut(Bytes.tBytes(rw));D、HTable.updatefnewPut(Bytes.tBytes(rw))答案:C解析:即table.get(table).scan();111.在Java中,一個(gè)類(lèi)可同時(shí)定義許多同名的方法,這些方法的形式參數(shù)個(gè)數(shù)、類(lèi)型或順序各不相同,傳回的值也可以不相同。這種面向?qū)ο蟪绦虻奶匦苑Q(chēng)為A、隱藏B、覆蓋C、重載D、Java不支持此特性答案:C解析:一個(gè)類(lèi)可以定義多個(gè)同名的方法,只要這些方法的參數(shù)列表不完全相同,這稱(chēng)為方法重載。112.HBase依賴(lài)()技術(shù)框架提供消息通信機(jī)制。A、ZkeeperB、ChubbyC、RPCD、Scket答案:A解析:“hbase依賴(lài)“Zkeeper”提供消息通信機(jī)制113.用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是()。A、專(zhuān)題分析報(bào)告B、綜合分析報(bào)告C、日常數(shù)據(jù)通報(bào)D、實(shí)時(shí)運(yùn)營(yíng)報(bào)告答案:C解析:用定期數(shù)據(jù)分析報(bào)表作為依據(jù)的反映計(jì)劃執(zhí)行情況的數(shù)據(jù)分析報(bào)告是日常數(shù)據(jù)通報(bào)114.LSM結(jié)構(gòu)的數(shù)據(jù)首先存儲(chǔ)在()0A、硬盤(pán)上B、內(nèi)存中C、磁盤(pán)陣列中D、閃存中答案:B解析:LSM樹(shù)的核心特點(diǎn)是利用順序?qū)憗?lái)提高寫(xiě)性能,但因?yàn)榉謱?此處分層是指的分為內(nèi)存和文件兩部分)的設(shè)計(jì)會(huì)稍微降低讀性能,但是通過(guò)犧牲小部分讀性能換來(lái)高性能寫(xiě),使得LSM樹(shù)成為非常流行的存儲(chǔ)結(jié)構(gòu)。115.哪一項(xiàng)不屬于Hive的流控特性()?A、已經(jīng)建立的總連接數(shù)閾值控制B、某個(gè)特定用戶(hù)已經(jīng)建立的連接數(shù)閾值控制C、每個(gè)用戶(hù)已經(jīng)建立的連接數(shù)閾值控制D、單位時(shí)間內(nèi)所建立的連接數(shù)閾值控制答案:B解析:某個(gè)特定用戶(hù)已經(jīng)建立的連接數(shù)閾值控制不屬于Hive的流控特性116.下列關(guān)于Flinkbarrier描述錯(cuò)誤的是?()A、一個(gè)barrier將本周期快照的數(shù)據(jù)與下一個(gè)周期快照的數(shù)據(jù)分隔開(kāi)來(lái)B、barrier是F1ink快照的核心C、在插入barrier的時(shí)候,會(huì)暫時(shí)阻斷數(shù)據(jù)流D、barrier周期性插入到數(shù)據(jù)流中,并作為數(shù)海流的一部分隨之流動(dòng)答案:C解析:在插入barrier的時(shí)候,不會(huì)暫時(shí)阻斷數(shù)據(jù)流117.如果要給隊(duì)列QueueA設(shè)置容量為30%,應(yīng)該設(shè)置哪個(gè)參數(shù)()?A、yarn.scheduler.capacity.rt.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.rt.QueueD.user-limit-factrC、yarn.scheduler.capacity.rt.QueueA.capacityD、yarn.scheduler.capacity.rt.QueueA.state答案:C解析:在YARN中應(yīng)設(shè)置為yarn.scheduler.capacity.rt.QueueA.capacity118.Hadptnryarnschedulercapacity,rt.Queueafinim.m-user-limit-percent設(shè)置為50,下面說(shuō)法錯(cuò)誤的是?A、一個(gè)用戶(hù)提交任務(wù),可以使用QueueA的100%的資源。B、如果QueueA中已經(jīng)有2個(gè)用戶(hù)的任務(wù)運(yùn)行,這時(shí)第3個(gè)用戶(hù)提交的任務(wù)需要等待釋放資源。C、QueueA中必須保障毎個(gè)用戶(hù)至少得到50%的資源D、QueueA中的每個(gè)用戶(hù)最多只能獲得50%的資源答案:D解析:如果有資源需求,每個(gè)隊(duì)列都會(huì)對(duì)分配給用戶(hù)的資源百分比實(shí)施限制。用戶(hù)限制可以在最小值和最大值之間變化。前者(最小值)設(shè)置為該屬性值,后者(最大值)取決于已提交應(yīng)用程序的用戶(hù)數(shù)。例如,假設(shè)此屬性的值為25。如果兩個(gè)用戶(hù)已將應(yīng)用程序提交到隊(duì)列,用戶(hù)不可以使用超過(guò)50%的隊(duì)列資源。如果第三位用戶(hù)提交了一個(gè)應(yīng)用程序,用戶(hù)都不能使用超過(guò)33%的隊(duì)列資源。如果有4個(gè)或更多用戶(hù),用戶(hù)都不能使用超過(guò)25%的隊(duì)列資源。值100表示??未施加用戶(hù)限制。默認(rèn)值為100。值指定為整數(shù)。119.下列論據(jù)中,能夠支撐“大數(shù)據(jù)無(wú)所不能”的觀點(diǎn)的是()A、互聯(lián)網(wǎng)金融打破了傳統(tǒng)的觀念和行為B、大數(shù)據(jù)存在泡沫C、大數(shù)據(jù)具有非常高的成本D、個(gè)人隱私泄露與信息安全擔(dān)憂(yōu)答案:D解析:“個(gè)人隱私泄露與信息安全擔(dān)憂(yōu)”能夠支撐“大數(shù)據(jù)無(wú)所不能”的觀點(diǎn)120.關(guān)于MapReduceShuffle過(guò)程合并(bine)操作,兩個(gè)健值對(duì)<"a",1>和<"a",1>經(jīng)過(guò)合并操作結(jié)果為()。A、<"a",2>B、<"a",<1,1>>C、<"a,a",2>D、<"a,a",<1,1>>答案:A解析:關(guān)于MapReduceShuffle過(guò)程合并(bine)操作,兩個(gè)健值對(duì)<"a",1>和<"a",1>經(jīng)過(guò)合并操作結(jié)果為<"a",2>。歸并的結(jié)果是<"a",<1,1>>。121.KafkaClusterMirrring工具可以實(shí)現(xiàn)以下哪些功能?A、Kafka數(shù)據(jù)同步方案B、Kafka單集群內(nèi)數(shù)據(jù)備份C、Kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全不正確答案:A解析:可使用MirrrMaker工具創(chuàng)建從源Kafka群集(源群集)到目標(biāo)Kafka群集(目標(biāo)群集)的鏡像,從而實(shí)現(xiàn)數(shù)據(jù)同步122.HBase是分布式列式存儲(chǔ)系統(tǒng),記錄按什么集中存放。A、列族B、列C、行D、不確定答案:A解析:HBase是一個(gè)分布式列式存儲(chǔ)系統(tǒng),記錄按列簇集中存放,通過(guò)主鍵(rw,key)和主鍵的range來(lái)檢索數(shù)據(jù)。123.HFile數(shù)據(jù)格式中的Metalndex字段用于()。A、Meta塊的長(zhǎng)度B、Meta塊的結(jié)束點(diǎn)C、Meta塊數(shù)據(jù)內(nèi)容D、Meta塊的起始點(diǎn)答案:D解析:HFile是參照谷歌的SSTable存儲(chǔ)格式進(jìn)行設(shè)計(jì)的。全部的數(shù)據(jù)記錄都是通過(guò)它來(lái)完畢持久化,其內(nèi)部主要採(cǎi)用分塊的方式進(jìn)行存儲(chǔ)124.以下哪個(gè)操作是hive不支持的?()A、表增加列B、表刪除列C、表修改列D、修改表名答案:B解析:hive不支持表刪除列125.Fusininsight產(chǎn)品中,關(guān)乎Kafka說(shuō)法不正確的是()A、Kafka強(qiáng)依賴(lài)ZkeeperB、Kafka的服務(wù)端可以產(chǎn)生消息C、Kafka的部署的實(shí)例個(gè)數(shù)不得小于2D、Cnsumer作為Kafka的客戶(hù)端角色專(zhuān)門(mén)進(jìn)行消息的消費(fèi)答案:B解析:Kafka的服務(wù)端不可以產(chǎn)生消息126.Hadp平臺(tái)中啟用YARN組件的日志聚集功能,需要配置哪個(gè)參數(shù)?A、yarn.ndemanager.lcal-dirsB、yarn.ndemanager.lg-dirsC、yarn.acl.enableD、yarn.lg-aggregatin-enable答案:D解析:Hadp平臺(tái)中啟用YARN組件的日志聚集功能,需要配置yarn.lg-aggregatin-enable參數(shù)127.下列國(guó)家的大數(shù)據(jù)發(fā)展行動(dòng)中,集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國(guó)家是()。A、美國(guó)B、日本C、中國(guó)D、韓國(guó)答案:D解析:國(guó)家的大數(shù)據(jù)發(fā)展行動(dòng)中,集中體現(xiàn)“重視基礎(chǔ)、首都先行”的國(guó)家是韓國(guó)128.關(guān)于Kafka的基本概念描述錯(cuò)誤的是()?A、Kafka集群包含一個(gè)或多個(gè)服務(wù)實(shí)例,這些服務(wù)實(shí)例被稱(chēng)為BrkerB、每條發(fā)布到Kafka集群的消息都有一個(gè)類(lèi)別,這個(gè)類(lèi)別被稱(chēng)為T(mén)picC、每個(gè)Cnsumer屬于多個(gè)的CnsumerGrupD、Kafka將Tpic分成一個(gè)或者多個(gè)Partitin,每個(gè)Partitin在物理上對(duì)應(yīng)一個(gè)文件夾,該文件夾下存儲(chǔ)這個(gè)Partitin的所有消息答案:C解析:每個(gè)Cnsumer進(jìn)程都會(huì)劃歸到一個(gè)邏輯的CnsumerGrup中129.以下關(guān)于Zkeeper關(guān)鍵特性中的原子性說(shuō)法正確的是?A、客戶(hù)端發(fā)送的更新會(huì)按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、更新只能全部完成或失敗,不會(huì)部分完成C、一條消息被一個(gè)server接收,將被所有server接收D、集群中無(wú)論哪臺(tái)服務(wù)器,對(duì)外示均是同一視圖答案:B解析:數(shù)據(jù)更新原子性:一次數(shù)據(jù)更新要么成功,要么失敗。130.SQL語(yǔ)言中,刪除一個(gè)表中所有數(shù)據(jù),但保留表結(jié)構(gòu)的命令是()。A、DELETEB、DRPC、DRPD、REMRE答案:A解析:2、truncate和delete只刪除數(shù)據(jù)不刪除表的結(jié)構(gòu)(定義)。DeleteFrmCustmer;DrptableCustmer;drptable表名稱(chēng);truncatetable表名稱(chēng);deletefrm表名稱(chēng)where列名稱(chēng)=值131.Hbase元數(shù)據(jù)MetaRegin/路由信息保存在哪里?A、ZkeeperB、Meta表C、HMasterD、Rt表答案:B解析:Hbase元數(shù)據(jù)MetaRegin/路由信息保存在Meta表中132.在數(shù)據(jù)安全及處理效率方面,不適宜大數(shù)據(jù)分析的軟件是()。A、SASB、StataC、MatLabD、SPSS答案:D解析:在數(shù)據(jù)安全及處理效率方面,不適宜大數(shù)據(jù)分析的軟件是SPSSSAS(是全球最大的私營(yíng)軟件公司之一,是由美國(guó)北卡羅來(lái)納州立大學(xué)1966年開(kāi)發(fā)的統(tǒng)計(jì)分析軟件。SPSS是由SPSS公司推出的軟件“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”軟件。Stata是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專(zhuān)業(yè)圖表的完整及整合性統(tǒng)計(jì)軟件。MATLAB是美國(guó)MathWrks公司出品的商業(yè)數(shù)學(xué)軟件,用于數(shù)據(jù)分析、無(wú)線通信、深度學(xué)習(xí)、圖像處理與計(jì)算機(jī)視覺(jué)、信號(hào)處理、量化金融與風(fēng)險(xiǎn)管理、機(jī)器人,控制系統(tǒng)等領(lǐng)域。133.硬件故障被認(rèn)為是常態(tài),為了解決這個(gè)問(wèn)題.HDFS設(shè)計(jì)了副本機(jī)制。默認(rèn)情況下HDFS會(huì)存()份?A、3B、5C、2D、4答案:A解析:默認(rèn)情況下HDFS會(huì)存3份134.在HBaseShell操作中,可以使用下面哪個(gè)命令對(duì)數(shù)據(jù)表進(jìn)行行數(shù)統(tǒng)計(jì)()。A、selectcunt(0)frm'users'B、sum'users'C、cunt'users'D、truncate'users'答案:C解析:HBase'users'屬性唯一,通過(guò)cunt語(yǔ)句,可統(tǒng)計(jì)有多少行數(shù)135.如果需要對(duì)HBase表中的數(shù)據(jù)進(jìn)行列表查看,可以使用()命令進(jìn)行操作。A、cuntB、scanC、putD、get答案:B解析:get命令是用來(lái)獲取Hbase表中某行的數(shù)據(jù)136.在Fusininsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Tpic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Tpic時(shí),必須設(shè)置Partitin個(gè)數(shù)B、在創(chuàng)建Kafka的tpic時(shí),必須設(shè)置Partitin副本個(gè)數(shù)C、設(shè)置多副本可以増強(qiáng)Kafka服務(wù)的容災(zāi)能力D、以上全都正確答案:C解析:kafka的partitin可以在創(chuàng)建時(shí)候指定,也可以alter(kafka-tpic.sh里面的參數(shù)),但是,這個(gè)修改只能增加partitin數(shù)目,并不能減少137.關(guān)于HBase用戶(hù)讀寫(xiě)數(shù)據(jù)過(guò)程說(shuō)法錯(cuò)誤的是A、用戶(hù)寫(xiě)入數(shù)據(jù)時(shí),被分配到相應(yīng)Regin服務(wù)器去執(zhí)行B、用戶(hù)數(shù)據(jù)首先被寫(xiě)入到MemStre和Hlg中C、只有當(dāng)操作寫(xiě)入Hlg之后,mit()調(diào)用才會(huì)將其返回給客戶(hù)端D、當(dāng)用戶(hù)讀取數(shù)據(jù)時(shí),先去磁盤(pán)上面的StreFile中尋找答案:D解析:數(shù)據(jù)讀寫(xiě)的過(guò)程:?用戶(hù)寫(xiě)入數(shù)據(jù)時(shí),被分配到相應(yīng)Regin服務(wù)器去執(zhí)行?用戶(hù)數(shù)據(jù)首先被寫(xiě)入到MemStre和Hlg中?只有當(dāng)操作寫(xiě)入Hlg之后,mit()調(diào)用才會(huì)將其返回給客戶(hù)端?當(dāng)用戶(hù)讀取數(shù)據(jù)時(shí),Regin服務(wù)器會(huì)首先訪問(wèn)MemStre緩存,如果找不到,再去磁盤(pán)上面的StreFile中尋找138.如果我們現(xiàn)有一個(gè)安裝26.5版本的hadp集群,在不修改默認(rèn)配置的情況下存儲(chǔ)200個(gè)每個(gè)200M的文本文件,請(qǐng)問(wèn)最終會(huì)在集群中產(chǎn)生多少個(gè)數(shù)據(jù)塊(包括副本)A、200B、40000C、400D、1200答案:D解析:?jiǎn)栕罱K會(huì)在集群中產(chǎn)生1200個(gè)數(shù)據(jù)塊139.Hadp中MapReduce組件擅長(zhǎng)處理哪種場(chǎng)景的計(jì)算任務(wù)?A、迭代計(jì)算B、離線計(jì)算C、實(shí)時(shí)交互計(jì)算D、流式計(jì)算答案:B解析:海量數(shù)據(jù)在單機(jī)上處理因?yàn)橛布Y源限制,無(wú)法勝任。而一旦將單機(jī)版程序擴(kuò)展到集群來(lái)分布式運(yùn)行,將極大增加程序的復(fù)雜度和開(kāi)發(fā)難度。引入mapreduce框架后,開(kāi)發(fā)人員可以將絕大部分工作集中在業(yè)務(wù)邏輯的開(kāi)發(fā)上,而將分布式計(jì)算中的復(fù)雜性交由框架來(lái)處理。140.下哪種不是Hive支持的數(shù)據(jù)類(lèi)型()。A、structB、intC、mapD、lng答案:D解析:Hive支持原始數(shù)據(jù)類(lèi)型和復(fù)雜類(lèi)型,原始類(lèi)型包括數(shù)值型,Blean,字符串,時(shí)間戳,int。復(fù)雜類(lèi)型包括數(shù)組,map,struct。141.hadp平臺(tái)中要查看Yarn服務(wù)中一個(gè)applicatin的信息,通常需要使用什么命令?A、cntainerB、jarC、applicatin-attemptD、Applicatin答案:D解析:hadp平臺(tái)中要查看Yarn服務(wù)中一個(gè)applicatin的信息,通常需要使用Applicatin命令。Cntainer將內(nèi)存、CPU、磁盤(pán)、網(wǎng)絡(luò)等資源封裝在一起,這樣可以起到限定資源邊界的作用。把本地的java文件打包成jar包,然后放在linux集群上,通過(guò)hadp命令來(lái)運(yùn)行該jar包。142.HBase來(lái)源于哪篇博文?A、TheGgleFileSystemB、MapReduceC、BigTableD、Chubby答案:C解析:Bigtable是一種用于管理結(jié)構(gòu)化數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng),旨在擴(kuò)展到非常大的尺寸:對(duì)數(shù)千臺(tái)商品服務(wù)器上的PB數(shù)據(jù)進(jìn)行服務(wù)。Bigtable不支持完整的關(guān)系數(shù)據(jù)模型,相反,它為客戶(hù)端提供了一個(gè)簡(jiǎn)單的數(shù)據(jù)模型,支持對(duì)數(shù)據(jù)布局和格式的動(dòng)態(tài)控制,并允許客戶(hù)端推理底層存儲(chǔ)中表示的數(shù)據(jù)的局部屬性。用戶(hù)在Bigtable中可以使用是任意字符串的行和列名稱(chēng)對(duì)數(shù)據(jù)進(jìn)行索引。Bigtable還將數(shù)據(jù)視為字符串,盡管客戶(hù)端通常將各種形式的結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)序列化到這些字符串中。143.FusinninsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過(guò)哪個(gè)組件?A、SurceB、SinkC、TpicD、channel答案:C解析:FusinninsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點(diǎn)內(nèi)不需要經(jīng)過(guò)Tpic組件。在節(jié)點(diǎn)的內(nèi)部,agent由surce、channel和sink組成。surce負(fù)責(zé)消費(fèi)從上游節(jié)點(diǎn)獲取的events,并將其放到channel中,目前Flume支持Avr、Thrift、Syslg、Netcat等數(shù)據(jù)流。channel分為兩種類(lèi)型,一種是memrychannel,它適合高吞吐量場(chǎng)景,但節(jié)點(diǎn)掛掉后數(shù)據(jù)可能會(huì)丟失。另一種是filechannel,也就是channel里的數(shù)據(jù)會(huì)同步到硬盤(pán)里,節(jié)點(diǎn)意外掛掉后數(shù)據(jù)可恢復(fù),但處理時(shí)間會(huì)稍長(zhǎng)一些,F(xiàn)lume默認(rèn)使用filechannel。sink從channel取數(shù)據(jù)并將其放入下游節(jié)點(diǎn)。144.如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇以下哪種消息發(fā)布策略()?A、局部字段分組B、廣播分組C、直接分組D、全局分組答案:C解析:如果需要由數(shù)據(jù)生產(chǎn)者決定數(shù)據(jù)發(fā)送給目標(biāo)Blt的某一個(gè)確定的Task,應(yīng)選擇直接分組發(fā)布策略145.Hadpffl件在企業(yè)應(yīng)用中,能用于數(shù)據(jù)挖掘的產(chǎn)品有()。A、HiveB、PigC、MahutD、Hbase答案:C解析:Mahut可用于數(shù)據(jù)挖掘,Hive和Hbase是數(shù)據(jù)存儲(chǔ),pig是一種語(yǔ)言。146.若需要定義一個(gè)類(lèi)域或類(lèi)方法,應(yīng)使用哪種修飾符?A、staticB、packageC、privateD、public答案:A解析:類(lèi)域類(lèi)方法全局變量全局方法147.以下關(guān)于Flink關(guān)鍵特性描述不正確的是()A、Sparkstreaming與Flink相比,時(shí)延更低B、F1ink流式處理引撃能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C、與FusininghtHD中的Streaming相比Flink具有更高的吞吐量D、checkpint實(shí)現(xiàn)了Flink的容錯(cuò)答案:A解析:Flink會(huì)比SparkStreaming有更低的流處理延遲性148.關(guān)于Hive中的桶說(shuō)法不正確的是()?A、每個(gè)桶是一個(gè)目錄B、建表時(shí)指定桶個(gè)數(shù),桶內(nèi)可排序C、數(shù)據(jù)按照某個(gè)字段的值Hash后放入某個(gè)桶中D、對(duì)于數(shù)據(jù)抽樣、特定jin的優(yōu)化很有意義答案:A解析:一個(gè)分區(qū)就是一個(gè)目錄,而不是桶149.FusininsightManager用戶(hù)權(quán)限管理不支持哪個(gè)配置?A、給用戶(hù)配置角色B、給用戶(hù)組配置角色C、給角色配量權(quán)限D(zhuǎn)、給用戶(hù)組配置權(quán)限答案:D解析:FusininsightManager用戶(hù)權(quán)限管理不支持給用戶(hù)組配置權(quán)限150.Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理?A、DatabatchAPI,DatastreamAPIB、StreamAPI,BatchAPIC、DatastreamAPI,DatasetAPID、BatchAPI,StreamAPI答案:C解析:Flink中的DatastreamAPI接口用于流數(shù)據(jù)處理,DatasetAPI接口用于批處理151.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成()?A、channelB、TransfrmatinC、sinkD、surce答案:B解析:Flink的數(shù)據(jù)轉(zhuǎn)換操作在Transfrmatin完成152.部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署幾個(gè)?A、1B、3C、4D、2答案:D解析:部署FusininsightHD時(shí),同一集群內(nèi)的FlumeServer節(jié)點(diǎn)建議至少部署2個(gè)153.整型數(shù)據(jù)類(lèi)型中,需要內(nèi)存空間最少的是A、shrtB、lngC、intD、byte答案:D解析:byte,一個(gè)字節(jié)(八個(gè)二進(jìn)制位)154.數(shù)據(jù)倉(cāng)庫(kù)的最終目的是()A、收集業(yè)務(wù)需求B、開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用分析C、建立數(shù)據(jù)倉(cāng)庫(kù)邏輯模型D、為用戶(hù)和業(yè)務(wù)部門(mén)提供決策支持答案:A解析:數(shù)據(jù)倉(cāng)庫(kù)的最終目的是收集業(yè)務(wù)需求155.為了保證流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在()?A、本地文件系統(tǒng)中B、Jbmanager的內(nèi)存中C、HDFS中D、可靠性高的單機(jī)數(shù)據(jù)庫(kù)中答案:C解析:為了保證流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在HDFS中156.在Spark生態(tài)組件中,哪個(gè)產(chǎn)品可用于基于實(shí)時(shí)數(shù)據(jù)流的數(shù)據(jù)處理()。A、SparkCreB、SparkSqlC、SparkStreamingD、MLlib答案:C解析:SparkStreaming基于實(shí)時(shí)數(shù)據(jù)流157.使用JAVAAPI進(jìn)行HBaseS表掃描操作,以下命令輸寫(xiě)正確的是()。A、table.getScanner(scan);B、table.scan(table);C、table.get(table).scan();D、table.Scanner(get);答案:A解析:使用table.getScanner(scan)進(jìn)行掃描158.在數(shù)據(jù)庫(kù)模型中,可以指定條件對(duì)記錄進(jìn)行排序,使用的方法是()。A、rder_byB、filterC、rderD、grup()答案:A解析:保證結(jié)果集中的行已排序的方法是使用RDERBY子句159.關(guān)于HBase實(shí)現(xiàn)的三個(gè)主要的功能組件說(shuō)法錯(cuò)誤的是A、主服務(wù)器Master負(fù)責(zé)管理和維護(hù)HBase表的分區(qū)信息,維護(hù)Regin服務(wù)器列表,分配Regin,負(fù)載均衡B、Regin服務(wù)器負(fù)責(zé)存儲(chǔ)和維護(hù)分配給自己的Regin,處理來(lái)自客

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論