大數(shù)據(jù)HCIA練習(xí)題(附答案)_第1頁(yè)
大數(shù)據(jù)HCIA練習(xí)題(附答案)_第2頁(yè)
大數(shù)據(jù)HCIA練習(xí)題(附答案)_第3頁(yè)
大數(shù)據(jù)HCIA練習(xí)題(附答案)_第4頁(yè)
大數(shù)據(jù)HCIA練習(xí)題(附答案)_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大數(shù)據(jù)HCIA練習(xí)題(附答案)一、單選題(共40題,每題1分,共40分)1、HBase的某張表的RowKey劃分SplitKey為9,E,a,z,請(qǐng)問(wèn)該表有幾個(gè)Region?A、3B、4C、5D、6正確答案:C2、下列關(guān)于Flinkbarrier描述錯(cuò)誤的是?A、在插入barrier的時(shí)候,會(huì)暫時(shí)阻斷數(shù)據(jù)流B、一個(gè)barrier將本周起快照的數(shù)據(jù)與下一個(gè)周期快照的數(shù)據(jù)分隔開來(lái)C、barrier周期性插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動(dòng)D、barrier是Flink快照的核心正確答案:A3、FusionInsightHD中HBase的某張表的RowKey劃分SplitKey為9,E,a,z,請(qǐng)問(wèn)該表有幾個(gè)Region?A、3B、4C、5D、6正確答案:C4、以下關(guān)于HBase二級(jí)索引的描述哪一項(xiàng)是正確的?A、二級(jí)索引把要查找的列與rowkey關(guān)聯(lián)成一個(gè)索引表B、此時(shí)列成新的rowkey,原rowkey成為valueC、二級(jí)索引查詢了2次D、以上完全正確正確答案:D5、Hive中的哪些操作可以合并A、UNIONALLB、JOINC、SELECTD、GROUPBY正確答案:A6、HBase中數(shù)據(jù)存儲(chǔ)的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile正確答案:A7、spark的核心模塊是?A、sparksqlB、mapreduceC、sparkstreamingD、sparkcore正確答案:D8、FusionInsightHD中,關(guān)于HBase的BIoomFilter特性理解,說(shuō)法不正確的是?A、可以用來(lái)過(guò)濾數(shù)據(jù)B、可以用來(lái)優(yōu)化隨機(jī)讀性能C、會(huì)增加存儲(chǔ)的消耗D、可以準(zhǔn)確判斷某條數(shù)據(jù)不存在正確答案:A9、關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是?A、Supervisor負(fù)責(zé)資源分配和任務(wù)調(diào)度B、Supervisor負(fù)責(zé)接受Nimbus分配的任務(wù),啟動(dòng)和停止屬于自己管理的worker進(jìn)程C、Supervisor是運(yùn)行具體處理邏輯的進(jìn)程D、Supervisor是一個(gè)Topology中接收數(shù)據(jù)然后執(zhí)行處理的組件正確答案:B10、關(guān)于HBase的Region分裂流程Split的描述不正確的是?A、Split過(guò)程中并沒(méi)有真正的將文件分開,僅僅是創(chuàng)建了引用文件B、Split為了減少Region中數(shù)據(jù)大小,從而將一個(gè)Region分裂成兩個(gè)RegionC、Split過(guò)程中該表會(huì)暫停服務(wù)D、Split過(guò)程中被分裂的Region會(huì)暫停服務(wù)正確答案:C11、Zookeeper的scheme認(rèn)證方式不包括以下哪項(xiàng)?()A、saslB、worldC、digestD、auth正確答案:A12、在FusionInsightHD中,創(chuàng)建Loader作業(yè)的進(jìn)行數(shù)據(jù)轉(zhuǎn)換的正確步驟是()A、加載、轉(zhuǎn)換、輸出B、輸入設(shè)置、轉(zhuǎn)換、輸出C、加載、轉(zhuǎn)化、抽取D、抽取、轉(zhuǎn)換、輸出正確答案:B13、Flume數(shù)據(jù)采集過(guò)程中,下列選項(xiàng)中能對(duì)數(shù)據(jù)進(jìn)行過(guò)濾和修飾的是?A、SinkB、ChannelSelectorC、InterceptorD、Channel正確答案:C14、FusionlnsightHD系統(tǒng)中,LDAP數(shù)據(jù)同步方式是哪個(gè)?A、單向同步B、雙向同步C、隔離不同步D、數(shù)據(jù)交叉同步正確答案:A15、FusionlnsightHD中,如果需要查看當(dāng)前登錄HBase的用戶和權(quán)限組,可以在HBaseshell中執(zhí)行什么命令?A、use_permissionB、whoamiC、whoD、get_user正確答案:B16、下列選項(xiàng)中,關(guān)于Zookeeper可靠性含義說(shuō)法正確的是?()A、可靠性通過(guò)主備部署莫屬實(shí)現(xiàn)B、可靠性是指更新只能成功或者失敗,沒(méi)有中間狀態(tài)C、可靠性是指無(wú)論哪個(gè)Server。對(duì)外展示的均是同一個(gè)視圖D、可靠性是指一條消息被一個(gè)Server接收,它將被所有Server接受正確答案:D17、下列那些命令是HDFS下載文件/目錄到本地的()A、dfs-mkdirB、dfs-putC、dfs-catD、dfs-get正確答案:D18、Flink中的()接口用于流數(shù)據(jù)處理,()接口用于批處理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI正確答案:A19、在很多小文件場(chǎng)景下,Spark會(huì)起很多Task。當(dāng)SQL邏輯中存在Shuffle操作時(shí),會(huì)大大增加hash分桶數(shù),嚴(yán)重影響性能。FusionInsight中,針對(duì)小文件的場(chǎng)景通常采用()算子,來(lái)對(duì)Table中的小文件生成的partition進(jìn)行合并,減少partition數(shù),從而避免再shuffle的時(shí)候,生成過(guò)多的hash分桶,提高性能。A、groupbyB、connectC、coalesceD、join正確答案:C20、下列選項(xiàng)中,關(guān)于Zookeeper可靠性含義說(shuō)法正確的是?A、可靠性通過(guò)主備部署模式實(shí)現(xiàn)B、可靠性是指一條消息被一個(gè)server接收,它將被所有server接受C、可靠性是指無(wú)論哪個(gè)server,對(duì)外展示的均是同一個(gè)視圖D、可靠性是指更新只能成功或者失敗,沒(méi)有中間狀態(tài)正確答案:B21、FusionInsightHD系統(tǒng)中HDFS默認(rèn)BlockSize是多少?A、32MB、64MC、128MD、256M正確答案:C22、以下關(guān)于Kafka的描述錯(cuò)誤的有()A、用作活動(dòng)流和運(yùn)營(yíng)數(shù)據(jù)處理管道的基礎(chǔ)B、由ApacheHadoop開發(fā),并于2011年開源C、具有信息持久化、高吞吐、實(shí)時(shí)等特性D、使用Scala、Java語(yǔ)言實(shí)現(xiàn)正確答案:B23、FusionInsightHD集群組網(wǎng)設(shè)計(jì)中,有一種機(jī)架可以按照業(yè)務(wù)需求線性擴(kuò)展,這種機(jī)架被稱為()A、基本框B、擴(kuò)展框C、管理框D、數(shù)據(jù)框正確答案:B24、FusionlnsightHD使用HBase客戶端批量寫入10條數(shù)據(jù),某個(gè)RegionServer節(jié)點(diǎn)上包含該表的2個(gè)Region,分別A和B,10條數(shù)據(jù)中有兩條屬于A,4條屬于B,請(qǐng)問(wèn)寫入這10條數(shù)據(jù)需要向該RegionServer發(fā)送幾次RPC請(qǐng)求?A、1B、2C、3D、4正確答案:A25、FusionInsightHD系統(tǒng)審計(jì)日志不可以記錄下面哪些操作?A、手動(dòng)清除告警B、啟停服務(wù)實(shí)例C、刪除服務(wù)實(shí)例D、查詢歷史監(jiān)控正確答案:D26、華為FusionInsightHD系統(tǒng)中關(guān)于HDFS的DataNode說(shuō)法正確的是?A、不會(huì)檢查數(shù)據(jù)的有效性B、周期性地將本節(jié)點(diǎn)的Block發(fā)送給NameNodeC、不同的DataNode存儲(chǔ)的Block一定是不同的D、一個(gè)DataNode上的Block可以是相同的正確答案:D27、下面哪些場(chǎng)景不是Flink組件擅長(zhǎng)的?()A、迭代計(jì)算B、數(shù)據(jù)存儲(chǔ)C、批處理D、流處理正確答案:B28、YARN調(diào)度器分配資源申請(qǐng)的順序,下面哪一個(gè)描述是正確的?A、任意機(jī)器->同機(jī)架->本地資源B、任意機(jī)器->本地資源->同機(jī)架C、本地資源->同機(jī)架->任意機(jī)器D、同機(jī)架->任意機(jī)器->本地資源正確答案:C29、下列關(guān)于HBase的BloomFilter特性理解不正確的是?A、用來(lái)過(guò)濾數(shù)據(jù)B、用來(lái)優(yōu)化隨機(jī)讀取的性能C、會(huì)增加存儲(chǔ)的消耗D、可以準(zhǔn)確判斷某條數(shù)據(jù)不存在S正確答案:C30、為了保證流應(yīng)用的快照存儲(chǔ)的可靠性,快照主要存儲(chǔ)在?A、HDFS中B、jobManager的內(nèi)存中C、可靠性高的單機(jī)數(shù)據(jù)庫(kù)中D、本地文件系統(tǒng)中正確答案:A31、FusionInsightHD的Manager界面對(duì)Loader的操作不包括下列哪個(gè)?A、啟動(dòng)Loader實(shí)例B、查看Loader服務(wù)狀態(tài)C、配置Loader參數(shù)D、查看Loader運(yùn)行日志正確答案:D32、SoIrCloud模式是集群模式,在此模式下Solr服務(wù)器強(qiáng)依賴于以下哪個(gè)服務(wù)?A、HBaseB、HDFSC、ZooKeeperD、Yarn正確答案:C33、HBase的底層數(shù)據(jù)以()的形式存在的?A、KeyValueB、行存儲(chǔ)C、實(shí)時(shí)存儲(chǔ)D、列存儲(chǔ)正確答案:A34、以下關(guān)于Flink關(guān)鍵特性描述不正確的是?A、SparkStreaming與Flink相比,時(shí)延更低B、Flink流式處理引擎能夠同時(shí)提供支持流處理和批處理應(yīng)用的功能C、與FusionInghtHD中的Streaming相比,F(xiàn)link具有更高的吞吐量D、checkpoint實(shí)現(xiàn)了Flink的容錯(cuò)正確答案:A35、在有N個(gè)節(jié)點(diǎn)FusionInsightHD集群中部署HBase時(shí),推薦部署()個(gè)HMaster進(jìn)程,()個(gè)RegionServer進(jìn)程A、3,NB、N,NC、2,ND、2,2正確答案:C36、關(guān)于DataSet,下列說(shuō)法不正確的是?()A、DataSet是一個(gè)由特定域的對(duì)象組成的強(qiáng)類型集合B、DataSet不需要反序列化就可執(zhí)行大部分操作C、DataSet執(zhí)行sort、filter、shuffle等操作需要進(jìn)行反序列化D、DataSet與RDD高度類似,性能比RDD好正確答案:C37、以下關(guān)于Hive的描述不正確的是?A、Hive的最佳使用場(chǎng)合是大數(shù)據(jù)集的批處理作業(yè)B、Hive查詢操作過(guò)程嚴(yán)格遵守HadoopMapReduce的作業(yè)執(zhí)行模型,Hive將用戶的HiveQL語(yǔ)句通過(guò)解釋器轉(zhuǎn)為MapReduce作業(yè)提交到Hadoop集群上C、Hive構(gòu)建在基于靜態(tài)批處理的Hadoop之上,Hadoop通常都有較高的延遲并且在作業(yè)提交和調(diào)度的時(shí)候需要大量的開銷D、Hive可以實(shí)現(xiàn)在大規(guī)模數(shù)據(jù)集上實(shí)現(xiàn)低延遲快速的查詢。正確答案:D38、Hive中的這條命令“ALTERTABLEemployee1ADDcolumns(column1string);”是什么含義?A、刪除表B、增加列C、創(chuàng)建表D、修改文件格式正確答案:B39、以下關(guān)于kafkapartition偏移量的描述不正確的是?()A、offset是一個(gè)String型字符串B、每條消息在文件中的位置稱為offset(偏移量)C、消費(fèi)者通過(guò)(offset、partition、topic)跟蹤記錄D、唯一標(biāo)記一條消息正確答案:A40、Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪個(gè)環(huán)節(jié)中完成?()A、soureB、TransformationC、SinkD、Channel正確答案:B二、多選題(共30題,每題1分,共30分)1、Hadoop的HDFS是一種分布式文件系統(tǒng),適合以下哪種場(chǎng)景的數(shù)據(jù)存儲(chǔ)和管理?A、大量小文件存儲(chǔ)B、高容錯(cuò)、高吞吐量C、低延遲讀取D、流式數(shù)據(jù)訪問(wèn)正確答案:BD2、Nimbus在Streaming架構(gòu)中的功能包括?A、資源分配B、啟動(dòng)/關(guān)閉工作進(jìn)程C、任務(wù)調(diào)度D、監(jiān)控任務(wù)執(zhí)行狀態(tài)正確答案:ACD3、FusionInsightManager界面顯示Hive服務(wù)狀態(tài)為Bad時(shí),可能原因有哪些?A、DBService不可用B、HDFS服務(wù)不可用C、MetaStore實(shí)例不可用D、HBase服務(wù)不可用正確答案:ABC4、在FusionInsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partiton個(gè)數(shù)B、在創(chuàng)建Kafka的Topic時(shí),必須設(shè)置Partition副本個(gè)數(shù)C、設(shè)置多副本可以增強(qiáng)Kafka服務(wù)的容災(zāi)能力D、以上全都正確正確答案:ABCD5、對(duì)于容量調(diào)度器的任務(wù)選擇,以下說(shuō)法正確的是A、資源回收請(qǐng)求隊(duì)列優(yōu)先B、資源利用量最低的隊(duì)列優(yōu)先C、最大隊(duì)列層級(jí)優(yōu)先D、最小隊(duì)列層級(jí)優(yōu)先正確答案:ABD6、采用Flume傳輸數(shù)據(jù)過(guò)程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel正確答案:BC7、HBase的數(shù)據(jù)文件HFile中一個(gè)KeyValue格式包含哪些信息?A、KeyB、ValueC、TimeStampD、KeyType正確答案:ABCD8、根據(jù)數(shù)據(jù)流如何在兩個(gè)Transformation之間傳輸數(shù)據(jù),數(shù)據(jù)流可以分為哪些類型?A、一對(duì)多流B、redistributing流C、一對(duì)一流D、Distributing流正確答案:AC9、HBase的數(shù)據(jù)文件HFile中一個(gè)KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType正確答案:ABCD10、Hadoop集群規(guī)模很大時(shí),數(shù)據(jù)的分布情況會(huì)非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴(kuò)容,數(shù)據(jù)是否需要做均衡等。以下關(guān)于FusionInsight資源分布監(jiān)控說(shuō)法正確的有()A、幫助用戶迅速找到資源消耗最高的節(jié)點(diǎn),采用適當(dāng)?shù)拇胧〣、通過(guò)每個(gè)服務(wù)主頁(yè)的資源分布查看界面,查看到關(guān)鍵的資源分布情況C、可以幫助用戶快速聚集在最關(guān)鍵的資源消耗上D、通過(guò)DashBoard界面,可以查看到主機(jī)資源分布情況。例如內(nèi)存占有率在50-75%的主機(jī)列表,并提供鏈接跳轉(zhuǎn)正確答案:ABCD11、下面關(guān)于flink窗口的描述錯(cuò)誤的是A、滑動(dòng)動(dòng)窗口之間時(shí)間點(diǎn)不存在重疊B、滾動(dòng)窗口在時(shí)間上是不重疊的C、滾動(dòng)窗口在時(shí)間上是重疊的D、滑動(dòng)窗口之間時(shí)間點(diǎn)存在重疊正確答案:AC12、華為大數(shù)據(jù)解決方案中平臺(tái)架構(gòu)包括以下哪些組成部分?A、DataFarm層B、GaussDB200C、FusionInsightManagerD、Hadoop層正確答案:ABCD13、FusionInsightHD系統(tǒng)中使用Streaming客戶端Shell命令查看拓?fù)浠蛱峤煌負(fù)涫。韵履男┒ㄎ皇侄问钦_的?A、查看客戶端異常堆棧,判斷是否客戶端使用問(wèn)題B、查看主Nimbus的運(yùn)行日志,判斷是否Nimbus服務(wù)端異常C、查看Supervisor運(yùn)行日志,判斷是否Supervisor異常D、查看Worker運(yùn)行日志正確答案:AB14、執(zhí)行HBase讀數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HFileB、HLogC、MemStoreD、HDFS正確答案:AC15、FusionInsight家族包含下列哪些子產(chǎn)品()?()A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS正確答案:ABCDE16、以下關(guān)于Hadoop分布式文件系統(tǒng)HDFS聯(lián)邦描述正確的有?A、一個(gè)Namespace使用一個(gè)blockpool管理數(shù)據(jù)塊B、一個(gè)Namespace可使用多個(gè)blockpool管理數(shù)據(jù)塊C、每個(gè)blockpool的磁盤空間是物理共享的,邏輯空間是隔離的D、支持NameNode/Namespace水平擴(kuò)展正確答案:ACD17、在FusionInsightHD中,F(xiàn)link主要與以下哪些組件進(jìn)行交互?A、KafkaB、YARNC、ZookeeperD、HDFS正確答案:ABCD18、HBase集群定時(shí)執(zhí)行Compaction的目的是什么?A、減少同一個(gè)Region,同一個(gè)ColumnFamily下的文件數(shù)目B、提升數(shù)據(jù)讀取性能C、減少同一個(gè)ColumnFamily的文件數(shù)據(jù)D、減少同一個(gè)Region的文件數(shù)目正確答案:AB19、在FusionInsightHD中,以下哪一項(xiàng)不屬于Hive的流控特性A、支持對(duì)已建立的總連接數(shù)做閾值控制B、支持對(duì)每個(gè)用戶已經(jīng)建立的連接數(shù)做閾值控制C、支持對(duì)某個(gè)特定用戶已建立的連接數(shù)做閾值控制D、支持對(duì)單位時(shí)間內(nèi)所建立的連接數(shù)做閾值控制正確答案:ABD20、Flink的兼容性體現(xiàn)在以下哪些方面?A、能夠使用Hadoop的格式化輸入和輸出B、YARN能夠作為Flink集群的資源調(diào)度管理器C、能夠從本地獲取數(shù)據(jù)D、能夠與Hadoop原有的Mappers和Reducers混合使用正確答案:ABD21、以下關(guān)于KafkaPartition說(shuō)法正確的有?A、每個(gè)Partition都是有序且不可變的消息隊(duì)列B、每個(gè)Partition在存儲(chǔ)層面對(duì)應(yīng)一個(gè)log文件C、Partition數(shù)量決定了每個(gè)Consumergroup中并發(fā)消費(fèi)者的最大數(shù)量D、引入Partition機(jī)制,保證了Kafka的高吞吐能力正確答案:ABCD22、以下屬于Streaming的特點(diǎn)的是?A、屬于事件驅(qū)動(dòng)B、延遲低C、可做連續(xù)查詢D、數(shù)據(jù)先存儲(chǔ)在計(jì)算正確答案:ABC23、Hbase中的以下哪種場(chǎng)景會(huì)觸發(fā)Flush操作?A、當(dāng)Wals中的文件數(shù)量達(dá)到閾值時(shí)B、Hbase定期刷新Memstore,默認(rèn)周期為1小時(shí)C、MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預(yù)設(shè)的閾值大小D、Region中MemStore的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值正確答案:ABCD24、Zookeeper中的數(shù)據(jù)節(jié)點(diǎn)znode分為哪幾種類型?A、temporaryB、persistentC、semi-persistentD、ephemeral正確答案:BD25、Hadoop的HDFS是一種分布式文件系統(tǒng),適合以下哪種應(yīng)用場(chǎng)景的數(shù)據(jù)存儲(chǔ)和管理?A、大量小文件存儲(chǔ)B、高容錯(cuò)、高吞吐量C、低延遲讀取D、流式數(shù)據(jù)訪問(wèn)正確答案:BD26、HDFS不適用于以下哪些場(chǎng)景?A、流式數(shù)據(jù)訪問(wèn)B、大量小文件存儲(chǔ)C、大文件存儲(chǔ)與訪問(wèn)D、隨機(jī)寫入正確答案:BD27、關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說(shuō)法正確的是?A、SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認(rèn)的執(zhí)行引擎為MapReduceB、SparkSQL不可以使用Hive的自定義函數(shù)C、SparkSQL兼容絕大部分Hive的語(yǔ)法和函數(shù)D、SparkSQL依賴Hive的元數(shù)據(jù)正確答案:ACD28、大數(shù)據(jù)商業(yè)咨詢服務(wù)方案在規(guī)劃環(huán)節(jié)主要考慮以下哪些設(shè)計(jì)?A、大數(shù)據(jù)商業(yè)模式設(shè)計(jì)B、商業(yè)場(chǎng)景全景規(guī)劃C、典型場(chǎng)景需求設(shè)計(jì)D、場(chǎng)景分解和業(yè)務(wù)設(shè)計(jì)正確答案:ABCD29、大數(shù)據(jù)時(shí)代的到來(lái),依賴于以下哪些技術(shù)的提升?A、網(wǎng)絡(luò)B、硬件設(shè)備制造C、云計(jì)算D、人工智能正確答案:ABCD30、YARN容量調(diào)度器的主要特點(diǎn)有哪些()A、靈活性B、多重租賃C、動(dòng)態(tài)更新配置文件D、容量保證正確答案:ABCD三、判斷題(共30題,每題1分,共30分)1、ResourecManager采用高可用方案,當(dāng)ActiveResourceManager發(fā)現(xiàn)故障時(shí),只能通過(guò)內(nèi)置的Zookeeper來(lái)啟動(dòng)Standby的ResourceManager將其狀態(tài)切換為Active。A、正確B、錯(cuò)誤正確答案:B2、現(xiàn)有3個(gè)機(jī)架,有一個(gè)文件需要存3份,其中副本1和副本2存放在與client相同的機(jī)架且不同的服務(wù)器上。根據(jù)HDFS的副本放置策略一定要存放在其他機(jī)架。A、正確B、錯(cuò)誤正確答案:B3、在YARN的任務(wù)調(diào)度中,一旦ApplicationMaster申請(qǐng)到資源后,便與對(duì)應(yīng)的ResourceManager通信,要求它啟動(dòng)任務(wù)。A、正確B、錯(cuò)誤正確答案:B4、Mapreduce過(guò)程中,默認(rèn)情況下,一個(gè)分片就是一個(gè)塊,也是一個(gè)mapTask.A、正確B、錯(cuò)誤正確答案:A5、驅(qū)動(dòng)型Source是flume周期性主動(dòng)去獲取數(shù)據(jù)。()A、正確B、錯(cuò)誤正確答案:B6、Channel的作用類似隊(duì)列,用于臨時(shí)緩存進(jìn)來(lái)的數(shù)據(jù),當(dāng)Sink成功地將數(shù)據(jù)發(fā)送到下一跳的Channel或最終目的,數(shù)據(jù)會(huì)從Channel移除A、正確B、錯(cuò)誤正確答案:A7、FusionInsightHD系統(tǒng)中,在創(chuàng)建Kafka的Topic時(shí)必須設(shè)置Partition個(gè)數(shù)和副本個(gè)數(shù),設(shè)置多副本可以增強(qiáng)Kafka服務(wù)的容災(zāi)能力。A、正確B、錯(cuò)誤正確答案:A8、假設(shè)HDFS在寫入數(shù)據(jù)時(shí)只存2份,那么在寫入過(guò)程中,HDFSClient先將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入DataNode2。()A、正確B、錯(cuò)誤正確答案:B9、FusionInsightHD產(chǎn)品中,一個(gè)典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一個(gè)Zookeeper集群A、正確B、錯(cuò)誤正確答案:A10、topology在任務(wù)完成后會(huì)自動(dòng)結(jié)束運(yùn)行。()A、正確B、錯(cuò)誤正確答案:B11、Channels支持事務(wù),提供較弱的順序保證,可以連接任何數(shù)量的Source和Sink。A、正確B、錯(cuò)誤正確答案:A12、Hadoop系統(tǒng)中,如果文件系統(tǒng)的備份因子是3,那么每次MapReduce任務(wù)運(yùn)行的task所需要的文件都要從3個(gè)有副本的機(jī)器上傳輸需要處理的文件。A、正確B、錯(cuò)誤正確答案:B13、FusionInsighttool是為技術(shù)支持工程師和維護(hù)工程師提供的一套健康檢測(cè)工具,能夠檢查集群相關(guān)節(jié)點(diǎn)、服務(wù)的健康狀態(tài),提前發(fā)現(xiàn)集群中潛在的問(wèn)題,并生成健康檢查報(bào)告。方便技術(shù)支持工程師各維護(hù)工程師快速了解系統(tǒng)的健康狀況。()A、正確B、錯(cuò)誤正確答案:A14、大數(shù)據(jù)需要傳統(tǒng)行業(yè)思維的轉(zhuǎn)變,要把數(shù)據(jù)收集,分析中作為業(yè)務(wù)流程的重要組成,數(shù)據(jù)端驅(qū)動(dòng)業(yè)務(wù)流程優(yōu)化,實(shí)現(xiàn)智能化和自動(dòng)化,并依托數(shù)據(jù)資產(chǎn)實(shí)現(xiàn)跨界拓展A、正確B、錯(cuò)誤正確答案:A15、FusionInsightHD產(chǎn)品中,zookeeper服務(wù)不可用會(huì)導(dǎo)致kafka服務(wù)不可用。A、正確B、錯(cuò)誤正確答案:A16、在Flink中,checkpoint機(jī)制能夠保證應(yīng)用在運(yùn)行過(guò)程中出現(xiàn)失效時(shí),從某一個(gè)檢查點(diǎn)恢復(fù),在此過(guò)程中,流快照是根據(jù)數(shù)據(jù)流入建立的A、正確B、錯(cuò)誤正確答案:A17、Kafka作為一個(gè)分布式消息系統(tǒng),支持在線和離線消息處理,并提供了JAVAAPI以便其他組件對(duì)接使用。在FunsionInsight解決方案中,Kafka屬于FusionInsightHD模塊。A、正確B、錯(cuò)誤正

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論