HCIA-大數(shù)據(jù)試題與答案_第1頁
HCIA-大數(shù)據(jù)試題與答案_第2頁
HCIA-大數(shù)據(jù)試題與答案_第3頁
HCIA-大數(shù)據(jù)試題與答案_第4頁
HCIA-大數(shù)據(jù)試題與答案_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

精選優(yōu)質(zhì)文檔-----傾情為你奉上精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)專心---專注---專業(yè)精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)HCIA-大數(shù)據(jù)試題與答案1.下列選項中無法通過大數(shù)據(jù)技術(shù)實現(xiàn)的是?()*[單選題]*A.商業(yè)模式發(fā)現(xiàn)B.信用評估C.商品推薦D.運營分析(正確答案)2.FusionInsightManager的主要功能有以下哪些?()*[單選題]*A.數(shù)據(jù)集成B.系統(tǒng)管理C.安全管理(正確答案)D.服務(wù)治理(正確答案)(正確答案)3.假設(shè)每個用戶最低資源保障設(shè)置為yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。則以下說法錯誤的是?()*[單選題]*A.第3個用戶提交任務(wù)時,每個用戶最多獲得33.33%的資源B.第2個用戶提交任務(wù)時,每個用戶最多獲得50%的資源C.第4個用戶提交任務(wù)時,每個用戶最多獲得25%的資源D.第5個用戶提交任務(wù)時,每個用戶最多獲得20%的資源(正確答案)4.華為大數(shù)據(jù)解決方案中平臺架構(gòu)包括以下哪些組成部分?()*[單選題]*A.Hadoop層B.FusioInghtManager(正確答案)C.GaussDB200D.DataFram(正確答案)(正確答案)5.Spark自帶的資源管理框架是?()*[單選題]*A.StandaloneB.MesosC.YARND.Docker(正確答案)6.關(guān)于RDD,下列說法錯誤的是?()*[單選題]*A.RDD具有血統(tǒng)機制(Lineage)B.RDD默認存儲在磁盤C.RDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集D.RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象(正確答案)7.關(guān)于SparkSQL&Hive區(qū)別與聯(lián)系,下列說法正確的是?()*[單選題]*A.SparkSQL依賴Hive的元數(shù)據(jù)B.SparkSQL的執(zhí)行引擎為Sparkcore,Hive默認執(zhí)行引擎為MapReduceC.SparkSQL不可以使用Hive的自定義函數(shù)(正確答案)D.SparkSQL兼容絕大部分Hive的語法和函數(shù)(正確答案)(正確答案)8.在FusionInsight集群中,Spark主要與以下哪些組件進行交互?()*[單選題]*A.HDFSB.YARN(正確答案)C.HiveD.ZooKeeper(正確答案)(正確答案)9.關(guān)于Hive在FusionInsightHD中的架構(gòu)描述錯誤的是?()*[單選題]*A.只要有一個HiveServer不可用,整個Hive集群便不可用B.MotaStore用于提供元數(shù)據(jù)服務(wù),依賴于DBServiceC.在同一時間點,HiveServer只要一個處于Active狀態(tài),另一個則處于Standby狀態(tài)D.HiveServer負責接收客戶端請求.解析.執(zhí)行HQL命令并返回查詢結(jié)果(正確答案)10.通常情況下,Hive以文本文件存儲的表會以回車作為其行分隔符,在華為FusionInsightHive中,可以指定表數(shù)據(jù)的輸入和輸出格式處理。()*[單選題]*A.TRUEB.FALSE(正確答案)11.以下關(guān)于HBase中HMaster的功能描述哪些是正確的?()*[單選題]*A.Region負載均衡,Region分裂以及分裂后的Region分配B.負責建表/修改表/刪除表(正確答案)C.負責RegionServer的負載均衡(正確答案)D.RegionServer失效后的Region遷移(正確答案)(正確答案)12.Nimbus在Streaming架構(gòu)中的功能包括?()*[單選題]*A.監(jiān)控任務(wù)執(zhí)行狀態(tài)B.任務(wù)調(diào)度(正確答案)C.啟動/關(guān)閉工作進程D.資源分配(正確答案)(正確答案)13.Topology在任務(wù)完成后會自動結(jié)束運行。()*[單選題]*A.TRUEB.FALSE(正確答案)14.下面關(guān)于flink窗口的描述錯誤的是()*[單選題]*A.滾動窗口在時間上是重疊的B.滾動窗口在時間上是不重疊的C.滑動動窗口之間時間點不存在重疊(正確答案)D.滑動窗口之間時間點存在重疊(正確答案)15.在FusionInsightManager界面中,對Loader的操作不包括下列哪個選項?()*[單選題]*A.切換Loader主備節(jié)點B.啟動Loader實例C.配置Loader參數(shù)D.查看Loader服務(wù)狀態(tài)(正確答案)16.創(chuàng)建Loader作業(yè)中,可以在以下哪個步驟中設(shè)置過濾器類型?()*[單選題]*A.輸入設(shè)置B.轉(zhuǎn)換C.基本信息D.輸出(正確答案)17.以下哪些數(shù)據(jù)源可以通過Loader實現(xiàn)與FusionInghtHD的數(shù)據(jù)交換?()*[單選題]*A.NoSQLB.FTPServer(正確答案)C.SFTPServer(正確答案)D.MySQL(正確答案)(正確答案)18.Kafka日志的清理方式有兩種:delete和compact。默認值是delete。()*[單選題]*A.TRUEB.FALSE(正確答案)19.kafka-clustermirroring工具可以實現(xiàn)以下那些功能?()*[單選題]*A.kafka集群數(shù)據(jù)同步方案B.kafka單集群內(nèi)數(shù)據(jù)備份C.kafka單集群內(nèi)數(shù)據(jù)恢復D.以全部不對(正確答案)20.fusioninsightHD產(chǎn)品中,一個典型的kafka集群包含若干個producer若干個consummer和一個zookeeper集群?()*[單選題]*A.trueB.false(正確答案)21.ZKFC進程部署在hdfs中的以下那個節(jié)點上?()*[單選題]*A.activenamenodeB.standbynamenode(正確答案)C.datanodeD.以上全部不對(正確答案)22.以下關(guān)于KafkaPartition偏移量的描述不正確的是?()*[單選題]*A.每條消息在文件中的位置稱為offset(偏移量)B.消費者通過(offset.partition.topic)跟蹤記錄C.唯一標記一條消息D.Offset是一個String型字符串(正確答案)23.Channel的作用類似隊列,用于臨時緩存進來的數(shù)據(jù),當Sink成功地將數(shù)據(jù)發(fā)送到下一跳的Channel或最終目的,數(shù)據(jù)會從Channel移除()*[單選題]*A.TRUEB.FALSE(正確答案)24.Zookeeper中的數(shù)據(jù)節(jié)點znode分為哪幾種類型?()*[單選題]*A.semi-persistentB.ephemeralC.temporaryD.persistent(正確答案)(正確答案)25.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內(nèi)容?()*[單選題]*A.目錄B.文件(正確答案)C.塊(正確答案)D.以上全不正確(正確答案)26.HDFS存儲數(shù)據(jù)時,關(guān)鍵數(shù)據(jù)根據(jù)實際業(yè)務(wù)需要保存在具有高度可靠性的節(jié)點中,通過修改DataNode的存儲策略,系統(tǒng)可以將數(shù)據(jù)強制保存在指定的節(jié)點組中。()*[單選題]*A.TRUEB.FALSE(正確答案)27.RDD有Transformation和Action算子,下列屬于Action算子的是?()*[單選題]*A.mapB.saveAsTextFileC.FilterD.reduceByKey(正確答案)28.SparkonYarn-client適合用于生產(chǎn)環(huán)境是因為可以更快的看到APP的輸出。()*[單選題]*A.TRUEB.FALSE(正確答案)29.以下關(guān)于HiveSQL基本操作描述正確的是?()*[單選題]*A.創(chuàng)建外部表必須要指定location信息B.創(chuàng)建外部表使用external關(guān)鍵字,創(chuàng)建普通表需要指定internal關(guān)鍵字C.加載數(shù)據(jù)到Hive時源數(shù)據(jù)必須是HDFS的一個路徑D.創(chuàng)建表時可以指定列分割符(正確答案)30.在Streaming中,消息可靠性級別中精確一次是通過ACK機制來實現(xiàn)的。()*[單選題]*A.TRUEB.FALSE(正確答案)31.Flume適用于以下哪些場景的數(shù)據(jù)收集?()*[單選題]*A.Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B.本地文件數(shù)據(jù)采集(正確答案)C.應(yīng)用系統(tǒng)產(chǎn)生的日志采集(正確答案)D.大量數(shù)據(jù)的實時數(shù)據(jù)采集(正確答案)32.在Zookeeper和Yarn的協(xié)同工作中,當ActiveResourceManager產(chǎn)生故障時,StandbyResourceManager會從以下哪些目錄中獲取Application相關(guān)信息?()*[單選題]*A.metastoreB.StatestoreC.StoreageD.Warehouse(正確答案)33.ZooKeeper所有節(jié)點都可以處理讀請求。()*[單選題]*A.TRUEB.FALSE(正確答案)34.HDFS的副本放置策略中,同一機架不同的服務(wù)器之間的距離是()*[單選題]*A.3B.2C.1D.4(正確答案)35.下列哪些措施是為了保障數(shù)據(jù)的完整性()*[單選題]*A.元數(shù)據(jù)可靠性保證B.重建失效數(shù)據(jù)盤的副本數(shù)據(jù)(正確答案)C.安全模式(正確答案)D.集群數(shù)據(jù)均衡(正確答案)(正確答案)36.Zookeeper的Scheme認證方式不包括以下哪項?()*[單選題]*A.digestB.saslC.authD.world(正確答案)37.MapReduce過程中,以下屬于Shuffle機制的是?()*[單選題]*A.CopyB.PartitionC.CombineD.Sort/Merge(正確答案)(正確答案)38.FusionInsightManager可以對哪些項目進行健康檢查?()*[單選題]*A.角色B.主機(正確答案)C.服務(wù)(正確答案)D.實例(正確答案)(正確答案)39.FusionInsightManager與外部管理平臺對接時,支持哪些接口?()*[單選題]*A.VPNB.SyslogC.FTP(正確答案)D.SNMP(正確答案)(正確答案)40.下列選項中適合MapReduce的場景有?()*[單選題]*A.實時交互計算B.迭代計算C.流式計算D.離線計算(正確答案)41.以下關(guān)于FusionInsight中CarbonData說法正確的有?()*[單選題]*A.使用Carbon的目的是對大數(shù)據(jù)即席查詢提供超快速響應(yīng)。B.Carbon使用輕量級壓縮和重量級壓縮的組合壓縮算法壓縮數(shù)據(jù),可以減少60%-80%數(shù)據(jù)存儲空間,大大節(jié)省硬件存儲成本。(正確答案)C.Carbon是一種新型的ApacheHadoop本地文件格式,使用先進的列式存儲.索引.壓縮和編碼技術(shù),以提高計算效率,有助于加速超過PB數(shù)量級的數(shù)據(jù)查詢,可用于更換的交互查詢。(正確答案)D.Carbon也是一種將數(shù)據(jù)源與Spark集成的高性能分析引擎。(正確答案)(正確答案)42.HDFS聯(lián)邦機制下,各NameNode間元數(shù)據(jù)是不共享的。()*[單選題]*A.TRUEB.FALSE(正確答案)43.ApplicationMaster采用輪詢的方式通過RPC協(xié)議向ResourceManager申請和領(lǐng)取資源。()*[單選題]*A.TRUEB.FALSE(正確答案)44.在YARN的任務(wù)調(diào)度中,一旦ApplicationMaster申請到資源后,使與對應(yīng)的ResourceManager通信,要求它啟動任務(wù)()*[單選題]*A.TRUEB.FALSE(正確答案)45.如圖所示,下列哪些選項屬于寬依賴()

*[單選題]*A.groupby:A->BB.map:C->DC.union:D&E->FD.join:B&F->G(正確答案)(正確答案)46.HFS的出現(xiàn)解決了需要在HDFS中存儲大量的小文件(10MB以下)。同時也要存儲一些大文件(10MB以上)的混合的場景()*[單選題]*A.TRUEB.FALSE(正確答案)47.下列哪個命令是從HDFS下載目錄/文件到本地的?()*[單選題]*A.dfs-putB.dfs-catC.dfs-getD.dfs-mkdir(正確答案)48.以下選項中,屬于HDFS架構(gòu)關(guān)鍵特性的是?()*[單選題]*A.HA高可靠性B.健壯機制(正確答案)C.元數(shù)據(jù)持久化機制(正確答案)D.多方式訪問機制(正確答案)(正確答案)49.HBase的主HMaster是如何選舉的?()*[單選題]*A.由RegionServer進行裁決B.HMaster為雙主模式,不需要進行裁決C.通過ZooKeeper進行裁決D.隨機選舉(正確答案)50.關(guān)于Hive與Hadoop其他組件的關(guān)系。以下描述錯誤的是?()*[單選題]*A.Hive最終將數(shù)據(jù)存儲在HDFS中B.Hive是Hadoop平臺的數(shù)據(jù)倉庫工具C.HQL可以通過MapReduce執(zhí)行任務(wù)D.Hive對HBase有強依賴(正確答案)51.Hive不支持超時重試機制。()*[單選題]*A.TRUEB.FALSE(正確答案)52.FusionInsight中,HiveServer將用戶提交的HQL語句進行編譯,解析成對應(yīng)的Yarn任務(wù).Spark任務(wù)或者HDFS操作,從而完成數(shù)據(jù)轉(zhuǎn)換,分析。()*[單選題]*A.trueB.False(正確答案)53.HBase的Region是由哪個服務(wù)進程來管理的?()*[單選題]*A.HRegionServerB.ZooKeeperC.HMasterD.DataNode(正確答案)54.Streaming的處理節(jié)點Bolt中,可以完成以下哪些操作?()*[單選題]*A.連接運算B.過濾(Filter)(正確答案)C.連接數(shù)據(jù)庫(正確答案)D.業(yè)務(wù)處理(正確答案)(正確答案)55.Flume傳輸?shù)目煽啃允侵窮lume在傳輸數(shù)據(jù)過程中,當下一跳的Flume節(jié)點故障或者數(shù)據(jù)接收異常時,可以自動切換到另外一路上繼續(xù)傳輸?()*[單選題]*A.TrueB.False(正確答案)56.FusionInsightHD集群中包含了多種服務(wù),每種服務(wù)又由若干角色組成,下面哪些是服務(wù)的角色?()*[單選題]*A.HDFSB.NameNodeC.DataNode(正確答案)D.HBase(正確答案)57.FusionInsightHD系統(tǒng)中使用Streaming客戶端Shell命令提交了拓撲之后,使用StormUI查看發(fā)現(xiàn)該拓撲長時間沒有處理數(shù)據(jù),可能原因有?()*[單選題]*A.查看客戶端異常堆棧,判斷是否客戶端使用問題B.查看主Nimbus的運行日志,判斷是否Nimbus服務(wù)端異常(正確答案)C.查看Supervisor運行日志,判斷是否Supervisor異常(正確答案)D.查看Worker運行日志(正確答案)(正確答案)58.假設(shè)HDFS在寫入數(shù)據(jù)是只存2份,那么在寫入過程中,HDFSClient先將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入DataNode2。()*[單選題]*A.TrueB.False(正確答案)59.容力量調(diào)度器在盡心資源分配,現(xiàn)有同級的2個隊列Q1和Q2,他們的容量均為30,期中Q1已使用8.Q2已使用14,則會優(yōu)先將資源分配Q1。()*[單選題]*A.TrueB.False(正確答案)60.HBase中包含的一些典型的Filter有哪些?()*[單選題]*A.SingleColumnValueFilterB.FilterList(正確答案)C.RowFilter(正確答案)D.KeyOnlyFilter(正確答案)(正確答案)61.Flink流式處理的數(shù)據(jù)源類型包括?()*[單選題]*A.CollectionsB.JDBC(正確答案)C.Socketstreams(正確答案)D.Files(正確答案)(正確答案)62.server.channels.ch1.transactionCapacity表示事務(wù)大小,即當前channel支持事務(wù)處理的事件個數(shù),可和source的batchsize設(shè)置為同樣大小,但不能小于batchsize。()*[單選題]*A.TrueB.False(正確答案)63.Flume架構(gòu)中,一個sink可以連接多個channel。()*[單選題]*A.TrueB.False(正確答案)64.以下關(guān)于Flink關(guān)鍵特性描述不正確的是?()[單選題]*A.SparkStreaming與Flink相比,時延更低*(正確答案)B.Flink流式處理引擎能夠同時提供支持流處理和批處理應(yīng)用的功能C.與FusionInghtHD中的Streaming相比,F(xiàn)link具有更高的吞吐量D.checkpoint實現(xiàn)了Flink的容錯65.FusionInsight是華為企業(yè)級大數(shù)據(jù)存儲,查詢,分析的統(tǒng)一平臺,能夠幫助企業(yè)快速構(gòu)建海量數(shù)據(jù)信息處理系統(tǒng),通過對海量信息數(shù)據(jù)實時與非實時的分析挖掘,發(fā)現(xiàn)全新價值點和企業(yè)商機。()*[單選題]*A.TrueB.False(正確答案)66.KafkaClusterMirroring工具可以實現(xiàn)以下哪項功能?()*[單選題]*A.Kafka跨集群數(shù)據(jù)同步方式B.Kafka單集群內(nèi)數(shù)據(jù)備份C.Kafka單集群內(nèi)數(shù)據(jù)恢復D.以上全不正確(正確答案)67.FusionInsightTool是為技術(shù)支持工程師和維護工程師提供的一套健康檢查工具,能夠檢查集群相關(guān)節(jié)點,服務(wù)的健康狀態(tài),中潛在的問題。并生成健康檢查報告。方便技術(shù)支持工程和維護工程師快速了解系統(tǒng)的健康狀況。()*[單選題]*A.TRUEB.FALSE(正確答案)68.FusionInsight產(chǎn)品中,關(guān)于Kafka說法不正確的是?()*[單選題]*A.Kafka強依賴于ZooKeeperB.Kafka的服務(wù)端可以產(chǎn)生消息C.Kafka部署的實例個數(shù)不得小于2D.Consumer作為kafka的客戶端角色專門進行消息的消費。(正確答案)69.為了提高Kafka的容錯性,Kafka支持Partition的復制策略,以下關(guān)于LeaderPartition和FollowerPartition的描述錯誤的是()*[單選題]*A.Kafka針對Partition的復制需要選出一個Leader。由該Leader負責Partition的讀寫操作。其他的副本節(jié)點只是負責數(shù)據(jù)同步B.由于LeaderServer承載了全部的請求壓力。因此從集群的整體考慮,Kafka會將Leader均衡的分散在每個實例上,來確保數(shù)據(jù)均衡C.一個Kafka集群各個節(jié)點間不可能互為Leader和FlowerD.如果Leader失效。那么將會有其他follower來接管(成為新的Leader)(正確答案)70.Kafka是一個高吞吐.分布式.基于發(fā)布訂閱的消息系統(tǒng),利用Kafka技術(shù)可在廉價PCServer上搭建起大規(guī)模消息系統(tǒng)。()*[單選題]*A.TRUEB.FALSE(正確答案)71.flink是一個批處理和流處理結(jié)合的統(tǒng)一計算框架,其核心是一個數(shù)據(jù)分發(fā)以及并行計算的流數(shù)據(jù)處理引擎()*[單選題]*A.TrueB.False(正確答案)72.HBase集群定時執(zhí)行Compaction的目的是什么?()*[單選題]*A.減少同一個Region同一個ColumnFamily下的文件數(shù)目B.減少同一個Region的文件數(shù)目C.提升數(shù)據(jù)讀取性能(正確答案)D.提升數(shù)據(jù)寫入能力(正確答案)(正確答案)73.下列關(guān)于Flinkbarrier描述錯誤的是?()*[單選題]*A.一個barrier將本周期快照的數(shù)據(jù)與下一個周期快照的數(shù)據(jù)分隔開來B.barrier是Flink快照的核心C.在插入barrier的時候,會暫時阻斷數(shù)據(jù)流D.barrier周期性插入到數(shù)據(jù)流中,并作為數(shù)據(jù)流的一部分隨之流動(正確答案)74.Flume進程級聯(lián)時,以下哪些Sink類型用于接收上一跳Flume發(fā)送過來的數(shù)據(jù)?()*[單選題]*A.NullSinkB.thriftsinkC.HivesinkD.avrosink(正確答案)(正確答案)75.Flink可以基于以下哪些窗口進行統(tǒng)計?()*[單選題]*A.時間窗口B.滑動窗口(正確答案)C.會話窗口(正確答案)D.countWindow(正確答案)(正確答案)76.關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是?()*[單選題]*A.Supervisor是在Topology中接受數(shù)據(jù)然后執(zhí)行處理的組件B.Supervisor負責接受Nimbus分配的任務(wù),啟動和停止屬于自己管理的Worker進程C.Supervisor負責資源分配和任務(wù)調(diào)度D.Supervisor是運行具體處理邏輯的過程(正確答案)77.Hadoop中,如果yarn.scheduler.capacity.root.QueueA.minim.m-user-limit-percent設(shè)置為50,下面說法錯誤的是?()*[單選題]*A.一個用戶提交任務(wù),可以使用QueueA的100%的資源。B.如果QueueA中已經(jīng)有2個用戶的任務(wù)運行,這時第3個用戶提交的任務(wù)需要等待釋放資源。C.QueueA中必須保障每個用戶至少得到50%的資源。D.QueueA中的每個用戶最多只能獲得50%的資源。(正確答案)78.關(guān)于Flume,下列說法錯誤的是?()*[單選題]*A.Flume級聯(lián)節(jié)點之間的數(shù)據(jù)傳輸支持加密B.Flume支持多級聯(lián)和多路復用C.Source到Channel到Sink等進程內(nèi)部有加密的必要D.Flume級聯(lián)節(jié)點之間的數(shù)據(jù)傳輸不支持壓縮(正確答案)(正確答案)79.以下關(guān)于Kafkalogs中segmentfile的說法正確的是?()*[單選題]*A.通過索引信息可以快速定位messageB.稀疏存儲,即將原來的完整數(shù)據(jù),只間隔的選擇多條進行存儲(正確答案)C.是index元數(shù)據(jù)全部映射到memory,可以避免segmentfile的index數(shù)據(jù)IO磁盤操作D.索引文件稀疏存儲,可以大幅度降低index文件元數(shù)據(jù)占用空間大小(正確答案)(正確答案)80.Streaming主要通過zookeeper提供以下的哪項實現(xiàn)事件偵聽?()*[單選題]*A.分布式鎖機制B.WatcherC.CheckpointD.ACK(正確答案)81.Zookeeper在分布式應(yīng)用中的主要作用不包括一下哪些選項?()*[單選題]*A.選舉Master節(jié)點B.保證各節(jié)點上數(shù)據(jù)的一致性C.分配集群資源D.存儲及群中服務(wù)器信息(正確答案)82.Hadoop集群規(guī)模很大時,數(shù)據(jù)的分布情況會非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴容,數(shù)據(jù)是否需要做負載均衡等,fusionInsight資源分布監(jiān)控說法正確的是?()*[單選題]*A.可以幫助用戶快速聚焦在最關(guān)鍵的資源消耗上。B.通過每個服務(wù)主業(yè)的資源分布查看界面,看到關(guān)鍵的資源分布情況。(正確答案)C.通過Dashboard界面,可以查看到主機資源分不清哪個礦,例如內(nèi)存占用率在50-75%的主機列表,并提供鏈接跳轉(zhuǎn)。(正確答案)D.幫助用戶迅速找到資源消耗最高的點,采取適當?shù)拇胧?正確答案)(正確答案)83.以下關(guān)于華為大數(shù)據(jù)解決方案說法正確的是()*[單選題]*A.GaussDB是一款開源數(shù)據(jù)庫產(chǎn)品B.Farmer是數(shù)據(jù)服務(wù)框架(正確答案)C.FusionInsightManager是一個分布式系統(tǒng)管理框架,管理員可以通過多接入點操控分布式集群(正確答案)D.FusionInsightHD是基于開源大數(shù)據(jù)軟件Hadoop的增強版本(正確答案)(正確答案)84.下圖展示了文件A,B,C的存放位置。其中文件A和D具有關(guān)聯(lián)性,它們的存儲位置符合Colocation同分布策略()*[單選題]*A.TRUEB.FALSE(正確答案)85.HDFS中Namenode的主備仲裁,是由哪個組件控制的()*[單選題]*A.HDFSClientB.NodeManagerC.ResourceManagerD.ZooKeeperFailoverController(正確答案)86.SparkStreaming計算基于DStream將流式計算分解成一系列短小的批處理作業(yè)()*[單選題]*A.TRUEB.FALSE(正確答案)87.導入數(shù)據(jù)到Hive表時,不會檢查數(shù)據(jù)合法性,只會在讀取數(shù)據(jù)時候檢查。()*[單選題]*A.TRUEB.FALSE(正確答案)88.Topology的處理邏輯都在Bolt中()*[單選題]*A.TRUEB.FALSE(正確答案)89.安裝FusionInsightHD的Streaming組件是,Nimbus角色要求安裝幾個節(jié)點?()*[單選題]*A.4B.3C.2D.1(正確答案)90.Flume的tertises配置文件中可以配置多個channel來傳輸數(shù)據(jù)()*[單選題]*A.TrueB.False(正確答案)91.驅(qū)動型source是flume周期性主動去獲取數(shù)據(jù)()*[單選題]*A.TrueB.False(正確答案)92.FusionInsightHD數(shù)據(jù)高可靠性體現(xiàn)在以下哪些方面?()*[單選題]*A.硬盤熱插拔B.關(guān)鍵數(shù)據(jù)掉電保護(正確答案)C.跨數(shù)據(jù)中心容災(zāi)(正確答案)D.第三方備份系統(tǒng)集成(正確答案)(正確答案)93.FusionInsightHD系統(tǒng)審計日志不可以記錄下面哪些操作?()*[單選題]*A.手動清除告警B.啟停服務(wù)實例C.查詢歷史監(jiān)控D.刪除服務(wù)實例(正確答案)94.下圖展示了HDFS的標簽存儲策略,觀察下圖,HBase的數(shù)據(jù)會被存儲到哪些數(shù)據(jù)節(jié)點上()?*[單選題]*A.DataNodeAB.DataNodeB(正確答案)C.DataNodeED.DataNodeF(正確答案)95.HBase的數(shù)據(jù)文件HFile中一個KeyValue格式包含Key,Value,TimeStamp,KeyType等內(nèi)容()*[單選題]*A.TRUEB.FALSE(正確答案)96.在有N個節(jié)點FusionInsightHD集群中部署HBase時,推薦部署()個HMaster進程,()個RegionServer進程()?*[單選題]*A.3,NB.N,NC.2,ND.2,2(正確答案)97.Flink的數(shù)據(jù)轉(zhuǎn)換操作在以下哪些環(huán)節(jié)中完成()?*[單選題]*A.channelB.TransformationC.sinkD.source(正確答案)98.Kafka消息傳輸保障通常有以下哪幾種()?*[單選題]*A.僅有一次(ExactlyOnce)B.最少一次(AtLeastOnce)(正確答案)C.最多三次(AtMostThreeTimes)D.最多一次(AtMostOnce)(正確答案)(正確答案)99.KafkaLogssegment文件命名規(guī)則是partion全局的第一個segment從0開始,后續(xù)每個segment文件名為上一個全局partion事務(wù)最大offset(偏移message數(shù))。()*[單選題]*A.TRUEB.FALSE(正確答案)100.HBase的主要特點有哪些?()*[單選題]*A.面向列B.高性能(正確答案)C.可伸縮(正確答案)D.高可靠性(正確答案)(正確答案)101.YARN中,“從”節(jié)點負責以下哪些工作?()*[單選題]*A.集群中所有資源的統(tǒng)一管理和分配B.監(jiān)督container的生命周期管理C.監(jiān)控每個Container的資源使用(內(nèi)存、CPU等)情況(正確答案)D.管理日志和不同應(yīng)用程序用到的附屬服務(wù)(正確答案)102.Spark有哪些特點?()*[單選題]*A.快B.靈(正確答案)C.輕(正確答案)D.巧(正確答案)(正確答案)103.Hive中“Groupby”指的是通過一定的規(guī)則將每一個數(shù)據(jù)集劃分成若干個小的數(shù)據(jù)集,然后針對若干個小的數(shù)據(jù)集進行數(shù)據(jù)分組處理()*[單選題]*A.TrueB.False(正確答案)104.Flink適用于高并發(fā)處理數(shù)據(jù)、毫秒級時延的應(yīng)用()*[單選題]*A.TrueB.False(正確答案)105.與開源sqoop相比,loader具有哪些增強特性?()*[單選題]*A.高可靠性B.高性能(正確答案)C.安全性(正確答案)D.圖形化(正確答案)(正確答案)106.FusionInsightHDloader可以將HDFS數(shù)據(jù)導出到以下哪些目標端?()*[單選題]*A.orale數(shù)據(jù)庫B.SFTP服務(wù)器(正確答案)C.BD2數(shù)據(jù)庫(正確答案)D.FTP服務(wù)器(正確答案)(正確答案)107.FusionInsightHD的Loader在創(chuàng)建作業(yè)時,連接器有以下哪些作業(yè)?()*[單選題]*A.配置作業(yè)與內(nèi)部數(shù)據(jù)源連接方式B.配置作業(yè)與外部數(shù)據(jù)源連接方式(正確答案)C.確定有轉(zhuǎn)換(正確答案)D.提供優(yōu)化參數(shù),提高數(shù)據(jù)導入導出性能(正確答案)(正確答案)108.當zookeeper集群的節(jié)點數(shù)為5節(jié)點時,請問集群的容災(zāi)能力和多少節(jié)點是等價的?()*[單選題]*A.3B.4C.5D.以上全不正確(正確答案)109.FusionInsight家族包含下列哪些子產(chǎn)品?()*[單選題]*A.FusionInsightFarmerB.FusionInsightMiner(正確答案)C.FusionInsightHD(正確答案)D.GaussDB200(正確答案)(正確答案)110.FusionInsightManager用戶權(quán)限管理不支持哪個配置?()*[單選題]*A.給用戶配置角色B.給用戶組配置角色C.給角色配置權(quán)限D(zhuǎn).給用戶組配置權(quán)限(正確答案)111.Yarn調(diào)度器分配資源的順序,下面哪一個描述的正確?()*[單選題]*A.任意機器——>本地資源——>同機架B.任意機器——>同機架——>本地資源C.本地資源——>同機架——>任意機器D.同機架——>任意機器——>本地資源(正確答案)112.以下哪個不屬于Hadoop中MapReduce組件的特點?()*[單選題]*A.高容錯B.良好的擴展性C.實時計算D.易于編程(正確答案)113.Hbase的最小存儲單元是Region。()*[單選題]*A.TRUEB.FALSE(正確答案)114.Hbase的某張表的RowKey劃分Splitkey為9.E.a.z.請問表里面有幾個Region?()*[單選題]*A.6B.3C.5D.4(正確答案)115.根據(jù)數(shù)據(jù)流如何在兩個TransFormation之間傳輸數(shù)據(jù),數(shù)據(jù)流可以分為那些類型?()*[單選題]*A.一對一流B.distributing流C.一對多流(正確答案)D.redistributig流(正確答案)116.為了保障流應(yīng)用的快照存儲的可靠性,快照主要存儲在哪里?()*[單選題]*A.jobManager的內(nèi)存中B.可靠性高的單機數(shù)據(jù)庫中C.本地文件系統(tǒng)中D.hdfs中(正確答案)117.在fusionlnsight產(chǎn)品中,關(guān)于kafka的topic.以下描述不正確的是?()*[單選題]*A.topic的partition數(shù)量可以創(chuàng)建時配置B.每個topic只能被分成一個partition區(qū)C.每條發(fā)布到kafka的消息都有一個類別,這個類別被稱為topic.也可以理解為一個存儲消息的隊列D.每個partition在存儲層面對應(yīng)一個log文件,log文件中記錄了所有的消息數(shù)據(jù)(正確答案)118.Kafa集群在運行期間,直接依賴于下面哪些組件?()*[單選題]*A.sparkB.zookeeperC.hdfsD.hbase(正確答案)119.關(guān)于fusioninsightmanager界面hive日志收集的描述中,哪個不對?()*[單選題]*A.可指定實例進行日志收集,比如指定收集metaStore的日志B可指定節(jié)點ip進行日志收集,例如僅下載某個ip的日志C.可指定特定用戶進行日志收集,例如僅下載user用戶的日志D.可指定時間端進行日志收集,不如只收集2016-1-1到2016-1-10的日志(正確答案)120.fusioninsightmanager對于管理操作,下列錯誤的是?()*[單選題]*A.可對服務(wù)進行啟停重啟B.可以添加和卸載服務(wù)C.可設(shè)置不常用服務(wù)隱藏或顯示D.可查看服務(wù)的當前狀態(tài)(正確答案)121.為減少寫入磁盤的數(shù)據(jù)量,mapreduce支持對MOF(mapoutfile)進行壓縮后再寫入。()*[單選題]*A.TrueB.False(正確答案)122.ResourceManager采用高可用方案,當Activeresourcemanager發(fā)現(xiàn)故障時,只能通過內(nèi)置的zookeeper來啟動standby的resourcemanager,將其狀態(tài)切換為active。()*[單選題]*A.TrueB.False(正確答案)123.Hive是一種數(shù)據(jù)倉庫處理工具,使用類SQL的HiveQL語言實現(xiàn)數(shù)據(jù)查詢功能,所有Hive的數(shù)據(jù)都存儲在HDFS中。()*[單選題]*A.TrueB.False(正確答案)124.在WebHCat架構(gòu)中,用戶能夠通過安全的HTTPS協(xié)議執(zhí)行以下哪些操作?()*[單選題]*A.執(zhí)行HiveDDL操作。B.運行MapReduce任務(wù)C.運行HiveHQL任務(wù)D.以上全都正確(正確答案)125.Flink的兼容性體現(xiàn)在以下哪些方面?()*[單選題]*A.YARN能夠作為F1ink集群的資源調(diào)度管理器B.能夠與Hadoop原有的Mappers和Reducers混合使用(正確答案)C.能夠使用Hadoop的格式化輸入和輸出口(正確答案)D.能夠從本地獲取數(shù)據(jù)(正確答案)(正確答案)126.KafkaConsumer寫數(shù)據(jù)總體流程是,Consumer連接指定TopicPartition所在的LeaderBroker.用主動獲取方式從Kafka中獲取消息。()*[單選題]*A.trueB.false(正確答案)127.圖形化的健康巡檢工具FusionInsightTool由FusionCare和SysChecker兩部分組成。()*[單選題]*A.trueB.false(正確答案)128.FusionInsightManager界面上,當收到Kafka磁盤容量不足告警,且該告警的原因已經(jīng)排除硬硬件故障時,系統(tǒng)管理員需要考慮擴容解決此問題。()*[單選題]*A.trueB.false(正確答案)129.如圖所示,F(xiàn)link流式理接口DataStreamAPI支持的語言包括?()*[單選題]*A.JavaB.C語言C.Scala(正確答案)D.Python(正確答案)130.以下關(guān)于HBase的文件存儲模塊(HBaseFileStream,簡稱HFS)描述正確的有?()*[單選題]*A.應(yīng)用在FusionInsightHD的上層應(yīng)用B.HFS封裝了HBase與HDFS的接口(正確答案)C.為上層應(yīng)用提供文件的存儲.讀取.刪除等功能(正確答案)D.HFS是HBase的獨立模塊(正確答案)(正確答案)131.若在消息處理過程中允許部分信息丟失,關(guān)閉消息可靠性處理機制的方式有以下哪些?()*[單選題]*A.將參數(shù)Config.Topology_ACKKRS設(shè)置為0B.將參數(shù)Config.Topology_ACKKRS設(shè)置為FalseC.Spout發(fā)送消息時,使用不指定消息messageID的接口進行發(fā)送(正確答案)D.Bolt發(fā)送消息時使用Unanchor方式發(fā)送(正確答案)(正確答案)132.在Flink技術(shù)架構(gòu)中,以下哪項是流處理和批處理的計算引擎?()*[單選題]*A.StandaloneB.RuntimeC.FlinkCoreD.DataSteam(正確答案)133.下圖為Flume數(shù)據(jù)傳輸架構(gòu),圖中“?”號處的組件是?()*[單選題]*A.InterceptorB.ChannelProcessorC.ChannelSelectorD.以上全不正確(正確答案)134.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?()*[單選題]*A.MemoryChannelB.JDBCChannelC.FileChannel(正確答案)D.HDFSChannel(正確答案)135.華為FusionInsightHD是國內(nèi)首家符合國家金融等級保護的大數(shù)據(jù)平臺,其安全性現(xiàn)在以下哪些方面?()*[單選題]*A.系統(tǒng)安全B.權(quán)限認證C.數(shù)據(jù)安全D.以上全都正確(正確答案)136.在華為大數(shù)據(jù)解決方案中,hadoop底層包含以下那些組件?()*[單選題]*A.finkB.hive(正確答案)C.minerD.spark(正確答案)(正確答案)137.spark的核心模塊是?()*[單選題]*A.sparkstreamingB.sparkcoreC.mapreduceD.sparksql(正確答案)138.關(guān)于hbase存儲模型的描述正確的是?()*[單選題]*A.即使是key值相同,qualifier也相同的多個keyvalue.也可能有多個,此時使用時間戳來區(qū)分B.同一個key值可以關(guān)聯(lián)多個value(正確答案)C.keyvalue中期有時間戳,類型等關(guān)鍵信息(正確答案)D.每一個keyvalue都有一個qualifier標識(正確答案)(正確答案)139.hbase的底層數(shù)據(jù)以()的形式存在的?()*[單選題]*A.keyvalueB.列存儲C.行存儲D.實時存儲(正確答案)140.二級索引為hbase提供了按照某些列的值進行索引的能力,二級索引先查索引表,再定位到數(shù)據(jù)表中的位置,不用全表掃描()*[單選題]*A.trueB.false(正確答案)141.colocation(同分布)文件級的同分布實現(xiàn)文件的快速訪問,避免了因數(shù)據(jù)遷移帶來的大量網(wǎng)絡(luò)開銷()*[單選題]*A.trueB.false(正確答案)142.fusioninsightHD集群包含多種服務(wù),每種服務(wù)又有若干個角色組成,下面那些是角色?()*[單選題]*A.namenodeB.hbaseC.datanode(正確答案)(正確答案)143.fusininsightHD平臺中,那些組件支持對列表加密?()*[單選題]*A.HDFSB.FlinkC.hbaseD.hive(正確答案)(正確答案)144.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次允許task都是從3個有副本的機器上傳輸需要處理的文件.()*[單選題]*A.TrueB.False(正確答案)145.YARN容量調(diào)度器的主要特點有哪些?()*[單選題]*A.容量保證B.動態(tài)更新配置文件(正確答案)C.靈活性(正確答案)D.多重租賃(正確答案)(正確答案)146.KafkaClusterMirroring工具可以實現(xiàn)以下哪些功能?()[單選]*[單選題]*A.Kafka跨集群數(shù)據(jù)同步方案B.Kafka單集群內(nèi)數(shù)據(jù)備份C.Kafka但集群內(nèi)數(shù)據(jù)恢復D.以上全不正確(正確答案)147.硬件故障被認為是常態(tài),為了解決這個問題,HDFS設(shè)計了副本機制。默認情況下,一份文件,HDFS會存()份?*[單選題]*A.3B.5C.2D.4(正確答案)148.現(xiàn)有3個機架,有一個文件需要存3份,其中副本1和副本2存放在與client相同的機架且不同的服務(wù)器上。根據(jù)HDFS的副本放置策略一定要存放在其他機架。()*[單選題]*A.TRUEB.FALSE(正確答案)149.Flume架構(gòu)中,一個Source可以連接多個Channel。()*[單選題]*A.TRUEB.FALSE(正確答案)150.FusionInsightHD的HBase中保存了一張用戶信息表msg_table,RowKey為用戶id,其中一類為用戶昵稱,現(xiàn)在按先后順序往這列寫keyValue:001:Li,001:Mary,001:Lily,請問scan‘msg_table’,(VERSIONS=>2)會返回哪幾條數(shù)據(jù)?()*[單選題]*A.1:LiB.1:LilyC.001:Li,001:Mary,001:LilyD.001:Mary,001:Lily(正確答案)151.Kafka中partitionreplication之間同步數(shù)據(jù),從partition的leader復制數(shù)據(jù)到follower需要線程(replicationFetcherThread),F(xiàn)ollower(一個follower相當于consumer)主動從leader批量拉取消息的,這極大提高了吞吐量。()*[單選題]*A.TrueB.False(正確答案)152.以下哪些選項屬于FusionInsight數(shù)據(jù)安全性?()[多選]*[單選題]*A.操作系統(tǒng)安全加固B.組件數(shù)據(jù)加密C.數(shù)據(jù)完整性校驗(正確答案)D.用戶權(quán)限認證管理(正確答案)153.NodeManager的內(nèi)存和CPU的數(shù)量,是通過下列哪些選項進行配置?()*[單選題]*A.Yarn.scheduler.capacity.root.QueueA.maximum-capacityB.Yarn.nodemanager.resource.cpu-vcoreC.Yarn.nodemanager.vmem-pmom-ratio(正確答案)D.Yarn.modemanager.resource.memory-mb(正確答案)(正確答案)154.下列選項中,哪些是MapReduce一定會有的過程?()*[單選題]*A.CombineB.MapC.Reduce(正確答案)D.Partition(正確答案)(正確答案)155.下列選項中,哪些是Spark的重要角色()*[單選題]*A.NodemanagerB.ResourceManager(正確答案)C.DataNodeD.Driver(正確答案)(正確答案)156.以下屬于HiveSQL中DDL(數(shù)據(jù)定義語言)的是?()*[單選題]*A.修改表B.刪除表(正確答案)C.數(shù)據(jù)導入D.建表(正確答案)(正確答案)157.關(guān)于HIVE的描述不正確的是?()*[單選題]*A.Hive最佳使用場景是大數(shù)據(jù)集的批處理作業(yè)B.Hive可以實現(xiàn)在大規(guī)模數(shù)據(jù)集上實現(xiàn)低延遲快速的查詢、C.ive構(gòu)建在基于靜態(tài)批量處理的Hadoop之上,Hadoop通常有較高的延遲并且在作業(yè)提交和調(diào)度的時候需要大量的開銷D.Hive查詢操作過程嚴格遵循HadoopMapReduce的作用執(zhí)行模型,Hive將用戶的HiveQL語句通過解釋器轉(zhuǎn)換為MapReduceHadoop集群上(正確答案)158.在Flink中,checkpoint機制能夠保證應(yīng)用在運行過程中出現(xiàn)失效時,從某一個檢查點恢復,在此過程中,流快照是根據(jù)數(shù)據(jù)流入建立的()*[單選題]*A.TRUEB.FALSE(正確答案)159.Hive中的“Groupby”指的是通過一定規(guī)則將一個數(shù)據(jù)集劃分成若干個小的數(shù)據(jù)集,然后針對若干個小的數(shù)據(jù)集進行數(shù)據(jù)分組處理。()*[單選題]*A.TrueB.False(正確答案)160.Hive中~UNIONALL~操作符用于合并兩個或多個select語句的結(jié)果集,結(jié)果集中,不允許有重復的值。()*[單選題]*A.TrueB.False(正確答案)161.StructuredStreaming在OutPut階段可以定義不同的數(shù)據(jù)寫入方式,包括以下哪些方式?()*[單選題]*A.GeneralModeB.AppendMode、C.ompleteMode(正確答案)D.UpdateMode(正確答案)(正確答案)162.Flume數(shù)據(jù)采集的過程中,下列選項中能對數(shù)據(jù)進行過濾和修飾的是?()*[單選題]*A.SinkB.ChannelC.ChannelselectorD.Interceptor(正確答案)163.以下關(guān)于FusionInsightCTBase的描述不正確的是?()*[單選題]*A.CTBase的讀寫數(shù)據(jù)接口,統(tǒng)一封裝了行定義的接口,自動進行冷字段的合并和解析,不需要在應(yīng)用程序中進行合并和解釋B.CTBase是基于HBase的聚簇表開發(fā)框架C.CTBase提供了一套WebUI進行元數(shù)據(jù)定義,提供了只管醫(yī)用的表設(shè)計工具,降低表設(shè)計的難度D.CTBase的javaAPI提供一套HBase連接池管理的接口,內(nèi)部進行連接共享,減少客戶端應(yīng)用開發(fā)難度。(正確答案)164.Kafka是一個高吞吐,分布式,基于發(fā)布訂閱的消息系統(tǒng),利用Kafka技術(shù)可在廉價PCServer上搭建起大規(guī)模消息系統(tǒng)。()*[單選題]*A.TRUEB.FALSE(正確答案)165.YARN中設(shè)置隊列QueueA的最大使用資源量,需要配置哪個參數(shù)?()*[單選題]*A.yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB.yarn.scheduler.capacity.root.QueueA.maximum-capacityC.yarn.scheduler.capacity.root.QueueA.minimum.user-limit-factorD.yarn.scheduler.capacity.root.QueueA.state(正確答案)166.如果某些Containers的物理內(nèi)存利用率超過了配置的內(nèi)存閾值,但所有Containers的總內(nèi)存利用率并沒有超過設(shè)置的NodeManager內(nèi)存閾值,那么內(nèi)存使用過多的containers仍可以繼續(xù)運行。()*[單選題]*A.TrueB.False(正確答案)167.下圖為Spark&MapReduce的性能對比數(shù)據(jù),可以得出結(jié)論,與MapReduce計算相比,Spark用的資源,獲得倍性能?()*[單選題]*A.1/10,4B.1/8,3C.1/8,4D.1/10,3(正確答案)168.FusionInsightHD系統(tǒng)中,HBase支持動態(tài)擴展列。()*[單選題]*A.TrueB.False(正確答案)169.以下哪些選項屬于Hive的數(shù)據(jù)存儲模型?()*[單選題]*A.桶B.數(shù)據(jù)庫C.分區(qū)D.表E.以上全都正確(正確答案)170.Hive中的這條命令”ALTERTABLEemployeelADDcolumns(columnlstring).”是什么含義?()*[單選題]*A.創(chuàng)建表B.刪除表C.添加列D.修改文件格式(正確答案)171.下列關(guān)于SparkStreaming和Streaming比較說法不正確的是?()*[單選題]*A.SparkStreaming是一個微批處理框架,事件需要積累到一定量時才進行處理B.Streaming的執(zhí)行邏輯是即時啟動,運行完后再回收C.SparkStreaming的吞吐量大約是Streaming的2-5倍D.SparkStreaming事件處理時延比Streaming更高(正確答案)172.以下關(guān)于Flink與其它組件交互說法正確的是?()*[單選題]*A.Flink任務(wù)的運行依賴Yarn來進行資源的調(diào)度管理B.Flink的checkpoint的實現(xiàn)依賴于Zookeeper(正確答案)C.Flink可以將接收的組件發(fā)送給Kafka(正確答案)D.Flink在HDFS文件系統(tǒng)中讀寫數(shù)據(jù)(正確答案)(正確答案)173.創(chuàng)建Loader作業(yè)時,可以在以下哪個步驟中設(shè)置Map數(shù)?()*[單選題]*A.輸出B.輸入設(shè)置C.轉(zhuǎn)換D.基本信息(正確答案)174.Channels支持事務(wù),提供較弱的順序保證,可以連接任何數(shù)量的Source和Sink。()*[單選題]*A.TrueB.False(正確答案)175.Kafka集群中,Kafka服務(wù)端的角色是?()*[單選題]*A.BrokerB.ConsumerC.ZooKeeperD.Producer(正確答案)176.KafkaProducer讀數(shù)據(jù)總體流程是,Producer連接任意存活的Broker,請求制定Topic、Partition的Leader元數(shù)據(jù)信息,然后直接與對應(yīng)的Broker直接連接,發(fā)布數(shù)據(jù)。()*[單選題]*A.TrueB.False(正確答案)177.下圖所示的Map階段,是描述哪個過程?()*[單選題]*A.PartitionB.SortC.Splill/MergeD.combine(正確答案)178.Spark根據(jù)RDD的依賴關(guān)系來劃分Stage,調(diào)度器從DAG圖末端出發(fā),逆向遍歷整個依賴關(guān)系鏈,遇到窄依賴就斷開,遇到寬依賴就將其加入當前Stage。()*[單選題]*A.TRUEB.FALSE(正確答案)179.關(guān)于DataSet,下列說法不正確的是?()*[單選題]*A.DataSet不需要反序列化就可執(zhí)行大部分操作B.DataSet是一個由特定域的對象組成的強類型集合C.DataSet與RDD高度類似,性能比RDD好D.DataSet執(zhí)行sort,filter,shuffle登操作需要進行反序列化(正確答案)180.Hbase中OpenScanner的過程,會創(chuàng)建兩種不同的Scanner來讀取HFile和MemStore的數(shù)據(jù),HFile對應(yīng)的Scanner為StoreFileScanner,MemStore對應(yīng)的Scanner為MemStoreScanner。()*[單選題]*A.TRUEB.FALSE(正確答案)181.執(zhí)行HBase讀取數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分數(shù)據(jù)?()*[單選題]*A.HMasterB.HFileC.HlogD.MemStore(正確答案)(正確答案)182.使用HBase客戶端批量寫入10條數(shù)據(jù),某個HRegionServer節(jié)點上包含該表的2個Region,分別為A和B,10條數(shù)據(jù)中有6條屬于A,4條屬于B,請問寫入這10條數(shù)據(jù)需要向該HRegionServer發(fā)送幾次RPC請求?()*[單選題]*A.10B.6C.2D.1(正確答案)183.Hive不適用于以下哪個場景()*[單選題]*A.非實時分析,例如日志分析,統(tǒng)計分析B.數(shù)據(jù)挖掘,例如用戶行為分析,興趣分析,區(qū)域展示C.數(shù)據(jù)匯總,例如每天,每用戶點擊數(shù),點擊排行D.實時在線數(shù)據(jù)分析(正確答案)184.關(guān)于Hive建表基本操作,描述正確的是()*[單選題]*A.一旦表建好,不可再修改表名B.一旦表建好,不可再增加新列C.創(chuàng)建外部表時需要制定external關(guān)鍵字D.一旦表創(chuàng)建好,不可再修改列名(正確答案)185.FusionInsightHD系統(tǒng)中Hive支持的存儲格式包括?()*[單選題]*A.TextFileB.SequenceFile(正確答案)C.RCFile(正確答案)D.HFile(正確答案)186.在Flink的運行流程中,負責申請資源的角色是?()*[單選題]*A.ResourceManagerB.JobManagerC.ClientD.TaskManager(正確答案)187.在FuisonInsightHD中,創(chuàng)建Loader作業(yè)的進行數(shù)據(jù)轉(zhuǎn)換的正確步驟是?()*[單選題]*A.輸入設(shè)置,轉(zhuǎn)換,輸出B.抽取,轉(zhuǎn)換,輸出C.加載,轉(zhuǎn)換,輸出D.加載,轉(zhuǎn)換,抽取(正確答案)188.Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是?()*[單選題]*A.SplitB.BlockC.EventD.Packet(正確答案)189.FusionnInsigetHD系統(tǒng)中,F(xiàn)lume數(shù)據(jù)流在節(jié)點內(nèi)不需要經(jīng)過哪個組件?()*[單選題]*A.SourceB.SinkC.TopicD.Channel(正確答案)190.傳統(tǒng)數(shù)據(jù)處理的數(shù)據(jù)規(guī)模的單位是?()*[單選題]*A.TBB.EBC.PBD.GB(正確答案)191.下列哪個命令是刪除文件的?()*[單選題]*A.dfs-clearB.dfs-lsC.dfs-rmD.dfs-del(正確答案)192.下圖為HDFS分級存儲的配置,如果Block的副本數(shù)為4,則以下說法錯誤的是?()*[單選題]*A.第1個Block副本將寫入RAM_DISK,其余副本寫入DISKB.如果是第1個副本之外的其他副本寫入失敗,則嘗試寫入“副本的備選存儲策略”指定的存儲策略C.如果第1個Block副本寫入RAM_DISK失敗,則嘗試寫入”備選存儲策略”的存儲類型D.4個Block都將寫入RAM_DISK(正確答案)193.Hadoop平臺中,要查看YARN服務(wù)中一個application的信息,通常需要使用什么命令?()*[單選題]*A.containerB.jarC.application-attemptD.Application(正確答案)194.Spark適用于以下哪些場景?()*[單選題]*A.交互式查詢B.實時流處理(正確答案)C.批處理(正確答案)D.圖計算(正確答案)(正確答案)195.下圖展示了StructuredStreaming的計算模型。通過觀察可以得出最終T3的計算結(jié)果是?()*[單選題]*A.Dog1,owl1B.Cat2,dog4,owl2C.Cat2,dog3,owl1D.Cat1,cat1,dog2,dog2,owl2(正確答案)196.SparkStreaming容錯機制是指RDD中任意的Partition出錯,都可以根據(jù)其父RDD重新計算生成,如果父RDD丟失,則需要去磁盤中查找原始數(shù)據(jù)。()*[單選題]*A.TRUEB.FALSE(正確答案)197.HBase元數(shù)據(jù)MetaRegion路由信息保存在哪里?()*[單選題]*A.ZookeeperB.Meta表C.HMasterD.Root表(正確答案)198.Hbase的BloomFiliter是用來顧慮數(shù)據(jù)的?()*[單選題]*A.TRUEB.FALSE(正確答案)199.執(zhí)行HBase讀數(shù)據(jù)業(yè)務(wù),需要讀取哪幾部分數(shù)據(jù)?()*[單選題]*A.HLogB.HMasterC.HFileD.MemStore(正確答案)(正確答案)200.FusionInsight中Hive包含2個角色,HiverServer和MetaStore?()*[單選題]*A.TRUEB.FALSE(正確答案)201.Colocation同分布文件級的同分不實現(xiàn)文件的快速訪問,避免了因數(shù)據(jù)遷移帶來的大量網(wǎng)絡(luò)開銷()*[單選題]*A.TRUEB.FALSE(正確答案)202.關(guān)于Hive與傳統(tǒng)數(shù)據(jù)倉庫的對比,以下描述錯誤的是?()*[單選題]*A.Hive元數(shù)據(jù)存儲獨立于數(shù)據(jù)存儲之外,從而解耦合元數(shù)據(jù)和數(shù)據(jù),靈活性高,而傳統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)應(yīng)用單一,靈活性低B.Hive基于HDFS存儲,理論上存儲量可無限擴展,而傳統(tǒng)數(shù)據(jù)倉庫存儲量會有上限C.由于Hive的數(shù)據(jù)存儲在HDFS中,所以可以保證數(shù)據(jù)的高容錯,高可靠D.由于Hive基于大數(shù)據(jù)平臺,所以查詢效率比傳統(tǒng)數(shù)據(jù)倉庫快(正確答案)203.YARN的基于標準調(diào)度,是對下列選項中的哪個進行標簽化?()*[單選題]*A.AppMasterB.ResourceManagerC.NodeManagerD.Container(正確答案)204.對于Hive中關(guān)于普通表和外部表描述不正確的是?()*[單選題]*A.默認創(chuàng)建普通表B.刪除外部表時,只刪除外部表數(shù)據(jù)而不刪除元數(shù)據(jù)C.外部實質(zhì)是將已存在于HDFS上的文件路徑跟表關(guān)聯(lián)起來D.刪除普通表時,元數(shù)據(jù)和數(shù)據(jù)同時被刪除(正確答案)205.在FusionInsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?()*[單選題]*A.在創(chuàng)建Kafka的Topic時,必須設(shè)置Partition個數(shù)B.在創(chuàng)建Kafka的Topic時,必須設(shè)置Partition副本個數(shù)C.設(shè)置多副本可以增強Kafka服務(wù)的容災(zāi)能力D.以上全都正確(正確答案)206.Zookeeper的增強性包括在審計日志中添加ephemeralnode被刪除的審計日志()*[單選題]*A.TRUEB.False(正確答案)207.下列選項中,關(guān)于Zookeeper可靠性含義說法正確的是?()*[單選題]*A.可靠性通過主備部署模式實現(xiàn)B.可靠性是指更新更新只能成功或者失敗,沒有中間狀態(tài)C.可靠性是指無論哪個server,對外展示的均是同一個視圖D.可靠性是指一個消息被一個Server接收,它將被所有的Server接受(正確答案)208.華為FusionInsightHD行業(yè)成功案例都有哪些?()*[單選題]*A.數(shù)字政府B.智慧園區(qū)(正確答案)C.智慧交通(正確答案)D.金融(正確答案)(正確答案)209.FusionInsightManager會定時備份哪些元數(shù)據(jù)?()*[單選題]*A.OMSB.LDAPServer(正確答案)C.DBService(正確答案)D.Namenode(正確答案)(正確答案)210.YARN中默認的資源調(diào)度器是?()*[單選題]*A.FIFO調(diào)度器B.容量調(diào)度器C.Fair調(diào)度器D.以上全不是(正確答案)211.假設(shè)在寫入數(shù)據(jù)時只存2份,那么寫入過程中,HDFSClient現(xiàn)將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入Datanode2()*[單選題]*A.TRUEB.FALSE(正確答案)212.Yarn-Client和Yarn-Cluster主要區(qū)別是ApplicationMaster進程的區(qū)別()*[單選題]*A.TRUEB.FALSE(正確答案)213.部署FusionInsightHD時,同一集群內(nèi)的FlumeServer節(jié)點建議至少部署幾個?()*[單選題]*A.1B.3C.4D.2(正確答案)214.以下哪些是Kafka實際的應(yīng)用場景?()*[單選題]*A.網(wǎng)站活性跟蹤B.日志收集(正確答案)C.聚合統(tǒng)計系統(tǒng)運營數(shù)據(jù)(監(jiān)控數(shù)據(jù))(正確答案)D.資源管理(正確答案)215.FusionInsightHD系統(tǒng)中,下面哪個方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果()*[單選題]*A.通過LoaderUI界面查看B.通過YARN任務(wù)管理查看C.通過NodeManager查看D.通過Manager的告警查看(正確答案)216.如圖,以下關(guān)于Kafka消息消費者Consumer讀取消息的描述,錯誤的有?()*[單選題]*A.Consumer使用Offset來記錄讀取的位置B.圖片中的藍色框為Kafka的一個Topic,即可以理解為一個隊列,每個格子代表一條消息。C.生產(chǎn)者產(chǎn)生的消息逐條放到Topic的末尾D.消費者從右至左順序讀取消息(正確答案)217.在大數(shù)據(jù)時代,企業(yè)所面臨的挑戰(zhàn)有以下哪些?()*[單選題]*A.企業(yè)各部門間數(shù)據(jù)分散,相同數(shù)據(jù)在各部門內(nèi)部存儲格式不一致。B.數(shù)據(jù)結(jié)構(gòu)多樣化。(正確答案)C.競爭對手的技術(shù)進步。(正確答案)D.數(shù)據(jù)存在噪音、缺失、存儲類型不規(guī)范等問題,需要進行大量的數(shù)據(jù)預(yù)處理工作。(正確答案)(正確答案)218.FusionInsightHD中HBase默認使用什么組件作為其底層文件存儲系統(tǒng)?()*[單選題]*A.FileB.KafkaC.HDFSD.Memory(正確答案)219.在很多小文件場景下,Spark會起很多Task,當SQL邏輯中存在Shuffle操作時,會大大增加hash分桶數(shù),嚴重影響性能。FusionInsight中,針對小文件的場景通常采用()算子,來對Table中的小文件生成的partition進行合并,減少partition數(shù),從而避免在shuffle的時候,生成過多的hash分桶,提升性能?()*[單選題]*A.groupbyB.coalosceC.connectD.join(正確答案)220.下列關(guān)于Worker(工作進程)、Executor(線程)、Task(任務(wù))說法正確的是?()*[單選題]*A.每個Executor(線程)可以運行多個Task(任務(wù))B.每個Worker可以運行多個Executor(線程)(正確答案)C.每個Worker只能為一個拓撲運行Executor(線程)D.每個Executor(線程)可以運行不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論