大數(shù)據(jù)HCIA復(fù)習(xí)試題及答案_第1頁
大數(shù)據(jù)HCIA復(fù)習(xí)試題及答案_第2頁
大數(shù)據(jù)HCIA復(fù)習(xí)試題及答案_第3頁
大數(shù)據(jù)HCIA復(fù)習(xí)試題及答案_第4頁
大數(shù)據(jù)HCIA復(fù)習(xí)試題及答案_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第頁大數(shù)據(jù)HCIA復(fù)習(xí)試題及答案1.Flume數(shù)據(jù)采集過程中,下列選項中能對數(shù)據(jù)進(jìn)行過濾和修飾的是()A、ChannelB、ChannelSelectorC、InterceptorD、Sink【正確答案】:C2.在FusionInsight產(chǎn)品中,關(guān)于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Topic時,必須設(shè)置Partition個數(shù)B、創(chuàng)建Kafka的Topic時,必須設(shè)置Partition副本個數(shù)C、設(shè)置多副本可以增強Kafka服務(wù)的容災(zāi)能力D、以上全都正確【正確答案】:C3.下面關(guān)于Zookeeper的特性描述錯誤的是?A、戶端所發(fā)送的更新會按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、條消息要被超過半數(shù)的Server接收,他將可以成功寫入磁盤C、消息更新只能成功或失敗,沒有中間狀態(tài)D、Zookeeper節(jié)點數(shù)必須為奇數(shù)個【正確答案】:D4.SparkStreaming計算基于DStream,將流式計算分解成一系列短小的批處理作業(yè)。()A、TRUEB、FALSE【正確答案】:A5.部署FusionInsightHD時,同一集群內(nèi)的FlumeServer節(jié)點建議至少部署幾個?A、1B、2C、3D、4【正確答案】:B6.kafkalogssegment文件命名規(guī)則是partion全局的第一個segment從0開始,后續(xù)每個segment文件名為上一個全局partion的最大offset(偏移message數(shù))。

()A、TRUEB、FALSE【正確答案】:A7.FusionlnsightHadoop集群中,在某節(jié)點上通過df-hT查詢,看到的分區(qū)包含以下幾個:

/var/log

/srv/BigData

/srv/BigData/hadoop/data5

/srv/BigData/solr/solrserver3

/srv/BigData/dbdataom

這些分區(qū)所對應(yīng)磁盤最佳Raid級別的規(guī)劃組合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1【正確答案】:B8.FusionInsightHD中使用HBase進(jìn)行數(shù)據(jù)讀取服務(wù)時需要連接HMasterA、對B、錯【正確答案】:B9.對高價值高度聚合的信息和知識的批次處理是大數(shù)據(jù)行業(yè)主要商業(yè)訴求A、trueB、false【正確答案】:A10.下圖所示的Map階段,是描述哪個過程?

A、PartitionB、SortC、Splill/MergeD、combine【正確答案】:D11.FusionInsightHD集群三層組網(wǎng)時,管理節(jié)點、控制節(jié)點、數(shù)據(jù)節(jié)點建議安裝在不同的網(wǎng)段內(nèi),可以提高可靠性。A、正確B、錯誤【正確答案】:A12.以下關(guān)于ZooKeeper關(guān)鍵特性中的原子性說法正確的是A、客戶端發(fā)送的更新會按照他們被發(fā)送的順序進(jìn)行應(yīng)用B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個server接收,將被所有server接收D、集群中無論哪臺服務(wù)器,對外展示的均是同一視圖【正確答案】:B13.Yarn-client和Yarn-cluster主要區(qū)別是ApplicationMaster進(jìn)程的區(qū)別()A、TRUEB、FALSE【正確答案】:A14.kafka是一個高吞吐、分布式、基于發(fā)布訂閱的消息系統(tǒng),利用kafka技術(shù)可在廉價PCServer上搭建起大規(guī)模消息系統(tǒng)。()A、TRUEB、FALSE【正確答案】:A15.在FusionInsight產(chǎn)品中,關(guān)于KafkaTopic,以下描述不正確的有?A、每個Topic只能被分成一個partition(區(qū))B、Topic的partition數(shù)量可以在創(chuàng)建時配置C、每個Partition的存儲層面對應(yīng)一個log文件,log文件中記錄了所有的信息數(shù)據(jù)D、每條發(fā)布到Kafka的消息都有一個類別,這個類別被稱為Topic,也可以理解為一個存儲消息的隊列【正確答案】:A16.FusionlnsightHD中Loader實例必須與哪個實例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager【正確答案】:D17.SparkSQL表中,經(jīng)常會存在很多小文件(大小遠(yuǎn)小于HDFS塊大小),在這種情況下,Spark會啟動更多的Task來處理這些小文件,當(dāng)SQL邏輯中存在Shuffle操作時,會大大增加hash分桶數(shù),從而嚴(yán)重影響性能。A、對B、錯【正確答案】:B18.FusionlnsightHD使用HBase客戶端批量寫入10條數(shù)據(jù),某個RegionServer節(jié)點上包含該表的2個Region,分別A和

B,10條數(shù)據(jù)中有兩條屬于

A,4條屬于

B,請問寫入這10條數(shù)據(jù)需要向該RegionServer發(fā)送幾次RPC請求?A、1B、2C、3D、4【正確答案】:A19.在FusionInsightHD中,創(chuàng)建Loader作業(yè)的進(jìn)行數(shù)據(jù)轉(zhuǎn)換的正確步驟是()A、加載、轉(zhuǎn)換、輸出B、輸入設(shè)置、轉(zhuǎn)換、輸出C、加載、轉(zhuǎn)化、抽取D、抽取、轉(zhuǎn)換、輸出【正確答案】:B20.Kafka所有消息都會被持久化到硬盤中,同時Kafka通過對TopicPartition設(shè)置Replicetion來保障數(shù)據(jù)可靠。A、TRUEB、FALSE【正確答案】:A21.哪個模塊是負(fù)責(zé)FusionInsightManager用戶數(shù)據(jù)存儲的?A、CASB、AOS

C、KerberosD、LDAP

【正確答案】:D22.Solr創(chuàng)建Collection時,推薦選用路由算法為compositldRouter,那么該Collection可以拓展shard。A、正確B、錯誤【正確答案】:B23.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次運行Task都要從3個有副本的機器上傳輸需要處理的文件段。A、對B、錯【正確答案】:B24.FuskmlnsightHD集群規(guī)劃中,管理節(jié)點&控制節(jié)點&數(shù)據(jù)節(jié)點合一部署方案適合什么樣的場景?A、30節(jié)點以下B、100節(jié)點以上C、100-200節(jié)點D、200節(jié)點以上【正確答案】:A25.HDFS支持大文件存儲,同時支持多個用戶對同一個文件的寫操作,以及在文件任意位置進(jìn)行修改。A、正確B、錯誤【正確答案】:B26.FusionInsightHD中Loader作業(yè)提交到Y(jié)ARN后,作業(yè)不能手動停止。A、對B、錯【正確答案】:B27.傳統(tǒng)數(shù)據(jù)處理的數(shù)據(jù)規(guī)模的單位是?A、TBB、EBC、PBD、GB【正確答案】:D28.以下關(guān)于HiveSQL基本操作描述正確的是()A、加載數(shù)據(jù)到Hive時源數(shù)據(jù)必須是HDFS的一個路徑B、創(chuàng)建外部表必須要指定location信息C、創(chuàng)建表時可以指定列分隔符D、創(chuàng)建外部表使用external關(guān)鍵字。創(chuàng)建普通表需要指定internal關(guān)鍵字【正確答案】:C29.如果YARN集群中只有Default、QueueA和QueueB子隊列,那么允許將他們的容量分別設(shè)置為60%、25%、22%。A、對B、錯【正確答案】:B30.FusionInsightHD平臺中,HBase暫不支持二級索引A、對B、錯【正確答案】:B31.下列哪個不是HBase讀取數(shù)據(jù)流程中涉及的角色或服務(wù)?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer【正確答案】:C32.HBase的最小處理單元是Region,UserRegion和RegionServer之間的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正確答案】:A33.查看Kafka的某Topic的partition詳細(xì)信息時,使用如下哪個命令?A、bin/kafka-topic.sh–createB、bin/kafka-topic.sh--listC、bin/kafka-topic.sh--describeD、bin/kafka-topic.sh--delete【正確答案】:C34.Zookeeper在分布式應(yīng)用中的主要作用不包括一下哪些選項?A、選舉Master節(jié)點B、保證各節(jié)點上數(shù)據(jù)的一致性C、分配集群資源D、存儲及群中服務(wù)器信息【正確答案】:C35.FusionInsight集群組網(wǎng)設(shè)計中,二層組網(wǎng)指集群內(nèi)二層交換,集群節(jié)點在一個子網(wǎng)里,適用節(jié)點小于200的集群場景。A、正確B、錯誤【正確答案】:A36.Flume傳輸數(shù)據(jù)的過程中,Sink取走數(shù)據(jù)并寫入目的地后,會將events從channel中刪除。A、對B、錯【正確答案】:A37.FusionInsightManager用戶權(quán)限管理不支持哪個配置?A、給用戶配置角色B、給角色配置權(quán)限C、給用戶組配置角色D、給用戶組配置權(quán)限【正確答案】:D38.關(guān)于FusionlnsightHD中Loader作業(yè)描述正確的是?A、Loader將作業(yè)提交到Y(jié)am執(zhí)行后,如果此時Loader服務(wù)異常,則此作業(yè)執(zhí)行失敗。B、Loader將作業(yè)提交到Y(jié)am執(zhí)行后,如果某個Mapper任務(wù)執(zhí)行失敗,能夠自動進(jìn)行重試C、Loadet作業(yè)執(zhí)行失敗后將會產(chǎn)生垃壩數(shù)據(jù),需要用戶手動清除D、Loader將一個作業(yè)提交至Yam執(zhí)行后,該作業(yè)執(zhí)行完成前,不能再提交其他作業(yè)【正確答案】:B39.FusionlnsightHD系統(tǒng)中HDFS的Block默認(rèn)保存幾份?A、3份B、2份C、1份D、不確定【正確答案】:A40.驅(qū)動型Source是flume周期性主動去獲取數(shù)據(jù)。()A、TRUEB、FALSE【正確答案】:B41.以下哪類數(shù)據(jù)不屬于半結(jié)構(gòu)化數(shù)據(jù)?A、HTMLB、XMLC、二維表D、JSON【正確答案】:C42.Kafka作為一個分布式消息系統(tǒng),支持在線和離線消息處理,并提供了javaAPI以便其他組件對接使用,在FusionInsight解決方案中,Kafka屬于FusionInsightHD模塊。A、TrueB、False【正確答案】:A43.FusionInsightHD中l(wèi)oader從SFTP服務(wù)器導(dǎo)入文件時,不需要做編碼轉(zhuǎn)換和數(shù)據(jù)轉(zhuǎn)換且速度最快的文件類型是以下哪項?()A、sequence_fileB、text_fileC、binary_fileD、graph_file【正確答案】:C44.FusionInsightHD系統(tǒng)審計日志不可以記錄下面哪些操作()A、刪除服務(wù)實例B、啟停服務(wù)實例C、手動清除告警D、查詢歷史監(jiān)控【正確答案】:D45.Flink與SparkStreaming類似,屬于事件驅(qū)動型實時流系統(tǒng)A、對B、錯【正確答案】:B46.Hadoop平臺中,要查看YARN服務(wù)中一個application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正確答案】:D47.HBase的主Master是如何選舉的?A、隨機選取B、由RegionServer進(jìn)行裁決C、通過Zookeeper進(jìn)行裁決D、HMaster為雙主模式,不需要進(jìn)行裁決【正確答案】:C48.FusionInsightHD系統(tǒng)中,HBase支持動態(tài)擴展列。()A、TRUEB、FALSE【正確答案】:A49.關(guān)于FusionInsightHD安裝流程正確的是?A、安裝Manager->執(zhí)行preinstall->LLD工具進(jìn)行配置->安裝集群->安裝后檢查->安裝后配置B、LLD工具進(jìn)行配置->執(zhí)行preinstall->安裝Manager->安裝集群->安裝后檢查->安裝后配置C、安裝Manager->LLD工具進(jìn)行配置->執(zhí)行preinstall->安裝集群->安裝后檢查->安裝后配置D、LLD工具進(jìn)行配置->執(zhí)行preinstall->安裝集群->安裝Manager->安裝后檢查->安裝后配置【正確答案】:B50.Hive是基于hadoop的數(shù)據(jù)倉庫軟件,可以查詢和管理PB級別的分布式數(shù)據(jù)。以下關(guān)于Hive特性的描述不正確的是?()A、僅支持MapReduce計算引擎B、易用易編程C、可直接訪問HDFS文件以及HBaseD、靈活方便的ETL(extract/transform/load)【正確答案】:A51.Spark任務(wù)的每個stage可劃分為job,劃分的標(biāo)記是shuffle。A、正確B、錯誤【正確答案】:B52.kafkaProducer讀數(shù)據(jù)總體流程是,Producer連接任意存活的Broker,請求指定topic、partition的leader元數(shù)據(jù)信息,然后直接與對應(yīng)的Broker直接連接,發(fā)布數(shù)據(jù)。()A、TRUEB、FALSE【正確答案】:A53.sparkStreaming容錯機制是指RDD中任意的partition出錯,都可以根據(jù)其父

RDD重新計算生成,如果父RDD丟失,則需要去磁盤中查找原始數(shù)據(jù)。()A、TRUEB、FALSE【正確答案】:B54.下列哪個命令是刪除文件的?()A、dfs-clearB、dfs-delC、dfs-rmD、dfs-ls【正確答案】:C55.關(guān)于Hive建表的基本操作,描述正確的是?A、創(chuàng)建外部表的時需要指定external關(guān)鍵字B、一旦表創(chuàng)建好,不可再修改表名C、一旦表創(chuàng)建好,不可再修改列名D、一旦表創(chuàng)建好,不可再增加新列【正確答案】:A56.以下關(guān)于HBase二級索引的描述哪一項是正確的()A、二級索引把要查找的列與rowkey關(guān)聯(lián)成一個索引表B、此時列成新的rowkey,原rowkey成為valueC、二級索引查詢了2次D、以上全都正確【正確答案】:D57.下圖為Spark&MapReduce的性能對比數(shù)據(jù),可以得出結(jié)論,與MapReduce計算相比,Spark用___的資源,獲得___倍性能?A、1/8,3B、1/10,3C、1/10,4D、1/8,4【正確答案】:B58.FusionInsightHD產(chǎn)品中,一個典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一個Zookeeper集群A、TrueB、False【正確答案】:A59.下面哪些場景不是Flink組件擅長的?()A、批處理B、迭代計算C、數(shù)據(jù)存儲D、流處理【正確答案】:C60.華為FusionInsightHD系統(tǒng)中關(guān)于HDFS的DataNode的說法正確的是?A、不會檢查數(shù)據(jù)的有效性B、周期性地將本節(jié)點的Block相關(guān)信息發(fā)送給NameNodeC、不同的DataNode存儲的Block一定是不同的D、一個DataNode上的Block可以是相同的【正確答案】:B61.Kafka是一個分布式的消息發(fā)布訂閱系統(tǒng),它只是進(jìn)行消息的轉(zhuǎn)發(fā),不會保存消息。A、對B、錯【正確答案】:B62.fusioninsightmanager不能夠管理哪個對象?A、sparkB、主機OSC、yarnD、HDFS【正確答案】:B63.topology在任務(wù)完成后會自動結(jié)束運行。()A、TRUEB、FALSE【正確答案】:B64.在有N個節(jié)點FusionInsightHD集群中部署HBase時,推薦部署()個HMaster進(jìn)程,()個

RegionServer進(jìn)程A、3,NB、N,NC、2,ND、2,2【正確答案】:C65.HDFS的Client寫入文件時,數(shù)據(jù)的第一副本寫入位置由NameNode確定,其他副本的寫入位置由DataNode確定。A、對B、錯【正確答案】:A66.FusionlnsightHD中,如果需要查看當(dāng)前登錄HBase的用戶和權(quán)限組,可以在HBaseshell中執(zhí)行什么命令?A、use_permissionB、whoamiC、whoD、get_user【正確答案】:B67.FusionInsightSparkSQL同社區(qū)SparkJDBCServer一樣,只支持單租戶綁定到一個YARN資源隊列多租戶,并不支持多租戶并行執(zhí)行。A、TRUEB、FALSE【正確答案】:B68.Zookeeper的scheme認(rèn)證方式不包含以下哪項?()A、saslB、authC、digestD、world【正確答案】:A69.如果某些Container的物理內(nèi)存利用超過了配置的內(nèi)存閾值,但所有Container的總內(nèi)存利用率并沒有超過設(shè)置的NodeManager內(nèi)存閾值,那么內(nèi)存使用過多的Container仍可以繼續(xù)運行。()A、TRUEB、FALSE【正確答案】:A70.kafka集群在運行期間,直接依賴于下面那些組件?()A、ZookeeperB、HDFSC、SparkD、HBase【正確答案】:A71.Flink采用checkpoint機制保障應(yīng)用程序運行中的容錯性。A、TRUEB、FALSE【正確答案】:A72.HDFS中Namenode的主備仲裁,是由哪個組件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController【正確答案】:D73.在Streaming中,消息可靠性級別中精確一次是通過ACK機制來實現(xiàn)的。A、TRUEB、FALSE【正確答案】:B74.FusionInsightHD系統(tǒng)中,下面哪個方法不能查看到Loader作業(yè)執(zhí)行的結(jié)果?A、通過Yarn任務(wù)管理查看B、通過LoaderUI界面查看C、通過Mangaer的告警查看D、通過NodeManager查看【正確答案】:D75.KafkaClusterMirroring工具可以實現(xiàn)以下哪項功能?A、Kafka跨集群數(shù)據(jù)同步方式B、Kafka單集群內(nèi)數(shù)據(jù)備份C、Kafka單集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全不正確【正確答案】:A76.HDFS的NameNode節(jié)點主備狀態(tài)管理及元數(shù)據(jù)文件合并分別由哪兩個角色負(fù)責(zé)?A、ZKFC和備NameNodeB、主NameNode和備NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode【正確答案】:A77.Hadoop的HBase不適合哪些數(shù)據(jù)類型的應(yīng)用場景?A、大文件應(yīng)用場景B、海量數(shù)據(jù)應(yīng)用場景C、高吞吐率應(yīng)用場景D、半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用場景【正確答案】:A78.以下哪個不屬于Hadoop中MapReduce組件的特點?A、易于編程B、良好的拓展性C、實時計算D、高容錯性【正確答案】:C79.FusionlnsightManager對服務(wù)的管理操作,下面說法錯誤的是?A、可對服務(wù)進(jìn)行啟停重啟操作B、可以添加和卸載服務(wù)C、可設(shè)置不常用的服務(wù)隱藏或顯示D、可查看服務(wù)的當(dāng)前狀態(tài)【正確答案】:C80.硬件故障被認(rèn)為是常態(tài),為了解決這個問題,HDFS設(shè)計了副本機制。默認(rèn)情況下,一份文件,HDFS會存()份?A、2B、4C、3D、5【正確答案】:C81.在Flink中,checkpoint機制能夠保證應(yīng)用在運行過程中出現(xiàn)失敗時,從某一個檢查點恢復(fù),在此過程中,流快照是根據(jù)數(shù)據(jù)流入順序依次創(chuàng)建的。A、TrueB、False【正確答案】:A82.HBase中MOB數(shù)據(jù)直接HFile的格式存儲在HDFS上,然后把這個文件的地址信息及大小信息作為value存儲在管理HBase的store上,通過工具集中管理這些文件。這樣就可以大大降低HBase的compation和split頻率,提升性能。A、TRUEB、FALSE【正確答案】:A83.HBase中Region的物理存儲單元是什么A、RegionB、ColumnFamilyColumnD、Row【正確答案】:B84.Spark和Hadoop都不適用于迭代計算的場景。A、對B、錯【正確答案】:B85.Hadoop系統(tǒng)中YARN分配給Container的內(nèi)存大小,可以通過參數(shù)yarn.app.mapreduce.am.resource.mb來設(shè)置A、對B、錯【正確答案】:B86.YRAN的基于標(biāo)簽調(diào)度,是對下列選項中的哪個進(jìn)行標(biāo)簽化?APPMasterB、ResourceManagerContainerD、NodeManager【正確答案】:D87.SoIrCloud模式是集群模式,在此模式下Solr服務(wù)器強依賴于以下哪個服務(wù)?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正確答案】:C88.Hive中“Groupby”指的是通過一定的規(guī)則將每一個數(shù)據(jù)集劃分成若干個小的數(shù)據(jù)集,然后針對若干個小的數(shù)據(jù)集進(jìn)行數(shù)據(jù)分組處理A、TrueB、False【正確答案】:A89.用戶權(quán)限管理基于角色的訪問控制(RBAC),提供可視化的多組統(tǒng)一的集群中用戶權(quán)限管理。A、trueB、false【正確答案】:A90.Hive在load時是不檢查數(shù)據(jù)是否符合schema的,hive遵循的是schemaonread(讀時模式),只有在讀的時候hive才檢查、解析具體的數(shù)據(jù)字段、schema。

()A、TRUEB、FALSE【正確答案】:A91.Flink適用于高并發(fā)處理數(shù)據(jù)、毫秒級時延的應(yīng)用A、TrueB、False【正確答案】:A92.KafkaClusterMirroring工具可以實現(xiàn)以下哪些功能?A、Kafka跨集群數(shù)據(jù)同步方案B、Kafka單集群內(nèi)數(shù)據(jù)備份C、Kafka但集群內(nèi)數(shù)據(jù)恢復(fù)D、以上全不正確【正確答案】:A93.以下哪一項不屬于創(chuàng)建Loader作業(yè)時必選項?A、名稱B、連接C、類型D、優(yōu)先級【正確答案】:D94.FusionInsightManager對服務(wù)的配置功能說法不正確的是?A、服務(wù)級別的配置可對所有實例生效B、實例級別的配置只針對本實例生效C、實例級別的配置對其他實例也生效D、配置保存好需要重啟服務(wù)才能生效【正確答案】:C95.安裝FusionInsightHD的Streaming組件時,Nimbus角色要求安裝幾個節(jié)點A、3B、2C、4D、1【正確答案】:B96.Spark是以下哪種編程語言實現(xiàn)的?A、CB、C++C、JAVAD、Scala【正確答案】:D97.

FusionInsightHD的Streaming對于Zookeeper弱依賴,即使Zookeeper故障,Streaming可以正常提供服務(wù)。A、對B、錯【正確答案】:B98.關(guān)于RDD,下列說法錯誤的是?A、RDD具有血統(tǒng)機制(Lineage)B、RDD默認(rèn)存儲在磁盤C、RDD是一個只讀的,可分區(qū)的分布式數(shù)據(jù)集D、RDD是Spark對基礎(chǔ)數(shù)據(jù)的抽象【正確答案】:B99.Hadoop的NameNode用于存儲文件系統(tǒng)的元數(shù)據(jù)。A、正確B、錯誤【正確答案】:A100.下列哪個命令是從HDFS下載目錄/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put【正確答案】:C101.使用Hbase客戶端批量寫入10條數(shù)據(jù),某個HRegionServer節(jié)點上包含該表的2個Region,分別為A和B,10條數(shù)據(jù)中有6條屬于

A,4條屬于

B,請問寫入這10條數(shù)據(jù)需要向該HRegionServer發(fā)送幾次RPC請求?A、2B、1C、6D、10【正確答案】:B102.安裝FusionInsightHD的Streaming組件時,Nimbus角色要求安裝幾個節(jié)點()A、3B、2C、1D、4【正確答案】:B103.Flink是一個批處理和流處理結(jié)合的統(tǒng)一計算框架,其核心是一個數(shù)據(jù)分發(fā)以及并行化計算的流數(shù)據(jù)處理引擎。A、對B、錯【正確答案】:A104.Zookeeper的scheme認(rèn)證方式不包括以下哪項?()A、authB、saslC、digestD、world【正確答案】:B105.flume架構(gòu)中,一個Source可以連接多個channel。()A、TRUEB、FALSE【正確答案】:A106.spark的核心模塊是?A、sparkstreamingB、sparkcoreC、mapreduceD、sparksql【正確答案】:B107.SparkonYarn-client適合用于生產(chǎn)環(huán)境是因為可以更快的看到APP的輸出。A、TRUEB、FALSE【正確答案】:B108.Hadoop中哪個模塊負(fù)責(zé)HDFS的數(shù)據(jù)存儲?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker【正確答案】:B109.在Flink技術(shù)架構(gòu)中,()是流處理和批處理的計算引擎A、Standalone

B、RuntimeC、DataStreamD、FlinkCore

【正確答案】:B110.在Flink的運行流程中,負(fù)責(zé)申請資源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正確答案】:B111.關(guān)于FusionInsightHDStreaming的Supervisor描述正確的是?A、Supervisor負(fù)責(zé)資源的分配和任務(wù)的調(diào)度B、Supervisor負(fù)責(zé)接受Nimbus分配的任務(wù),啟動停止屬于自己管理的Worker進(jìn)程C、Supervisor是運行具體處理邏輯的進(jìn)程D、Supervisor是在Topology中接收數(shù)據(jù)然后執(zhí)行處理的組件?!菊_答案】:B112.下列選項中,關(guān)于Zookeeper可靠性含義說法正確的是?()A、可靠性通過主備部署莫屬實現(xiàn)B、可靠性是指更新只能成功或者失敗,沒有中間狀態(tài)C、可靠性是指無論哪個Server。對外展示的均是同一個視圖D、可靠性是指一條消息被一個Server接收,它將被所有Server接受【正確答案】:D113.SparkOnYarn模式下的driver只能運行在客戶端。A、對B、錯【正確答案】:B114.以下關(guān)于Flink關(guān)鍵特性描述不正確的是?A、SparkStreaming與Flink相比,時延更低B、Flink流式處理引擎能夠同時提供支持流處理和批處理應(yīng)用的功能C、與FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint實現(xiàn)了Flink的容錯【正確答案】:A115.YARN上有兩個同級隊列Q1與Q2,容量都是50%,Q1上已經(jīng)有10個任務(wù)共占用了40的容量,Q2上有兩個任務(wù)共占用了30的容量,那么由于Q1的任務(wù)數(shù)多,調(diào)度器會優(yōu)先將資源分配給Q1。A、對B、錯【正確答案】:B116.以下哪些選項屬于FusionInsightSparkSQL的優(yōu)點?A、支持?jǐn)?shù)據(jù)插入、更新和刪除B、長穩(wěn)測試C、以上全都正確D、穩(wěn)定和高性能SQL兼容性【正確答案】:C117.當(dāng)Zookeeper集群的節(jié)點數(shù)為5節(jié)點時,請問集群的容災(zāi)能力和多少節(jié)點是等價的?A、3B、4C、6D、以上都不是【正確答案】:C118.二級索引為hbase提供了按照某些列的值進(jìn)行索引的能力,二級索引先查索引表,再定位到數(shù)據(jù)表中的位置,不用全表掃描A、trueB、false【正確答案】:A119.Streaming主要通過Zookeeper提供的以下哪項服務(wù)實現(xiàn)事件偵聽?()A、分布式鎖機制B、ACKC、WatcherD、Checkpoint【正確答案】:C120.假設(shè)HDFS在寫入數(shù)據(jù)時只存2份,那么在寫入過程中,HDFSClient先將數(shù)據(jù)寫入DataNode1,再將數(shù)據(jù)寫入DataNode2。()A、TRUEB、FALSE【正確答案】:B121.ApplicationMaster采用輪詢的方式通過RPC協(xié)議向ResourceManager申請和領(lǐng)取資源。A、TRUEB、FALSE【正確答案】:A122.flume傳輸數(shù)據(jù)的可靠性是指flume在傳輸數(shù)據(jù)過程中,當(dāng)下一跳的flume節(jié)點故障或者數(shù)據(jù)接收異常時,可以自動切換到另外一路上繼續(xù)傳輸。()A、TRUEB、FALSE【正確答案】:A123.Spark應(yīng)用在運行時,Stage劃分的依據(jù)是什么?A、taskB、taskSetC、actionD、shuffle【正確答案】:D124.下圖為HDFS分級存儲的配置,如果block的副本數(shù)為4,則以下說法錯誤的是?()A、4個block都將寫入RAM_DISKB、如果是第1個副本之外的其它副本寫入失敗,則嘗試寫入“副本的備選存儲策略”指定的存儲類型C、第1個block副本將寫入RAM_DISK,其余副本寫入DISKD、如果第1個block副本寫入RAM_DISK失敗,則嘗試寫入“備選存儲策略”指定的存儲類型【正確答案】:A125.以下關(guān)于Hbase中HregionServer的功能描述哪些是不正確的A、RegionServer一般與HDFS集群的NameNode部署在一起,實現(xiàn)數(shù)據(jù)的存儲功能B、Hbase的數(shù)據(jù)處理和計算單元C、RegionServer是Hbase的數(shù)據(jù)服務(wù)進(jìn)程,負(fù)責(zé)處理用戶數(shù)據(jù)的讀寫請求D、管理所有的Region,Region可以在RegionServer之間遷移【正確答案】:B126.FusionlnsightHD系統(tǒng)中,LDAP數(shù)據(jù)同步方式是哪個?A、單向同步B、雙向同步C、隔離不同步D、數(shù)據(jù)交叉同步【正確答案】:A127.SparkStreaming相比Storm具備更高的實時性。A、對B、錯【正確答案】:B128.kafkaConsumer寫數(shù)據(jù)總體流程是,Consumer連接指定TopicPartition所在的LeaderBroker,用于主動獲取方式從kafka中獲取消息。()A、TRUEB、FALSE【正確答案】:A129.hive支持普通視圖和物化視圖。()A、TRUEB、FALSE【正確答案】:B130.colocation(同分布)文件級的同分布實現(xiàn)文件的快速訪問,避免了因數(shù)據(jù)搬遷帶來的大量網(wǎng)絡(luò)開銷。()A、TRUEB、FALSE【正確答案】:A131.HBase的BloomFilter是用來過濾數(shù)據(jù)的。()A、TRUEB、FALSE【正確答案】:B132.FusionInsightHD產(chǎn)品中,關(guān)于Kafka的說法不正確的是?A、Kafka強依賴于ZookeeperB、Kafka部署的實例個數(shù)不得小于2C、Kafka的服務(wù)端可以產(chǎn)生消息D、Consumer作為Kafka的客戶端角色進(jìn)行消息的消費【正確答案】:B133.FusionInsightHD管理節(jié)點提供雙機HA機制,主節(jié)點故障后,主備節(jié)點需要手動實現(xiàn)Failover。A、正確B、錯誤【正確答案】:B134.HDFS中的主備仲裁,是由哪個組件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正確答案】:A135.下圖展示的flume架構(gòu),主要應(yīng)用于集群外的數(shù)據(jù)導(dǎo)入到集群內(nèi)。()A、TRUEB、FALSE【正確答案】:A136.關(guān)于Hive與Hadoop其他組件的關(guān)系。以下描述錯誤的是?A、Hive最終將數(shù)據(jù)存儲在HDFS中B、Hive是Hadoop平臺的數(shù)據(jù)倉庫工具C、HQL可以通過MapReduce執(zhí)行任務(wù)D、Hive對HBase有強依賴【正確答案】:D137.Spark自帶的資源管理框架是?A、StandaloneB、MesosC、YARNDocker【正確答案】:B138.Hadoop中MapReduce組件擅長處理哪種場景的計算任務(wù)?A、迭代計算B、離線計算C、實時交互計算D、流式計算【正確答案】:B139.下面關(guān)于Zookeeper特性的描述錯誤的是?()A、Zookeeper節(jié)點數(shù)必須為奇數(shù)個。B、客戶端所發(fā)送的更新會按照它們被發(fā)送的順序進(jìn)行應(yīng)用。C、消息更新只能成功或者失敗,沒有中間狀態(tài)。D、一條消息要被超過半數(shù)的Server接收,它將可以成功寫入磁盤【正確答案】:A140.Spark是基于內(nèi)存的計算引擎,所有Spark程序運行過程中的數(shù)據(jù)只能存儲在內(nèi)存中A、對B、錯【正確答案】:B141.在MapReduce編程中,代碼不僅要描述做什么,還要描述具體怎么做。()A、TRUEB、FALSE【正確答案】:B142.FusionInsight中Hive包含2個角色,HiveServer和MetaStore.A、TRUEB、FALSE【正確答案】:A143.關(guān)于Hive在FusionlnsightHD中的架構(gòu)描述錯誤的是?A、只要有一個HiveServer不可用,整個Hive集群便不可用B、HiveServer負(fù)責(zé)接受客戶端請求、解析、執(zhí)行HQL命令并返回查詢結(jié)果C、MetaStore用于提供原數(shù)據(jù)服務(wù),依賴于DBServerD、在同一時間點HiveServeir只有一個處于Active狀態(tài),另一個則處于Standby狀態(tài)【正確答案】:A144.YARN中默認(rèn)的資源調(diào)度器是?()A、FIFO調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全不正確【正確答案】:B145.以下關(guān)于Zookeeper的Leader節(jié)點在收到數(shù)據(jù)變更請求后的讀寫流程說法正確的是?A、同時寫入磁盤和內(nèi)存B、先寫磁盤再寫內(nèi)存C、僅寫入內(nèi)存D、先寫內(nèi)存再寫磁盤【正確答案】:B146.Flume的perties配置文件中可以配置多個Channel來傳輸數(shù)據(jù)?A、TRUEB、FALSE【正確答案】:A147.Kafka中partitionreplication之間同步數(shù)據(jù),從partition的leader復(fù)制數(shù)據(jù)到follower需要線程

(replicationFetcherThread),Follower(一個follower相當(dāng)于consumer)主動從leader批量拉取消息的,這極大提高了吞吐量。A、TrueB、False【正確答案】:A148.Flume用于收集數(shù)據(jù),其傳輸?shù)臄?shù)據(jù)基本單位是?A、SplitBlockC、EventD、Packet【正確答案】:C149.FusionInsightHD的HBase中保存一張用戶信息表meg_table,Rowkey為用戶id,其中一列為用戶昵稱,現(xiàn)在按先后順序往這列寫入三個KeyValue:001:Li,001:Mary,001:Lily,請問scan’meg_table’,(VERSION=>2)會返回哪幾條數(shù)據(jù)?()A、001:LilyB、1:LiC、1:Mary,001:LilyD、001:Li,001:Mary,001:Lily【正確答案】:A150.某銀行規(guī)劃的FusionlnsightHD集群有90個節(jié)點,如果控制節(jié)點規(guī)劃了3個,那集群中數(shù)據(jù)節(jié)點推薦規(guī)劃()個。A、87B、85C、90D、86【正確答案】:B1.HBase集群定時執(zhí)行Compaction的目的是什么?A、減少同一Region,同一ColumnFamily下的文件數(shù)目B、提升數(shù)據(jù)讀取性能C、減少同一ColumnFamily的文件數(shù)據(jù)D、減少同一Region的文件數(shù)目【正確答案】:ABD2.FusionInsightHD安裝前準(zhǔn)備,包括哪些步驟?(多選)A、完成硬件安裝B、完成節(jié)點主機操作系統(tǒng)安裝C、準(zhǔn)備工具和軟件。例如Putty、LLD、FusionInsightHD軟件安裝包等D、準(zhǔn)備規(guī)劃數(shù)據(jù),例如網(wǎng)絡(luò)參數(shù)和角色部署位置【正確答案】:ABCD3.Hadoop集群規(guī)模很大時,數(shù)據(jù)的分布情況會非常關(guān)鍵,用戶需要根據(jù)數(shù)據(jù)分布情況,決定集群是否擴容,數(shù)據(jù)是否需要做均衡等。以下關(guān)于FusionInsight資源分布監(jiān)控說法正確的有()A、幫助用戶迅速找到資源消耗最高的節(jié)點,采用適當(dāng)?shù)拇胧〣、通過每個服務(wù)主頁的資源分布查看界面,查看到關(guān)鍵的資源分布情況C、可以幫助用戶快速聚集在最關(guān)鍵的資源消耗上D、通過DashBoard界面,可以查看到主機資源分布情況。例如內(nèi)存占有率在50-75%的主機列表,并提供鏈接跳轉(zhuǎn)【正確答案】:ABCD4.下列關(guān)于worker(工作進(jìn)程)、Executor(線程)、task(任務(wù))說法正確的是?()A、每個Executor(線程)可以運行多個task(任務(wù))B、每個Executor(線程)可以運行不同組件(spout或bolt)的task(任務(wù))C、每個worker可以運行多個Executor(線程)D、每個worker只能為一個拓?fù)溥\行Executor(線程)【正確答案】:ABCD5.以下屬于hiveSQL中DDL(數(shù)據(jù)定義語言)的是?()A、修改表B、刪除表C、建表D、數(shù)據(jù)導(dǎo)入【正確答案】:ABC6.Hadoop的HDFS是一種分布式文件系統(tǒng),適合以下哪種應(yīng)用場景的數(shù)據(jù)存儲和管理?A、大量小文件存儲B、高容錯、高吞吐量C、低延遲讀取D、流式數(shù)據(jù)訪問【正確答案】:BD7.FusionInsightHD的HBase服務(wù)包含哪些進(jìn)程?A、HMasterB、SlaveC、HRegionServerDataNode【正確答案】:AC8.FusionlnsightHD支持哪些日志下載方式?A、下載已安裝組件的所有組件的曰志B、下載單個組件某個模塊的曰志C、下載指定主機的曰志D、下載指定時間段的曰志【正確答案】:ABCD9.以下哪些數(shù)據(jù)源可以通過loader實現(xiàn)與FusionInsightHD的數(shù)據(jù)交換?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正確答案】:ABCD10.以下關(guān)于FusionInsight多租戶管理的描述正確的有()A、一站式管理租戶資源,計算資源(CPU/內(nèi)存/IO)、存儲資源(HDFS)、服務(wù)資源,(HBase…)B、可視化的多級租戶管理,與企業(yè)組織結(jié)構(gòu)相匹配,簡化系統(tǒng)資源分配與管理C、基于容器機制的租戶資源隔離,為租戶SLA保駕護(hù)航D、與企業(yè)組織結(jié)構(gòu)相匹配的多級的租戶模型,不同部門對應(yīng)不同的租戶、按需動態(tài)增刪租戶【正確答案】:ABCD11.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令查看拓?fù)浠蛘咛峤煌負(fù)涫?以下哪些定位手段的正確的?()A、查看Supervisor運行日志,判斷是否Supervisor異常B、查看worker運行日志C、查看客戶端異常堆棧,判斷是否客戶端使用問題D、查看主nimbus的運行日志,判斷是否nimbus服務(wù)器異常【正確答案】:ABCD12.FusionlnsightManager與外部管理平臺對接時,支持哪些接口?(多選)A、NMPB、VPNC、FTPD、Syslog【正確答案】:ACD13.FusionInsightManager會定時備份哪些數(shù)據(jù)?A、NameNodeB、LDAPC、OMSDBService【正確答案】:BC14.Flink流式處理的數(shù)據(jù)源類型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正確答案】:ABCD15.以下關(guān)于HBase中HMaster的功能描述哪些是正確的?A、Region負(fù)載均衡,Region分裂以及分裂后的Region分配B、負(fù)責(zé)建表/修改表/刪除表C、負(fù)責(zé)RegionServer的負(fù)載均衡D、RegionServer失效后的Region遷移【正確答案】:ABCD16.FusionInsight家族包含下列哪些子產(chǎn)品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正確答案】:ABCDE17.Flume進(jìn)程級聯(lián)時,以下哪些sink類型用于接收上一跳Flume發(fā)送過來的消息?AvrosinkB、ThriftsinkC、HivesinkD、Nullsink【正確答案】:AB18.如圖所示,Flink流式數(shù)據(jù)處理接口DataStreamAPI支持的語言包括?()A、pythonB、javaC、c語言D、scala【正確答案】:BD19.在Kafka中,如下關(guān)于Producer發(fā)送數(shù)據(jù)的說法錯誤的是()A、Proucer負(fù)責(zé)生產(chǎn)數(shù)據(jù)。Consumer負(fù)責(zé)消費數(shù)據(jù)。Producer和Consumer之間需要建立連接B、Proucer既可以發(fā)送數(shù)據(jù)到Broker上。又可以發(fā)送數(shù)據(jù)到ConsumerC、Proucer作為消息生產(chǎn)者??梢灾苯訉?shù)據(jù)寫入ZookeeperD、Proucer連接任意一個正常的Broker實例就可以產(chǎn)生數(shù)據(jù)【正確答案】:ABC20.FusionInsightManager與外部平臺對接時,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog【正確答案】:AD21.FusionInsightManager的主要功能有以下哪些?A、數(shù)據(jù)集成B、系統(tǒng)管理C、安全管理D、服務(wù)治理【正確答案】:BCD22.下列哪些OS版本被推薦可以用來搭建FusionlnsightV1R2C60集群?(多選)A、SUSE11SP1/SP2/SP3forAMD64&Inter64B、CentOS6.6C、Redhat-6.4-x86_64D、RedHat-6.5-x86_64E、RedHat-6.7-x86_64F、Ubuntu6.3【正確答案】:ABCDE23.在Streaming的處理節(jié)點Bolt中,可以完成以下哪些操作()A、接運算B、接數(shù)據(jù)庫C、濾(filter)D、務(wù)處理【正確答案】:ABCD24.Flink的兼容性體現(xiàn)在以下哪些方面?()A、能夠與hadoop原有的mappers和reducers混合使用B、YARN能夠作為Flink集群的資源調(diào)度管理器C、能夠使用hadoop的格式化輸入和輸出D、能夠從本地獲取數(shù)據(jù)【正確答案】:ABCD25.大數(shù)據(jù)商業(yè)咨詢服務(wù)方案在規(guī)劃環(huán)節(jié)主要考慮以下哪些設(shè)計?A、大數(shù)據(jù)商業(yè)模式設(shè)計B、商業(yè)場景全景規(guī)劃C、典型場景需求設(shè)計D、場景分解和業(yè)務(wù)設(shè)計【正確答案】:ABCD26.以下哪些是Spark可以提供的功能?A、分布式內(nèi)存計算引擎B、分布式文件系統(tǒng)C、集群資源的統(tǒng)一調(diào)度D、流處理功能【正確答案】:AD27.Zookeeper的關(guān)鍵特性包括以下哪些選項?()A、原子性B、最終一致性C、等待無關(guān)性D、可靠性【正確答案】:ABCD28.在FusionInsightHD中,以下哪一項不屬于Hive的流控特性A、支持對已建立的總連接數(shù)做閾值控制B、支持對每個用戶已經(jīng)建立的連接數(shù)做閾值控制C、支持對某個特定用戶已建立的連接數(shù)做閾值控制D、支持對單位時間內(nèi)所建立的連接數(shù)做閾值控制【正確答案】:ABD29.華為大數(shù)據(jù)解決方案中平臺架構(gòu)包括以下哪些組成部分?()A、Hadoop層B、GaussDB200C、Datafarm層D、FusioInghtManager【正確答案】:ACD30.以下關(guān)于FusionInsight中CarbonData說法正確的有?()A、carbon也是一種將數(shù)據(jù)源與spark集成的高性能分析引擎。B、carbon使用輕量級壓縮和重量級壓縮的組合壓縮算法壓縮數(shù)據(jù),可以減少

60%~80%數(shù)據(jù)存儲空間,大大節(jié)省硬件存儲成本。C、carbon是一種新型的ApacheHadoop本地文件格式,使用先進(jìn)的列式存儲、索引、壓縮和編碼技術(shù),以提高計算效率,有助于加速超過PB數(shù)量級的數(shù)據(jù)查詢,可用于更快的交互查詢。D、使用carbon的目的是對大數(shù)據(jù)即席查詢提供超快速響應(yīng)。【正確答案】:ABCD31.Flume適用于以下哪些場景的數(shù)據(jù)收集?A、Thrift,Avro,Syslog,Kafka等數(shù)據(jù)源上收集數(shù)據(jù)B、本地文件數(shù)據(jù)采集C、應(yīng)用系統(tǒng)產(chǎn)生的日志采集D、大量數(shù)據(jù)的實時數(shù)據(jù)采集【正確答案】:ABC32.HDFS不適用于以下哪些場景?A、流式數(shù)據(jù)訪問B、大量小文件存儲C、大文件存儲與訪問D、隨機寫入【正確答案】:BD33.在loader歷史作業(yè)記錄中,可以查看以下哪些內(nèi)容?()A、作業(yè)狀態(tài)B、作業(yè)開始/運行時間C、臟數(shù)據(jù)鏈接D、錯誤行/文件數(shù)量【正確答案】:ABCD34.HBase的數(shù)據(jù)文件HFile中一個KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType【正確答案】:ABCD35.HBase的主要特點有哪些?A、高可靠性B、高性能C、面向列D、可伸縮【正確答案】:ABCD36.下列哪些組件必須依賴于Zookeeper才能運行?A、HDFSB、HBaseC、SparkD、YARN【正確答案】:ABD37.下面關(guān)于flink窗口的描述錯誤的是A、滾動窗口在時間上是重疊的B、滾動窗口在時間上是不重疊的C、滑動動窗口之間時間點不存在重疊D、滑動窗口之間時間點存在重疊【正確答案】:AC38.Spark適用于以下哪些場景?()A、圖計算B、互式查詢C、批處理D、實時流處理【正確答案】:ABCD39.Flink可以基于以下哪些窗口進(jìn)行統(tǒng)計?A、時間窗口B、滑動窗口C、會話窗口D、countWindow【正確答案】:ABCD40.FusionlnsightHDV100R002C60版本集群中,以下哪些組件需要規(guī)劃元數(shù)據(jù)分區(qū)?A、HDFSB、ZookeeperC、StreamingD、RedisE、HBaseF、Kafka【正確答案】:ABC41.與開源sqoop相比,loader具有哪些增強特性?A、高可靠性B、高性能C、安全性D、圖形化【正確答案】:ABCD42.Zookeeper中的數(shù)據(jù)節(jié)點znode分為哪幾種類型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正確答案】:BD43.HDFS系統(tǒng)中對備用NameNode的作用的描述正確的有?A、主NameNode的熱備B、備NameNode對內(nèi)存沒有要求C、幫助主NameNode合并編輯日志,減少主NameNode的啟動時間D、備NameNode應(yīng)與主NameNode部署到一個節(jié)點【正確答案】:AC44.在FusionInsightHD中,Flink主要與以下哪些組件進(jìn)行交互A、zookeeperB、HDFSC、KafkaD、Yarn【正確答案】:ABCD45.FusionInsightHD數(shù)據(jù)高可靠性體現(xiàn)在以下哪些方面?()A、跨數(shù)據(jù)中心容災(zāi)B、關(guān)鍵數(shù)據(jù)掉電保護(hù)C、硬盤熱插拔D、第三方備份系統(tǒng)集成【正確答案】:ABCD46.基于Hadop幵源大數(shù)據(jù)平臺主要提供了針對數(shù)據(jù)分布式計算和存儲能力,如下屬于分布式存儲組件的有?A、MRB、SparkC、HDFSD、HBase【正確答案】:CD47.執(zhí)行Hbase數(shù)據(jù)業(yè)務(wù)(題干可能為讀數(shù)據(jù)業(yè)務(wù)),需要讀取哪幾部分?jǐn)?shù)據(jù)()A、HLogB、MenStoreC、HFileD、HMaster【正確答案】:BC48.執(zhí)行HBase數(shù)據(jù)讀取業(yè)務(wù)時,需要讀取哪幾部分?jǐn)?shù)據(jù)?A、HFileB、HLogC、MemStoreD、HMaster【正確答案】:AC49.FusionInsightHD的Loader在創(chuàng)建作業(yè)時,連接器有什么作用?A、確定有哪些轉(zhuǎn)換步驟B、提供優(yōu)化參數(shù),提供數(shù)據(jù)導(dǎo)入導(dǎo)出性能C、配置作業(yè)如何與外部數(shù)據(jù)源進(jìn)行連接D、配置作業(yè)如何與內(nèi)部數(shù)據(jù)源進(jìn)行連接【正確答案】:ABCD50.下列關(guān)于Flink中Transformation的說法正確的是?A、可以通過window設(shè)定時間窗口B、Filtor操作是對每個元素執(zhí)行boolean函數(shù)C、flatMap可以對文本進(jìn)行切分D、eyBy是將源頭數(shù)據(jù)按照key進(jìn)行分組,以保證同一個key的元數(shù)據(jù)分到同樣的組中【正確答案】:ABD51.以下關(guān)于FusionInsightHBase可視化建模說法正確的有?()A、可視化建模幫助DBA進(jìn)行建模設(shè)計,降低HBase的使用門檻B(tài)、QualifierHBase列:每一列代表業(yè)務(wù)數(shù)據(jù)某一屬性C、實現(xiàn)人員分工:DBA關(guān)注數(shù)據(jù)表建模,開發(fā)人員關(guān)注用戶表明和用到的列D、Column用戶表列:每一列代表一個KeyValue【正確答案】:ABC52.FusionlnsightHDLLD配置規(guī)劃工具可以生成哪些配置文件?A、監(jiān)控告警閾值配置文件B、集群的安裝模板文件C、HDFS和YARN的配置文件D、執(zhí)行Precheck所需要的配晉文件CheckNodes.Config【正確答案】:BD53.FusionlnsightHDLoader可以將HDFS數(shù)據(jù)導(dǎo)出到以下哪些目標(biāo)端?A、SFTP服務(wù)器B、FTP服務(wù)器C、Oracle數(shù)據(jù)庫DB2數(shù)據(jù)庫【正確答案】:ABCD54.大數(shù)據(jù)分析相關(guān)技術(shù)主要特征有哪些?A、機器學(xué)習(xí),全量特征B、數(shù)據(jù)背后事件關(guān)聯(lián)性分析C、以海量數(shù)據(jù)為基礎(chǔ)D、以精確樣本為基礎(chǔ)【正確答案】:ABC55.以下關(guān)于FusionInsight網(wǎng)絡(luò)安全可靠性,說法正確的有()A、避免業(yè)務(wù)平面的高負(fù)載阻塞集群管理通道B、網(wǎng)絡(luò)平面隔離,避免管理與業(yè)務(wù)寬帶搶占、互相干擾C、阻止外部攻擊者通過管理通道入侵實際業(yè)務(wù)數(shù)據(jù)D、FusionInsight支持將網(wǎng)絡(luò)劃分為三級:集群業(yè)務(wù)平面、集群管理平面和集群外維護(hù)網(wǎng)絡(luò),彼此之間實施物理隔離【正確答案】:ABCD56.如圖所示,下列哪些選項屬于寬依賴A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正確答案】:AD57.以下哪些選項屬于FusionInsight數(shù)據(jù)安全性?A、操作系統(tǒng)安全加固B、組件數(shù)據(jù)加密C、數(shù)據(jù)完整性校驗D、用戶權(quán)限認(rèn)證管理【正確答案】:BC58.FuskmlnsightHD集群中,集群規(guī)?,F(xiàn)有300個節(jié)點,如果采用推薦部署方案,控制節(jié)點上一定不會存在哪些分區(qū)?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正確答案】:BE59.華為大數(shù)據(jù)產(chǎn)品FusionInsightHD中的Streaming具有哪些關(guān)鍵特性?()A、靈活性B、可伸縮性C、容災(zāi)能力D、消息可靠性【正確答案】:ABCD60.華為FusionInsightHD集群中,Spark服務(wù)可以從以下哪些服務(wù)讀取數(shù)據(jù)?(多選)A、YARNB、HDFSC、HiveD、HBase【正確答案】:BCD61.FusionlnsightHD產(chǎn)品中,關(guān)于Kafka組件說法正確的有?A、刪除Topic時,必須踴保Kafka的服務(wù)配置delete.topic.enable配置為trueB、Kafka安裝及運行曰志保存路徑為/srv/Bigdata/kafkaC、ZooKeeper服務(wù)不可用會導(dǎo)致Kafka服務(wù)不可用D、必須使用admin用戶或者Kafkaadmin組用戶進(jìn)行創(chuàng)建Topic【正確答案】:ACD62.以下關(guān)于HBase存儲模型的描述正確的是?()A、每一個KeyValue都擁有一個Qualifier標(biāo)識B、同一個key值key關(guān)聯(lián)多個valueC、KeyValue中擁有時間戳、類型等關(guān)鍵信息D、即使是key值相同,Qualifier也相同的多個KeyValue,也可能有多個,此時使用時間戳來區(qū)分【正確答案】:ABCD63.傳統(tǒng)數(shù)據(jù)處理的性能瓶頸有?A、數(shù)據(jù)存儲成本高B、流式數(shù)據(jù)處理性能不足C、擴展能力有限D(zhuǎn)、批量數(shù)據(jù)處理缺失【正確答案】:AC64.下列選項中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正確答案】:BCD65.FusionInsightHD平臺中,哪些組件支持對表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正確答案】:BC66.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內(nèi)容()A、目錄B、文件C、塊D、以上全不正確【正確答案】:ABC67.在FusionInsight集群中,Spark主要與以下哪些組件進(jìn)行交互?()A、HiveB、YARNC、HDFSD、Zookeeper【正確答案】:BCD68.FusionlnsightManager會定時備份哪些數(shù)據(jù)?A、NameNodeB、LDAPServerC、OMSDBService【正確答案】:BC69.若在消息處理過程中允許部分信息丟失,關(guān)閉消息可靠性處理機制的方式有以下哪些?A、將參數(shù)Config.Topology_ACKKRS設(shè)置為0B、將參數(shù)Config.Topology_ACKKRS設(shè)置為FalseC、Spout發(fā)送消息時,使用不指定消息messageID的接口進(jìn)行發(fā)送D、Bolt發(fā)送消息時使用Unanchor方式發(fā)送【正確答案】:ACD70.下列屬于flume數(shù)據(jù)監(jiān)控的指標(biāo)是?()A、Source接收數(shù)據(jù)量B、Sink寫入數(shù)據(jù)量C、DataNode數(shù)量D、Channel緩存數(shù)據(jù)量【正確答案】:ABD71.FusionlnsightHD產(chǎn)品在部署Kerberos和LDAP服務(wù)是,以下描述正確的是?(多選)A、部署Kerberos服務(wù)之前,必須先部署LDAP服務(wù)B、LDAP服務(wù)必須和Kerberos服務(wù)部署在同一個節(jié)點C、Kerberos服務(wù)和LDAP服務(wù)部署同一個節(jié)點利于數(shù)據(jù)訪問,有助于性能提升D、LDAP服務(wù)可以多個集群共享【正確答案】:AC72.FusionlnsightHD集群升級,以下描述正確的有?(多選)A、升級過程中不可以手工操作主備OMS倒換B、集群內(nèi)所有主機的root賬戶密碼保持一致C、保持網(wǎng)絡(luò)暢通,避免因網(wǎng)絡(luò)問題導(dǎo)致升級異常D、觀察期不能做壙容【正確答案】:ABCD73.下列選項中,哪些是MapReduce一定會有的過程?A、CombineB、MapC、ReduceD、Partition【正確答案】:BCD74.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令提交了拓?fù)渲?使用StromUI查看發(fā)現(xiàn)該拓?fù)溟L時間沒有處理數(shù)據(jù),可能原因有?()A、Supervisor是在topology中接收數(shù)據(jù)然后執(zhí)行處理的組件B、拓?fù)錁I(yè)務(wù)存在邏輯錯誤,提交之后無法正常運行C、拓?fù)溥^于復(fù)雜或者并發(fā)太大,導(dǎo)致worker啟動時間太長,超過Supervisor的等待時間D、Supervisor的slots資源被耗盡,拓?fù)涮峤簧先ブ蠓植坏絪lot去啟東worker進(jìn)程【正確答案】:BCD75.采用Flume傳輸數(shù)據(jù)過程中,為了防止因Flume進(jìn)程重啟而丟失數(shù)據(jù),可以使用以下哪種Channel類型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正確答案】:BC76.FusionInsightManager界面顯示Hive服務(wù)狀態(tài)為Bad時,可能原因有哪些?A、DBService不可用B、HDFS服務(wù)不可用C、MetaStore實例不可用D、HBase服務(wù)不可用【正確答案】:ABC77.Fusionlnsight系統(tǒng)中Hive支持的存儲格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正確答案】:BCD78.以下關(guān)于華為大數(shù)據(jù)解決方案說法正確的是()A、Farmer是數(shù)據(jù)服務(wù)框架B、GaussDB是一款開源數(shù)據(jù)庫產(chǎn)品C、FusionInsightManager是一個分布式系統(tǒng)管理框架,管理員可以通過多接入點操控分布式集群D、FusionInsightHD是基于開源大數(shù)據(jù)軟件Hadoop的增強版本【正確答案】:ABCD79.YARN通過ResourceManager對集群資源進(jìn)行管理,它的主要功能有?A、集群資源調(diào)度B、應(yīng)用程序管理C、日志管理D、以上說法都不對【正確答案】:AB80.FusionInsightManager與外部管理平臺對接時,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正確答案】:AB81.spark有哪些特點?()A、快B、巧C、靈D、輕【正確答案】:ABCD82.關(guān)于Flume,下列說法錯誤的是?、A、Flume級聯(lián)節(jié)點之間的數(shù)據(jù)傳輸支持加密B、Flume支持多級聯(lián)和多路復(fù)用C、Source到Channel到Sink等進(jìn)程內(nèi)部有加密的必要D、Flume級聯(lián)節(jié)點之間的數(shù)據(jù)傳輸不支持壓縮【正確答案】:CD83.以下關(guān)于Flink與其他組件交互說法正確的是?()A、Flink的checkpoint的實現(xiàn)依賴于ZookeeperB、Flink可以將接收的組件發(fā)生給kafkaC、Flink任務(wù)的運行依賴Yarn來進(jìn)行資源的調(diào)度管理D、Flink在HDFS文件系統(tǒng)中讀寫數(shù)據(jù)【正確答案】:ABCD84.HBase集群定時執(zhí)行Compaction的目的是什么?(ACD)[]A、減少同一個Region同一個ColumnFamily下的文件數(shù)目B、減少同一個Region的文件數(shù)目C、提升數(shù)據(jù)讀取性能D、提升數(shù)據(jù)寫入能力【正確答案】:ACD85.以下哪些是Kafka實際的應(yīng)用場景A、日志收集B、網(wǎng)站活性跟蹤C、資源管理D、聚合統(tǒng)計系統(tǒng)運營數(shù)據(jù)【正確答案】:BD86.某高校的FusionlnsightHD集群中有230個節(jié)點,在進(jìn)行集群規(guī)劃時,下列哪些進(jìn)程應(yīng)該部署在數(shù)據(jù)節(jié)點上?A、DataNodeB、NameNodeC、NodeManagerD、RegionServerE、DBServerF、SoIrServer【正確答案】:ACDF87.以下關(guān)于KafkaPartition說法正確的有A、引入Partition機制,保證了Kafka的高吞吐能力B、每個Partition都是有序且不可變的消息隊列C、Partition數(shù)量決定了每個consumergroup中并發(fā)消費者的最大數(shù)量D、每個Partition在存儲層面對應(yīng)一個log文件【正確答案】:ABCD88.以下關(guān)于HBase的文件存儲模塊(HBaseFileStream,簡稱HFS)描述正確的有?A、應(yīng)用在FusionInsightHD的上層應(yīng)用B、HFS封裝了HBase與HDFS的接口C、為上層應(yīng)用提供文件的存儲.讀取.刪除等功能D、HFS是HBase的獨立模塊【正確答案】:ABCD89.華為FusionInsightHD行業(yè)成功案例都有哪些?A、數(shù)字政府B、智慧園區(qū)C、智慧交通D、金融【正確答案】:ABCD90.YARN中,“從”節(jié)點負(fù)責(zé)以下哪些工作?()A、集群中所有資源的統(tǒng)一管理和分配B、監(jiān)督Container的生命周期管理C、管理日志和不同應(yīng)用程序用到的附屬服務(wù)D、監(jiān)控每個Container的資源使用(內(nèi)存,CPU等)情況【正確答案】:BD91.在FusionInsight產(chǎn)品中,關(guān)于Kafka組件說法正確的是?A、在創(chuàng)建Topic時,副本數(shù)不得大于當(dāng)前存活的Broker實例個數(shù),否則創(chuàng)建Topic將會失敗B、Kafka的Producer發(fā)送消息時,可以指定該消息被哪個Consumer消費C、Kafka會將元數(shù)據(jù)信息存放到Zookeeper上D、Kafka安裝完成后就不能再配置數(shù)據(jù)存放目錄【正確答案】:ABCD92.根據(jù)數(shù)據(jù)流如何在兩個Transformation之間傳輸數(shù)據(jù),數(shù)據(jù)流可以分為哪些類型?

A、redistributing流B、一對一流C、一對多流D、distributing流【正確答案】:BC93.調(diào)用Zookeeper客戶端命令中包含哪些信息?A、端口號B、ip地址C、服務(wù)器名稱D、用戶名【正確答案】:AB94.NodeManager的內(nèi)存和CPU的數(shù)量,是通過下列哪些選項進(jìn)行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正確答案】:BCD95.Loader可以實現(xiàn)以下哪些轉(zhuǎn)換規(guī)則()A、空值轉(zhuǎn)換B、拼接轉(zhuǎn)換C、長整型時間轉(zhuǎn)換D、增量轉(zhuǎn)換【正確答案】:ABCD96.FusionInsightHD集群中包含了很多種服務(wù),每種服務(wù)又由若干角色組成,下面哪些是服務(wù)的角色?()【正確答案】:AA、HDFSB、NameNodeC、DataNodeD、Hbase【正確答案】:BC97.Zookeeper可以為FusionInsightHD中哪些組件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正確答案】:ABCD98.fusininsightHD平臺中,那些組件支持對列表加密?A、HDFSB、FlinkC、hbaseD、hive【正確答案】:CD99.HBase中以下哪種場景會出發(fā)Flush操作?A、HBase定期刷新Memstore,默認(rèn)周期為1小時B、當(dāng)WALs中文件數(shù)量達(dá)到閾值時C、Region中MemStore的總大小,達(dá)到了預(yù)設(shè)的FlushSize閾值D、MemStore占用內(nèi)存的總量和RegionServer總內(nèi)存比值超出了預(yù)設(shè)的閾值大小【正確答案】:ABCD100.kafka消息傳輸保障通常有以下哪幾種?()A、最多三次(AtMostThreeTimes)B、僅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正確答案】:BCD101.以下關(guān)于KafkaLogs中segmentfile的說法正確的有?A、index元數(shù)據(jù)全部映射到menory,可以避免sementfile的index數(shù)據(jù)IO磁盤操作B、索引文件稀疏存儲,可以大幅減低index文件元數(shù)據(jù)占用空間大小C、稀疏存儲,即將原來的完整數(shù)據(jù),只間隔的選擇多條進(jìn)行存儲D、通過索引信息可以快速定位message【正確答案】:ABCD102.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、數(shù)據(jù)集成C、系統(tǒng)管理D、服務(wù)治理【正確答案】:AC103.關(guān)于大數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論