




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第頁大數據HCIA復習試題及答案1.Flume數據采集過程中,下列選項中能對數據進行過濾和修飾的是()A、ChannelB、ChannelSelectorC、InterceptorD、Sink【正確答案】:C2.在FusionInsight產品中,關于創(chuàng)建Kafka的Topic,以下哪些描述是正確的?A、在創(chuàng)建Kafka的Topic時,必須設置Partition個數B、創(chuàng)建Kafka的Topic時,必須設置Partition副本個數C、設置多副本可以增強Kafka服務的容災能力D、以上全都正確【正確答案】:C3.下面關于Zookeeper的特性描述錯誤的是?A、戶端所發(fā)送的更新會按照他們被發(fā)送的順序進行應用B、條消息要被超過半數的Server接收,他將可以成功寫入磁盤C、消息更新只能成功或失敗,沒有中間狀態(tài)D、Zookeeper節(jié)點數必須為奇數個【正確答案】:D4.SparkStreaming計算基于DStream,將流式計算分解成一系列短小的批處理作業(yè)。()A、TRUEB、FALSE【正確答案】:A5.部署FusionInsightHD時,同一集群內的FlumeServer節(jié)點建議至少部署幾個?A、1B、2C、3D、4【正確答案】:B6.kafkalogssegment文件命名規(guī)則是partion全局的第一個segment從0開始,后續(xù)每個segment文件名為上一個全局partion的最大offset(偏移message數)。
()A、TRUEB、FALSE【正確答案】:A7.FusionlnsightHadoop集群中,在某節(jié)點上通過df-hT查詢,看到的分區(qū)包含以下幾個:
/var/log
/srv/BigData
/srv/BigData/hadoop/data5
/srv/BigData/solr/solrserver3
/srv/BigData/dbdataom
這些分區(qū)所對應磁盤最佳Raid級別的規(guī)劃組合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1【正確答案】:B8.FusionInsightHD中使用HBase進行數據讀取服務時需要連接HMasterA、對B、錯【正確答案】:B9.對高價值高度聚合的信息和知識的批次處理是大數據行業(yè)主要商業(yè)訴求A、trueB、false【正確答案】:A10.下圖所示的Map階段,是描述哪個過程?
A、PartitionB、SortC、Splill/MergeD、combine【正確答案】:D11.FusionInsightHD集群三層組網時,管理節(jié)點、控制節(jié)點、數據節(jié)點建議安裝在不同的網段內,可以提高可靠性。A、正確B、錯誤【正確答案】:A12.以下關于ZooKeeper關鍵特性中的原子性說法正確的是A、客戶端發(fā)送的更新會按照他們被發(fā)送的順序進行應用B、更新只能全部完成或失敗,不會部分完成C、一條消息被一個server接收,將被所有server接收D、集群中無論哪臺服務器,對外展示的均是同一視圖【正確答案】:B13.Yarn-client和Yarn-cluster主要區(qū)別是ApplicationMaster進程的區(qū)別()A、TRUEB、FALSE【正確答案】:A14.kafka是一個高吞吐、分布式、基于發(fā)布訂閱的消息系統(tǒng),利用kafka技術可在廉價PCServer上搭建起大規(guī)模消息系統(tǒng)。()A、TRUEB、FALSE【正確答案】:A15.在FusionInsight產品中,關于KafkaTopic,以下描述不正確的有?A、每個Topic只能被分成一個partition(區(qū))B、Topic的partition數量可以在創(chuàng)建時配置C、每個Partition的存儲層面對應一個log文件,log文件中記錄了所有的信息數據D、每條發(fā)布到Kafka的消息都有一個類別,這個類別被稱為Topic,也可以理解為一個存儲消息的隊列【正確答案】:A16.FusionlnsightHD中Loader實例必須與哪個實例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager【正確答案】:D17.SparkSQL表中,經常會存在很多小文件(大小遠小于HDFS塊大小),在這種情況下,Spark會啟動更多的Task來處理這些小文件,當SQL邏輯中存在Shuffle操作時,會大大增加hash分桶數,從而嚴重影響性能。A、對B、錯【正確答案】:B18.FusionlnsightHD使用HBase客戶端批量寫入10條數據,某個RegionServer節(jié)點上包含該表的2個Region,分別A和
B,10條數據中有兩條屬于
A,4條屬于
B,請問寫入這10條數據需要向該RegionServer發(fā)送幾次RPC請求?A、1B、2C、3D、4【正確答案】:A19.在FusionInsightHD中,創(chuàng)建Loader作業(yè)的進行數據轉換的正確步驟是()A、加載、轉換、輸出B、輸入設置、轉換、輸出C、加載、轉化、抽取D、抽取、轉換、輸出【正確答案】:B20.Kafka所有消息都會被持久化到硬盤中,同時Kafka通過對TopicPartition設置Replicetion來保障數據可靠。A、TRUEB、FALSE【正確答案】:A21.哪個模塊是負責FusionInsightManager用戶數據存儲的?A、CASB、AOS
C、KerberosD、LDAP
【正確答案】:D22.Solr創(chuàng)建Collection時,推薦選用路由算法為compositldRouter,那么該Collection可以拓展shard。A、正確B、錯誤【正確答案】:B23.Hadoop系統(tǒng)中,如果HDFS文件系統(tǒng)的備份因子是3,那么MapReduce每次運行Task都要從3個有副本的機器上傳輸需要處理的文件段。A、對B、錯【正確答案】:B24.FuskmlnsightHD集群規(guī)劃中,管理節(jié)點&控制節(jié)點&數據節(jié)點合一部署方案適合什么樣的場景?A、30節(jié)點以下B、100節(jié)點以上C、100-200節(jié)點D、200節(jié)點以上【正確答案】:A25.HDFS支持大文件存儲,同時支持多個用戶對同一個文件的寫操作,以及在文件任意位置進行修改。A、正確B、錯誤【正確答案】:B26.FusionInsightHD中Loader作業(yè)提交到YARN后,作業(yè)不能手動停止。A、對B、錯【正確答案】:B27.傳統(tǒng)數據處理的數據規(guī)模的單位是?A、TBB、EBC、PBD、GB【正確答案】:D28.以下關于HiveSQL基本操作描述正確的是()A、加載數據到Hive時源數據必須是HDFS的一個路徑B、創(chuàng)建外部表必須要指定location信息C、創(chuàng)建表時可以指定列分隔符D、創(chuàng)建外部表使用external關鍵字。創(chuàng)建普通表需要指定internal關鍵字【正確答案】:C29.如果YARN集群中只有Default、QueueA和QueueB子隊列,那么允許將他們的容量分別設置為60%、25%、22%。A、對B、錯【正確答案】:B30.FusionInsightHD平臺中,HBase暫不支持二級索引A、對B、錯【正確答案】:B31.下列哪個不是HBase讀取數據流程中涉及的角色或服務?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer【正確答案】:C32.HBase的最小處理單元是Region,UserRegion和RegionServer之間的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正確答案】:A33.查看Kafka的某Topic的partition詳細信息時,使用如下哪個命令?A、bin/kafka-topic.sh–createB、bin/kafka-topic.sh--listC、bin/kafka-topic.sh--describeD、bin/kafka-topic.sh--delete【正確答案】:C34.Zookeeper在分布式應用中的主要作用不包括一下哪些選項?A、選舉Master節(jié)點B、保證各節(jié)點上數據的一致性C、分配集群資源D、存儲及群中服務器信息【正確答案】:C35.FusionInsight集群組網設計中,二層組網指集群內二層交換,集群節(jié)點在一個子網里,適用節(jié)點小于200的集群場景。A、正確B、錯誤【正確答案】:A36.Flume傳輸數據的過程中,Sink取走數據并寫入目的地后,會將events從channel中刪除。A、對B、錯【正確答案】:A37.FusionInsightManager用戶權限管理不支持哪個配置?A、給用戶配置角色B、給角色配置權限C、給用戶組配置角色D、給用戶組配置權限【正確答案】:D38.關于FusionlnsightHD中Loader作業(yè)描述正確的是?A、Loader將作業(yè)提交到Yam執(zhí)行后,如果此時Loader服務異常,則此作業(yè)執(zhí)行失敗。B、Loader將作業(yè)提交到Yam執(zhí)行后,如果某個Mapper任務執(zhí)行失敗,能夠自動進行重試C、Loadet作業(yè)執(zhí)行失敗后將會產生垃壩數據,需要用戶手動清除D、Loader將一個作業(yè)提交至Yam執(zhí)行后,該作業(yè)執(zhí)行完成前,不能再提交其他作業(yè)【正確答案】:B39.FusionlnsightHD系統(tǒng)中HDFS的Block默認保存幾份?A、3份B、2份C、1份D、不確定【正確答案】:A40.驅動型Source是flume周期性主動去獲取數據。()A、TRUEB、FALSE【正確答案】:B41.以下哪類數據不屬于半結構化數據?A、HTMLB、XMLC、二維表D、JSON【正確答案】:C42.Kafka作為一個分布式消息系統(tǒng),支持在線和離線消息處理,并提供了javaAPI以便其他組件對接使用,在FusionInsight解決方案中,Kafka屬于FusionInsightHD模塊。A、TrueB、False【正確答案】:A43.FusionInsightHD中l(wèi)oader從SFTP服務器導入文件時,不需要做編碼轉換和數據轉換且速度最快的文件類型是以下哪項?()A、sequence_fileB、text_fileC、binary_fileD、graph_file【正確答案】:C44.FusionInsightHD系統(tǒng)審計日志不可以記錄下面哪些操作()A、刪除服務實例B、啟停服務實例C、手動清除告警D、查詢歷史監(jiān)控【正確答案】:D45.Flink與SparkStreaming類似,屬于事件驅動型實時流系統(tǒng)A、對B、錯【正確答案】:B46.Hadoop平臺中,要查看YARN服務中一個application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正確答案】:D47.HBase的主Master是如何選舉的?A、隨機選取B、由RegionServer進行裁決C、通過Zookeeper進行裁決D、HMaster為雙主模式,不需要進行裁決【正確答案】:C48.FusionInsightHD系統(tǒng)中,HBase支持動態(tài)擴展列。()A、TRUEB、FALSE【正確答案】:A49.關于FusionInsightHD安裝流程正確的是?A、安裝Manager->執(zhí)行preinstall->LLD工具進行配置->安裝集群->安裝后檢查->安裝后配置B、LLD工具進行配置->執(zhí)行preinstall->安裝Manager->安裝集群->安裝后檢查->安裝后配置C、安裝Manager->LLD工具進行配置->執(zhí)行preinstall->安裝集群->安裝后檢查->安裝后配置D、LLD工具進行配置->執(zhí)行preinstall->安裝集群->安裝Manager->安裝后檢查->安裝后配置【正確答案】:B50.Hive是基于hadoop的數據倉庫軟件,可以查詢和管理PB級別的分布式數據。以下關于Hive特性的描述不正確的是?()A、僅支持MapReduce計算引擎B、易用易編程C、可直接訪問HDFS文件以及HBaseD、靈活方便的ETL(extract/transform/load)【正確答案】:A51.Spark任務的每個stage可劃分為job,劃分的標記是shuffle。A、正確B、錯誤【正確答案】:B52.kafkaProducer讀數據總體流程是,Producer連接任意存活的Broker,請求指定topic、partition的leader元數據信息,然后直接與對應的Broker直接連接,發(fā)布數據。()A、TRUEB、FALSE【正確答案】:A53.sparkStreaming容錯機制是指RDD中任意的partition出錯,都可以根據其父
RDD重新計算生成,如果父RDD丟失,則需要去磁盤中查找原始數據。()A、TRUEB、FALSE【正確答案】:B54.下列哪個命令是刪除文件的?()A、dfs-clearB、dfs-delC、dfs-rmD、dfs-ls【正確答案】:C55.關于Hive建表的基本操作,描述正確的是?A、創(chuàng)建外部表的時需要指定external關鍵字B、一旦表創(chuàng)建好,不可再修改表名C、一旦表創(chuàng)建好,不可再修改列名D、一旦表創(chuàng)建好,不可再增加新列【正確答案】:A56.以下關于HBase二級索引的描述哪一項是正確的()A、二級索引把要查找的列與rowkey關聯(lián)成一個索引表B、此時列成新的rowkey,原rowkey成為valueC、二級索引查詢了2次D、以上全都正確【正確答案】:D57.下圖為Spark&MapReduce的性能對比數據,可以得出結論,與MapReduce計算相比,Spark用___的資源,獲得___倍性能?A、1/8,3B、1/10,3C、1/10,4D、1/8,4【正確答案】:B58.FusionInsightHD產品中,一個典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一個Zookeeper集群A、TrueB、False【正確答案】:A59.下面哪些場景不是Flink組件擅長的?()A、批處理B、迭代計算C、數據存儲D、流處理【正確答案】:C60.華為FusionInsightHD系統(tǒng)中關于HDFS的DataNode的說法正確的是?A、不會檢查數據的有效性B、周期性地將本節(jié)點的Block相關信息發(fā)送給NameNodeC、不同的DataNode存儲的Block一定是不同的D、一個DataNode上的Block可以是相同的【正確答案】:B61.Kafka是一個分布式的消息發(fā)布訂閱系統(tǒng),它只是進行消息的轉發(fā),不會保存消息。A、對B、錯【正確答案】:B62.fusioninsightmanager不能夠管理哪個對象?A、sparkB、主機OSC、yarnD、HDFS【正確答案】:B63.topology在任務完成后會自動結束運行。()A、TRUEB、FALSE【正確答案】:B64.在有N個節(jié)點FusionInsightHD集群中部署HBase時,推薦部署()個HMaster進程,()個
RegionServer進程A、3,NB、N,NC、2,ND、2,2【正確答案】:C65.HDFS的Client寫入文件時,數據的第一副本寫入位置由NameNode確定,其他副本的寫入位置由DataNode確定。A、對B、錯【正確答案】:A66.FusionlnsightHD中,如果需要查看當前登錄HBase的用戶和權限組,可以在HBaseshell中執(zhí)行什么命令?A、use_permissionB、whoamiC、whoD、get_user【正確答案】:B67.FusionInsightSparkSQL同社區(qū)SparkJDBCServer一樣,只支持單租戶綁定到一個YARN資源隊列多租戶,并不支持多租戶并行執(zhí)行。A、TRUEB、FALSE【正確答案】:B68.Zookeeper的scheme認證方式不包含以下哪項?()A、saslB、authC、digestD、world【正確答案】:A69.如果某些Container的物理內存利用超過了配置的內存閾值,但所有Container的總內存利用率并沒有超過設置的NodeManager內存閾值,那么內存使用過多的Container仍可以繼續(xù)運行。()A、TRUEB、FALSE【正確答案】:A70.kafka集群在運行期間,直接依賴于下面那些組件?()A、ZookeeperB、HDFSC、SparkD、HBase【正確答案】:A71.Flink采用checkpoint機制保障應用程序運行中的容錯性。A、TRUEB、FALSE【正確答案】:A72.HDFS中Namenode的主備仲裁,是由哪個組件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController【正確答案】:D73.在Streaming中,消息可靠性級別中精確一次是通過ACK機制來實現的。A、TRUEB、FALSE【正確答案】:B74.FusionInsightHD系統(tǒng)中,下面哪個方法不能查看到Loader作業(yè)執(zhí)行的結果?A、通過Yarn任務管理查看B、通過LoaderUI界面查看C、通過Mangaer的告警查看D、通過NodeManager查看【正確答案】:D75.KafkaClusterMirroring工具可以實現以下哪項功能?A、Kafka跨集群數據同步方式B、Kafka單集群內數據備份C、Kafka單集群內數據恢復D、以上全不正確【正確答案】:A76.HDFS的NameNode節(jié)點主備狀態(tài)管理及元數據文件合并分別由哪兩個角色負責?A、ZKFC和備NameNodeB、主NameNode和備NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode【正確答案】:A77.Hadoop的HBase不適合哪些數據類型的應用場景?A、大文件應用場景B、海量數據應用場景C、高吞吐率應用場景D、半結構化數據應用場景【正確答案】:A78.以下哪個不屬于Hadoop中MapReduce組件的特點?A、易于編程B、良好的拓展性C、實時計算D、高容錯性【正確答案】:C79.FusionlnsightManager對服務的管理操作,下面說法錯誤的是?A、可對服務進行啟停重啟操作B、可以添加和卸載服務C、可設置不常用的服務隱藏或顯示D、可查看服務的當前狀態(tài)【正確答案】:C80.硬件故障被認為是常態(tài),為了解決這個問題,HDFS設計了副本機制。默認情況下,一份文件,HDFS會存()份?A、2B、4C、3D、5【正確答案】:C81.在Flink中,checkpoint機制能夠保證應用在運行過程中出現失敗時,從某一個檢查點恢復,在此過程中,流快照是根據數據流入順序依次創(chuàng)建的。A、TrueB、False【正確答案】:A82.HBase中MOB數據直接HFile的格式存儲在HDFS上,然后把這個文件的地址信息及大小信息作為value存儲在管理HBase的store上,通過工具集中管理這些文件。這樣就可以大大降低HBase的compation和split頻率,提升性能。A、TRUEB、FALSE【正確答案】:A83.HBase中Region的物理存儲單元是什么A、RegionB、ColumnFamilyColumnD、Row【正確答案】:B84.Spark和Hadoop都不適用于迭代計算的場景。A、對B、錯【正確答案】:B85.Hadoop系統(tǒng)中YARN分配給Container的內存大小,可以通過參數yarn.app.mapreduce.am.resource.mb來設置A、對B、錯【正確答案】:B86.YRAN的基于標簽調度,是對下列選項中的哪個進行標簽化?APPMasterB、ResourceManagerContainerD、NodeManager【正確答案】:D87.SoIrCloud模式是集群模式,在此模式下Solr服務器強依賴于以下哪個服務?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正確答案】:C88.Hive中“Groupby”指的是通過一定的規(guī)則將每一個數據集劃分成若干個小的數據集,然后針對若干個小的數據集進行數據分組處理A、TrueB、False【正確答案】:A89.用戶權限管理基于角色的訪問控制(RBAC),提供可視化的多組統(tǒng)一的集群中用戶權限管理。A、trueB、false【正確答案】:A90.Hive在load時是不檢查數據是否符合schema的,hive遵循的是schemaonread(讀時模式),只有在讀的時候hive才檢查、解析具體的數據字段、schema。
()A、TRUEB、FALSE【正確答案】:A91.Flink適用于高并發(fā)處理數據、毫秒級時延的應用A、TrueB、False【正確答案】:A92.KafkaClusterMirroring工具可以實現以下哪些功能?A、Kafka跨集群數據同步方案B、Kafka單集群內數據備份C、Kafka但集群內數據恢復D、以上全不正確【正確答案】:A93.以下哪一項不屬于創(chuàng)建Loader作業(yè)時必選項?A、名稱B、連接C、類型D、優(yōu)先級【正確答案】:D94.FusionInsightManager對服務的配置功能說法不正確的是?A、服務級別的配置可對所有實例生效B、實例級別的配置只針對本實例生效C、實例級別的配置對其他實例也生效D、配置保存好需要重啟服務才能生效【正確答案】:C95.安裝FusionInsightHD的Streaming組件時,Nimbus角色要求安裝幾個節(jié)點A、3B、2C、4D、1【正確答案】:B96.Spark是以下哪種編程語言實現的?A、CB、C++C、JAVAD、Scala【正確答案】:D97.
FusionInsightHD的Streaming對于Zookeeper弱依賴,即使Zookeeper故障,Streaming可以正常提供服務。A、對B、錯【正確答案】:B98.關于RDD,下列說法錯誤的是?A、RDD具有血統(tǒng)機制(Lineage)B、RDD默認存儲在磁盤C、RDD是一個只讀的,可分區(qū)的分布式數據集D、RDD是Spark對基礎數據的抽象【正確答案】:B99.Hadoop的NameNode用于存儲文件系統(tǒng)的元數據。A、正確B、錯誤【正確答案】:A100.下列哪個命令是從HDFS下載目錄/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put【正確答案】:C101.使用Hbase客戶端批量寫入10條數據,某個HRegionServer節(jié)點上包含該表的2個Region,分別為A和B,10條數據中有6條屬于
A,4條屬于
B,請問寫入這10條數據需要向該HRegionServer發(fā)送幾次RPC請求?A、2B、1C、6D、10【正確答案】:B102.安裝FusionInsightHD的Streaming組件時,Nimbus角色要求安裝幾個節(jié)點()A、3B、2C、1D、4【正確答案】:B103.Flink是一個批處理和流處理結合的統(tǒng)一計算框架,其核心是一個數據分發(fā)以及并行化計算的流數據處理引擎。A、對B、錯【正確答案】:A104.Zookeeper的scheme認證方式不包括以下哪項?()A、authB、saslC、digestD、world【正確答案】:B105.flume架構中,一個Source可以連接多個channel。()A、TRUEB、FALSE【正確答案】:A106.spark的核心模塊是?A、sparkstreamingB、sparkcoreC、mapreduceD、sparksql【正確答案】:B107.SparkonYarn-client適合用于生產環(huán)境是因為可以更快的看到APP的輸出。A、TRUEB、FALSE【正確答案】:B108.Hadoop中哪個模塊負責HDFS的數據存儲?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker【正確答案】:B109.在Flink技術架構中,()是流處理和批處理的計算引擎A、Standalone
B、RuntimeC、DataStreamD、FlinkCore
【正確答案】:B110.在Flink的運行流程中,負責申請資源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正確答案】:B111.關于FusionInsightHDStreaming的Supervisor描述正確的是?A、Supervisor負責資源的分配和任務的調度B、Supervisor負責接受Nimbus分配的任務,啟動停止屬于自己管理的Worker進程C、Supervisor是運行具體處理邏輯的進程D、Supervisor是在Topology中接收數據然后執(zhí)行處理的組件?!菊_答案】:B112.下列選項中,關于Zookeeper可靠性含義說法正確的是?()A、可靠性通過主備部署莫屬實現B、可靠性是指更新只能成功或者失敗,沒有中間狀態(tài)C、可靠性是指無論哪個Server。對外展示的均是同一個視圖D、可靠性是指一條消息被一個Server接收,它將被所有Server接受【正確答案】:D113.SparkOnYarn模式下的driver只能運行在客戶端。A、對B、錯【正確答案】:B114.以下關于Flink關鍵特性描述不正確的是?A、SparkStreaming與Flink相比,時延更低B、Flink流式處理引擎能夠同時提供支持流處理和批處理應用的功能C、與FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint實現了Flink的容錯【正確答案】:A115.YARN上有兩個同級隊列Q1與Q2,容量都是50%,Q1上已經有10個任務共占用了40的容量,Q2上有兩個任務共占用了30的容量,那么由于Q1的任務數多,調度器會優(yōu)先將資源分配給Q1。A、對B、錯【正確答案】:B116.以下哪些選項屬于FusionInsightSparkSQL的優(yōu)點?A、支持數據插入、更新和刪除B、長穩(wěn)測試C、以上全都正確D、穩(wěn)定和高性能SQL兼容性【正確答案】:C117.當Zookeeper集群的節(jié)點數為5節(jié)點時,請問集群的容災能力和多少節(jié)點是等價的?A、3B、4C、6D、以上都不是【正確答案】:C118.二級索引為hbase提供了按照某些列的值進行索引的能力,二級索引先查索引表,再定位到數據表中的位置,不用全表掃描A、trueB、false【正確答案】:A119.Streaming主要通過Zookeeper提供的以下哪項服務實現事件偵聽?()A、分布式鎖機制B、ACKC、WatcherD、Checkpoint【正確答案】:C120.假設HDFS在寫入數據時只存2份,那么在寫入過程中,HDFSClient先將數據寫入DataNode1,再將數據寫入DataNode2。()A、TRUEB、FALSE【正確答案】:B121.ApplicationMaster采用輪詢的方式通過RPC協(xié)議向ResourceManager申請和領取資源。A、TRUEB、FALSE【正確答案】:A122.flume傳輸數據的可靠性是指flume在傳輸數據過程中,當下一跳的flume節(jié)點故障或者數據接收異常時,可以自動切換到另外一路上繼續(xù)傳輸。()A、TRUEB、FALSE【正確答案】:A123.Spark應用在運行時,Stage劃分的依據是什么?A、taskB、taskSetC、actionD、shuffle【正確答案】:D124.下圖為HDFS分級存儲的配置,如果block的副本數為4,則以下說法錯誤的是?()A、4個block都將寫入RAM_DISKB、如果是第1個副本之外的其它副本寫入失敗,則嘗試寫入“副本的備選存儲策略”指定的存儲類型C、第1個block副本將寫入RAM_DISK,其余副本寫入DISKD、如果第1個block副本寫入RAM_DISK失敗,則嘗試寫入“備選存儲策略”指定的存儲類型【正確答案】:A125.以下關于Hbase中HregionServer的功能描述哪些是不正確的A、RegionServer一般與HDFS集群的NameNode部署在一起,實現數據的存儲功能B、Hbase的數據處理和計算單元C、RegionServer是Hbase的數據服務進程,負責處理用戶數據的讀寫請求D、管理所有的Region,Region可以在RegionServer之間遷移【正確答案】:B126.FusionlnsightHD系統(tǒng)中,LDAP數據同步方式是哪個?A、單向同步B、雙向同步C、隔離不同步D、數據交叉同步【正確答案】:A127.SparkStreaming相比Storm具備更高的實時性。A、對B、錯【正確答案】:B128.kafkaConsumer寫數據總體流程是,Consumer連接指定TopicPartition所在的LeaderBroker,用于主動獲取方式從kafka中獲取消息。()A、TRUEB、FALSE【正確答案】:A129.hive支持普通視圖和物化視圖。()A、TRUEB、FALSE【正確答案】:B130.colocation(同分布)文件級的同分布實現文件的快速訪問,避免了因數據搬遷帶來的大量網絡開銷。()A、TRUEB、FALSE【正確答案】:A131.HBase的BloomFilter是用來過濾數據的。()A、TRUEB、FALSE【正確答案】:B132.FusionInsightHD產品中,關于Kafka的說法不正確的是?A、Kafka強依賴于ZookeeperB、Kafka部署的實例個數不得小于2C、Kafka的服務端可以產生消息D、Consumer作為Kafka的客戶端角色進行消息的消費【正確答案】:B133.FusionInsightHD管理節(jié)點提供雙機HA機制,主節(jié)點故障后,主備節(jié)點需要手動實現Failover。A、正確B、錯誤【正確答案】:B134.HDFS中的主備仲裁,是由哪個組件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正確答案】:A135.下圖展示的flume架構,主要應用于集群外的數據導入到集群內。()A、TRUEB、FALSE【正確答案】:A136.關于Hive與Hadoop其他組件的關系。以下描述錯誤的是?A、Hive最終將數據存儲在HDFS中B、Hive是Hadoop平臺的數據倉庫工具C、HQL可以通過MapReduce執(zhí)行任務D、Hive對HBase有強依賴【正確答案】:D137.Spark自帶的資源管理框架是?A、StandaloneB、MesosC、YARNDocker【正確答案】:B138.Hadoop中MapReduce組件擅長處理哪種場景的計算任務?A、迭代計算B、離線計算C、實時交互計算D、流式計算【正確答案】:B139.下面關于Zookeeper特性的描述錯誤的是?()A、Zookeeper節(jié)點數必須為奇數個。B、客戶端所發(fā)送的更新會按照它們被發(fā)送的順序進行應用。C、消息更新只能成功或者失敗,沒有中間狀態(tài)。D、一條消息要被超過半數的Server接收,它將可以成功寫入磁盤【正確答案】:A140.Spark是基于內存的計算引擎,所有Spark程序運行過程中的數據只能存儲在內存中A、對B、錯【正確答案】:B141.在MapReduce編程中,代碼不僅要描述做什么,還要描述具體怎么做。()A、TRUEB、FALSE【正確答案】:B142.FusionInsight中Hive包含2個角色,HiveServer和MetaStore.A、TRUEB、FALSE【正確答案】:A143.關于Hive在FusionlnsightHD中的架構描述錯誤的是?A、只要有一個HiveServer不可用,整個Hive集群便不可用B、HiveServer負責接受客戶端請求、解析、執(zhí)行HQL命令并返回查詢結果C、MetaStore用于提供原數據服務,依賴于DBServerD、在同一時間點HiveServeir只有一個處于Active狀態(tài),另一個則處于Standby狀態(tài)【正確答案】:A144.YARN中默認的資源調度器是?()A、FIFO調度器B、容量調度器C、Fair調度器D、以上全不正確【正確答案】:B145.以下關于Zookeeper的Leader節(jié)點在收到數據變更請求后的讀寫流程說法正確的是?A、同時寫入磁盤和內存B、先寫磁盤再寫內存C、僅寫入內存D、先寫內存再寫磁盤【正確答案】:B146.Flume的perties配置文件中可以配置多個Channel來傳輸數據?A、TRUEB、FALSE【正確答案】:A147.Kafka中partitionreplication之間同步數據,從partition的leader復制數據到follower需要線程
(replicationFetcherThread),Follower(一個follower相當于consumer)主動從leader批量拉取消息的,這極大提高了吞吐量。A、TrueB、False【正確答案】:A148.Flume用于收集數據,其傳輸的數據基本單位是?A、SplitBlockC、EventD、Packet【正確答案】:C149.FusionInsightHD的HBase中保存一張用戶信息表meg_table,Rowkey為用戶id,其中一列為用戶昵稱,現在按先后順序往這列寫入三個KeyValue:001:Li,001:Mary,001:Lily,請問scan’meg_table’,(VERSION=>2)會返回哪幾條數據?()A、001:LilyB、1:LiC、1:Mary,001:LilyD、001:Li,001:Mary,001:Lily【正確答案】:A150.某銀行規(guī)劃的FusionlnsightHD集群有90個節(jié)點,如果控制節(jié)點規(guī)劃了3個,那集群中數據節(jié)點推薦規(guī)劃()個。A、87B、85C、90D、86【正確答案】:B1.HBase集群定時執(zhí)行Compaction的目的是什么?A、減少同一Region,同一ColumnFamily下的文件數目B、提升數據讀取性能C、減少同一ColumnFamily的文件數據D、減少同一Region的文件數目【正確答案】:ABD2.FusionInsightHD安裝前準備,包括哪些步驟?(多選)A、完成硬件安裝B、完成節(jié)點主機操作系統(tǒng)安裝C、準備工具和軟件。例如Putty、LLD、FusionInsightHD軟件安裝包等D、準備規(guī)劃數據,例如網絡參數和角色部署位置【正確答案】:ABCD3.Hadoop集群規(guī)模很大時,數據的分布情況會非常關鍵,用戶需要根據數據分布情況,決定集群是否擴容,數據是否需要做均衡等。以下關于FusionInsight資源分布監(jiān)控說法正確的有()A、幫助用戶迅速找到資源消耗最高的節(jié)點,采用適當的措施B、通過每個服務主頁的資源分布查看界面,查看到關鍵的資源分布情況C、可以幫助用戶快速聚集在最關鍵的資源消耗上D、通過DashBoard界面,可以查看到主機資源分布情況。例如內存占有率在50-75%的主機列表,并提供鏈接跳轉【正確答案】:ABCD4.下列關于worker(工作進程)、Executor(線程)、task(任務)說法正確的是?()A、每個Executor(線程)可以運行多個task(任務)B、每個Executor(線程)可以運行不同組件(spout或bolt)的task(任務)C、每個worker可以運行多個Executor(線程)D、每個worker只能為一個拓撲運行Executor(線程)【正確答案】:ABCD5.以下屬于hiveSQL中DDL(數據定義語言)的是?()A、修改表B、刪除表C、建表D、數據導入【正確答案】:ABC6.Hadoop的HDFS是一種分布式文件系統(tǒng),適合以下哪種應用場景的數據存儲和管理?A、大量小文件存儲B、高容錯、高吞吐量C、低延遲讀取D、流式數據訪問【正確答案】:BD7.FusionInsightHD的HBase服務包含哪些進程?A、HMasterB、SlaveC、HRegionServerDataNode【正確答案】:AC8.FusionlnsightHD支持哪些日志下載方式?A、下載已安裝組件的所有組件的曰志B、下載單個組件某個模塊的曰志C、下載指定主機的曰志D、下載指定時間段的曰志【正確答案】:ABCD9.以下哪些數據源可以通過loader實現與FusionInsightHD的數據交換?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正確答案】:ABCD10.以下關于FusionInsight多租戶管理的描述正確的有()A、一站式管理租戶資源,計算資源(CPU/內存/IO)、存儲資源(HDFS)、服務資源,(HBase…)B、可視化的多級租戶管理,與企業(yè)組織結構相匹配,簡化系統(tǒng)資源分配與管理C、基于容器機制的租戶資源隔離,為租戶SLA保駕護航D、與企業(yè)組織結構相匹配的多級的租戶模型,不同部門對應不同的租戶、按需動態(tài)增刪租戶【正確答案】:ABCD11.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令查看拓撲或者提交拓撲失敗,以下哪些定位手段的正確的?()A、查看Supervisor運行日志,判斷是否Supervisor異常B、查看worker運行日志C、查看客戶端異常堆棧,判斷是否客戶端使用問題D、查看主nimbus的運行日志,判斷是否nimbus服務器異?!菊_答案】:ABCD12.FusionlnsightManager與外部管理平臺對接時,支持哪些接口?(多選)A、NMPB、VPNC、FTPD、Syslog【正確答案】:ACD13.FusionInsightManager會定時備份哪些數據?A、NameNodeB、LDAPC、OMSDBService【正確答案】:BC14.Flink流式處理的數據源類型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正確答案】:ABCD15.以下關于HBase中HMaster的功能描述哪些是正確的?A、Region負載均衡,Region分裂以及分裂后的Region分配B、負責建表/修改表/刪除表C、負責RegionServer的負載均衡D、RegionServer失效后的Region遷移【正確答案】:ABCD16.FusionInsight家族包含下列哪些子產品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正確答案】:ABCDE17.Flume進程級聯(lián)時,以下哪些sink類型用于接收上一跳Flume發(fā)送過來的消息?AvrosinkB、ThriftsinkC、HivesinkD、Nullsink【正確答案】:AB18.如圖所示,Flink流式數據處理接口DataStreamAPI支持的語言包括?()A、pythonB、javaC、c語言D、scala【正確答案】:BD19.在Kafka中,如下關于Producer發(fā)送數據的說法錯誤的是()A、Proucer負責生產數據。Consumer負責消費數據。Producer和Consumer之間需要建立連接B、Proucer既可以發(fā)送數據到Broker上。又可以發(fā)送數據到ConsumerC、Proucer作為消息生產者??梢灾苯訉祿懭隯ookeeperD、Proucer連接任意一個正常的Broker實例就可以產生數據【正確答案】:ABC20.FusionInsightManager與外部平臺對接時,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog【正確答案】:AD21.FusionInsightManager的主要功能有以下哪些?A、數據集成B、系統(tǒng)管理C、安全管理D、服務治理【正確答案】:BCD22.下列哪些OS版本被推薦可以用來搭建FusionlnsightV1R2C60集群?(多選)A、SUSE11SP1/SP2/SP3forAMD64&Inter64B、CentOS6.6C、Redhat-6.4-x86_64D、RedHat-6.5-x86_64E、RedHat-6.7-x86_64F、Ubuntu6.3【正確答案】:ABCDE23.在Streaming的處理節(jié)點Bolt中,可以完成以下哪些操作()A、接運算B、接數據庫C、濾(filter)D、務處理【正確答案】:ABCD24.Flink的兼容性體現在以下哪些方面?()A、能夠與hadoop原有的mappers和reducers混合使用B、YARN能夠作為Flink集群的資源調度管理器C、能夠使用hadoop的格式化輸入和輸出D、能夠從本地獲取數據【正確答案】:ABCD25.大數據商業(yè)咨詢服務方案在規(guī)劃環(huán)節(jié)主要考慮以下哪些設計?A、大數據商業(yè)模式設計B、商業(yè)場景全景規(guī)劃C、典型場景需求設計D、場景分解和業(yè)務設計【正確答案】:ABCD26.以下哪些是Spark可以提供的功能?A、分布式內存計算引擎B、分布式文件系統(tǒng)C、集群資源的統(tǒng)一調度D、流處理功能【正確答案】:AD27.Zookeeper的關鍵特性包括以下哪些選項?()A、原子性B、最終一致性C、等待無關性D、可靠性【正確答案】:ABCD28.在FusionInsightHD中,以下哪一項不屬于Hive的流控特性A、支持對已建立的總連接數做閾值控制B、支持對每個用戶已經建立的連接數做閾值控制C、支持對某個特定用戶已建立的連接數做閾值控制D、支持對單位時間內所建立的連接數做閾值控制【正確答案】:ABD29.華為大數據解決方案中平臺架構包括以下哪些組成部分?()A、Hadoop層B、GaussDB200C、Datafarm層D、FusioInghtManager【正確答案】:ACD30.以下關于FusionInsight中CarbonData說法正確的有?()A、carbon也是一種將數據源與spark集成的高性能分析引擎。B、carbon使用輕量級壓縮和重量級壓縮的組合壓縮算法壓縮數據,可以減少
60%~80%數據存儲空間,大大節(jié)省硬件存儲成本。C、carbon是一種新型的ApacheHadoop本地文件格式,使用先進的列式存儲、索引、壓縮和編碼技術,以提高計算效率,有助于加速超過PB數量級的數據查詢,可用于更快的交互查詢。D、使用carbon的目的是對大數據即席查詢提供超快速響應。【正確答案】:ABCD31.Flume適用于以下哪些場景的數據收集?A、Thrift,Avro,Syslog,Kafka等數據源上收集數據B、本地文件數據采集C、應用系統(tǒng)產生的日志采集D、大量數據的實時數據采集【正確答案】:ABC32.HDFS不適用于以下哪些場景?A、流式數據訪問B、大量小文件存儲C、大文件存儲與訪問D、隨機寫入【正確答案】:BD33.在loader歷史作業(yè)記錄中,可以查看以下哪些內容?()A、作業(yè)狀態(tài)B、作業(yè)開始/運行時間C、臟數據鏈接D、錯誤行/文件數量【正確答案】:ABCD34.HBase的數據文件HFile中一個KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType【正確答案】:ABCD35.HBase的主要特點有哪些?A、高可靠性B、高性能C、面向列D、可伸縮【正確答案】:ABCD36.下列哪些組件必須依賴于Zookeeper才能運行?A、HDFSB、HBaseC、SparkD、YARN【正確答案】:ABD37.下面關于flink窗口的描述錯誤的是A、滾動窗口在時間上是重疊的B、滾動窗口在時間上是不重疊的C、滑動動窗口之間時間點不存在重疊D、滑動窗口之間時間點存在重疊【正確答案】:AC38.Spark適用于以下哪些場景?()A、圖計算B、互式查詢C、批處理D、實時流處理【正確答案】:ABCD39.Flink可以基于以下哪些窗口進行統(tǒng)計?A、時間窗口B、滑動窗口C、會話窗口D、countWindow【正確答案】:ABCD40.FusionlnsightHDV100R002C60版本集群中,以下哪些組件需要規(guī)劃元數據分區(qū)?A、HDFSB、ZookeeperC、StreamingD、RedisE、HBaseF、Kafka【正確答案】:ABC41.與開源sqoop相比,loader具有哪些增強特性?A、高可靠性B、高性能C、安全性D、圖形化【正確答案】:ABCD42.Zookeeper中的數據節(jié)點znode分為哪幾種類型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正確答案】:BD43.HDFS系統(tǒng)中對備用NameNode的作用的描述正確的有?A、主NameNode的熱備B、備NameNode對內存沒有要求C、幫助主NameNode合并編輯日志,減少主NameNode的啟動時間D、備NameNode應與主NameNode部署到一個節(jié)點【正確答案】:AC44.在FusionInsightHD中,Flink主要與以下哪些組件進行交互A、zookeeperB、HDFSC、KafkaD、Yarn【正確答案】:ABCD45.FusionInsightHD數據高可靠性體現在以下哪些方面?()A、跨數據中心容災B、關鍵數據掉電保護C、硬盤熱插拔D、第三方備份系統(tǒng)集成【正確答案】:ABCD46.基于Hadop幵源大數據平臺主要提供了針對數據分布式計算和存儲能力,如下屬于分布式存儲組件的有?A、MRB、SparkC、HDFSD、HBase【正確答案】:CD47.執(zhí)行Hbase數據業(yè)務(題干可能為讀數據業(yè)務),需要讀取哪幾部分數據()A、HLogB、MenStoreC、HFileD、HMaster【正確答案】:BC48.執(zhí)行HBase數據讀取業(yè)務時,需要讀取哪幾部分數據?A、HFileB、HLogC、MemStoreD、HMaster【正確答案】:AC49.FusionInsightHD的Loader在創(chuàng)建作業(yè)時,連接器有什么作用?A、確定有哪些轉換步驟B、提供優(yōu)化參數,提供數據導入導出性能C、配置作業(yè)如何與外部數據源進行連接D、配置作業(yè)如何與內部數據源進行連接【正確答案】:ABCD50.下列關于Flink中Transformation的說法正確的是?A、可以通過window設定時間窗口B、Filtor操作是對每個元素執(zhí)行boolean函數C、flatMap可以對文本進行切分D、eyBy是將源頭數據按照key進行分組,以保證同一個key的元數據分到同樣的組中【正確答案】:ABD51.以下關于FusionInsightHBase可視化建模說法正確的有?()A、可視化建模幫助DBA進行建模設計,降低HBase的使用門檻B(tài)、QualifierHBase列:每一列代表業(yè)務數據某一屬性C、實現人員分工:DBA關注數據表建模,開發(fā)人員關注用戶表明和用到的列D、Column用戶表列:每一列代表一個KeyValue【正確答案】:ABC52.FusionlnsightHDLLD配置規(guī)劃工具可以生成哪些配置文件?A、監(jiān)控告警閾值配置文件B、集群的安裝模板文件C、HDFS和YARN的配置文件D、執(zhí)行Precheck所需要的配晉文件CheckNodes.Config【正確答案】:BD53.FusionlnsightHDLoader可以將HDFS數據導出到以下哪些目標端?A、SFTP服務器B、FTP服務器C、Oracle數據庫DB2數據庫【正確答案】:ABCD54.大數據分析相關技術主要特征有哪些?A、機器學習,全量特征B、數據背后事件關聯(lián)性分析C、以海量數據為基礎D、以精確樣本為基礎【正確答案】:ABC55.以下關于FusionInsight網絡安全可靠性,說法正確的有()A、避免業(yè)務平面的高負載阻塞集群管理通道B、網絡平面隔離,避免管理與業(yè)務寬帶搶占、互相干擾C、阻止外部攻擊者通過管理通道入侵實際業(yè)務數據D、FusionInsight支持將網絡劃分為三級:集群業(yè)務平面、集群管理平面和集群外維護網絡,彼此之間實施物理隔離【正確答案】:ABCD56.如圖所示,下列哪些選項屬于寬依賴A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正確答案】:AD57.以下哪些選項屬于FusionInsight數據安全性?A、操作系統(tǒng)安全加固B、組件數據加密C、數據完整性校驗D、用戶權限認證管理【正確答案】:BC58.FuskmlnsightHD集群中,集群規(guī)?,F有300個節(jié)點,如果采用推薦部署方案,控制節(jié)點上一定不會存在哪些分區(qū)?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正確答案】:BE59.華為大數據產品FusionInsightHD中的Streaming具有哪些關鍵特性?()A、靈活性B、可伸縮性C、容災能力D、消息可靠性【正確答案】:ABCD60.華為FusionInsightHD集群中,Spark服務可以從以下哪些服務讀取數據?(多選)A、YARNB、HDFSC、HiveD、HBase【正確答案】:BCD61.FusionlnsightHD產品中,關于Kafka組件說法正確的有?A、刪除Topic時,必須踴保Kafka的服務配置delete.topic.enable配置為trueB、Kafka安裝及運行曰志保存路徑為/srv/Bigdata/kafkaC、ZooKeeper服務不可用會導致Kafka服務不可用D、必須使用admin用戶或者Kafkaadmin組用戶進行創(chuàng)建Topic【正確答案】:ACD62.以下關于HBase存儲模型的描述正確的是?()A、每一個KeyValue都擁有一個Qualifier標識B、同一個key值key關聯(lián)多個valueC、KeyValue中擁有時間戳、類型等關鍵信息D、即使是key值相同,Qualifier也相同的多個KeyValue,也可能有多個,此時使用時間戳來區(qū)分【正確答案】:ABCD63.傳統(tǒng)數據處理的性能瓶頸有?A、數據存儲成本高B、流式數據處理性能不足C、擴展能力有限D、批量數據處理缺失【正確答案】:AC64.下列選項中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正確答案】:BCD65.FusionInsightHD平臺中,哪些組件支持對表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正確答案】:BC66.HDFS聯(lián)邦環(huán)境下,NameSpace(命名空間)包含以下哪些內容()A、目錄B、文件C、塊D、以上全不正確【正確答案】:ABC67.在FusionInsight集群中,Spark主要與以下哪些組件進行交互?()A、HiveB、YARNC、HDFSD、Zookeeper【正確答案】:BCD68.FusionlnsightManager會定時備份哪些數據?A、NameNodeB、LDAPServerC、OMSDBService【正確答案】:BC69.若在消息處理過程中允許部分信息丟失,關閉消息可靠性處理機制的方式有以下哪些?A、將參數Config.Topology_ACKKRS設置為0B、將參數Config.Topology_ACKKRS設置為FalseC、Spout發(fā)送消息時,使用不指定消息messageID的接口進行發(fā)送D、Bolt發(fā)送消息時使用Unanchor方式發(fā)送【正確答案】:ACD70.下列屬于flume數據監(jiān)控的指標是?()A、Source接收數據量B、Sink寫入數據量C、DataNode數量D、Channel緩存數據量【正確答案】:ABD71.FusionlnsightHD產品在部署Kerberos和LDAP服務是,以下描述正確的是?(多選)A、部署Kerberos服務之前,必須先部署LDAP服務B、LDAP服務必須和Kerberos服務部署在同一個節(jié)點C、Kerberos服務和LDAP服務部署同一個節(jié)點利于數據訪問,有助于性能提升D、LDAP服務可以多個集群共享【正確答案】:AC72.FusionlnsightHD集群升級,以下描述正確的有?(多選)A、升級過程中不可以手工操作主備OMS倒換B、集群內所有主機的root賬戶密碼保持一致C、保持網絡暢通,避免因網絡問題導致升級異常D、觀察期不能做壙容【正確答案】:ABCD73.下列選項中,哪些是MapReduce一定會有的過程?A、CombineB、MapC、ReduceD、Partition【正確答案】:BCD74.FusionInsightHD系統(tǒng)中使用Streaming客戶端shell命令提交了拓撲之后,使用StromUI查看發(fā)現該拓撲長時間沒有處理數據,可能原因有?()A、Supervisor是在topology中接收數據然后執(zhí)行處理的組件B、拓撲業(yè)務存在邏輯錯誤,提交之后無法正常運行C、拓撲過于復雜或者并發(fā)太大,導致worker啟動時間太長,超過Supervisor的等待時間D、Supervisor的slots資源被耗盡,拓撲提交上去之后分不到slot去啟東worker進程【正確答案】:BCD75.采用Flume傳輸數據過程中,為了防止因Flume進程重啟而丟失數據,可以使用以下哪種Channel類型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正確答案】:BC76.FusionInsightManager界面顯示Hive服務狀態(tài)為Bad時,可能原因有哪些?A、DBService不可用B、HDFS服務不可用C、MetaStore實例不可用D、HBase服務不可用【正確答案】:ABC77.Fusionlnsight系統(tǒng)中Hive支持的存儲格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正確答案】:BCD78.以下關于華為大數據解決方案說法正確的是()A、Farmer是數據服務框架B、GaussDB是一款開源數據庫產品C、FusionInsightManager是一個分布式系統(tǒng)管理框架,管理員可以通過多接入點操控分布式集群D、FusionInsightHD是基于開源大數據軟件Hadoop的增強版本【正確答案】:ABCD79.YARN通過ResourceManager對集群資源進行管理,它的主要功能有?A、集群資源調度B、應用程序管理C、日志管理D、以上說法都不對【正確答案】:AB80.FusionInsightManager與外部管理平臺對接時,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正確答案】:AB81.spark有哪些特點?()A、快B、巧C、靈D、輕【正確答案】:ABCD82.關于Flume,下列說法錯誤的是?、A、Flume級聯(lián)節(jié)點之間的數據傳輸支持加密B、Flume支持多級聯(lián)和多路復用C、Source到Channel到Sink等進程內部有加密的必要D、Flume級聯(lián)節(jié)點之間的數據傳輸不支持壓縮【正確答案】:CD83.以下關于Flink與其他組件交互說法正確的是?()A、Flink的checkpoint的實現依賴于ZookeeperB、Flink可以將接收的組件發(fā)生給kafkaC、Flink任務的運行依賴Yarn來進行資源的調度管理D、Flink在HDFS文件系統(tǒng)中讀寫數據【正確答案】:ABCD84.HBase集群定時執(zhí)行Compaction的目的是什么?(ACD)[]A、減少同一個Region同一個ColumnFamily下的文件數目B、減少同一個Region的文件數目C、提升數據讀取性能D、提升數據寫入能力【正確答案】:ACD85.以下哪些是Kafka實際的應用場景A、日志收集B、網站活性跟蹤C、資源管理D、聚合統(tǒng)計系統(tǒng)運營數據【正確答案】:BD86.某高校的FusionlnsightHD集群中有230個節(jié)點,在進行集群規(guī)劃時,下列哪些進程應該部署在數據節(jié)點上?A、DataNodeB、NameNodeC、NodeManagerD、RegionServerE、DBServerF、SoIrServer【正確答案】:ACDF87.以下關于KafkaPartition說法正確的有A、引入Partition機制,保證了Kafka的高吞吐能力B、每個Partition都是有序且不可變的消息隊列C、Partition數量決定了每個consumergroup中并發(fā)消費者的最大數量D、每個Partition在存儲層面對應一個log文件【正確答案】:ABCD88.以下關于HBase的文件存儲模塊(HBaseFileStream,簡稱HFS)描述正確的有?A、應用在FusionInsightHD的上層應用B、HFS封裝了HBase與HDFS的接口C、為上層應用提供文件的存儲.讀取.刪除等功能D、HFS是HBase的獨立模塊【正確答案】:ABCD89.華為FusionInsightHD行業(yè)成功案例都有哪些?A、數字政府B、智慧園區(qū)C、智慧交通D、金融【正確答案】:ABCD90.YARN中,“從”節(jié)點負責以下哪些工作?()A、集群中所有資源的統(tǒng)一管理和分配B、監(jiān)督Container的生命周期管理C、管理日志和不同應用程序用到的附屬服務D、監(jiān)控每個Container的資源使用(內存,CPU等)情況【正確答案】:BD91.在FusionInsight產品中,關于Kafka組件說法正確的是?A、在創(chuàng)建Topic時,副本數不得大于當前存活的Broker實例個數,否則創(chuàng)建Topic將會失敗B、Kafka的Producer發(fā)送消息時,可以指定該消息被哪個Consumer消費C、Kafka會將元數據信息存放到Zookeeper上D、Kafka安裝完成后就不能再配置數據存放目錄【正確答案】:ABCD92.根據數據流如何在兩個Transformation之間傳輸數據,數據流可以分為哪些類型?
A、redistributing流B、一對一流C、一對多流D、distributing流【正確答案】:BC93.調用Zookeeper客戶端命令中包含哪些信息?A、端口號B、ip地址C、服務器名稱D、用戶名【正確答案】:AB94.NodeManager的內存和CPU的數量,是通過下列哪些選項進行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正確答案】:BCD95.Loader可以實現以下哪些轉換規(guī)則()A、空值轉換B、拼接轉換C、長整型時間轉換D、增量轉換【正確答案】:ABCD96.FusionInsightHD集群中包含了很多種服務,每種服務又由若干角色組成,下面哪些是服務的角色?()【正確答案】:AA、HDFSB、NameNodeC、DataNodeD、Hbase【正確答案】:BC97.Zookeeper可以為FusionInsightHD中哪些組件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正確答案】:ABCD98.fusininsightHD平臺中,那些組件支持對列表加密?A、HDFSB、FlinkC、hbaseD、hive【正確答案】:CD99.HBase中以下哪種場景會出發(fā)Flush操作?A、HBase定期刷新Memstore,默認周期為1小時B、當WALs中文件數量達到閾值時C、Region中MemStore的總大小,達到了預設的FlushSize閾值D、MemStore占用內存的總量和RegionServer總內存比值超出了預設的閾值大小【正確答案】:ABCD100.kafka消息傳輸保障通常有以下哪幾種?()A、最多三次(AtMostThreeTimes)B、僅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正確答案】:BCD101.以下關于KafkaLogs中segmentfile的說法正確的有?A、index元數據全部映射到menory,可以避免sementfile的index數據IO磁盤操作B、索引文件稀疏存儲,可以大幅減低index文件元數據占用空間大小C、稀疏存儲,即將原來的完整數據,只間隔的選擇多條進行存儲D、通過索引信息可以快速定位message【正確答案】:ABCD102.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、數據集成C、系統(tǒng)管理D、服務治理【正確答案】:AC103.關于大數據的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 上海2025年上海健康醫(yī)學院招聘46人筆試歷年參考題庫附帶答案詳解
- 科技與教育的完美結合網絡教育平臺的盈利策略研究
- 科技背景下的心理健康教育與自我成長
- 科學育兒寶寶成長更健康
- 沙龍合作合同范本
- 科技發(fā)展對大學生學術研究的影響及展望
- 2025至2030年中國菊花香精數據監(jiān)測研究報告
- 2025至2030年中國藥品商標數據監(jiān)測研究報告
- 安保行業(yè)勞保合同范本
- 2025至2030年中國船用柴油發(fā)動機數據監(jiān)測研究報告
- 中國傳媒大學-主持人即興口語訓練-課件-1
- 【武漢版】生命安全教育五年級第19課《別讓皮膚受傷害》教學設計
- 2022-2023學年上海市華東師范大學第一附屬中學物理高一下期中聯(lián)考試題含解析
- 臺灣歷屆領導人和其大陸政策
- 2023屆高考模擬作文“和而不同”導寫及范文
- 2023年湖南高速鐵路職業(yè)技術學院單招筆試職業(yè)技能考試題庫及答案解析
- 結婚函調報告表
- 中智投資有限公司招聘筆試題庫2023
- 2023年中智投資有限公司招聘筆試押題庫
- FSC全套程序文件
- YY/T 0729.2-2009組織粘合劑粘接性能試驗方法第2部分:T-剝離拉伸承載強度
評論
0/150
提交評論