大數(shù)據(jù)技術教材配套習題練習測試卷_第1頁
大數(shù)據(jù)技術教材配套習題練習測試卷_第2頁
大數(shù)據(jù)技術教材配套習題練習測試卷_第3頁
大數(shù)據(jù)技術教材配套習題練習測試卷_第4頁
大數(shù)據(jù)技術教材配套習題練習測試卷_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第頁大數(shù)據(jù)技術教材配套習題練習測試卷1.下面哪個選項不屬于Hadoop1.0的問題?A、單一名稱節(jié)點,存在單點失效問題B、單一命名空間,無法實現(xiàn)資源隔離C、資源管理效率低D、很難上手【正確答案】:D2.分布式文件系統(tǒng)指的是什么?A、把文件分布存儲到多個計算機節(jié)點上,成千上萬的計算機節(jié)點構成計算機集群B、用于在Hadoop與傳統(tǒng)數(shù)據(jù)庫之間進行數(shù)據(jù)傳遞C、一個高可用的,高可靠的,分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)D、一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),可以處理消費者規(guī)模的網(wǎng)站中的所有動作流數(shù)據(jù)【正確答案】:A3.下列關于NoSQL與關系數(shù)據(jù)庫的比較,哪個說法是錯誤的?()A、在一致性方面,RDBMS強于NoSQLB、在數(shù)據(jù)完整性方面,RDBMS容易實現(xiàn)C、在擴展性方面,NoSQL比較好D、在可用性方面,NoSQL優(yōu)于RDBMS【正確答案】:D4.在Hadoop項目結構中,MapReduce指的是什么?A、分布式并行編程模型B、流計算框架C、Hadoop上的工作流管理系統(tǒng)D、提供分布式協(xié)調一致性服務【正確答案】:A5.下列關于MapReduce1.0的描述,錯誤的是?A、JobTracker“大包大攬”導致任務過重B、不存在單點故障C、容易出現(xiàn)內存溢出(分配資源只考慮MapReduce任務數(shù),不考慮CPU、內存)D、資源劃分不合理(強制劃分為slot,包括Mapslot和Reduceslot)【正確答案】:B6.下列哪一個不屬于HDFS1.0中存在的問題?A、無法水平擴展B、單點故障問題C、單一命名空間D、系統(tǒng)整體性能受限于單個名稱節(jié)點的吞吐量【正確答案】:A7.下列哪一個不屬于第三次信息化浪潮中新興的技術?A、互聯(lián)網(wǎng)B、云計算C、大數(shù)據(jù)D、物聯(lián)網(wǎng)【正確答案】:A8.下面哪一項不是MapReduce體系結構主要部分?A、ClientB、JobTrackerC、TaskTracker以及TaskD、Job【正確答案】:A9.下列關于Spark的描述,錯誤的是哪一項?A、Spark最初由美國加州伯克利大學(UCBerkeley)的AMP實驗室于2009年開發(fā)B、Spark在2014年打破了Hadoop保持的基準排序紀錄.C、Spark用十分之一的計算資源,獲得了比Hadoop快3倍的速度D、Spark運行模式單一【正確答案】:D10.大數(shù)據(jù)產業(yè)指什么?A、一切與支撐大數(shù)據(jù)組織管理和價值發(fā)現(xiàn)相關的企業(yè)經濟活動的集合B、提供智能交通、智慧醫(yī)療、智能物流、智能電網(wǎng)等行業(yè)應用的企業(yè)C、提供數(shù)據(jù)分享平臺、數(shù)據(jù)分析平臺、數(shù)據(jù)租售平臺等服務的企業(yè)D、提供分布式計算、數(shù)據(jù)挖掘、統(tǒng)計分析等服務的各類企業(yè)【正確答案】:A11.、顯示當前目錄的命令是:()A、cdB、pwdC、whoD、Is【正確答案】:B12.關于文檔數(shù)據(jù)庫的說法,下列哪一項是錯誤的?A、數(shù)據(jù)是規(guī)則的B、性能好(高并發(fā))C、缺乏統(tǒng)一的查詢語法D、復雜性低【正確答案】:A13.下列哪個不屬于NoSQL數(shù)據(jù)庫的特點?A、靈活的可擴展性B、靈活的數(shù)據(jù)模型C、與云計算緊密融合D、數(shù)據(jù)存儲規(guī)模有限【正確答案】:D14.下列關于MapReduce工作流程,哪個描述是正確的?A、所有的數(shù)據(jù)交換都是通過MapReduce框架自身去實現(xiàn)的B、不同的Map任務之間會進行通信C、不同的Reduce任務之間可以發(fā)生信息交換D、用戶可以顯式地從一臺機器向另一臺機器發(fā)送消息【正確答案】:A15.下列哪項是Hadoop生態(tài)系統(tǒng)中Spark的功能?A、處理大規(guī)模數(shù)據(jù)的腳本語言B、工作流和協(xié)作服務引擎,協(xié)調Hadoop上運行的不同任務C、不支持DAG作業(yè)的計算框架D、基于內存的分布式并行編程框架,具有較高的實時性,并且較好支持迭代計算【正確答案】:D16.對文件重命名的命令是:()A、rmB、mvC、moveD、cp【正確答案】:B17.下面哪個選項屬于大數(shù)據(jù)技術的“數(shù)據(jù)存儲和管理”技術層面的功能?A、利用分布式文件系統(tǒng)、數(shù)據(jù)倉庫、關系數(shù)據(jù)庫等實現(xiàn)對結構化、半結構化和非結構化海量數(shù)據(jù)的存儲和管理B、利用分布式并行編程模型和計算框架,結合機器學習和數(shù)據(jù)挖掘算法,實現(xiàn)對海量數(shù)據(jù)的處理和分析C、構建隱私數(shù)據(jù)保護體系和數(shù)據(jù)安全體系,有效保護個人隱私和數(shù)據(jù)安全D、把實時采集的數(shù)據(jù)作為流計算系統(tǒng)的輸入,進行實時處理分析【正確答案】:A18.下列關于RDD說法,描述有誤的是?A、一個RDD就是一個分布式對象集合,本質上是一個只讀的分區(qū)記錄集合B、每個RDD可分成多個分區(qū),每個分區(qū)就是一個數(shù)據(jù)集片段C、RDD是可以直接修改的D、RDD提供了一種高度受限的共享內存模型【正確答案】:C19.()不是Hbase的特點。A、大B、稀疏C、面向列D、面向行【正確答案】:D20.下列哪個不屬于YARN體系結構中ResourceManager的功能?A、處理客戶端請求B、監(jiān)控NodeManagerC、資源分配與調度D、處理來自ApplicationMaster的命令【正確答案】:D21.下面哪個不可能是hive的執(zhí)行引擎:()A、mapreduceB、tezC、stormD、spark【正確答案】:C22.下列關于Map和Reduce函數(shù)的描述,哪個是錯誤的?A、Map將小數(shù)據(jù)集進一步解析成一批<key,value>對,輸入Map函數(shù)中進行處理B、Map每一個輸入的<k1,v1>會輸出一批<k2,v2>。<k2,v2>是計算的中間結果C、Reduce輸入的中間結果<k2,List(v2)>中的List(v2)表示是一批屬于不同k2的valueD、Reduce輸入的中間結果<k2,List(v2)>中的List(v2)表示是一批屬于同一個k2的value【正確答案】:C23.下面哪個不是Hadoop1.0的組件:()A、HDFSB、MapReduceC、YARND、NameNode和DataNode【正確答案】:C24.在Hadoop項目結構中,HDFS指的是什么?A、分布式文件系統(tǒng)B、流數(shù)據(jù)讀寫C、資源管理和調度器D、Hadoop上的數(shù)據(jù)倉庫【正確答案】:A25.下面對FsImage的描述,哪個是錯誤的?A、FsImage文件沒有記錄每個塊存儲在哪個數(shù)據(jù)節(jié)點B、FsImage文件包含文件系統(tǒng)中所有目錄和文件inode的序列化形式C、FsImage用于維護文件系統(tǒng)樹以及文件樹中所有的文件和文件夾的元數(shù)據(jù)D、FsImage文件記錄了每個塊具體被存儲在哪個數(shù)據(jù)節(jié)點【正確答案】:D26.在HDFS中,NameNode的主要功能是什么?A、維護了blockid到datanode本地文件的映射關系B、存儲文件內容C、文件內存保存在磁盤中D、存儲元數(shù)據(jù)【正確答案】:D27.下列關于MapReduce模型的描述,錯誤的是哪一項?A、MapReduce采用“分而治之”策略B、MapReduce設計的一個理念就是“計算向數(shù)據(jù)靠攏”C、MapReduce框架采用了Master/Slave架構D、MapReduce應用程序只能用Java來寫【正確答案】:D28.下列有關hive和impala的對比錯誤的是:()A、hive與impala使用相同的元數(shù)據(jù)B、hive與impala中對sql的解釋處理比較相似,都是通過詞法分析生成執(zhí)行計劃C、hive適合于長時間的批處理查詢分析,而impala適合于實時交互式sql查詢D、hive在內存不足以存儲所有數(shù)據(jù)時,會使用外存,而impala也是如此【正確答案】:D29.在Hadoop項目結構中,HDFS指的是什么?A、分布式文件系統(tǒng)B、分布式并行編程模型C、資源管理和調度器D、Hadoop上的數(shù)據(jù)倉庫【正確答案】:A30.下面關于云計算數(shù)據(jù)中心的描述正確的是:A、數(shù)據(jù)中心是云計算的重要載體,為各種平臺和應用提供運行支撐環(huán)境B、數(shù)據(jù)中心就是放在企業(yè)內部的一臺中心服務器C、每個企業(yè)都需要建設一個云計算數(shù)據(jù)中心D、數(shù)據(jù)中心不需要網(wǎng)絡帶寬的支撐【正確答案】:A31.下面關于Hive的描述錯誤的是:()A、Hive是一個構建在Hadoop之上的數(shù)據(jù)倉庫工具B、Hive是由Facebook公司開發(fā)的C、Hive在某種程度上可以看作是用戶編程接口,其本身并不存儲和處理數(shù)據(jù)D、Hive定義了簡單的類似SQL的查詢語言——HiveQL,它與大部分SQL語法無法兼容【正確答案】:D32.內部表和外部表的區(qū)別之一:創(chuàng)建表時是否使用()關鍵字。A、overB、outerC、exteriorD、external【正確答案】:D33.MapReduce1.0的體系結構中,JobTracker是主要任務是什么?A、負責資源監(jiān)控和作業(yè)調度,監(jiān)控所有TaskTracker與Job的健康狀況B、使用“slot”等量劃分本節(jié)點上的資源量(CPU、內存等)C、會周期性地通過“心跳”將本節(jié)點上資源的使用情況和任務的運行進度匯報給TaskTrackerD、會跟蹤任務的執(zhí)行進度、資源使用量等信息,并將這些信息告訴任務(Task)【正確答案】:A34.下列關于BigTable的描述,哪個是錯誤的?A、爬蟲持續(xù)不斷地抓取新頁面,這些頁面每隔一段時間地存儲到BigTable里BigTable是一個分布式存儲系統(tǒng)C、BigTable起初用于解決典型的互聯(lián)網(wǎng)搜索問題D、網(wǎng)絡搜索應用查詢建立好的索引,從BigTable得到網(wǎng)頁【正確答案】:A35.HBase中需要根據(jù)某些因素來確定一個單元格,這些因素可以視為一個“四維坐標”,下面哪個不屬于“四維坐標”?A、行鍵B、關鍵字C、列族D、時間戳【正確答案】:B36.Hadoop最初是由誰創(chuàng)建的?A、LuceneB、DougCuttingC、ApacheD、MapReduce【正確答案】:B37.在HBase中,關于數(shù)據(jù)操作的描述,下列哪一項是錯誤的?A、HBase采用了更加簡單的數(shù)據(jù)模型,它把數(shù)據(jù)存儲為未經解釋的字符串B、HBase操作不存在復雜的表與表之間的關系C、HBase不支持修改操作D、HBase在設計上就避免了復雜的表和表之間的關系【正確答案】:C38.第一次信息化浪潮主要解決什么問題?A、信息傳輸B、信息處理C、信息爆炸D、信息轉換【正確答案】:B39.下面描述錯誤的是:()A、hive的功能十分強大,可以支持采用sql方式查詢hadoop平臺上的數(shù)據(jù)B、在實際應用中,hive也暴露出不穩(wěn)定的問題,在極少數(shù)情況下,其至會出現(xiàn)端口不響應或者進程丟失的問題C、在hiveha中,在hadoop集群上構建的數(shù)據(jù)倉庫是由單個hive實例進行管理的D、在hiveha中,客戶端的查詢請求首先訪問haproxy,由haproxy對訪問請求進行轉發(fā)【正確答案】:C40.下列說法哪項有誤?A、相對于Spark來說,使用Hadoop進行迭代計算非常耗資源B、Spark將數(shù)據(jù)載入內存后,之后的迭代計算都可以直接使用內存中的中間結果作運算,避免了從磁盤中頻繁讀取數(shù)據(jù)C、Hadoop的設計遵循“一個軟件棧滿足不同應用場景”的理念D、Spark可以部署在資源管理器YARN之上,提供一站式的大數(shù)據(jù)解決方案【正確答案】:C41.下列傳統(tǒng)并行計算框架,說法錯誤的是哪一項?A、刀片服務器、高速網(wǎng)、SAN,價格貴,擴展性差上B、共享式(共享內存/共享存儲),容錯性好C、編程難度高D、實時、細粒度計算、計算密集型【正確答案】:B42.下面關于Hive的描述錯誤的是:()A、HBase與Hive的功能是互補的,它實現(xiàn)了Hive不能提供的功能B、當采用MapReduce作為執(zhí)行引擎時,用HiveQL語句編寫的處理邏輯,最終都要轉化為MapReduce任務來運行C、Hive一般用于處理靜態(tài)數(shù)據(jù),主要是BI報表數(shù)據(jù)D、Hive主要是用于滿足實時數(shù)據(jù)流的處理需求【正確答案】:D43.、()是Hbase存儲的核心。A、StorageB、StoreC、toreFileD、MemStore【正確答案】:B44.HDFS中的Block默認保存()A、3份B、2份C、1份D、不確定【正確答案】:A45.云計算平臺層(PaaS)指的是什么?A、操作系統(tǒng)和圍繞特定應用的必需的服務B、將基礎設施(計算資源和存儲)作為服務出租C、從一個集中的系統(tǒng)部署軟件,使之在一臺本地計算機上(或從云中遠程地)運行的一個模型D、提供硬件、軟件、網(wǎng)絡等基礎設施以及提供咨詢、規(guī)劃和系統(tǒng)集成服務【正確答案】:A46.、()主要存放用戶建表未指定命名空間的表A、tableB、defaultC、namespaceD、hbase【正確答案】:B47.、查看主機名稱的命令是:()A、ifconfigB、hostnameC、topD、wget【正確答案】:B48.下列哪一項不屬于數(shù)據(jù)庫事務具有ACID四性?A、間斷性B、原子性C、一致性D、持久性【正確答案】:A49.在一個基本的Hadoop集群中,SecondaryNameNode主要負責什么?A、幫助NameNode收集文件系統(tǒng)運行的狀態(tài)信息B、負責執(zhí)行由JobTracker指派的任務C、協(xié)調數(shù)據(jù)計算任務D、負責協(xié)調集群中的數(shù)據(jù)存儲【正確答案】:A50.下列哪個不屬于Hadoop的特性?A、成本高B、高可靠性C、高容錯性D、運行在Linux平臺上【正確答案】:A51.下面描述錯誤的是:()A、Hive的功能十分強大,可以支持采用SQL方式查詢Hadoop平臺上的數(shù)據(jù)B、在實際應用中,Hive也暴露出不穩(wěn)定的問題,在極少數(shù)情況下,甚至會出現(xiàn)端口不響應或者進程丟失的問題C、在HiveHA中,在Hadoop集群上構建的數(shù)據(jù)倉庫是由單個Hive實例進行管理的D、在HiveHA中,客戶端的查詢請求首先訪問HAProxy,由HAProxy對訪問請求進行轉發(fā)【正確答案】:C52.下列關于Spark的描述,錯誤的是哪一項?A、使用DAG執(zhí)行引擎以支持循環(huán)數(shù)據(jù)流與內存計算析B、可運行于獨立的集群模式中,可運行于Hadoop中,也可運行于AmazonEC2等云環(huán)境中C、支持使用ScalA.Java、Python和R語言進行編程,但是不可以通過SparkShell進行交互式編程D、可運行于獨立的集群模式中,可運行于Hadoop中,也可運行于AmazonEC2等云環(huán)境中【正確答案】:C53.關于HDFSFederation的設計的描述,哪個是錯誤的?()A、屬于不同命名空間的塊可以構成同一個“塊池”B、HDFSFederation中,所有名稱節(jié)點會共享底層的數(shù)據(jù)節(jié)點存儲資源,數(shù)據(jù)節(jié)點向所有名稱節(jié)點匯報C、設計了多個相互獨立的名稱節(jié)點D、HDFS的命名服務能夠水平擴展【正確答案】:A54.下列哪一個不屬于大數(shù)據(jù)產業(yè)的產業(yè)鏈環(huán)節(jié)?A、數(shù)據(jù)循環(huán)層B、數(shù)據(jù)源層C、數(shù)據(jù)分析層D、數(shù)據(jù)應用層【正確答案】:A55.下列說法錯誤的是?A、HadoopMapReduce是MapReduce的開源實現(xiàn),后者比前者使用門檻低很多B、MapReduce采用非共享式架構,容錯性好C、MapReduce主要用于批處理、實時、計算密集型應用D、MapReduce采用“分而治之”策略【正確答案】:C56.Hadoop1.0的核心組件(僅指MapReduce和HDFS,不包括Hadoop生態(tài)系統(tǒng)內的

P.ig、Hive、HBase等其他組件),下列哪項是它的不足?A、抽象層次高B、表達能力有限,抽象層次低,需人工編碼C、價格昂貴D、可維護性低【正確答案】:B57.下列關于HDFS的描述,哪個不正確?A、HDFS還采用了相應的數(shù)據(jù)存放、數(shù)據(jù)讀取和數(shù)據(jù)復制策略,來提升系統(tǒng)整體讀寫響應性能B、HDFS采用了主從(Master/Slave)結構模型C、HDFS采用了冗余數(shù)據(jù)存儲,增強了數(shù)據(jù)可靠性D、HDFS采用塊的概念,使得系統(tǒng)的設計變得更加復雜【正確答案】:D58.以下哪個不是Hive的用戶接口模塊:()A、PMIB、HWI(HiveWebInterface)C、JDBC/ODBCD、ThriftServer【正確答案】:A59.、Spark生態(tài)系統(tǒng)組件MLlib的應用場景是?A、圖結構數(shù)據(jù)的處理B、基于歷史數(shù)據(jù)的交互式查詢C、復雜的批量數(shù)據(jù)處理D、基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘【正確答案】:D60.關于HDFSFederation的設計的描述,哪個是錯誤的?A、屬于不同命名空間的塊可以構成同一個“塊池”B、HDFSFederation中,所有名稱節(jié)點會共享底層的數(shù)據(jù)節(jié)點存儲資源,數(shù)據(jù)節(jié)點向所有名稱節(jié)點匯報C、設計了多個相互獨立的名稱節(jié)點D、HDFS的命名服務能夠水平擴展【正確答案】:A61.下面關于NoSQL和關系數(shù)據(jù)庫的簡單比較,哪個是錯誤的?A、RDBMS有關系代數(shù)理論作為基礎,NoSQL沒有統(tǒng)一的理論基礎B、NoSQL很難實現(xiàn)橫向擴展,RDBMS可以很容易通過添加更多設備來支持更大規(guī)模的數(shù)據(jù)C、RDBMS需要定義數(shù)據(jù)庫模式,嚴格遵守數(shù)據(jù)定義,NoSQL一般不存在數(shù)據(jù)庫模式,可以自由靈活定義并存儲各種不同類型的數(shù)據(jù)D、RDBMS借助于索引機制可以實現(xiàn)快速查詢,很多NoSQL數(shù)據(jù)庫沒有面向復雜查詢的索引【正確答案】:B62.()關鍵字用來復制指定表的表結構和數(shù)據(jù)。A、likeB、copyC、asD、replication【正確答案】:C63.HBase只有一個針對行健的索引,如果要訪問HBase表中的行,下面哪種方式是不可行的?A、通過單個行健訪問B、通過時間戳訪問C、通過一個行健的區(qū)間來訪問D、全表掃描【正確答案】:B64.在一個基本的Hadoop集群中,DataNode主要負責什么?A、負責執(zhí)行由JobTracker指派的任務B、協(xié)調數(shù)據(jù)計算任務C、負責協(xié)調集群中的數(shù)據(jù)存儲D、存儲被拆分的數(shù)據(jù)塊【正確答案】:D65.以下哪個不是數(shù)據(jù)倉庫的特性:()A、面向主題的B、集成的C、動態(tài)變化的D、反映歷史變化的【正確答案】:C66.下列哪個不屬于物聯(lián)網(wǎng)的應用?A、智能物流B、智能安防C、環(huán)保監(jiān)測D、數(shù)據(jù)清洗【正確答案】:D67.Hive的大部分查詢操作通過()完成。A、MapReduce作業(yè)B、HDFS作業(yè)C、HBase作業(yè)D、YARN作業(yè)【正確答案】:A68.HDFS采用了什么模型?A、分層模型B、主從結構模型C、管道-過濾器模型D、點對點模型【正確答案】:B69.下列關于Scala特性的描述,錯誤的是哪一項?A、Scala語法復雜,但是能提供優(yōu)雅的API計算B、Scala具備強大的并發(fā)性,支持函數(shù)式編程,可以更好地支持分布式系統(tǒng)C、Scala兼容Java,運行速度快,且能融合到Hadoop生態(tài)圈中D、Scala是Spark的主要編程語言【正確答案】:A70.下列說法錯誤的是?A、RDD(ResillientDistributedDataset)是運行在工作節(jié)點(WorkerNode)的一個進程,負責運行TaskB、Application是用戶編寫的Spark應用程序C、一個Job包含多個RDD及作用于相應RDD上的各種操作DirectedAcyclicGraph反映RDD之間的依賴關系【正確答案】:A71.下面哪一項不屬于計算機集群中的節(jié)點?A、主節(jié)點(MasterNode)B、源節(jié)點(SourceNode)C、名稱結點(NameNode)D、從節(jié)點(SlaveNode)【正確答案】:B72.下列哪項不屬于大數(shù)據(jù)的發(fā)展歷程?A、成熟期B、萌芽期C、大規(guī)模應用期D、迷茫期【正確答案】:D73.下列關于鍵值數(shù)據(jù)庫的描述,哪一項是錯誤的?A、擴展性好,靈活性好B、大量寫操作時性能高C、無法存儲結構化信息D、條件查詢效率高【正確答案】:D74.在HBase訪問接口中,Pig主要用在哪個場合?A、適合HadoopMapReduce作業(yè)并行批處理HBase表數(shù)據(jù)B、適合HBase管理使用C、適合其他異構系統(tǒng)在線訪問HBase表數(shù)據(jù)D、適合做數(shù)據(jù)統(tǒng)計【正確答案】:D75.在Hadoop生態(tài)系統(tǒng)中,Kafka主要解決Hadoop中存在哪些的問題?A、Hadoop生態(tài)系統(tǒng)中各個組件和其他產品之間缺乏統(tǒng)一的、高效的數(shù)據(jù)交換中介B、不同的MapReduce任務之間存在重復操作,降低了效率C、延遲高,而且不適合執(zhí)行迭代計算D、抽象層次低,需要手工編寫大量代碼【正確答案】:A76.下列哪一項不屬于NoSQL的四大類型?A、文檔數(shù)據(jù)庫B、圖數(shù)據(jù)庫C、列族數(shù)據(jù)庫D、時間戳數(shù)據(jù)庫【正確答案】:D77.下列關于NoSQL與關系數(shù)據(jù)庫的比較,哪個說法是錯誤的?A、在一致性方面,RDBMS強于NoSQLB、在數(shù)據(jù)完整性方面,RDBMS容易實現(xiàn)C、在擴展性方面,NoSQL比較好D、在可用性方面,NoSQL優(yōu)于RDBMS【正確答案】:D78.下面關于MongoDB說法,哪一項是正確的?A、具有較差的水平可擴展性B、設置個別屬性的索引來實現(xiàn)更快的排序C、提供了一個面向文檔存儲,操作復雜D、可以實現(xiàn)替換完成的文檔(數(shù)據(jù))或者一些指定的數(shù)據(jù)字段【正確答案】:D79.下面關于主服務器Master主要負責表和Region的管理工作的描述,哪個是錯誤的?A、在Region分裂或合并后,負責重新調整Region的分布B、對發(fā)生故障失效的Region服務器上的Region進行遷移C、管理用戶對表的增加、刪除、修改、查詢等操作D、不支持不同Region服務器之間的負載均衡【正確答案】:D80.下面對SecondaryNameNode第二名稱節(jié)點的描述,哪個是錯誤的?A、SecondaryNameNode一般是并行運行在多臺機器上B、它是用來保存名稱節(jié)點中對HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點重啟的時間C、SecondaryNameNode通過HTTPGET方式從NameNode上獲取到FsImage和EditLog文件,并下載到本地的相應目錄下D、SecondaryNameNode是HDFS架構中的一個組成部分【正確答案】:A81.在大數(shù)據(jù)的計算模式中,流計算解決的是什么問題?A、針對大規(guī)模數(shù)據(jù)的批量處理B、針對大規(guī)模圖結構數(shù)據(jù)的處理C、大規(guī)模數(shù)據(jù)的存儲管理和查詢分析D、針對流數(shù)據(jù)的實時計算【正確答案】:D82.、Spark生態(tài)系統(tǒng)組件SparkStreaming的應用場景是?A、基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘B、圖結構數(shù)據(jù)的處理C、基于歷史數(shù)據(jù)的交互式查詢D、基于實時數(shù)據(jù)流的數(shù)據(jù)處理【正確答案】:D83.在HDFS中,默認一個塊多大?A、64MBB、32KBC、128KBD、16KB【正確答案】:A84.關于MapReduce1.0的體系結構的描述,下列說法錯誤的是?A、Task分為MapTask和ReduceTask兩種,分別由JobTracker和TaskTracker啟動B、slot分為Mapslot和Reduceslot兩種,分別供MapTask和ReduceTask使用C、TaskTracker使用“slot”等量劃分本節(jié)點上的資源量(CPU、內存等)D、TaskTracker會周期性接收JobTracker發(fā)送過來的命令并執(zhí)行相應的操作(如啟

動新任務、殺死任務等)【正確答案】:A85.下列關于列族數(shù)據(jù)庫的描述,哪一項是錯誤的?A、查找速度慢,可擴展性差B、功能較少,大都不支持強事務一致性C、容易進行分布式擴展D、復雜性低【正確答案】:A86.關于Hive和傳統(tǒng)關系數(shù)據(jù)庫的對比分析,下面描述錯誤的是:()A、Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫則依賴于本地文件系統(tǒng)B、傳統(tǒng)的關系數(shù)據(jù)庫可以針對多個列構建復雜的索引,Hive不支持索引C、Hive和傳統(tǒng)關系數(shù)據(jù)庫都支持分區(qū)D、傳統(tǒng)關系數(shù)據(jù)庫很難實現(xiàn)橫向擴展,Hive具有很好的水平擴展性【正確答案】:B87.Hadoop框架中最核心的設計是什么?A、為海量數(shù)據(jù)提供存儲的HDFS和對數(shù)據(jù)進行計算的MapReduceB、提供整個HDFS文件系統(tǒng)的NameSpace(命名空間)管理、塊管理等所有服務C、Hadoop不僅可以運行在企業(yè)內部的集群中,也可以運行在云計算環(huán)境中D、Hadoop被視為事實上的大數(shù)據(jù)處理標準【正確答案】:A88.下面關于Region的說法,哪個是錯誤的?A、同一個Region不會被分拆到多個Region服務器B、為了加快訪問速度,.META.表的全部Region都會被保存在內存中C、一個-ROOT-表可以有多個RegionD、為了加速尋址,客戶端會緩存位置信息,同時,需要解決緩存失效問題【正確答案】:C89.下面哪一項不是Hadoop的特性?A、可擴展性高B、只支持少數(shù)幾種編程語言C、成本低D、能在linux上運行【正確答案】:B90.、在Spark生態(tài)系統(tǒng)組件的應用場景中,下列哪項說法是錯誤的?A、Spark應用在復雜的批量數(shù)據(jù)處理B、SparkSQL是基于歷史數(shù)據(jù)的交互式查詢C、SparkStreaming是基于歷史數(shù)據(jù)的數(shù)據(jù)挖掘D、GraphX是圖結構數(shù)據(jù)的處理【正確答案】:C91.下列哪一項不屬于HDFS采用抽象的塊概念帶來的好處?A、簡化系統(tǒng)設計B、支持大規(guī)模文件存儲C、強大的跨平臺兼容性D、適合數(shù)據(jù)備份【正確答案】:C92.下列哪一個不屬于Hadoop的大數(shù)據(jù)層的功能?A、數(shù)據(jù)挖掘B、離線分析C、實時計算D、BI分析【正確答案】:C93.下列關于MapReduce的說法,哪個描述是錯誤的?A、MapReduce具有廣泛的應用,比如關系代數(shù)運算、分組與聚合運算等B、MapReduce將復雜的、運行于大規(guī)模集群上的并行計算過程高度地抽象到了兩個函數(shù)C、編程人員在不會分布式并行編程的情況下,也可以很容易將自己的程序運行在分布式系統(tǒng)上,完成海量數(shù)據(jù)集的計算D、不同的Map任務之間可以進行通信【正確答案】:D94.關于HBase的三層結構中各層次的名稱和作用的說法,哪個是錯誤的?A、Zookeeper文件記錄了用戶數(shù)據(jù)表的Region位置信息B、-ROOT-表記錄了.META.表的Region位置信息C、META.表保存了HBase中所有用戶數(shù)據(jù)表的Region位置信息D、Zookeeper文件記錄了-ROOT-表的位置信息【正確答案】:A95.下列選項中,關于HBase和BigTable的底層技術對應關系,哪個是錯誤的?A、GFS與HDFS相對應B、GFS與Zookeeper相對應C、MapReduce與HadoopMapReduce相對應D、Chubby與Zookeeper相對應【正確答案】:B96.下列關于鍵值數(shù)據(jù)庫的描述,哪一項是錯誤的?()A、擴展性好,靈活性好B、大量寫操作時性能高C、無法存儲結構化信息D、條件查詢效率高【正確答案】:D97.下列哪個不屬于YARN體系結構中ApplicationMaster的功能?A、任務調度、監(jiān)控與容錯B、為應用程序申請資源C、將申請的資源分配給內部任務D、處理來自ResourceManger的命令【正確答案】:D1.信息科技為大數(shù)據(jù)時代提供哪些技術支撐?A、存儲設備容量不斷增加B、網(wǎng)絡帶寬不斷增加CPU處理能力大幅提升D、數(shù)據(jù)量不斷增大【正確答案】:ABC2.數(shù)據(jù)庫事務具有ACID四性,下面哪幾項屬于四性?A、原子性B、持久性C、間斷性D、一致性【正確答案】:ABD3.數(shù)據(jù)節(jié)點(DataNode)的主要功能包括哪些?A、負責數(shù)據(jù)的存儲和讀取B、根據(jù)客戶端或者是名稱節(jié)點的調度來進行數(shù)據(jù)的存儲和檢索C、向名稱節(jié)點定期發(fā)送自己所存儲的塊的列表D、用來保存名稱節(jié)點中對HDFS元數(shù)據(jù)信息的備份,并減少名稱節(jié)點重啟的時間【正確答案】:ABC4.下列哪些選項屬于Hadoop的缺點?A、表達能力有限B、磁盤IO開銷大C、延遲高D、在前一個任務執(zhí)行完成之前,其他任務就無法開始,難以勝任復雜、多階段的計算任務【正確答案】:ABCD5.HBase與傳統(tǒng)的關系數(shù)據(jù)庫的區(qū)別主要體現(xiàn)在以下哪幾個方面?A、數(shù)據(jù)類型B、數(shù)據(jù)操作C、存儲模式D、數(shù)據(jù)維護【正確答案】:ABCD6.下列選項中,哪些屬于Hadoop1.0的核心組件的不足之處?A、實時性差(適合批處理,不支持實時交互式)B、資源浪費(Map和Reduce分兩階段執(zhí)行)C、執(zhí)行迭代操作效率低D、難以看到程序整體邏輯【正確答案】:ABCD7.下面哪個屬于大數(shù)據(jù)的應用領域?A、智能醫(yī)療研發(fā)B、監(jiān)控身體情況C、實時掌握交通狀況D、金融交易【正確答案】:ABCD8.云計算關鍵技術包括什么?A、分布式存儲B、虛擬化C、分布式計算D、多租戶【正確答案】:ABCD9.Hadoop生態(tài)系統(tǒng)中Hive與其他部分的關系的描述正確的是:()A、HDFS作為高可靠的底層存儲,用來存儲Hive的海量數(shù)據(jù)B、MapReduce對這些海量數(shù)據(jù)進行批處理,實現(xiàn)Hive的高性能計算C、當采用MapRedue作為Hive的執(zhí)行引擎時,用HiveQL語句編寫的處理邏輯,最終都要轉化為MapReduce任務來運行D、HBase與Hive的功能是互補的,它實現(xiàn)了Hive不能提供的功能【正確答案】:ABCD10.MapReduce相較于傳統(tǒng)的并行計算框架有什么優(yōu)勢?A、非共享式,容錯性好B、普通PC機,便宜,擴展性好C、編程簡單,只要告訴MapReduce做什么即可D、批處理、非實時、數(shù)據(jù)密集型【正確答案】:ABCD11.與HadoopMapReduce計算框架相比,Spark所采用的Executor具有哪些優(yōu)點?A、利用多線程來執(zhí)行具體的任務,減少任務的啟動開銷B、Executor中有一個BlockManager存儲模塊,有效減少IO開銷C、提供了一種高度受限的共享內存模型D、不同場景之間輸入輸出數(shù)據(jù)能做到無縫共享【正確答案】:AB12.下面關于NoSQL與關系數(shù)據(jù)庫的比較,哪些是正確的?A、關系數(shù)據(jù)庫以完善的關系代數(shù)理論作為基礎,有嚴格的標準B、關系數(shù)據(jù)庫可擴展性較差,無法較好支持海量數(shù)據(jù)存儲C、NoSQL可以支持超大規(guī)模數(shù)據(jù)存儲D、NoSQL數(shù)據(jù)庫缺乏數(shù)學理論基礎,復雜查詢性能不高【正確答案】:ABCD13.物聯(lián)網(wǎng)的關鍵技術包括哪些?A、識別和感知技術B、網(wǎng)絡與通信技術C、數(shù)據(jù)挖掘與融合技術D、信息處理一體化技術【正確答案】:ABC14.下列說法中,哪些選項描述正確?A、Spark在借鑒HadoopMapReduce優(yōu)點的同時,很好地解決了MapReduce所面臨的問題B、Spark的計算模式也屬于MapReduce,但不局限于Map和Reduce操作C、HadoopMapReduce編程模型比Spark更靈活D、HadoopMapReduce提供了內存計算,可將中間結果放到內存中,對于迭代運算效率更高【正確答案】:AB15.下列關于MySQL集群的描述,哪些是正確的?A、復雜性:部署、管理、配置很復雜B、數(shù)據(jù)庫復制:MySQL主備之間一般采用復制方式,很多時候是異步復制C、擴容問題:如果系統(tǒng)壓力過大需要增加新的機器,這個過程涉及數(shù)據(jù)重新劃分D、動態(tài)數(shù)據(jù)遷移問題:如果某個數(shù)據(jù)庫組壓力過大,需要將其中部分數(shù)據(jù)遷移出去【正確答案】:ABCD16.HDFS要實現(xiàn)以下哪幾個目標?A、兼容廉價的硬件設備B、流數(shù)據(jù)讀寫C、大數(shù)據(jù)集D、復雜的文件模型【正確答案】:ABC17.大數(shù)據(jù)對社會發(fā)展的影響有哪些?A、大數(shù)據(jù)成為一種新的決策方式B、大數(shù)據(jù)應用促進信息技術與各行業(yè)的深度融合C、大數(shù)據(jù)開發(fā)推動新技術和新應用的不斷涌現(xiàn)D、大數(shù)據(jù)對社會發(fā)展沒有產生積極影響【正確答案】:ABC18.Impala主要由哪幾個部分組成:()A、ImpaladB、StateStoreCLID、Hive【正確答案】:ABC19.下面哪個屬于不斷完善的Hadoop生態(tài)系統(tǒng)中的組件?A、PigB、TezC、KafkaDN8【正確答案】:ABC20.JobTracker主要包括哪三大功能?A、資源管理B、任務調度C、任務監(jiān)控D、數(shù)據(jù)即服務【正確答案】:ABC21.、在實際應用中,大數(shù)據(jù)處理主要包括以下哪三個類型?A、復雜的批量數(shù)據(jù)處理:通常時間跨度在數(shù)十分鐘到數(shù)小時之間B、基于歷史數(shù)據(jù)的交互式查詢:通常時間跨度在數(shù)十秒到數(shù)分鐘之間C、基于實時數(shù)據(jù)流的數(shù)據(jù)處理:通常時間跨度在數(shù)十秒到數(shù)分鐘之間D、基于實時數(shù)據(jù)流的數(shù)據(jù)處理:通常時間跨度在數(shù)百毫秒到數(shù)秒之間【正確答案】:ABD22.、Spark采用RDD以后能夠實現(xiàn)高效計算的原因主要在于?A、高效的容錯性B、中間結果持久化到內存,數(shù)據(jù)在內存中的多個C、存放的數(shù)據(jù)可以是Java對象,避免了不必要的對象序列化和反序列化D、采用數(shù)據(jù)復制實現(xiàn)容錯【正確答案】:ABC23.、傳統(tǒng)數(shù)據(jù)倉庫面臨哪些挑戰(zhàn):()A、.無法滿足快速增長的海量數(shù)據(jù)存儲需求B、.無法有效處理不同類型的數(shù)據(jù)C、具有很強的擴展性D、計算和處理能力不足【正確答案】:ABD24.HDFS的命名空間包含什么?A、磁盤B、文件C、塊D、目錄【正確答案】:BCD25.以下屬于Hive的基本數(shù)據(jù)類型是:()A、TINYINTB、FLOATC、STRINGD、BINARY【正確答案】:ABCD26.MapReduce體系結構主要由以下那幾個部分構成?A、ClientB、JobTrackerC、TaskTrackerD、Task【正確答案】:ABCD27.一個基本的Hadoop集群中的節(jié)點主要包括什么?A、DataNode:存儲被拆分的數(shù)據(jù)塊B、JobTracker:協(xié)調數(shù)據(jù)計算任務C、TaskTracker:負責執(zhí)行由JobTracker指派的任務D、SecondaryNameNode:幫助NameNode收集文件系統(tǒng)運行的狀態(tài)信息【正確答案】:ABCD28.下列對于客服端的描述,哪些是正確的?A、客戶端是用戶操作HDFS最常用的方式,HDFS在部署時都提供了客戶端B、HDFS客戶端是一個庫,暴露了HDFS文件系統(tǒng)接口C、嚴格來說,客戶端并不算是HDFS的一部分D、客戶端可以支持打開、讀取、寫入等常見的操作【正確答案】:ABCD29.當處理CAP的問題時,可以有哪幾個明顯的選擇?A、CA:也就是強調一致性(C)和可用性(A),放棄分區(qū)容忍性(P)B、CP:也就是強調一致性(C)和分區(qū)容忍性(P),放棄可用性(A)C、AP:也就是強調可用性(A)和分區(qū)容忍性(P),放棄一致性(C)D、CAP:也就是同時兼顧可用性(A)、分區(qū)容忍性(P)和一致性(C),當時系統(tǒng)性能會下降很多【正確答案】:ABC30.HDFS采用抽象的塊概念可以帶來以下哪幾個明顯的好處?A、支持大規(guī)模文件存儲B、支持小規(guī)模文件存儲C、適合數(shù)據(jù)備份D、簡化系統(tǒng)設計【正確答案】:ACD31.大數(shù)據(jù)的兩個核心技術是什么?A、分布式存儲B、分布式應用C、分布式處理D、集中式存儲【正確答案】:AC32.下列關于圖數(shù)據(jù)庫的描述,哪些是正確的?A、專門用于處理具有高度相互關聯(lián)關系的數(shù)據(jù)B、比較適合于社交網(wǎng)絡、模式識別、依賴分析、推薦系統(tǒng)以及路徑尋找等問題C、靈活性高,支持復雜的圖算法D、復雜性高,只能支持一定的數(shù)據(jù)規(guī)?!菊_答案】:ABCD33.Hive的復雜數(shù)據(jù)類型包括()。ARRAYB、MAPC、STRUCTD、UNION【正確答案】:ABCD34.Spark具有以下哪幾個主要特點?A、運行速度快B、容易使用C、通用性D、運行模式單一【正確答案】:ABC35.HBase的實現(xiàn)包括哪三個主要的功能組件?A、庫函數(shù):鏈接到每個客戶端B、一個Master主服務器C、許多個Region服務器D、廉價的計算機集群【正確答案】:ABC36.在HDFS中,名稱節(jié)點(NameNode)主要保存了哪些核心的數(shù)據(jù)結構?A、FsImageB、DN8C、BlockD、EditLog【正確答案】:AD37.YARN體系結構主要包括哪三部分?A、ResourceManagerB、NodeManagerC、DataManagerD、ApplicationMaster【正確答案】:ABD38.以下哪些是數(shù)據(jù)倉庫的特性:()A、面向主題的(SubjectOriented)B、集成的(Integrated)C、相對穩(wěn)定的(Non-Volatile)D、反映歷史變化【正確答案】:ABCD39.第三次信息化浪潮的標志是哪些技術的興起?A、個人計算機B、物聯(lián)網(wǎng)C、云計算D、大數(shù)據(jù)【正確答案】:BCD40.HBase訪問接口類型包括哪些?A、NativeJavaAPIB、HBaseShellC、ThriftGatewayD、RESTGateway【正確答案】:ABCD41.Hadoop的特性包括哪些?A、高可擴展性B、支持多種編程語言C、成本低D、運行在Linux平臺上【正確答案】:ABCD42.對于MapReduce而言,其處理單位是split。split是一個邏輯概念,它包含哪些元數(shù)據(jù)信息?A、數(shù)據(jù)起始位置B、數(shù)據(jù)長度C、數(shù)據(jù)所在節(jié)點D、數(shù)據(jù)大小【正確答案】:AB43.下列關于Hadoop的描述,哪些是錯誤的?A、只能支持一種編程語言B、具有較差的跨平臺特性C、可以部署在廉價的計算機集群中D、曾經被公認為行業(yè)大數(shù)據(jù)標準開源軟件【正確答案】:AB44.云計算的服務模式和類型主要包括哪三類?A、軟件即服務(SaaS)B、平臺即服務(PaaS)C、基礎設施即服務(IaaS)D、數(shù)據(jù)采集即服務(DaaS)【正確答案】:ABC45.下列關于數(shù)據(jù)模型的描述,哪些是正確的?A、HBase采用表來組織數(shù)據(jù),表由行和列組成,列劃分為若干個列族B、每個HBase表都由若干行組成,每個行由行鍵(rowkey)來標識C、列族里的數(shù)據(jù)通過列限定符(或列)來定位D、每個單元格都保存著同一份數(shù)據(jù)的多個版本,這些版本采用時間戳進行索引【正確答案】:ABCD46.、Scala具有以下哪幾個主要特點?A、Scala的優(yōu)勢是提供了REPL(Read-Eval-PrintLoop,交互式解釋器),提高程序開發(fā)效率B、Scala兼容Java,運行速度快,且能融合到Hadoop生態(tài)圈中C、Scala具備強大的并發(fā)性,支持函數(shù)式編程D、Scala可以更好地支持分布式系統(tǒng)【正確答案】:ABCD47.Hadoop的優(yōu)化與發(fā)展主要體現(xiàn)在哪幾個方面?A、Hadoop自身核心組件MapReduce的架構設計改進B、Hadoop自身核心組件HDFS的架構設計改進C、Hadoop生態(tài)系統(tǒng)其它組件的不斷豐富D、Hadoop生態(tài)系統(tǒng)減少不必要的組件,整合系統(tǒng)【正確答案】:ABC48.Hadoop集群的整體性能主要受到什么因素影響?A、CPU性能B、內存C、網(wǎng)絡D、存儲容量【正確答案】:ABCD49.關于Hive與傳統(tǒng)關系數(shù)據(jù)庫的對比分析,下面描述正確的是:()A、.在數(shù)據(jù)存儲方面,Hive一般依賴于分布式文件系統(tǒng)HDFS,而傳統(tǒng)數(shù)據(jù)庫則依賴于本地文件系統(tǒng)B、在索引方面,傳統(tǒng)的關系數(shù)據(jù)庫可以針對多個列構建復雜的索引,大幅度提升數(shù)據(jù)查詢性能,而Hive不像傳統(tǒng)的關系型數(shù)據(jù)庫那樣有鍵的概念,它只能提供有限的索引功能C、在分區(qū)方面,傳統(tǒng)的數(shù)據(jù)庫提供分區(qū)功能來改善大型表以及具有各種訪問模式的表的可伸縮性、可管理性,以及提高數(shù)據(jù)庫效率;Hive不支持分區(qū)功能D、.在執(zhí)行引擎方面,傳統(tǒng)的關系數(shù)據(jù)庫依賴自身的執(zhí)行引擎,而Hive則依賴于

M.apReduce、Tez和Spark等執(zhí)行引擎【正確答案】:ABD50.、Spark支持哪三種不同類型的部署方式?A、Standalone(類似于MapReduce1.0,slot為資源分配單位)B、SparkonMesos(和Spark有血緣關系,更好支持Mesos)C、SparkonYARND、SparkonHDFS【正確答案】:ABC51.、數(shù)據(jù)倉庫Hive的執(zhí)行引擎可以是:()A、TezB、MapReduceC、PigD、Spark【正確答案】:ABD52.MapReduce的作業(yè)主要包括什么?A、從磁盤或從網(wǎng)絡讀取數(shù)據(jù),即IO密集工作B、計算數(shù)據(jù),即CPU密集工作C、針對不同的工作節(jié)點選擇合適硬件類型D、負責協(xié)調集群中的數(shù)據(jù)存儲【正確答案】:AB53.下列哪一項不屬于Hadoop的特性?A、較低可擴展性B、只支持java語言C、成本低D、運行在Linux平臺上【正確答案】:AB54.下列關于MapReduce的體系結構的描述,說法正確的有?A、用戶編寫的MapReduce程序通過Client提交到JobTracker端B、JobTracker負責資源監(jiān)控和作業(yè)調度C、TaskTracker監(jiān)控所有TaskTracker與Job的健康狀況D、TaskTracker使用“slot”等量劃分本節(jié)點上的資源量(CPU、內存等)【正確答案】:ABD55.HDFS1.0主要存在哪些問題?A、單點故障問題B、不可以水平擴展C、單個名稱節(jié)點難以提供不同程序之間的隔離性D、系統(tǒng)整體性能受限于單個名稱節(jié)點的吞吐量【正確答案】:ACD56.HDFS特殊的設計,在實現(xiàn)優(yōu)良特性的同時,也使得自身具有一些應用局限性,主要包括以下哪幾個方面?A、較差的跨平臺兼容性B、無法高效存儲大量小文件C、不支持多用戶寫入及任意修改文件D、不適合低延遲數(shù)據(jù)訪問【正確答案】:BCD57.MapReduce的具體應用包括哪些?A、關系代數(shù)運算(選擇、投影、并、交、差、連接)B、分組與聚合運算C、矩陣-向量乘法D、矩陣乘法【正確答案】:ABCD58.下列關于Region服務器工作原理的描述,哪些是正確的?A、每個Region服務器都有一個自己的HLog文件B、每次刷寫都生成一個新的StoreFile,數(shù)量太多,影響查找速度C、合并操作比較耗費資源,只有數(shù)量達到一個閾值才啟動合并D、Store是Region服務器的核心【正確答案】:ABCD59.NoSQL的三大基石?A、CAPB、最終一致性C、BASEDN8【正確答案】:ABC60.下列關于Map端的Shuffle的描述,哪些是正確的?A、MapReduce默認為每個Map任務分配1000MB緩存B、多個溢寫文件歸并成一個或多個大文件,文件中的鍵值對是排序的C、當數(shù)據(jù)很少時,不需要溢寫到磁盤,直接在緩存中歸并,然后輸出給ReduceD、每個Map任務分配多個緩存,使得任務運行更有效率【正確答案】:BC61.、Spark運行架構具有以下哪些特點?A、每個Application都有自己專屬的Executor進程,并且該進程在Application運行期間一直駐留B、Executor進程以多線程的方式運行TaskC、Spark運行過程與資源管理器無關,只要能夠獲取Executor進程并保持通信即可D、Task采用了數(shù)據(jù)本地性和推測執(zhí)行等優(yōu)化機制【正確答案】:ABCD62.關系數(shù)據(jù)庫引以為傲的兩個關鍵特性(完善的事務機制和高效的查詢機制),到了Web2.0時代卻成了雞肋,主要表現(xiàn)在以下哪幾個方面?A、Web2.0網(wǎng)站系統(tǒng)通常不要求嚴格的數(shù)據(jù)庫事務B、Web2.0網(wǎng)站系統(tǒng)基本上不用關系數(shù)據(jù)庫來存儲數(shù)據(jù)C、Web2.0并不要求嚴格的讀寫實時性D、Web2.0通常不包含大量復雜的SQL查詢【正確答案】:ACD63.關于NoSQL的三大基石之一的CAP,下列哪些說法是正確的?A、一致性,是指任何一個讀操作總是能夠讀到之前完成的寫操作的結果量B、一個分布式系統(tǒng)可以同時滿足一致性、可用性和分區(qū)容忍性這三個需求C、可用性,是指快速獲取數(shù)據(jù)D、分區(qū)容忍性,是指當出現(xiàn)網(wǎng)絡分區(qū)的情況時(即系統(tǒng)中的一部分節(jié)點無法和其

他節(jié)點進行通信),分離的系統(tǒng)也能夠正常運行【正確答案】:ACD64.HBase的三層結構中,三層指的是哪三層?A、Zookeeper文件B、-ROOT-表C、META.表D、數(shù)據(jù)類型【正確答案】:ABC65.關系數(shù)據(jù)庫已經無法滿足Web2.0的需求,主要表現(xiàn)在以下幾個方面?A、無法滿足海量數(shù)據(jù)的管理需求B、無法滿足數(shù)據(jù)高并發(fā)的需求C、無法滿足高可擴展性和高可用性的需求D、使用難度高【正確答案】:ABC66.Zookeeper是一個很好的集群管理工具,被大量用于分布式計算,它主要提供什么服務?A、配置維護B、域名服務C、分布式同步D、負載均衡服務【正確答案】:ABC67.大數(shù)據(jù)具有哪些特點?A、數(shù)據(jù)的“大量化”B、數(shù)據(jù)的“快速化”C、數(shù)據(jù)的“多樣化”D、數(shù)據(jù)的“價值密度比較低”【正確答案】:ABCD68.下列關于Hadoop的描述,哪些是正確的?A、為用戶提供了系統(tǒng)底層細節(jié)透明的分布式基礎架構B、具有很好的跨平臺特性C、可以部署在廉價的計算機集群中D、曾經被公認為行業(yè)大數(shù)據(jù)標準開源軟件【正確答案】:ABCD69.Hive主要由哪三個模塊組成:()A、用戶接口模塊B、.用戶查詢模塊C、驅動模塊D、元數(shù)據(jù)存儲模塊【正確答案】:ABD70.、在實際應用中,當采用多種計算架構來滿足不同應用場景需求時,大數(shù)據(jù)處理難免會帶來哪些問題?A、不同場景之間輸入輸出數(shù)據(jù)無法做到無縫共享,通常需要進行數(shù)據(jù)格式的轉換B、不同的軟件需要不同的開發(fā)和維護團隊C、需要較高的使用成本D、比較難以對同一個集群中的各個系統(tǒng)進行統(tǒng)一的資源協(xié)調和分配【正確答案】:ABCD71.HDFS數(shù)據(jù)塊多副本存儲具備以下哪些優(yōu)點?A、加快數(shù)據(jù)傳輸速度B、容易檢查數(shù)據(jù)錯誤C、保證數(shù)據(jù)可靠性D、適合多平臺上運行【正確答案】:ABC72.下列關于文檔數(shù)據(jù)庫的描述,哪些是正確的?A、性能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論