云南農(nóng)業(yè)大學(xué)2020-2021大數(shù)據(jù)技術(shù)及應(yīng)用期末考試_第1頁
云南農(nóng)業(yè)大學(xué)2020-2021大數(shù)據(jù)技術(shù)及應(yīng)用期末考試_第2頁
云南農(nóng)業(yè)大學(xué)2020-2021大數(shù)據(jù)技術(shù)及應(yīng)用期末考試_第3頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

云南農(nóng)業(yè)大學(xué)2020-2021大數(shù)據(jù)技術(shù)及應(yīng)用期末考試2020-2021大數(shù)據(jù)技術(shù)及應(yīng)用期末考試,請(qǐng)大家誠信考試,認(rèn)真作答!請(qǐng)認(rèn)真填寫考生基本信息:[矩陣文本題]*姓名:姓名:學(xué)號(hào):專業(yè):1、云計(jì)算分層架構(gòu)不包括()。[單選題]*AA、IaasB、PaasC、SaasD、Yaas(正確答案)2、美國海軍軍官莫里通過對(duì)前人航海日志的分析,繪制考了新的航海路線圖,標(biāo)明了大風(fēng)與洋流可能發(fā)生的地點(diǎn)。這體現(xiàn)了大數(shù)據(jù)分析理念中的()。[單選題]*AA、在數(shù)據(jù)基礎(chǔ)上傾向于全體數(shù)據(jù)而不是抽樣數(shù)據(jù)B、在分析方法上更注重相關(guān)分析而不是因果分析(正確答案)C、在分析效果上更追究效率而不是絕對(duì)精確D、在數(shù)據(jù)規(guī)模上強(qiáng)調(diào)相對(duì)數(shù)據(jù)而不是絕對(duì)數(shù)據(jù)3、下列關(guān)于聚類挖報(bào)技術(shù)的說法中,錯(cuò)誤的是()。[單選題]*AA、不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別B、要求同類數(shù)據(jù)的內(nèi)容相似度盡可能小(正確答案)C、要求不同類數(shù)據(jù)的內(nèi)容相儀度盡可能小D、與分類挖據(jù)技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理4、大數(shù)據(jù)的利用過程是()[單選題]*AA、果集-挖提-清洗-統(tǒng)計(jì)B、果集一統(tǒng)計(jì)-清洗一挖據(jù)C、采集-清洗一挖據(jù)-統(tǒng)計(jì)D、采集一清洗--統(tǒng)計(jì)-挖據(jù)(正確答案)5、大數(shù)據(jù)的本質(zhì)是()[單選題]*AA、洞察(正確答案)B、采集C、統(tǒng)計(jì)D、聯(lián)系6、下面哪個(gè)()程序通常與NamenodeA在ー個(gè)節(jié)點(diǎn)啟動(dòng)。[單選題]*AA、TasktrackerB、DatanodeC、Jobtracker(正確答案)D、secondarynamenode7、HDFS默認(rèn)BlockSize()。[單選題]*AA、16MB、32MC、64M(正確答案)D、128M8、云計(jì)算是對(duì)()技術(shù)的發(fā)展與運(yùn)用。[單選題]*AA、并行計(jì)算B、分布式計(jì)算C、網(wǎng)格計(jì)算D、以上都是(正確答案)9、()是用于處理海量數(shù)據(jù)的并行編程模式和大規(guī)模數(shù)據(jù)集的并行運(yùn)算的軟件架構(gòu)。[單選題]*AA、GFSB、Mapreduce(正確答案)C、BittableD、Chubby10、在Bigtable中,()主要用來存儲(chǔ)子表數(shù)據(jù)以及一些日志文件。[單選題]*AA、GFS(正確答案)B、MapreduceC、SstableDD、Chubby11、推薦系統(tǒng)為客戶推薦商品,自動(dòng)完成個(gè)性化選擇商品的過程,滿足客戶的個(gè)性化需求,推薦基于網(wǎng)站最熱賣商品、客戶所處城市、(),推測(cè)客戶將來可能的購買行為。[單選題]*AA、客戶的朋友B、客戶過去的購買行為和購買記錄(正確答案)C、客戶的興趣愛好D、客戶的個(gè)人信息12、下列關(guān)于普查的缺點(diǎn)的說法中,正確的是()。[單選題]*AA、工作量較大,容易導(dǎo)致調(diào)查內(nèi)容有限、產(chǎn)生重復(fù)和遺漏現(xiàn)象(正確答案)B、誤差不易被控制C、對(duì)樣本的依賴性比較強(qiáng)D、評(píng)測(cè)結(jié)果不夠穩(wěn)定13、假設(shè)一種基因同時(shí)導(dǎo)致兩件事情,一是使人喜歡抽煙,二是使這個(gè)人和肺癌就是()關(guān)系,而吸煙和肺癌則是(A)關(guān)系。[單選題]*AA、因果;相關(guān)(正確答案)B、相關(guān);因果C、并列;相關(guān)D、因果;并列14、醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項(xiàng)?()[單選題]*AA、個(gè)人健康管理數(shù)據(jù)B、診療數(shù)據(jù)C、公共安全數(shù)據(jù)(正確答案)D、健康檔案數(shù)據(jù)15、下面哪個(gè)進(jìn)程負(fù)責(zé)MapReduce任務(wù)調(diào)度。()[單選題]*AA、NameNodeB、Jobtracker(正確答案)C、TaskTrackerD、secondaryNameNode16、Hadoop1、0默認(rèn)的調(diào)度器策略是哪個(gè)。()[單選題]*AA、先進(jìn)先出調(diào)度器(正確答案)B、計(jì)算能力調(diào)度器C、公平調(diào)度器D、優(yōu)先級(jí)調(diào)度器A、Namenode,Datanode,TaskTrackerB、Namenode,Datanode,secondaryNameNodeC、Namenode,Datanode,HMaster17、在實(shí)驗(yàn)集群的master節(jié)點(diǎn)使用A、Namenode,Datanode,TaskTrackerB、Namenode,Datanode,secondaryNameNodeC、Namenode,Datanode,HMasterDD、Namenode,JobTracker,secondaryNameNode(正確答案)18MapReducekeyvalueMapReduce不適宜的運(yùn)算。()[]*AA、MaxB、MinC、CountD、Average(正確答案)19、MapReduce編程模型,鍵值對(duì)<key,value>的key必須實(shí)現(xiàn)哪個(gè)接口?()[單選題]*AA、WritableComparable(正確答案)B、ComparableC、WritableD、LongWritable20、HBase數(shù)據(jù)庫的BlockCache緩存的數(shù)據(jù)塊中,哪一項(xiàng)不一定能提高效率。()[單選題]*ROOT表B、.META.表C、HFileindexD、普通的數(shù)據(jù)塊(正確答案)21、HBase是分布式列式存儲(chǔ)系統(tǒng),記錄按什么集中存放。()[單選題]*AA、列族(正確答案)B、列C、行D、不確定22、HBase的Region組成中,必須要有以下哪一項(xiàng)。()[單選題]*AA、StoreFileB、MemStore(正確答案)C、HFileD、MetaStore23、客戶端首次查詢HBase數(shù)據(jù)庫時(shí),首先需要從哪個(gè)表開始查找。()[單選題]*AA、.META.ROOT-正確答案)C、用戶表D、信息表24、設(shè)計(jì)分布式數(shù)據(jù)倉庫hive的數(shù)據(jù)表時(shí),為取樣更高效,一般可以對(duì)表中的連續(xù)字段進(jìn)行什么操作。()[單選題]*AA、分桶(正確答案)B、分區(qū)C、索引DD、分表25、MongoDB是一種NoSQL數(shù)據(jù)庫,具體地說,是()存儲(chǔ)數(shù)據(jù)庫。[單選題]*AA、鍵值B、文檔(正確答案)C、圖形D、XML26、下列關(guān)于MapReduce的說法錯(cuò)誤的是()[單選題]*AA、MapReduce將復(fù)雜的、運(yùn)行于大規(guī)模集群上的并行計(jì)算過程高度地抽象到了兩個(gè)函數(shù):Map和ReduceMapReduce采用“分而治之”集,會(huì)被切分成許多獨(dú)立的分片(split)Map任務(wù)并行處理C、MapReduce設(shè)計(jì)的一個(gè)理念就是“計(jì)算向數(shù)據(jù)靠攏”,而不是“數(shù)據(jù)向計(jì)算靠攏”,因?yàn)椋苿?dòng)數(shù)據(jù)需要大量的網(wǎng)絡(luò)傳輸開銷DMapReduceJava來寫(正確答案)27、下面與Zookeeper類似的框架是()[單選題]*AA、ProtobufB、JavaC、KafkaD、Chubby(正確答案)28、關(guān)于Hive與Hadoop其他組件的關(guān)系,描述錯(cuò)誤的是()。[單選題]*AA、HIVE最終將數(shù)據(jù)存儲(chǔ)在HDFS中HiveSQLMapReduce任務(wù)CHiveHadoop平臺(tái)的數(shù)據(jù)倉庫工具?DHiveHBase有強(qiáng)依賴(正確答案)29、下面不屬于Hadoop安裝步驟的是()。[單選題]*AAJDKJava環(huán)境變量B、設(shè)置免密碼登錄CEclipse集成開發(fā)環(huán)境(正確答案)DHadoopHadoop30、根據(jù)管理數(shù)據(jù)的模式分類,NoSQL系統(tǒng)可以分為不包括()。[單選題]*AA、鍵值系統(tǒng)B、文檔存儲(chǔ)系統(tǒng)C、圖數(shù)據(jù)庫D、語音管理系統(tǒng)(正確答案)1、下面對(duì)HBase的描述哪些是正確的()。*AA、不是開源的B、是面向列的(正確答案)C、是分布式的(正確答案)DNoSQL數(shù)據(jù)庫(正確答案)2、下列關(guān)于大數(shù)據(jù)的說法中,錯(cuò)誤的是()。*AA、大數(shù)據(jù)具有體量大、結(jié)構(gòu)單一、時(shí)效性強(qiáng)的特征(正確答案)B、處理大數(shù)據(jù)需采用新型計(jì)算架構(gòu)和智能算法等新技術(shù)C、大數(shù)據(jù)的應(yīng)用注重相關(guān)分析而不是因果分析D、大數(shù)據(jù)的應(yīng)用注重因果分析而不是相關(guān)分析(正確答案)3、有關(guān)HDFS文件系統(tǒng)說法正確的是以下那些()。*AAHDFS本身是個(gè)高可用系統(tǒng)架構(gòu)(正確答案)HDFSNameNode、DataNode架構(gòu)CHDFS數(shù)據(jù)副本的數(shù)量越大越好DHDFSNameNode分主備,主備不同時(shí)對(duì)外服(正確答案)4、大數(shù)據(jù)應(yīng)用于各行業(yè),下面關(guān)于大數(shù)據(jù)的說法正確的是()。*AA、美國的Target百貨上線了一套客戶分析工具,對(duì)顧客的購買記錄進(jìn)行分析,比女孩的父親更加早知道女孩懷孕(正確答案)30000知道哪些早產(chǎn)兒出現(xiàn)問題并且有針對(duì)性進(jìn)采取措施(正確答案)C、ExpressScripts通過一些復(fù)雜模型來檢測(cè)虛假藥品,及時(shí)提醒人們何時(shí)應(yīng)該停止用藥(正確答案)D、三者皆不是5、IBM公司用3個(gè)V來描述大數(shù)據(jù)的三個(gè)基本特征,這3V是()。*AA、體量(正確答案)B、規(guī)模C、速度(正確答案)DD、多樣性(正確答案)E、復(fù)雜性6、MapReduce基于Google發(fā)布的MapReduce論文設(shè)計(jì)開發(fā),其具有如下哪些特點(diǎn)()。*AA、易于編程(正確答案)B、高速度C、良好的擴(kuò)展性(正確答案)D、高容錯(cuò)性(正確答案)7、MapReduce與HBase的關(guān)系,哪些描述是正確的()。*AAMapReduceHBase可以正常運(yùn)行的保證MapReduce,HBase可以正常運(yùn)行(正確答案)CMapReduceHBase(正確答案)D、它們之間沒有任何關(guān)系8、下面對(duì)HBase的描述哪些是正確的()。*AA、不是開源的B、是面向列的(正確答案)C、是分布式的(正確答案)DNoSQL數(shù)據(jù)庫(正確答案)9、有關(guān)HDFS文件系統(tǒng)說法正確的是以下那些()。*AAHDFS本身是個(gè)高可用系統(tǒng)架構(gòu)(正確答案)HDFSNameNode、DataNode架構(gòu)CHDFS數(shù)據(jù)副本的數(shù)量越大越好DHDFSNameNode分主備,主備不同時(shí)對(duì)外服(正確答案)10、下面哪些概念是HBase框架中使用的()。*AA、HDFS(正確答案)B、GridFSC、Zookeeper(正確答案)D、EXT311、NoSQL數(shù)據(jù)庫得以存在的三大理論基石是()。*AA、原子性CAP理論(正確答案)CBASE原理(正確答案)D、最終一致性(正確答案)12、在高階數(shù)據(jù)處理中,往往無法把整個(gè)流程寫在單個(gè)MapReduce作業(yè)中,下列關(guān)于鏈接MapReduce作業(yè)的說法,正確的是()。*AAJob和JobControl類可以管理非線性作業(yè)之間的依賴(正確答案)B、ChainMapper和ChainReducer類可以用來簡(jiǎn)化數(shù)據(jù)預(yù)處理和后處理的構(gòu)成(正確答案)CChainReducermapperreducerJobConf(正確答案)DD、ChainReducer.addMapper()方法中,一般對(duì)鍵/值對(duì)發(fā)送設(shè)置成值傳遞,性能好且安全性高13、NoSQL數(shù)據(jù)庫的分類主要有()。*AA、鍵值(Key-Value)存儲(chǔ)數(shù)據(jù)庫(正確答案)B、列存儲(chǔ)數(shù)據(jù)庫(正確答案)C、文檔型數(shù)據(jù)庫(正確答案)D、圖形(Graph)數(shù)據(jù)庫(正確答案)14、關(guān)于大數(shù)據(jù)的理念的描述,以下哪些不正確()。*AA、相關(guān)性比因果更重要B、要效率也要絕對(duì)精準(zhǔn)(正確答案)C、大數(shù)據(jù)的核心價(jià)值是預(yù)測(cè)D、遵從隱私和法律并非大數(shù)據(jù)的風(fēng)險(xiǎn)(正確答案)15、健值數(shù)據(jù)庫的相關(guān)產(chǎn)品主要包括()。*AA、Redis(正確答案)B、SimpleDB(正確答案)C、Memcached(正確答案)D、Chordless(正確答案)1、人們關(guān)心大數(shù)據(jù),最終是關(guān)心大數(shù)據(jù)的應(yīng)用,關(guān)心如何從業(yè)務(wù)和應(yīng)用出發(fā)讓大數(shù)據(jù)真正實(shí)現(xiàn)其所蘊(yùn)含的價(jià)值,從而為人們生產(chǎn)生活帶來有益的改變。[判斷題]*對(duì)對(duì)(正確答案)錯(cuò)錯(cuò)2、Hadoop是一個(gè)能夠讓用戶輕松架構(gòu)和使用的分布式計(jì)算平臺(tái)。用戶可以輕松地在Hadoop上開發(fā)和運(yùn)行處理海量數(shù)據(jù)的應(yīng)用程序。[判斷題]*對(duì)對(duì)(正確答案)錯(cuò)3、Hadoop自身具有嚴(yán)格的權(quán)限管理和安全措施保障集群正常運(yùn)行。[判斷題]*對(duì)對(duì)錯(cuò)(正確答案)4、HBase對(duì)于空/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論