南開大學(xué)20秋學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)(參考答案)_第1頁
南開大學(xué)20秋學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)(參考答案)_第2頁
南開大學(xué)20秋學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)(參考答案)_第3頁
南開大學(xué)20秋學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)(參考答案)_第4頁
南開大學(xué)20秋學(xué)期《大數(shù)據(jù)導(dǎo)論》在線作業(yè)(參考答案)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1.大數(shù)據(jù)的特點不包含()。A.數(shù)據(jù)體量大

B.價值密度高

C.處理速度快

D.數(shù)據(jù)不統(tǒng)一答案:D2.大數(shù)據(jù)的最顯著特征是()。A.數(shù)據(jù)規(guī)模大

B.數(shù)據(jù)類型多樣

C.數(shù)據(jù)處理速度快

D.數(shù)據(jù)價值密度高答案:A3.數(shù)據(jù)產(chǎn)生方式變革中數(shù)據(jù)產(chǎn)生方式是自動的主要是來自哪個階段?()A.運營式系統(tǒng)階段

B.用戶原創(chuàng)內(nèi)容階段

C.感知式系統(tǒng)階段答案:C4.下列哪個工具常用來開發(fā)移動友好地交互地圖?()A.Leaflet

B.Visual.ly

C.BPizzaPieCharts

D.Gephi答案:A5.醫(yī)療健康數(shù)據(jù)的基本情況不包括以下哪項?()A.診療數(shù)據(jù)

B.個人健康管理數(shù)據(jù)

C.公共安全數(shù)據(jù)

D.健康檔案數(shù)據(jù)答案:C6.數(shù)據(jù)倉庫是隨著時間變化的,下列不正確的是()。A.數(shù)據(jù)倉庫隨時間變化不斷增加新內(nèi)容

B.捕捉到的新數(shù)據(jù)會覆蓋原來的快照

C.數(shù)據(jù)倉庫隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容

D.數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會隨時間的變化不斷進行重新綜合答案:C7.IaaS是()的簡稱。A.軟件即服務(wù)

B.平臺即服務(wù)

C.基礎(chǔ)設(shè)施即服務(wù)

D.硬件即服務(wù)答案:C8.哪個選項不屬于大數(shù)據(jù)4V特點?()A.Volume

B.Valid

C.Variety

D.Value答案:B9.第一個提出大數(shù)據(jù)概念的公司是()。A.麥肯錫公司

B.谷歌公司

C.微軟公司

D.臉譜公司答案:A10.MapReduce中的Map和Reduce函數(shù)使用()進行輸入輸出。A.key/value對

B.隨機數(shù)值

C.其他計算結(jié)果答案:A11.數(shù)據(jù)清洗的方法不包括()。A.缺失值處理

B.噪聲數(shù)據(jù)清除

C.一致性檢查

D.重復(fù)數(shù)據(jù)記錄處理答案:D12.以下不是數(shù)據(jù)倉庫基本特征的是()。A.數(shù)據(jù)倉庫是面向主題的

B.數(shù)據(jù)倉庫是面向事務(wù)的

C.數(shù)據(jù)倉庫的數(shù)據(jù)是相對穩(wěn)定的

D.數(shù)據(jù)倉庫的數(shù)據(jù)是反映歷史變化的答案:B13.下列不屬于Google云計算平臺技術(shù)架構(gòu)的是()。A.并行數(shù)據(jù)處理MapReduce

B.分布式鎖Chubby

C.結(jié)構(gòu)化數(shù)據(jù)表BigTable

D.彈性云計算EC2答案:D14.下列哪個R語言擴展包可以創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖?()A.ggplot2

B.network

C.ggmaps

D.animation答案:B15.基礎(chǔ)設(shè)施即服務(wù)的英文簡稱是()。A.IaaS

B.PaaS

C.SaaS答案:A16.大數(shù)據(jù)時代預(yù)測人類移動行為的數(shù)據(jù)特點是()。A.多樣化

B.數(shù)據(jù)量大

C.維數(shù)高

D.變化快答案:BCD17.借助于大數(shù)據(jù)提供的()和(),政府可為農(nóng)業(yè)生產(chǎn)進行合理引導(dǎo),依據(jù)需求進行生產(chǎn),避免產(chǎn)能過剩造成不必要的資源和社會財富浪費。A.消費能力

B.趨勢報告

C.購物結(jié)果答案:AB18.關(guān)于R語言擴展包下列正確的是()。A.network可創(chuàng)建帶有點和邊的網(wǎng)絡(luò)圖

B.animation可制作一系列的圖像并將它們串聯(lián)起來做成動畫

C.ggmaps通過樹圖來可視化層次型數(shù)據(jù)

D.protfolio基于谷歌地圖、OpenStreetMap及其他地圖的空間數(shù)據(jù)可視化工具答案:AB19.網(wǎng)絡(luò)數(shù)據(jù)采集常用的是通過()或()等方式從網(wǎng)站上獲取數(shù)據(jù)信息。A.網(wǎng)絡(luò)爬蟲

B.網(wǎng)站公開API

C.手動獲取答案:AB20.數(shù)據(jù)分析的類型根據(jù)數(shù)據(jù)分析深度可以分為()。A.描述性分析

B.預(yù)測性分析s

C.規(guī)則性分析答案:ABC21.數(shù)據(jù)變換(DataTransformation)的方法有()。A.光滑

B.聚集

C.數(shù)據(jù)泛化

D.規(guī)范化答案:ABCD22.按照數(shù)據(jù)量的大小,可將數(shù)據(jù)分析分為()。A.內(nèi)存級數(shù)據(jù)分析

B.Bl級數(shù)據(jù)分析

C.海量級數(shù)據(jù)分析

D.巨量級數(shù)據(jù)分析答案:ABC23.可使用(),(),()進行光滑。A.最大值

B.箱中位數(shù)

C.箱邊界

D.箱均值答案:BCD24.常見的分類方法有()。A.決策樹

B.貝葉斯網(wǎng)絡(luò)

C.遺傳算法

D.FP算法答案:ABC25.醫(yī)療大數(shù)據(jù)特點:除了包含了大數(shù)據(jù)4個“V”的特點之外還有()。A.多態(tài)性

B.時效性

C.不完整性

D.冗余性答案:ABCD26.大數(shù)據(jù)在醫(yī)療中的應(yīng)用有()。A.流行性疾病預(yù)防

B.慢性病健康管理

C.臨床決策支持

D.醫(yī)療器械研發(fā)答案:ABCD27.一個HDFS集群由一個()和()構(gòu)成。此外,還有與這兩個角色之間作為溝通橋梁的客戶端(Client)。A.一個名字節(jié)點

B.若干個名字節(jié)點

C.一個數(shù)據(jù)節(jié)點

D.若干個數(shù)據(jù)節(jié)點答案:AD28.主流分布式計算平臺有()。A.google

B.IBM

C.baidu

D.Amazon答案:ABD29.大數(shù)據(jù)存儲的特點與挑戰(zhàn)有()。A.容量問題

B.延遲問題

C.安全問題

D.成本問題答案:ABCD30.百度大數(shù)據(jù)引擎主要包含()三大組件。A.開放云

B.數(shù)據(jù)工廠

C.百度大腦。答案:ABC31.減少已分配但未使用的存儲容量的浪費,在分配存儲空間時,系統(tǒng)按需分配存儲空間。()A.正確

B.錯誤答案:A32.廣播變量在廣播后可以修改。()A.正確

B.錯誤答案:B33.內(nèi)存級分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實時業(yè)務(wù)分析需求。()A.正確

B.錯誤答案:A34.云存儲中用戶需要按需付費并使用存儲服務(wù)。()A.正確

B.錯誤答案:A35.云存儲是指通過集群應(yīng)用、網(wǎng)絡(luò)技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能的一個系統(tǒng)。()A.正確

B.錯誤答案:A36.每個變量的最大值和最小值之差稱為極差。()A.正確

B.錯誤答案:A37.數(shù)據(jù)變換(DataTransformation)就是把原始數(shù)據(jù)轉(zhuǎn)化為適合于數(shù)據(jù)挖掘的數(shù)據(jù)形式。()A.正確

B.錯誤答案:A38.利用大數(shù)據(jù)技術(shù)對電子病歷中的數(shù)字化信息進行分析處理,既能夠讓醫(yī)生的診療有跡可循,還可以發(fā)現(xiàn)最有效的臨床路徑,從而及時為醫(yī)生提供最佳的診療建議。()A.正確

B.錯誤答案:A39.數(shù)據(jù)集成(DataIntegration)是將多個數(shù)據(jù)源中的數(shù)據(jù)合并存放到一個一致的數(shù)據(jù)存儲中。()A.正確

B.錯誤答案:A40.美國《自然》(Nature)雜志??猅henextgoogle,第一次正式提出“大數(shù)據(jù)”概念。()A.正確

B.錯誤答案:A41.用一個函數(shù)擬合數(shù)據(jù)來光滑數(shù)據(jù)稱為回歸。()A.正確

B.錯誤答案:A42.RDD是一種自定義的可并行數(shù)據(jù)容器,可以存放任意類型的數(shù)據(jù)。()A.正確

B.錯誤答案:A43.BI分析適用于總數(shù)據(jù)量在集群內(nèi)存的最大級別以內(nèi)的情況,使用內(nèi)部數(shù)據(jù)庫技術(shù),適合實時業(yè)務(wù)分析需求。()A.正確

B.錯誤答案:B44.云存儲是一個由網(wǎng)絡(luò)設(shè)備、存儲設(shè)備、服務(wù)器、應(yīng)用軟件、公用訪問接口、接入網(wǎng)和客戶端程序等組成的復(fù)雜系統(tǒng)。()A.正確

B.錯誤答案:A45.軌跡數(shù)據(jù)包含空間和時間屬性,并且通常規(guī)模巨大且維度高。()A.正確

B.錯誤答案:A46.預(yù)測性分析(PredictiveAnalysis)用于預(yù)測未來事件發(fā)生的概率和演化趨勢。()A.正確

B.錯誤答案:A47.數(shù)據(jù)存取和共享機制是大數(shù)據(jù)發(fā)展面臨的挑戰(zhàn)。()A.正確

B.錯誤答案:A48.21世紀時數(shù)據(jù)信息大發(fā)展的時代,移動互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)等極大拓寬了互聯(lián)網(wǎng)的邊界和應(yīng)用范圍,各種數(shù)據(jù)正在迅速膨脹并變大。()A.正確

B.錯誤答案:A49.交通數(shù)據(jù)集

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論