大數(shù)據(jù)工具應用知到智慧樹章節(jié)測試課后答案2024年秋廣東金融學院_第1頁
大數(shù)據(jù)工具應用知到智慧樹章節(jié)測試課后答案2024年秋廣東金融學院_第2頁
大數(shù)據(jù)工具應用知到智慧樹章節(jié)測試課后答案2024年秋廣東金融學院_第3頁
大數(shù)據(jù)工具應用知到智慧樹章節(jié)測試課后答案2024年秋廣東金融學院_第4頁
大數(shù)據(jù)工具應用知到智慧樹章節(jié)測試課后答案2024年秋廣東金融學院_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

大數(shù)據(jù)工具應用知到智慧樹章節(jié)測試課后答案2024年秋廣東金融學院第一章單元測試

2011年麥肯錫研究院提出的大數(shù)據(jù)定義是:大數(shù)據(jù)是指其大小超出了常規(guī)數(shù)據(jù)庫工具獲取、儲存、管理和(

)能力的數(shù)據(jù)集。

A:訪問

B:應用C:計算

D:分析

答案:分析用4V來概括大數(shù)據(jù)的特點的話,一般是指:Value、Velocity、Volume和(

)。

A:VagaryB:VainlyC:VarietyD:Valley

答案:Variety大數(shù)據(jù)分析四個方面的工作主要是:數(shù)據(jù)分類、(

)、關聯(lián)規(guī)則挖掘和時間序列預測。

A:數(shù)據(jù)統(tǒng)計

B:數(shù)據(jù)聚類

C:數(shù)據(jù)清洗

D:數(shù)據(jù)計算

答案:數(shù)據(jù)聚類

新浪和京東聯(lián)合推出的大數(shù)據(jù)商品推薦,是由京東盲目推送到當前瀏覽新浪網(wǎng)站的用戶的頁面上的。

A:錯B:對

答案:錯目前的大數(shù)據(jù)處理技術只能處理結(jié)構化數(shù)據(jù)。

A:對B:錯

答案:錯

第二章單元測試

我們常用的微軟Office套件中的Access數(shù)據(jù)庫軟件的數(shù)據(jù)庫文件格式后綴名是(

)。

A:dbf

B:mdb

C:xls

D:mdf

答案:mdb

大多數(shù)日志文件的后綴名是(

)。

A:csv

B:xml

C:txt

D:log

答案:log

本課程重點介紹的weka軟件的專有文件格式是(

)。

A:ARFFB:valueC:MongoDB

D:keymap

答案:ARFF數(shù)據(jù)清洗工作的目的主要是要解決數(shù)據(jù)的完整性、唯一性、合法性和(

)。

A:共享性

B:專業(yè)性

C:排他性

D:一致性

答案:一致性

八爪魚軟件的“自定義采集”工作方式下,需要在軟件里輸入一個(

)來作為采集的目標。

A:網(wǎng)頁地址

B:用戶名

C:電話號碼

D:關鍵詞

答案:網(wǎng)頁地址

八爪魚軟件的采集規(guī)則可以通過文件的形式來導入或者導出,這種文件的后綴名是(

)。

A:otd

B:jpg

C:png

D:gif

答案:otd

Excel可以通過“數(shù)據(jù)有效性”按鈕操作來規(guī)范數(shù)據(jù)輸入的范圍。

A:對B:錯

答案:對Excel不能導入txt或csv格式的文件。

A:錯B:對

答案:錯八爪魚軟件只能對軟件內(nèi)建了“簡易采集”規(guī)則的網(wǎng)站采集數(shù)據(jù)。

A:錯B:對

答案:錯八爪魚軟件進行自定義采集時,需要了解對網(wǎng)頁的頁面結(jié)構。

A:錯B:對

答案:對

第三章單元測試

使用DBSCAN算法對鳶尾花數(shù)據(jù)集(Iris.arff)進行聚類,將epsilon參數(shù)設置為0.2,minPoints參數(shù)設置為5,忽略class屬性,那么將形成(

)個簇。

A:

4B:

1C:

2D:

3

答案:

2使用EM算法對天氣數(shù)據(jù)集(weather.numeric.arff)進行聚類,將numClusters設置為4,即簇數(shù)為4,其他參數(shù)保持默認值,忽略play屬性,從結(jié)果中可知,下列選項中,(

)是錯誤的。

A:

模型的最大似然估計值是-7.18B:

這組數(shù)據(jù)用算法迭代15次C:

第四個簇的先驗概率是0.14D:

第四個簇的實例數(shù)為4

答案:

第四個簇的實例數(shù)為4

使用SimpleKMeans算法對天氣數(shù)據(jù)集(weather.numeric.arff)進行聚類,保持默認參數(shù),即3個簇以及歐氏距離。選擇play屬性為忽略屬性,從結(jié)果中可知,下列選項中,(

)是錯誤。

A:

產(chǎn)生了三個中心點B:

這組數(shù)據(jù)用算法迭代四次C:

聚合為3個簇,分別有7,3,4個實例D:

平方和誤差為8.928

答案:

這組數(shù)據(jù)用算法迭代四次使用線性回歸(LinearRegression)分類器和用M5P分類器對cpu.arff分別進行分類,由其輸出的誤差指標可知(

)。

A:

LinearRegression的標準誤差比M5P的標準誤差小B:

LinearRegression的相對誤差比M5P的相對誤差小C:

LinearRegression的平均絕對誤差比M5P的平均絕對誤差小D:

LinearRegression的平均方根誤差比M5P的平均方根誤差大

答案:

LinearRegression的平均方根誤差比M5P的平均方根誤差大

刪去cpu.arff數(shù)據(jù)文件中的CACH屬性后,使用M5P分類器構建方案,在結(jié)果中,到達LM2的實例數(shù)有(

)個。

A:

21B:

23C:

30D:

165

答案:

21根據(jù)J48分類器訓練weather.nominal.arff所生產(chǎn)的決策樹,當outlook=sunny;temperature=cool;humidity=high;windy=TRUE時,分類的結(jié)果是(

)。

A:

NoB:

無法分類

C:

沒有結(jié)果D:

Yes

答案:

No根據(jù)J48分類器訓練iris.arff所生產(chǎn)的決策樹,當sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2時,分類的結(jié)果是(

)。

A:

Iris-setosaB:

Iris-virginicaC:

Iris-versicolorD:

無法分類

答案:

Iris-setosa關于Weka離散化說明正確的是(

)。

A:

離散化包括無監(jiān)督離散化和有監(jiān)督離散化B:

有監(jiān)督離散化有兩種等寬和等頻方法C:

離散化是將數(shù)值屬性轉(zhuǎn)換為字符串型屬性D:

等寬離散化是使實例分布均勻的

答案:

離散化包括無監(jiān)督離散化和有監(jiān)督離散化以下(

)不是Weka的數(shù)據(jù)類型。

A:

decimalB:

numericC:

stringD:

nominal

答案:

decimal關于Weka的文件類型描述錯誤的是(

)。

A:

Weka可以打開文件格式有.arff、.csv、.xlsxB:

arff是ASCII文件,可以用Word等文本編輯器打開查看C:

Weka處理的數(shù)據(jù)集類似于關系數(shù)據(jù)庫橫行實例,豎行屬性D:

@relation定義數(shù)據(jù)集名稱,@data之后呈現(xiàn)實例,每一行就是一個實例

答案:

Weka可以打開文件格式有.arff、.csv、.xlsx以下屬于關聯(lián)分析的是(

)。

A:

購物籃分析B:

CPU性能預測C:

股票趨勢建模D:

自動判斷鳶尾花類別

答案:

購物籃分析大數(shù)據(jù)時代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時,我們更應該注重數(shù)據(jù)中的相關關系,而不是因果關系。其中,數(shù)據(jù)之間的相關關系可以通過以下(

)算法直接挖掘。

A:

BayesNetworkB:

C4.5C:

K-meansD:

Apriori

答案:

Apriori某超市研究銷售紀錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的(

)問題。

A:

分類B:

自然語言處理C:

關聯(lián)規(guī)則發(fā)現(xiàn)D:

聚類

答案:

關聯(lián)規(guī)則發(fā)現(xiàn)在進行自動選擇屬性時,必須設立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的(

)。

A:

元分類器B:

搜索方法C:

屬性評估器D:

規(guī)則挖掘

答案:

屬性評估器以下屬于屬性空間的搜索方法的是(

)。

A:

SymmetricalUncertAttributeEvalB:

GainRatioAttributeEvalC:

PrincipalComponentsD:

BestFirst

答案:

BestFirst在weka軟件探索者界面中,利用Visualize標簽頁通過更改各個參數(shù)來進行數(shù)據(jù)集的可視化屬性設置后,需要單擊以下(

)按鈕,所有更改才會生效。

A:

SelectAttributeB:

UpdateC:

FastscrollingD:

SubSample

答案:

Update給定關聯(lián)規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。

A:對B:錯

答案:錯支持度是衡量關聯(lián)規(guī)則重要性的一個指標。

A:對B:錯

答案:對Ranker方法既可以用于單個屬性評估器,又可以用于屬性子集評估器。

A:對B:錯

答案:錯利用weka軟件進行數(shù)據(jù)可視化時,用戶可以選擇類別屬性對數(shù)據(jù)點著色,如果類別屬性是標稱型,則顯示為彩色條。

A:錯B:對

答案:錯

第四章單元測試

貝葉斯網(wǎng)絡中的節(jié)點代表(

)。

A:隨機過程B:隨機變量C:隨機函數(shù)D:變量

答案:隨機變量貝葉斯網(wǎng)絡中,節(jié)點需給出概率分布描述,對于離散型隨機變量而言,可以用(

)的形式表示。

A:正態(tài)分布B:條件概率表C:

均勻分布D:條件概率密度函數(shù)

答案:條件概率表貝葉斯網(wǎng)絡中節(jié)點之間的邊代表(

)。

A:概率因果B:隨機結(jié)果C:隨機關系D:組合關系

答案:隨機關系貝葉斯網(wǎng)絡保存的文件格式是(

)。

A:

TXTB:DOCXC:XLSD:XMLBIF

答案:XMLBIF下面(

)不是反向傳播神經(jīng)網(wǎng)絡的結(jié)構。

A:隱含層B:輸入層C:計算層D:輸出層

答案:計算層神經(jīng)網(wǎng)絡中的節(jié)點代表(

)。

A:激勵變量B:隨機變量C:激勵函數(shù)D:隨機函數(shù)

答案:激勵函數(shù)下列(

)不是常見的激勵函數(shù)。

A:閾值函數(shù)B:線性函數(shù)C:正弦函數(shù)D:Sigmoid函數(shù)

答案:正弦函數(shù)在貝葉斯網(wǎng)絡編輯界面時,如果節(jié)點的名稱沒法完全顯示,需要從(

)菜單項進行調(diào)整。

A:View|ZoomOutB:Tools|SetDataC:View|ZoomInD:Tools|Layout

答案:Tools|LayoutWEKA中選擇神經(jīng)網(wǎng)絡分類器操作時,應該選擇(

)。

A:默認的分類器B:functions條目下的SGD分類器C:rules條目下的PARTD:functions條目下的MultilayerPerceptron分類器

答案:functions條目下的MultilayerPerceptron分類器下面關于PackageManager安裝后的目錄說明不正確的是(

)。

A:src子目錄存放源代碼文件B:sample-data子目錄存放數(shù)據(jù)集文件C:doc子目錄存放API文檔D:lib子目錄存放包所需要的說明文件

答案:lib子目錄存放包所需要的說明文件

第五章單元測試

Tableau是一款定位于數(shù)據(jù)可視化敏捷開發(fā)和實現(xiàn)()展現(xiàn)工具。Tableau連續(xù)第6年在Gartner分析和商業(yè)智能魔力象限中蟬聯(lián)領導者殊榮。

A:商業(yè)行為B:商務智能C:商業(yè)統(tǒng)計D:商務計算

答案:商務智能以下()不是Tableau的數(shù)據(jù)類型?

A:DateB:StringC:DecimalD:Boolean

答案:DecimalTableau可以用來實現(xiàn)交互的、()的分析和儀表板應用,從而幫助我們快速地認識和理解數(shù)據(jù)。

A:可視化B:連續(xù)性C:離散性D:智能化

答案:可視化下列說法錯誤的是()。

A:Tableau通過內(nèi)存數(shù)據(jù)引擎,可以直接查詢外部數(shù)據(jù)庫同時動態(tài)的從數(shù)據(jù)倉庫抽取實時數(shù)據(jù),極大的提高了數(shù)據(jù)訪問和查詢效率B:用戶僅需要通過輕點鼠標和簡單拖放就可以迅速創(chuàng)建出智能、精美、直觀和具有強交互性的報表和儀表盤C:Tableau允許從多個數(shù)據(jù)源訪問數(shù)據(jù),包括帶分隔符的文本文件、Excel文件、SQL數(shù)據(jù)庫、Oracle數(shù)據(jù)庫和多維數(shù)據(jù)庫等D:Tableau不提供應用編程接口

答案:Tableau不提供應用編程接口度量往往是()字段,度量是我們的指標。度量常常是連續(xù)的,連續(xù)的字段在圖表中形成軸.將其拖放到功能區(qū)時,Tableau默認會進行()。

A:分類,聚合運算B:數(shù)值,混合運算C:數(shù)值,聚合運算D:分類,混合運算

答案:數(shù)值,聚合運算關于數(shù)據(jù)分層描述錯誤的是()。

A:數(shù)據(jù)分層的層級結(jié)構由數(shù)據(jù)維度的上下順序決定B:數(shù)據(jù)分層的層次結(jié)構可以手工調(diào)整C:數(shù)據(jù)分層可以實現(xiàn)向上鉆取D:數(shù)據(jù)分層可以實現(xiàn)向下鉆取

答案:數(shù)據(jù)分層可以實現(xiàn)向上鉆取以下不屬于集的創(chuàng)建方式的是()。

A:[常規(guī)]創(chuàng)建B:[頂部]創(chuàng)建C:[分組]創(chuàng)建D:[條件]創(chuàng)建

答案:[分組]創(chuàng)建Tableau右邊數(shù)據(jù)目錄欄中,不能單擊右鍵創(chuàng)建參數(shù)的緯度是()。

A:度量B:參數(shù)C:緯度D:集

答案:集以下不是創(chuàng)建計算字段時的運算邏輯的是()。

A:數(shù)字B:表結(jié)構C:日期D:用戶

答案:表結(jié)構儀表板版面大小設計選項,()不屬于大小設計選項。

A:自動B:固定大小C:范圍D:自定義

答案:自定義

第六章單元測試

Logistic函數(shù)的定義域是()。

A:[0,1]B:(-INF,1)C:(0,+INF)D:(-INF,+INF)

答案:(-INF,+INF)下列敘述錯誤的是()。

A:邏輯回歸預測事件發(fā)生的概率并分析導致事件發(fā)生的因素B:邏輯回歸是一種監(jiān)督機器學習算法C:邏輯回歸主要用于回歸分析D:邏輯回歸采用Sigmoid函數(shù)對樣本數(shù)據(jù)進行擬合,以構建回歸模型

答案:邏輯回歸主要用于回歸分析使用IBk分類器和SMO分類器對vote.arff分別進行分類,由其輸出的結(jié)果可知()。

A:SMO對democrat和republican的分類正確率都比IBk大B:SMO對democrat的分類正確率比IBk小C:IBk正確分類百分比比SMO大D:IBk對republican的分類正確率比SMO大

答案:SMO對democrat和republican的分類正確率都比IBk大

A:true或falseB:0或1C:1或-1D:0或-1

答案:1或-1以下描述錯誤的是()。

A:聚類分析可以看作是一種非監(jiān)督的分類B:SVM尋找具有最小邊緣的超平面,因此經(jīng)常被稱為最小邊緣分類器C:SVM對噪聲不具備魯棒性D:k-最近鄰算法(K-NN)是一種消極學習器

答案:SVM尋找具有最小邊緣的超平面,因此經(jīng)常被稱為最小邊緣分類器線性支持向量機的最大化間隔正確的描述是()。

A:B:C:D:

答案:以下計算距離的公式中,計算歐氏距離的是()。

A:B:C:D:

答案:

第七章單元測試

以下數(shù)據(jù)和信息的說法,不正確的是()。

A:凡是可以電子化記錄下來的都是數(shù)據(jù)B:信息是客觀世界各種事物特征的反映C:數(shù)據(jù)對用戶來說是有價值的D:數(shù)據(jù)的形式是多樣化的

答案:數(shù)據(jù)對用戶來說是有價值的以下關于數(shù)據(jù)分析的方法,正確的是()。

A:所有的分析都是要從“過程”出發(fā),沒有結(jié)論的數(shù)字羅列并不是分析B:分析是一個過程,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論