大數(shù)據(jù)工具應(yīng)用2026608-知到答案、智慧樹答案_第1頁
大數(shù)據(jù)工具應(yīng)用2026608-知到答案、智慧樹答案_第2頁
大數(shù)據(jù)工具應(yīng)用2026608-知到答案、智慧樹答案_第3頁
大數(shù)據(jù)工具應(yīng)用2026608-知到答案、智慧樹答案_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余4頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)工具應(yīng)用2026608-知到答案、智慧樹答案第一章單元測試1、問題:年麥肯錫研究院提出的大數(shù)據(jù)定義是:大數(shù)據(jù)是指其大小超出了常規(guī)數(shù)據(jù)庫工具獲取、儲存、管理和()能力的數(shù)據(jù)集。選項(xiàng):A:分析B:應(yīng)用C:計(jì)算D:訪問答案:【分析】2、問題:用4V來概括大數(shù)據(jù)的特點(diǎn)的話,一般是指:、、和()。選項(xiàng):答案:【】3、問題:大數(shù)據(jù)分析四個方面的工作主要是:數(shù)據(jù)分類、()、關(guān)聯(lián)規(guī)則挖掘和時(shí)間序列預(yù)測。選項(xiàng):A:數(shù)據(jù)聚類B:數(shù)據(jù)清洗C:數(shù)據(jù)計(jì)算D:數(shù)據(jù)統(tǒng)計(jì)答案:【數(shù)據(jù)聚類】4、問題:新浪和京東聯(lián)合推出的大數(shù)據(jù)商品推薦,是由京東盲目推送到當(dāng)前瀏覽新浪網(wǎng)站的用戶的頁面上的。選項(xiàng):A:錯B:對答案:【錯】5、問題:目前的大數(shù)據(jù)處理技術(shù)只能處理結(jié)構(gòu)化數(shù)據(jù)。選項(xiàng):A:錯B:對答案:【錯】第二章單元測試1、問題:我們常用的微軟套件中的Access數(shù)據(jù)庫軟件的數(shù)據(jù)庫文件格式后綴名是()。選項(xiàng):A:xlsB:mdbC:dbfD:mdf答案:【mdb】2、問題:大多數(shù)日志文件的后綴名是()。選項(xiàng):A:xmlB:csvC:logD:txt答案:【log】3、問題:本課程重點(diǎn)介紹的weka軟件的專有文件格式是()。選項(xiàng):A:MongoDBB:keymapC:valueD:ARFF答案:【ARFF】4、問題:數(shù)據(jù)清洗工作的目的主要是要解決數(shù)據(jù)的完整性、唯一性、合法性和()。選項(xiàng):A:排他性B:專業(yè)性C:共享性D:一致性答案:【一致性】5、問題:八爪魚軟件的“自定義采集”工作方式下,需要在軟件里輸入一個()來作為采集的目標(biāo)。選項(xiàng):A:用戶名B:關(guān)鍵詞C:電話號碼D:網(wǎng)頁地址答案:【網(wǎng)頁地址】6、問題:八爪魚軟件的采集規(guī)則可以通過文件的形式來導(dǎo)入或者導(dǎo)出,這種文件的后綴名是()。選項(xiàng):A:gifB:jpgC:otdD:png答案:【otd】7、問題:Excel可以通過“數(shù)據(jù)有效性”按鈕操作來規(guī)范數(shù)據(jù)輸入的范圍。選項(xiàng):A:對B:錯答案:【對】8、問題:Excel可以不能導(dǎo)入txt或csv格式的文件。選項(xiàng):A:對B:錯答案:【錯】9、問題:八爪魚軟件只能對軟件內(nèi)建了“簡易采集”規(guī)則的網(wǎng)站采集數(shù)據(jù)。選項(xiàng):A:錯B:對答案:【錯】10、問題:八爪魚軟件進(jìn)行自定義采集時(shí),需要了解對網(wǎng)頁的頁面結(jié)構(gòu)。選項(xiàng):A:對B:錯答案:【對】第三章單元測試1、問題:使用DBSCAN算法對鳶尾花數(shù)據(jù)集(Iris.arff)進(jìn)行聚類,將epsilon參數(shù)設(shè)置為0.2,minPoints參數(shù)設(shè)置為5,忽略class屬性,那么將形成()個簇。選項(xiàng):A:2B:3C:4D:1答案:【3】2、問題:使用EM算法對天氣數(shù)據(jù)集()進(jìn)行聚類,將numClusters設(shè)置為4,即簇?cái)?shù)為4,其他參數(shù)保持默認(rèn)值,忽略class屬性,從結(jié)果中可知,下列選項(xiàng)中,()是錯誤的。選項(xiàng):A:模型的最大似然估計(jì)值是-7.18B:這組數(shù)據(jù)用算法迭代15次C:第四個簇的先驗(yàn)概率是0.14D:第四個簇的實(shí)例數(shù)為4答案:【第四個簇的實(shí)例數(shù)為4】3、問題:使用SimpleKMeans算法對天氣數(shù)據(jù)集()進(jìn)行聚類,保持默認(rèn)參數(shù),即3個簇以及歐氏距離。選擇play屬性為忽略屬性,從結(jié)果中可知,下列選項(xiàng)中,()是錯誤。選項(xiàng):A:這組數(shù)據(jù)用算法迭代四次B:聚合為3個簇,分別有7,3,4個實(shí)例C:產(chǎn)生了三個中心點(diǎn)D:平方和誤差為8.928答案:【這組數(shù)據(jù)用算法迭代四次】4、問題:使用線性回歸(LinearRegression)分類器和用M5P分類器對分別進(jìn)行分類,由其輸出的誤差指標(biāo)可知()。選項(xiàng):A:LinearRegression的相對誤差比M5P的相對誤差小B:LinearRegression的平均絕對誤差比M5P的平均絕對誤差小C:LinearRegression的標(biāo)準(zhǔn)誤差比M5P的標(biāo)準(zhǔn)誤差小D:LinearRegression的平均方根誤差比M5P的平均方根誤差大答案:【LinearRegression的平均方根誤差比M5P的平均方根誤差大】5(、問題:刪去數(shù)據(jù)文件中的CACH屬性后,使用M5P分類器構(gòu)建方案,在結(jié)果中,到達(dá)LM2的實(shí)例數(shù)有)個。選項(xiàng):A:23B:165C:30D:21答案:【21】6、問題:根據(jù)J48分類器訓(xùn)練所生產(chǎn)的決策樹,當(dāng)outlook=sunny;temperature=cool;humidity=high;windy=TRUE時(shí),分類的結(jié)果是()。選項(xiàng):A:沒有結(jié)果B:無法分類C:No答案:【No】7、問題:根據(jù)J48分類器訓(xùn)練iris.arff所生產(chǎn)的決策樹,當(dāng)sepallength=4.4;sepalwidth=3.0;petallength=1.3;petalwidth=0.2時(shí),分類的結(jié)果是()。選項(xiàng):A:Iris-virginicaB:Iris-versicolorC:Iris-setosaD:無法分類答案:【Iris-setosa】8、問題:關(guān)于離散化說明正確的是()。選項(xiàng):A:有監(jiān)督離散化有兩種等寬和等頻方法B:離散化是將數(shù)值屬性轉(zhuǎn)換為字符串型屬性C:離散化包括無監(jiān)督離散化和有監(jiān)督離散化D:等寬離散化是使實(shí)例分布均勻的答案:【離散化包括無監(jiān)督離散化和有監(jiān)督離散化】9、問題:以下()不是的數(shù)據(jù)類型。選項(xiàng):A:decimalB:stringC:numericD:nominal答案:【decimal】10、問題:關(guān)于的文件類型描述錯誤的是()。選項(xiàng):是ASCII文件,可以用等文本編輯器打開查看處理的數(shù)據(jù)集類似于關(guān)系數(shù)據(jù)庫橫行實(shí)例,豎行屬性可以打開文件格式有、.csv、.xlsxD:@relation定義數(shù)據(jù)集名稱,@data之后呈現(xiàn)實(shí)例,每一行就是一個實(shí)例答案:【可以打開文件格式有、.csv、.xlsx】11、問題:以下屬于關(guān)聯(lián)分析的是()。選項(xiàng):A:股票趨勢建模B:CPU性能預(yù)測C:購物籃分析D:自動判斷鳶尾花類別答案:【購物籃分析】12、問題:大數(shù)據(jù)時(shí)代的到來,使我們無法人為地去發(fā)現(xiàn)數(shù)據(jù)中的奧妙,與此同時(shí),我們更應(yīng)該注重?cái)?shù)據(jù)中的相關(guān)關(guān)系,而不是因果關(guān)系。其中,數(shù)據(jù)之間的相關(guān)關(guān)系可以通過以下()算法直接挖掘。選項(xiàng):A:C4.5B:BayesNetworkC:AprioriD:K-means答案:【Apriori】13、問題:某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據(jù)挖掘的()問題。選項(xiàng):A:自然語言處理B:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)C:聚類D:分類答案:【關(guān)聯(lián)規(guī)則發(fā)現(xiàn)】14、問題:在進(jìn)行自動選擇屬性時(shí),必須設(shè)立兩個對象,其中確定使用什么方法為每個屬性子集分配一個評估值的對象是下面的()。選項(xiàng):A:元分類器B:屬性評估器C:規(guī)則挖掘D:搜索方法答案:【屬性評估器】15、問題:以下屬于屬性空間的搜索方法的是()。選項(xiàng):A:GainRatioAttributeEvalB:PrincipalComponentsC:SymmetricalUncertAttributeEvalD:BestFirst答案:【BestFirst】16、問題:在weka軟件探索者界面中,利用標(biāo)簽頁通過更改各個參數(shù)來進(jìn)行數(shù)據(jù)集的可視化屬性設(shè)置后,需要單擊以下()按鈕,所有更改才會生效。選項(xiàng):A:FastscrollingB:SelectAttributeC:UpdateD:SubSample答案:【Update】17、問題:給定關(guān)聯(lián)規(guī)則AB,意味著:若A發(fā)生,B也會發(fā)生。選項(xiàng):A:錯B:對答案:【錯】18、問題:支持度是衡量關(guān)聯(lián)規(guī)則重要性的一個指標(biāo)。選項(xiàng):A:錯B:對答案:【對】19、問題:Ranker方法既可以用于單個屬性評估器,又可以用于屬性子集評估器。選項(xiàng):A:對B:錯答案:【錯】20、問題:利用weka軟件進(jìn)行數(shù)據(jù)可視化時(shí),用戶可以選擇類別屬性對數(shù)據(jù)點(diǎn)著色,如果類別屬性是標(biāo)稱型,則顯示為彩色條。選項(xiàng):A:對B:錯答案:【錯】第四章單元測試1、問題:貝葉斯網(wǎng)絡(luò)中的節(jié)點(diǎn)代表()。選項(xiàng):A:隨機(jī)函數(shù)B:隨機(jī)變量C:變量D:隨機(jī)過程答案:【隨機(jī)過程】2、問題:貝葉斯網(wǎng)絡(luò)中,節(jié)點(diǎn)需給出概率分布描述,對于離散型隨機(jī)變量而言,可以用()的形式表示。選項(xiàng):A:正態(tài)分布B:條件概率密度函數(shù)C:均勻分布D:條件概率表答案:【條件概率表】3、問題:貝葉斯網(wǎng)絡(luò)中節(jié)點(diǎn)之間的邊代表()。選項(xiàng):A:隨機(jī)結(jié)果B:組合關(guān)系C:隨機(jī)關(guān)系D:概率因果答案:【隨機(jī)關(guān)系】4、問題:貝葉斯網(wǎng)絡(luò)保存的文件格式是()。選項(xiàng):A:DOCXB:TXTC:XLSD:XMLBIF答案:【XMLBIF】5、問題:下面()不是反向傳播神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。選項(xiàng):A:輸出層B:計(jì)算層C:輸入層D:隱含層答案:【計(jì)算層】6、問題:神經(jīng)網(wǎng)絡(luò)中的節(jié)點(diǎn)代表()。選項(xiàng):A:激勵函數(shù)B:激勵變量C:隨機(jī)變量D:隨機(jī)函數(shù)答案:【激勵函數(shù)】7、問題:下列()不是常見的激勵函數(shù)。選項(xiàng):A:正弦函數(shù)B:線性函數(shù)C:Sigmoid函數(shù)D:閾值函數(shù)答案:【正弦函數(shù)】8、問題:在貝葉斯網(wǎng)絡(luò)編輯界面時(shí),如果節(jié)點(diǎn)的名稱沒法完全顯示,需要從()菜單項(xiàng)進(jìn)行調(diào)整。選項(xiàng):答案:【】9、問題:WEKA中選擇神經(jīng)網(wǎng)絡(luò)分類器操作時(shí),應(yīng)該選擇()。選項(xiàng):A:functions條目下的SGD分類器B:默認(rèn)的分類器C:rules條目下的D:functions條目下的MultilayerPerceptron分類器答案:【functions條目下的MultilayerPerceptron分類器】10、問題:下面關(guān)于PackageManager安裝后的目錄說明不正確的是()。選項(xiàng):A:doc子目錄存放API文檔B:lib子目錄存放包所需要的說明文件C:src子目錄存放源代碼文件D:sample-data子目錄存放數(shù)據(jù)集文件答案:【lib子目錄存放包所需要的說明文件】第五章單元測試1、問題:一般情況下在作圖時(shí)先不添加()區(qū)。選項(xiàng):A:圖例區(qū)B:標(biāo)題區(qū)C:坐標(biāo)軸D:繪圖區(qū)答案:【標(biāo)題區(qū)】2、問題:連續(xù)性單變量圖不包括()。選項(xiàng):A:箱線圖B:P-P圖C:條形圖D:直方圖答案:【條形圖】3、問題:兩個定性變量可選擇的作圖不包括()。選項(xiàng):

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論