數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編_第1頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編_第2頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編_第3頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編_第4頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

精品文檔-下載后可編輯數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編

1.【單選題】2分|某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購(gòu)買尿布,這種屬于數(shù)據(jù)挖掘的哪類問(wèn)題()。

A關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

B聚類

C分類

D自然語(yǔ)言處理

2.【單選題】2分|將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)()

A頻繁模式挖掘

B分類和預(yù)測(cè)

C數(shù)據(jù)預(yù)處理

D數(shù)據(jù)流挖掘

3.【單選題】2分|當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離()。

A分類

B聚類

C關(guān)聯(lián)分析

D隱馬爾可夫鏈

4.【單選題】2分|什么是KDD()。

A數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)

B領(lǐng)域知識(shí)發(fā)現(xiàn)

C文檔知識(shí)發(fā)現(xiàn)

D動(dòng)態(tài)知識(shí)發(fā)現(xiàn)

5.【單選題】2分|為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問(wèn)題屬于數(shù)據(jù)挖掘的哪一類任務(wù)()

A探索性數(shù)據(jù)分析

B建模描述

C預(yù)測(cè)建模

D尋找模式和規(guī)則

6.【單選題】2分|建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)()

A根據(jù)內(nèi)容檢索

B建模描述

C預(yù)測(cè)建模

D尋找模式和規(guī)則

7.【單選題】2分|用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類任務(wù)()

A根據(jù)內(nèi)容檢索

B建模描述

C預(yù)測(cè)建模

D尋找模式和規(guī)則

8.【單選題】2分|下面哪種不屬于數(shù)據(jù)預(yù)處理的方法()

A變量代換

B離散化

C聚集

D估計(jì)遺漏值

9.【單選題】2分|下面哪個(gè)不屬于數(shù)據(jù)的屬性類型:()

A標(biāo)稱

B序數(shù)

C區(qū)間

D相異

10.【單選題】2分|以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()

A嵌入

B過(guò)濾

C包裝

D抽樣

11.【單選題】2分|在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是:()

A有放回的簡(jiǎn)單隨機(jī)抽樣

B無(wú)放回的簡(jiǎn)單隨機(jī)抽樣

C分層抽樣

D漸進(jìn)抽樣

12.【多選題】4分|數(shù)據(jù)倉(cāng)庫(kù)是隨著時(shí)間變化的,下面的描述正確的是()

A數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容;

B捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照;

C數(shù)據(jù)倉(cāng)庫(kù)隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容;

D數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合;

13.【單選題】2分|OLAP技術(shù)的核心是:()

A在線性;

B對(duì)用戶的快速響應(yīng);

C互操作性;

D多維分析;

14.【多選題】4分|有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)特點(diǎn),正確的描述是:()

A數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)要從數(shù)據(jù)出發(fā);

B數(shù)據(jù)倉(cāng)庫(kù)使用的需求在開(kāi)發(fā)出去就要明確;

C數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)是一個(gè)不斷循環(huán)的過(guò)程,是啟發(fā)式的開(kāi)發(fā);

D在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析和處理更靈活,且沒(méi)有固定的模式

15.【單選題】2分|關(guān)于OLAP的特性,下面正確的是:(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性()

A(1)(2)(3)

B(2)(3)(4)

C(1)(2)(3)(4)

D(1)(2)(3)(4)(5)

16.【多選題】4分|在有關(guān)數(shù)據(jù)倉(cāng)庫(kù)測(cè)試,下列說(shuō)法正確的是:()

A在完成數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行各種測(cè)試.測(cè)試工作中要包括單元測(cè)試和系統(tǒng)測(cè)試.

B當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試.

C系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試.

D在測(cè)試之前沒(méi)必要制定詳細(xì)的測(cè)試計(jì)劃.

17.【單選題】2分|設(shè)X={1,2,3}是頻繁項(xiàng)集,則可由X產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。

A4

B5

C6

D7

18.【單選題】2分|以下哪些算法是分類算法()

ADBSCAN

BC4.5

CK-Mean

DEM

19.【單選題】2分|以下哪些分類方法可以較好地避免樣本的不平衡問(wèn)題()

AKNN

BSVM

CBayes

D神經(jīng)網(wǎng)絡(luò)

20.【多選題】4分|關(guān)于OLAP和OLTP的區(qū)別描述,正確的是:()

AOLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同.

B與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對(duì)簡(jiǎn)單的事務(wù).

COLAP的特點(diǎn)在于事務(wù)量大,但事務(wù)內(nèi)容比較簡(jiǎn)單且重復(fù)率高.

DOLAP是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的,但其最終數(shù)據(jù)來(lái)源與OLTP一樣均來(lái)自底層的數(shù)據(jù)庫(kù)系統(tǒng),兩者面對(duì)的用戶是相同的.

21.【單選題】2分|如果規(guī)則集中的規(guī)則按照優(yōu)先級(jí)降序排列,則稱規(guī)則集是()

A無(wú)序規(guī)則

B窮舉規(guī)則

C互斥規(guī)則

D有序規(guī)則

22.【單選題】2分|以下哪個(gè)聚類算法不是屬于基于原型的聚類()。

A模糊c均值

BEM算法

CSOM

DCLIQUE

23.【單選題】2分|一個(gè)對(duì)象的離群點(diǎn)得分是該對(duì)象周圍密度的逆。這是基于()的離群點(diǎn)定義。

A概率

B鄰近度

C密度

D聚類

24.【單選題】2分|下面關(guān)于Jarvis-Patrick(JP)聚類算法的說(shuō)法不正確的是()。

AJP聚類擅長(zhǎng)處理噪聲和離群點(diǎn),并且能夠處理不同大小、形狀和密度的簇。

BJP算法對(duì)高維數(shù)據(jù)效果良好,尤其擅長(zhǎng)發(fā)現(xiàn)強(qiáng)相關(guān)對(duì)象的緊致簇。

CJP聚類是基于SNN相似度的概念。

DJP聚類的基本時(shí)間復(fù)雜度為O(m)。

25.【多選題】4分|關(guān)于決策樹(shù)的說(shuō)法,正確的是()

A冗余屬性不會(huì)對(duì)決策樹(shù)的準(zhǔn)確率造成不利的影響

B子樹(shù)可能在決策樹(shù)中重復(fù)多次

C決策樹(shù)算法對(duì)于噪聲的干擾非常敏感

D尋找最佳決策樹(shù)是NP完全問(wèn)題

26.【多選題】4分|以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述正確的有()

A神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒

B可以處理冗余特征

C訓(xùn)練ANN是一個(gè)很耗時(shí)的過(guò)程

D至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)

27.【多選題】4分|關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說(shuō)法不正確的是()。

A當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論