版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
精品文檔-下載后可編輯數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編數(shù)據(jù)挖掘與數(shù)據(jù)分析常見(jiàn)測(cè)試題匯編
1.【單選題】2分|某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買啤酒的人很大概率也會(huì)購(gòu)買尿布,這種屬于數(shù)據(jù)挖掘的哪類問(wèn)題()。
A關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
B聚類
C分類
D自然語(yǔ)言處理
2.【單選題】2分|將原始數(shù)據(jù)進(jìn)行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個(gè)步驟的任務(wù)()
A頻繁模式挖掘
B分類和預(yù)測(cè)
C數(shù)據(jù)預(yù)處理
D數(shù)據(jù)流挖掘
3.【單選題】2分|當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離()。
A分類
B聚類
C關(guān)聯(lián)分析
D隱馬爾可夫鏈
4.【單選題】2分|什么是KDD()。
A數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
B領(lǐng)域知識(shí)發(fā)現(xiàn)
C文檔知識(shí)發(fā)現(xiàn)
D動(dòng)態(tài)知識(shí)發(fā)現(xiàn)
5.【單選題】2分|為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問(wèn)題屬于數(shù)據(jù)挖掘的哪一類任務(wù)()
A探索性數(shù)據(jù)分析
B建模描述
C預(yù)測(cè)建模
D尋找模式和規(guī)則
6.【單選題】2分|建立一個(gè)模型,通過(guò)這個(gè)模型根據(jù)已知的變量值來(lái)預(yù)測(cè)其他某個(gè)變量值屬于數(shù)據(jù)挖掘的哪一類任務(wù)()
A根據(jù)內(nèi)容檢索
B建模描述
C預(yù)測(cè)建模
D尋找模式和規(guī)則
7.【單選題】2分|用戶有一種感興趣的模式并且希望在數(shù)據(jù)集中找到相似的模式,屬于數(shù)據(jù)挖掘哪一類任務(wù)()
A根據(jù)內(nèi)容檢索
B建模描述
C預(yù)測(cè)建模
D尋找模式和規(guī)則
8.【單選題】2分|下面哪種不屬于數(shù)據(jù)預(yù)處理的方法()
A變量代換
B離散化
C聚集
D估計(jì)遺漏值
9.【單選題】2分|下面哪個(gè)不屬于數(shù)據(jù)的屬性類型:()
A標(biāo)稱
B序數(shù)
C區(qū)間
D相異
10.【單選題】2分|以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()
A嵌入
B過(guò)濾
C包裝
D抽樣
11.【單選題】2分|在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是:()
A有放回的簡(jiǎn)單隨機(jī)抽樣
B無(wú)放回的簡(jiǎn)單隨機(jī)抽樣
C分層抽樣
D漸進(jìn)抽樣
12.【多選題】4分|數(shù)據(jù)倉(cāng)庫(kù)是隨著時(shí)間變化的,下面的描述正確的是()
A數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容;
B捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照;
C數(shù)據(jù)倉(cāng)庫(kù)隨事件變化不斷刪去舊的數(shù)據(jù)內(nèi)容;
D數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合;
13.【單選題】2分|OLAP技術(shù)的核心是:()
A在線性;
B對(duì)用戶的快速響應(yīng);
C互操作性;
D多維分析;
14.【多選題】4分|有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)特點(diǎn),正確的描述是:()
A數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)要從數(shù)據(jù)出發(fā);
B數(shù)據(jù)倉(cāng)庫(kù)使用的需求在開(kāi)發(fā)出去就要明確;
C數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)是一個(gè)不斷循環(huán)的過(guò)程,是啟發(fā)式的開(kāi)發(fā);
D在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析和處理更靈活,且沒(méi)有固定的模式
15.【單選題】2分|關(guān)于OLAP的特性,下面正確的是:(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性()
A(1)(2)(3)
B(2)(3)(4)
C(1)(2)(3)(4)
D(1)(2)(3)(4)(5)
16.【多選題】4分|在有關(guān)數(shù)據(jù)倉(cāng)庫(kù)測(cè)試,下列說(shuō)法正確的是:()
A在完成數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施過(guò)程中,需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行各種測(cè)試.測(cè)試工作中要包括單元測(cè)試和系統(tǒng)測(cè)試.
B當(dāng)數(shù)據(jù)倉(cāng)庫(kù)的每個(gè)單獨(dú)組件完成后,就需要對(duì)他們進(jìn)行單元測(cè)試.
C系統(tǒng)的集成測(cè)試需要對(duì)數(shù)據(jù)倉(cāng)庫(kù)的所有組件進(jìn)行大量的功能測(cè)試和回歸測(cè)試.
D在測(cè)試之前沒(méi)必要制定詳細(xì)的測(cè)試計(jì)劃.
17.【單選題】2分|設(shè)X={1,2,3}是頻繁項(xiàng)集,則可由X產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。
A4
B5
C6
D7
18.【單選題】2分|以下哪些算法是分類算法()
ADBSCAN
BC4.5
CK-Mean
DEM
19.【單選題】2分|以下哪些分類方法可以較好地避免樣本的不平衡問(wèn)題()
AKNN
BSVM
CBayes
D神經(jīng)網(wǎng)絡(luò)
20.【多選題】4分|關(guān)于OLAP和OLTP的區(qū)別描述,正確的是:()
AOLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù).它與OTAP應(yīng)用程序不同.
B與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對(duì)簡(jiǎn)單的事務(wù).
COLAP的特點(diǎn)在于事務(wù)量大,但事務(wù)內(nèi)容比較簡(jiǎn)單且重復(fù)率高.
DOLAP是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的,但其最終數(shù)據(jù)來(lái)源與OLTP一樣均來(lái)自底層的數(shù)據(jù)庫(kù)系統(tǒng),兩者面對(duì)的用戶是相同的.
21.【單選題】2分|如果規(guī)則集中的規(guī)則按照優(yōu)先級(jí)降序排列,則稱規(guī)則集是()
A無(wú)序規(guī)則
B窮舉規(guī)則
C互斥規(guī)則
D有序規(guī)則
22.【單選題】2分|以下哪個(gè)聚類算法不是屬于基于原型的聚類()。
A模糊c均值
BEM算法
CSOM
DCLIQUE
23.【單選題】2分|一個(gè)對(duì)象的離群點(diǎn)得分是該對(duì)象周圍密度的逆。這是基于()的離群點(diǎn)定義。
A概率
B鄰近度
C密度
D聚類
24.【單選題】2分|下面關(guān)于Jarvis-Patrick(JP)聚類算法的說(shuō)法不正確的是()。
AJP聚類擅長(zhǎng)處理噪聲和離群點(diǎn),并且能夠處理不同大小、形狀和密度的簇。
BJP算法對(duì)高維數(shù)據(jù)效果良好,尤其擅長(zhǎng)發(fā)現(xiàn)強(qiáng)相關(guān)對(duì)象的緊致簇。
CJP聚類是基于SNN相似度的概念。
DJP聚類的基本時(shí)間復(fù)雜度為O(m)。
25.【多選題】4分|關(guān)于決策樹(shù)的說(shuō)法,正確的是()
A冗余屬性不會(huì)對(duì)決策樹(shù)的準(zhǔn)確率造成不利的影響
B子樹(shù)可能在決策樹(shù)中重復(fù)多次
C決策樹(shù)算法對(duì)于噪聲的干擾非常敏感
D尋找最佳決策樹(shù)是NP完全問(wèn)題
26.【多選題】4分|以下關(guān)于人工神經(jīng)網(wǎng)絡(luò)(ANN)的描述正確的有()
A神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練數(shù)據(jù)中的噪聲非常魯棒
B可以處理冗余特征
C訓(xùn)練ANN是一個(gè)很耗時(shí)的過(guò)程
D至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)
27.【多選題】4分|關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說(shuō)法不正確的是()。
A當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國(guó)大唐集團(tuán)限公司重慶分公司所屬石柱發(fā)電公司招聘46人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025下半年江蘇省南通市事業(yè)單位考試招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025下半年四川內(nèi)江市市中區(qū)部分事業(yè)單位招聘21人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上海城建城市運(yùn)營(yíng)(集團(tuán))限公司招聘51人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上半年廣東省深圳市事業(yè)單位招聘1420人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上半年四川自貢市沿灘區(qū)事業(yè)單位招聘工作人員67人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025上半年四川省瀘州市江陽(yáng)區(qū)事業(yè)單位考試招聘125人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025“才聚齊魯成就未來(lái)”山東南郊集團(tuán)投資限公司招聘2人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 防護(hù)頭盔勞動(dòng)防護(hù)用品管理細(xì)則
- 2024年電子設(shè)備租賃及售后服務(wù)合同范本2篇
- 一體化綜合指揮平臺(tái)(應(yīng)急指揮部分)建設(shè)方案
- 理正深基坑之鋼板樁受力計(jì)算
- 國(guó)家開(kāi)放大學(xué)電大??啤吨袊?guó)當(dāng)代文學(xué)》期末試題及答案
- 廣東話粵語(yǔ)姓名拼音大全
- 《金融工程原理-無(wú)套利均衡分析》筆記01
- 工程項(xiàng)目收尾管理辦法
- 閘門及啟閉機(jī)安裝專項(xiàng)施工方案
- 應(yīng)征公民體格檢查表(征兵)
- 電力系統(tǒng)分析名詞解釋、簡(jiǎn)答、模擬試卷
- 家具制造企業(yè)消防安全要求
- 巖石堅(jiān)固性和穩(wěn)定性分級(jí)表
評(píng)論
0/150
提交評(píng)論