




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘與統(tǒng)計決策課程復(fù)習(xí)提綱 2017.6一、 概念題(約20%)1、 概念解釋(10%)2、 是非題(10%) 概念題復(fù)習(xí)要點:1、 數(shù)據(jù)挖掘定義?數(shù)據(jù)挖掘與經(jīng)典統(tǒng)計建模的異同點? 2、 聚類定義?系統(tǒng)聚類、K均值聚類、Kohonen聚類的原理與特點? 一般聚類數(shù)的判別?聚類結(jié)果的判別? 3、 神經(jīng)網(wǎng)絡(luò)定義?感知機(jī)模型、BP模型、RBF模型的原理與應(yīng)用特點(包括數(shù)據(jù)特點、結(jié)構(gòu)特點、映射特點、權(quán)值修正特點、誤差表示等)?3、 主成分分析與因子分析方法的特點?變量與主成分的關(guān)系?變量與公共因子的關(guān)系? 載荷因子表示公因子與變量的什么關(guān)系?載荷因子取值不同表示公因子與變量關(guān)系的哪些不同? 5、決
2、策樹方法的定義?ID3、C4.5、二叉樹方法的不同應(yīng)用特點?決策樹的評價標(biāo)準(zhǔn)?決策樹的前后剪枝特點?后剪枝的形式評價與樹結(jié)構(gòu)評價定義?6、關(guān)聯(lián)分析、時序關(guān)聯(lián)分析方法的特點? K項頻繁集(大項目集)、K項大序列的定義?最大頻繁(項目)集、最大序列的定義?頻繁集(大項目集)支持度、大序列支持度定義?關(guān)聯(lián)規(guī)則置信度、時序關(guān)聯(lián)規(guī)則置信度定義?規(guī)則提取特點?規(guī)則檢驗定義?7、 遺傳算法的定義與特點?適應(yīng)值函數(shù)、選擇算子、交叉算子、變異算子的理論定義?一般設(shè)計形式?模式定理的結(jié)論表示?設(shè)計與計算題(約80%):二、 聚類分析:給出樣品屬性取值或變量觀察值,1)要求計算距離矩陣,并按系統(tǒng)聚類法,以兩點最大或
3、最小距離定義兩類相似度進(jìn)行聚類(樣本或變量聚類),2)表出聚類過程及譜系圖,并判別聚類結(jié)果。三、 主成分/因子分析: 給定變量與因子相關(guān)的載荷矩陣,在已知特征根及累計貢獻(xiàn)率大于一定比例條件下,1)要求計算或判別選擇主要變量、主要主成分、主要因子,2)用因子表示變量或用變量表示主成分。四、神經(jīng)網(wǎng)絡(luò)模型:給出已知樣本與模型設(shè)計要求,1)要求通過樣本學(xué)習(xí)和權(quán)值修正獲取模型參數(shù),建立神經(jīng)網(wǎng)絡(luò)模型(BP、RBF、感知機(jī)等),2)應(yīng)用建立的模型進(jìn)行檢驗、分類或預(yù)測。五、決策樹分析:給出某樣本集,1)要求利用ID3算法或C4.5算法或二叉樹算法,判別節(jié)點與分枝,建立決策樹。 2)給定檢驗樣本集,對建立決策樹
4、進(jìn)行檢驗。 3)在假定條件下,對決策樹進(jìn)行剪枝判別,計算剪枝形式與剪枝結(jié)構(gòu)評價。 六、1)關(guān)聯(lián)分析:給出N個事務(wù)對應(yīng)的物品項、最少支持度和最少可信度,要求用AP方法求最大頻繁集和指定項目條件的關(guān)聯(lián)規(guī)則。 2)時序關(guān)聯(lián)分析:給出N個時間顧客的事務(wù)對應(yīng)的物品項,最少支持度和最少可信度,要求用AP-G方法求最大序列和指定條件的時序關(guān)聯(lián)規(guī)則。 3) 給定檢驗樣本集,要求對提取規(guī)則進(jìn)行檢驗,要求計算檢驗的誤差。 七、遺傳算法:1)給出N個個體組成的種群,在指定或設(shè)計適值函數(shù)下,進(jìn)行選擇、交叉與變異運(yùn)算;2)給出某一問題,要求設(shè)計基因、個體和種群,并針對問題設(shè)計合理的適應(yīng)值函數(shù),設(shè)計合適的選擇、交叉與變異
5、算子。參考試題形式:一. 概念描述1數(shù)據(jù)挖掘是指 2遺傳算法中的適應(yīng)值函數(shù)是指 3. K-均值聚類是指 4. BP神經(jīng)網(wǎng)絡(luò)是指 5時序關(guān)聯(lián)分析是指 二. 是非題1. 數(shù)據(jù)倉庫不一定要有數(shù)據(jù)挖掘方法的支持。( )2. 系統(tǒng)聚類中,可以按兩類的最大或最小相似度逐步歸并直至為一類。( ) 3. K-均值聚類中,若給定類中心調(diào)整次數(shù)為終止條件,則初始類中心選擇對聚類結(jié)果有影響。( )5 決策樹的CART算法,是通過信息增益率最大來選擇測試屬性。( )6. 在同一實例集下,具有深度越小、葉結(jié)點數(shù)越多的決策樹越優(yōu)。( )7 時序關(guān)聯(lián)分析的Apriori-G 方法的最大序列一定包含客戶標(biāo)識。( )8. RB
6、F神經(jīng)網(wǎng)絡(luò)的輸入層到隱層的映射是線性的。( )9、5. 具有S型映射函數(shù)的BP神經(jīng)網(wǎng)絡(luò)的輸出變量取值一定要變換到區(qū)間0,1中。( )10、11關(guān)聯(lián)分析的最大頻繁集是唯一的。( )四、 設(shè)有五個樣本,每樣本有n個指標(biāo),第i樣本用類表示,兩兩之間的歐氏距離陣如下所示,試1)按最小距離聚類,表出聚類過程及聚類譜系圖,2)從聚類譜系圖中,通過類間距離求最合適的聚類類數(shù)。 0 1 0 3 5 0 4 7 2.5 0 6 2 5 8 0四1、設(shè)f(x)=x2, x5,30, 設(shè)想通過遺傳算法求f(x)最小值。若個體為二進(jìn)制表示,初始個體如下,請設(shè)計適值函數(shù),并按要求填寫下表 個體號初始個體初始個體的編碼表
7、示適應(yīng)度復(fù)制數(shù)(整數(shù))隨機(jī)交叉?zhèn)€體號隨機(jī)交叉點為3時的交叉結(jié)果順序抽取染色體,按變異概率10%、隨機(jī)變異點為2實施變異的結(jié)果12711011221301101131910011448010003 2、設(shè)產(chǎn)品質(zhì)量有質(zhì)量指標(biāo)為Y1,Y2YM ,影響質(zhì)量的因素變量為X1,X2,XN,標(biāo)準(zhǔn)質(zhì)量指標(biāo)為Z1,Z2ZM,設(shè)想通過遺傳算法求一組最優(yōu)組合x1,x2,xN,如果采用實數(shù)編碼,要求為這樣的遺傳算法設(shè)計1)基因與個體表示;2)種群表示;3)適值函數(shù)表示。五、設(shè)A,B,C,D,E分別表示五種物品,要求通過以下五項業(yè)務(wù)應(yīng)用apriori算法分析五種物品的關(guān)聯(lián)程度,求:1)若最少支持度為0.3,求最大頻繁集
8、;2)若最少支持度為0.4,求任兩項集出現(xiàn)而導(dǎo)致另一項集出現(xiàn)的關(guān)聯(lián)規(guī)則。業(yè)務(wù)標(biāo)識 物品 1 ACDE 2 BCD 3 A 4 CDE 5 ABCD六、設(shè)每個肺病例有五種癥狀:發(fā)燒(無、低、中度、高),咳嗽(輕微、中度、劇烈),X光所見陰影(點狀、索條狀、片狀、空洞),血沉(正常、快),聽診(正常、干鳴音、水泡音),肺炎和肺結(jié)核部分病例集見下表,試用決策樹的ID3算法識別根節(jié)點對應(yīng)的癥狀及分支樣本(分支樣本用樣本號表示)。樣本號 病狀病例號發(fā)燒咳嗽 X光所見血沉聽診肺炎1高劇烈片狀正常水泡音2中度劇烈片狀正常水泡音3低輕微點狀正常干鳴音4高中度片狀正常水泡音5中度輕微片狀正常水泡音肺結(jié)核6無輕微索條狀正常正常7高劇烈空洞快干鳴音8低輕微索條狀正常正常9無輕微點狀快干鳴音10低中度片狀快正常七、設(shè)在開發(fā)某企業(yè)的DSS中,利用神經(jīng)網(wǎng)絡(luò)模型輔助投資方案選擇。以X1、X2、X3分別表示三個評價投資方案指標(biāo)的定義值,Y表示選擇結(jié)果。已知兩個樣本的取值如下: X1 X2 X3 Y1 0 1 11 1 1 1假設(shè)閾值為0,且連接權(quán)初始值為0,調(diào)整因子=1。要求: 建立輔助投資方案決策的感知機(jī)模型; 當(dāng)投資方案指標(biāo)為(X1,X2,X3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年餐飲業(yè)加盟合同模板
- 2025年建筑工程承包合同范本
- 2025商品房買賣合同備案撤銷的具體內(nèi)容
- 2025家居建材采購合同范本
- 高一英語自我小測:SectionⅠ()
- 《2025技術(shù)顧問聘請合同書聘請方》
- 2024年秦皇島市市屬事業(yè)單位考試真題
- 2024年孟州市市屬事業(yè)單位考試真題
- 2024年河南鄭州師范學(xué)院特殊教育學(xué)院招聘招聘真題
- 2024年安陸工業(yè)技術(shù)學(xué)校專任教師招聘真題
- 《蠶變了新模樣》優(yōu)質(zhì)教案
- 公司登記備案人員因私出國(境)管理辦法
- 雙重否定句句式轉(zhuǎn)換
- “課堂教學(xué)大比武”活動課堂實錄作品評價指標(biāo)參考
- 風(fēng)速與體感溫度對照表(最新版)
- 《劉姥姥進(jìn)大觀園》課本劇劇本3篇
- 道路工程竣工報告
- 顯示儀表ppt課件
- 文件模板(平行文)
- ASME B1.1-2003統(tǒng)一英制螺紋中文版_圖文
- 電力環(huán)網(wǎng)柜箱變基礎(chǔ)計算表
評論
0/150
提交評論