


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、決策樹實(shí)驗(yàn)一、實(shí)驗(yàn)原理決策樹是一個類似于流程圖的樹結(jié)構(gòu),其中每個內(nèi)部結(jié)點(diǎn)表示在一個屬性上的測試,每個分支代表一個測試輸入,而每個樹葉結(jié)點(diǎn)代表類或類分布。數(shù)的最頂層結(jié)點(diǎn)是根結(jié)點(diǎn)。一棵典型的決策樹如圖1所示。它表示概念buys_computer,它預(yù)測顧客是否可能購買計算機(jī)。內(nèi)部結(jié)點(diǎn)用矩形表示,而樹葉結(jié)點(diǎn)用橢圓表示。為了對未知的樣本分類,樣本的屬性值在決策樹上測試。決策樹從根到葉結(jié)點(diǎn)的一條路徑就對應(yīng)著一條合取規(guī)則,因此決策樹容易轉(zhuǎn)化成分類規(guī)則。ID3算法: 決策樹中每一個非葉結(jié)點(diǎn)對應(yīng)著一個非類別屬性,樹枝代表這個屬性的值。一個葉結(jié)點(diǎn)代表從樹根到葉結(jié)點(diǎn)之間的路徑對應(yīng)的記錄所屬的類別屬性值。 每一個非
2、葉結(jié)點(diǎn)都將與屬性中具有最大信息量的非類別屬性相關(guān)聯(lián)。 采用信息增益來選擇能夠最好地將樣本分類的屬性。信息增益基于信息論中痼的概念。ID3總是選擇具有最高信息增益(或最大痼壓縮)的屬性作為當(dāng)前結(jié)點(diǎn)的測試屬性。該屬性使得對結(jié)果劃分中的樣本分類所需的信息量最小,并反映劃分的最小隨機(jī)性或不純性”。算法偽代碼算法Decision_Tree(data,AttributeName)輸入由離散值屬性描述的訓(xùn)練樣本集data;候選屬性集合AttributeName。輸出一棵決策樹。(1)創(chuàng)建節(jié)點(diǎn)N;(2)Ifsamples都在同一類C中then(3)返回N作為葉節(jié)點(diǎn),以類C標(biāo)記;(4)Ifattribute_l
3、ist為空then(5)返回N作為葉下點(diǎn),以samples中最普遍的類標(biāo)記;多數(shù)表決(6)選擇attribute_list中具有最高信息增益的屬性test_attribute;(7)以test_attribute標(biāo)十出?點(diǎn)N;(8)Foreachtest_attribute的已知值v/劃分samples(9)由節(jié)點(diǎn)N分出一個對應(yīng)test_attribute=v的分支;(10令Sv為samples中test_attribute=v的樣本集合;一個劃分塊(11)IfSv為空then(12) 加上一個葉節(jié)點(diǎn),以samples中最普遍的類標(biāo)記;(13) Else加入一個由Decision_Tree(S
4、v,attribute_list-test_attribute)返回節(jié)點(diǎn)值。三、實(shí)驗(yàn)數(shù)據(jù)預(yù)處理Age:30歲以下標(biāo)記為“1”;30歲以上50歲以下標(biāo)記為“2”;50歲以上標(biāo)記為“3”。Sex:FEMAL-“1”;MALE-“2”Region:INNERCITY-“1”;TOWN-“2”;RURAL-“3”;SUBURBAN-“4”Income:50002萬-“1”;2萬4萬-“2”;4萬以上-“3”MarriedChildrenCarMortgagePep:以上五個條件,若為“是”標(biāo)記為“1”,若為“否”標(biāo)記為“2”。Agesexregionincomemarriedchildrencarmo
5、rtgagepep121121122121122221214121221211112222121112222121121211212112112211121121213122121212221222221222211212211211221212212111212221321211122111211121113222121312212221323311121322312112313311221321312122321311111311312112313312222324312211313322112四、實(shí)驗(yàn)主函數(shù)functionmainDataSet=121121121122221214121
6、221211112222121112222121121211212112112211121121213122121212221222221222211212211211221212212111212221321211122111211121113222121312212221323311121322312112313311221321312122321311111311312112313312222324312211313322112clc;122;AttributName=111213141516171819;TreeRulesMatrix=DecisionTree(DataSet,Attr
7、ibutName)End五、實(shí)驗(yàn)結(jié)果TheDecisionTree:(TheRoot):Attribut|1Attribut|1_Attribut|1_leaf1|2_leaf2|2leaf2|3_Attribut|11Attribut|11|12|13|12leaf2|2Attribut|1_Attribut|1_leaf2|2_leaf1|2leaf1Attribut|1leaf2|2Attribut|1leaf1|2_leaf2|3leaf2,Attribut|1_leaf2|2_Attribut11leaf112Attribut11leaf112leaf2Attribut23leaf1leaf1leaf2leaf1Tree=Attribut:3Child:1x4structRulesMatrix=11101000112101000220101000230111100130121100230131100130101200210102010220102010100102020100210000200221000100222000200230000200300001200300012100300122100300222200400000
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 烏魯木齊房產(chǎn)轉(zhuǎn)讓合同范例
- 中介介紹分紅合同范例
- 供用沙合同范例
- 加裝電梯銷售合同范例
- 代理轉(zhuǎn)包合同范例
- 親人之間借貸合同范例
- 烏魯木齊店鋪轉(zhuǎn)讓合同范例
- 交通疏解合同范例
- oem貼牌合同范例
- 人才入住合同范例
- 2025年個人所得稅贍養(yǎng)老人費(fèi)用分?jǐn)倕f(xié)議模板
- 2025人教版(2024)小學(xué)美術(shù)一年級下冊教學(xué)計劃、教學(xué)設(shè)計及教學(xué)反思(附目錄)
- 醫(yī)療器械使用安全和風(fēng)險管理培訓(xùn)課件
- 2025年新疆生產(chǎn)建設(shè)兵團(tuán)興新職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性測試題庫帶答案
- 雷鋒的故事春鋒十里暖童心小小雷鋒在學(xué)習(xí)課件
- 語文-云南省師范大學(xué)附屬中學(xué)2025屆高三下學(xué)期開學(xué)考試試題和答案
- 英語學(xué)科核心素養(yǎng)下小學(xué)英語繪本閱讀教學(xué)現(xiàn)狀及對策研究
- 外周靜脈解剖知識
- 2025年飼料及寵物食品項(xiàng)目建議書
- 《走近世界民間美術(shù)》 課件 2024-2025學(xué)年人美版(2024)初中美術(shù)七年級下冊
- 河南2025年02月鄭州市公安機(jī)關(guān)公開招考1200名警務(wù)輔助人員筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
評論
0/150
提交評論