![決策樹歸納法_第1頁](http://file4.renrendoc.com/view/8137172e13a3e1d887e2966cb956a3c9/8137172e13a3e1d887e2966cb956a3c91.gif)
![決策樹歸納法_第2頁](http://file4.renrendoc.com/view/8137172e13a3e1d887e2966cb956a3c9/8137172e13a3e1d887e2966cb956a3c92.gif)
![決策樹歸納法_第3頁](http://file4.renrendoc.com/view/8137172e13a3e1d887e2966cb956a3c9/8137172e13a3e1d887e2966cb956a3c93.gif)
![決策樹歸納法_第4頁](http://file4.renrendoc.com/view/8137172e13a3e1d887e2966cb956a3c9/8137172e13a3e1d887e2966cb956a3c94.gif)
![決策樹歸納法_第5頁](http://file4.renrendoc.com/view/8137172e13a3e1d887e2966cb956a3c9/8137172e13a3e1d887e2966cb956a3c95.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
歸納式學(xué)習(xí)法決策樹歸納法01簡介DTI算法步驟DTI算法原理目錄0302基本信息決策樹歸納法(DTI),又稱“決策圖”,是歸納式學(xué)習(xí)法中最簡單的一支。它是將決策過程各個階段之間的邏輯結(jié)構(gòu)繪成一張箭線圖,再根據(jù)決策樹進(jìn)行分析計算,從而得出所需決策方案的方法。DTI常用于數(shù)據(jù)挖掘。簡介簡介決策樹歸納法根據(jù)數(shù)據(jù)的值,把數(shù)據(jù)分層組織成樹型結(jié)構(gòu),即用樹形結(jié)構(gòu)來表示決策集合,這些決策集合通過對數(shù)據(jù)集的分類產(chǎn)生規(guī)則。在決策樹中每一個分支代表一個子類,樹的每一層代表一個概念。
決策樹歸納法一般以方框和圓圈為結(jié)點,并由直線連接而成的一種像樹枝形狀的結(jié)構(gòu)。方框結(jié)點叫做決策點,由決策點引出若干條樹枝(直線)。每條樹枝代表一個方案,故叫方案枝。在每個方案枝的末端畫上一個圓圈就是圓圈結(jié)點,圓圈結(jié)點叫做機(jī)會點。由機(jī)會點引出若干條樹枝(直線),每條樹枝為概率枝。在概率枝的末端列出不同狀態(tài)下的收益值或損失值。
DTI常用于分析構(gòu)建模型的可行性與可信度,相應(yīng)地根據(jù)觀察推出其邏輯表達(dá)式及結(jié)構(gòu),通過其簡單清晰的邏輯推理和分割信息值,能夠快捷地對大數(shù)據(jù)集進(jìn)行高效的數(shù)據(jù)劃分。但針對連續(xù)型數(shù)據(jù)和多類別集合,劃分效率就會隨復(fù)雜度的升高而降低。
DTI算法原理DTI算法原理決策樹歸納法(GTI)是一組規(guī)則集合,使用遞歸的方式將訓(xùn)練樣本集(TS)劃分成更小的子集合(Sub-TS),直到每一個子集合擁有獨有的所屬類別標(biāo)簽。DTI算法通常采用信息論(IT)作為屬性選擇方法,根節(jié)點TS的選擇是基于訓(xùn)一算出的所具有最高信息增益的屬性。給定一個N維訓(xùn)練樣本集T={},表示樣本實例屬于類別的先驗概率,可根據(jù)下式得出對給定的樣本實例進(jìn)行分類所需要的期望信息Info(T)。相應(yīng)地,訓(xùn)練樣本集T根據(jù)屬性A={}迭代地被劃分成N個不同的子集合{},其中為樣本集合T中屬性A=時的樣本子集合。可根據(jù)權(quán)重值計算出屬性A劃分T的期望信息,從而根據(jù)原始信息要求Info(T)和新的信息要求的偏移量計算得出信息增益InfoGain(A)。根據(jù)樣本集T中的屬性值,逐一地計算出每個屬勝值對T進(jìn)行劃分的信息增益,從中選擇出具有最高信息增益的屬性。作為最佳屬性來劃分子集合,遞歸整個過程直到所有集合都被正確歸類。
DTI算法步驟示例偽程序解釋算法偽程序示例DTI算法步驟算法偽程序示例程序名:DTIsamples代表以離散值屬性表示的訓(xùn)練樣本,attribute_list指候選屬性集合。(1)建立一節(jié)點N;(2)若samples含相同分類c,則:(3)返回N表示含c類的葉節(jié)點;(4)若attribute_list為空集合則:(5)返回N含samples中最大類的葉節(jié)點;(6)選test_attribute,即attribute_list中含最大信息增益的屬性;(7)將節(jié)點N標(biāo)記為testattribute;(8)對testattribute的每一已知值分割樣本;(9)由節(jié)點N產(chǎn)生一分支表示testattribute=;示例偽程序解釋樹由一單一節(jié)點表示訓(xùn)練樣本開始(步驟1),若樣本含相同類,則節(jié)點為葉且注標(biāo)為此類(步驟2、3);否則,算法使用系統(tǒng)亂度導(dǎo)向稱為信息增益法為經(jīng)驗法則,以選出最能將樣本分成兩類的屬性(步驟6)。該屬性變成該節(jié)點的“測試”或“決策”屬性(步驟7)。算法的各屬性均被分類,每一測試屬性的已知值建立一分支,樣本依此被分割(步驟8-10)。算法以遞歸式形成樣本中每一分割而成決策樹。節(jié)點產(chǎn)生一屬性后,則不需考慮該節(jié)點的子孫(步驟13)。當(dāng)滿足下列條件時停止遞歸:(a)樣本的任一已知節(jié)點皆屬于某一固定類(步驟2、3)或(b)樣本中沒有其它屬性可供進(jìn)一步分割(步驟4),此時,引用勝者攘括(步驟5),將該節(jié)點轉(zhuǎn)換成葉節(jié)點且標(biāo)記為勝者的類別,否則儲存該節(jié)點的類分布。(c)分支test_attribute=(步驟11)無樣本。此時,葉依據(jù)樣本中主要類別建立(步驟12)。樹中每一節(jié)點所選的測試屬性均以信息增益加以衡量,這種衡量稱為屬性選擇度量或度量一完善的分割。含最高信息增益
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝設(shè)計與制作合同
- 農(nóng)產(chǎn)品種植技術(shù)推廣合同
- 2025年中國2萘酚行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 熱泵式壓力匹配器行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 輕卡后橋總成項目可行性研究報告
- 整體軋制翅片行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 2025-2030年中國經(jīng)編毛皮行業(yè)深度研究分析報告
- 金融行業(yè)勞動合同管理制度范文
- 租賃合同中安全條款范文
- 2025年度城市軌道交通灌注樁施工合同
- 銷售人員薪資提成及獎勵制度
- 2017年江蘇南京中考滿分作文《無情歲月有味詩》5
- 2023年宏觀經(jīng)濟(jì)學(xué)考點難點
- 2024-2030年中國智慧水務(wù)行業(yè)應(yīng)用需求分析發(fā)展規(guī)劃研究報告
- 山體排險合同模板
- 特殊感染手術(shù)的配合與術(shù)后處理課件
- 檢驗科生物安全工作總結(jié)
- 《金屬與石材幕墻工程技術(shù)規(guī)范》jgj1332001-2021112401384
- 即時通訊系統(tǒng)建設(shè)方案
- 2024年中國南水北調(diào)集團(tuán)新能源投資限公司抽水蓄能項目崗位公開招聘高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 部編版五年級下冊語文1-8單元習(xí)作課件
評論
0/150
提交評論