版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
6.11.4學(xué)習(xí)貝葉斯信念網(wǎng)6.11.5貝葉斯網(wǎng)的梯度上升訓(xùn)練
6.11.6學(xué)習(xí)貝葉斯網(wǎng)的結(jié)構(gòu)
6.11.6學(xué)習(xí)貝葉斯網(wǎng)是否可以設(shè)計(jì)出有效的算法以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到貝葉斯信念網(wǎng)?對于這一問題有多種可以考慮的框架:—首先網(wǎng)絡(luò)結(jié)構(gòu)可以預(yù)先給出,或可由訓(xùn)練數(shù)據(jù)中推得?!浯危械木W(wǎng)絡(luò)變量可以直接從每個(gè)訓(xùn)練樣例中觀察到,或某些變量不能觀察到。當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)先已知且變量可以從訓(xùn)練樣例中完全獲得時(shí),通過學(xué)習(xí)得到條件概率表就比較簡單,只需要像在樸素貝葉斯分類器中那樣估計(jì)表中的條件概率項(xiàng)。網(wǎng)絡(luò)結(jié)構(gòu)已知,但只有一部分變量值能在數(shù)據(jù)中觀察到,學(xué)習(xí)就困難得多了。這一問題在某種程度上類似于在人工神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)隱藏單元的權(quán)值,其中輸入輸出的節(jié)點(diǎn)值由訓(xùn)練樣例給出,但隱藏單元的值未指定。針對這一問題,采用簡單的梯度上升過程以學(xué)習(xí)條件概率表中的項(xiàng)。這一梯度上升過程搜索一個(gè)假設(shè)空間,它對應(yīng)于條件概率表中所有可能的項(xiàng)。在梯度上升中被最大化的指標(biāo)函數(shù)是給定假設(shè)h下觀察到訓(xùn)練數(shù)據(jù)D的概率P(D|h)。就相當(dāng)于極大似然假設(shè)
6.11.5貝葉斯網(wǎng)的梯度上升訓(xùn)練梯度上升的規(guī)則:通過lnP(D|h)的梯度來使P(D|h)最大化。其中代表?xiàng)l件概率表中的一個(gè)表項(xiàng)。為在給定父節(jié)點(diǎn)取值時(shí),網(wǎng)絡(luò)變量值為
的概率。
例如:圖6-3中條件概率表中最右上方的表項(xiàng),那么為變量Campfire,是其父節(jié)點(diǎn)的元組<Storm,BusTourGroup>,=true,并且=
<False,False>。具體的算法:對于每個(gè),lnP(D|h)的梯度是對每個(gè)求導(dǎo)數(shù)得到。
(6.25)
例如:為計(jì)算對應(yīng)圖6-3中表左上方的表項(xiàng)的導(dǎo)數(shù),需要對D中的每個(gè)訓(xùn)練樣例d計(jì)算P(Camfire=True,Storm=False,BusTourGroup=False|d)。當(dāng)訓(xùn)練樣例d中無法觀察到這些變量時(shí),這些概率可用標(biāo)準(zhǔn)的貝葉斯網(wǎng)絡(luò)推理的過程中計(jì)算得到。用梯度上升來更新每一個(gè)
+其中
是一個(gè)小常量,稱為學(xué)習(xí)率。將權(quán)值
歸一化,保持有效的概率在區(qū)間[0,1]之間,還要求對所有的i,k保持1像其他基于梯度算法中的那樣,該算法只能保證尋找到局部最優(yōu)解
6.11.6學(xué)習(xí)貝葉斯網(wǎng)的結(jié)構(gòu)當(dāng)網(wǎng)絡(luò)的結(jié)構(gòu)是未知的,數(shù)據(jù)是可完全觀察,學(xué)習(xí)貝葉斯因此網(wǎng)絡(luò)也是很困難的。此時(shí)常采用K2的啟發(fā)式搜索算法來學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)。K2算法用于貪婪搜索(總是做出在當(dāng)前看來是做好的選擇,而不是從整體出發(fā))處理模型選擇問題:先定義一種評價(jià)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)劣的評分函數(shù),再從一個(gè)網(wǎng)絡(luò)的開始,根據(jù)事先確定的最大父節(jié)點(diǎn)數(shù)目和節(jié)點(diǎn)的次序,選擇分值最高的節(jié)點(diǎn)作為該節(jié)點(diǎn)的父節(jié)點(diǎn)。K2算法使用后驗(yàn)概率作為評分函數(shù):算法的偽代碼:過程描述:k2的出發(fā)點(diǎn)是一個(gè)包含所有節(jié)點(diǎn),但卻沒有邊的無向圖。在搜索的過程中,k2按順序逐個(gè)考察中的變量,確定其父親節(jié)點(diǎn),然后添加相應(yīng)的邊。
對某一變量Xj,假設(shè)K2已經(jīng)找到它的一些父親節(jié)點(diǎn)。如果||<u,即Xj的父親節(jié)點(diǎn)的個(gè)數(shù)還未達(dá)到上界u,那么就繼續(xù)為它尋找父節(jié)點(diǎn),具體的做法是首先考慮那些在中排在Xj之前,但還不是Xj的父節(jié)點(diǎn)的變量,從這些變量中選出Xi,使得新的家族CH評分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工作檢討書集合15篇
- 演講稿怎么寫格式?【5篇】
- 退社申請書(15篇)
- 小學(xué)學(xué)校校長述職報(bào)告范文10篇
- 大一學(xué)生自我鑒定15篇
- 高層框剪多功能寫字樓施工組織設(shè)計(jì)
- 人教版初中英語九年級(jí)下冊全冊教案
- 免責(zé)協(xié)議書的范本(2篇)
- 兒童教育輔導(dǎo)服務(wù)合同(2篇)
- 2025年高性能氣敏傳感器合作協(xié)議書
- 選詞填空(試題)外研版英語五年級(jí)上冊
- 雷火灸療法專業(yè)知識(shí)講座
- GB/T 15605-2008粉塵爆炸泄壓指南
- 鐵路工程-軌道工程施工工藝及方案
- 福建省福州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)及行政區(qū)劃代碼
- 《高中語文文言斷句》一等獎(jiǎng)優(yōu)秀課件
- 上海市中小學(xué)生學(xué)籍信息管理系統(tǒng)
- (完整版)自動(dòng)感應(yīng)門施工方案
- 8站小車呼叫的plc控制
- _ 基本粒子與宏觀物體內(nèi)在聯(lián)系
- 象棋比賽積分編排表
評論
0/150
提交評論