




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
會(huì)計(jì)學(xué)1EM算法主要思想內(nèi)容概述1、背景簡(jiǎn)介2、問(wèn)題描述3、EM算法原理4、結(jié)論與討論第1頁(yè)/共15頁(yè)1、背景簡(jiǎn)介EM是一種聚類算法聚類:將數(shù)據(jù)集中的數(shù)據(jù)分成若干類(簇),使類內(nèi)相似度盡可能大,類間相似度盡可能小。聚類算法:基于劃分的方法(K均值)、層次聚類、基于密度的方法、基于網(wǎng)格的方法、基于模型的方法。第2頁(yè)/共15頁(yè)2、問(wèn)題描述EM算法是基于模型的聚類方法,假設(shè)樣本分布符合高斯混合模型,算法目的是確定各個(gè)高斯部件的參數(shù),充分?jǐn)M合給定數(shù)據(jù),并得到一個(gè)模糊聚類,即每個(gè)樣本以不同概率屬于每個(gè)高斯分布,概率數(shù)值將由以上各個(gè)參數(shù)計(jì)算得到。第3頁(yè)/共15頁(yè)2、問(wèn)題描述(續(xù))高斯混合模型被定義為M個(gè)高斯密度函數(shù)的線性組合:其中為均值為,協(xié)方差為的高斯分布,是混合參數(shù),看做第i個(gè)高斯分布的權(quán)重,表征先驗(yàn)概率。且第4頁(yè)/共15頁(yè)2、問(wèn)題描述(續(xù))
的概率密度函數(shù)為參數(shù)估計(jì)的最常用方法是最大似然估計(jì),通過(guò)使似然函數(shù)達(dá)到最大值得到參數(shù)的估計(jì)值。將高斯混合密度函數(shù)中所有待定的參數(shù)記為,則似然函數(shù)為:第5頁(yè)/共15頁(yè)2、問(wèn)題描述(續(xù))為了使問(wèn)題簡(jiǎn)化,我們求的最大值。這里由于有和的對(duì)數(shù),求導(dǎo)后形式復(fù)雜,因此不能使用一般的求偏導(dǎo)并令導(dǎo)數(shù)為零的方法。第6頁(yè)/共15頁(yè)3、EM算法原理簡(jiǎn)化的問(wèn)題:某混合高斯分布一共有k個(gè)分布,并且對(duì)于每一個(gè)觀察到的x,如果我們同時(shí)還知道它是屬于k中哪一個(gè)分布的,則求各個(gè)參數(shù)并不是件難事。比如用z來(lái)表示每一個(gè)高斯分布,那么我們的觀察集不僅僅是{x1,x2,x3…},而是{(x1,z2),(x2,z3),(x3,z1)…}而現(xiàn)實(shí)往往是:我們不知道每個(gè)x屬于哪個(gè)分布,也就是說(shuō)z是我們觀察不到的,z是隱藏變量。第7頁(yè)/共15頁(yè)3、EM算法原理(續(xù))假定可以觀察到Z,問(wèn)題變?yōu)榍笙率阶畲笾档荶是觀察不到的,因此EM算法假設(shè)Z的分布依據(jù)上一輪的估計(jì)參數(shù)確定,求取上式期望的最大值。定義:第8頁(yè)/共15頁(yè)第9頁(yè)/共15頁(yè)對(duì)上式使用拉格朗日乘數(shù)法可得求偏導(dǎo)并令值為零分別得:第10頁(yè)/共15頁(yè)其中,可由下式求得。第11頁(yè)/共15頁(yè)EM算法的具體流程為重復(fù)執(zhí)行以下兩個(gè)步驟直到收斂:第一步稱為E步驟,是根據(jù)參數(shù)初始值或上一次迭代所得結(jié)果值來(lái)計(jì)算似然函數(shù)關(guān)于條件分布的期望:第二步稱為M步驟,是將似然函數(shù)最大化以獲得新的參數(shù)值,用更新使最大化。第12頁(yè)/共15頁(yè)4、結(jié)論與討論1)EM算法比K-means算法計(jì)算復(fù)雜,收斂也較慢,不適于大規(guī)模數(shù)據(jù)集和高維數(shù)據(jù),但比K-means算法計(jì)算結(jié)果穩(wěn)定、準(zhǔn)確。(數(shù)學(xué)手段加快收斂)2)需要已知樣本聚類數(shù)目(?)3)對(duì)初值敏感(可以多運(yùn)行幾次解決/密度/最大最小原則/模糊/…)4)爬山技術(shù),局部最優(yōu)解(可以多運(yùn)行幾次解決?)5)對(duì)孤立點(diǎn)敏感,有噪音時(shí)效果差
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- TY/T 1108-2024體育賽事活動(dòng)競(jìng)賽規(guī)則編制規(guī)范
- 工程課題立項(xiàng)申報(bào)書
- 儲(chǔ)罐氣體銷售合同范本
- 代駕租賃合同范本
- Unit 3 Keep Fit section B 1a-1d 同步課時(shí)講練(含答案)七年級(jí)英語(yǔ)下冊(cè)(人教版2024)
- 原料購(gòu)置合同范例
- 公司食堂 燃?xì)?合同范本
- 印刷紙箱合同范本
- 產(chǎn)品折扣合同范本
- 課題申報(bào)書怎么寫作
- 2024年人教版九年級(jí)英語(yǔ)單詞默寫單(微調(diào)版)
- 江蘇省宿遷市2024年中考數(shù)學(xué)試卷含答案
- 2024至2030年中國(guó)海洋化工產(chǎn)業(yè)發(fā)展動(dòng)態(tài)及投資前景分析報(bào)告
- 事業(yè)單位工作人員獎(jiǎng)勵(lì)審批表
- 餐飲配方傳授合同范本
- 《婦幼保健學(xué)》課件-第二章 兒童生長(zhǎng)發(fā)育
- 山東省技能大賽青島選拔賽-世賽選拔項(xiàng)目52樣題(平面設(shè)計(jì)技術(shù))
- 福建省教師公開招聘考試(小學(xué)數(shù)學(xué))模擬試卷1(共236題)
- 順豐快遞員工入職合同范本
- 山東省德州市禹城市2023-2024學(xué)年度下學(xué)期期末考試八年級(jí)物理試題(無(wú)答案)
- 35kV輸電線路工程施工安全保障措施
評(píng)論
0/150
提交評(píng)論