數(shù)學(xué)建模-支持向量機課件_第1頁
數(shù)學(xué)建模-支持向量機課件_第2頁
數(shù)學(xué)建模-支持向量機課件_第3頁
數(shù)學(xué)建模-支持向量機課件_第4頁
數(shù)學(xué)建模-支持向量機課件_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

支持向量機

supportvectormachine,SVMOutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機SVM的理論基礎(chǔ)傳統(tǒng)的統(tǒng)計模式識別方法只有在樣本趨向無窮大時,其性能才有理論的保證。統(tǒng)計學(xué)習(xí)理論(STL)研究有限樣本情況下的機器學(xué)習(xí)問題。SVM的理論基礎(chǔ)就是統(tǒng)計學(xué)習(xí)理論。傳統(tǒng)的統(tǒng)計模式識別方法在進行機器學(xué)習(xí)時,強調(diào)經(jīng)驗風(fēng)險最小化。而單純的經(jīng)驗風(fēng)險最小化會產(chǎn)生“過學(xué)習(xí)問題”,其推廣能力較差。推廣能力是指:將學(xué)習(xí)機器(即預(yù)測函數(shù),或稱學(xué)習(xí)函數(shù)、學(xué)習(xí)模型)對未來輸出進行正確預(yù)測的能力。SVM由于SVM的求解最后轉(zhuǎn)化成二次規(guī)劃問題的求解,因此SVM的解是全局唯一的最優(yōu)解SVM在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機器學(xué)習(xí)問題中Joachims最近采用SVM在Reuters-21578來進行文本分類,并聲稱它比當(dāng)前發(fā)表的其他方法都好

OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機線性判別函數(shù)和判別面一個線性判別函數(shù)(discriminantfunction)是指由x的各個分量的線性組合而成的函數(shù)

兩類情況:對于兩類問題的決策規(guī)則為如果g(x)>0,則判定x屬于C1,如果g(x)<0,則判定x屬于C2,如果g(x)=0,則可以將x任意分到某一類或者拒絕判定。

超平面方程g(x)=0定義了一個判定面,它把歸類于C1的點與歸類于C2的點分開來。當(dāng)g(x)是線性函數(shù)時,這個平面被稱為“超平面”(hyperplane)。當(dāng)x1和x2都在判定面上時,這表明w和超平面上任意向量正交,并稱w為超平面的法向量。注意到:x1-x2表示超平面上的一個向量判別函數(shù)g(x)是特征空間中某點x到超平面的距離的一種代數(shù)度量

從下圖容易看出上式也可以表示為:r=g(x)/||w||。當(dāng)x=0時,表示原點到超平面的距離,r0=g(0)/||w||=w0/||w||,標(biāo)示在上圖中??傊壕€性判別函數(shù)利用一個超平面把特征空間分隔成兩個區(qū)域。超平面的方向由法向量w確定,它的位置由閾值w0確定。判別函數(shù)g(x)正比于x點到超平面的代數(shù)距離(帶正負(fù)號)。當(dāng)x點在超平面的正側(cè)時,g(x)>0;當(dāng)x點在超平面的負(fù)側(cè)時,g(x)<0

廣義線性判別函數(shù)在一維空間中,沒有任何一個線性函數(shù)能解決下述劃分問題(黑紅各代表一類數(shù)據(jù)),可見線性判別函數(shù)有一定的局限性。廣義線性判別函數(shù)如果建立一個二次判別函數(shù)g(x)=(x-a)(x-b),則可以很好的解決上述分類問題。決策規(guī)則仍是:如果g(x)>0,則判定x屬于C1,如果g(x)<0,則判定x屬于C2,如果g(x)=0,則可以將x任意分到某一類或者拒絕判定。

廣義線性判別函數(shù)設(shè)計線性分類器

OutlineSVM的理論基礎(chǔ)線性判別函數(shù)和判別面最優(yōu)分類面支持向量機最優(yōu)分類面

SVM是從線性可分情況下的最優(yōu)分類面發(fā)展而來的,基本思想可用圖2的兩維情況說明.

圖中,方形點和圓形點代表兩類樣本,H為分類線,H1,H2分別為過各類中離分類線最近的樣本且平行于分類線的直線,它們之間的距離叫做分類間隔(margin)。

所謂最優(yōu)分類線就是要求分類線不但能將兩類正確分開(訓(xùn)練錯誤率為0),而且使分類間隔最大.推廣到高維空間,最優(yōu)分類線就

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論