版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
CH.3核函數(shù)特征空間《導(dǎo)論》pp.24-46需要學(xué)習(xí)的目標(biāo)函數(shù)的復(fù)雜度取決于它的表示(自變元個數(shù)、定義域、函數(shù)關(guān)系式、……),學(xué)習(xí)任務(wù)的難易程度隨之而變化。線性學(xué)習(xí)器計(jì)算能力有限核表示方法的特點(diǎn)使用線性學(xué)習(xí)器分二類問題
分二類問題
尋找一個實(shí)值函數(shù)(決策函數(shù))f:XR,
當(dāng)f(x)0
時,輸入賦給正類;當(dāng)
f(x)0
時,輸入賦給負(fù)類。線性學(xué)習(xí)器
使用線性假設(shè)
確定最優(yōu)超平面,其控制參數(shù)為而決策規(guī)則由
給出。線性學(xué)習(xí)器計(jì)算能力有限目標(biāo)概念(函數(shù))通常不能由給定屬性的簡單線性函數(shù)組合產(chǎn)生導(dǎo)致使用多層閾值線性函數(shù)(如:多層神經(jīng)網(wǎng)絡(luò)、BP算法等)對目標(biāo)概念的更為簡潔的直接描述涉及比給定數(shù)據(jù)更為廣泛的抽象特征導(dǎo)致核表示方法核表示方法的特點(diǎn)將給定數(shù)據(jù)映射到高維空間,變線性不可分情形為線性可分,來增加線性學(xué)習(xí)器的計(jì)算能力用于學(xué)習(xí)的算法和理論可以在很大程度上同應(yīng)用領(lǐng)域的特性分開,而這些特性將在設(shè)計(jì)合適的核函數(shù)時考慮Ch.3主要內(nèi)容1、特征空間和特征選擇問題2、使用線性學(xué)習(xí)器學(xué)習(xí)一個非線性關(guān)系3、關(guān)于核函數(shù)的討論4、特征空間中的計(jì)算5、核與高斯過程
使用不同技術(shù)的困難所在1、特征空間和特征選擇問題
1)一個合理的思路2)定義和概念3)特征映射可能產(chǎn)生的困難4)特征選擇面臨的重要任務(wù)1)一個合理的思路需要增加一個預(yù)處理步驟,將給定數(shù)據(jù)的表達(dá)形式轉(zhuǎn)換成一個與特定的學(xué)習(xí)問題(如P.25,例3.1萬有引力,x→lnx)所需要的表示相匹配的一種形式。P.25“萬有引力定理”,使用映射:x→lnx2)定義和概念屬性:原始的數(shù)據(jù)量(或輸入量),空間X是輸入空間(低維)。特征:經(jīng)變化后,用于描述數(shù)據(jù)的量新空間是特征空間(高維)特征選擇(特征映射):選擇最適合學(xué)習(xí)問題的數(shù)據(jù)表達(dá)方式的任務(wù)
P.26圖3.1經(jīng)過特征映射,使得所得數(shù)據(jù)可以線性分開P.26圖3.1特征映射:二維輸入空間→二維特征空間
數(shù)據(jù)線性分開:不能→能3)特征映射可能產(chǎn)生的困難考慮二維輸入空間的情形假定關(guān)于問題的先驗(yàn)知識提示:相關(guān)信息已編碼到自由度為2的單項(xiàng)式的形式,則一個可能使用的映射是:(4維)對于n維輸入空間,自由度取為d的單項(xiàng)式形式,特征映射:若還要用到交錯項(xiàng)的信息表示,則其特征空間的維數(shù)將很快變得不可計(jì)算。4)特征選擇面臨的重要任務(wù)
降低和排除維數(shù)災(zāi)難,提高計(jì)算性能和泛化性能檢測出無關(guān)特征并將其去除特別是那些與目標(biāo)值輸出無關(guān)的特征例:萬有引力計(jì)算中,物體的顏色、溫度等維數(shù)約簡:尋找包含原始屬性中必要信息的最小特征集(d盡可能小于n)關(guān)于萬有引力的例子作為學(xué)習(xí)過程的一個重要部分,如何實(shí)現(xiàn)自動化及避免選擇的任意性。(主成分分析,…)P.26,例3.2關(guān)于萬有引力定理的進(jìn)一步例子:2、使用線性學(xué)習(xí)器學(xué)習(xí)一個非線性
關(guān)系1)考慮問題的思路2)到特征空間的隱式映射3)核函數(shù)方法1)考慮問題的思路應(yīng)用一個固定的非線性映射Φ,將原始數(shù)據(jù)(屬性)從輸入空間Χ映射到特征空間F,在特征空間F中使用線性學(xué)習(xí)器,提高計(jì)算能力。所考慮的假設(shè)集是形為f(x)的函數(shù):
(非線性特征映射)即用二步法建立一個非線性學(xué)習(xí)器。2)到特征空間的隱式映射線性學(xué)習(xí)器的一個重要性質(zhì)是可以表述為對偶形式(對偶變量)針對上述變換后的假設(shè)如果能找到一種方式,避開對特征映射Φ的顯式運(yùn)算,而在特征空間F中直接計(jì)算內(nèi)積,則可得到假設(shè)函數(shù)在對偶空間上的表示:原問題化為對偶空間()上的一個線性學(xué)習(xí)問題,而特征空間F本身的維數(shù)N
和特征映射的顯式表示不再影響計(jì)算。3)核函數(shù)方法
核的使用,避免了特征向量的顯式表示,而用原始數(shù)據(jù)隱式表達(dá)了特征空間,并在對偶空間上直接訓(xùn)練線性學(xué)習(xí)器。關(guān)于訓(xùn)練樣例的唯一信息是它們在特征空間上的Gram矩陣,稱為核矩陣(),用粗體表示ii)核的幾個簡單例子(pp.28-29)iii)核函數(shù)方法的特點(diǎn)內(nèi)積特征空間ii)核的幾個簡單例子特征:自由度為d
的多項(xiàng)式返回3.4節(jié)iii)核函數(shù)方法的特點(diǎn)直觀想法:①創(chuàng)建一個復(fù)雜的特征空間②尋找該特征空間上適當(dāng)?shù)膬?nèi)積③尋找一種直接的方法,用原始輸入計(jì)算該值實(shí)際做法:①直接定義一個核函數(shù)②通過它隱式地定義了特征空間(因此,在計(jì)算內(nèi)積時,在學(xué)習(xí)器的設(shè)計(jì)中,都避開了具體的特征空間)3、關(guān)于核函數(shù)的討論1)核函數(shù)的性質(zhì)和Mercer定理2)再生核希爾伯特空間(RKHS)
(ReproducingKernelHilbertSpace)3)從核函數(shù)出發(fā)構(gòu)造核函數(shù)4)從特征出發(fā)構(gòu)造核函數(shù)1)核函數(shù)的性質(zhì)和Mercer定理i)對稱性:
ii)Cauchy-Schward不等式:
iii)非負(fù)定性——Mercer定理
a)是有限個輸入組成的空間,是上對稱函數(shù)
b)更一般情形iii)非負(fù)定性——Mercer定理a)是有限個輸入組成的空間,是上對稱函數(shù):是核函數(shù)矩陣是半正定的(非負(fù)定)(證明:p.30命題3.5)實(shí)際對應(yīng)特征映射
其中λt是K的第t個特征值,vt是λt對應(yīng)的特征向量。有限維輸入下,Mercer定理的證明(命題3.5)命題3.5證明(續(xù))iii)非負(fù)定性——Mercer定理(續(xù))b)一般情形(輸入的個數(shù)可能無限)①M(fèi)ercer定理:設(shè)輸入空間是緊子集,假設(shè)K是連續(xù)對稱函數(shù)。任意對稱,非負(fù)定函數(shù)可以看作平方可積函數(shù)空間上的一個內(nèi)積。①M(fèi)ercer定理的說明假設(shè)K是連續(xù)對稱函數(shù)b)一般情形的說明(續(xù))決策函數(shù)在原輸入空間上的表示決策函數(shù)在對偶空間上的表示2)再生核希爾伯特空間(RKHS)
(ReproducingKernelHilbertSpace)函數(shù)空間H
的引進(jìn)及其產(chǎn)生的問題核K對于H中函數(shù)的再生性
iii)RKHS及其作用i)函數(shù)空間H的引進(jìn)及其產(chǎn)生的問題
函數(shù)空間H
的引進(jìn):(假設(shè)空間的轉(zhuǎn)換)引進(jìn)一個函數(shù)空間H,H是特征空間F在映射T下的映像
由定義在輸入空間X上的函數(shù)組成i)問題的產(chǎn)生(續(xù))在無窮維F的情況下:H可能不包括所有可能的假設(shè)函數(shù)(它們可能是在F中沒有有限范數(shù)的點(diǎn)的映像)H可能包括過多的函數(shù)(不利于計(jì)算、以及泛化性)提出RKHS,就是為了保證H確切地包含假設(shè)集,且有一定的附加性質(zhì)。ii)核K對于H中函數(shù)的再生性ii)核K對于H中函數(shù)的再生性(續(xù))iii)再生核希爾伯特空間(RKHS)及其作用iii)再生核希爾波特空間(RKHS)及其作用(續(xù))③④iii)Mercer核和
再生核希爾伯特空間(RKHS)結(jié)論:(th.3.10,p.37)對定義在域上的每一個Mercer核存在一個由定義在X上的函數(shù)所組成的RKHS.H,其逆定理也成立:對線性有界函數(shù)的任意Hilbert空間,存在再生核函數(shù)。且此再生核是Mercer核。關(guān)于RKHS作用的一個例子(p.37,例3.11)=t(xi)=yi與αi無關(guān)3)從核函數(shù)出發(fā)構(gòu)造核函數(shù)確認(rèn)一個對稱函數(shù)是核函數(shù)的關(guān)鍵:函數(shù)在任意有限點(diǎn)集上定義的Gram矩陣是半正定的可以從簡單的核出發(fā),構(gòu)造復(fù)雜的核:(p.38,命題3.12)4)從特征出發(fā)構(gòu)造核函數(shù)直接通過內(nèi)積的計(jì)算,從而不需要驗(yàn)證半正定性例如:前述的多項(xiàng)式核(pp.28-29)特殊:例3.15(字符串子序列核)(p.40)在非歐氏空間(離散空間)中核方法的應(yīng)用潛力在非歐氏空間(離散空間)中核方法的應(yīng)用潛力_2在非歐氏空間(離散空間)中核方法的應(yīng)用潛力_34、特征空間中的計(jì)算1)核的使用,避免了顯式計(jì)算特征向量
特征映射:得到的內(nèi)嵌是非線性的,它定義了特征空間的n維子流形;此時,特征空間F中可以用對偶形式表示的點(diǎn),即:映像的線性組合通常不對應(yīng)任意輸入點(diǎn)的映像(即,不一定找得到其在X中的關(guān)于的原像點(diǎn)),但仍然可以計(jì)算這些點(diǎn)之間的距離和內(nèi)積。2)具體計(jì)算方法2)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆山西省山西大學(xué)附中高三生物第一學(xué)期期末學(xué)業(yè)水平測試模擬試題含解析
- 來賓市重點(diǎn)中學(xué)2025屆生物高一上期末聯(lián)考試題含解析
- 2025屆安徽省舒城桃溪中學(xué)生物高三第一學(xué)期期末學(xué)業(yè)水平測試模擬試題含解析
- 2025屆河北省滄州市普通高中生物高三上期末教學(xué)質(zhì)量檢測試題含解析
- 2025屆浙江省溫州市共美聯(lián)盟生物高三上期末教學(xué)質(zhì)量檢測試題含解析
- 2025屆廣東省深圳市翻身實(shí)驗(yàn)學(xué)校數(shù)學(xué)高一上期末統(tǒng)考模擬試題含解析
- 湖北武漢市華中師大一附中2025屆高二上生物期末聯(lián)考模擬試題含解析
- 2025屆云南昆明市黃岡實(shí)驗(yàn)學(xué)校生物高三上期末監(jiān)測模擬試題含解析
- 江蘇省南通市田家炳中學(xué)2025屆數(shù)學(xué)高一上期末監(jiān)測模擬試題含解析
- 山東棗莊八中2025屆高三生物第一學(xué)期期末質(zhì)量跟蹤監(jiān)視模擬試題含解析
- 新質(zhì)生產(chǎn)力:復(fù)合概念、發(fā)展基礎(chǔ)與系統(tǒng)創(chuàng)新路徑
- 2024年個人車位租賃合同參考范文(三篇)
- (完整版)新概念英語第一冊單詞表(打印版)
- 江西省九江市修水縣2024屆九年級上學(xué)期期中考試數(shù)學(xué)試卷(含答案)
- 2024年山東省濟(jì)南市中考數(shù)學(xué)真題(含答案)
- 二手門市銷售合同范本
- 2024年安全員A證試題庫(附答案)
- 部編版五年級上冊《交流平臺·初試身手·習(xí)作例文》課件
- 新蘇教版六年級上冊科學(xué)全冊知識點(diǎn)
- 2.2生命活動的主要承擔(dān)者-蛋白質(zhì)(公開課)
- 2024-2030年中國汽摩配行業(yè)運(yùn)營態(tài)勢及重點(diǎn)企業(yè)發(fā)展分析報(bào)告
評論
0/150
提交評論