遷移學(xué)習(xí)域自適應(yīng)性李宏毅筆記_第1頁
遷移學(xué)習(xí)域自適應(yīng)性李宏毅筆記_第2頁
遷移學(xué)習(xí)域自適應(yīng)性李宏毅筆記_第3頁
遷移學(xué)習(xí)域自適應(yīng)性李宏毅筆記_第4頁
遷移學(xué)習(xí)域自適應(yīng)性李宏毅筆記_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、遷移學(xué)習(xí)域自適應(yīng)性-李宏毅筆記遷移學(xué)習(xí)域自適應(yīng)性導(dǎo)語在真實(shí)的機(jī)器學(xué)習(xí)項(xiàng)目中,我們的訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集之間是存在一定數(shù)據(jù)分布差異的,這個(gè)時(shí)候往往模型會(huì)出現(xiàn)過擬合的情況,模型在測(cè)試集上的效果不是很理想。那怎么樣在不改變數(shù)據(jù)集的情況下,提升測(cè)試集準(zhǔn)確率呢。這個(gè)時(shí)候就有了遷移學(xué)習(xí)的一種代表方法,域自適應(yīng)(Domainadaptation)。另外在遷移學(xué)習(xí)中又分樣本遷移、特征遷移和模型遷移,其中模型遷移學(xué)習(xí)與fine-tune(微調(diào))有一些不同的地方:雖然二者都是利用訓(xùn)練過的模型來解決問題,但實(shí)際上存在一些差異:“fine-tune(微調(diào)):是對(duì)已經(jīng)訓(xùn)練好的模型,把整個(gè)這個(gè)模型放到另一個(gè)數(shù)據(jù)集上繼續(xù)

2、進(jìn)行訓(xùn)練(其中參數(shù)繼續(xù)發(fā)生變化)“遷移學(xué)習(xí):提取模型中所需要的部分層,對(duì)這些層進(jìn)行凍結(jié)(固定層的參數(shù))在凍結(jié)層后增加新的訓(xùn)練層,最后完成訓(xùn)練。fine-tune是繼續(xù)更新模型的參數(shù),遷移學(xué)習(xí)是固定一部分參數(shù),訓(xùn)練更新一部分參數(shù)。Domainadaptation域自適應(yīng)方法,通常表示域不同,但任務(wù)相同的方法,這里域代表一個(gè)數(shù)據(jù)集的集合。什么樣子的域(數(shù)據(jù)集),可以適合來做域自適應(yīng)呢通常我們的源域(與測(cè)試樣本不同的數(shù)據(jù)集,也可以說是訓(xùn)練集)數(shù)據(jù)集有標(biāo)簽,目標(biāo)域數(shù)據(jù)(測(cè)試集)沒有標(biāo)簽或者很少數(shù)據(jù)有標(biāo)簽2.1Domainadaptation思路定義源域(訓(xùn)練集):source定義目標(biāo)域(測(cè)試集):ta

3、rget主要的思路就是將source訓(xùn)練好的模型能夠用在target上,域適配問題最主要的就是如何減少source和target不同分布之間的差異。域適配包括無監(jiān)督域適配和半監(jiān)督域適配,前者的target是完全沒有l(wèi)abel的,后者的target有部分的Iabel,但是數(shù)量非常的少通過在不同階段進(jìn)行領(lǐng)域自適應(yīng),研究者提出了三種不同的領(lǐng)域自適應(yīng)方法:樣本自適應(yīng):對(duì)源域樣本進(jìn)行加權(quán)重采樣,從而逼近目標(biāo)域的分布。特征層面自適應(yīng):將源域和目標(biāo)域投影到公共特征子空間。模型層面自適應(yīng):對(duì)源域誤差函數(shù)進(jìn)行修改,考慮目標(biāo)域的誤差。2.2樣本自適應(yīng)樣本自適應(yīng)也可以說是樣本遷移。基本思想:通過對(duì)source,進(jìn)行

4、重采樣,在source里找到與target相似的數(shù)據(jù),命這些相似數(shù)據(jù)為新的source。把source數(shù)據(jù)的數(shù)據(jù)量,量權(quán)值進(jìn)行調(diào)整,使其這些數(shù)據(jù)與target數(shù)據(jù)分布基本一致,如下圖所示:優(yōu)點(diǎn)缺點(diǎn)縮放,白噪聲等。缺點(diǎn):權(quán)2.特征自適應(yīng)特征自適應(yīng)也可以說是特征遷移,基本思路:通過構(gòu)建特征提取網(wǎng)絡(luò),訓(xùn)練網(wǎng)絡(luò)模型,使模型能夠提取出source與target的共同特征部分,相似的數(shù)據(jù)分布。如下圖所示,我們輸入source和target數(shù)據(jù)集正數(shù)據(jù)分布相似。最后如上器,%LZ-征提取器可以看成GAN中的geneitor訓(xùn)練集與測(cè)試這里的提取瞽做的是讓進(jìn)一步優(yōu)卜布,幾乎一樣難以分辨出(也就是說domain

5、classifier就是GAN中的discriminator,我們的目的,就是找到一個(gè)特征提取過:曰domainclassifier。classifier的反饋,下圖為不(同soUrcd和target文器),這樣才能讓下,只有source和加曲正很相似classifier是要努力分辨他們(我們通過我們最后要的是提取器。MethodITHMBHSyrNino5VHNSynSkmGT訓(xùn)優(yōu)缺點(diǎn)點(diǎn)多今數(shù)方法適耳9targeti丿訓(xùn)練下的結(jié)果。缺點(diǎn):在于難于求解,容易發(fā)生過適配2.4模型自適應(yīng)模型自適應(yīng)就是最常用的遷移學(xué)習(xí)方式,模型遷移?;舅枷耄和ㄟ^已經(jīng)訓(xùn)練好的模型,將模型放入到一個(gè)新的領(lǐng)域數(shù)據(jù)集中訓(xùn)練固定住模型部分層(不改變層的結(jié)構(gòu),以及參數(shù))更改部分模型層,(初始化這些層的參數(shù),可能也會(huì)改變層的結(jié)構(gòu))訓(xùn)練模型如下圖案例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論