版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、遷移學(xué)習(xí)域自適應(yīng)性-李宏毅筆記遷移學(xué)習(xí)域自適應(yīng)性導(dǎo)語在真實(shí)的機(jī)器學(xué)習(xí)項(xiàng)目中,我們的訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集之間是存在一定數(shù)據(jù)分布差異的,這個(gè)時(shí)候往往模型會(huì)出現(xiàn)過擬合的情況,模型在測(cè)試集上的效果不是很理想。那怎么樣在不改變數(shù)據(jù)集的情況下,提升測(cè)試集準(zhǔn)確率呢。這個(gè)時(shí)候就有了遷移學(xué)習(xí)的一種代表方法,域自適應(yīng)(Domainadaptation)。另外在遷移學(xué)習(xí)中又分樣本遷移、特征遷移和模型遷移,其中模型遷移學(xué)習(xí)與fine-tune(微調(diào))有一些不同的地方:雖然二者都是利用訓(xùn)練過的模型來解決問題,但實(shí)際上存在一些差異:“fine-tune(微調(diào)):是對(duì)已經(jīng)訓(xùn)練好的模型,把整個(gè)這個(gè)模型放到另一個(gè)數(shù)據(jù)集上繼續(xù)
2、進(jìn)行訓(xùn)練(其中參數(shù)繼續(xù)發(fā)生變化)“遷移學(xué)習(xí):提取模型中所需要的部分層,對(duì)這些層進(jìn)行凍結(jié)(固定層的參數(shù))在凍結(jié)層后增加新的訓(xùn)練層,最后完成訓(xùn)練。fine-tune是繼續(xù)更新模型的參數(shù),遷移學(xué)習(xí)是固定一部分參數(shù),訓(xùn)練更新一部分參數(shù)。Domainadaptation域自適應(yīng)方法,通常表示域不同,但任務(wù)相同的方法,這里域代表一個(gè)數(shù)據(jù)集的集合。什么樣子的域(數(shù)據(jù)集),可以適合來做域自適應(yīng)呢通常我們的源域(與測(cè)試樣本不同的數(shù)據(jù)集,也可以說是訓(xùn)練集)數(shù)據(jù)集有標(biāo)簽,目標(biāo)域數(shù)據(jù)(測(cè)試集)沒有標(biāo)簽或者很少數(shù)據(jù)有標(biāo)簽2.1Domainadaptation思路定義源域(訓(xùn)練集):source定義目標(biāo)域(測(cè)試集):ta
3、rget主要的思路就是將source訓(xùn)練好的模型能夠用在target上,域適配問題最主要的就是如何減少source和target不同分布之間的差異。域適配包括無監(jiān)督域適配和半監(jiān)督域適配,前者的target是完全沒有l(wèi)abel的,后者的target有部分的Iabel,但是數(shù)量非常的少通過在不同階段進(jìn)行領(lǐng)域自適應(yīng),研究者提出了三種不同的領(lǐng)域自適應(yīng)方法:樣本自適應(yīng):對(duì)源域樣本進(jìn)行加權(quán)重采樣,從而逼近目標(biāo)域的分布。特征層面自適應(yīng):將源域和目標(biāo)域投影到公共特征子空間。模型層面自適應(yīng):對(duì)源域誤差函數(shù)進(jìn)行修改,考慮目標(biāo)域的誤差。2.2樣本自適應(yīng)樣本自適應(yīng)也可以說是樣本遷移。基本思想:通過對(duì)source,進(jìn)行
4、重采樣,在source里找到與target相似的數(shù)據(jù),命這些相似數(shù)據(jù)為新的source。把source數(shù)據(jù)的數(shù)據(jù)量,量權(quán)值進(jìn)行調(diào)整,使其這些數(shù)據(jù)與target數(shù)據(jù)分布基本一致,如下圖所示:優(yōu)點(diǎn)缺點(diǎn)縮放,白噪聲等。缺點(diǎn):權(quán)2.特征自適應(yīng)特征自適應(yīng)也可以說是特征遷移,基本思路:通過構(gòu)建特征提取網(wǎng)絡(luò),訓(xùn)練網(wǎng)絡(luò)模型,使模型能夠提取出source與target的共同特征部分,相似的數(shù)據(jù)分布。如下圖所示,我們輸入source和target數(shù)據(jù)集正數(shù)據(jù)分布相似。最后如上器,%LZ-征提取器可以看成GAN中的geneitor訓(xùn)練集與測(cè)試這里的提取瞽做的是讓進(jìn)一步優(yōu)卜布,幾乎一樣難以分辨出(也就是說domain
5、classifier就是GAN中的discriminator,我們的目的,就是找到一個(gè)特征提取過:曰domainclassifier。classifier的反饋,下圖為不(同soUrcd和target文器),這樣才能讓下,只有source和加曲正很相似classifier是要努力分辨他們(我們通過我們最后要的是提取器。MethodITHMBHSyrNino5VHNSynSkmGT訓(xùn)優(yōu)缺點(diǎn)點(diǎn)多今數(shù)方法適耳9targeti丿訓(xùn)練下的結(jié)果。缺點(diǎn):在于難于求解,容易發(fā)生過適配2.4模型自適應(yīng)模型自適應(yīng)就是最常用的遷移學(xué)習(xí)方式,模型遷移?;舅枷耄和ㄟ^已經(jīng)訓(xùn)練好的模型,將模型放入到一個(gè)新的領(lǐng)域數(shù)據(jù)集中訓(xùn)練固定住模型部分層(不改變層的結(jié)構(gòu),以及參數(shù))更改部分模型層,(初始化這些層的參數(shù),可能也會(huì)改變層的結(jié)構(gòu))訓(xùn)練模型如下圖案例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 防火阻燃材料的應(yīng)用與測(cè)評(píng)
- 電子商務(wù)平臺(tái)銷售合同
- 寄賣合同范本模板
- 泥工勞務(wù)分包合同
- 沙石材料運(yùn)輸合同范本
- 物業(yè)管理中的環(huán)境保護(hù)措施
- 房地產(chǎn)開發(fā)投資合同
- 輸尿管鏡項(xiàng)目可行性研究報(bào)告
- 平頭式塔式起重機(jī)臂架輕量化設(shè)計(jì)研究
- 委托合同中的利益沖突及其救濟(jì)
- 三年級(jí)上冊(cè)豎式計(jì)算練習(xí)300題及答案
- 點(diǎn)亮生命-大學(xué)生職業(yè)生涯發(fā)展與就業(yè)指導(dǎo)全套教學(xué)課件
- 旅居管家策劃方案
- 車間消防安全知識(shí)培訓(xùn)課件
- 華為經(jīng)營管理-華為的研發(fā)管理(6版)
- 鋰離子電池生產(chǎn)工藝流程圖
- 平衡計(jì)分卡-化戰(zhàn)略為行動(dòng)
- 幼兒園小班下學(xué)期期末家長(zhǎng)會(huì)PPT模板
- 礦山安全培訓(xùn)課件-地下礦山開采安全技術(shù)
- GB/T 6417.1-2005金屬熔化焊接頭缺欠分類及說明
- 《社會(huì)主義市場(chǎng)經(jīng)濟(jì)理論(第三版)》第七章社會(huì)主義市場(chǎng)經(jīng)濟(jì)規(guī)則論
評(píng)論
0/150
提交評(píng)論