版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
AI建模師素養(yǎng)手冊第理解Diffusion——從DAE降噪出發(fā)By高煥堂/AI建模師俱樂部會長—般AE面對MissingDataDAE有更強(qiáng)的過濾能力過濾能力愈強(qiáng),生成能力愈好多層DAE設(shè)計OvercompleteDAE模型-本文發(fā)表于臺灣AIC產(chǎn)業(yè)聯(lián)盟技術(shù)分享大會上?原來的主題是:AI生成與DAE降噪機(jī)制。-最近,由于Diffusi。n的爆紅,它又非常依賴降噪機(jī)制的訓(xùn)練,所以我就拿簡單的DAE降噪機(jī)制來做為理解Diffusion的基礎(chǔ)。本文發(fā)表于臺灣AIC產(chǎn)業(yè)聯(lián)盟
技術(shù)分享大會(2022.2.17)2022/2/172022/2/17臺灣AIC(AI+IC)技術(shù)分享大會請參閱:/pdi7id=h4EOymDV3vV這文章里寫道:-最近,以連續(xù)時間隨機(jī)微分方程形式的擴(kuò)張(Diffusion)模型,已被證實(shí)是一個成功的〈非對抗性〉生成模型。-這類模型是采用〈降噪分?jǐn)?shù)匹配(DSM)>的加權(quán)和進(jìn)行訓(xùn)練,可以看作是多尺度的DAE(降噪自編碼器)。也請參閱:https://www.iro.umontreal.ca/~vincentp/Publications/smdae_techreportpdf-這篇文章的主題是:“AConnectionBetweenScoreMatchingandDenoisingAutoencoders”(降噪分?jǐn)?shù)匹配(DSM)與DAE的連結(jié))一般AE面對MissingDataAE面對MissingData復(fù)習(xí)AE(Autoencoder)-在上一集里,您已經(jīng)看到了,一般典型的AE就具有過濾的能力。而本集所介紹DAE的過濾能力將更上一層樓。-于此先復(fù)習(xí)一下AE的基本性質(zhì),然后看看它如何面對MissingData。AE面對MissingData從補(bǔ)值角度來看AE-先從AE說起。例如有一個AE模型(daeOLpy):ABcABcDEFGHIJKLMNX(輸入值)H(潛藏空間)T(目標(biāo)值)xOxlx2hOhltotlt26162161621135135135135-請按下〈學(xué)習(xí)〉,就展幵訓(xùn)練流程。X(輸入值)xOxlx26■2■16■2■11■3■5135訓(xùn)練資料(4只動物)耳朵長度X(輸入值)訓(xùn)練資料(4只動物)耳朵長度眼睛大小訓(xùn)練資料(4只動物)耳朵長度眼睛大小胡須長度訓(xùn)練資料(4只動物)X(輸入值)xOxlxOxl訓(xùn)練資料TOC\o"1-5"\h\z6 2 1訓(xùn)練資料6 2 11 3 51 3 5EncoderDecoderY^X幵始訓(xùn)練?得出Encoder和Decoder:ABCDEFGHIJKLM1X(輸入值)H(潛藏空間)T(目標(biāo)值)2xOxJx.2hOhltot]t23610.990.016214610.99Q016215<<1350.010.9911355勇35J0,99391OCQ3WH0.87-1.06JWO3.711-0.81A學(xué)習(xí)&補(bǔ)值100,090,15-1,392,013,2611-1.181.11BO2330.991.7812BH0.420□J完成了!13K_XEncoderH1DecoderY XWH0.97-0.96WO4,160.86I-1.21H30.060.12-0.921.892.87BH-1.290.42L010BO]L88L12I2.17WH0.97-0.96BH0.060.12-1.29L010.420顯著特征顯著特征顯著特征顯著特征顯著■特征-0.960.12-1.21顯著特征X0k■0.861.072.8/AE面對MissingDataI檢驗(yàn)一下這個AE模型新資料6 2 1新資料6 2 11 3 5EncoderDecoderEncoderDecoderWH 0.97 -0.960.06 0.12WH 0.97 -0.960.06 0.12-1.29 L01BH 0.42 0WO 416 0.86 -L21-0.92 L89 2.87BO L88 1.12 2J7AE面對MissingDataI檢驗(yàn)一下這個AE模型?實(shí)際操作daeOl.py:
AE面對MissingDataI進(jìn)行測試-按下〈預(yù)測〉,就得到:。WHABCDE新資料621135BHW04.160.864,21預(yù)測(還原)-0.921,892.87B01.881.122.17?正確地還原了。AE面對MissingData使用MissingData來測試-剛才的輸入數(shù)據(jù),都是完整的。?如果測試數(shù)據(jù)含有MissingData,會如何呢?AE面對MissingData使用MissingData來測試MissingData6某些特征值遺失了MissingData6某些特征值遺失了?如果測試數(shù)據(jù)含有MissingData,如下:MissingDataMissingDataEncoderDecoderWH0.97-0.960.060.12-1.29WH0.97-0.960.060.12-1.29L01BH0.420-0.92 L89 2.87BO L88 1.12 2J7AE面對MissingDataI進(jìn)行預(yù)測(補(bǔ)值)?準(zhǔn)備輸入數(shù)據(jù)(MissingData)°H向量MissingDataImputedData"收9平均值0.97預(yù)測(還原)-0.960.12AI2345d6789WH101112BH134.160.86-1,21-0.921,892.87L881.122.1714141414AE面對MissingDataX(輸入值)x0xlx2進(jìn)行預(yù)測(補(bǔ)值)-先設(shè)定為〈平均值〉。ABCDEFGH2.5MissingData6661122331155H向量ImputedData設(shè)定平均值6789WH0.97-0.96WO4,160.864.21100.060.12-0.921,892.8711-1.29L01BO1.881.122J7435212BH0,420133.5預(yù)測(還原)AE面對MissingDataI進(jìn)行預(yù)測(補(bǔ)值)-按下〈預(yù)測〉,就得到:。12345678MissingData613.50.930.080.090.920.520.48H向量ImputedData619WH0.97-0.96WO4.160.86-1,21100,060,12-0,921.892,8711-1.291,01BO1.881.122.1711BH0.42■13設(shè)定
平均值預(yù)測(還原)很好補(bǔ)值很好補(bǔ)值A(chǔ)E面對MissingDataI進(jìn)行預(yù)測(補(bǔ)值)12345678BMissingData61G3.50.930.080.090.920.520.48H向量611LM[moutedData213523設(shè)定平均值9WH0.97-0.96WO4.160.86-1,21100,060,12-0,921.892,8711-1.291,01BO1.881.122.1711BH0.42■13預(yù)測(還原)AE面對MissingDataI進(jìn)行預(yù)測(補(bǔ)值)不理想的補(bǔ)值!BMissingData61G3.50.930.080.090.920.520.48H向量6MImputedData19WH0.97-0.96WO4.160.86-1,21100,060,12-0,921.892,8711-1.291,01BO1.881.122.1712BH0.42■137設(shè)定
平均值預(yù)測(還原)H1H向量230.930,08MissingData繼續(xù)改進(jìn)10111213WHBH■60.970,06-1.290.42-0.960,121.01WOBO0.090.524.16
-0,921.880.920.480.86L891.12-1.212,872.17不理想的補(bǔ)值!LMImputedData21,/J35/423領(lǐng)醐懼設(shè)定平均值預(yù)測(還原)DAE有更好的過濾能力簡介DAE(DenoisingAutoencoder)-顧名思義,DAE的〃Denoising”是去除噪音之意,也就是把噪音<過濾〉掉。?而本集所介紹DAE的過濾能力將更上一層樓。?DAE有更好的過濾能力|復(fù)習(xí):典型的AE架構(gòu)feHiddenLayerInputLayerOutputLayer復(fù)習(xí):典型的AE架構(gòu)(潛藏空間)HiddenLayerIlDecoderyInputLayer XOutputLayer(輸入值)(輸出值)?DAE有更好的過濾能力|擴(kuò)大為DAE架構(gòu)autoencoder::hautoencoder::h■denoisingautoencoderiHiddenLayerInputData■VICorrupted■
partially:InputLayerOutputLayer;autoencoder:: …… j;IdenoisingautoencoderiX(輸入值)xOxlx2621621135X(輸入值)X(輸入值)MissingDataDAEX(輸入值)MissingDataDAE有更好的過濾能力訓(xùn)練數(shù)據(jù)也能含有MissingData?將上一節(jié)的一筆MissingData并入訓(xùn)練數(shù)據(jù)集I使用MissingData來訓(xùn)練它Encoder新的訓(xùn)練資料(含MissingData)DecoderY&X建立AE模型123456J8123456J89101112131415X(輸入值)KLM一(百標(biāo)值)tOt)t2設(shè)定
平均值學(xué)習(xí)&補(bǔ)值-按下〈設(shè)定>和<學(xué)習(xí)〉按鈕,就展開學(xué)習(xí):幵始訓(xùn)練?得出Encoder和Decoder:123456BCDX(輸入值)x0xlx2621611351353521H(潛藏空間)h0hl0.010.490.490.93KLMT(目標(biāo)值)tot]t26216211351356210.930.016凱0.48完成了!1,690.010.34-0.31-1.520.750.61-07110111213 BH15EncoderDecoderWH WH 1.69 0.010.34 -0.31-1.52 0.75BH 0.61 -0.21TOC\o"1-5"\h\zWO5 -0.21 -2.98-0.16 1.77 2.4BO 1.08 1.35 2.81
MissingDataMissingDataEncoderDecoderWH 1.69 0.010.34 -0.31-1.52 0.75BH 0.61 -0.21MissingDataMissingDataEncoderDecoderWH 1.69 0.010.34 -0.31-1.52 0.75BH 0.61 -0.21-0.16 1.77 2.4BO 1.08 1.35 2.81實(shí)際操作?準(zhǔn)備輸入數(shù)據(jù)(MissingData)°-按下〈設(shè)定>和<預(yù)測〉按鈕,就進(jìn)行還原:
DAE有更好的過濾能力|展開補(bǔ)值-輸出預(yù)測結(jié)果:
?DAE有更好的過濾能力改進(jìn)了I提升補(bǔ)值能力了改進(jìn)了MissingData-0.21H向量0.79-2.980.220.750.93-0.21-0.16ImputedData6設(shè)定平均值預(yù)測(還原)X(輸入值)X(輸入值)MissingDataX(輸入值)X(輸入值)MissingDataDAE有更好的過濾能力拿更多MissingData來訓(xùn)練它建立AE模型-按下〈設(shè)定>和<學(xué)習(xí)〉按鈕,就進(jìn)行訓(xùn)練:得到更好的補(bǔ)值I111213141516171819xOxlx261621351353.521132.43-2.53-0,450,36-2.162.010.47-071cDWHBHMissingData1B一X(輸入值)3hOhl10100101100.010.994.490.71-1.27-0,521,712,411.511.292.61H向量100.010.990.830.09HWOBOG瓦:潛藏空間)KLMNT(目標(biāo)值)totlt26-很不錯
的補(bǔ)值學(xué)習(xí)&補(bǔ)值完成了!5設(shè)定平均值23tedData1.31.8精益求精…例如,采隨機(jī)方式,從X里得出更多MissingData來訓(xùn)練它denoisingautoencoder?潛藏空間H向量的變化|H向量的意義?DAE是一種能接受損壞(遺失)資料作為輸入,并訓(xùn)練AE來預(yù)測(補(bǔ)值)原始未被損壞資料作為輸出的自編碼器。autoencoder:hdenoisingautoencoder
潛藏空間H向量的變化-DAE通過學(xué)習(xí)原始數(shù)據(jù)和損壞數(shù)據(jù)的共同潛在表示。(…learningcommonlatentrepresentationiovertheoriginalandcorrupteddata.)InputDataCorrupted:partially:InputLayertHiddenLayerOutputLayer;:Zautoencoder:: _________——……登:■denoisingautoencoderi潛藏空間H向量的變化-DAE通過學(xué)習(xí)原始數(shù)據(jù)和損壞數(shù)據(jù)的共同潛在表示。J./earningcommonlatentrepresentationovertheoriginalandcorrupteddata.)-俗語說:萬變不離其宗。?這個<宗>就是共同潛在的表示(Commonlatentrepresentation)涵意。?潛藏空間H向量的變化|請看一個簡單的AE模型(dae02.py)-按下〈學(xué)習(xí)〉按鈕,就進(jìn)行訓(xùn)練:14141414?潛藏空間H向量的變化I展幵訓(xùn)練?得出Encoder和Decoder:ABCDEFGHIJKLM1X(輸入值)H(潛藏空間)T(目標(biāo)值)2x0xlx2hOhltotlt231350.010.9813546110.036156lotAWH1.04-0.770.030.1-L36BH0.410學(xué)習(xí)EncoderEncoderDecoderWH 1.04 -0.770.03 0.1-136 0.89BH 041 0TOC\o"1-5"\h\zWH 1.04 -0.770.03 0.1-136 0.89BH 041 0-0.6 1.76 2.56BO 1.57 1.27 2.5新資料2EncoderEncoderDecoderWH 1.04 -0.770.03 0.1-136 0.89BH 041 0TOC\o"1-5"\h\zWH 1.04 -0.770.03 0.1-136 0.89BH 041 0-0.6 1.76 2.56BO 1.57 1.27 2.5?潛藏空間H向量的變化|準(zhǔn)備預(yù)測-按下〈預(yù)測〉按鈕,就進(jìn)行預(yù)測:潛藏空間H潛藏空間H向量的變化|展開預(yù)測?輸出結(jié)果:很不錯
的預(yù)測661新資料預(yù)測值DecoderEncoderWH1.04-0.770.030.1-1.360.8904110,03WO4470,69-1,57-0.61.762.56BO1.571.272.5新資料0,03EncoderDecoder新資料0,03EncoderDecoder
Decoder
潛藏空間H向量的變化檢驗(yàn)一下它的補(bǔ)值能力-剛才是拿完整的數(shù)據(jù)來預(yù)測。?現(xiàn)在改拿MissingData來進(jìn)行補(bǔ)值。基于一樣的Encoder和Decoder:EncoderDecoderMissingDataEncoderEncoderDecoderWH 1.04 -0.770.03 0.1-136 0.89BH 041 0TOC\o"1-5"\h\zWH 1.04 -0.770.03 0.1-136 0.89BH 041 0-0.6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022年上海統(tǒng)計師(初級)考試題庫(含基礎(chǔ)和實(shí)務(wù))
- 甘孜職業(yè)學(xué)院《工程機(jī)械設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級科學(xué)上冊11.1生物的感覺11.1.1生物對環(huán)境變化的反應(yīng)學(xué)案無答案牛津上海版
- 三年級數(shù)學(xué)上冊6平移旋轉(zhuǎn)和軸對稱單元概述和課時安排素材蘇教版
- 三年級數(shù)學(xué)上冊四乘與除教案北師大版
- 三年級科學(xué)上冊第三單元人與動物5動物世界第一課時教案首師大版
- 三年級科學(xué)下冊第四單元磁鐵第3課磁鐵的兩極教學(xué)材料教科版
- 計量設(shè)備培訓(xùn)課件
- 《米拉公寓建筑分析》課件
- 《弧形導(dǎo)臺過站》課件
- 2024年版電商平臺入駐商家服務(wù)與銷售分成合同
- 蜜雪冰城合同范例
- 小紅書種草營銷師(初級)認(rèn)證考試真題試題庫(含答案)
- LPG液化氣充裝站介質(zhì)分析操作規(guī)程 202412
- 養(yǎng)老院環(huán)境衛(wèi)生保潔方案
- 中學(xué)學(xué)校裝修改造工程施工組織設(shè)計方案
- 2024年WPS計算機(jī)二級考試題庫350題(含答案)
- 2024年5G網(wǎng)絡(luò)覆蓋工程分包合同
- 2025屆北京市海淀區(qū)交大附中高一物理第一學(xué)期期末復(fù)習(xí)檢測試題含解析
- 天津市武清區(qū)2024-2025學(xué)年九年級上學(xué)期11月期中物理試題(無答案)
- 煤礦防治水細(xì)則解讀
評論
0/150
提交評論