BP神經網絡實現圖像壓縮_第1頁
BP神經網絡實現圖像壓縮_第2頁
BP神經網絡實現圖像壓縮_第3頁
BP神經網絡實現圖像壓縮_第4頁
BP神經網絡實現圖像壓縮_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

機器學習(ML第11組)

圖像壓縮(BP神經網絡)神經網絡應用手寫數字識別(概率神經網絡)求解最優(yōu)策略(利用基于值迭代的MDP算法求解最優(yōu)策略)馬爾科夫決策過程應用BP神經網絡實現圖像壓縮唐璇E13201073羅威亞E13201055Contents問題背景1BP神經網絡建模2BP神經網絡壓縮的實現3結果與分析4問題背景常見的文件壓縮軟件如WinZip、WinRAR等采用的是無損壓縮,能夠完全恢復原文件內容。多媒體信息具有信息量大、冗余信息多的特點,往往采用有損壓縮技術。JPEG壓縮(變換編碼與熵編碼)基于小波變換的圖像壓縮算法分形壓縮編碼矢量量化壓縮編碼圖像壓縮算法問題背景BP神經網絡是一種多層前向神經網絡,是整個人工神經網絡體系中的精華,廣泛應用于分類識別、逼近、回歸和壓縮。實際應用中80%的神經網絡模型采取了BP網絡或者BP的變化形式。BP神經網絡實現圖像壓縮,依賴BP網絡的非線性映射能力進行數據壓縮。實驗結果表明,采用BP神經網絡對灰度圖像進行壓縮,在保證較好峰值信噪比(PSNR)的情況下,達到了較高的壓縮比。BP神經網絡建模(模型的壓縮原理)BP神經網絡用于壓縮的網絡模型構建:采用一個隱含層,則整體構成一個三層的網絡。把一組輸入模式通過少量的隱含層單元映射到一組輸出模式,并使輸出模式盡可能等于輸入模式。(隱含層神經元的值和相應的權值向量可以輸出一個與原輸入模式相同的向量)輸入層隱含層輸出層

解碼

編碼補充:理論已經證明,單個隱含層的網絡可以通過適當增加神經元節(jié)點的個數實現任意非線性映射。所以,單個隱含層可滿足大部分應用需要。壓縮原理:當隱含層神經元的個數較少時,就意味著隱含層能用更少的數來表現輸入模式,而這,實際上就是壓縮。BP神經網絡建模(壓縮解壓過程)假設網絡的輸入層和輸出層均有M個神經元組成,隱含層包含I個神經元,且I<M,則輸入模式必須進行壓縮編碼,結果保存在隱含層。輸入層到隱含層的變換相當于壓縮的編碼過程;隱含層到輸出層的變換相當于壓縮的解碼過程。編碼編碼結果解碼輸入層,M個神經元隱含層,I個神經元,I<M輸出層,M個神經元輸入數據重建數據BP神經網絡建模(圖像壓縮編碼)輸入圖像數據:假設圖像為像素N×N大小,以K×K為單位進行劃分,將圖像細分為一個個圖像塊。圖像塊中每一個像素點與一個輸入或輸出神經元相對應,如下模型。樣本學習:網絡隨機地抽取圖像中各K×K圖像塊作為學習模式,使用反向傳播算法進行學習,通過調整網絡中神經元之間的連接權值,使訓練集圖像的重建誤差E=f-g的均值達到最小。訓練好的網絡隱含層神經元矢量便是數據壓縮的結果,而輸出層神經元矢量便是重建后的數據。原始圖像重建圖像K×KK×KBP神經網絡建模BP網絡的計算模型{wij,bj}x2x3xM

y1y2y3yM{wji,bi}hjx1編碼過程解碼過程隱含層第j個神經元輸出值:輸出層第i個神經元輸出值:BP神經網絡壓縮的實現圖像塊劃分歸一化BP網絡訓練保存結果將圖像的二維矩陣分成K×K的一個個塊,輸出K^2×N矩陣(樣矩陣)除以255,得數據位于0~1之間。(這樣能提高壓縮率,灰度圖像的灰度值0~255)采用神經網絡工具箱函數feedforward創(chuàng)建前向BP網絡采用LM訓練法(收斂快)net的權值net的閾值每個圖像塊對應的隱含層單元的輸出壓縮步驟:256×25616×4096BP神經網絡壓縮的實現load圖像塊重建(BP網絡解碼)反歸一化圖像塊恢復載入壓縮文件的數據預處理fori=1:4096Y(:,i)=com.lw*(com.d(:,i))+com.b;end乘上25516×4096矩陣的每一列抽取出來,重新排列4×4矩陣,并對4×4矩陣按行排列以恢復圖像。PSNRRATE解壓縮步驟:結果BP神經網絡的訓練(N=4):程序設計:兩個函數block_divide函數,用于圖像塊劃分,形成K^2*N矩陣re_divide函數,用于圖像塊恢復腳本文件bp_imageCompress.m腳本負責壓縮lena.bmp圖像(需要調用block_divide圖像劃分函數),壓縮結果保存于comp.mat中bp_imageRecon.m腳本負責解壓comp.mat(需要調用re_divide圖像塊恢復函數)train訓練函數確定了輸入輸出層向量的維數結果原始圖像lena.bmp:重建圖像:塊與塊之間差異較大,即出現塊效應現象。PSNR:32.4148rate:0.1465分析現象:正如剛剛所看到的,塊與塊之間差異較大,即出現塊效應現象。這是由于設計的算法將圖像強行分割為4×4的塊,并分別進行訓練,所以出現塊效應現象。壓縮比率:由于后續(xù)沒有進行熵編碼等原因,算法的壓縮比率(14%)并不高。圖像質量:峰值信噪比(PSNR)為32.4148,其實修改算法的參數(如改變隱含層神經元個數)可以調節(jié)圖像壓縮的質量。TablePSNRrateN=130.87960.0507N=231.81810.0897N=432.41180.1465N=631.99620.2030N=831.10150.2512N=1030.74710.3158N=1228.20560.3219N=1431.90630.4148壓縮比提高,但圖像質量降低重建效果對比(部分)N=1:N=2:N=4:N=10:壓縮率最高重建質量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論