版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第4章 圖像信息處理技術(shù) 4.1 圖像信號概述 4.2 圖像信號數(shù)字化 4.3 數(shù)字圖像壓縮方法的分類 4.4 典型的熵編碼方法 4.5 預(yù)測編碼 4.6 變換編碼 *4.7 新型圖像編碼技術(shù) 4.8 靜態(tài)圖像壓縮編碼標(biāo)準(zhǔn) 4.9 動態(tài)圖像壓縮編碼標(biāo)準(zhǔn)練習(xí)與思考題 4.1 圖像信號概述 圖像是一種可視化的信息, 圖像信號是圖像信息的理論描述方法, 圖像信號按其內(nèi)容變化與時間的關(guān)系來分, 主要包括靜態(tài)圖像和動態(tài)圖像兩種。 靜態(tài)圖像其信息密度隨空間分布, 且相對時間為常量; 動態(tài)圖像也稱時變圖像, 其空間密度特性是隨時間而變化的。 人們經(jīng)常用靜態(tài)圖像的一個時間序列來表示一個動態(tài)圖像。 圖像分類還可
2、以按其他方式進行: 如按其亮度等級的不同可分為二值圖像和灰度圖像; 按其色調(diào)的不同可分為黑白圖像和彩色圖像; 按其所占空間的維數(shù)不同可分為平面的二維圖像和立體的三維圖像等等。 圖像信號的記錄、 存儲和傳輸可以采用模擬方式或數(shù)字方式。 傳統(tǒng)的方式為模擬方式, 例如, 目前我們在電視上所見到的圖像就是以一種模擬電信號的形式來記錄, 并依靠模擬調(diào)幅的手段在空間傳播的。 將模擬圖像信號經(jīng)A/D變換后就得到數(shù)字圖像信號, 數(shù)字圖像信號便于進行各種處理, 例如最常見的壓縮編碼處理就是在此基礎(chǔ)上完成的。 本書介紹的圖像信息處理技術(shù)就是針對數(shù)字圖像信號的。 1 彩色圖像信號的分量表示 對于黑白圖像信號, 每個
3、像素點用灰度級來表示, 若用數(shù)字表示一個像素點的灰度, 有8比特就夠了, 因為人眼對灰度的最大分辨力為26。 對于彩色視頻信號(例如常見的彩色電視信號)均基于三基色原理, 每個像素點由紅(R)、 綠(G)、 藍(B)三基色混合而成。 若三個基色均用8比特來表示, 則每個像素點就需要24比特, 由于構(gòu)成一幅彩色圖像需要大量的像素點, 因此, 圖像信號采樣、 量化后的數(shù)據(jù)量就相當(dāng)大, 不便于傳輸和存儲。 為了解決此問題, 人們找到了相應(yīng)的解決方法: 利用人的視覺特性降低彩色圖像的數(shù)據(jù)量, 這種方法往往把RGB空間表示的彩色圖像變換到其他彩色空間, 每一種彩色空間都產(chǎn)生一種亮度分量和兩種色度分量信號
4、。 常用的彩色空間表示法有YUV、 YIQ和YCbCr等。 (1) YUV彩色空間。 通常我們用彩色攝像機來獲取圖像信息, 攝像機把彩色圖像信號經(jīng)過分色棱鏡分成R0、 G0、 B0三個分量信號, 分別經(jīng)過放大和r校正得到RGB, 再經(jīng)過矩陣變換電路得到亮度信號Y和色差信號U、 V, 其中亮度信號表示了單位面積上反射光線的強度, 而色差信號(所謂色差信號, 就是指基色信號中的三個分量信號R、 G、 B與亮度信號之差)決定了彩色圖像信號的色調(diào)。 最后發(fā)送端將Y、 U、 V三個信號進行編碼, 用同一信道發(fā)送出去, 這就是在PAL彩色電視制式中使用的YUV彩色空間。 YUV與RGB彩色空間變換的對應(yīng)關(guān)
5、系如式(4.1-1)所示。 YUV彩色空間的一個優(yōu)點是, 它的亮度信號Y和色差信號U、 V是相互獨立的, 即Y信號分量構(gòu)成的黑白灰度圖與用U、 V兩個色彩分量信號構(gòu)成的兩幅單色圖是相互獨立的。 因為YUV是獨立的, 所以可以對這些單色圖分別進行編碼。 此外, 利用YUV之間的獨立性解決了彩色電視機與黑白電視機的兼容問題。 (4.1-1) YUV表示法的另一個優(yōu)點是, 可以利用人眼的視覺特性來降低數(shù)字彩色圖像的數(shù)據(jù)量。 人眼對彩色圖像細節(jié)的分辨能力比對黑白圖像細節(jié)的分辨能力低得多, 因此就可以降低彩色分量的分辨率而不會明顯影響圖像質(zhì)量, 即可以把幾個相同像素不同的色彩值當(dāng)做相同的色彩值來處理(即
6、大面積著色原理), 從而減少了所需的數(shù)據(jù)量。 在PAL彩色電視制式中, 亮度信號的帶寬為4.43 MHz, 用以保證足夠的清晰度, 而把色差信號的帶寬壓縮為1.3 MHz, 達到了減少帶寬的目的。 在數(shù)字圖像處理的實際操作中, 就是對亮度信號Y和色差信號U、 V分別采用不同的采樣頻率。 目前常用的Y、 U、 V采樣頻率的比例有422和411, 當(dāng)然, 根據(jù)要求的不同, 還可以采用其他比例。 例如要存儲RGB888的彩色圖像, 即R、 G、 B分量都用8比特表示, 圖像的大小為640480像素, 那么所需要的存儲容量為64048038/8921 600字節(jié); 如果用YUV411來表示同一幅彩色圖
7、像, 對于亮度信號Y, 每個像素仍用8比特表示, 而對于色差信號U、 V, 每4個像素用8比特表示, 則存儲量變?yōu)?40480(8+4)/8460 800字節(jié)。 盡管數(shù)據(jù)量減少了一半, 但人眼察覺不出有明顯變化。 (2) YIQ彩色空間。 在NTSC彩色電視制式中選用YIQ彩色空間, 其中Y表示亮度, I、 Q是兩個彩色分量。 I、 Q與U、 V是不相同的。 人眼的彩色視覺特性表明, 人眼對紅、 黃之間顏色變化的分辨能力最強; 而對藍、 紫之間顏色變化的分辨能力最弱。 在YIQ彩色空間中, 色彩信號I表示人眼最敏感的色軸, Q表示人眼最不敏感的色軸。 在NTSC制式中, 傳送人眼分辨能力較強的
8、I信號時, 用較寬的頻帶(1.31.5 MHz); 而傳送人眼分辨能力較弱的Q信號時, 用較窄的頻帶(0.5 MHz)。 YIQ與RGB彩色空間變換的對應(yīng)關(guān)系如式(4.1-2)所示。 (4.1-2) (3) YCbCr彩色空間。 YCbCr彩色空間是由ITU-R(國際電聯(lián)無線標(biāo)準(zhǔn)部, 原國際無線電咨詢委員會CCIR)制定的彩色空間。 按照CCIR601-2標(biāo)準(zhǔn), 將非線性的RGB信號編碼成YCbCr, 編碼過程開始是先采用符合SMPTE-CRGB(它定義了三種熒光粉, 即一種參考白光, 應(yīng)用于演播室監(jiān)視器及電視接收機標(biāo)準(zhǔn)的RGB)的基色作為r校正信號。 非線性RGB信號很容易與一個常量矩陣相乘
9、而得到亮度信號Y和兩個色差信號Cb、 Cr。 YCbCr通常在圖像壓縮時作為彩色空間, 而在通信中是一種非正式標(biāo)準(zhǔn)。 YCbCr與RGB彩色空間變換的對應(yīng)關(guān)系如式(4.1-3)所示, 可以看到: 數(shù)字域中的彩色空間變換與模擬域中的彩色空間變換是不同的。 (4.1-3) 2 彩色圖像信號的分量編碼 通過圖像信號的表示方法的討論可以看到: 對于彩色圖像信號數(shù)字壓縮編碼, 可以采用兩種不同的編解碼方案。 一種是復(fù)合編碼, 它直接對復(fù)合圖像信號進行采樣、 編碼和傳輸; 另一種是分量編碼, 它首先把復(fù)合圖像中的亮度和色度信號分離出來, 然后分別進行取樣、 編碼和傳輸。 目前分量編碼已經(jīng)成為圖像信號壓縮的
10、主流, 在20世紀(jì)90年代以來頒布的一系列圖像壓縮國際標(biāo)準(zhǔn)中均采用分量編碼方案。 以YUV彩色空間為例, 分量編碼系統(tǒng)的基本框圖如圖4.1-1所示, 其中對亮度信號Y使用較高的采樣頻率, 對色差信號U、 V則使用較低的采樣頻率。 圖4.1-1 彩色圖像信號分量編碼系統(tǒng)的基本框圖 4.2 圖像信號數(shù)字化 圖像信號數(shù)字化與音頻數(shù)字化一樣主要包括兩方面的內(nèi)容: 取樣和量化。 圖像在空間上的離散化稱為取樣, 即使空間上連續(xù)變化的圖像離散化, 也就是用空間上部分點的灰度值來表示圖像, 這些點稱為樣點(或像素, 像元, 樣本)。 一幅圖像應(yīng)取多少樣點呢?其約束條件是: 由這些樣點采用某種方法能夠正確重建原
11、圖像。 取樣的方法有兩類: 一類是直接對表示圖像的二維函數(shù)值進行取樣, 即讀取各離散點上的信號值, 所得結(jié)果就是一個樣點值陣列, 所以也稱為點陣取樣; 另一類是先將圖像函數(shù)進行正交變換, 用其變換系數(shù)作為取樣值, 故稱為正交系數(shù)取樣。 對樣點灰度級值的離散化過程稱為量化, 也就是對每個樣點值數(shù)字化, 使其和有限個可能電平數(shù)中的一個對應(yīng), 即使圖像的灰度級值離散化。 量化也可分為兩種: 一種是將樣點灰度級值等間隔分檔取整, 稱為均勻量化; 另一種是將樣點灰度級值不等間隔分檔取整, 稱為非均勻量化。 4.2.1 取樣點數(shù)和量化級數(shù)的選取 假定一幅圖像取MN個樣點, 對樣點值進行Q級分檔取整。 那么
12、對M, N和Q如何取值呢? 首先, M, N, Q一般總是取2的整數(shù)次冪, 如Q = 2b , b為正整數(shù), 通常稱為對圖像進行b比特量化, M、 N可以相等, 也可以不相等。 若取相等, 則圖像距陣為方陣, 分析運算方便一些。 其次, 關(guān)于M、 N和b(或Q)數(shù)值大小的確定。 對b來講, 取值越大, 重建圖像失真越小。 若要完全不失真地重建原圖像, 則b必須取無窮大, 否則一定存在失真, 即所謂的量化誤差。 一般供人眼觀察的圖像, 由于人眼對灰度分辨能力有限, 用58比特量化即可。 對MN的取值主要依據(jù)取樣的約束條件。 也就是在MN大到滿足取樣定理的情況下, 重建圖像就不會產(chǎn)生失真, 否則就
13、會因取樣點數(shù)不夠而產(chǎn)生所謂混淆失真。 為了減少表示圖像的比特數(shù), 應(yīng)取MN點數(shù)剛好滿足取樣定理。 這種狀態(tài)的取樣即為奈奎斯特取樣。 MN常用的尺寸有512512, 256256, 6464, 3232等。 再次, 在實際應(yīng)用中, 如果允許表示圖像的總比特數(shù)MNb給定, 對MN和b的分配往往是根據(jù)圖像的內(nèi)容和應(yīng)用要求以及系統(tǒng)本身的技術(shù)指標(biāo)來選定的。 例如, 若圖像中有大面積灰度變化緩慢的平滑區(qū)域如人圖像的特寫照片等, 則MN取樣點可以少些, 而量化比特數(shù)b多些, 這樣可使重建圖像灰度層次多些。 若b太少, 在圖像平滑區(qū)往往會出現(xiàn)“假輪廓”。 反之, 對于復(fù)雜景物圖像, 如群眾場面的照片等, 量化
14、比特數(shù)b可以少些, 而取樣點數(shù)MN要多些, 這樣就不會丟失圖像的細節(jié)。 究竟MN和b如何組合才能獲得滿意的結(jié)果很難講出一個統(tǒng)一的方案, 但是有一點是可以肯定的: 不同的取樣點數(shù)和量化比特數(shù)組合可以獲得相同的主觀質(zhì)量評價。 *4.2.2 點陣取樣 在分析取樣和重建圖像時, 往往認為取樣系統(tǒng)的輸入圖像是一個確定的圖像場, 即為確知函數(shù), 如一幅照片或膠片。 但是在某些情況下, 如電視圖像由于噪聲影響和取樣方式變化, 把這種取樣看成是二維隨機過程的取樣更為有益, 當(dāng)然實際取樣還有一些問題要注意。 1. 確定圖像場的點陣取樣原理 對理想取樣而言, 其取樣函數(shù)為空間抽樣函數(shù) S(x,y), 離散形式可表
15、示為(4.2-1) 函數(shù)的取樣陣列如圖4.2-1所示。 圖4.2-1 函數(shù)的取樣陣列 令fI(x,y)代表一理想的無限大連續(xù)圖像場, 其點陣取樣方法就是用空間抽樣函數(shù)S(x,y)和連續(xù)圖像函數(shù)fI(x,y)相乘。 設(shè)fS(x,y)表示取樣后的圖像, 理想取樣數(shù)學(xué)模型如圖4.2-2所示。 圖4.2-2 理想取樣數(shù)學(xué)模型 由此可以得到 (4.2-2) 式中, 連續(xù)函數(shù)fI(x,y)移入求和式內(nèi)變?yōu)殡x散形式fI(ix, jy), 表明只是在取樣點(ix, jy)上計值。 根據(jù)二維傅立葉變換卷積定理, 可以得到頻域關(guān)系式為 (4.2-3) 式中 假定理想圖像的頻譜是有限的, 截止頻率為uc和vc, 根
16、據(jù)函數(shù)的篩選性質(zhì)對式(4.2-3)進一步運算可以得式(4.2-4)和如圖4.2-3所示的取樣圖像頻譜示意圖。 (4.2-4) 圖4.2-3 取樣圖像頻譜示意圖 由式(4.2-4)和圖4.2-3可以看出, 取樣圖像頻譜是原圖像頻譜在頻域中的無窮多個重復(fù)。 重復(fù)頻譜之間間隔u和v取決于取樣間隔x和y的大小, 只要選取合適的x、 y, 就能保證u、 v等于或大于原圖像截止頻率2uc、 2vc, 那么各個重復(fù)頻譜之間就不會重疊。 在這種情況下, 選用合適的二維重建濾波器, 就可以取出一個完整的原圖像頻譜(即除所有i, j0的頻譜成分), 再由二維傅立葉反變換獲得和原圖像一樣的重建圖像 。 取樣正確與否
17、的原則是能否由取樣圖像不失真地重建原圖像, 而正確取樣的關(guān)鍵是取樣間隔x、 y的選擇, 因此保證正確取樣的條件是因為 (4.2-5)所以 則 (4.2-6) 滿足式(4.2-5)和式(4.2-6)中“等于”條件的取樣稱為奈奎斯特取樣。 滿足兩式中小于條件的取樣稱為過取樣, 而不滿足上述兩條件的取樣稱為欠取樣。 在欠取樣情況下, 會產(chǎn)生混淆失真。 混淆失真是取樣中應(yīng)注意的一個重要問題。 防止出現(xiàn)混淆失真的辦法, 從理論上講, 若已知原圖像頻譜的最高頻率成分, 則使用過取樣或奈奎斯特取樣, 而不要使用欠取樣; 但若不知道原圖像頻譜的最高頻率成分, 則應(yīng)先采用已知截止頻率的低通濾波器預(yù)先過濾圖像,
18、限制其高頻率成分, 再針對低通濾波器截止頻率進行過取樣或奈奎斯特取樣。 在實際取樣系統(tǒng)中, 取樣脈沖寬帶效應(yīng)相當(dāng)于一個低通濾波器, 另外光學(xué)系統(tǒng)的透鏡散焦, 孔闌衍射也都可以等效為低通濾波器的作用, 盡管會引起圖像模糊降質(zhì), 但對防止混淆失真卻是有好處的。 2. 隨機圖像場取樣 實際圖像往往有噪聲, 這種附加有噪聲的確定圖像場可以認為是隨機圖像場, 因此這里簡單介紹一下隨機圖像場的取樣。 式中, x=x1-x2; y=y1-y2。 用狄拉克取樣函數(shù)S(x,y)對這個隨機過程進行取樣所獲得的取樣場為(4.2-8) 因而取樣場的自相關(guān)函數(shù)為 (4.2-9) 根據(jù)狄拉克函數(shù)性質(zhì): 兩個狄拉克函數(shù)相乘
19、還是一個狄拉克函數(shù), 即 S(x1,y1)S(x2,y2)=S(x1-x2,y1-y2)=S(x,y) (4.2-10)將式(4.2-7)和式(4.2-10)代入式(4.2-9)即可得對上式兩邊取二維傅立葉變換, 根據(jù)傅氏變換定理得(4.2-11) (4.2-12) 圖4.2-4 有噪聲圖像的取樣(一維示意圖) 4.2.3 圖像信號量化 經(jīng)過取樣的圖像只是在空間上被離散為像素(樣本)的陣列, 而每一個樣本灰度值還是一個有無窮多個取值的連續(xù)變化量, 必須將其轉(zhuǎn)化為有限個離散值, 賦予不同碼字才能真正成為數(shù)字圖像, 再由計算機或其他數(shù)字設(shè)備進行處理運算, 這樣的轉(zhuǎn)化過程稱為量化。 將樣本連續(xù)灰度等
20、間隔分層量化方式稱為均勻量化, 不等間隔分層量化方式稱為非均勻量化。 量化既然以有限個離散值來近似表示無限多個連續(xù)量, 就一定會產(chǎn)生誤差, 這就是所謂的量化誤差。 由此產(chǎn)生的失真叫量化失真或量化噪聲, 對均勻量化來講, 量化分層越多, 量化誤差越小, 但編碼時占用比特數(shù)就越多。 在一定比特數(shù)下, 為了減少量化誤差, 往往要用非均勻量化, 如按圖像灰度值出現(xiàn)的概率大小不同進行非均勻量化, 即對灰度值經(jīng)常出現(xiàn)的區(qū)域進行細量化, 反之進行粗量化。 在實際圖像系統(tǒng)中, 由于存在著成像系統(tǒng)引入的噪聲及圖像本身的噪聲, 因此量化等級取得太多(量化間隔太?。┦菦]有必要的, 因為如果噪聲幅度值大于量化間隔,
21、量化器輸出的量化值就會產(chǎn)生錯誤, 得到不正確的量化。 在應(yīng)用屏幕顯示其輸出圖像時, 灰度鄰近區(qū)域邊界會出現(xiàn)“忙動”現(xiàn)象。 假設(shè)噪聲是高斯分布, 均值為0, 方差為2, 在有噪聲情況下, 最佳量化層選取有兩種方法, 一是令正確量化的概率大于某一個值, 二是使量化誤差的方差等于噪聲方差。 針對輸出圖像是專供人觀察評價的應(yīng)用, 研究出了一些按人的視覺特性進行非均勻量化方式, 如圖像灰度變化緩慢部分細量化, 而圖像灰度變化快的細節(jié)部分粗量化, 這是由于視覺掩蓋效應(yīng)被發(fā)現(xiàn)而產(chǎn)生的。 再如按人的視覺靈敏度特征進行對數(shù)形式量化分層等。 4.3 數(shù)字圖像壓縮方法的分類 圖像壓縮的基本目標(biāo)就是減小數(shù)據(jù)量, 但最
22、好不要引起圖像質(zhì)量的明顯下降, 在大多數(shù)實際應(yīng)用中, 為了取得較低的比特率, 輕微的質(zhì)量下降是允許的。 至于圖像壓縮到什么程度而沒有明顯的失真, 則取決于圖像數(shù)據(jù)的冗余度。 較高的冗余度形成較大的壓縮, 而典型的圖像信號都具有很高的冗余度, 正是這些冗余度的存在允許我們對圖像進行壓縮。 例如, 我們在第2章介紹的空間冗余和時間冗余是圖像信號最常見的冗余, 所有的這些冗余度都可以被除去而不會引起顯著的信息損失, 但壓縮編碼無法減少冗余度。 不同的出發(fā)點有不同的分類, 按照信息論的角度, 數(shù)字圖像壓縮方法一般可分為: (1) 可逆編碼(Reversible Coding 或Information
23、Preserving Coding), 也稱為無損壓縮。 這種方法的解碼圖像與原始圖像嚴(yán)格相同, 壓縮是完全可恢復(fù)的或無偏差的, 無損壓縮不能提供較高的壓縮比。 (2) 不可逆編碼(Non-Reversible Coding), 也稱為有損壓縮。 用這種方法恢復(fù)的圖像較原始圖像存在一定的誤差, 但視覺效果一般是可接受的, 它可提供較高的壓縮比。 按照壓縮方法的原理, 數(shù)字圖像壓縮方法可分為: (1) 預(yù)測編碼(Predictive Coding)。 預(yù)測編碼是一種針對統(tǒng)計冗余進行壓縮的方法, 它主要是減少數(shù)據(jù)在空間和時間上的相關(guān)性, 達到對數(shù)據(jù)的壓縮, 是一種有失真的壓縮方法。 預(yù)測編碼中典型
24、的壓縮方法有DPCM和ADPCM等, 它們比較適合于圖像數(shù)據(jù)的壓縮。 (2) 變換編碼(Transform Coding)。 變換編碼也是一種針對統(tǒng)計冗余進行壓縮的方法。 這種方法將圖像光強矩陣(時域信號)變換到系數(shù)空間(頻域)上進行處理。 常用的正交變換有DFT(離散傅氏變換)、 DCT(離散余弦變換)、 DST(離散正弦變換)、 哈達碼變換和Karhunen-Loeve變換。 (3) 量化和矢量量化編碼(Vector Quantization)。 量化和矢量量化編碼本質(zhì)上也還是一種針對統(tǒng)計冗余進行壓縮的方法。 當(dāng)我們對模擬量進行數(shù)字化時, 必然要經(jīng)歷一個量化的過程。 在這里量化器的設(shè)計是一
25、個很關(guān)鍵的步驟, 量化器設(shè)計的好壞對于量化誤差的大小有直接的影響。 矢量量化是相對于標(biāo)量量化而提出的, 如果我們一次量化多個點, 則稱為矢量量化。 (4) 信息熵編碼(Entropy Coding)。 根據(jù)信息熵原理, 用短的碼字表示出現(xiàn)概率大的信息, 用長的碼字表示出現(xiàn)概率小的信息。 常見的方法有哈夫曼編碼、 游程編碼以及算術(shù)編碼。 (5) 子帶編碼(Sub-band Coding)。 子帶編碼將圖像數(shù)據(jù)變換到頻域后, 按頻率分帶, 然后用不同的量化器進行量化, 從而達到最優(yōu)的組合。 或者是分步漸近編碼, 在初始時對某一頻帶的信號進行解碼, 然后逐漸擴展到所有頻帶, 隨著解碼數(shù)據(jù)的增加, 解
26、碼圖像也逐漸地清晰起來。 此方法對于遠程圖像模糊查詢與檢索的應(yīng)用比較有效。 (6) 結(jié)構(gòu)編碼(Structure Coding), 也稱為第二代編碼(Second Generation Coding)。 編碼時首先求出圖像中的邊界、 輪廓、 紋理等結(jié)構(gòu)特征參數(shù), 然后保存這些參數(shù)信息。 解碼時根據(jù)結(jié)構(gòu)和參數(shù)信息進行合成, 從而恢復(fù)出原圖像。 (7) 基于知識的編碼(Knowledge-Based Coding)。 對于人臉等可用規(guī)則描述圖像, 利用人們對其的知識形成一個規(guī)則庫, 據(jù)此將人臉的變化等特征用一些參數(shù)進行描述, 從而用參數(shù)加上模型就可以實現(xiàn)人臉的圖像編碼與解碼。圖像壓縮算法的總體框圖
27、如圖4.3-1所示。 圖4.3-1 圖像壓縮算法的總體框圖 下面幾節(jié)主要介紹幾種常見的壓縮編碼方法: 信息熵編碼方法(如哈夫曼編碼、 游程編碼和算術(shù)編碼)、 預(yù)測編碼和變換編碼, 并介紹新一代編碼方法(如知識基編碼和分形編碼)等以及相關(guān)知識。 由于矢量量化編碼和子帶編碼方法在上一章中結(jié)合音頻編碼已經(jīng)介紹, 它們在應(yīng)用于圖像時原理基本相同, 這里不再贅述。 4.4 典型的熵編碼方法 4.4.1 基本概念 1 圖像熵和平均碼字長度 1) 圖像熵(Entropy) 設(shè)數(shù)字圖像像素灰度級集合為 (W1, W2,Wk,,WM), 其對應(yīng)的概率分別為P1, P2, , Pk, , PM。 按信息論中信源信
28、息熵定義, 數(shù)字圖像的熵H為 由此可見, 一幅圖像的熵就是這幅圖像的平均信息量度, 也是表示圖像中各個灰度級比特數(shù)的統(tǒng)計平均值。 式(4.4-1)所表示的熵值是在假定圖像信源無記憶(即圖像的各個灰度級不相關(guān))的前提下獲得的, 這樣的熵值常稱為無記憶信源熵值, 記為H0()。 對于有記憶信源, 假如某一像素灰度級與前一像素灰度級相關(guān), 那么公式(4.4-1)中的概率要換成條件概率P(Wi/Wi-1)和聯(lián)合概率P(Wi, Wi-1), 則圖像信息熵公式變?yōu)椋?.4-1) 式中, P(Wi, Wi-1)=P(Wi)P(Wi/Wi-1), 則稱H(Wi/Wi-1)為條件熵。 因為只與前面一個符號相關(guān),
29、 故稱為一階熵H1()。 如果與前面兩個符號相關(guān), 求得的熵值就稱為二階熵H2()。 依此類推可以得到三階和四階等高階熵, 并且可以證明 H0()H1()H2()H3()(4.4-2) 香農(nóng)信息論已證明: 信源熵是進行無失真編碼的理論極限。 低于此極限的無失真編碼方法是不存在的, 這是熵編碼的理論基礎(chǔ)。 而且可以證明, 如果考慮像素間的相關(guān)性, 使用高階熵一定可以獲得更高的壓縮比。 2) 平均碼字長度 設(shè)k為數(shù)字圖像第k個碼字Ck的長度(二進制代數(shù)的位數(shù)), 其相應(yīng)出現(xiàn)的概率為Pk, 則該數(shù)字圖像所賦予的碼字平均長度R為(4.4-3) 3) 編碼效率在一般情況下, 編碼效率往往用下列簡單公式表
30、示(4.4-4) 式中, H為信源熵, R為平均碼字長度。 根據(jù)信息論中信源編碼理論, 可以證明在RH條件下總可以設(shè)計出某種無失真編碼方法。 若編碼結(jié)果使R遠大于H, 表明這種編碼方法效率很低, 占用比特數(shù)太多。 例如對圖像樣本量化值直接采用PCM編碼, 其結(jié)果平均碼字長度R就遠比圖像熵H大。 若編碼結(jié)果使R等于或很接近于H, 這種狀態(tài)的編碼方法稱為最佳編碼。 它既不丟失信息而引起圖像失真, 又占用最少的比特數(shù), 例如下面要介紹的哈夫曼編碼即屬于最佳編碼方法。 若要求編碼結(jié)果RH, 則必然丟失信息而引起圖像失真。 這就是在允許失真條件下的一些失真編碼方法。 熵編碼的目的就是要使編碼后的圖像平均
31、比特數(shù)R盡可能接近圖像熵H。 一般是根據(jù)圖像灰度級數(shù)出現(xiàn)的概率大小賦予不同長度的碼字, 概率大的灰度級用短碼字, 反之, 用長碼字。 可以證明, 這樣的編碼結(jié)果所獲得的平均碼字長度最短。 這就是下面要介紹的變長最佳編碼定理。 2. 變長最佳編碼定理 【定理】 在變長編碼中, 對出現(xiàn)概率大的信息符號賦予短碼字, 而對于出現(xiàn)概率小的信息符號賦予長碼字。 如果碼字長度嚴(yán)格按照所對應(yīng)符號出現(xiàn)概率大小逆序排列, 則編碼結(jié)果平均碼字長度一定小于任何其他排列方式。 這個定理就是下面要介紹的哈夫曼編碼方法的理論基礎(chǔ)。 設(shè)圖像灰度級為W1, W2, , Wi, WN; 各灰度級出現(xiàn)的概率分別為P1, P2, ,
32、 Pi, , PN; 編碼所賦予的碼字長度分別為t1, t2, , ti, , tN; 則編碼后圖像平均碼字長度R應(yīng)為 再令嚴(yán)格按照定理規(guī)則進行編碼, 其結(jié)果平均碼字長度為R1; R2為將其中任兩個灰度級不按定理規(guī)則編碼(即概率大的灰度級賦予長碼字。 反之, 用短碼字), 而其他所有灰度級仍按定理規(guī)則編碼所得的圖像平均碼字長度, 那么R2應(yīng)等于R1加上“不按定理規(guī)則編碼所增加的平均碼字長度”R。 只要證明R大于0, 即可以證明上述定理。 3. 可變長最佳編碼的平均碼字長度 設(shè)可變長編碼所用碼元進制為D, 被編碼的信息符號總數(shù)為N, 第i個符號出現(xiàn)的概率為Pi, 與其對應(yīng)的碼字長度為ti, 則可
33、以證明這種編碼結(jié)果平均碼字長度R落在下列區(qū)間內(nèi) 式中, , 由此可以引導(dǎo)出對某一信息符號存在下式(4.4-5) 對二進制碼進一步簡化為 -lbPiti-lbPi+1 (4.4-6) 4. 惟一可譯編碼 有些情況下, 為了減少表示圖像的平均碼字長度, 往往對碼字之間不加同步碼。 但是, 這樣就要求所編碼字序列能被惟一地譯出來。 滿足這個條件的編碼稱為惟一可譯編碼, 也常稱為單義可譯碼。 單義可譯碼往往是采用非續(xù)長代碼。 1) 續(xù)長代碼和非續(xù)長代碼 若代碼中任何一個碼字都不是另一個碼字的續(xù)長, 也就是不能在某一碼字后面添加一些碼元而構(gòu)成另一個碼字, 稱其為非續(xù)長代碼。 反之, 稱其為續(xù)長代碼。 如
34、二進制代碼0, 10, 11即為非續(xù)長代碼, 而0, 01, 11則為續(xù)長代碼。 因為碼字01可由碼字“0”后加上一個碼元“1”構(gòu)成。 2) 單義代碼 在介紹單義代碼前, 先簡單介紹一下克勞夫特(Kraft)不等式: 若信源符號有m種取值, 其碼字長度分別為li(i=1, 2, , m); 又設(shè)最長的碼字長度為L, 碼元種類(即多少進制碼)為D, 長度為li的碼字占用了 個長度為L的碼字, 也就是必須有 對于二進制, 則有 。 任意有限長的碼字序列, 只能被惟一地分割成一個個碼字, 則這樣的碼字序列稱為單義代碼。 單義代碼的充要條件是滿足克勞夫特(Kraft)不等式(4.4-7) 式中, D為
35、代碼中碼元種類, 對于二進制D2; n為代碼中碼字個數(shù); ti為代碼中第i個碼字的長度(即碼元個數(shù))。 如代碼C00, 10, 001, 101, 因為是二進制碼, 則D2, 共有4個碼字C100、 C210、 C3001、 C4101, 其相應(yīng)的長度為t1=2、 t2=2、 t3=3、 t4=3, 代入式(4.4-7)可得 4.4.2 哈夫曼(Huffman)編碼方法 哈夫曼編碼是根據(jù)可變長度最佳編碼定理, 應(yīng)用哈夫曼算法而產(chǎn)生的一種編碼方法。 在具有相同輸入概率集合的前提下, 它的平均碼字長度比其他任何一種惟一可譯碼都小, 因此, 也常稱其為緊湊碼。 下面以一個具體的例子來說明其編碼方法,
36、 如圖4.4-1所示。圖4.4-1 哈夫曼(Huffman)編碼的示例 1. 編碼步驟 (1) 先將輸入灰度級按出現(xiàn)的概率由大到小順序排列(對概率相同的灰度級可以任意顛倒排列位置)。 (2) 將最小兩個概率相加, 形成一個新的概率集合。 再按第(1)步方法重排(此時概率集合中概率個數(shù)已減少一個)。 如此重復(fù)進行, 直到只有兩個概率為止。 (3) 分配碼字。 碼字分配從最后一步開始反向進行, 對最后兩個概率一個賦予“1”碼, 一個賦予“0”碼。 如概率0.60賦予“0”碼, 0.40賦予“1”碼(也可以將0.60賦予“1”碼, 0.40賦予“0”碼)。 如此反向進行到開始的概率排列。 在此過程中
37、, 若概率不變, 則仍用原碼字。 如圖4.4-1中第六步中概率0.40到第五步中仍用“1”碼。 若概率分裂為兩個, 其碼字前幾位碼元仍用原來的。 碼字的最后一位碼元一個賦予“0”碼元, 另一個賦予“1”碼元。 如圖中第六步中概率0.60到第五步中分裂為0.37和0.23, 則所得碼字分別為“00”和“01”。 2. 前例哈夫曼編碼的編碼效率計算 根據(jù)式(4.4-1)求出前例信源熵為根據(jù)式(4.4-3)求出平均碼字長度為根據(jù)式(4.4-4)求出編碼效率為 可見哈夫曼編碼效率很高。 *4.4.3 游程編碼 在圖像中, 尤其是一些不太復(fù)雜的圖像和計算機生成的圖像中, 往往存在著灰度或顏色相同的圖像塊
38、, 對這樣的圖像進行掃描時, 對應(yīng)這些相同灰度和顏色的圖像塊就會有連續(xù)多行掃描行數(shù)據(jù)具有相同的數(shù)值, 而且在同一行上會有許多連續(xù)的像素點具有同樣的數(shù)值。 只保留連續(xù)相同像素值中的一個值及具有相同數(shù)值的像素點數(shù)目, 這種方法就是人們常說的行程編碼或游程編碼(RLC, Run Length Coding), 而且這種方法可以用少的數(shù)據(jù)量來表示圖像信息。 在二元序列中, 只有兩種符號, 即“0”和“1”; 這些符號可連續(xù)出現(xiàn), 連“0”這一段稱為“0”游程, 連“1”這一段稱為“1”游程。 它們的長度分別為L(0)和L(1)。 “0”游程和“1”游程總是交替出現(xiàn)的。 倘若規(guī)定二元序列是以“0”開始,
39、 第一個游程是“0”游程, 第二個必為“1”游程, 第三個又是“0”游程等等。 對于隨機的二元序列, 各游程長度將是隨機變量; 其取值可為1, 2, 3, , 直到無限。 定義了游程和游程長度, 就可把任何二元序列變換成游程長度的序列, 或簡稱游程序列。 這種變換是一一對應(yīng)的, 也就是可逆的。 例如有一二元序列 000101110010001 可變換成下列游程序列 3113213 *4.4.4 算術(shù)編碼 哈夫曼編碼、 游程編碼等無損編碼都是建立在符號和碼字相對應(yīng)的基礎(chǔ)上的, 這種編碼通常叫做塊碼或分組碼。 此時, 信源符號應(yīng)是多元的, 而且不考慮符號相關(guān)性。 要用于最常見的二元序列, 須采用游
40、程編碼、 分幀編碼或合并符號等方法, 轉(zhuǎn)換成多值符號, 而這些符號間的相關(guān)性也不予考慮。 這就使信源編碼的匹配原則不能充分滿足, 編碼效率就有所損失。 倘若要較好的解除相關(guān)性, 常需在序列中取很長一段, 而這將遇到采用等長碼時的那種困難。 為了克服這種局限性, 就需跳出塊碼的范疇, 研究非塊碼的編碼方法。 這就是從全序列出發(fā), 采用遞推形式的連續(xù)編碼。 其實香農(nóng)早就提出信源序列的積累概率的概念, 把這個概率映射到0,1)區(qū)間上, 使每個序列對應(yīng)區(qū)間內(nèi)的一點, 這就是一個二進位的小數(shù)。 這些點把0,1)區(qū)間分成許多小段, 每段的長度等于某一序列的概率。 再在段內(nèi)取一個二進位小數(shù), 其長度可與該序
41、列的概率匹配, 達到高效編碼的目的。 這也就是算術(shù)編碼的基本概念。 在這里將著重討論積累概率的意義以及遞推計算等, 以說明算術(shù)編碼的基本原理。 再通過實例介紹獨立二元序列的編碼過程。 1. 積累概率的遞推計算 我們先從信源符號的積累概率開始, 再討論序列的積累概率。 設(shè)信源符號集為 A=a0, a1, a2, , am-1 相應(yīng)的概率為Pr, r=0, 1, 2, , m-1。 定義各符號的積累概率為(4.4-8) 顯然, 由上式可得 P0=0, P1=p0, P2=p0+p1, 而且 pr=Pr+1-Pr 由于Pr和Pr+1都是小于1的正數(shù), 可用0,1)區(qū)間內(nèi)的兩個點來表示, 則pr就是這
42、兩點間的小區(qū)間的長度。 不同的符號有不同的小區(qū)間, 它們互不重疊, 這種小區(qū)間內(nèi)任一個點可作為該符號的代碼。 現(xiàn)在來計算序列的積累概率。 為了簡單起見, 先以獨立二元序列為例來計算, 所得的結(jié)果很容易推廣到一般情況。 設(shè)有一序列S=011, 這種三個二元符號的序列可按自然二進數(shù)排列, 000, 001, 010, , 則S的積累概率為 P(S)=p(000)+p(001)+p(010) (4.4-9) 倘若S后面接一個“0”, 積累概率就成為P(S0)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)=p(000)+p(001)+p(010)=P(
43、S) 因為兩個四元符號的最后一位是“0”和“1”時, 根據(jù)歸一律, 它們的概率和應(yīng)等于前三位的概率, 即p(0000)+p(0001)=p(000)等。 倘若S后面接一個“1”, 則其積累概率是 P(S1)=p(0000)+p(0001)+p(0010)+p(0011) +p(0100)+p(0101)+p(0110) =P(S)+p(0110)=P(S)+p(S)p0 由于二元集的積累概率為P0=0, P1=p0, 所以上面兩式可統(tǒng)一寫成 P(Sr)=P(S)+p(S)Pr r=0, 1 (4.4-10) 這樣寫的式子很容易推廣到多元序列, 即可得到一般的積累概率遞推公式 P(Sar)=P(
44、S)+p(S)Pr (4.4-11) 以及序列的概率公式 p(Sar)=p(S)pr (4.4-12) 對于有相關(guān)性的序列, 上面的兩個遞推公式也是適用的, 只是上式中的單符號概率應(yīng)換成條件概率。 用遞推公式可逐位計算序列的積累概率, 而不用像式(4.4-9)那樣列舉所有排在前面的那些序列概率。 實際上, 可用兩個存儲器把p(S)和P(S)存下來, 然后根據(jù)輸入符號和式(4.4-11)、 式(4.4-12), 更新兩個存儲器中的值。 在起始時可令 P()=0, p()=1其中代表空集, 只有一個符號ar的序列就是ar。 2. 代碼長度 從以上關(guān)于積累概率P(S)的計算中可看出, P(S)把區(qū)間
45、0,1)分割成許多小區(qū)間, 每個小區(qū)間的長度等于各序列的概率p(S), 而這些小區(qū)間內(nèi)的任一點可用來代表這些序列, 現(xiàn)在來討論如何選擇這個點。 令 (4.4-13) 其中X代表大于或等于X的最小整數(shù), 把積累概率P(S)寫成二進位的小數(shù), 取其前L位, 若有尾數(shù), 就進位到第L位, 這樣得到一個數(shù)C。 例如, P(S)=0.10110001, p(S)=1/7, 則L=3, 得C0.110。 這個C就可以作為S的碼字。 可以證明這C點必然在長度為p(S)的小區(qū)間內(nèi), 因而是可以惟一解碼的。 這樣構(gòu)成的碼字, 編碼效率是很高的, 因為已經(jīng)達到概率匹配, 尤其是當(dāng)序列很長時。 由式(4.4-13)
46、可見, 對于長序列, p(S)必然很小, L與概率倒數(shù)的對數(shù)已幾乎相等。 也就是取整數(shù)所造成的差別很小, 平均代碼長度將接近S的熵值。 實際編碼過程是這樣的。 可先設(shè)定兩個存儲器, 起始時一個為“0”, 另一個為“1”, 分別代表空集的積累概率和概率。 每輸入一個信源符號, 更新一次, 得到P(S)值后, 按前述方法得到碼字C, 暫存起來, C值也隨輸入符號而更新。 直至序列結(jié)束, 就可作為該序列的碼字輸出。 由于P(S)是遞增的, 而增量隨著序列的增長而減小。 因為增量是序列的概率與信源符號的積累概率的乘積, 所以C的前幾位一般已固定, 在以后的計算中不會被更新, 因而可以輸出。 解碼也逐位
47、進行。 由于P(S)的遞增性, 第一個符號的積累概率不會小于以后的C值, 所以從C值就可譯出第一個信源符號。 由該符號按編碼方法算得的P(S)與C比較就可判斷下一個信源符號, 依次下去就可譯出全序列。 其實, 在算術(shù)編碼中, 解碼過程與編碼過程是相似的。 3. 實現(xiàn)算術(shù)編碼的一些問題 以上從理論上簡單討論了算術(shù)編碼的編譯方法以及它的編碼效率, 可以看出它有許多優(yōu)點, 尤其它的漸近最佳性, 亦即當(dāng)序列無限增長時, 平均碼長將漸近地等于序列的熵值。 但在實際實現(xiàn)時, 尚有一些必須解決的問題。 (1) 復(fù)雜性問題。 每次遞推運算中都有乘法, 當(dāng)序列概率和符號的積累概率展開成二進位小數(shù)后的位數(shù)較多且要
48、求精度較高時, 就有一定的運算量。 這種運算必須在輸入一個信源符號的時間內(nèi)完成, 以保證實時編解碼, 有時會造成困難。 要消除乘法, 只有一種情況, 這就是編碼序列是二元序列, 而且其符號概率較小的一個是2-k的形式, 其中k是正整數(shù)。 此時乘以2-k等于移位, 乘以1-2-k等于移位和相減。 這樣就完全沒有乘法運算, 可加快運算速度。 這就是為什么算術(shù)編碼一般只用于二元序列的編碼, 而且符號概率常用2-k去近似。 (2) 計算精度問題。 即使在二元序列的情況下, 精度問題仍存在。 隨著遞推運算的延續(xù), P(S)和p(S)(即積累概率和序列的概率)的小數(shù)位數(shù)也將逐步增加, 若不能隨時輸出和加以
49、截斷, 運算器將難于容納, 但有所截斷必然降低精度。 而精度不夠會影響編解碼的正確性。 這是因為隨著序列長度增大, 小區(qū)間數(shù)目越來越多, 長度越來越短。 計算精度不夠會使有些小區(qū)間互相重疊或消失(即長度為零), 前者使惟一性喪失, 后者使無碼字可編。 這些會造成差錯, 就不是無損編碼, 而且這些差錯還會擴散。 所以最初提出的算術(shù)編碼要求無限精度, 這是不現(xiàn)實的。 有限精度是可能的, 只是編碼效率會有所下降。 (3) 存儲量問題。 碼字C的長度也隨序列S長度的增加而不斷增長。 若不及時輸出, 存儲量將非常大。 但若輸出過早, 運算過程中可能還需調(diào)整已輸出的部分, 就會影響結(jié)果。 當(dāng)未輸出部分的前
50、面各位都是“1”時, 后面在計算時略有增加, 就可能進位到已輸出部分, 尤其是連“1”很長時, 原以為保留許多位已經(jīng)夠了, 但仍會影響已輸出部分。 從理論上說, 這種連“1”的長度可以達到無限, 當(dāng)然出現(xiàn)這種情況的概率也將接近于零。 這類問題常稱為進位問題, 在實際應(yīng)用時也必須設(shè)法解決。 4. 二元獨立序列的算術(shù)編碼示例設(shè)有二元獨立序列: S=11111100已知其符號概率 p0=1/4, p1=3/4, 則用前面的公式和編碼規(guī)則, 可得P(S) =p(00000000)+p(00000001)+p(00000010)+p(11111011) =1-p(11111111)-p(11111110
51、)-p(11111101)-p(11111100) =1-p(111111) =1-(3/4)6=0.110100100111 C=0.1101010 該碼字C在P(11111100)和P(11111101)之間, 必可惟一譯出序列S。 這樣編碼的效率為 熵/平均碼字長度 =92.7% 隨著S的增長, 編碼效率一般還可提高。 但是這種按全序列的編碼, 計算量和存儲量將隨S的增長而不斷增加, 因而幾乎不可能實現(xiàn)。 現(xiàn)在用遞推公式式(4.4-11)和式(4.4-12)來計算上面的序列的碼字。 這種編碼過程如圖4.4-2所示。 圖4.4-2 算術(shù)編碼過程示例 由式(4.4-10)以及二元集的積累概率
52、P0=0, P1=p0可得P(S0)=P(S), P(S1)=P(S)+p(S)p0。 所以, 當(dāng)輸入第一個1: P(S1)=0+1(1/4)=1/40.01; 輸入第二個1: P(S1)=1/4(3/4)(1/4)=7/160.0111; 輸入第一個0: P(S0)=P(S), 即與上一行相同, 換成二進制小數(shù)還是相同。 依次類推, 而計算序列概率按公式p(S0)=p(S)p0, p(S1)=p(S)p1計算即可。 圖4.4-3 算術(shù)編碼的圖解 4.5 預(yù) 測 編 碼 4.5.1 DPCM系統(tǒng)的基本原理 DPCM系統(tǒng)的基本原理是指基于圖像中相鄰像素之間具有較強的相關(guān)性。 每個像素可以根據(jù)前幾
53、個已知的像素值來作預(yù)測。 因此在預(yù)測法編碼中, 編碼與傳輸?shù)闹挡⒉皇窍袼厝又当旧恚?而是這個取樣值的預(yù)測值(也稱估計值)與實際值之間的差值。 DPCM系統(tǒng)的原理框圖如圖4.5-1所示。 圖4.5-1 DPCM系統(tǒng)的原理框圖 設(shè)輸入信號xn為tn時刻的取樣值。 是根據(jù)tn時刻以前已知的m個取樣值xn-m, , xn-1對xn所作的預(yù)測值, 即(4.5-1 ) 式中, ai(i1, , m)稱為預(yù)測系數(shù), m為預(yù)測階數(shù)。 en為預(yù)測誤差信號, 顯然(4.5-2) 設(shè)qn為量化器的量化誤差, en為量化器輸出信號, 可見 qn=en-en (4.5-3) 接收端解碼輸出為xn, 如果信號在傳輸過程
54、中不產(chǎn)生誤差, 則有en=en, xn=xn, 。 此時發(fā)送端的輸入信號xn與接收端的輸出信息xn之間的誤差為(4.5-4) 4.5.2 最佳線性預(yù)測 在線性預(yù)測的預(yù)測表達式(4.5-1)中, 預(yù)測值 是xn-m, , xn-1的線性組合, 分析可知, 需選擇適當(dāng)?shù)念A(yù)測系數(shù)ai使得預(yù)測誤差最小, 這是一個求解最佳線性預(yù)測的問題。 一般情況下, 應(yīng)用均方誤差為極小值準(zhǔn)則獲得的線性預(yù)測稱為最佳線性預(yù)測。 在討論如何確定預(yù)測系數(shù)ai之前, 先簡單討論一下線性預(yù)測DPCM中, 對xn作最佳預(yù)測時, 如何取用以前的已知像素值xn-1, xn-2, , x1。 xn與鄰近像素的關(guān)系示意圖如圖4.5-2所示
55、。 圖4.5-2 xn與鄰近像素的關(guān)系示意圖 (1) 若取用現(xiàn)在像素xn的同一掃描行中前面最鄰近像素x1來預(yù)測xn, 即xn的預(yù)測值 , 則稱為前值預(yù)測。 (2) 若取用xn的同一掃描行中前幾個已知像素值, 如x1, x5, 來預(yù)測xn, 則稱為一維預(yù)測。 (3) 若取用xn的同一行和前幾行若干個已知像素值, 如x1, x5, x2, x3, x4, 來預(yù)測xn, 則稱為二維預(yù)測。 (4) 若取用已知像素不但是前幾行的而且還包括前幾幀的, 那么相應(yīng)的稱其為三維預(yù)測。 在一維預(yù)測情況下不失一般性。 設(shè)xn是期望Exn=0的廣義平穩(wěn)隨機過程, 則設(shè)(4.5-5) 為了使 最小, 必定有 i=1,
56、2, , m (4.5-6) 解這m個聯(lián)立方程可得ai(i=1, 2, , m)。 xn的自相關(guān)函數(shù)為 R(k)=Exnxn-k 且 R(-k)=R(k), 代入式(4.5-6)得i1, 2, , m (4.5-7) 寫成矩陣形式為 上式最左邊的矩陣是xn的相關(guān)矩陣, 為Toeplitz矩陣, 所以用Levinson算法可解出各ai (i=1, 2, , m), 從而得到在均方誤差最小意義下的最佳線性預(yù)測。 式(4.5-5)也可以用自相關(guān)函數(shù)來表示, 即(4.5-9) 因為Exn=0, 所以R(0)即為xn的方差 , 可見 。 因而傳送差值en比直接傳送原始信號xn更有利于數(shù)據(jù)壓縮。 R(k)
57、越大, 表明xn的相關(guān)性越強, 則 越小, 所能達到的壓縮比就越大。 當(dāng)R(k)=0(k0)時, 即相鄰點不相關(guān)時, , 此時預(yù)測并不能提高壓縮比。 二維、 三維線性預(yù)測的情況與一維完全類似, 只不過推導(dǎo)的過程相對一維來說要復(fù)雜一些, 這里不再推導(dǎo), 有興趣的讀者可以參考相關(guān)書籍。 應(yīng)用均方差極小準(zhǔn)則所獲得的各個預(yù)測系數(shù)ai之間有什么樣的約束關(guān)系呢? 假設(shè)圖像中有一個區(qū)域亮度值是一個常數(shù), 那么預(yù)測器的預(yù)測值也應(yīng)是一個與前面相同的常數(shù), 即將此結(jié)果代入式(4.5-1)得因此 1980年P(guān)irsch進一步研究并修正了這個結(jié)論。 他認為, 為了防止DPCM系統(tǒng)中出現(xiàn)“極限環(huán)”(Limit Circ
58、le)振蕩和減少傳輸誤碼的擴散效應(yīng), 應(yīng)滿足下列兩個條件: (1) 預(yù)測誤差e=0應(yīng)該是一個量化輸出電平, 也就是量化分層的總數(shù)K應(yīng)是奇數(shù)。 (2) 所有預(yù)測系數(shù)ai除滿足 外, 還應(yīng)滿足 4.5.3 DPCM系統(tǒng)中的圖像降質(zhì) 由于預(yù)測器和量化器的設(shè)計以及數(shù)字信道傳輸誤碼的影響, 在DPCM系統(tǒng)中會出現(xiàn)一些圖像降質(zhì)現(xiàn)象。 經(jīng)過許多實驗可總結(jié)為下列幾種。 (1) 斜率過載引起圖像中黑白邊沿模糊, 分辨率降低。 這主要是當(dāng)掃描到圖像中黑白邊沿時, 預(yù)測誤差信號比量化器最大輸出電平還要大得多, 從而引起很大的量化噪聲。 (2) 顆粒噪聲。 顆粒噪聲主要是最小的量化輸出電平太大, 而圖像中灰度緩慢變化
59、區(qū)域輸出可能在兩個最小的輸出電平之間隨機變化, 從而使畫面出現(xiàn)細斑, 而人眼對灰度平坦區(qū)域的顆粒噪聲又很敏感, 從而使人主觀感覺上圖像降質(zhì)嚴(yán)重。 (3) 假輪廓圖案。 假輪廓圖案主要是由于量化間隔太大, 而圖像灰度緩慢變化區(qū)域的預(yù)測誤差信號太小, 就會產(chǎn)生像地形圖中等高線一樣的假輪廓圖案。 (4) 邊沿忙亂。 邊沿忙亂主要在電視圖像DPCM編碼中出現(xiàn), 因為不同幀在同一像素位置上量化噪聲各不相同, 黑白邊沿在電視監(jiān)視上將呈現(xiàn)閃爍跳動犬齒狀邊沿。 (5) 誤碼擴散。 任何數(shù)字信道中總是存在著誤碼。 在DPCM系統(tǒng)中, 即使某一位碼有差錯, 對圖像一維預(yù)測來講, 將使該像素以后的同一行各個像素都產(chǎn)
60、生差錯。 而對二維預(yù)測, 誤碼引起的差錯還將擴散到以下各行。 這樣將使圖像質(zhì)量大大下降, 其影響的程度取決于誤碼在信號代碼中的位置以及有誤碼的數(shù)碼所對應(yīng)的像素在圖像中的位置。 一般來說, 一維預(yù)測誤碼呈水平條狀圖案, 而二維預(yù)測誤碼呈“彗星狀”向右下方擴散。 二維預(yù)測比一維預(yù)測抗誤碼能力強得多。 對電視圖像來講, 要使圖像質(zhì)量達到人不能察覺的降質(zhì), 實驗表明, 對DPCM要求傳輸誤碼應(yīng)優(yōu)于510-6, 而對于一維前值預(yù)測DPCM則應(yīng)優(yōu)于10-9, 二維DPCM應(yīng)優(yōu)于10-8。 4.5.4 自適應(yīng)預(yù)測編碼 在討論線性預(yù)測中, 我們假設(shè)輸入數(shù)據(jù)是平穩(wěn)的隨機過程。 然而, 實際的輸入數(shù)據(jù)并非是平穩(wěn)過
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 投資入股合作協(xié)議書模板
- 余甘子種苗生產(chǎn)技術(shù)規(guī)程
- 2024年培訓(xùn)班兼職教師聘用合同模板
- 建筑行業(yè)勞動合同范本
- 回收協(xié)議書范本2024年
- 個人車位買賣協(xié)議樣本
- 2024年三人結(jié)伙協(xié)議書范本
- 合作項目保密協(xié)議書2024年
- 版權(quán)承包協(xié)議樣本
- 房地產(chǎn)合同范本:房屋出售協(xié)議書
- 護理導(dǎo)論 評判性思維
- SPC培訓(xùn)資料_2
- 學(xué)習(xí)適應(yīng)性測驗(AAT)
- ADS創(chuàng)建自己的元件庫
- MATLAB仿真三相橋式整流電路(詳細完美)
- 文件管理系統(tǒng)畢業(yè)設(shè)計論文
- 2019年重慶普通高中會考通用技術(shù)真題及答案
- 天秤座小奏鳴曲,Libra Sonatine;迪安斯,Roland Dyens(古典吉他譜)
- 鋼筋混凝土工程施工及驗收規(guī)范最新(完整版)
- 光纜施工規(guī)范及要求
- 三國志11全人物信息(五維、特技、生卒年等)
評論
0/150
提交評論