![第8章 圖像壓縮20121120_第1頁(yè)](http://file4.renrendoc.com/view12/M09/36/04/wKhkGWX802GAOFYLAABbqwcVnVg344.jpg)
![第8章 圖像壓縮20121120_第2頁(yè)](http://file4.renrendoc.com/view12/M09/36/04/wKhkGWX802GAOFYLAABbqwcVnVg3442.jpg)
![第8章 圖像壓縮20121120_第3頁(yè)](http://file4.renrendoc.com/view12/M09/36/04/wKhkGWX802GAOFYLAABbqwcVnVg3443.jpg)
![第8章 圖像壓縮20121120_第4頁(yè)](http://file4.renrendoc.com/view12/M09/36/04/wKhkGWX802GAOFYLAABbqwcVnVg3444.jpg)
![第8章 圖像壓縮20121120_第5頁(yè)](http://file4.renrendoc.com/view12/M09/36/04/wKhkGWX802GAOFYLAABbqwcVnVg3445.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第八章圖像壓縮
Imagecompression圖像編碼ImageCoding壓縮目的基本原理基本方法圖像編碼標(biāo)準(zhǔn)減少數(shù)據(jù)量:存儲(chǔ)量、傳輸時(shí)間例1:一般彩色電視信號(hào),YIQ色空間中各分量的帶寬分別為4.2MHz、1.5MHz、0.5MHz,采樣原理,采樣頻率>=2倍原始信號(hào)頻率,量化為8bit,1秒鐘的數(shù)據(jù)量為(4.2+1.5+0.5)*2*8=99.2MBits,約為100Mbits/S。HDTV數(shù)據(jù)量約為1.2GBits/S,彩色靜止圖像:3*1024*1024*8=3MB,8.1基礎(chǔ)壓縮的根據(jù):圖像數(shù)據(jù)量>>信息量
I=D-du,I(信息量),
D(數(shù)據(jù)量),
du(冗余量)保留意義完全的信息,支持查詢與檢索。冗余(redundancy)信息和不相干(irrelevancy)的信息。壓縮率用n1表示一幅圖像原來(lái)的數(shù)據(jù)量,n2表示壓縮后的數(shù)據(jù)量,壓縮率Cr
定義為:Cr=n1/n2
冗余量
Rd
可表示為:Rd=1-1/Cr
數(shù)據(jù)冗余的類型編碼冗余像素間冗余心理視覺(jué)冗余1、編碼冗余(信息熵冗余)“碼本”是表示一組信息或一組事件的一系列符號(hào)(如字母、數(shù)字等)。其中對(duì)每個(gè)信息或事件所賦予的符號(hào)成為“碼字”,每個(gè)碼字含有的基本符號(hào)的個(gè)數(shù)稱為“碼長(zhǎng)”。設(shè)l(rk)為碼字rk的碼長(zhǎng),在二進(jìn)制表示時(shí)稱為“比特?cái)?shù)(bits)”,Pr(rk)為碼字的出現(xiàn)概率。若編碼系統(tǒng)共有L種不同的碼字,則系統(tǒng)可獲得的平均比特?cái)?shù)為: 自然碼,如表示256個(gè)不同的灰度級(jí),就用8bits的等長(zhǎng)的二進(jìn)制數(shù)據(jù)來(lái)編碼每一個(gè)灰度級(jí),這樣系統(tǒng)的平均碼長(zhǎng)就是8bits。定理:當(dāng)l(rk)根據(jù)pr(rk)降序設(shè)計(jì)成變長(zhǎng)編碼的形式時(shí),平均碼長(zhǎng)最小。等長(zhǎng)編碼與非等長(zhǎng)編碼比較rkpr(rk)編碼1L1(rk)編碼2L2(rk)編碼3L3(rk)r0=00.0200030021111016r1=1/70.250013012002r2=2/70.06010310211104r3=3/70.1601131100411004r4=4/70.0810031101411014r5=5/70.21101311104012r6=6/70.03110311110061111006r7=10.1911131111016102平均碼長(zhǎng)33.782.82、像素間冗余(1)空間冗余:規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性??臻g冗余時(shí)間冗余(2)時(shí)間冗余:序列圖像像素的灰度級(jí)和顏色之間具有相關(guān)性,隨機(jī)場(chǎng)模型(3)結(jié)構(gòu)冗余:紋理結(jié)構(gòu)有些圖像存在較強(qiáng)的紋理結(jié)構(gòu),如墻紙、草席等圖像,稱之存在結(jié)構(gòu)冗余(4)知識(shí)冗余:人臉的固定結(jié)構(gòu)。有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性,例如人臉的圖像有固定的結(jié)構(gòu),比如說(shuō)嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正臉圖像的中線上等等,這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,稱此類冗余為知識(shí)冗余。。3.心理視覺(jué)冗余人類的視覺(jué)系統(tǒng)對(duì)于圖像場(chǎng)的注意是非均勻和非線性的,特別是視覺(jué)系統(tǒng)并不是對(duì)于圖像場(chǎng)的任何變化都能感知,即眼睛并不是對(duì)所有信息都有相同的敏感度,有些信息在通常的視覺(jué)感覺(jué)過(guò)程中與另外一些信息相比來(lái)說(shuō)并不那么重要,這些信息可認(rèn)為是心理視覺(jué)冗余的,去除這些信息并不會(huì)明顯地降低所感受到的圖像的質(zhì)量。心理視覺(jué)冗余的存在是與人觀察圖像的方式有關(guān)的,人在觀察圖像時(shí)主要是尋找某些比較明顯的目標(biāo)特征,而不是定量地分析圖像中每個(gè)像素的亮度,或至少不是對(duì)每個(gè)像素等同地分析,人通過(guò)在腦子里分析這些特征并與先驗(yàn)知識(shí)結(jié)合以完成對(duì)圖像的解釋過(guò)程,由于每個(gè)人所具有的先驗(yàn)知識(shí)不同,對(duì)同一幅圖像的心理視覺(jué)冗余也就因人而異。動(dòng)態(tài)圖像的視覺(jué)延遲現(xiàn)象改進(jìn)的灰度級(jí)(IGS)量化方法4、保真度準(zhǔn)則輸入圖像f(x,y),輸出g(x,y),x,y=0,1,2,…,N-1,定義偏差e(x,y)=f(x,y)-g(x,y),(1)均方誤差:(2)均方根信噪比:(3)壓縮比=原圖像編碼每個(gè)像素平均所需bit數(shù)/壓縮后像素平均所需bit數(shù)保真度準(zhǔn)則:主觀保真度準(zhǔn)則、客觀保真度準(zhǔn)則??陀^保真度準(zhǔn)則:圖像均方誤差、均方根信噪比。主觀保真度準(zhǔn)則
盡管客觀保真度準(zhǔn)則提供了一種簡(jiǎn)單方便的信息損失的方法,但是很多解壓圖像最終是供人觀看的,有時(shí)單用某一個(gè)或幾個(gè)解析式來(lái)度量圖像品質(zhì),甚至得到與主觀評(píng)估相反的結(jié)果,這樣就造成采用這些解析公式得到的定量的逼真度的可信度低,造成逼真度不能從理論上完滿解決的根本原因在于人眼視覺(jué)感知得到的信息傳輸?shù)缴窠?jīng)系統(tǒng)的處理、判別過(guò)程不清楚,而這又涉及到生物物理學(xué)、生物化學(xué)以及生態(tài)光學(xué)等領(lǐng)域的成就,至今還不能提供這一過(guò)程的滿意回答(這也是當(dāng)今計(jì)算機(jī)視覺(jué)的一個(gè)前沿課題,目前正在研究發(fā)展中)。
鑒于這樣的原因,目前對(duì)圖像品質(zhì)的度量仍停留在主觀評(píng)估上。所謂主觀評(píng)估就是聘請(qǐng)一些‘外行’或?qū)<?,通過(guò)對(duì)圖像的觀察來(lái)判別好壞。因而這是一種定性的評(píng)估。這種主觀評(píng)估可能是對(duì)一幅圖像而言,由觀察者對(duì)其總體印象估出優(yōu)劣,其等級(jí)標(biāo)準(zhǔn)表見(jiàn)后;或在一組圖像中進(jìn)行比較。采用主觀評(píng)估的缺點(diǎn)是顯而易見(jiàn)的,對(duì)“外行”人來(lái)說(shuō),可能注意的是圖像的大體上的優(yōu)劣,而對(duì)“內(nèi)行”人即具有圖像處理經(jīng)驗(yàn)的人來(lái)說(shuō),更多的是注意圖像中細(xì)節(jié)的退化程度,所以這種主觀評(píng)估法應(yīng)使“外行”和“內(nèi)行”分開(kāi)進(jìn)行。
主觀保真度準(zhǔn)則標(biāo)準(zhǔn)評(píng)分評(píng)價(jià)說(shuō)明1極好圖像質(zhì)量非常好,和希望的一樣好2好圖像質(zhì)量高,觀看舒服,有干擾但不影響觀看3可用圖像質(zhì)量可接受,有干擾但不太影響觀看4勉強(qiáng)可以圖像質(zhì)量差,干擾有些影響觀看,希望改進(jìn)5差圖像質(zhì)量很差,干擾嚴(yán)重妨礙觀看6不能用圖像質(zhì)量極差,不能使用8.2圖像壓縮模型圖像采集信源編碼信道編碼信道解碼信源解碼圖像顯示或存儲(chǔ)圖像通信編碼器解碼器1.基本概念信源需要傳輸或存儲(chǔ)的原始信息稱為“信源”。包括語(yǔ)音、圖像、視頻等信息源。“信源編碼”的主要任務(wù)是利用一定的編碼方法降低數(shù)碼率,即比特率。信道信息傳輸?shù)耐罚恍畔⒃趥鬏斨幸黾涌煽啃?、抗干擾能力,就要進(jìn)行“信道編碼”,此時(shí)要進(jìn)行奇偶校驗(yàn)等檢測(cè),需要增加比特?cái)?shù)??垢蓴_能力越強(qiáng),增加的比特?cái)?shù)就越多。簡(jiǎn)單的圖像編碼模型信源PCM信息源編碼器信道編碼器通訊線路或存儲(chǔ)媒體
圖像通訊和編碼壓縮原理框圖壓縮編碼器信宿PCM解碼器信道解碼器壓縮解碼器編碼部分解碼部分信源編碼器和信源解碼器信道編碼器和信道解碼器漢明(Hamming)編碼:正確的碼字之間的最小距離要大于一個(gè)給定值碼字以二進(jìn)制形式表示,比特(bit)D((101),(110))=2漢明:將3個(gè)比特位的冗余加到4比特的碼字上,任意兩個(gè)正確碼字間的距離為3,可發(fā)現(xiàn)和校正錯(cuò)誤。2.圖像編碼壓縮要研究的主要內(nèi)容信源壓縮方法信源模型有關(guān)編碼模型逼真度準(zhǔn)則或失真度準(zhǔn)則平方誤差準(zhǔn)則基于主觀感受的逼真度準(zhǔn)則3.編碼方法的分類由壓縮恢復(fù)的圖像與原始圖像的差別“可逆壓縮”:編碼的數(shù)據(jù)可完全恢復(fù)出原始圖像“熵編碼”(EntropyCoding),“無(wú)失真編碼”、“無(wú)誤差編碼”(ErrorFreeCoding)、無(wú)噪聲編碼”(Noiseless)、“冗余度壓縮”(RedundancyReduction)、“數(shù)據(jù)緊縮”(DATACompactionLosslessBit-Preserving)?!安豢赡鎵嚎s”:“有失真編碼”(lossyCoding),采用這類編碼方法,由編碼數(shù)據(jù)恢復(fù)的圖像與原始圖像有區(qū)別,圖像編碼產(chǎn)生的誤差與編碼的方法以及壓縮比等因素有關(guān)。(1)“第一代”編碼技術(shù)三大經(jīng)典編碼方法“熵值編碼”“預(yù)測(cè)編碼”“變換編碼”“熵值編碼”(概率匹配編碼)主要針對(duì)無(wú)記憶信源,根據(jù)信息碼字出現(xiàn)概率的分布特征,尋找概率與碼字長(zhǎng)度間的最優(yōu)匹配,從而進(jìn)行壓縮編碼,又稱為統(tǒng)計(jì)編碼。游程編碼、Huffman編碼和算術(shù)編碼等多種。熵值編碼是信息編碼的基礎(chǔ),也是各種實(shí)用算法的一個(gè)基本組成部分?!邦A(yù)測(cè)編碼”根據(jù)數(shù)據(jù)的統(tǒng)計(jì)特性得到預(yù)測(cè)值,然后傳輸圖像像素與其預(yù)測(cè)值的差值信號(hào),使傳輸?shù)拇a率降低,達(dá)到壓縮的目的。預(yù)測(cè)編碼方法簡(jiǎn)單經(jīng)濟(jì),編碼效率較高,是語(yǔ)音的基本編碼方法。預(yù)測(cè)編碼分為線性預(yù)測(cè)編碼、非線性預(yù)測(cè)編碼。根據(jù)處理的信息維數(shù)不同,又可分為行內(nèi)編碼(一維)、幀內(nèi)編碼(二維)以及幀間編碼(三維)。預(yù)測(cè)編碼是視頻圖像壓縮的基礎(chǔ)。“變換編碼”進(jìn)行某種正交變換來(lái)消除像素間的相關(guān)性。可分為最佳變換編碼,如K-L變換,以及次優(yōu)變換編碼,如離散余弦變換(DCT)等。在實(shí)施時(shí),輔助以區(qū)域變換編碼、門限變換編碼?;陔x散余弦變換的靜止圖像壓縮標(biāo)準(zhǔn)jpeg和運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)mpeg等一系列標(biāo)準(zhǔn)?!白赃m應(yīng)編碼”從本質(zhì)上來(lái)說(shuō)就是一種“混合編碼”方案,它在不同階段根據(jù)圖像的不同特征將變換編碼、預(yù)測(cè)編碼、無(wú)誤差編碼等各種方案的優(yōu)勢(shì)綜合利用起來(lái)。關(guān)鍵是識(shí)別圖像的特征。多種方案的復(fù)用可實(shí)現(xiàn)多級(jí)壓縮,已經(jīng)可以得到較大的壓縮比了,現(xiàn)有的圖像壓縮標(biāo)準(zhǔn)JPEG、MPEG等在設(shè)計(jì)中就利用了這種思路。(2)第二代編碼技術(shù)要充分利用人的視覺(jué)生理、心理特征和圖像信源的各種特征,實(shí)現(xiàn)從“波形”編碼到“模型”編碼的轉(zhuǎn)變,以便獲得更高壓縮比。向量量化編碼、基于分形的編碼、基于模型的編碼、基于區(qū)域分割的編碼、基于神經(jīng)網(wǎng)絡(luò)的編碼以及識(shí)別編碼和基于知識(shí)的編碼等。(3)過(guò)渡編碼技術(shù)充分利用人類視覺(jué)特性的“多分辨率編碼”方法,如子帶編碼、金字塔形編碼和基于小波變換的編碼。這類方法原理上仍屬于線性處理,屬于“波形”編碼,可歸入經(jīng)典編碼方法,但它們又緊密結(jié)合人類視覺(jué)系統(tǒng)的特性,因此可以被看作是“第一代”編碼技術(shù)向“第二代”編碼技術(shù)過(guò)渡的橋梁。編碼算法PCM預(yù)測(cè)編碼變換編碼付立葉變換斜變換小波變換統(tǒng)計(jì)編碼Huffman編碼算術(shù)編碼游程編碼其他編碼靜態(tài)圖像編碼二值圖像編碼子帶編碼輪廓編碼常用圖像編碼算法分類固定自適應(yīng)固定自適應(yīng)離散余弦變換KL變換沃爾什哈達(dá)馬Harr變換LZW比特平面逐漸浮現(xiàn)逐層內(nèi)插方塊抖動(dòng)視頻圖像內(nèi)插運(yùn)動(dòng)補(bǔ)償條件補(bǔ)充運(yùn)動(dòng)估計(jì)幀間預(yù)測(cè)幀內(nèi)預(yù)測(cè)幀間編碼矢量量化算法的適用范圍
特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不對(duì)所有的圖像都有效。一般說(shuō)來(lái),大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像;某些算法(如基于對(duì)象的圖像壓縮編碼方案),只能用于特定圖像場(chǎng)景(如人的頭肩像場(chǎng)景)的壓縮。算法的復(fù)雜度
算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡(jiǎn)單,易于硬件實(shí)現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性、多媒體系統(tǒng)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。
8.3信息論要素1.信息量消息(message)包含著對(duì)人們有用的信息(informassion)消息是由一個(gè)有次序的符號(hào)(如字母、數(shù)字、狀態(tài)、電平等)序列構(gòu)成。輸出這些符號(hào)集的源就是信源。而信息是指對(duì)消息接收者是預(yù)先不知道的報(bào)道。信息的度量—信息量假設(shè)接收到一個(gè)符號(hào)xi,它所攜帶的信息量I(xi)定義為:I(xi)=log2(1/p(xi))=-log2p(xi),負(fù)號(hào)保證其為正值。亦稱自信息量,單位為bit,其含義是:隨機(jī)變量X取值為xi時(shí)所攜帶信息的度量。進(jìn)制不同單位也不同。這是一種不確定性的度量,人們收到消息前后確定性不同,因此解除不確定性的多少就可作為信息的度量。例如,要識(shí)別1~32中所選的數(shù)字,其信息量為I(xi)=log2(1/p(xi))=log232=5bit解除不確定性的過(guò)程就是獲得信息的過(guò)程概率與信息量的關(guān)系0<p<1時(shí),I(p(xi))是連續(xù)的;
p=0時(shí),I(p(xi))=
p=1時(shí),I(p(xi))=0p1>p2時(shí),I(p1(xi))<I(p2(xi))
信息量是一組事件的不確定性的度量.2信息信道
熵(Entropy)定義:在離散無(wú)記憶信源(發(fā)送符號(hào)是相互獨(dú)立的信源)中,一個(gè)符號(hào)所攜帶的平均信息量(自信息量的概率平均值)H=
1~MpiI(pi)=-
1~Mpilog2pi(bit/符號(hào))如何理解?信源的熵就是由信源產(chǎn)生的平均信息量;信源符號(hào)中各符號(hào)所攜帶的信息量的數(shù)學(xué)期望;在物理意義上:符號(hào)出現(xiàn)之前是不確定性的度量,符號(hào)出現(xiàn)之時(shí)是一種驚奇性度量,符號(hào)出現(xiàn)之后是從該信源中獲得平均信息量的度量。熵的應(yīng)用舉例例1.一幅圖像有M個(gè)灰度級(jí),出現(xiàn)的概率分別為p1,p2,…,pM,其信息量分別為-log2p1,-log2p2,…,平均信息量H=-
pilog2pi
若概率相等,即pi=1/M.則H=log2M,可以證明:只有xi出現(xiàn)的概率相同,才能獲得最大的平均信息量例2.若像素灰度值為xi=0,1.而對(duì)應(yīng)概率為p和q=1-p,則熵
H=plog21/p-(1-p)log21/(1-p)Hp00.51例3.假設(shè)信源X隨機(jī)輸出4種電平:p1(x1)=1/2,p2(x2)=1/4,p3(x3)=1/8,p4(x4)=1/8H(X)=-
pi(xi)log2pi(xi)=1.75bit/符號(hào)
編碼Ⅰ:平均碼長(zhǎng)Navg=2bit/符號(hào),大于熵(1.75)編碼Ⅱ:平均碼長(zhǎng)Navg=
pi(xi)n(xi)=1.752bit/符號(hào),等于熵(1.75),達(dá)到極限符號(hào)出現(xiàn)概率編碼方式Ⅰ編碼方式Ⅱx11/2000x21/40110x31/810110x41/8111113基本編碼定理無(wú)噪聲編碼定理也是“Shannon(香農(nóng))第一定理”。定義了可以達(dá)到的每個(gè)信源符號(hào)的最小平均碼字長(zhǎng)度。信息的碼字長(zhǎng)度與它的出現(xiàn)概率成反比,大概率事件的碼長(zhǎng)較短,小概率事件的碼長(zhǎng)較大,嚴(yán)格按照這個(gè)規(guī)律構(gòu)造非等長(zhǎng)碼,就可以獲得概率統(tǒng)計(jì)意義上最優(yōu)的編碼。平均碼長(zhǎng)的下限,對(duì)二進(jìn)制編碼而言,只有當(dāng)所有符號(hào)的出現(xiàn)概率等于2的負(fù)整數(shù)冪時(shí),(如0.5,0.25等),才能達(dá)到下限。信息的出現(xiàn)概率在實(shí)際應(yīng)用中很難獲得,一般是用它的頻率代替。某種編碼方法的編碼效率定義為:其中H(x)為信號(hào)的信息熵,L(x)
為編碼的平均長(zhǎng)度。這種編碼方法的冗余度為:如果某種編碼方法產(chǎn)生的平均字長(zhǎng)等于信息源的熵,那么它就沒(méi)有任何冗余信息,達(dá)到了編碼的最優(yōu)狀態(tài)。這時(shí)要求:某種編碼方法的編碼效率定義為
如果L(x)和H(x)相等,編碼效果最佳;如果L(x)和H(x)接近,編碼效果為佳;如果L(x)遠(yuǎn)大于H(x)
,則編碼效果差。
由于同一圖像壓縮編碼算法對(duì)不同圖像的編碼效率往往不同,為了公平地衡量圖像壓縮編碼算法的效率,常常需要定義一些所謂的“標(biāo)準(zhǔn)圖像”,通過(guò)測(cè)量不同圖像編碼算法在同一組“標(biāo)準(zhǔn)圖像”上的性能來(lái)評(píng)價(jià)各圖像壓縮算法的編碼效率。
國(guó)際上流行的三幅標(biāo)準(zhǔn)圖像
(a)Lena(b)Barbara(c)Mandrill圖(a)頭發(fā)部分高頻數(shù)據(jù)含量豐富,背景含低頻數(shù)據(jù),肩部亮度過(guò)渡平滑;圖(b)低頻區(qū)域含量適中,但物體邊緣豐富,頭巾、褲子及桌布上有極細(xì)膩的條紋;圖(c)高頻數(shù)據(jù)極為豐富,特別是臉部毛發(fā)部分,主要用于評(píng)價(jià)圖像編碼算法對(duì)高頻區(qū)域數(shù)據(jù)的處理性能。8.4無(wú)誤差壓縮
LosslessCompression
無(wú)誤差壓縮:編碼后的圖像能經(jīng)解碼器復(fù)原到原始的圖像,可逆?;舴蚵a算術(shù)編碼位平面編碼二值圖像編碼行程編碼(Run_lengthCoding)無(wú)損預(yù)測(cè)編碼1
霍夫曼碼(Huffman)基本思想:統(tǒng)計(jì)信號(hào)的概率分布模型,然后按信號(hào)出現(xiàn)的概率賦予信號(hào)不同的碼長(zhǎng)。出現(xiàn)概率大的信號(hào)賦予較短的碼字,出現(xiàn)概率小的,賦予較長(zhǎng)的碼字。算法(1)統(tǒng)計(jì)輸入信號(hào)的概率(如對(duì)一幅圖像或M幅同種類型圖像進(jìn)行灰度分布概率統(tǒng)計(jì)),得到N個(gè)不同概率的信息符號(hào);(2)將N個(gè)輸入信號(hào)按照它們的出現(xiàn)概率由大到小排列;(3)合并兩個(gè)概率最小的信號(hào),形成一個(gè)新的信號(hào)。新信號(hào)的概率是這兩個(gè)信號(hào)的概率和。這時(shí)概率減少為N-1個(gè);(4)在形成新概率集合后重新排列;(5)重復(fù)第4步,至只剩兩個(gè)概率序列為止;(6)以二進(jìn)制碼元(0,1)賦值,形成非續(xù)長(zhǎng)代碼樹(shù)。注意,最好按統(tǒng)一規(guī)律分配碼元,這樣解碼時(shí)更易于理解。(7)霍夫曼代碼的產(chǎn)生從根節(jié)點(diǎn)開(kāi)始,反向進(jìn)行?;舴蚵a舉例例: H-C P
1 1 0.4
2 00 0.3
3 011 0.1
4 0100 0.1
5 01010 0.06
6 01011 0.04110010.60.30.20.10101001L=k=1,M
kP(
k)=1(0.4)+2(0.3)+3(0.1)+4(0.1)+5(0.06)+5(0.04)=2.20bitsH=-k=1,M
P(ak)logP(ak)=-0.4log(0.4)-0.3log(0.3)-0.1log(0.1)-0.1log(0.1)-0.06log(0.06)-0.04log(0.04)=2.14bits霍夫曼碼是最佳編碼:按給定的概率分布構(gòu)成的最短的代碼--與概率分布相匹配的編碼。編碼效率:
=H(x)/
L(x)=2.14/2.20=0.97缺點(diǎn):1、強(qiáng)烈依賴于概率結(jié)構(gòu),工作量大。2、碼字變化大,結(jié)構(gòu)復(fù)雜,實(shí)現(xiàn)困難。
算術(shù)編碼是60年代初期提出,在信源概率分布比較均勻情況下,它的編碼效率高于霍夫曼編碼(5%),沒(méi)有變換編碼對(duì)數(shù)據(jù)輸入分塊的要求,已用于H.263和JPEG國(guó)際標(biāo)準(zhǔn),在JPEG擴(kuò)展系統(tǒng)中用它來(lái)取代霍夫曼編碼。
2
算術(shù)編碼(Arithmetic)算術(shù)編碼原理將被編碼的信源消息表示成實(shí)數(shù)軸0~1之間的一個(gè)間隔(Interval)(也稱子區(qū)間),消息越長(zhǎng),編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。信源中連續(xù)符號(hào)根據(jù)某一模式生成概率的大小來(lái)縮小間隔。(1)算術(shù)編碼的模式選擇,直接影響編碼效率,有固定模式,也有自適應(yīng)模式。(2)算術(shù)編碼的自適應(yīng)模式,無(wú)需先定義概率模型,合適于無(wú)法進(jìn)行概率統(tǒng)計(jì)的信源,在這點(diǎn)上優(yōu)越于霍夫曼編碼。(3)在信源符號(hào)概率接近時(shí),算術(shù)編碼比霍夫曼編碼效率高。(4)算術(shù)編碼硬件實(shí)現(xiàn)比霍夫曼編碼要復(fù)雜些。(5)算術(shù)編碼在JPEG的擴(kuò)展系統(tǒng)中被推薦代替霍夫曼編碼。算術(shù)編碼的特點(diǎn)3位平面編碼一種能有效減少像素間冗余的技術(shù),對(duì)相關(guān)性強(qiáng)的圖像,它的編碼效率比霍夫曼碼更高?;痉椒ǎ簩⒍嗉?jí)圖像(灰度圖像或彩色圖像)分解成一系列的二值圖像,然后對(duì)二值圖像應(yīng)用二值圖像編碼方法,以達(dá)到對(duì)多值圖像編碼的目的。相關(guān)技術(shù):位平面分解二值圖像編碼位平面分解設(shè)灰度圖像的灰度級(jí)需要m比特表示,那么任意一個(gè)灰度級(jí)g都可以表示成一個(gè)以2為底的多項(xiàng)式:其中ai=0/1,i=0,1,2,…,m-1
也就是說(shuō),圖像的同一個(gè)比特位的系數(shù)的集合就是一個(gè)二值圖像,稱為一個(gè)“位平面”。位平面編號(hào)從0開(kāi)始,直到m-1。將m個(gè)位平面組合,顯然又可以恢復(fù)原來(lái)的灰度圖像127(011111112)和128(100000002)二值圖像編碼位平面圖像圖形圖像或文本圖像大量的是連續(xù)的白色背景,對(duì)這些連續(xù)的塊指定短碼字,可以達(dá)到壓縮的效果。
空白編碼利用了文本類圖像中空白較多的特點(diǎn)。將圖像的一行分成若干段,規(guī)定每段有k個(gè)象素;若k個(gè)象素全是空白,則用“0”表示;否則用“1”表示,后接直接編碼。例:不同的10個(gè)像素,它們相應(yīng)的代碼如下:10個(gè)象素
相應(yīng)的代碼0000000000 0000000000110000000001100000000111000000001壓縮比=p(全白)>1/k,才能達(dá)到壓縮效果。當(dāng)k=10時(shí),對(duì)大多數(shù)文本文件比較合適。黑塊/白塊編碼擴(kuò)展到二維,是對(duì)圖像中大片的連續(xù)的1或0的區(qū)域(黑白塊)進(jìn)行識(shí)別編碼。(1)設(shè)圖像被分解為若干塊,每一塊的大小一致,為a
b。(2)這些塊只有三種類型:全白色、全黑色、混合區(qū)域。(3)統(tǒng)計(jì)這三類區(qū)域的出現(xiàn)概率。(4)碼字分配:出現(xiàn)概率最大的類型用1比特碼字“0”表示,其他的用2比特碼字“10”和“11”表示,后接對(duì)應(yīng)區(qū)域的直接編碼。
4
行程編碼(Run_lengthCoding)又稱為“游程編碼”可用于二值圖像/灰度值/連續(xù)出現(xiàn)的長(zhǎng)度值進(jìn)行編碼。若在圖像的一行內(nèi)采用,就是一維行程編碼,即A碼;若在圖像平面內(nèi)實(shí)施,則為二維行程編碼,它們分別是傳真機(jī)中使用的兩種二值圖像壓縮標(biāo)準(zhǔn)(G3和G4)中所用技術(shù)的基礎(chǔ)。一維行程編碼(線性行程編碼,A碼)圖像行掃描,xi={x1,x2…,xn},
行內(nèi)連續(xù)的相同的點(diǎn)的數(shù)目稱為行程長(zhǎng)度??v坐標(biāo)為圖像灰度級(jí)gi,編碼:Wi=(gi,li),li灰度級(jí)為gi的
行程長(zhǎng)度。G8642048121620xL5
無(wú)損預(yù)測(cè)編碼預(yù)測(cè)編碼(PredictiveCoding),根據(jù)“過(guò)去”的時(shí)刻的像素值,運(yùn)用一種模型,預(yù)測(cè)當(dāng)前的像素值,預(yù)測(cè)編碼通常不直接對(duì)信號(hào)編碼,而是對(duì)預(yù)測(cè)誤差進(jìn)行編碼。當(dāng)預(yù)測(cè)比較準(zhǔn)確,誤差較小時(shí),即可達(dá)到編碼壓縮的目的。原理:對(duì)圖像的一個(gè)像素的離散幅度的真實(shí)值,利用其相鄰象素的相關(guān)性,預(yù)測(cè)它的下一個(gè)象素的可能值,再求兩者差,對(duì)這種具有預(yù)測(cè)性質(zhì)的差值,量化,編碼,就可以達(dá)到壓縮的目的。預(yù)測(cè)編碼示意圖輸入圖象預(yù)測(cè)器
n量化器編碼器‘n解碼器傳輸‘n輸出圖象預(yù)測(cè)器預(yù)測(cè)器:是根據(jù)前面幾個(gè)像素的灰度值預(yù)測(cè)而得量化器:對(duì)
n進(jìn)行舍入,整量化編碼器:可采用成熟的編碼技術(shù),如Huffman編碼等解碼器:編碼器的逆線性預(yù)測(cè)器:例52 4 6 8 8 4 2 102
4 3 5 7 8 6 32
4 3 3 1 4 4 72 4 6 8 8 4 2 10^
f預(yù)測(cè)器預(yù)測(cè)編碼表示時(shí)刻n的輸入信號(hào),fn表示時(shí)刻n的輸入信號(hào),表示預(yù)測(cè)信號(hào),它是由fn之前的m個(gè)信號(hào)估計(jì)的,?n為預(yù)測(cè)誤差信號(hào)。因此,在實(shí)際系統(tǒng)中,信號(hào)前m個(gè)值是不能預(yù)測(cè)的,輸入的是實(shí)際信號(hào)的幅度,它們要用單獨(dú)的方式編碼。若框圖中缺少“量化器”,則傳送的信號(hào)無(wú)損失,整個(gè)系統(tǒng)無(wú)誤差,為“無(wú)損預(yù)測(cè)編碼”。在有“量化器”時(shí),誤差被重整為很少的數(shù)目Δ’n,為“有損預(yù)測(cè)編碼”,但編碼比特?cái)?shù)減少,可以獲得更大的壓縮比。隔行掃描的電視圖像,經(jīng)驗(yàn)公式:人頭像的典型預(yù)測(cè)公式為:8.5有損壓縮LossCompression有誤差編碼:編碼后的圖像不能經(jīng)解碼器復(fù)原到原始的圖像,不可逆。在編碼時(shí)通常還對(duì)造成較小誤差的數(shù)據(jù)忽略,以獲得更高的編碼率,因此屬于“有誤差編碼”。(1)預(yù)測(cè)編碼(2)變換編碼1有損預(yù)測(cè)編碼-+XN’e’NXN’e’NeN輸出XN輸出XN’量化器編碼器預(yù)測(cè)器解碼器預(yù)測(cè)器預(yù)測(cè)編碼原理根據(jù)信號(hào)規(guī)律,設(shè)計(jì)預(yù)測(cè)公式,對(duì)預(yù)測(cè)的誤差進(jìn)行編碼。線性預(yù)測(cè)編碼(差分脈沖調(diào)制)、非線性預(yù)測(cè)編碼。當(dāng)前xn,之前的信號(hào)xn-1,xn-2,…,xn-m,則預(yù)測(cè)值為預(yù)測(cè)誤差en是用于傳輸?shù)牧浚h(yuǎn)小于原值。令:E(en
2)
0,則可獲得最佳估值
有損預(yù)測(cè)系統(tǒng)對(duì)圖8.23采用P.371的四個(gè)預(yù)測(cè)器
即為8.5.16—8.5.19式Chapter8ImageCompressionP.371四種預(yù)測(cè)編碼的預(yù)測(cè)誤差圖像預(yù)測(cè)誤差的量化
均勻量化,只要量化級(jí)數(shù)少于8bits就可望達(dá)到壓縮的效果??梢愿鶕?jù)最佳量化器的設(shè)計(jì)方法,設(shè)計(jì)最佳的非線性量化器,當(dāng)每像素平均2bits時(shí)就可以得到較好的圖像質(zhì)量。若采用自適應(yīng)量化或矢量量化,圖像質(zhì)量可進(jìn)一步提高。2變換編碼實(shí)際圖像的空間域信息—正交變換—頻率/列率—編碼特點(diǎn):1)正交變換,相關(guān)性下降;
2)頻譜信息來(lái)自整個(gè)圖像,頻譜能量集中低頻;
3)受噪聲干擾?。?/p>
4)變換系數(shù)存在量化過(guò)程,不可逆編碼。輸入圖像構(gòu)造子圖像正變換量化符號(hào)編碼壓縮數(shù)據(jù)壓縮數(shù)據(jù)符號(hào)解碼反變換合并子圖像解壓圖像圖典型的變換編碼系統(tǒng)框圖編碼中需考慮的重要因素1、變換方法的選擇信息集中能力強(qiáng)弱:KLT,DCT,DFT,WHT計(jì)算量大?。篕LT,DCT,DFT,WHT2、子圖像尺寸的選擇2的冪次,圖像的相關(guān)性與圖像尺寸有關(guān),8*8,16*163、比特的分配對(duì)變換子圖像的系數(shù)截留、量化和編碼的全過(guò)程。DFTWHTDCT子圖像尺寸的選擇比特分配:子圖像的截取、量化和編碼的整個(gè)過(guò)程系數(shù)截留方式:區(qū)域編碼和門限編碼。1)區(qū)域編碼:對(duì)能量集中區(qū)域進(jìn)行抽樣,并對(duì)區(qū)域內(nèi)變換系數(shù)編碼。壓縮率高2)門限編碼:對(duì)變換系數(shù)的幅度進(jìn)行編碼。效果好7654328165432170543210604321005032100040210000301000002000000010區(qū)域比特分配圖壓縮步驟1.確定矩陣階數(shù);2.分別按圖像矩陣的行或列,求得圖像數(shù)據(jù)的協(xié)方差矩陣;3.確定變換矩陣;4.計(jì)算變換域的協(xié)方差矩陣;5.保留較大的系數(shù),把小于等于域值的系數(shù)以0代替;6.按新矩陣傳輸非零系數(shù),并在接收端用反變換核求原始圖像的值。特點(diǎn):(1)變換系數(shù)的相關(guān)性遠(yuǎn)遠(yuǎn)小于圖像像素間的相關(guān)性;(2)變換矩陣固定,DFT,DCT,Walsh_Hadamard,Slant,Haar;(3)快速算法。8.6圖像編碼標(biāo)準(zhǔn)1、二值圖像壓縮編碼2、靜態(tài)圖像壓縮編碼3、動(dòng)態(tài)圖像壓縮編碼國(guó)際標(biāo)準(zhǔn)化組織(internationalstandardizationorganization,ISO)
國(guó)際電信聯(lián)盟(internationaltelecommunicationunion,ITU)
國(guó)際電話電報(bào)咨詢委員會(huì)(consultativecommitteeoftheinternationaltelephoneandtelegraph,CCITT)。
主要的數(shù)據(jù)壓縮標(biāo)準(zhǔn)及其典型應(yīng)用標(biāo)準(zhǔn)號(hào)俗稱適用信源典型應(yīng)用ITU-TT.82|ISO/IEC11544JBIG-1二值圖像、圖形G4傳真機(jī)、計(jì)算機(jī)圖形ISO/IEC14492JBIG-2二值圖像、圖形傳真機(jī)、WWW圖形庫(kù)、PDA等ITU-TT.81|ISO/IEC10918JPEG連續(xù)色調(diào)靜止圖像圖像庫(kù)、傳真、彩色印刷、數(shù)碼相機(jī)等ITU-TT.87|ISO/IEC14495JPEG-LS連續(xù)色調(diào)靜止圖像醫(yī)學(xué)、遙感圖像資料的無(wú)損/近似無(wú)壓縮ISO/IEC11544JPEG2000連續(xù)色調(diào)靜止圖像各種圖形、圖像(含計(jì)算機(jī)生成的)ITU-TG.723、G.728和G.729語(yǔ)音數(shù)字通信和電話錄音ITU-T-TH.261P×64活動(dòng)圖像ISDN上的會(huì)議電視/可視電話ITU-T-TH.263活動(dòng)圖像PSTN上的會(huì)議電視/可視電話ISO/IEC11172MPEG-1活動(dòng)圖像及伴音VCD、DBA、多媒體、VOD等ITU-T-TH.262|ISO/IEC13818-2MPEG-2視頻高質(zhì)量活動(dòng)圖像SVCD/DVD、VOD/MOD、多媒體視頻游戲、DVBDTV/HDTV等ISO/IEC14496MPEG-4多媒體音像數(shù)據(jù)WWW上的視頻、音頻擴(kuò)展1二值圖像壓縮編碼G3和G4
CCITT的T.0建議書“公共電話網(wǎng)文件傳輸傳真設(shè)備分類”中定義了G1、G2、G3和G4四種傳真機(jī)。規(guī)定G3傳真機(jī)可采用MH(ModifiedHuffman)和MR(ModifiedREAD)編碼方式,G4傳真機(jī)采用MMR(ModifiedModifiedREAD)編碼方式。G3:非自適應(yīng)編碼,1-D游程編碼技術(shù)、位平面分解、常數(shù)塊編碼。對(duì)每組N行(N=2或N=4)掃描線中的后N-1行也可以用2-D方式編碼。1組共8幅“試驗(yàn)”圖用來(lái)評(píng)判各種壓縮方法,包括打印的文字、用幾種語(yǔ)言手寫的文字、少量的線繪圖G3對(duì)它們的壓縮率約為15:1。G4:G3的1種簡(jiǎn)化版本,其中只使用2-D編碼。G4的壓縮率一般比G3高1倍。
2靜止彩色圖像壓縮標(biāo)準(zhǔn)1、JPEG2、JPEG2000(1)JPEG(JointPictureExpertsGroup)聯(lián)合圖像專家小組“聯(lián)合”是指,國(guó)際電報(bào)電話咨詢委員會(huì)(CCIT)和國(guó)際標(biāo)準(zhǔn)化協(xié)會(huì)(ISO)聯(lián)合組成的一個(gè)圖像專家小組。聯(lián)合圖像專家小組1986年成立,任務(wù)是開(kāi)發(fā)研制出連續(xù)色調(diào)、多級(jí)灰度、靜止圖像的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn),使之滿足以下的要求:1)達(dá)到或接近當(dāng)前壓縮比與圖像保真度技術(shù)水平,能覆蓋一個(gè)較寬的圖像質(zhì)量等級(jí),能達(dá)到“很好”到“極好”的評(píng)估,即編碼圖像與原始圖像相比較,人的視覺(jué)難以區(qū)分差別。2)能適用于任何種類的連續(xù)色調(diào)的圖像,且長(zhǎng)寬比都不受限制,同時(shí)也不受限于景物內(nèi)容、圖像的復(fù)雜度和統(tǒng)計(jì)特性等。3)計(jì)算的復(fù)雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實(shí)現(xiàn)4)JPEG算法具有下面四種操作方式:順序編碼。每個(gè)圖像按從左到右、從上到下掃描,一次掃描完成編碼。累進(jìn)編碼。圖像編碼在多次掃描中完成。累進(jìn)編碼傳輸時(shí)間長(zhǎng),接受端收到的圖像是多次掃描由粗糙到清晰的累進(jìn)過(guò)程。無(wú)失真編碼??杀WC解碼后完全精確地恢復(fù)源圖像,其壓縮比低于有失真編碼。分層編碼。圖像在多個(gè)空間分辨率進(jìn)行編碼。當(dāng)信道傳輸速率慢,接收端顯示器分辯率也不高的情況下,只需做
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)加工印花合同范本
- 2025年中國(guó)新型動(dòng)力電池行業(yè)市場(chǎng)調(diào)研分析及投資戰(zhàn)略規(guī)劃報(bào)告
- 中國(guó)電網(wǎng)合同范例
- 刻字瓷像合同范本
- 買個(gè)合同范例
- 國(guó)開(kāi)電大《幼兒園課程論》形考任務(wù)三參考答案
- 出國(guó)勞務(wù)標(biāo)準(zhǔn)合同范本
- 青島市機(jī)動(dòng)車委托銷售合同范本
- 個(gè)人水果訂購(gòu)合同范本
- 免除責(zé)任合同范本
- 無(wú)效宣告請(qǐng)求書與意見(jiàn)陳述書代理實(shí)務(wù)全天版-案例一
- 電子線檢驗(yàn)標(biāo)準(zhǔn)
- 建筑施工安全員理論考核試題與答案
- 人教版七年級(jí)歷史下冊(cè)教學(xué)計(jì)劃(及進(jìn)度表)
- 建筑工程節(jié)后復(fù)工自查表
- 華萊士標(biāo)準(zhǔn)化體系
- 快捷smt全自動(dòng)物料倉(cāng)儲(chǔ)方案
- keysight眼圖和抖動(dòng)噪聲基礎(chǔ)知識(shí)與測(cè)量方法
- TPU材料項(xiàng)目可行性研究報(bào)告寫作參考范文
- 試用期考核合格證明表
- 鍋爐補(bǔ)給水陰陽(yáng)混床操作步序表
評(píng)論
0/150
提交評(píng)論