版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十一章圖像壓縮(yāsuō)編碼
Chapter11共六十二頁Contents信息論基礎(chǔ)圖像壓縮基本概念與模型統(tǒng)計(jì)(tǒngjì)編碼變換編碼預(yù)測(cè)編碼圖像壓縮編碼國際標(biāo)準(zhǔn)共六十二頁信息論基礎(chǔ)(jīchǔ)信息論基礎(chǔ):信息論是圖像編碼的基礎(chǔ)。信息論認(rèn)為(rènwéi)可以將信息的產(chǎn)生模擬成一個(gè)概率事件,可以用隨機(jī)過程描述信息論中的信源模型。信息熵:隨機(jī)變量的熵是描述隨機(jī)變量不確定度的統(tǒng)計(jì)量,設(shè)隨機(jī)變量X的概率密度函數(shù)為
,
,
,熵H(X)定義為,式中,
稱為自信息。通常在二元概率空間中規(guī)定等概率時(shí)的熵為單位熵,對(duì)數(shù)底為2時(shí),熵的單位為比特(bit);以e為底時(shí),熵的單位為奈特(nat);以10為底時(shí),熵的單位為哈特利(Hartley)。隨機(jī)變量X的熵函數(shù)H(X)具有如下的基本性質(zhì):
(非負(fù)性);H(X)是X的凹函數(shù)(凹性);當(dāng)隨機(jī)變量X服從均勻分布時(shí),其熵達(dá)到最大值,其中,
m為X可能取值的個(gè)數(shù)。共六十二頁信息論基礎(chǔ)(jīchǔ)相對(duì)熵:設(shè)隨機(jī)變量的概率分布
服從均勻分布,即所有取值的概率(gàilǜ)相等
,
,則有,
式中,
表示兩個(gè)概率分布
和
之間的相對(duì)熵,給出的是兩個(gè)隨機(jī)變量概率分布之間距離的度量。二元概率空間的熵函數(shù)共六十二頁信息論基礎(chǔ)(jīchǔ)香農(nóng)(Shannon)定理:關(guān)于隨機(jī)變X的信源編碼(biānmǎ)C是從X的取值空間
到
的一個(gè)映射,其中
表示D進(jìn)制碼元表
中有限長(zhǎng)度的符號(hào)序列所構(gòu)成的集合。設(shè)C表示x的碼字,
表示
的碼字
的長(zhǎng)度,信源編碼C的期望長(zhǎng)度L(C)定義為,若編碼將X的取值空間
中的每一個(gè)元素映射到不同的編碼序列,則稱這個(gè)編碼是非奇異的。非奇異碼可以保證了X取值的明確性,但只有在兩個(gè)碼字之間添加間斷碼,才能確保其可譯性。編碼C的擴(kuò)展C*是從
中有限長(zhǎng)度的符號(hào)序列到D進(jìn)制碼元表
中有限長(zhǎng)碼元序列的映射,。若一個(gè)編碼的擴(kuò)展編碼是非奇異的,則稱該編碼是惟一可譯碼。若碼中無任何碼字是其他碼字的前綴,則稱該編碼為前綴碼。香農(nóng)第一定理(最優(yōu)前綴碼定理):設(shè)
是關(guān)于信源概率分布
的D進(jìn)制編碼的一組最優(yōu)碼字長(zhǎng)度,L*為最優(yōu)碼的期望長(zhǎng)度(),則有
。最優(yōu)編碼就是使碼字長(zhǎng)度L(C)接近下界
。若L(C)遠(yuǎn)大于
,則效率過低;若,則必然丟失信息。
共六十二頁圖像壓縮基本概念與模型(móxíng)圖像壓縮基本概念與模型:圖像信息具有直觀、形象的優(yōu)點(diǎn),但數(shù)據(jù)量龐大。圖像壓縮的目的是消減圖像數(shù)據(jù)中的冗余信息,從而更加有效地傳輸和存儲(chǔ)圖像。圖像熵與編碼效率:將像素的灰度看作隨機(jī)變量(suíjībiànliànɡ)X,其概率分布率為
,
為灰度級(jí),k=0,1,…,L-1,L為灰度級(jí)數(shù)。根據(jù)信息論中熵的定義,圖像熵H(X)定義為,通常采用編碼效率和冗余度來度量圖像壓縮編碼方法的性能,編碼效率
定義為,;冗余度
與編碼效率
之間的關(guān)系為,。壓縮率通常用于度量圖像編碼的數(shù)據(jù)壓縮程度。設(shè)源圖像的比特?cái)?shù)為No,壓縮數(shù)據(jù)的比特?cái)?shù)為Nc,圖像編碼的壓縮率
定義為,。共六十二頁圖像壓縮基本概念與模型(móxíng)圖像信息的冗余:數(shù)字圖像的冗余包括空間(kōngjiān)冗余、時(shí)間冗余、信息熵冗余、結(jié)構(gòu)冗余和心理視覺冗余等??臻g冗余和時(shí)間冗余統(tǒng)稱為統(tǒng)計(jì)冗余。空間冗余是指,由于同一物體上各采樣點(diǎn)的顏色之間通常在空間上是均勻的、連續(xù)的,因此大量相鄰像素的數(shù)值是相同或相近的,存在著空間連貫性。時(shí)間冗余是指序列圖像中的相鄰幀之間的相關(guān)性所引起的數(shù)據(jù)冗余。信息熵冗余是從編碼技術(shù)的角度在圖像編碼時(shí)由于編碼效率不高所引起的數(shù)據(jù)冗余,也稱為編碼冗余。結(jié)構(gòu)冗余是指圖像中存在重復(fù)出現(xiàn)的相同或相似的紋理結(jié)構(gòu)。人類視覺系統(tǒng)對(duì)圖像的敏感性是非均勻和非線性的,在正常的視覺處理過程中,各種信息的相對(duì)重要程度不同,由此就產(chǎn)生了心理視覺冗余,包括:(1)人眼對(duì)亮度變化敏感,而對(duì)色度變化相對(duì)不敏感;(2)人眼的辨別能力與物體周圍的背景亮度成反比;(3)人眼對(duì)圖像中灰度發(fā)生急劇變化的邊緣區(qū)域敏感,而對(duì)非邊緣區(qū)域相對(duì)不敏感;(4)人眼對(duì)整體結(jié)構(gòu)敏感,而對(duì)局部細(xì)節(jié)相對(duì)不敏感
;(5)大多數(shù)情況下灰度圖像采用8位表示、共28種灰度,彩色圖像采用24位表示、共224種顏色,而人眼至多可以辨認(rèn)出26級(jí)灰度和216種顏色。共六十二頁圖像壓縮基本概念與模型(móxíng)保真度準(zhǔn)則:保真度是指圖像壓縮系統(tǒng)編解碼器的輸出信號(hào)再現(xiàn)輸入信號(hào)的相似程度,分主觀與客觀兩方面。主觀保真度準(zhǔn)則:取決于人類的視覺感受,采用由人來評(píng)價(jià)的主觀方法。通過向觀察者呈現(xiàn)重構(gòu)圖像,然后將觀察者的評(píng)分進(jìn)行平均,以此(yǐcǐ)作為圖像質(zhì)量的主觀評(píng)價(jià)。人是圖像和視頻的最終觀察者,因此主觀評(píng)價(jià)是最直接、最可靠的方法;其問題是需多次重復(fù)實(shí)驗(yàn),耗時(shí)費(fèi)力,易受觀察者個(gè)人因素的影響,且無法將主觀評(píng)價(jià)方法嵌入到應(yīng)用系統(tǒng)中。值等級(jí)描述1極好圖像質(zhì)量極高2好圖像質(zhì)量高,感覺良好,干擾可以接受3過得去圖像質(zhì)量可以接受,干擾不是不可接受4勉強(qiáng)可以圖像質(zhì)量較低,希望能加以改善,在某種程度上難以接受干擾5差圖像質(zhì)量很差,尚能觀看,具有明顯不可接受的干擾6不可用圖像質(zhì)量非常差,無法觀看電視圖像的絕對(duì)等級(jí)量表共六十二頁圖像壓縮基本概念與模型(móxíng)客觀保真度準(zhǔn)則:以壓縮編碼前后圖像的誤差來度量(dùliàng)的,采用由算法評(píng)價(jià)的客觀方法。源圖像與重構(gòu)圖像間的誤差可表為,設(shè)源圖像
和重構(gòu)圖像
的尺寸為M×N,
均方誤差MSE定義為圖像總體平方誤差的平均值,可表示為,若將源圖像與重構(gòu)圖像之間的誤差看作是噪聲,則重構(gòu)圖像
可表示為,
,信噪比SNR定義為圖像信號(hào)功率與噪聲功率
之比,可表示為,由于大多數(shù)信號(hào)具有很寬的動(dòng)態(tài)范圍,通常以對(duì)數(shù)尺度來表示信噪比,單位為分貝。在這種情況下,信噪比SNRdB的定義為,共六十二頁圖像壓縮基本概念與模型(móxíng)圖像壓縮系統(tǒng):圖像壓縮系統(tǒng)是由編碼(biānmǎ)器和解碼器兩個(gè)部分組成。編碼(biānmǎ)器是對(duì)源數(shù)據(jù)經(jīng)過編碼(biānmǎ)進(jìn)行壓縮,由信源編碼(biānmǎ)器和信道編碼(biānmǎ)器組成;解碼器是對(duì)編碼(biānmǎ)生成的壓縮數(shù)據(jù)進(jìn)行解壓縮,由與編碼(biānmǎ)器相對(duì)應(yīng)的信道解碼器和信源解碼器組成。信源編碼器和信源解碼器:信源編碼器用于減少或消除輸入信號(hào)的數(shù)據(jù)冗余,包含了映射器、量化器和符號(hào)編碼器3個(gè)級(jí)聯(lián)的操作;信道編碼器用于增強(qiáng)信源編碼器輸出符號(hào)的抗噪能力。信道編碼器和信道解碼器:當(dāng)信道中含有噪聲或容易產(chǎn)生誤差時(shí),信道編碼通過將可控制的冗余加入信源編碼的碼字以減少信道噪聲的影響,提高信息傳輸時(shí)的抗干擾能力。信源編碼器信源解碼器圖像壓縮系統(tǒng)共六十二頁統(tǒng)計(jì)(tǒngjì)編碼統(tǒng)計(jì)編碼:統(tǒng)計(jì)編碼是利用數(shù)據(jù)的統(tǒng)計(jì)冗余進(jìn)行的可變碼字長(zhǎng)度編碼,也稱為熵編碼。由源符號(hào)映射到可變長(zhǎng)度的碼字稱為可變碼字長(zhǎng)度編碼,如赫夫曼編碼。當(dāng)待編碼的符號(hào)集合較大時(shí),為了降低編解碼器的復(fù)雜度,采用準(zhǔn)變長(zhǎng)編碼,如香農(nóng)-費(fèi)諾編碼。
對(duì)于信源符號(hào)的D進(jìn)制前綴碼,設(shè)
是關(guān)于信源概率分布p的一組最優(yōu)碼長(zhǎng),碼長(zhǎng)為
的編碼稱為香農(nóng)碼,步驟如下:統(tǒng)計(jì)每一個(gè)(yīɡè)信源符號(hào)出現(xiàn)的概率,將信源符號(hào)按其概率以遞減的順序排列,即:計(jì)算各個(gè)概率對(duì)應(yīng)的碼字長(zhǎng)度:計(jì)算累積概率:將累積概率
由十進(jìn)制小數(shù)轉(zhuǎn)換成二進(jìn)制小數(shù);截取二進(jìn)制小數(shù)點(diǎn)后的前
位作為對(duì)應(yīng)信源符號(hào)的碼字。信源符號(hào)
概率
碼長(zhǎng)
累積概率
的二進(jìn)制表示碼字x30.4375200.0000000000x50.250020.43750.0111000001x40.187530.68750.10110000101x20.062540.8750.111000001110x10.062540.93750.111100001111香農(nóng)-費(fèi)諾編碼的過程共六十二頁統(tǒng)計(jì)(tǒngjì)編碼費(fèi)諾提出了一種構(gòu)造信源編碼的次優(yōu)方法—二分法香農(nóng)-費(fèi)諾編碼方法,期望碼字長(zhǎng)度可以達(dá)到
,具體編碼步驟(bùzhòu)如下:統(tǒng)計(jì)每一個(gè)信源符號(hào)出現(xiàn)的概率,將信源符號(hào)按其概率以遞減順序排列,,選取k使得
最??;從位置k將信源符號(hào)集合劃分為概率總和相等或近似相等的兩個(gè)子集,對(duì)概率較大的子集中的符號(hào),加入0,對(duì)于概率較小的,加入1編碼;對(duì)每一個(gè)劃分出來的子集合重復(fù)2,直至子集中只剩余單個(gè)信源符號(hào);依次連接每一個(gè)信源符號(hào)所屬子集的二進(jìn)制編碼,組成所對(duì)應(yīng)的碼字?;叶戎?/p>
xix3x5x4x2x1概率
pi
0.43750.25000.18750.06250.0625第1次編碼01第2次編碼01第3次編碼01第4次編碼01信源符號(hào)
概率
碼長(zhǎng)
碼字x30.43710x50.250021x40.18753110x20.062541110x10.062541111二分法香農(nóng)-費(fèi)諾編碼的過程共六十二頁統(tǒng)計(jì)(tǒngjì)編碼赫夫曼編碼方法:赫夫曼樹是一種帶權(quán)路徑長(zhǎng)度最短的二叉樹,也稱為最優(yōu)二叉樹。設(shè)根節(jié)點(diǎn)為0層,
為m個(gè)葉節(jié)點(diǎn)
對(duì)應(yīng)的權(quán)值,從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的路徑長(zhǎng)度為葉節(jié)點(diǎn)的層數(shù),則樹的帶權(quán)路徑長(zhǎng)度
的計(jì)算(jìsuàn)式為,赫夫曼編碼包括構(gòu)造赫夫曼樹和分配碼字兩步驟。構(gòu)造赫夫曼樹步驟如下:統(tǒng)計(jì)每一個(gè)信源符號(hào)出現(xiàn)的概率,并按其概率以遞減的順序排列;將最小概率的兩個(gè)符號(hào)合并成為一個(gè)節(jié)點(diǎn),并將它們的概率之和作為該節(jié)點(diǎn)的概率,參與下一次的排序;按概率遞減順序重新排列新的節(jié)點(diǎn),并重復(fù)2直至合并為一個(gè)總根節(jié)點(diǎn)。分配碼字步驟如下:對(duì)于每一個(gè)節(jié)點(diǎn)的分支,對(duì)概率大的符號(hào)0,對(duì)概率小的符號(hào)加入1編碼,從根節(jié)點(diǎn)到葉節(jié)點(diǎn)路徑分支上分配的編碼依次連接組成所對(duì)應(yīng)信源符號(hào)的碼字。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼赫夫曼樹構(gòu)造(gòuzào)和碼字分配過程赫夫曼編碼的碼字信源符號(hào)
概率
碼長(zhǎng)
碼字
x10.32200x40.22210x50.1811x60.163000x20.0840000x30.0440001共六十二頁統(tǒng)計(jì)(tǒngjì)編碼有關(guān)赫夫曼編碼的評(píng)論:赫夫曼編碼的實(shí)現(xiàn)問題:赫夫曼編碼在實(shí)際中存在的以下若干問題:1)當(dāng)硬件實(shí)現(xiàn)時(shí),概率值的最小存儲(chǔ)單元為1bit,不能精確到小數(shù)后多位,這樣會(huì)引起概率匹配不準(zhǔn)確以及編碼效率的下降;2)由于碼字長(zhǎng)度可變,因此(yīncǐ)赫夫曼編碼與解碼過程耗時(shí);3)一幅灰度圖像一般達(dá)到256個(gè)灰度級(jí),當(dāng)對(duì)整幅圖像直接進(jìn)行赫夫曼編碼時(shí),就會(huì)產(chǎn)生很多不同的碼字,且小概率分布的灰度值可能有很長(zhǎng)的編碼,這樣不僅達(dá)不到數(shù)據(jù)壓縮的目的反而會(huì)使數(shù)據(jù)量和復(fù)雜度增大。赫夫曼編碼與香農(nóng)碼:對(duì)于某個(gè)特定的符號(hào),使用碼字長(zhǎng)度為
的香農(nóng)碼,可能比最優(yōu)碼更差。例如,考慮兩個(gè)符號(hào),其中一個(gè)符號(hào)發(fā)生的概率為0.9999,而另一個(gè)為0.0001。若使用香農(nóng)碼,則它們的碼字長(zhǎng)度分別為1bit和14bit。然而,這兩個(gè)符號(hào)的赫夫曼編碼的最優(yōu)碼長(zhǎng)都是1bit。因而,在香農(nóng)編碼中,不經(jīng)常發(fā)生的符號(hào)的碼字長(zhǎng)度一般比最優(yōu)碼的碼字更長(zhǎng)。對(duì)于單個(gè)符號(hào)來說,不論是香農(nóng)碼還是赫夫曼碼都可能有更短的碼字長(zhǎng)度,但從平均意義上講,赫夫曼編碼具有更短的期望碼字長(zhǎng)度。另外,從期望碼字長(zhǎng)度衡量,香農(nóng)碼和赫夫曼碼的差別不超過1bit,兩者的期望碼字長(zhǎng)度均在
H(X)與H(X)+1之間。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼算術(shù)編碼:算術(shù)編碼將信源序列用0與1之間的小數(shù)進(jìn)行編碼,可以用分?jǐn)?shù)比特來表示單個(gè)信源符號(hào)。當(dāng)信源序列的長(zhǎng)度增加時(shí),表示信源序列的編碼區(qū)間減小,信源序列表示該編碼區(qū)間所需的位數(shù)就會(huì)增加。具體來講,赫夫曼編碼每一次對(duì)一個(gè)符號(hào)進(jìn)行編碼,將單個(gè)信源符號(hào)映射成一個(gè)整數(shù)位的碼字,而算術(shù)編碼將信源符號(hào)的整個(gè)序列映射成一個(gè)單獨(dú)的浮點(diǎn)數(shù),給整個(gè)符號(hào)序列分配一個(gè)單一的碼字。在算術(shù)編碼中,根據(jù)信源中的每一個(gè)符號(hào)的概率來細(xì)分編碼區(qū)間,每輸入一個(gè)符號(hào),將編碼區(qū)間縮小(suōxiǎo)至當(dāng)前輸入符號(hào)的間隔。根據(jù)輸入信源符號(hào)的概率減小編碼區(qū)間[0,1),信源符號(hào)的概率愈大對(duì)應(yīng)于間隔愈寬,需要使用較短的碼字表示;信源符號(hào)的概率愈小對(duì)應(yīng)于間隔愈窄,需要用較長(zhǎng)的碼字表示。設(shè)一個(gè)離散無記憶信源X的符號(hào)集合為
,信源符號(hào)及其概率分布如表所示,信源的熵為1.5219bit。在算術(shù)編碼的開始,編碼區(qū)間為整個(gè)半開區(qū)間[0,1),初始時(shí)根據(jù)每一個(gè)信源符號(hào)的概率將其劃分成3個(gè)間隔,符號(hào)x1對(duì)應(yīng)于間隔[0,0.4),符號(hào)x2對(duì)應(yīng)于間隔[0.4,0.6),符號(hào)x3對(duì)應(yīng)于間隔[0.6,1)。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼算術(shù)編碼(biānmǎ)的過程算術(shù)編碼過程的步驟描述步驟輸入符號(hào)編碼判別編碼區(qū)間1x2符號(hào)x2的初始間隔為
[0.4,0.6)[0.4,0.6)2x1編碼區(qū)間[0.4,0.6)中符號(hào)x1的間隔為[0.4,0.48)
[0.4,0.48)
3x1編碼區(qū)間[0.4,0.48)中符號(hào)x1的間隔為[0.4,0.432)
[0.4,0.432)4x3編碼區(qū)間[0.4,0.432)中符號(hào)x3的間隔為[0.4192,0.432)[0.4192,0.432)5x3編碼區(qū)間[0.4192,0.432)中符號(hào)x3的間隔為[0.42688,0.432)
[0.42688,0.432)
共六十二頁統(tǒng)計(jì)(tǒngjì)編碼行程編碼:行程編碼是一種無損數(shù)據(jù)壓縮(shùjùyāsuō)的熵編碼方法,也稱為行程長(zhǎng)度編碼。其基本原理是,將連續(xù)的符號(hào)序列用該序列的長(zhǎng)度和單個(gè)符號(hào)來表示,連續(xù)的符號(hào)序列稱為行程,符號(hào)序列的長(zhǎng)度稱為行程長(zhǎng)度。例如,行程編碼將符號(hào)序列aabbbbccddddd表示為2a4b2c5d。行程編碼是一種針對(duì)二值圖像的有效編碼方法,對(duì)連續(xù)的黑色和白色像素?cái)?shù)(行程)進(jìn)行編碼。由于傳真文檔主要是二值文檔,行程編碼已成為傳真文檔壓縮編碼的標(biāo)準(zhǔn)方法。PCX圖像文件是最早支持彩色圖像的文件格式,最高可以支持256種彩色。此外,為了達(dá)到更高的壓縮率,一般不單獨(dú)使用行程編碼,而是與其他編碼方法結(jié)合使用。例如,在JPEG靜止圖像壓縮編碼標(biāo)準(zhǔn)中,綜合使用了變換編碼、預(yù)測(cè)編碼、行程編碼和熵編碼等編碼方法。共六十二頁變換編碼變換編碼:是將在空域描述的圖像信號(hào)轉(zhuǎn)換到變換域進(jìn)行描述,然后再根據(jù)圖像信號(hào)在變換域中系數(shù)的特點(diǎn)和人類視覺特性進(jìn)行編碼。變換編碼的原理:變換編碼將圖像像素矩陣經(jīng)過某種形式的正交變換轉(zhuǎn)換成一組變換系數(shù),然后對(duì)這些變換系數(shù)進(jìn)行量化和編碼。一般而言,正交變換后,大量變換系數(shù)都有較小的幅度,根據(jù)人類視覺特性對(duì)各個(gè)變換系數(shù)進(jìn)行不同精度的量化,在保證一定圖像質(zhì)量的前提下,通過粗量化或完全(wánquán)拋棄較小的系數(shù)而幾乎不會(huì)發(fā)生視覺可察覺的圖像失真。這樣,能夠用少量的變換系數(shù)來表示圖像的大量信息,從而達(dá)到數(shù)據(jù)壓縮的目的。塊變換編碼是以圖像塊為基本單元的變換編碼技術(shù),塊變換編碼依次執(zhí)行4個(gè)操作:圖像塊分解、正變換、量化器和符號(hào)編碼器。解碼器反序地執(zhí)行3個(gè)操作:符號(hào)解碼器、逆變換和圖像塊合并。編碼器解碼器共六十二頁統(tǒng)計(jì)(tǒngjì)編碼正交變換:正交變換是一維信號(hào)處理方法在二維空間的擴(kuò)展,它能夠?qū)D像的大部分能量集中到相對(duì)少數(shù)幾個(gè)系數(shù)上,因此,可有效地消除像素之間的空間相關(guān)性。尺寸為M×N的數(shù)字圖像
,它與其正向離散變換
的關(guān)系為,
式中,
和
分別稱為正變換和逆變換的核函數(shù)或基函數(shù)。若變換的基函數(shù)為可分離的,則滿足。具有(jùyǒu)可分離基函數(shù)的二維變換可以分解為相應(yīng)的一維行(列)變換來計(jì)算。正變換和逆變換的基函數(shù)
決定了變換類型和總體計(jì)算的復(fù)雜性,傅里葉正變換的基函數(shù)以及傅里葉逆變換的基函數(shù)為,共六十二頁統(tǒng)計(jì)(tǒngjì)編碼離散余弦變換:離散余弦變換廣泛應(yīng)用于信號(hào)(xìnhào)和圖像的有損數(shù)據(jù)壓縮,二維離散余弦變換是一種圖像壓縮編碼領(lǐng)域中最常用的正交變換。一維離散余弦變換:離散余弦變換是一種與傅里葉變換有著內(nèi)在聯(lián)系的變換,離散余弦變換相當(dāng)于是對(duì)一個(gè)實(shí)偶函數(shù)進(jìn)行離散傅里葉變換。一維離散函數(shù)
,的離散余弦變換及其逆變換定義為:其中,一維離散余弦變換的基函數(shù)共六十二頁統(tǒng)計(jì)(tǒngjì)編碼二維離散余弦變換:對(duì)于尺寸為M×N的數(shù)字圖像
,二維離散余弦變換及其逆變換定義(dìngyì)為,其中,如同二維離散傅立葉變換,二維離散余弦變換也是作用于整幅圖像的變換,每一個(gè)
包含了所有
值。由于整幅圖像的離散余弦變換需要對(duì)全部像素進(jìn)行計(jì)算,復(fù)雜度過高,因此,在實(shí)際的圖像編碼過程中,通常將整幅圖像劃分為8×8的圖像塊,以圖像塊為單元進(jìn)行二維離散余弦變換,獲得8×8的變換系數(shù)矩陣,再將變換系數(shù)量化后進(jìn)行熵編碼。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼vuM=8、N=8時(shí)二維離散余弦(yúxián)變換的基圖像共六十二頁二維離散余弦(yúxián)變換(a)灰度圖像(túxiànɡ)
(b)對(duì)數(shù)DCT譜統(tǒng)計(jì)編碼共六十二頁統(tǒng)計(jì)(tǒngjì)編碼偽彩色表示的對(duì)數(shù)DCT譜,左上角紅色方框標(biāo)出1/16、1/9和1/4的低頻(dīpín)成分區(qū)域共六十二頁(a)保留左上角1/16區(qū)域(qūyù)
(b)保留左上角1/9區(qū)域(c)保留左上角1/4區(qū)域(d)保留數(shù)值大于10的低頻DCT系數(shù)的低頻DCT系數(shù)的低頻DCT系數(shù)的DCT系數(shù)經(jīng)過DCT系數(shù)(xìshù)壓縮的重構(gòu)圖像及其誤差圖像統(tǒng)計(jì)編碼共六十二頁統(tǒng)計(jì)(tǒngjì)編碼DCT的矩陣形式:離散余弦變換是一種線性變換,一維序列
的離散余弦變換可用矩陣向量形式表示為,。其中,
為離散余弦變換矩陣,可表示為,一維離散余弦逆變換的矩陣向量形式可寫為:二維離散余弦變換具有(jùyǒu)行列可分離性,二維序列
的離散余弦變換及其逆變換的矩陣向量形式可寫為,式中,C1和C2分別為M×M維和N×N維離散余弦變換矩陣。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼DCT和DFT的比較:與離散傅里葉變換相比,離散余弦變換能夠使分塊處理造成的塊效應(yīng)更弱。塊效應(yīng)是由圖像塊的邊界像素在拼接(pīnjiē)處構(gòu)成間斷造成的。離散傅里葉變換固有的N點(diǎn)周期性造成具有高頻特性的邊界間斷。當(dāng)對(duì)DFT系數(shù)進(jìn)行截?cái)嗷蛄炕瘯r(shí),邊界點(diǎn)出現(xiàn)不正確的值,在圖像中表現(xiàn)為明顯的塊效應(yīng)。離散余弦變換固有的2N點(diǎn)周期不會(huì)產(chǎn)生固有的邊界間斷,因此,在很大程度上減少了這種塊效應(yīng)。DFTDCT一維DFT和DCT的固有周期圖釋共六十二頁
(b)DCT系數(shù)(xìshù)
(d)DFT系數(shù)的幅度
(a)斜坡(xiépō)信號(hào)(c)DCT重構(gòu)信號(hào)(e)DFT重構(gòu)信號(hào)斜坡信號(hào)的DFT和DCT表示統(tǒng)計(jì)編碼共六十二頁預(yù)測(cè)(yùcè)編碼預(yù)測(cè)編碼:是一種利用采樣信號(hào)之間存在的時(shí)間(shíjiān)和空間冗余來進(jìn)行數(shù)據(jù)壓縮的編碼技術(shù)。無損預(yù)測(cè)編碼:由于相鄰像素之間具有較強(qiáng)的相關(guān)性,可以利用前面的像素值預(yù)測(cè)當(dāng)前的像素值。由于預(yù)測(cè)誤差的熵小于像素值的熵,對(duì)預(yù)測(cè)誤差進(jìn)行編碼所需的比特?cái)?shù)少于直接對(duì)像素值編碼的比特?cái)?shù),從而能夠?qū)崿F(xiàn)更高的數(shù)據(jù)壓縮率。預(yù)測(cè)器的輸出經(jīng)過四舍五入到最接近的整數(shù)
,實(shí)際值
和預(yù)測(cè)值
之差為預(yù)測(cè)誤差,即,。符號(hào)編碼器通常采用變長(zhǎng)編碼方法對(duì)預(yù)測(cè)誤差進(jìn)行熵編碼,從而生成壓縮碼流。符號(hào)解碼器根據(jù)接收到的變長(zhǎng)碼字解碼出預(yù)測(cè)誤差
,并通過反運(yùn)算重構(gòu)源像素,即,。無損預(yù)測(cè)編解碼器系統(tǒng)框圖共六十二頁預(yù)測(cè)(yùcè)編碼從已知的
來預(yù)測(cè),可以較準(zhǔn)確地估計(jì)出
,即估計(jì)值近似等于,。其中,
為預(yù)測(cè)函數(shù)。最常用(chánɡyònɡ)的是線性預(yù)測(cè)編碼,根據(jù)前m個(gè)像素的線性組合預(yù)測(cè)當(dāng)前像素,可表示為,對(duì)于二維函數(shù)數(shù)字圖像,有,源圖像預(yù)測(cè)誤差圖像灰度直方圖預(yù)測(cè)誤差直方圖共六十二頁預(yù)測(cè)(yùcè)編碼有損預(yù)測(cè)編碼:有損預(yù)測(cè)編碼的基礎(chǔ)是以損失圖像重構(gòu)的準(zhǔn)確度為代價(jià)來換取壓縮率的提高。與無損預(yù)測(cè)編碼器不同的是,有損預(yù)測(cè)編碼器是在預(yù)測(cè)誤差與符號(hào)(fúhào)編碼器之間增加了一個(gè)量化器,對(duì)預(yù)測(cè)誤差進(jìn)行量化。設(shè)
表示量化后的預(yù)測(cè)誤差,有損預(yù)測(cè)編碼器的預(yù)測(cè)器是在反饋環(huán)中,輸入
由預(yù)測(cè)值
與相應(yīng)的預(yù)測(cè)誤差量化值
相加產(chǎn)生,即,編碼器解碼器共六十二頁統(tǒng)計(jì)(tǒngjì)編碼有損預(yù)測(cè)編碼具體(jùtǐ)由如下5個(gè)步驟組成:預(yù)測(cè)器帶有存儲(chǔ)器,對(duì)前m個(gè)像素的輸出值
進(jìn)行存儲(chǔ),根據(jù)式
對(duì)當(dāng)前輸入
進(jìn)行預(yù)測(cè),產(chǎn)生預(yù)測(cè)值
;計(jì)算當(dāng)前輸入像素
與預(yù)測(cè)值
之差,產(chǎn)生預(yù)測(cè)誤差
;對(duì)預(yù)測(cè)誤差
進(jìn)行量化,符號(hào)編碼器對(duì)預(yù)測(cè)誤差的量化值
進(jìn)行編碼形成碼字發(fā)送;根據(jù)式
,解碼端將
與
相加重構(gòu)輸出信號(hào)
,由于量化引入了失真,根據(jù)式
,計(jì)算重構(gòu)誤差
;繼續(xù)輸入下一個(gè)像素
,重復(fù)上述過程。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼增量調(diào)制:增量調(diào)制或增量脈碼調(diào)制系統(tǒng)只保留每一個(gè)采樣信號(hào)與其(yǔqí)預(yù)測(cè)值之差的符號(hào),并采用一位二進(jìn)制數(shù)編碼的差分脈沖編碼調(diào)制。這是一種簡(jiǎn)單的有損預(yù)測(cè)編碼形式,其預(yù)測(cè)函數(shù)定義及量化器定義如下,式中,是通常小于1的預(yù)測(cè)系數(shù),
是正常量。,設(shè)輸入采樣信號(hào)為,解碼器輸出的重構(gòu)信號(hào)為,DM量化和編碼示意圖DM編碼示例共六十二頁統(tǒng)計(jì)(tǒngjì)編碼最優(yōu)線性預(yù)測(cè):在預(yù)測(cè)編碼中,設(shè)計(jì)最優(yōu)線性預(yù)測(cè)器最重要的是選擇合適的預(yù)測(cè)器階數(shù)m以及
個(gè)預(yù)測(cè)系數(shù)
,使得預(yù)測(cè)器達(dá)到最優(yōu)預(yù)測(cè)效果。最優(yōu)線性預(yù)測(cè)器的設(shè)計(jì)分為兩個(gè)部分:預(yù)測(cè)器階數(shù)的確定:由圖像的統(tǒng)計(jì)特性可知,一幅圖像中像素之間的相關(guān)系數(shù)在較小的范圍內(nèi)可以用指數(shù)衰減型曲線近似。當(dāng)像素的距離增大時(shí),其相關(guān)性急劇減弱,因此,預(yù)測(cè)器的階數(shù)無需取值過大。實(shí)驗(yàn)(shíyàn)表明,對(duì)于大多數(shù)圖像,階數(shù)
的取值一般為3。預(yù)測(cè)系數(shù)的確定:將最優(yōu)預(yù)測(cè)器的預(yù)測(cè)系數(shù)選取問題轉(zhuǎn)換為關(guān)于一組預(yù)測(cè)系數(shù)的均方預(yù)測(cè)誤差最小化問題。根據(jù)二次凸優(yōu)化問題的一階KKT條件,滿足
使均方誤差最小化,即,將上式用法方程組的形式可表示為:通過解上式表示的線性方程組,求解出m個(gè)最優(yōu)預(yù)測(cè)系數(shù)
,使得均方預(yù)測(cè)誤差
達(dá)到最小值。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼自適應(yīng)預(yù)測(cè)(yùcè)編碼
:差分脈沖編碼調(diào)制系統(tǒng)的預(yù)測(cè)器采用固定的預(yù)測(cè)系數(shù)和量化器參數(shù),然而實(shí)際上圖像和視頻的局部時(shí)空特性是變化的,因此,采用固定參數(shù)達(dá)不到好的性能。自適應(yīng)預(yù)測(cè)編碼根據(jù)圖像和視頻的局部統(tǒng)計(jì)特征,自適應(yīng)地調(diào)整預(yù)測(cè)器的預(yù)測(cè)系數(shù)和量化器參數(shù),進(jìn)一步改善量化性能和提高壓縮率。自適應(yīng)DPCM系統(tǒng)包含自適應(yīng)量化和自適應(yīng)預(yù)測(cè)兩個(gè)部分。為了在一定的量化級(jí)下減小量化誤差或在同等的誤差條件下增大壓縮率,自適應(yīng)量化根據(jù)信號(hào)隨時(shí)間變化不均勻的特點(diǎn),自適應(yīng)地改變量化階大小。使用較小的量化階編碼較小的差值,使用較大的量化階編碼較大的差值。自適應(yīng)預(yù)測(cè)依據(jù)信源特征,自適應(yīng)地選擇最優(yōu)預(yù)測(cè)系數(shù)。共六十二頁統(tǒng)計(jì)(tǒngjì)編碼幀間預(yù)測(cè)編碼:視頻幀同時(shí)具有空間相關(guān)性和時(shí)間相關(guān)性。幀間預(yù)測(cè)編碼是利用視頻幀間的相關(guān)性,來實(shí)現(xiàn)視頻圖像的壓縮。運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè):運(yùn)動(dòng)圖像是由時(shí)間上以幀周期為間隔的連續(xù)圖像構(gòu)成的時(shí)間序列圖像,相鄰幀間只有微小的細(xì)節(jié)(xìjié)變化,因此,運(yùn)動(dòng)圖像在時(shí)間上比在空間上具有更強(qiáng)的相關(guān)性。運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼分為3個(gè)步驟:1)將圖像分解為相對(duì)靜止的背景區(qū)域和若干運(yùn)動(dòng)物體區(qū)域,通過運(yùn)動(dòng)估計(jì)獲得各個(gè)運(yùn)動(dòng)物體的運(yùn)動(dòng)向量;2)根據(jù)運(yùn)動(dòng)向量計(jì)算運(yùn)動(dòng)補(bǔ)償參考幀,作為當(dāng)前幀的預(yù)測(cè)值;3)對(duì)預(yù)測(cè)誤差進(jìn)行量化、編碼和傳輸,同時(shí)將運(yùn)動(dòng)向量和分解方式等信息發(fā)至接收端。DPCM/DCT視頻編解碼器的簡(jiǎn)化系統(tǒng)框圖共六十二頁統(tǒng)計(jì)(tǒngjì)編碼塊匹配法:塊匹配法將圖像劃分為圖像塊,并假設(shè)圖像塊中的各個(gè)像素具有相同的運(yùn)動(dòng),且只做平移運(yùn)動(dòng)。由于相鄰幀之間的相關(guān)性很強(qiáng),圖像塊可以在前向幀和后向幀中對(duì)應(yīng)相近的位置找到相似的區(qū)域,因此,匹配搜索一般僅限制在一個(gè)有限范圍內(nèi)進(jìn)行,稱之為搜索窗口。塊匹配法將當(dāng)前幀第k幀劃分為圖像塊,對(duì)于每一個(gè)圖像塊,在前向幀第k-△k幀中的搜索窗口內(nèi)搜索最優(yōu)匹配塊,兩對(duì)應(yīng)圖像塊的相對(duì)位移(△x,△y)就是該圖像塊的運(yùn)動(dòng)向量。判別兩個(gè)圖像塊相似程度的準(zhǔn)則,有最小均方誤差函數(shù)、最小平均絕對(duì)值差函數(shù)和最小絕對(duì)差分和函數(shù)等。作為固定搜索模式(móshì),有二維對(duì)數(shù)搜索、三步搜索、叉形搜索、四步搜索、梯度下降搜索、菱形搜索、六邊形搜索、十字形菱形搜索等。參考幀當(dāng)前幀共六十二頁預(yù)測(cè)(yùcè)編碼誤差曲面僅有一個(gè)(yīɡè)局部極小點(diǎn)誤差曲面有多個(gè)局部極小點(diǎn)固定搜索模式問題:當(dāng)搜索模式的大小與序列中實(shí)際運(yùn)動(dòng)的程度不匹配時(shí),就會(huì)出現(xiàn)過搜索和欠搜索;另一方面,運(yùn)動(dòng)較大序列(例如,全局運(yùn)動(dòng))的運(yùn)動(dòng)向量靠近中心分布的假設(shè)不成立,因此,當(dāng)搜索這樣的序列時(shí),搜索步長(zhǎng)太小會(huì)導(dǎo)致搜索路徑過長(zhǎng);此外,如果它的誤差曲面并非單峰,搜索甚至陷入誤差曲面上的局部極小點(diǎn),導(dǎo)致匹配誤差偏大。共六十二頁預(yù)測(cè)(yùcè)編碼三步搜索算法:該算法從搜索窗口的原點(diǎn)(0,0)開始,以最大搜索長(zhǎng)度的一半為步長(zhǎng),計(jì)算中心點(diǎn)及其周圍8個(gè)鄰點(diǎn)的塊匹配誤差,找到最小塊匹配誤差點(diǎn);下一步以該點(diǎn)為中心,步長(zhǎng)減半,在縮小的方形上的9個(gè)點(diǎn)中找最小塊匹配誤差點(diǎn),直到搜索步長(zhǎng)減為1。若搜索窗口的最大步長(zhǎng)為7,則該算法以4、2、1為步長(zhǎng),三步完成搜索,因此稱為三步搜索算法。新三步搜索算法:三步搜索算法步長(zhǎng)較大,對(duì)于運(yùn)動(dòng)較小的序列,易陷入局部極小點(diǎn)。由于運(yùn)動(dòng)向量的分布(fēnbù)具有靠近中心的特性,因此,新三步搜索算法在上述第一步中加入了以搜索窗口原點(diǎn)為中心的8個(gè)鄰點(diǎn)參與比較。三步搜索算法新三步搜索算法Tennis序列中9幀圖像的運(yùn)動(dòng)向量分布共六十二頁預(yù)測(cè)(yùcè)編碼四步搜索算法:針對(duì)三步搜索算法第一步的搜索步長(zhǎng)過大提出的改進(jìn)。第一步與三步搜索相同,但步長(zhǎng)為2,若最小塊匹配誤差點(diǎn)落在了方形中心或到達(dá)搜索窗口邊界,則步長(zhǎng)減為1,比較3×3方形上的9個(gè)點(diǎn),獲得(huòdé)最優(yōu)匹配點(diǎn);否則,以該最小塊匹配誤差點(diǎn)作為新的中心繼續(xù),步長(zhǎng)不變。梯度下降搜索算法:梯度下降搜索算法完全基于誤差場(chǎng)單調(diào)分布的假設(shè)。首先將3×3方形的中心放在搜索窗口的原點(diǎn),計(jì)算其上9個(gè)點(diǎn)的塊匹配誤差。若最小塊匹配誤差點(diǎn)落在方形的中心或到達(dá)搜索窗口邊界,則算法終止;否則,以該點(diǎn)作為新的中心點(diǎn),繼續(xù)搜索新形成的3×3方形。該算法總是沿著塊匹配誤差最速下降的方向搜索,因此稱之為梯度下降搜索。四步搜索算法搜索運(yùn)動(dòng)向量例梯度下降搜索算法搜索運(yùn)動(dòng)向量例共六十二頁統(tǒng)計(jì)(tǒngjì)編碼菱形搜索算法:菱形搜索算法有兩種搜索模式,分別為大菱形搜索模式(LDSP)和小菱形搜索模式(SDSP)。算法(suànfǎ)搜索過程如下:將LDSP中心放在搜索窗口的原點(diǎn),比較LDSP上的9個(gè)點(diǎn)的塊匹配誤差。若LDSP中心點(diǎn)的塊匹配誤差最小,則轉(zhuǎn)向第3步,否則,轉(zhuǎn)向第2步。以上一步中的最小塊匹配誤差點(diǎn)為中心形成新的LDSP,每一次僅需再計(jì)算3個(gè)或5個(gè)點(diǎn)的塊匹配誤差。若LDSP中心的塊匹配誤差最小,則轉(zhuǎn)向第3步,否則,重復(fù)執(zhí)行第2步。將LDSP切換為SDSP,5個(gè)點(diǎn)中的最小塊匹配誤差點(diǎn)指向最優(yōu)匹配塊。LDSPSDSP菱形搜索算法搜索運(yùn)動(dòng)向量例共六十二頁預(yù)測(cè)(yùcè)編碼六邊形搜索算法:菱形搜索中菱形周圍的8個(gè)點(diǎn)到中心的距離相差較大,為了更好地近似圓形,因此設(shè)計(jì)了六邊形搜索算法。六邊形算法同樣有兩種搜索模式,大六邊形搜索模式(LHSP)和小六邊形搜索模式(SHSP)。十字形菱形搜索算法:超過96%的運(yùn)動(dòng)向量分布在中心5×5的十字形區(qū)域內(nèi),因此采用十字形搜索窗口(CSP)可減少搜索次數(shù)。該算法將中心放在搜索窗口的原點(diǎn),檢查其上的9個(gè)點(diǎn),若中心是最小塊匹配誤差點(diǎn),則終止;否則,加入距離最近的、且屬于LDSP上的2個(gè)點(diǎn)參與比較。若上一步(yībù)的最小塊匹配誤差點(diǎn)為(±1,±1)或(0,±1),且此步和上一步的最小塊匹配誤差點(diǎn)相同,則終止;否則,搜索步驟與菱形搜索算法相同。菱形搜索算法十字形菱形搜索算法LHSPSHSPCSPLDSP和SDSP共六十二頁預(yù)測(cè)(yùcè)編碼有效三步搜索算法:由于運(yùn)動(dòng)向量的分布具有靠近中心的特性,有效三步搜索算法在3SS算法的第一步中加入了SDSP上的4個(gè)點(diǎn)。十字形菱形六邊形搜索算法:視頻序列中出現(xiàn)較多的是平移、縮放、搖攝、傾斜運(yùn)動(dòng)。實(shí)驗(yàn)證明,若用菱形搜索算法,則有大部分塊的運(yùn)動(dòng)向量分布在菱形的頂點(diǎn)上,在菱形搜索模式之前,首先采用十字形搜索模式,以提前終止搜索,減少運(yùn)動(dòng)小的塊的搜索次數(shù)(cìshù),再用六邊形搜索,以減少從菱形頂點(diǎn)開始搜索的額外開銷,因此提出了十字形菱形六邊形搜索算法。十字形菱形六邊形搜索算法小大十字形VF-HSPHF-HSPVT-HSPHT-HSP
SHSP共六十二頁預(yù)測(cè)(yùcè)編碼十字形菱形六邊形搜索算法搜索過程:開始:將SCSP的中心放在搜索窗口的原點(diǎn),檢查SCSP上的5個(gè)搜索點(diǎn),若中心點(diǎn)的塊匹配誤差(wùchā)最小,則終止。大叉形搜索:加入LCSP最外面的4個(gè)點(diǎn)(±2,0)和(0,±2),參與比較,即比較中心在搜索窗口原點(diǎn)的LCSP上的9個(gè)搜索點(diǎn)。半菱形搜索:再加入距離LCSP的最小塊匹配誤差點(diǎn)最近的,且屬于以搜索窗口原點(diǎn)為中心的LDSP上的2個(gè)點(diǎn),參與比較,若上一步的最小塊匹配誤差點(diǎn)在SCSP的端點(diǎn)上,且這一步的最小塊匹配誤差點(diǎn)和上一步SCSP上的最小塊匹配誤差點(diǎn)相同,則算法終止。搜索:(1)若上一步使用LDSP搜索,且菱形邊上的點(diǎn)是最小塊匹配誤差點(diǎn),則將LDSP的中心移到上一步的最小塊匹配誤差點(diǎn);(2)若上一步使用LDSP搜索,且菱形水平(或垂直)方向的頂點(diǎn)是最小塊匹配誤差點(diǎn),則將水平(或垂直)方向的LHSP的中心移到上一步的最小塊匹配誤差點(diǎn);(3)否則,將與上一步相同的LHSP的中心移到上一步的最小塊匹配誤差點(diǎn)。對(duì)于上述的任何一種情況(LDSP→LDSP、LDSP→LHSP或LHSP→LHSP),每一次僅出現(xiàn)3個(gè)新的搜索位置。若LDSP或LHSP的中心是最小塊匹配誤差點(diǎn),則轉(zhuǎn)向第5步,否則重復(fù)執(zhí)行第4步。結(jié)束:若上一步使用LDSP搜索,則切換為SDSP;若上一步使用LHSP搜索,則切換為SHSP。(SDSP和SHSP的形式相同)。這一步5個(gè)搜索點(diǎn)中的最小塊匹配誤差點(diǎn)指向最優(yōu)匹配塊。共六十二頁子帶編碼(biānmǎ)子帶編碼:子帶編碼是一種在頻率域中進(jìn)行數(shù)據(jù)壓縮的方法。子帶編碼與解碼過程:編碼中,首先用一組帶通濾波器將圖像信號(hào)分解成若干個(gè)在不同頻段上的子帶信號(hào),然后將這些子帶信號(hào)經(jīng)過(jīngguò)頻率搬移轉(zhuǎn)變成基帶信號(hào),再對(duì)它們?cè)谀慰固厮俾噬戏謩e重采樣。采樣后的信號(hào)經(jīng)過(jīngguò)量化和編碼,并合并成一個(gè)總的碼流傳輸給接收端。接收端首先將碼流分成與原來的各個(gè)子帶信號(hào)相對(duì)應(yīng)的子帶碼流,然后解碼、將頻譜搬移至原來的位置,最后經(jīng)帶通濾波器并相加,重構(gòu)出輸出信號(hào)。子帶編碼的3個(gè)方面優(yōu)勢(shì):各個(gè)子帶內(nèi)的量化失真都控制在各自子帶內(nèi),不會(huì)擴(kuò)散到其他子帶,圖像經(jīng)過子帶編碼后,能量較弱的高頻頻帶中的信號(hào)不會(huì)被其他頻帶中量化失真所掩蓋;根據(jù)人類視覺特性控制不同頻帶的編碼,在各個(gè)子帶之間合理分配編碼位數(shù),使之適應(yīng)人眼對(duì)不同頻帶失真的敏感程度,從而提高圖像的主觀視覺質(zhì)量;子帶編碼由于其本身具備的頻率分解特性,適合于分辨率可分級(jí)和質(zhì)量可分級(jí)的圖像編碼,也適合嵌入式的碼流結(jié)構(gòu)。共六十二頁子帶編碼(biānmǎ)編碼器解碼器共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)圖像壓縮編碼國際標(biāo)準(zhǔn):20世紀(jì)80年代以來,國際標(biāo)準(zhǔn)化組織(Internationalstandardorganization,ISO)和國際電信聯(lián)盟(Internationaltelecommunicationunion,ITU)陸續(xù)制定了一系列有關(guān)圖像通信方面(fāngmiàn)的多媒體壓縮編碼標(biāo)準(zhǔn),極大地推動(dòng)了圖像編解碼技術(shù)的發(fā)展與應(yīng)用。這些壓縮編碼標(biāo)準(zhǔn)可以歸為兩類:靜止圖像壓縮編碼標(biāo)準(zhǔn)和運(yùn)動(dòng)圖像壓縮編碼標(biāo)準(zhǔn)。靜止圖像壓縮編碼標(biāo)準(zhǔn)包括適用于二值圖像的JBIG標(biāo)準(zhǔn)(1991,ITU-TT.82,ISO/IEC11544)、適用于連續(xù)色調(diào)靜止圖像的JPEG標(biāo)準(zhǔn)(1991,ITU-TT.81,ISO/IEC10918)、JPEG-LS標(biāo)準(zhǔn)(1998,ITU-TT.87,ISO/IEC14495)和JPEG2000標(biāo)準(zhǔn)(2001,ISO/IEC15444);運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)包括ITU-T制定的H.26x系列和ISO制定的運(yùn)動(dòng)圖像專家組格式MPEG-x系列,其中,適用于運(yùn)動(dòng)圖像的H.261標(biāo)準(zhǔn)(1990,ITU-TH.261)、適用于運(yùn)動(dòng)圖像及伴音的MPEG-1標(biāo)準(zhǔn)(1993,ISO/IEC11172)、適用于高質(zhì)量運(yùn)動(dòng)圖像的MPEG-2/H.262標(biāo)準(zhǔn)(1995,ITU-TH.262,ISO/IEC13818-2)、適用于運(yùn)動(dòng)圖像的H.263標(biāo)準(zhǔn)(1996,ITU-TH.263)、適用于運(yùn)動(dòng)圖像的H.263+標(biāo)準(zhǔn)(1998,ITU-TH.263+)、適用于多媒體音像數(shù)據(jù)的MPEG-4標(biāo)準(zhǔn)(2000,ISO/IEC14496)、適用于運(yùn)動(dòng)圖像的H.263++標(biāo)準(zhǔn)(2002,ITU-T)和適用于運(yùn)動(dòng)圖像的H.264標(biāo)準(zhǔn)(2003,ITU-TH.264)。共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)JPEG壓縮編碼:JPEG標(biāo)準(zhǔn)是第一個(gè)靜止圖像壓縮編碼的國際標(biāo)準(zhǔn)(ɡuójìbiāozhǔn)。JPEG編碼器的基本系統(tǒng)是基于分塊DCT的有損壓縮編碼,它利用離散余弦變換將圖像從空域轉(zhuǎn)換到變換域,使用量化表對(duì)DCT系數(shù)進(jìn)行量化,然后使用預(yù)測(cè)編碼和熵編碼對(duì)量化系數(shù)進(jìn)行編碼。編碼器解碼器共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)JPEG壓縮編碼主要步驟:離散余弦變換:將圖像分解成尺寸為
的圖像塊,圖像塊之間不重疊,對(duì)每一個(gè)圖像塊獨(dú)立進(jìn)行離散余弦變換,產(chǎn)生DCT系數(shù)矩陣,矩陣中第一行第一列元素為圖像塊的平均亮度,稱為直流系數(shù),其余63個(gè)元素稱為交流系數(shù)。量化:量化操作是在保證視覺保真度的前提下消減高頻成分。量化表規(guī)定64個(gè)變換系數(shù)的量化精度,量化是產(chǎn)生信息損失的根源。Z字形掃描:將DCT的量化系數(shù)進(jìn)行Z字形重排列,增加行程中連續(xù)0的個(gè)數(shù),以此(yǐcǐ)提高后續(xù)行程編碼的壓縮率。差分脈沖編碼調(diào)制:DC系數(shù)具有兩個(gè)特點(diǎn):DC系數(shù)的數(shù)值較大;相鄰兩個(gè)圖像塊的DC量化系數(shù)之間的差值很小。根據(jù)這兩個(gè)特點(diǎn),使用差分脈沖編碼調(diào)制對(duì)DC系數(shù)進(jìn)行單獨(dú)編碼。行程編碼:Z字形掃描的AC量化系數(shù)的特點(diǎn)是行程中包含很多零值系數(shù),并且很多零值是連續(xù)的,因此使用行程編碼對(duì)Z字形掃描的AC量化系數(shù)進(jìn)行編碼。赫夫曼編碼:最后,對(duì)經(jīng)過差分脈沖編碼調(diào)制的DC量化系數(shù)和行程編碼的AC量化系數(shù)進(jìn)行赫夫曼編碼,從而進(jìn)一步提高壓縮率。為了便于傳輸、存儲(chǔ)和解碼器進(jìn)行譯碼,將各種標(biāo)記符和編碼后的圖像數(shù)據(jù)組成逐幀的數(shù)據(jù),這樣組織的數(shù)據(jù)通常稱為JPEG位數(shù)據(jù)流。共六十二頁
(a)質(zhì)量級(jí)別(jíbié)為高的JPEG壓縮圖像(b)質(zhì)量級(jí)別為中的JPEG壓縮圖像(c)量級(jí)別為低的JPEG壓縮圖像不同(bùtónɡ)質(zhì)量級(jí)別的JPEG壓縮圖像:重構(gòu)圖像、誤差圖像與誤差概率直方圖圖像壓縮編碼國際標(biāo)準(zhǔn)共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)JPEG2000壓縮編碼標(biāo)準(zhǔn):JPEG采用以離散余弦變換為主的塊編碼方式,而JPEG2000采用以小波變換為主的多分辨率編碼方式。其主要特點(diǎn)(tèdiǎn)如下:高壓縮率:JPEG2000編碼比JPEG有更高的壓縮率,編碼中所采用的小波變換避免了JPEG編碼中的塊效應(yīng),通過對(duì)碼流的率失真優(yōu)化能保持整體壓縮性能,圖像質(zhì)量?jī)?yōu)于同等壓縮率的JPEG格式圖像。同時(shí)支持無損和有損壓縮:由于JPEG2000采用嵌入式可分級(jí)碼流,實(shí)現(xiàn)無損到有損的漸進(jìn)解壓,可在同一碼流中同時(shí)支持有損和無損壓縮。漸進(jìn)傳輸:JPEG2000格式圖像支持漸進(jìn)傳輸,首先傳輸圖像的整體輪廓,然后再逐步傳輸圖像細(xì)節(jié),使圖像由模糊到清晰顯示。感興趣區(qū)域編碼:JPEG2000支持感興趣區(qū)域編碼,即對(duì)感興趣區(qū)域進(jìn)行低壓縮率甚至無損壓縮編碼獲得高質(zhì)量的重構(gòu)圖像,而對(duì)其他區(qū)域采用高壓縮率。編解碼器結(jié)構(gòu)共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)JPEG2000壓縮編碼主要步驟:預(yù)處理:首先將源圖像分解為若干互不重疊的矩形區(qū)域,稱為拼接塊,對(duì)每一個(gè)拼接塊進(jìn)行獨(dú)立的編碼操作。拼接塊的尺寸會(huì)影響重構(gòu)圖像的質(zhì)量,因此,需要選擇合適的拼接塊尺寸。分量變換:分量變換實(shí)際上是顏色空間轉(zhuǎn)換的過程,作用是消除各個(gè)分量之間的相關(guān)性,以減少數(shù)據(jù)的冗余度,提高后續(xù)編碼的壓縮率。JPEG2000定義了兩種變換:可逆分量和不可逆分量變換。小波變換:對(duì)各個(gè)分量以拼接塊為單位進(jìn)行小波變換,作用是消除像素間的空間相關(guān)性,將信息集中到少數(shù)的變換系數(shù)上。JPEG2000將bior5.3小波和jpeg9.7小波用作缺省小波變換濾波器,通過整型5/3小波變換來實(shí)現(xiàn)可逆變換,通過浮點(diǎn)型9/7小波變換來實(shí)現(xiàn)不可逆變換,分解級(jí)數(shù)默認(rèn)為6。量化:量化操作是將大量幅度較小的高頻小波系數(shù)衰減或截?cái)酁榱悖瑥亩褂?shǐyòng)更少的位數(shù)來表示非零的量化系數(shù)。嵌入式塊編碼:JPEG2000中的熵編碼采納了嵌入式塊編碼(EBCOT),包括“塊編碼”與“位流組織”二個(gè)階段,第一階段是基于上下文的二進(jìn)制算術(shù)編碼器,第二階段是通過率失真優(yōu)化對(duì)碼塊位流進(jìn)行編碼控制,并組織生成壓縮碼流。共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)嵌入式塊編碼(EBCOT)主要步驟:位平面編碼:經(jīng)過小波變換和系數(shù)量化,對(duì)拼接塊進(jìn)行小波分解的子帶由整數(shù)系數(shù)組成。在嵌入式塊編碼算法中,將小波分解的每一個(gè)子帶圖像劃分為尺寸相同的碼塊,對(duì)每一個(gè)碼塊進(jìn)行獨(dú)立的嵌入式編碼。碼塊的劃分是在每一個(gè)子帶圖像中獨(dú)立進(jìn)行,對(duì)小波系數(shù)的分塊遵循如下原則:1)為了(wèile)保證塊編碼的獨(dú)立性,碼塊不能跨越子帶邊界;2)同一子帶圖像中碼塊的尺寸相同;3)碼塊的尺寸為16~4096個(gè)像素,碼塊的寬和高都為2的冪次,JPEG2000推薦尺寸為64×64或32×32。每一個(gè)碼塊又可分解成位平面。從碼塊的非零比特的最高位平面開始直到最低位平面結(jié)束逐平面進(jìn)行編碼。位平面上4行構(gòu)成一個(gè)編碼帶,以條帶形式掃描碼塊,掃描過程從位平面左上角的數(shù)據(jù)開始,連續(xù)掃描當(dāng)前編碼帶中第一列4個(gè)數(shù)據(jù)后,轉(zhuǎn)向掃描第二列4個(gè)數(shù)據(jù),如此繼續(xù),直至掃描最后一列4個(gè)數(shù)據(jù);然后,轉(zhuǎn)向掃描下一個(gè)編碼帶;按照這樣的順序依次掃描整個(gè)位平面。共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)碼塊示意圖位平面(píngmiàn)示意圖編碼帶掃描示意圖位平面掃描順序標(biāo)號(hào),碼塊的尺寸為32×32共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)MQ算術(shù)編碼:JPEG2000所采用的MQ算術(shù)編碼是一種自適應(yīng)二進(jìn)制算術(shù)編碼方法。MQ算術(shù)編碼器根據(jù)位平面的上下文標(biāo)簽和編碼器內(nèi)部的狀態(tài)決定編碼的輸出,將待編碼的二進(jìn)制數(shù)分成大概率符號(hào)(MPS)和小概率符號(hào)(LPS)。設(shè)A表示編碼區(qū)間的寬度,C表示起始位置。若輸入符號(hào)為MPS,則A←A(1-Qe),C←C+AQe;若輸入符號(hào)為L(zhǎng)PS,則C保持不變,A←AQe。為了有利于硬件實(shí)現(xiàn),采用固定精度的整數(shù)運(yùn)算進(jìn)行操作,且使用整數(shù)代替小數(shù)(xiǎoshù)。通過在編碼過程中采用“重歸一化處理過程”,可以將編碼區(qū)間A保持在單位1附近,通過近似處理簡(jiǎn)化上述運(yùn)算過程。若輸入符號(hào)為MPS,則A←A-Qe,C←C+Qe;若輸入符號(hào)為L(zhǎng)PS,則C保持不變,A←Qe。MQ算術(shù)編碼器系統(tǒng)框圖MQ算術(shù)編碼器輸入與編碼區(qū)間劃分共六十二頁圖像壓縮編碼(biānmǎ)國際標(biāo)準(zhǔn)位流組織:第二階段編碼過程實(shí)際上是分層打包形成碼流的過程,按照率失真最優(yōu)的原則分層組織,選取合適的截?cái)帱c(diǎn)截?cái)嗝恳粋€(gè)碼塊的位數(shù)據(jù)流,形成不同質(zhì)量的層,對(duì)每一層用不同的碼流格式打包。在編碼過程中,需要對(duì)每一個(gè)截?cái)帱c(diǎn)進(jìn)行率失真優(yōu)化的計(jì)算,使其在任意(rènyì)點(diǎn)截?cái)喽伎梢垣@得率失真最優(yōu)的質(zhì)量。然后將截?cái)帱c(diǎn)和失真度以壓縮的形式同碼塊位流保存在一起,形成碼塊的嵌入式壓縮位流。轄區(qū)與子帶之間的關(guān)系以及數(shù)據(jù)包掃描順序示意圖
JPEG
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國經(jīng)濟(jì)型酒店行業(yè)全國市場(chǎng)開拓戰(zhàn)略制定與實(shí)施研究報(bào)告
- 新形勢(shì)下人力資源服務(wù)行業(yè)轉(zhuǎn)型升級(jí)戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國中醫(yī)藥服務(wù)貿(mào)易行業(yè)并購重組擴(kuò)張戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國老年護(hù)理服務(wù)行業(yè)商業(yè)模式創(chuàng)新戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2025-2030年中國家庭服務(wù)機(jī)器人行業(yè)資本規(guī)劃與股權(quán)融資戰(zhàn)略制定與實(shí)施研究報(bào)告
- 市政道路工程竣工監(jiān)理質(zhì)量評(píng)估報(bào)告
- 旅行套裝問卷調(diào)查
- 2025年中國口罩行業(yè)市場(chǎng)調(diào)查研究及投資前景預(yù)測(cè)報(bào)告
- 白皮紙行業(yè)行業(yè)發(fā)展趨勢(shì)及投資戰(zhàn)略研究分析報(bào)告
- 母嬰零食知識(shí)培訓(xùn)課件
- 微型消防站消防員培訓(xùn)內(nèi)容
- 大一中國近代史綱要期末考試試題及答案
- (完整版)鋼筋加工棚驗(yàn)算
- 安徽省合肥市廬陽區(qū)2023-2024學(xué)年三年級(jí)上學(xué)期期末數(shù)學(xué)試卷
- 概念方案模板
- 西南交大畢業(yè)設(shè)計(jì)-地鐵車站主體結(jié)構(gòu)設(shè)計(jì)
- 2024年山東傳媒職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 江蘇省南通市崇川區(qū)2023-2024學(xué)年三年級(jí)上學(xué)期期末語文試卷
- crtd植入術(shù)護(hù)理查房
- 掃雪鏟冰安全教育培訓(xùn)
- 人教版三年級(jí)下冊(cè)必讀書目《中國古代寓言故事》
評(píng)論
0/150
提交評(píng)論