第四章數(shù)字壓縮編碼技術(shù)

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-02-14 格式：DOC 頁(yè)數(shù)：14 大?。?57.50KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩9頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章數(shù)字壓縮編碼技術(shù)1 數(shù)字壓縮的必要性數(shù)字信號(hào)有很多優(yōu)點(diǎn)，但當(dāng)模擬信號(hào)數(shù)字化后其頻帶大大加寬，一路6MHz的普通電視信號(hào)數(shù)字化后，其數(shù)碼率將高達(dá)167Mbps，對(duì)儲(chǔ)存器容量要求很大，占有的帶寬將達(dá)80MHz左右，這樣將使數(shù)字信號(hào)失去實(shí)用價(jià)值。數(shù)字壓縮技術(shù)很好地解決了上述困難，壓縮后信號(hào)所占用的頻帶大大低于原模擬信號(hào)的頻帶。因此說(shuō)，數(shù)字壓縮編碼技術(shù)是使數(shù)字信號(hào)走向?qū)嵱没年P(guān)鍵技術(shù)之一，表41列出了各種應(yīng)用的碼率。表41 各種應(yīng)用的碼率應(yīng)用種類比特?cái)?shù)/象素象素?cái)?shù)/行行數(shù)/幀幀數(shù)/秒亮色比比特/秒(壓縮前)比特/秒(壓縮后)HDTV819201080304:1:11.18Gbps2025M

2、bps普通電視CCIR6018720480304:1:1167Mbps48Mbps會(huì)議電視CIF8352288304:1:136.5Mbps1.52Mbps桌上電視QCF8176144304:1:19.1Mbps128kbps電視電話8128112304:1:15.2Mbps56kbps有線電視網(wǎng)中數(shù)字壓縮技術(shù)主要包括用于會(huì)議電視系統(tǒng)的H.261壓縮編碼，用于計(jì)算機(jī)靜止圖像壓縮的JPEG和用于活動(dòng)圖像壓縮的MPEG數(shù)字壓縮技術(shù)。2 圖像壓縮編碼的可能性從信息論觀點(diǎn)來(lái)看，圖像作為一個(gè)信源，描述信源的數(shù)據(jù) 是信息量(信源熵)和信息冗余量之和。信息冗余量有許多種，如空間冗余，時(shí)間冗余，結(jié)構(gòu)冗余，

3、知識(shí)冗余，視覺(jué)冗余等，數(shù)據(jù)壓縮實(shí)質(zhì)上是減少這些冗余量?？梢?jiàn)冗余量減少可以減少數(shù)據(jù)量而不減少信源的信息量。從數(shù)學(xué)上講，圖像可以看作一個(gè)多維函數(shù)，壓縮描述這個(gè) 函數(shù)的數(shù)據(jù)量實(shí)質(zhì)是減少其相關(guān)性。另外在一些情況下，允許圖像有一定的失真，而并不妨礙圖像的實(shí)際應(yīng)用，那么數(shù)據(jù)量壓縮的可能性就更大了。3 圖像壓縮編碼方法的分類編碼壓縮方法有許多種，從不同的角度出發(fā)有不同的分類方法，比如從信息論角度出發(fā)可分為兩大類： (1)冗余度壓縮方法，也稱無(wú)損壓縮，信息保持編碼或熵編碼。具體講就是解碼圖像和壓縮編碼前的圖像嚴(yán)格相同，沒(méi)有失真，從數(shù)學(xué)上講是一種可逆運(yùn)算。 (2)信息量壓縮方法，也稱有損壓縮，失真度編碼或

4、熵壓縮編碼。也就是講解碼圖像和原始圖像是有差別的，允許有一定的失真。應(yīng)用在多媒體中的圖像壓縮編碼方法，從壓縮編碼算法原理上可以分類為： (1)無(wú)損壓縮編碼種類哈夫曼編碼算術(shù)編碼行程編碼 Lempel zev編碼 (2)有損壓縮編碼種類預(yù)測(cè)編碼：DPCM，運(yùn)動(dòng)補(bǔ)償頻率域方法：正文變換編碼(如DCT)，子帶編碼空間域方法：統(tǒng)計(jì)分塊編碼模型方法：分形編碼，模型基編碼基于重要性：濾波，子采樣，比特分配，矢量量化 (3)混合編碼 JBIG，H261，JPEG，MPEG等技術(shù)標(biāo)準(zhǔn) 衡量一個(gè)壓縮編碼方法優(yōu)劣的重要指標(biāo)是： (1)壓縮比要高，有幾倍、幾十倍，也有幾百乃至幾千倍； (2)壓縮與解

5、壓縮要快，算法要簡(jiǎn)單，硬件實(shí)現(xiàn)容易； (3)解壓縮的圖像質(zhì)量要好。最后要說(shuō)明的是選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特征；多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力；應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。 4 壓縮編碼方法簡(jiǎn)介壓縮編碼的方法有幾十種之多，并在編碼過(guò)程中涉及較深的的數(shù)學(xué)里理論基礎(chǔ)問(wèn)題，在此僅介紹幾種常用的壓縮編碼方法，主要是從物理意義上作一定的解釋，讀者如對(duì)數(shù)據(jù)壓縮專題感興趣的話，請(qǐng)參看講座結(jié)束后所附的參考資料。4.1 莫爾斯碼與信源編碼莫爾斯碼即電報(bào)碼，其精華之處在于用短碼來(lái)表示常出現(xiàn)的英文字母，用長(zhǎng)碼來(lái)表示不常出現(xiàn)的字母，以減小碼率。這種方法非常有效，故延用至今。電視信號(hào)經(jīng)過(guò)變

6、換后，例如經(jīng)差值脈沖編碼后，發(fā)現(xiàn)前后像素幅度差值小的概率大，而差值大的概率小，因此可用短碼表示概率大的信號(hào)，而用長(zhǎng)碼來(lái)代表概率小的信號(hào)，從而達(dá)到壓縮碼率的目的。4.2 差值脈沖編碼電視圖像基本上是由面積較大的像塊(如藍(lán)天、大地、服裝等)組成。雖然每個(gè)像塊的幅值各不相同，但像塊內(nèi)各樣值的幅度是相近的或相同的，幅值躍變部分相應(yīng)于像塊的輪廓，只占整幅圖像的很小一部分。幀間相同的概率就更大了，靜止圖像相鄰幀間的相應(yīng)位置的像素完全一樣，這意味著前后像素之差或前后幀間相應(yīng)位置像素之差為零或差值小的概率大，差值大的概率小。這就是差值編碼的基本想法，其原理框圖見(jiàn)圖41(a)。發(fā)端將當(dāng)前樣值和前一樣

7、值相減所得差值經(jīng)量化后進(jìn)行傳輸，收端將收到的差值與前一個(gè)樣值相加得到當(dāng)前樣值。在這個(gè)原理圖中，輸出的當(dāng)前樣值是輸出的前一樣值加上收到的差值，由于在當(dāng)前差值中包括當(dāng)前的量化誤差，而輸出的前一樣值又包括前一樣值的量化誤差，這就造成了量化誤差的積累。因此實(shí)用電路為圖41(b)。這時(shí)輸入當(dāng)前樣值不是與輸入的前一樣值相減，而是與輸出的前一樣值相減，因此在差值中已經(jīng)包含了前一樣值的量化誤差的負(fù)值，在與輸出的前一個(gè)樣值相加時(shí)，這部分量化誤差被抵消，只剩下當(dāng)前的量化誤差，這就避免了量化誤差的積累。4.3 預(yù)測(cè)編碼預(yù)測(cè)編碼利用像素的相關(guān)性，可進(jìn)一步減小差值。從前面的分析可以看出，如果差值編碼中

8、小幅度出現(xiàn)的機(jī)會(huì)增加，由于其對(duì)應(yīng)的碼長(zhǎng)較短，總數(shù)碼率會(huì)進(jìn)一步減小。如果能猜出下一個(gè)樣值，那么差值就會(huì)是零，當(dāng)然這種情況是沒(méi)有意義的，因?yàn)槿纛A(yù)先知道下一樣值，就不需要進(jìn)行通信了。但可以肯定，如果我們不僅利用前后樣值的相關(guān)性，同時(shí)也利用其它行、其它幀的像素的相關(guān)性，用更接近當(dāng)前樣值的預(yù)測(cè) 值與當(dāng)前樣值相減，小幅度差值就會(huì)增加，總數(shù)碼率就會(huì)減小，這就是預(yù)測(cè)編碼的方法。預(yù) 測(cè)編碼的電路與差值編碼類似，或者說(shuō)差值編碼就是以前一樣值為預(yù)測(cè)值的預(yù)測(cè)編碼，又稱為一維預(yù)測(cè)。如果用到以前行的像素或以前幀的像素，則稱為二維或三維預(yù)測(cè)。在美國(guó)國(guó)際電話電報(bào)公司(ITT)生產(chǎn)的數(shù)字電視機(jī)芯片中有一個(gè)視頻存儲(chǔ)控制器

9、芯片VMC2260就用了二維預(yù)測(cè)編碼，預(yù)測(cè)器用了三個(gè)像素作為下一個(gè)像素的預(yù)測(cè)值，即預(yù)測(cè)值等于1/2前一像素加1/4 上一行相應(yīng)像素再加上1/4上一行相應(yīng)的前一像素。這樣不僅利用了前一像素的相關(guān)性，也利用了上一行相應(yīng)像素的相關(guān)性，這樣做要比差值編碼有更大的碼率壓縮。如果再用上前一幀的像素會(huì)進(jìn)一步降低數(shù)碼率。但為了得到前一幀的像素必須要使用幀存儲(chǔ)器，造價(jià)比較高。只用到幀內(nèi)像素的處理稱為幀編碼(Intraframe Coding)，用到前后幀像素的處理稱為幀間編碼(Interframe Coding)。要得到較大的碼率壓縮就必須使用幀間編碼。JPEG是典型的幀內(nèi)編碼方案，而MPEG是幀間編

10、碼方法。前者大多用于靜止圖像處理，而后者主要用于對(duì)運(yùn) 動(dòng)圖像的處理。 4.4 哈達(dá)瑪特變換這是一種有效地去除噪波的方法，噪波的存在往往容易和小幅度變化的信號(hào)相混淆，利用多幀平均的方法，對(duì)于靜止圖像，各幀相同，平均的結(jié)果其值不變，對(duì)于噪波，多幀平均趨于零。但如果圖像中有運(yùn)動(dòng)，多幀平均就會(huì)造成運(yùn)動(dòng)模糊，故不能簡(jiǎn)單地進(jìn)行平均，需要根據(jù)運(yùn)動(dòng)的大小來(lái)調(diào)節(jié)反饋量，即調(diào)節(jié)平均的程度，做到運(yùn)動(dòng)自適應(yīng)降噪。大多數(shù)情況下是利用幀差信號(hào)來(lái)判斷圖像中是否有運(yùn)動(dòng)，如果幀差小于一定值，就可視為是因噪波引起的，可取較大的反饋量；如果幀差大于一定值，就可視為圖像中有運(yùn)動(dòng)。但在許多情況下，僅從幅度的大小來(lái)判斷是雜波還是

11、圖像是很困難的，如移動(dòng)的云，近攝的綠草地等圖像信號(hào)所得到幀差信號(hào)也很小，所以BKU-904采用二維哈達(dá)瑪特變換(Hadamard Transform)來(lái)區(qū)分是噪波還是圖像信號(hào)。先將輸入值按42分成小塊，分別進(jìn)行實(shí)時(shí)快速哈達(dá)瑪特變換(FHT)。圖像經(jīng)變換后，轉(zhuǎn)換成相應(yīng)成分的系數(shù)，這些系數(shù)分別代表直流分量；水平方向細(xì)節(jié)和色度分量等；垂直方向細(xì)節(jié)；斜方向細(xì)節(jié)及色度分量等，而噪波變換后均勻散在各系數(shù)中。這樣就更有效地區(qū)分出信號(hào)和噪波，從而達(dá)到更有效地進(jìn)行自適應(yīng)降噪的目的。 4.5 離散余弦變換離散余弦變換(Discrete cosine Transform)簡(jiǎn)稱DCT。任何連續(xù)的實(shí)對(duì)稱函數(shù)的

12、傅里葉變換中只含余弦項(xiàng)，因此余弦變換與傅里葉變換一樣有明確的物理量意義。DCT是先將整體圖像分成NN像素塊，然后對(duì)NN像素塊逐一進(jìn)行DCT變換。由于大多數(shù)圖像的高頻分量較小，相應(yīng)于圖像高頻成分的系數(shù)經(jīng)常為零，加上人眼對(duì)高頻成分的失真不太敏感，所以可用更粗的量化，因此傳送變換系數(shù)所用的數(shù)碼率要大大小于傳送圖像像素所用的數(shù)碼率。到達(dá)接收端后再通過(guò)反離散余弦變換回到樣值，雖然會(huì)有一定的失真，但人眼是可以接受的。 N代表像素?cái)?shù)，一般N=8，88的二維數(shù)據(jù)塊經(jīng)DCT后變成88個(gè)變換系數(shù)，這些系數(shù)都有明確的物理意義：U代表水平像素號(hào)，V代表垂直像素號(hào)。如當(dāng)U=0，V=0時(shí)，F(xiàn)(0，0)是

13、原 64個(gè) 樣值的平均，相當(dāng)于直流分量，隨著U、V值增加，相應(yīng)系數(shù)分別代表逐步增加的水平空間頻率分量和垂直空間頻率分量的大小。4.6 量化(Q) 嚴(yán)格說(shuō)DCT本身并不能進(jìn)行碼率壓縮，因?yàn)?4個(gè)樣值仍然得到64個(gè)系數(shù)，如圖42所示。這里給出了一個(gè)88像塊的具體例子，經(jīng)DCT變換后，比特?cái)?shù)增加了。在這個(gè)例子中樣值是8比特，從0225得到的即直流分量的最大值是原來(lái)256的64/8倍，即02047，交流分量的范圍是-10241023。只是在經(jīng)過(guò)量化后，特別是按人眼的生理特征對(duì)低頻分量和高頻分量設(shè)置不同的量化，會(huì)使大多數(shù)高頻分量的系數(shù)變?yōu)榱?。一般說(shuō)來(lái)，人眼對(duì)低頻分量比較敏感，而對(duì)高頻分量不

14、太敏感。因此對(duì)低頻分量采用較細(xì)的量化，而對(duì)高頻分量采用較粗的量化。所謂量化，即根據(jù)不同的要求，設(shè)置不同的量化等級(jí)，從而降低數(shù)碼率。 4.7 游程長(zhǎng)度編碼讀出數(shù)據(jù)和表示數(shù)據(jù)的方式也是減少碼率的一個(gè)重要因素。讀出的方式可以有多種選擇，如水平逐行讀出、垂直逐列讀出、之字型讀出和交替讀出等，其中之字型讀出(ZigZag) 是最常用的一種。由于經(jīng)DCT變換以后，系數(shù)大多數(shù)集中在左上角，即低頻分量區(qū)，因此之字型讀出實(shí)際上是按二維頻率的高低順序讀出系數(shù)的，這樣一來(lái)就為游程長(zhǎng)度編碼(Runleng th Encoding)創(chuàng)造了條件。所謂游程長(zhǎng)度編碼是指一個(gè)碼可同時(shí)表示碼的值和前面幾個(gè)零，這樣就

15、可以把之字型讀出的優(yōu)點(diǎn)顯示出來(lái)了。因?yàn)橹中妥x出在大多數(shù)情況下出現(xiàn)連零的機(jī) 會(huì)比較多，尤其在最后，如果都是零，在讀到最后一個(gè)數(shù)后只要給出“塊結(jié)束”(EOB)碼，就可以結(jié)束輸出，因此節(jié)省了很多碼率。游程長(zhǎng)度指的是由字構(gòu)成的數(shù)據(jù)流中各個(gè)字符連續(xù)重復(fù)出現(xiàn)而形成字符串的長(zhǎng)度。基本的游程編碼就是在數(shù)據(jù)流中直接用三個(gè)字符來(lái)給出上述三種信息，其數(shù)據(jù)結(jié)構(gòu)如圖43 所示。 SC表示有一個(gè)字符串在此位置，X代表構(gòu)成串的字符，CC代表串的長(zhǎng)度。游程編碼和哈夫曼編碼等屬于統(tǒng)計(jì)編碼。 4.8 霍夫曼編碼霍夫曼編碼是可變字長(zhǎng)編碼(VLC)的一種。 Huffman于1952年提出一種編碼方法，該方法完全依據(jù)字符出

16、現(xiàn)概率來(lái)構(gòu)造異字頭的平均長(zhǎng) 度最短的碼字，有時(shí)稱之為最佳編碼，一般就叫作Huffman編碼。下面引證一個(gè)定理，該定理保證了按字符出現(xiàn)概率分配碼長(zhǎng)，可使平均碼長(zhǎng)最短。定理：在變字長(zhǎng)編碼中，如果碼字長(zhǎng)度嚴(yán)格按照對(duì)應(yīng)符號(hào)出現(xiàn)的概率大小逆序排列，則其平均碼字長(zhǎng)度為最小。現(xiàn)在通過(guò)一個(gè)實(shí)例來(lái)說(shuō)明上述定理的實(shí)現(xiàn)過(guò)程。設(shè)將信源符號(hào)按出現(xiàn)的概率大小順序排列為： U：(a1a2a3a4a5a6a7)0.200.190.180.170.150.100.01 給概率最小的兩個(gè)符號(hào)a6與a7分別指定為“1”與“0”，然后將它們的概率相加再與原來(lái)的 a1a5組合并重新排序成新的原為：U：(a1a2a3a4a5a

17、6)0.200.190.180.170.150.11 對(duì)a5與a6分別指定“1”與“0”后，再作概率相加并重新按概率排序得U：（0.26 0.20 0.19 0.18 0.17）直到最后得 U：（0.61 0.39）分別給以“0”，“1”為止，如圖44所示。霍夫曼編碼的具體方法：先按出現(xiàn)的概率大小排隊(duì)，把兩個(gè)最小的概率相加，作為新的概率和剩余的概率重新排隊(duì)，再把最小的兩個(gè)概率相加，再重新排隊(duì)，直到最后變成1。每次相加時(shí)都將“0”和“1”賦與相加的兩個(gè)概率，讀出時(shí)由該符號(hào)開(kāi)始一直走到最后的“1”，將路線上所遇到的“0”和“1”按最低位到最高位的順序排好，就是該符號(hào)的霍夫曼編碼。例如

18、a7從左至右，由U至U，其碼字為0000； a6按踐線將所遇到的“0”和“1”按最低位到最高位的順序排好，其碼字為0001 用霍夫曼編碼所得的平均比特率為：碼長(zhǎng)出現(xiàn)概率上例為： 0.22+0.192+0.183+0.173+0.153+0.14+0.014=2.72 bit 可以算出本例的信源熵為2.61bit，二者已經(jīng)是很接近了。 4.9 運(yùn)動(dòng)估計(jì)的運(yùn)動(dòng)補(bǔ)償編碼這是一種幀間編碼的方法，其原理是利用幀間的空間相關(guān)性，減小空間冗余度。幀間編碼為什么可以減小冗余度，這是因?yàn)閮蓭g有很大的相似性。如果將前后兩幀相減 (移動(dòng)物體作相應(yīng)位移)得到的誤差作編碼所需比特要比幀內(nèi)編碼所需的比特少，幀間

19、差集中在零附近，可以用短的碼字傳送。實(shí)現(xiàn)幀間編碼的方法是運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償。用圖45來(lái)說(shuō)明這個(gè)過(guò)程。當(dāng)前幀在過(guò)去幀的窗口中尋找匹配部分，從中找到運(yùn)動(dòng)矢量；根據(jù)運(yùn)動(dòng)矢量，將過(guò)去幀位移，求得對(duì)當(dāng)前幀的估計(jì)；將這個(gè)估計(jì)和當(dāng)前幀相減，求得估計(jì)的誤差值；將運(yùn)動(dòng)矢量和估計(jì)的誤差值送到接收端去。接收端根據(jù)收到的運(yùn)動(dòng)矢量將過(guò)去幀作位移(也就是對(duì)當(dāng)前幀的估計(jì))，再加上接收到的誤差值，就是當(dāng)前幀了。圖47 運(yùn)動(dòng)估計(jì)的全局搜索塊匹配實(shí)際上，在做運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償時(shí)，是以1616的塊(稱宏塊)逐個(gè)進(jìn)行的，如圖46所示，這是將當(dāng)前幀劃分為NN(1616)的塊。對(duì)每一塊在過(guò)去幀中范圍為的范圍內(nèi)進(jìn)行搜

20、索，以求得最優(yōu)匹配，從而得到運(yùn)動(dòng)矢量的估值(dx,dy)。衡量匹配好壞的準(zhǔn)則可以是均方誤差最小準(zhǔn)則。搜索方法可以是全局搜索法，即對(duì)搜索范圍內(nèi)的每一點(diǎn)都計(jì)算均方誤差，選最小值即對(duì)應(yīng)最優(yōu)匹配，如圖47所示。 5 JPEG標(biāo)準(zhǔn) JPEG是Joint Photographic Experts Group的縮寫，主要用于計(jì)算機(jī)靜止圖像的壓縮，在用于活動(dòng)圖像時(shí)，其算法僅限于幀內(nèi)，便于編輯。采用JPEG標(biāo)準(zhǔn)可以得到不同壓縮比的圖像，在使圖像質(zhì)量得到保證的情況下，可以從每個(gè)像素24bit減到每個(gè)像素1bit甚至更小。 JPEG標(biāo)準(zhǔn)所根據(jù)的算法是基于DCT(離散余弦變換)和可變長(zhǎng)編碼。系統(tǒng)框圖如圖48

21、所示，從圖中可見(jiàn)，JPEG的關(guān)鍵技術(shù)有變換編碼、量化、差分編碼、運(yùn)動(dòng)補(bǔ)償、霍夫曼編碼和游程編碼等。圖48 JPEG系統(tǒng)框圖 6 H.261標(biāo)準(zhǔn) JPEG算法的原理是利用單幀內(nèi)的空間相關(guān)性，減小空間冗余度，這種方式稱為幀內(nèi)編碼。我們知道電視圖像(包括各種活動(dòng)圖像)各個(gè)連續(xù)幀之間也有很大的相關(guān)性，稱為時(shí)間相關(guān)性。為了進(jìn)一步提高圖像壓縮比，要設(shè)法減小時(shí)間冗余度，這種編碼方式稱為幀間編碼。H.261 是用于會(huì)議電視的國(guó)際標(biāo)準(zhǔn)，既采用了幀內(nèi)編碼，又采用了幀間編碼，因此它的壓縮比大致是JPEG的三倍。 H.261標(biāo)準(zhǔn)用于音象業(yè)務(wù)的碼率是p64kbps(p=1，2，30)。用于電視電話時(shí)p=1或

22、2，用于電視會(huì)議時(shí)p6。這種標(biāo)準(zhǔn)具有最小延遲實(shí)時(shí)對(duì)話的能力。圖49是H.261編碼器的原理框圖。從編碼器中看到，它有一個(gè)和解碼器一樣的過(guò)程，解出的圖像放在運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)器(存儲(chǔ)器)中形成過(guò)去幀，它的輸出和當(dāng)前幀一起加到“運(yùn)動(dòng)估計(jì)”，求得的運(yùn)動(dòng)矢量一方面經(jīng)VLC送到復(fù)用器中去，另一方面加到運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)器中，使之產(chǎn)生估計(jì)幀(對(duì)當(dāng)前幀)，它和當(dāng)前幀相減即求得差值，這個(gè)差值經(jīng)DCT和Q、VLC也送到復(fù)用器中去。圖49 H.261編碼器的原理框圖在進(jìn)行幀間編碼時(shí)，編碼器和解碼器必須使用相同的預(yù)測(cè)器，否則兩者會(huì)脫軌。為了獲得重建圖像，被量化以后的系數(shù)要用一個(gè)反量化器和反余弦變換(IDCT)

23、來(lái)處理，為防止編碼器和解碼器慢慢漂移分離，必須對(duì)誤差的平均值加以嚴(yán)格規(guī)定，即使如此，仍然要周期地使用幀內(nèi)編碼，使解碼器處于一個(gè)已知狀態(tài)。運(yùn)動(dòng)補(bǔ)償單元使幀間差最小，從而減少所需傳輸碼率。搜索窗的大小在水平和垂直方向上都是15個(gè)采樣值。通常只對(duì)亮度信號(hào)作運(yùn)動(dòng)估計(jì)，但運(yùn)動(dòng)補(bǔ)償不僅作用于亮度，也作用于色度(亮度象素位移的一半)。圖410畫出了解碼器的框圖。被壓縮的數(shù)據(jù)送入緩沖器，然后作可變長(zhǎng)度解碼，解碼器余下的部分相似于編碼器的后端，僅有的區(qū)別是不再需要運(yùn)動(dòng)估計(jì)。運(yùn)動(dòng)矢量和其它附帶的信息是直接從可變長(zhǎng)解碼器的輸出得到的。在編碼器的輸出端有緩沖器(Buffer)，這是因?yàn)榫幋a過(guò)程產(chǎn)生

24、的比特率不是恒定的，它取決于運(yùn)動(dòng)序列中各點(diǎn)的圖像統(tǒng)計(jì)特征。在圖像的“簡(jiǎn)單”部分允許節(jié)省一些比特，而在“復(fù)雜”的部分要多花一些比特。對(duì)于每一個(gè)編碼圖像，比特的數(shù)目也允許變更。但是在傳輸網(wǎng)絡(luò)中的數(shù)據(jù)的比特率又必須是恒定的，所以在視頻編碼器的輸出端必須有數(shù)據(jù) 緩沖器來(lái)提供平滑的作用。相反的，在解碼器要以非恒定的速率來(lái)利用接收到的信息，所以也要包含一個(gè)解碼器的緩沖器。圖410 H.261的解碼器框圖在傳輸中，幀頻的長(zhǎng)期平均值是CIF的標(biāo)準(zhǔn)值，但是在短的時(shí)間間隔內(nèi)幀頻會(huì)有一定變化。表42 CIF和QCIF格式格式CIFQCIF信號(hào)分量行數(shù)/幀象素?cái)?shù)/行行數(shù)/幀象素?cái)?shù)/行亮度(Y)288

25、360(352)144180(176) 色度(Cb)144180(176)7290(88) 色度(Cr)144180(176)7290(88)注：CIF和QCIF幀頻是每秒30幀。H.261的一幅圖像是由塊(Block)組成宏塊(Macroblock)，宏塊組成圖像組(GO B)，圖像組組成圖像，如圖411所示。兩種格式的碼率為：CIF：152Mbps QCIF：128kbps 7 MPEG- 1和MPEG-2標(biāo)準(zhǔn) MPEG(Moving Picture Expert Group)意思是“運(yùn)動(dòng)圖像專家組”。這個(gè)專家組的任務(wù) 是為了對(duì)數(shù)字存儲(chǔ)媒質(zhì)、電視廣播、通信等方面的運(yùn)動(dòng)圖像和伴音給出一種

26、通用的編碼方法。符合這種編碼方法的運(yùn) MPEG用句法規(guī)定了一個(gè)層次性的結(jié)構(gòu)，共分六層。這六層是圖像序列(Video Sequence)-圖像組(Group of Picture)-圖像(Picture)-宏塊條(Silce)- 宏塊(Macroblock )-塊(Block)。一個(gè)圖像包含亮度陣列和色度陣列。在MPEG- 1中亮度和色度的格式是420，而在MPEG-2 中，除這一格式外，還允許有422及444。六個(gè)層次有其不同的功能，如表43所示。表43 MPEG1/2規(guī)定的層次功能語(yǔ)法規(guī)定的層次功能語(yǔ)法規(guī)定的層次功能序列層(Sequence layer)隨機(jī)存取段落宏塊條層(Sl

27、ice layer)重新同步單元圖像組層(Group of picture layer)隨機(jī)存取視頻單元宏塊層(Macroblock layer)運(yùn)動(dòng)補(bǔ)償單元圖像層(Picture layer)基本編碼單元塊層(Block layer)DCT單元所謂420是指在垂直方向每隔一行去除一行色度信號(hào)。 7.2 MPEG-1和MPEG-2中三種類型圖像MPEG在利用塊匹配運(yùn)動(dòng)補(bǔ)償來(lái)減小時(shí)間冗余度時(shí)，不僅用上一幀的圖像預(yù)測(cè)當(dāng)前圖像，而且也使用下一幀圖像預(yù)測(cè)當(dāng)前圖像，即雙向預(yù)測(cè)，這是和H.261標(biāo)準(zhǔn)有重要區(qū)別的地方。因此，MPEG-1和2中有三種類型圖像，即I、B、P三種，如圖412所示。I幀是

28、幀內(nèi)編碼，P幀是正向預(yù)測(cè)，如圖413所示，通過(guò)正向預(yù)測(cè)得到的圖。B幀是雙向預(yù)測(cè)圖，如圖414所示。由于B幀不能作其他圖像的基準(zhǔn)，所以對(duì)B幀編碼校粗(步長(zhǎng)較大)，需要比特?cái)?shù)比預(yù)測(cè)圖P少。7.3 MPEG- 1的視頻壓縮編碼MPEG-1中視頻編碼的關(guān)鍵壓縮技術(shù)和H.261一樣，仍是DCT、運(yùn)動(dòng)補(bǔ)償和Huffman編碼。編碼器和解碼器的原理框圖也和H.261沒(méi)有區(qū)別。 MPEG-1的信源輸入格式是SIF(Source Input Format)。CCIR601格式的信源要轉(zhuǎn)換成SIF后進(jìn) 入MPEG- 1編碼器，解碼器輸出也是SIF格式，顯示時(shí)要經(jīng)內(nèi)插，擴(kuò)充為CCIR601格式。PAL/NT S

29、C都作如此處理。SIF格式如表44所示。表44 SIF(525/625)格式信號(hào)分量行數(shù)/幀象素?cái)?shù)/行亮度(Y)240/288352 色度(Cb)120/144176色度(Cr)120/144176圖415所示為MPEG-1視頻編碼器。圖中和H.261不同的部分是有二組運(yùn)動(dòng)補(bǔ)償和存儲(chǔ)器，并有相應(yīng)的轉(zhuǎn)換開(kāi)關(guān)。這是因?yàn)镸PEG- 1有B圖像要處理。開(kāi)關(guān)有4種狀態(tài)，0是針對(duì)幀內(nèi) 編碼，“2”或“3”是用上一幀圖像(經(jīng)S2的虛線a/c)或用下一幀圖像(經(jīng)S2的實(shí)線 d/b) ，“4”是用了上一幀和下一幀兩幅圖像(經(jīng)S2的實(shí)線b和實(shí)線c)，這時(shí)候要相應(yīng)產(chǎn)生2 個(gè)運(yùn) 動(dòng)矢量。7.4 MPEG- 2視頻壓

30、縮編碼研究制定MPEG標(biāo)準(zhǔn)是為了使應(yīng)用于數(shù)字存儲(chǔ)媒體、電視廣播、通信等方面的運(yùn)動(dòng)圖像和伴音有一種通用的編碼方法。使用這個(gè)標(biāo)準(zhǔn)意味著運(yùn)動(dòng)圖像可以作為一種計(jì)算機(jī)數(shù)據(jù)來(lái)處理，并且能夠存儲(chǔ)在各種各樣的存儲(chǔ)器中，也可以在現(xiàn)有的或未來(lái)的網(wǎng)絡(luò)中傳送和接收，還可以在現(xiàn)在的或?qū)?lái)的廣播信道中廣播。這個(gè)標(biāo)準(zhǔn)的應(yīng)用很廣泛，覆蓋了從電視電話到高清晰度電視。 (1)劃分為不同的“Profile”和“Level”(“類”和“級(jí)”)。由于想使這個(gè)標(biāo)準(zhǔn)適用于各種不同的應(yīng)用，而各種應(yīng)用在碼率、分辨力、圖像質(zhì)量和服務(wù)方面要求又各不相同，所以希望這個(gè)標(biāo)準(zhǔn)要有通用性。在這個(gè)標(biāo)準(zhǔn)產(chǎn)生的過(guò)程中，考慮了各種應(yīng)用的不同要求，開(kāi)發(fā)了

31、必要的算法，并且把它們集中成為一種單一的句法。正因?yàn)槿绱耍@個(gè)標(biāo)準(zhǔn)使得各種不同應(yīng)用的碼流之間可以靈活地相互改變。既要使句法有通用性，又不能要求具體的解碼器全面滿足整個(gè)句法的需要，那樣具體的解碼器就太復(fù)雜了。為了解決通用性和特殊性的矛盾，設(shè)想將整個(gè)ISO/IEC的句法分成子集，這樣分的子集就稱為Profile，我們稱之為“類”。這個(gè)“類”規(guī)定的子集還覺(jué)得太大，有必要再分得細(xì)一些。例如圖像的盡寸有小的，有大的，大的可大到，實(shí)際上不會(huì)有一個(gè)解碼器能夠處理這么大的動(dòng)態(tài)范圍的圖像，因此，在Profile中又規(guī)定了“l(fā)evel”，稱為級(jí)。 ISO/IEC13818-2(即MPEG-2視頻)規(guī)定了5個(gè)類和4個(gè)級(jí)如表45所示。表45 MPEG- 2的Profile和Level類級(jí) Simple ProfileMain ProfileSNR ScalableProfileSpstially S

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第四章數(shù)字壓縮編碼技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第四章 數(shù)字壓縮編碼技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第四章數(shù)字壓縮編碼技術(shù)