




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章 數(shù)字壓縮編碼技術(shù)1 數(shù)字壓縮的必要性 數(shù)字信號(hào)有很多優(yōu)點(diǎn),但當(dāng)模擬信號(hào)數(shù)字化后其頻帶大大加寬,一路6MHz的普通電視信號(hào)數(shù)字化后,其數(shù)碼率將高達(dá)167Mbps,對(duì)儲(chǔ)存器容量要求很大,占有的帶寬將達(dá)80MHz左右,這 樣將使數(shù)字信號(hào)失去實(shí)用價(jià)值。數(shù)字壓縮技術(shù)很好地解決了上述困難,壓縮后信號(hào)所占用的頻帶大大低于原模擬信號(hào)的頻帶。因此說(shuō),數(shù)字壓縮編碼技術(shù)是使數(shù)字信號(hào)走向?qū)嵱没年P(guān)鍵技術(shù)之一,表41列出了各種應(yīng)用的碼率。表41 各種應(yīng)用的碼率應(yīng)用種類比特?cái)?shù)/象素象素?cái)?shù)/行行數(shù)/幀幀數(shù)/秒亮色比比特/秒(壓縮前)比特/秒(壓縮后)HDTV819201080304:1:11.18Gbps2025M
2、bps普通電視CCIR6018720480304:1:1167Mbps48Mbps會(huì)議電視CIF8352288304:1:136.5Mbps1.52Mbps桌上電視QCF8176144304:1:19.1Mbps128kbps電視電話8128112304:1:15.2Mbps56kbps有線電視網(wǎng)中數(shù)字壓縮技術(shù)主要包括用于會(huì)議電視系統(tǒng)的H.261壓縮編碼, 用于計(jì)算機(jī)靜止圖像壓縮的JPEG和用于活動(dòng)圖像壓縮的MPEG數(shù)字壓縮技術(shù)。2 圖像壓縮編碼的可能性 從信息論觀點(diǎn)來(lái)看,圖像作為一個(gè)信源,描述信源的數(shù)據(jù) 是信息量(信源熵)和信息冗余量之和。信息冗余量有許多種,如空間冗余,時(shí)間冗余,結(jié)構(gòu)冗余,
3、知識(shí)冗余,視覺(jué)冗余等,數(shù)據(jù)壓縮實(shí)質(zhì)上是減少這些冗余量??梢?jiàn)冗余量減少可以減少數(shù)據(jù)量而不減少信源的信息量。從數(shù)學(xué)上講,圖像可以看作一個(gè)多維函數(shù),壓縮描述這個(gè) 函數(shù)的數(shù)據(jù)量實(shí)質(zhì)是減少其相關(guān)性。另外在一些情況下,允許圖像有一定的失真,而并不妨礙圖像的實(shí)際應(yīng)用,那么數(shù)據(jù)量壓縮的可能性就更大了。3 圖像壓縮編碼方法的分類 編碼壓縮方法有許多種,從不同的角度出發(fā)有不同的分類方法,比如從信息論角度出發(fā)可分 為兩大類: (1)冗余度壓縮方法,也稱無(wú)損壓縮,信息保持編碼或熵編碼。具體講就是解碼圖像和壓縮 編碼前的圖像嚴(yán)格相同,沒(méi)有失真,從數(shù)學(xué)上講是一種可逆運(yùn)算。 (2)信息量壓縮方法,也稱有損壓縮,失真度編碼或
4、熵壓縮編碼。也就是講解碼圖像和原始圖像是有差別的,允許有一定的失真。 應(yīng)用在多媒體中的圖像壓縮編碼方法,從壓縮編碼算法原理上可以分類為: (1)無(wú)損壓縮編碼種類哈夫曼編碼 算術(shù)編碼 行程編碼 Lempel zev編碼 (2)有損壓縮編碼種類 預(yù)測(cè)編碼:DPCM,運(yùn)動(dòng)補(bǔ)償 頻率域方法:正文變換編碼(如DCT),子帶編碼 空間域方法:統(tǒng)計(jì)分塊編碼 模型方法:分形編碼,模型基編碼 基于重要性:濾波,子采樣,比特分配,矢量量化 (3)混合編碼 JBIG,H261,JPEG,MPEG等技術(shù)標(biāo)準(zhǔn) 衡量一個(gè)壓縮編碼方法優(yōu)劣的重要指標(biāo)是: (1)壓縮比要高,有幾倍、幾十倍,也有幾百乃至幾千倍; (2)壓縮與解
5、壓縮要快,算法要簡(jiǎn)單,硬件實(shí)現(xiàn)容易; (3)解壓縮的圖像質(zhì)量要好。 最后要說(shuō)明的是選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特征;多媒體系統(tǒng)(硬件和 軟件產(chǎn)品)的適應(yīng)能力;應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。 4 壓縮編碼方法簡(jiǎn)介壓縮編碼的方法有幾十種之多,并在編碼過(guò)程中涉及較深的的數(shù)學(xué)里理論基礎(chǔ)問(wèn)題,在此僅介紹 幾種常用的壓縮編碼方法,主要是從物理意義上作一定的解釋,讀者如對(duì)數(shù)據(jù)壓縮專題感興 趣的話,請(qǐng)參看講座結(jié)束后所附的參考資料。4.1 莫爾斯碼與信源編碼 莫爾斯碼即電報(bào)碼,其精華之處在于用短碼來(lái)表示常出現(xiàn)的英文字母,用長(zhǎng)碼來(lái)表示不常出 現(xiàn)的字母,以減小碼率。這種方法非常有效,故延用至今。電視信號(hào)經(jīng)過(guò)變
6、換后,例如經(jīng)差值脈沖編碼后,發(fā)現(xiàn)前后像素幅度差值小的概率大,而差值大的概率小,因此可用短碼表示 概率大的信號(hào),而用長(zhǎng)碼來(lái)代表概率小的信號(hào),從而達(dá)到壓縮碼率的目的。4.2 差值脈沖編碼 電視圖像基本上是由面積較大的像塊(如藍(lán)天、大地、服裝等)組成。雖然每個(gè)像塊的幅值各 不相同,但像塊內(nèi)各樣值的幅度是相近的或相同的,幅值躍變部分相應(yīng)于像塊的輪廓,只占整幅圖像的很小一部分。幀間相同的概率就更大了,靜止圖像相鄰幀間的相應(yīng)位置的像素完 全一樣,這意味著前后像素之差或前后幀間相應(yīng)位置像素之差為零或差值小的概率大,差值 大的概率小。這就是差值編碼的基本想法,其原理框圖見(jiàn)圖41(a)。發(fā)端將當(dāng)前樣值和前一 樣
7、值相減所得差值經(jīng)量化后進(jìn)行傳輸,收端將收到的差值與前一個(gè)樣值相加得到當(dāng)前樣值。 在這個(gè)原理圖中,輸出的當(dāng)前樣值是輸出的前一樣值加上收到的差值,由于在當(dāng)前差值中包 括當(dāng)前的量化誤差,而輸出的前一樣值又包括前一樣值的量化誤差,這就造成了量化誤差的 積累。因此實(shí)用電路為圖41(b)。這時(shí)輸入當(dāng)前樣值不是與輸入的前一樣值相減,而是與 輸 出的前一樣值相減,因此在差值中已經(jīng)包含了前一樣值的量化誤差的負(fù)值,在與輸出的前一 個(gè)樣值相加時(shí),這部分量化誤差被抵消,只剩下當(dāng)前的量化誤差,這就避免了量化誤差的積 累。4.3 預(yù)測(cè)編碼 預(yù)測(cè)編碼利用像素的相關(guān)性,可進(jìn)一步減小差值。 從前面的分析可以看出,如果差值編碼中
8、小幅度出現(xiàn)的機(jī)會(huì)增加,由于其對(duì)應(yīng)的碼長(zhǎng)較短, 總數(shù)碼率會(huì)進(jìn)一步減小。如果能猜出下一個(gè)樣值,那么差值就會(huì)是零,當(dāng)然這種情況是沒(méi)有 意義的,因?yàn)槿纛A(yù)先知道下一樣值,就不需要進(jìn)行通信了。但可以肯定,如果我們不僅利用 前后樣值的相關(guān)性,同時(shí)也利用其它行、其它幀的像素的相關(guān)性,用更接近當(dāng)前樣值的預(yù)測(cè) 值與當(dāng)前樣值相減,小幅度差值就會(huì)增加,總數(shù)碼率就會(huì)減小,這就是預(yù)測(cè)編碼的方法。預(yù) 測(cè)編碼的電路與差值編碼類似,或者說(shuō)差值編碼就是以前一樣值為預(yù)測(cè)值的預(yù)測(cè)編碼,又稱為一維預(yù)測(cè)。如果用到以前行的像素或以前幀的像素,則稱為二維或三維預(yù)測(cè)。在美國(guó)國(guó)際 電話電報(bào)公司(ITT)生產(chǎn)的數(shù)字電視機(jī)芯片中有一個(gè)視頻存儲(chǔ)控制器
9、芯片VMC2260就用了二維 預(yù)測(cè)編碼,預(yù)測(cè)器用了三個(gè)像素作為下一個(gè)像素的預(yù)測(cè)值,即預(yù)測(cè)值等于1/2前一像素加1/4 上一行相應(yīng)像素再加上1/4上一行相應(yīng)的前一像素。這樣不僅利用了前一像素的相關(guān)性,也 利用了上一行相應(yīng)像素的相關(guān)性,這樣做要比差值編碼有更大的碼率壓縮。如果再用上前一 幀的像素會(huì)進(jìn)一步降低數(shù)碼率。但為了得到前一幀的像素必須要使用幀存儲(chǔ)器,造價(jià)比較高 。只用到幀內(nèi)像素的處理稱為幀編碼(Intraframe Coding),用到前后幀像素的處理稱為幀 間編碼(Interframe Coding)。要得到較大的碼率壓縮就必須使用幀間編碼。JPEG是典型的幀內(nèi)編碼方案,而MPEG是幀間編
10、碼方法。前者大多用于靜止圖像處理,而后者主要用于對(duì)運(yùn) 動(dòng)圖像的處理。 4.4 哈達(dá)瑪特變換 這是一種有效地去除噪波的方法,噪波的存在往往容易和小幅度變化的信號(hào)相混淆,利用多幀平均的方法,對(duì)于靜止圖像,各幀相同,平均的結(jié)果其值不變,對(duì)于噪波,多幀平均趨于零。 但如果圖像中有運(yùn)動(dòng),多幀平均就會(huì)造成運(yùn)動(dòng)模糊,故不能簡(jiǎn)單地進(jìn)行平均,需要根據(jù)運(yùn)動(dòng)的大小來(lái)調(diào)節(jié)反饋量,即調(diào)節(jié)平均的程度,做到運(yùn)動(dòng)自適應(yīng)降噪。 大多數(shù)情況下是利用幀差信號(hào)來(lái)判斷圖像中是否有運(yùn)動(dòng),如果幀差小于一定值,就可視為是因噪波引起的,可取較大的反饋量;如果幀差大于一定值,就可視為圖像中有運(yùn)動(dòng)。 但在許多情況下,僅從幅度的大小來(lái)判斷是雜波還是
11、圖像是很困難的,如移動(dòng)的云,近攝的 綠草地等圖像信號(hào)所得到幀差信號(hào)也很小,所以BKU-904采用二維哈達(dá)瑪特變換(Hadamard Transform)來(lái)區(qū)分是噪波還是圖像信號(hào)。先將輸入值按42分成小塊,分別進(jìn)行實(shí)時(shí)快速哈 達(dá)瑪特變換(FHT)。 圖像經(jīng)變換后,轉(zhuǎn)換成相應(yīng)成分的系數(shù),這些系數(shù)分別代表直流分量;水平方向細(xì)節(jié)和色度 分量等;垂直方向細(xì)節(jié);斜方向細(xì)節(jié)及色度分量等,而噪波變換后均勻散在各系數(shù)中。這樣 就更有效地區(qū)分出信號(hào)和噪波,從而達(dá)到更有效地進(jìn)行自適應(yīng)降噪的目的。 4.5 離散余弦變換離散余弦變換(Discrete cosine Transform)簡(jiǎn)稱DCT。任何連續(xù)的實(shí)對(duì)稱函數(shù)的
12、傅里葉變換 中只含余弦項(xiàng),因此余弦變換與傅里葉變換一樣有明確 的物理量意義。DCT是先將整體圖像分成NN像素塊,然后對(duì)NN像素塊逐一進(jìn)行DCT變換。 由于 大多數(shù)圖像的高頻分量較小,相應(yīng)于圖像高頻成分的系數(shù)經(jīng)常為零,加上人眼對(duì)高頻成分的 失真不太敏感,所以可用更粗的量化,因此傳送變換系數(shù)所用的數(shù)碼率要大大小于傳送圖像 像素所用的數(shù)碼率。到達(dá)接收端后再通過(guò)反離散余弦變換回到樣值,雖然會(huì)有一定的失真 ,但人眼是可以接受的。 N代表像素?cái)?shù),一般N=8,88的二維數(shù)據(jù)塊經(jīng)DCT后變成88個(gè)變換系數(shù),這些系數(shù)都 有 明確的物理意義:U代表水平像素號(hào),V代表垂直像素號(hào)。如當(dāng)U=0,V=0時(shí),F(xiàn)(0,0)是
13、原 64個(gè) 樣值的平均,相當(dāng)于直流分量,隨著U、V值增加,相應(yīng)系數(shù)分別代表逐步增加的水平空間頻 率分量和垂直空間頻率分量的大小。4.6 量化(Q) 嚴(yán)格說(shuō)DCT本身并不能進(jìn)行碼率壓縮,因?yàn)?4個(gè)樣值仍然得到64個(gè)系數(shù),如圖42所示。這 里 給出了一個(gè)88像塊的具體例子,經(jīng)DCT變換后,比特?cái)?shù)增加了。在這個(gè)例子中樣值是8比特 ,從0225得到的即直流分量的最大值是原來(lái)256的64/8倍,即02047,交流分 量的范圍是-10241023。只是在經(jīng)過(guò)量化后,特別是按人眼的生理特征對(duì)低頻分量和高頻分 量設(shè)置不同的量化,會(huì)使大多數(shù)高頻分量的系數(shù)變?yōu)榱?。一般說(shuō)來(lái),人眼對(duì)低頻分量比較敏 感,而對(duì)高頻分量不
14、太敏感。因此對(duì)低頻分量采用較細(xì)的量化,而對(duì)高頻分量采用較粗的量 化。 所謂量化,即根據(jù)不同的要求,設(shè)置不同的量化等級(jí),從而降低數(shù)碼率。 4.7 游程長(zhǎng)度編碼 讀出數(shù)據(jù)和表示數(shù)據(jù)的方式也是減少碼率的一個(gè)重要因素。讀出的方式可以有多種選擇 ,如 水平逐行讀出、垂直逐列讀出、之字型讀出和交替讀出等,其中之字型讀出(ZigZag) 是最常用的一種。由于經(jīng)DCT變換以后,系數(shù)大多數(shù)集中在左上角,即低頻分量區(qū),因此之 字型讀出實(shí)際上是按二維頻率的高低順序讀出系數(shù)的,這樣一來(lái)就為游程長(zhǎng)度編碼(Runleng th Encoding)創(chuàng)造了條件。所謂游程長(zhǎng)度編碼是指一個(gè)碼可同時(shí)表示碼的值和前面幾個(gè)零, 這樣就
15、可以把之字型讀出的優(yōu)點(diǎn)顯示出來(lái)了。因?yàn)橹中妥x出在大多數(shù)情況下出現(xiàn)連零的機(jī) 會(huì)比較多,尤其在最后,如果都是零,在讀到最后一個(gè)數(shù)后只要給出“塊結(jié)束”(EOB)碼, 就可以結(jié)束輸出,因此節(jié)省了很多碼率。 游程長(zhǎng)度指的是由字構(gòu)成的數(shù)據(jù)流中各個(gè)字符連續(xù)重復(fù)出現(xiàn)而形成字符串的長(zhǎng)度。 基本的游程編碼就是在數(shù)據(jù)流中直接用三個(gè)字符來(lái)給出上述三種信息,其數(shù)據(jù)結(jié)構(gòu)如圖43 所示。 SC表示有一個(gè)字符串在此位置,X代表構(gòu)成串的字符,CC代表串的長(zhǎng)度。 游程編碼和哈夫曼編碼等屬于統(tǒng)計(jì)編碼。 4.8 霍夫曼編碼 霍夫曼編碼是可變字長(zhǎng)編碼(VLC)的一種。 Huffman于1952年提出一種編碼方法,該方法完全依據(jù)字符出
16、現(xiàn)概率來(lái)構(gòu)造異字頭的平均長(zhǎng) 度最短的碼字,有時(shí)稱之為最佳編碼,一般就叫作Huffman編碼。下面引證一個(gè)定理,該定 理保證了按字符出現(xiàn)概率分配碼長(zhǎng),可使平均碼長(zhǎng)最短。 定理:在變字長(zhǎng)編碼中,如果碼字長(zhǎng)度嚴(yán)格按照對(duì)應(yīng)符號(hào)出現(xiàn)的概率大小逆序排列,則其平 均碼字長(zhǎng)度為最小。 現(xiàn)在通過(guò)一個(gè)實(shí)例來(lái)說(shuō)明上述定理的實(shí)現(xiàn)過(guò)程。設(shè)將信源符號(hào)按出現(xiàn)的概率大小順序排列為 : U:(a1a2a3a4a5a6a7)0.200.190.180.170.150.100.01 給概率最小的兩個(gè)符號(hào)a6與a7分別指定為“1”與“0”,然后將它們的概率相加再與原來(lái)的 a1a5組合并重新排序成新的原為:U:(a1a2a3a4a5a
17、6)0.200.190.180.170.150.11 對(duì)a5與a6分別指定“1”與“0”后,再作概率相加并重新按概率排序得U:(0.26 0.20 0.19 0.18 0.17) 直到最后得 U:(0.61 0.39) 分別給以“0”,“1”為止,如圖44所示。 霍夫曼編碼的具體方法:先按出現(xiàn)的概率大小排隊(duì),把兩個(gè)最小的概率相加,作為新的概率 和剩余的概率重新排隊(duì),再把最小的兩個(gè)概率相加,再重新排隊(duì),直到最后變成1。每次相 加時(shí)都將“0”和“1”賦與相加的兩個(gè)概率,讀出時(shí)由該符號(hào)開(kāi)始一直走到最后的“1”, 將路線上所遇到的“0”和“1”按最低位到最高位的順序排好,就是該符號(hào)的霍夫曼編碼。 例如
18、a7從左至右,由U至U,其碼字為0000; a6按踐線將所遇到的“0”和“1”按最低位到最高位的順序排好,其碼字為0001 用霍夫曼編碼所得的平均比特率為:碼長(zhǎng)出現(xiàn)概率 上例為: 0.22+0.192+0.183+0.173+0.153+0.14+0.014=2.72 bit 可以算出本例的信源熵為2.61bit,二者已經(jīng)是很接近了。 4.9 運(yùn)動(dòng)估計(jì)的運(yùn)動(dòng)補(bǔ)償編碼 這是一種幀間編碼的方法,其原理是利用幀間的空間相關(guān)性,減小空間冗余度。 幀間編碼為什么可以減小冗余度,這是因?yàn)閮蓭g有很大的相似性。如果將前后兩幀相減 (移動(dòng)物體作相應(yīng)位移)得到的誤差作編碼所需比特要比幀內(nèi)編碼所需的比特少,幀間
19、差集中 在零附近,可以用短的碼字傳送。 實(shí)現(xiàn)幀間編碼的方法是運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償。用圖45來(lái)說(shuō)明這個(gè)過(guò)程。 當(dāng)前幀在過(guò)去幀的窗口中尋找匹配部分,從中找到運(yùn)動(dòng)矢量; 根據(jù)運(yùn)動(dòng)矢量,將過(guò)去幀位移,求得對(duì)當(dāng)前幀的估計(jì); 將這個(gè)估計(jì)和當(dāng)前幀相減,求得估計(jì)的誤差值; 將運(yùn)動(dòng)矢量和估計(jì)的誤差值送到接收端去。 接收端根據(jù)收到的運(yùn)動(dòng)矢量將過(guò)去幀作位移(也就是對(duì)當(dāng)前幀的估計(jì)),再加上接收到的誤差 值,就是當(dāng)前幀了。 圖47 運(yùn)動(dòng)估計(jì)的全局搜索塊匹配 實(shí)際上,在做運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償時(shí),是以1616的塊(稱宏塊)逐個(gè)進(jìn)行的,如圖46所示 ,這是將當(dāng)前幀劃分為NN(1616)的塊。對(duì)每一塊在過(guò)去幀中范圍為的范圍內(nèi)進(jìn)行搜
20、索,以求得最優(yōu)匹配,從而得到運(yùn)動(dòng)矢量的估值(dx,dy)。衡量匹配好壞 的準(zhǔn)則可以是均方誤差最小準(zhǔn)則。搜索方法可以是全局搜索法,即對(duì)搜索范圍內(nèi)的每一點(diǎn)都 計(jì)算均方誤差,選最小值即對(duì)應(yīng)最優(yōu)匹配,如圖47所示。 5 JPEG標(biāo)準(zhǔn) JPEG是Joint Photographic Experts Group的縮寫,主要用于計(jì)算機(jī)靜止圖像的壓縮,在用 于活動(dòng)圖像時(shí),其算法僅限于幀內(nèi),便于編輯。 采用JPEG標(biāo)準(zhǔn)可以得到不同壓縮比的圖像,在使圖像質(zhì)量得到保證的情況下,可以從每個(gè)像 素24bit減到每個(gè)像素1bit甚至更小。 JPEG標(biāo)準(zhǔn)所根據(jù)的算法是基于DCT(離散余弦變換)和可變長(zhǎng)編碼。系統(tǒng)框圖如圖48
21、所示, 從圖中可見(jiàn),JPEG的關(guān)鍵技術(shù)有變換編碼、量化、差分編碼、運(yùn)動(dòng)補(bǔ)償、霍夫曼編碼和游程 編碼等。 圖48 JPEG系統(tǒng)框圖 6 H.261標(biāo)準(zhǔn) JPEG算法的原理是利用單幀內(nèi)的空間相關(guān)性,減小空間冗余度,這種方式稱為幀內(nèi)編碼。我 們知道電視圖像(包括各種活動(dòng)圖像)各個(gè)連續(xù)幀之間也有很大的相關(guān)性,稱為時(shí)間相關(guān)性。 為了進(jìn)一步提高圖像壓縮比,要設(shè)法減小時(shí)間冗余度,這種編碼方式稱為幀間編碼。H.261 是用于會(huì)議電視的國(guó)際標(biāo)準(zhǔn),既采用了幀內(nèi)編碼,又采用了幀間編碼,因此它的壓縮比大致 是JPEG的三倍。 H.261標(biāo)準(zhǔn)用于音象業(yè)務(wù)的碼率是p64kbps(p=1,2,30)。用于電視電話時(shí)p=1或
22、2,用 于電視會(huì)議時(shí)p6。這種標(biāo)準(zhǔn)具有最小延遲實(shí)時(shí)對(duì)話的能力。 圖49是H.261編碼器的原理框圖。從編碼器中看到,它有一個(gè)和解碼器一樣的過(guò)程,解出 的圖像放在運(yùn)動(dòng)補(bǔ)償 預(yù)測(cè)器(存儲(chǔ)器)中形成過(guò)去幀,它的輸出和當(dāng)前幀一起加到“運(yùn)動(dòng)估計(jì)”,求得的運(yùn)動(dòng)矢 量一方面經(jīng)VLC送到復(fù)用器中去,另一方面加到運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)器中,使之產(chǎn)生估計(jì)幀(對(duì)當(dāng)前 幀),它和當(dāng)前幀相減即求得差值,這個(gè)差值經(jīng)DCT和Q、VLC也送到復(fù)用器中去。 圖49 H.261編碼器的原理框圖 在進(jìn)行幀間編碼時(shí),編碼器和解碼器必須使用相同的預(yù)測(cè)器,否則兩者會(huì)脫軌。為了獲得重 建圖像,被量化以后的系數(shù)要用一個(gè)反量化器和反余弦變換(IDCT)
23、來(lái)處理,為防止編碼器和 解碼器慢慢漂移分離,必須對(duì)誤差的平均值加以嚴(yán)格規(guī)定,即使如此,仍然要周期地使用幀 內(nèi)編碼,使解碼器處于一個(gè)已知狀態(tài)。 運(yùn)動(dòng)補(bǔ)償單元使幀間差最小,從而減少所需傳輸碼率。搜索窗的大小在水平和垂直方向上都 是15個(gè)采樣值。通常只對(duì)亮度信號(hào)作運(yùn)動(dòng)估計(jì),但運(yùn)動(dòng)補(bǔ)償不僅作用于亮度,也作用于色 度(亮度象素位移的一半)。 圖410畫出了解碼器的框圖。被壓縮的數(shù)據(jù)送入緩沖器,然后作可變長(zhǎng)度解碼,解碼器余 下的 部分相似于編碼器的后端,僅有的區(qū)別是不再需要運(yùn)動(dòng)估計(jì)。運(yùn)動(dòng)矢量和其它附帶的信息是 直接從可變長(zhǎng)解碼器的輸出得到的。 在編碼器的輸出端有緩沖器(Buffer),這是因?yàn)榫幋a過(guò)程產(chǎn)生
24、的比特率不是 恒定的,它取決于運(yùn)動(dòng)序列中各點(diǎn)的圖像統(tǒng)計(jì)特征。在圖像的“簡(jiǎn)單”部分允許節(jié)省一些比 特,而在“復(fù)雜”的部分要多花一些比特。對(duì)于每一個(gè)編碼圖像,比特的數(shù)目也允許變更。 但是在傳輸網(wǎng)絡(luò)中的數(shù)據(jù)的比特率又必須是恒定的,所以在視頻編碼器的輸出端必須有數(shù)據(jù) 緩沖器來(lái)提供平滑的作用。相反的,在解碼器要以非恒定的速率來(lái)利用接收到的信息,所以 也要包含一個(gè)解碼器的緩沖器。 圖410 H.261的解碼器框圖 在傳輸中,幀頻的長(zhǎng)期平均值是CIF的標(biāo)準(zhǔn)值,但是在短的時(shí)間間隔內(nèi)幀頻會(huì)有一定變化。 表42 CIF和QCIF格式格 式CIFQCIF信號(hào)分量行數(shù)/幀象素?cái)?shù)/行行數(shù)/幀象素?cái)?shù)/行 亮度(Y)288
25、360(352)144180(176) 色度(Cb)144180(176)7290(88) 色度(Cr)144180(176)7290(88)注:CIF和QCIF幀頻是每秒30幀。H.261的一幅圖像是由塊(Block)組成宏塊(Macroblock),宏塊組成圖像組(GO B),圖像組組 成圖像,如圖411所示。 兩種格式的碼率為:CIF:152Mbps QCIF:128kbps 7 MPEG- 1和MPEG-2標(biāo)準(zhǔn) MPEG(Moving Picture Expert Group)意思是“運(yùn)動(dòng)圖像專家組”。這個(gè)專家組的任務(wù) 是為了對(duì)數(shù)字存儲(chǔ)媒質(zhì)、電視廣播、通信等方面的運(yùn)動(dòng)圖像和伴音給出一種
26、通用的編碼 方法 。符合這種編碼方法的運(yùn) MPEG用句法規(guī)定了一個(gè)層次性的結(jié)構(gòu),共分六層。這六層是圖像序列(Video Sequence)-圖像組(Group of Picture)-圖像(Picture)-宏塊條(Silce)- 宏塊(Macroblock )-塊(Block)。 一個(gè)圖像包含亮度陣列和色度陣列。在MPEG- 1中亮度和色度的格式是420,而在MPEG-2 中,除這一格式外,還允許有422及444。 六個(gè)層次有其不同的功能,如表43所示。表43 MPEG1/2規(guī)定的層次功能語(yǔ)法規(guī)定的層次功 能語(yǔ)法規(guī)定的層次功 能序列層(Sequence layer)隨機(jī)存取段落宏塊條層(Sl
27、ice layer)重新同步單元 圖像組層(Group of picture layer)隨機(jī)存取視頻單元宏塊層(Macroblock layer)運(yùn)動(dòng)補(bǔ)償單元 圖像層(Picture layer)基本編碼單元塊層(Block layer)DCT單元所謂420是指在垂直方向每隔一行去除一行色度信號(hào)。 7.2 MPEG-1和MPEG-2中三種類型圖像MPEG在利用塊匹配運(yùn)動(dòng)補(bǔ)償來(lái)減小時(shí)間冗余度時(shí),不僅用上一幀的圖像預(yù)測(cè)當(dāng)前圖像, 而且也使用下一幀圖像預(yù)測(cè)當(dāng)前圖像,即雙向預(yù)測(cè),這是和H.261標(biāo)準(zhǔn)有重要區(qū)別的地方。 因此 ,MPEG-1和2中有三種類型圖像,即I、B、P三種,如圖412所示。I幀是
28、幀內(nèi)編碼,P幀是正向預(yù)測(cè),如圖413所示,通過(guò)正向預(yù)測(cè)得到的圖。B幀是雙向預(yù)測(cè)圖 ,如圖414所示。由于B幀不能作其他圖像的基準(zhǔn),所以對(duì)B幀編碼校粗(步長(zhǎng)較大),需要比特?cái)?shù)比預(yù)測(cè)圖P少。7.3 MPEG- 1的視頻壓縮編碼MPEG-1中視頻編碼的關(guān)鍵壓縮技術(shù)和H.261一樣,仍是DCT、運(yùn)動(dòng)補(bǔ)償和Huffman編碼。編碼 器和解碼器的原理框圖也和H.261沒(méi)有區(qū)別。 MPEG-1的信源輸入格式是SIF(Source Input Format)。CCIR601格式的信源要轉(zhuǎn)換成SIF后進(jìn) 入MPEG- 1編碼器,解碼器輸出也是SIF格式,顯示時(shí)要經(jīng)內(nèi)插,擴(kuò)充為CCIR601格式。PAL/NT S
29、C都作如此處理。SIF格式如表44所示。表44 SIF(525/625)格式信號(hào)分量行數(shù)/幀象素?cái)?shù)/行亮度(Y)240/288352 色度(Cb)120/144176色度(Cr)120/144176圖415所示為MPEG-1視頻編碼器。圖中和H.261不同的部分是有二組運(yùn)動(dòng)補(bǔ)償和存儲(chǔ)器, 并有相應(yīng)的轉(zhuǎn)換開(kāi)關(guān)。這是因?yàn)镸PEG- 1有B圖像要處理。開(kāi)關(guān)有4種狀態(tài),0是針對(duì)幀內(nèi) 編碼,“2”或“3”是用上一幀圖像(經(jīng)S2的虛線a/c)或用下一幀圖像(經(jīng)S2的實(shí)線 d/b) ,“4”是用了上一幀和下一幀兩幅圖像(經(jīng)S2的實(shí)線b和實(shí)線c),這時(shí)候要相應(yīng)產(chǎn)生2 個(gè)運(yùn) 動(dòng)矢量。7.4 MPEG- 2視頻壓
30、縮編碼 研究制定MPEG標(biāo)準(zhǔn)是為了使應(yīng)用于數(shù)字存儲(chǔ)媒體、電視廣播、通信等方面的運(yùn)動(dòng)圖像和 伴音 有一種通用的編碼方法。使用這個(gè)標(biāo)準(zhǔn)意味著運(yùn)動(dòng)圖像可以作為一種計(jì)算機(jī)數(shù)據(jù)來(lái)處理 ,并且能夠存儲(chǔ)在各種各樣的存儲(chǔ)器中,也可以在現(xiàn)有的或未來(lái)的網(wǎng)絡(luò)中傳送和接收,還可以在現(xiàn)在的或?qū)?lái)的廣播信道中廣播。 這個(gè)標(biāo)準(zhǔn)的應(yīng)用很廣泛,覆蓋了從電視電話到高清晰度電視。 (1)劃分為不同的“Profile”和“Level”(“類”和“級(jí)”)。由于想使這個(gè)標(biāo)準(zhǔn)適用于各種不同的應(yīng)用,而各種應(yīng)用在碼率、分辨力、圖像質(zhì)量和服務(wù)方面要求又各不相同,所以希望這個(gè)標(biāo)準(zhǔn)要有通用性。在這個(gè)標(biāo)準(zhǔn)產(chǎn)生的過(guò)程中,考慮了各種應(yīng)用的不同要求,開(kāi)發(fā)了
31、必要的算法,并且把它們集中成為一種單一的句法。正因?yàn)槿绱耍@個(gè)標(biāo)準(zhǔn)使得各種不同應(yīng)用 的碼 流之間可以靈活地相互改變。 既要使句法有通用性,又不能要求具體的解碼器全面滿足整個(gè)句法的需要,那樣具體的解碼器就太復(fù)雜了。為了解決通用性和特殊性的矛盾,設(shè)想將整個(gè)ISO/IEC的句法分成子集,這樣分的子集就稱為Profile,我們稱之為“類”。這個(gè)“類”規(guī)定的子集還覺(jué)得太大,有必要再分得細(xì)一些。例如圖像的盡寸有小的,有大的,大的可大到,實(shí)際上不會(huì)有一個(gè)解碼器能夠處理這么大的動(dòng)態(tài)范圍的圖像,因此,在Profile中又規(guī)定了“l(fā)evel”,稱為級(jí)。 ISO/IEC13818-2(即MPEG-2視頻)規(guī)定了5個(gè)類和4個(gè)級(jí)如表45所示。表45 MPEG- 2的Profile和Level類級(jí) Simple ProfileMain ProfileSNR ScalableProfileSpstially S
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 45133-2025氣體分析混合氣體組成的測(cè)定基于單點(diǎn)和兩點(diǎn)校準(zhǔn)的比較法
- 信訪合同范本
- 單位采購(gòu)柜子合同范本
- 出售餐飲椅子合同范本
- 單位同意入職合同范本
- 出租轉(zhuǎn)讓吊車合同范本
- 個(gè)人購(gòu)買黃金合同范本
- 信息咨詢合作合同范本
- 農(nóng)資商店用工合同范本
- 單位用人聘用合同范本
- 基于單片機(jī)的老人跌倒報(bào)警裝置獲獎(jiǎng)科研報(bào)告
- 呼吸機(jī)及管路的管理課件
- 維修質(zhì)量檢驗(yàn)制度
- 統(tǒng)計(jì)學(xué)主要計(jì)算公式21098
- 品質(zhì)控制計(jì)劃(QC工程圖)
- DB15T 1193-2017 城市供水行業(yè)反恐怖防范要求
- 汽車營(yíng)銷學(xué)(全套課件)
- 現(xiàn)澆墩臺(tái)身軸線偏位、全高豎直度檢測(cè)記錄表
- 激光共聚焦顯微鏡校準(zhǔn)規(guī)范編制說(shuō)明
- 靜脈竇血栓(共56張)課件
- 樓板配筋計(jì)算表格(自動(dòng)版)
評(píng)論
0/150
提交評(píng)論