版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第七章數(shù)據(jù)壓縮編碼技術(shù)本章導讀 數(shù)據(jù)壓縮編碼技術(shù)是多媒體技術(shù)的核心技術(shù),在多媒體技術(shù)中占主導地位。通過數(shù)據(jù)壓縮編碼,去除了多媒體信息中的數(shù)據(jù)冗余,大大減少了數(shù)據(jù)量,為多媒體數(shù)據(jù)的存儲、傳輸、處理奠定了基礎(chǔ)。本章主要介紹數(shù)據(jù)壓縮編碼技術(shù)中的基本概念、典型的數(shù)據(jù)壓縮算法以及多媒體數(shù)據(jù)壓縮的幾個標準。 本章主要內(nèi)容7.1 數(shù)據(jù)壓縮技術(shù)概述7.2 數(shù)據(jù)壓縮技術(shù)原理7.3 JPEG靜止圖像壓縮標準簡介7.4 運動圖像壓縮標準MPEG7.5 H.26視聽通信編/解碼標準系列7.1 數(shù)據(jù)壓縮技術(shù)概述7.1.1 數(shù)據(jù)壓縮的概念 采樣數(shù)據(jù)不僅僅是所代表的原始信息本身,還包含著其它一些沒必要保留的(確定的、可推知
2、的)信息,即存在著數(shù)據(jù)冗余。 數(shù)據(jù)壓縮就是從采樣數(shù)據(jù)中去除冗余,即保留原始信息中變化的、特征性信息,去除重復的、確定的或可推知的信息,在實現(xiàn)更接近實際媒體信息描述的前提下,盡可能的減少描述用的信息量。 7.1.2 多媒體數(shù)據(jù)的冗余 一般而言,多媒體數(shù)據(jù)中存在的數(shù)據(jù)冗余情況主要有以下幾種:編碼冗余(信息熵冗余) 編碼所用數(shù)據(jù)位數(shù)大于其信息熵。2. 空間冗余 是圖像數(shù)據(jù)通常存在的一種數(shù)據(jù)冗余。在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面特性具有相關(guān)性,也就是說,同一景物表面上各采樣點的顏色之間往往存在著空間連貫性,如下圖中的天空和湖水。 3. 時間冗余 在圖像序列中,時間冗余就是相鄰幀圖像之間有較大相
3、關(guān)性,一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景重構(gòu)出來。 (a) 前一幀圖像(b) 后一幀圖像4. 結(jié)構(gòu)冗余 圖像一般都有非常強的紋理結(jié)構(gòu)。如草席、磚墻、地板、天花板等圖像,它們一般都是比較有規(guī)律的紋理結(jié)構(gòu),如下圖所示。這類圖像在結(jié)構(gòu)上存在冗余。 5. 知識冗余 圖像的理解與某些基礎(chǔ)知識有相當大的相關(guān)性。例如:人臉的圖像有固定的結(jié)構(gòu),比如說嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于臉的中線上等等。這類規(guī)律性的結(jié)構(gòu)可由先驗知識和背景知識得到,稱此類冗余為知識冗余。 6. 視覺冗余 人類的視覺系統(tǒng)對于圖像場的敏感性是非均勻的和非線性的,人眼并不能覺察圖像場的所有變化,而是依據(jù)視覺特性
4、有取舍的進行觀察。對亮度變化敏感,對色度的變化不敏感;對物體邊緣敏感,而對內(nèi)部區(qū)域不敏感;對整體結(jié)構(gòu)敏感,而對內(nèi)部細節(jié)相對不敏感;這些敏感因素的灰度等級僅為26級,而一般數(shù)字圖像的量化采用的是28灰度等級以上,很明顯存在著視覺冗余。 7. 聽覺冗余 人耳對不同頻率的聲音的敏感性是不同的,聽覺系統(tǒng)并不能察覺所有頻率的變化,對某些頻率也不必特別關(guān)注,因此存在聽覺冗余。 8. 紋理統(tǒng)計冗余 有些圖像紋理盡管不嚴格服從某一分布規(guī)律,但是它在統(tǒng)計的意義上服從該規(guī)律。利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,所以我們稱之為紋理的統(tǒng)計冗余。 7.1.3 數(shù)據(jù)壓縮技術(shù)的發(fā)展過程 20世紀40年代,人們開始系統(tǒng)地
5、研究數(shù)據(jù)壓縮技術(shù);主要表現(xiàn)在數(shù)據(jù)壓縮算法方面: 首先是Claude Shannon與R.M.Fano的Shannon-Fano編碼方法; 1952年,D.A.Huffman提出了Huffman編碼方法; 1968年,P.Elias 發(fā)展了Shannon-Fano編碼,構(gòu)造出更為完美的Shannon-Fano-Elias 編碼。 1976年,J.Rissanen 提出了一種可以成功地逼近信息熵極限的編碼方法算術(shù)編碼。 1982年,Rissanen 和G.G.Langdon 一起改進了算術(shù)編碼。 1977年,Jacob Ziv和Abraham Lempel提出了LZ77編碼算法,78年又作了改進,
6、被稱為LZ78編碼算法。 1984年,Terry Welch提出了LZ78算法的變種算法LZW。 LZ77、LZ78、LZW三種壓縮技術(shù)就是目前無損壓縮領(lǐng)域中最為流行的、被稱為“字典式編碼”的壓縮技術(shù)。 7.1.3 數(shù)據(jù)壓縮技術(shù)的發(fā)展過程(續(xù)) 數(shù)據(jù)壓縮標準逐漸形成,有損壓縮算法快速出現(xiàn)。 1986年開始制定靜態(tài)圖像壓縮標準, 1994 年后成為國際標準,稱為JPEG標準。 ITU制定的電視會議系列標準(H.261、H.262、H.263 、H.264等)以及由ISO制定的視頻系列標準(MPEG-1、MPEG-2、MPEG-4)中,均采用了有損壓縮原理作為其核心壓縮算法。其中的MPEG-4標準
7、(相當于ITU的H.263和H.263+標準)是為了適應(yīng)網(wǎng)絡(luò)視頻的需求特點而制定的,具有更高的壓縮比、支持并發(fā)數(shù)據(jù)流編碼、基于內(nèi)容的交互操作、增強的時間域隨機存取、容錯、基于內(nèi)容的尺度可變性等新特性。 7.1.4 數(shù)據(jù)壓縮的分類1、按照壓縮內(nèi)容 分為音頻數(shù)據(jù)壓縮、靜態(tài)圖像數(shù)據(jù)壓縮、視頻數(shù)據(jù)壓縮和其他數(shù)據(jù)文件壓縮等四種類型。 2、按照壓縮方式分為對稱壓縮和非對稱壓縮兩種類型。 3、按照壓縮效果 分為有損壓縮與無損壓縮兩種類型。普通數(shù)據(jù)文件,一般采用無損壓縮,對于冗余度較小的圖像,需要采用有損壓縮。 4、按照算法思想 分為信息熵編碼、預測編碼、變換編碼、混合編碼以及其他編碼等五種,每種類型包含了一
8、些具體算法,如下圖。 7.1.5 數(shù)據(jù)壓縮的主要指標 衡量不同壓縮方法優(yōu)劣的技術(shù)指標是相同的,主要包括以下幾個方面。 1)壓縮比:指壓縮前后的數(shù)據(jù)量之比,它反映了施加某壓縮算法之后,數(shù)據(jù)量減少的比例; 2)恢復效果:指經(jīng)解壓縮算法對壓縮數(shù)據(jù)進行處理后所得到的數(shù)據(jù)與其表示的原信息的相似程度; 3)算法簡單、速度快:主要指實現(xiàn)算法的復雜度。 7.2 數(shù)據(jù)壓縮技術(shù)原理7.2.1 信息熵與編碼1、信息熵的概念 信息論中,編碼數(shù)據(jù)量與所表示的信息量以及冗余信息之間的關(guān)系為:數(shù)據(jù)量信息量冗余量 信息熵用來度量信息量的大小。對于單個事件(如字符)來說,其信息熵定義為:H(i)= - log2(Pi)(bit
9、) (1)公式(1)表示發(fā)生概率為Pi的事件i所具有的信息熵為H(i),單位為bit(比特)。 對于一個消息隊列(如字符串)的信息熵定義為: H(X) = -Pilog2(Pi)= PiH(i) (2) 其中,Pi表示某一事件i發(fā)生的概率。 例如:有一字符串“babbdcaacb”包含a、b、c、d四種字符,其長度為10,字符a、b、c、d分別出現(xiàn)了3、4、2、1次,則a、b、c、d在信息中出現(xiàn)的概率分別為0.3、0.4、0.2、0.1,它們的熵分別為: H(a)=-log2(0.3)1.737(bit) H(b)=-log2(0.4)1.322(bit) H(c)=-log2(0.2)2.3
10、22(bit) H(d)=-log2(0.1)3.322(bit) 每種字符的信息熵就是該字符編碼所用的理想位數(shù)(二進制)。整條信息的熵就是表達整個字符串需要的位數(shù)(這里用字符出現(xiàn)的次數(shù)代替概率):H(X)=-Pilog2(Pi) =H(a)3+H(b)4+H(c)2+H(d)1 =18.465(bit)2、編碼 編碼實質(zhì)上是對要處理的源數(shù)據(jù)或源文件按一定的規(guī)則進行變換(映射),力圖用盡可能少的符號代碼來表示較多、較長的源符號信息。編碼方法中的碼字(代碼)有固定長度和可變長度兩種。 3、壓縮模型 模型是規(guī)則和數(shù)據(jù)的集合,即:壓縮算法=模型+編碼 4、壓縮、還原 壓縮是指設(shè)法去掉部分或全部冗余,
11、從而減少文件或數(shù)據(jù)所占的存儲空間; 還原(解壓縮)則是指利用相反的算法使文件或數(shù)據(jù)恢復原狀。7.2.2 無損壓縮編碼1、Shannon-Fano編碼簡稱為S-F編碼,是一種變長編碼,其基本思想是按信源符號出現(xiàn)的概率大小進行排序,出現(xiàn)概率大的分配短碼,反之則分配長碼。具體編碼過程如下: (1)信源符號按概率遞減順序排列。(2)把符號序列分成上下兩部分,使上下兩部分的概率和相等或接近相等。(3)對上部分子序列編碼為“0”,相當于左子樹,對下部分子序列編碼為“1”,相當于右子樹。(4)重復上述步驟,直到每個子序列只包含一個符號為止。 舉例:有信源字符序列S為: aaabbceeehddabafffb
12、dddgghhabccedabdgghha 其長度為40個字符,由a、b、c、d、e、f、g、h共8種字符構(gòu)成。假設(shè)在編碼之前,每種字符出現(xiàn)的概率已由某種模型統(tǒng)計出來,用-來表示,具體值分別為: a-8,b-6,c-3,d-7,e-4,f-3,g-4,h-5a - 8d - 7b - 6h - 5e - 4g - 4c - 3f - 3a - 8d - 7b - 6h - 5e - 4g - 4c - 3f - 3(a)第一步(b)第二步解:首先將信源符號按概率遞減順序排列,形成圖(a)所示結(jié)果,然后,再把符號序列分成上下兩部分,使上下兩部分的概率和相等或接近相等,形成圖(b)所示結(jié)果。其中上
13、部分符號序列概率和為21,編碼為0;下部分為19,編碼為1。 最后再重復第二步,不斷對子符號序列進行劃分,最后得到一棵二叉樹,如圖(c)所示。 從根到葉形成編碼,最終得到的符號編碼分別為: a-00, b-011, c-1110,d-010, e-101,f-1111,g-110, h-100。 信源字符序列S的編碼總位數(shù)L等于每種字符編碼位數(shù)與字符出現(xiàn)次數(shù)乘積的和,即: L=2836433734433435 118(位) 如果直接用ASCII碼,則要用408320位。因此,S-F編碼實現(xiàn)了數(shù)據(jù)壓縮。 2、Huffman編碼 其編碼思想與Shannon-Fano編碼方法基本一致,但構(gòu)造二叉樹的
14、方法則相反,不是自上而下,而是自下而上、從樹葉到樹根生成二叉樹。具體編碼過程如下: (l)將信源符號按概率遞減順序排列;(2)把兩個最小的概率加起來,作為新符號的概率;(3)重復步驟(1)和(2),直到概率達到“1”為止;(4)在每次合并消息時,將被合并的消息賦于“1”和“0”或“0”和“l(fā)”;(5)尋找從每一信源符號到概率為“1”處的路徑,記錄下路徑上的“l(fā)”和“0”;(6)對每一符號寫出從碼樹的根到終結(jié)點的“l(fā)”、“0”序列。例如,對于信源 其編碼過程如下: x1 x2 x3 x4 x5 x6X= 0.25 0.25 0.20 0.15 0.10 0.05最后得到的編碼為:x1 01,x2
15、 10,x3 - 11,x4 000,x5 -0010,x6 -0011。其中x1、x2、x3的碼長為2,x4的碼長為3,x5、x6的碼長為4,平均碼長為2.45。0.050.150.450.553、算術(shù)編碼 算術(shù)編碼也是一種信息熵編碼方法,它用0到1之間的一個實數(shù)對輸入的信息進行編碼。用到兩個基本的參數(shù),一是信源符號的概率,二是信源符號對應(yīng)和編碼區(qū)間。一般的信源符號集x可表示為: 對于一個給定的信源符號輸入序列S=x1x2x3xm,其中xi屬于信源符號集X中的任意符號,可按以下過程進行編碼:1)定義初始區(qū)間0,1),表示一個0到1之間的半開區(qū)間,并規(guī)定初始概率p0=0;2)根據(jù)信源中各符號的
16、概率值,把0,1)區(qū)間劃分成N個子區(qū)間Q1,Q2,Qn,其中:Qi=Li,Ri),Li= ,Ri=Li+Pi ,i=1,2,,N (3)3)設(shè)置輸入序號i的初值,i=1表示開始輸入第一個信源符號。4)當輸入符號為xi(xi 對應(yīng)信源符號集X中的第k個符號),可按以下公式定義新的子區(qū)間Ii,并計算區(qū)間長度di。 Ii=li,ri) () li=li-1+di-1 () ri=li-1+di-1 () di=ri-li ()5)i=i+1,如果還有信源符號未輸入完畢,則轉(zhuǎn)第4)步繼續(xù)輸入下一個信源符號。如果全部輸入完畢,則當前區(qū)間Ii=li,ri)中的任意數(shù)就是所需的編碼。例:有四個符號a1、a2
17、、a3、a4的信源,其對應(yīng)概率分別為0.5、0.25、0.125、0.125。如果輸入序列為S=a2a1a3a2a4。根據(jù)以上編碼過程,得如下結(jié)果:從以上的編碼過程可以看出以下幾個問題: 1)算術(shù)編碼器對整個消息只產(chǎn)生一個碼字,這個碼字是在間隔0, 1)中的一個實數(shù),因此譯碼器在接受到表示這個實數(shù)的所有位之前不能進行譯碼。 )運算中出現(xiàn)溢出是一個明顯的問題,但多數(shù)機器都有16位、32位或者64位的精度,因此該問題可使用比例縮放方法解決。 3)算術(shù)編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導致整個消息譯錯。4、行程編碼行程編碼(RLE)通過統(tǒng)計信源符號中的重復個數(shù),并以格式來編碼
18、。適用于壓縮包含大量重復信息的信源。其基本思想是:按行存儲一個顏色值和相同色值的像素個數(shù)。如下圖。 (a) 圖像示例(168像素)0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0
19、0 0 0 0 0 0 0(b) 示例圖像的像素值(168像素)圖7-9 連續(xù)相同色塊圖像與像素值示例 16 0 02 0 11 01 03 0 02 0 01 01 13 0 02 0 01 01 13 0 02 0 01 01 13 0 02 0 11 01 03 0 16 0 16 0(c) RLE編碼說明: RLE壓縮編碼尤其適用于計算機生成的圖像,對減少圖像文件的存儲空間非常有效。然而,RLE對顏色豐富的自然圖像就顯得力不從心,如果使用RLE編碼方法,不僅不能壓縮圖像數(shù)據(jù),反而可能使原來的圖像數(shù)據(jù)變得更大。5、詞典編碼 詞典編碼主要是利用編碼數(shù)據(jù)本身存在字符串重復特性來實現(xiàn)數(shù)據(jù)壓縮的
20、。算法的核心就是如何動態(tài)地形成詞典,以及如何選擇輸出格式以減小冗余。詞典編碼又可分為兩類:第一類詞典編碼的思想是:查找正在壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過,然后用已經(jīng)出現(xiàn)過的字符串替代重復的部分,并將指向重復字符串的指針作為輸出編碼。指針P指向了重復字符串“abc”,所以,當再次出現(xiàn)相同字符串時,則輸出指針P。第二類詞典編碼的思想是:從輸入的數(shù)據(jù)中創(chuàng)建一個由短語組成的“編碼詞典”,編碼數(shù)據(jù)過程中當遇到已經(jīng)在詞典中出現(xiàn)的“短語”時,編碼器就輸出這個詞典中短語的“索引號”,而不是短語本身,如下圖。7.2.3 有損壓縮編碼介紹 有損數(shù)據(jù)壓縮編碼方法通常用于對靜態(tài)圖像、音頻以及視頻等多媒體信
21、息的編碼壓縮,這些多媒體信息大多數(shù)是通過對模擬信息的數(shù)字化(采樣與量化)而得到的。1、預測編碼1)預測編碼的基本概念 預測編碼是數(shù)據(jù)壓縮的重要技術(shù)原理之一,它是根據(jù)離散信號之間的空間或時間相關(guān)性,利用前面的一個或多個信號對下一信號進行預測,然后對實際值和預測值的差進行編碼。常用的預測編碼方法有DPCM(差分脈沖編碼調(diào)制)和ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)等。 2)DPCM差分脈沖編碼DPCM :Differential Pulse Code Modulation,差分脈沖編碼調(diào)制,用采樣量化后的樣本值與預測值之間的差值來編碼。原理如下圖所示。s(k)是PCM樣本值,se(k-1)是s(k)
22、的預測值,d(k)是差分信號,即d(k)= s(k)- se(k-1)。I(k)是差分信號d(k)的量化值,st(k)是重構(gòu)信號,是由逆量化器產(chǎn)生的量化差分信號與對過去樣本信號的估算值se(k-1)求和得到,以作為預測器確定下一個信號估算值的輸入信號。3)ADPCM自適應(yīng)差分脈沖編碼 ADPCM是自適應(yīng)量化和自適應(yīng)預測方法的總稱,是對DPCM方法的進一步改進,通過調(diào)整量化步長,對不同頻段設(shè)置不同的量化字長,使數(shù)據(jù)得到進一步的壓縮。 自適應(yīng)量化就是使量化間隔大小的變化自動地去適應(yīng)輸入信號大小的變化。根據(jù)信號分布不均勻的特點,使系統(tǒng)具有隨輸入信號的變化而改變量化區(qū)間的大小,以保持輸入量化器的信號基
23、本均勻的能力。圖7-13給出了反饋自適應(yīng)的基本原理 。2、變換編碼基本思想:先對信號進行域變換,然后再對變換后的信號進行量化、編碼。域變換的目的:尋求更大的信號獨立性,減少相關(guān)性;由于相關(guān)性減少了,所以可用較少的位數(shù)進行編碼,從而達到信息壓縮的目的。 2、變換編碼編碼過程:劃分NN子塊、變換、量化和編碼 。解碼過程:解碼、反量化、域的逆變換、合并子塊還原出所需信息。例:劃分圖像塊的過程 圖7-16 將圖像劃分成圖像塊原圖像劃分成多個圖像塊88像素的圖像塊一個圖像塊的像素劃分圖像塊常用的變換有KLT、DCT、WHT以及WLT 。DCTDCT(Discrete Cosine Transform)是
24、離散余弦變換的簡稱。它是通過從圖像像素(空域)到頻率系數(shù)(頻域)的信號變換,使空間上具有強相關(guān)性的信號在頻域上的特定區(qū)域集中,產(chǎn)生有某種規(guī)律性分布的系數(shù)矩陣,再進行數(shù)據(jù)壓縮;DCT是一種可逆變換,這使得利用DCT進行數(shù)據(jù)壓縮和恢復成為可能。從空域到頻域的變換稱為正向離散余弦變換(FDCT),從頻域到空域的變換稱為逆向離散余弦變換(IDCT)。 FDCT正向離散余弦變換FDCT先將整體圖像分成多個圖像塊,然后對NN的像素矩陣逐一進行DCT變換,形成頻域系數(shù)矩陣;在空域,每個圖像塊是一個NN的像素矩陣,用B表示,空域中的像素顏色(灰度)用B(x , y)表示,其中,x為空域橫坐標,y為空域縱坐標,
25、取值范圍均為0到N-1。變換后的頻域系數(shù)矩陣(用C表示)包含N2個系素,分為N行N列,每個系數(shù)用C(u , v)表示,其中,u和v均為頻域坐標,取值范圍均為0到N-1。 FDCT變換公式如下:其中: N為所劃分圖像方陣的行列數(shù),一般N=8; x、y:圖像空域坐標,取值為0N-1; B(x,y):空域圖像數(shù)據(jù)(像素灰度值); u、v:DCT后頻率系數(shù)矩陣的坐標位置,取值為0N-1; C(u,v):DCT變換后頻率系數(shù)矩陣內(nèi)的系數(shù)值; 當u=0且v=0時,E(u) = E(v) = 1/ ; 當u0或V0時,E(u) = E(v) = l B(x,y)的取值范圍是-128+127。具體轉(zhuǎn)換時,需要
26、先將無符號的0255的灰度值平移到-128+127取值范圍。 IDCT變換公式如下:參數(shù)意義同F(xiàn)DCT。例: 對一幅320240像素的8位灰度圖作FDCT時,F(xiàn)DCT先將整幅圖像劃分成4030個88像素矩陣B,其中的每個元素B(x,y)代表對應(yīng)像素的灰度,取值在0255之間。先做灰度值坐標的平移,即B(x,y)= B(x,y)-128,再進行FDCT變換,形成頻率系數(shù)矩陣C。 劃分成多個圖像塊一個圖像塊的像素矩陣像素(灰度)矩陣B78 75 79 82 82 86 94 9476 78 76 82 83 86 85 9472 75 67 78 80 78 74 8274 76 75 75 86
27、 80 81 7973 70 75 67 78 78 79 8569 63 68 69 75 78 82 8076 76 71 71 67 79 80 8372 77 78 69 75 75 78 78頻率系數(shù)矩陣C619 -29 8 2 1 -3 0 1 22 -6 -4 0 7 0 -2 -3 11 0 5 -4 -3 4 0 -3 2 -10 5 0 0 7 3 2 6 2 -1 -1 -3 0 0 8 1 2 1 2 0 2 -2 -2 -8 -2 -4 1 2 1 -1 1 -3 1 5 -2 1 -1 1 -3如果是RGB模式的彩色圖像,一個像素包含R、G、B三個顏色分量,一個彩色
28、圖像塊對應(yīng)三個像素矩陣,分別為Br(紅色像素)、Bg(綠色像素)、Bb(藍色像素)矩陣,變換后形成三個頻率系數(shù)矩陣Cr、Cg、Cb。FDCT得到的頻率系數(shù)矩陣C中的每個元素稱為變換系數(shù),它們均有明確的物理意義。C(0,0)是該矩陣中最特殊的一個元素,它與矩陣B的平均值有關(guān),稱為DC系數(shù)或直流分量;頻率系數(shù)矩陣C619 -29 8 2 1 -3 0 1 22 -6 -4 0 7 0 -2 -3 11 0 5 -4 -3 4 0 -3 2 -10 5 0 0 7 3 2 6 2 -1 -1 -3 0 0 8 1 2 1 2 0 2 -2 -2 -8 -2 -4 1 2 1 -1 1 -3 1 5
29、-2 1 -1 1 -3其余元素稱為AC系數(shù)或交流分量,代表隨u和v變化而變化的水平和垂直頻率分量的大小。 頻率系數(shù)矩陣C的分布規(guī)律是,離DC系數(shù)越近的AC系數(shù)(低頻系數(shù))值越大,離DC系數(shù)越遠的AC系數(shù)(高頻系數(shù))值越來越小, 頻率系數(shù)矩陣C619 -29 8 2 1 -3 0 1 22 -6 -4 0 7 0 -2 -3 11 0 5 -4 -3 4 0 -3 2 -10 5 0 0 7 3 2 6 2 -1 -1 -3 0 0 8 1 2 1 2 0 2 -2 -2 -8 -2 -4 1 2 1 -1 1 -3 1 5 -2 1 -1 1 -3 這就意味著,一方面FDCT使圖像的表示集結(jié)
30、到頻率系數(shù)矩陣左上角的系數(shù)中,它們攜帶了更多關(guān)于圖像的有用信息,另一方面,頻率系數(shù)矩陣的右下角的系數(shù)幾乎不包含圖像的有用信息。 從頻率系數(shù)矩陣C和原圖像特征可以看出,頻率系數(shù)矩陣C中的系數(shù)反映空域圖像的顏色變化情況。若C中AC系數(shù)均為0,則空域圖像為一幅無顏色變化的單色圖像;頻率系數(shù)矩陣C619 -29 8 2 1 -3 0 1 22 -6 -4 0 7 0 -2 -3 11 0 5 -4 -3 4 0 -3 2 -10 5 0 0 7 3 2 6 2 -1 -1 -3 0 0 8 1 2 1 2 0 2 -2 -2 -8 -2 -4 1 2 1 -1 1 -3 1 5 -2 1 -1 1 -
31、3若C中AC系數(shù)絕大多數(shù)為0,少數(shù)非0,說明空域圖像的顏色有較小變化(較少顏色),圖像比較粗糙;若C中AC系數(shù)絕大多數(shù)非0,少數(shù)為0,說明空域圖像的顏色變化很大(顏色豐富),圖像很細膩。 DCT小結(jié)從頻域看,通常用到的大量圖片都由低頻系數(shù)構(gòu)成,高頻系數(shù)較少,系數(shù)值較小,常為0,加上人眼對高頻分量的失真不太敏感,所以可用更粗的量化級對高頻系數(shù)進行量化,實現(xiàn)圖像數(shù)據(jù)壓縮。解碼時,通過IDCT恢復圖像數(shù)據(jù)。 3、混合編碼 混合編碼不是一類原理性編碼方案,是兩種或兩種以上相關(guān)編碼方法優(yōu)點與特長的混合應(yīng)用。 比如在MPEG和JPEG標準中,都混合應(yīng)用了不同的編碼方法,從而實現(xiàn)較為理想的編碼壓縮效果。4、
32、其它編碼 主要包括分形編碼、矢量量化編碼、子帶編碼等獨具特色編碼方法。 1)分形編碼 分形的概念:分形指某種形狀(或結(jié)構(gòu))的一個局部或片斷,它可以有許多種大小、尺寸的相似形。 分形編碼是一種以分形幾何學為理論基礎(chǔ)的編碼方法,它利用分形幾何中自相似的原理來實現(xiàn)數(shù)據(jù)壓縮的。首先對把一幅數(shù)字圖像,通過一些圖像處理技術(shù),然后在分形集中尋找各子圖像之間的相似性,其壓縮比超出經(jīng)典編碼方法近3個數(shù)量級。2)矢量量化編碼 矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)性,將輸入圖像數(shù)據(jù)序列分組,每一組由n個數(shù)據(jù)構(gòu)成一個N維矢量,一起進行編碼,即一次量化多個點。 3)子帶編碼 子帶編碼技術(shù)是一種高質(zhì)量、高壓縮比的圖像
33、編碼方法。其基本思想是,依據(jù)語音和圖像信號可以劃分為不同的頻域段,而人眼對不同頻域段的敏感程度不同的特性,將要壓縮的信息分離成高低不同的兩個頻帶(子帶),再根據(jù)頻帶的特性分別進行量化和編碼,完成對信息的編碼壓縮。7.3 JPEG靜止圖像壓縮標準7.3.1 JPEG概述 JPEG是一個適用于彩色、單色、多級灰度、連續(xù)色調(diào)的靜止數(shù)字圖像的壓縮標準,它定義了兩種基本的壓縮算法: 基于DPCM(差分脈沖編碼調(diào)制) 及Huffman編碼(或算術(shù)編碼) 的無損壓縮算法。壓縮此較小,較少使用; 基于DCT(離散余弦變換)的有損壓縮算法,壓縮比可以很大,廣泛使用,不特別說明時,JPEG就指有損壓縮算法。7.3
34、.1 JPEG概述 1、JPEG的數(shù)據(jù)壓縮思想 JPEG基于人的視覺特性實現(xiàn)數(shù)據(jù)壓縮;人眼對亮度信號較敏感而對色度信號不太敏感。利用這個特性可以把圖像中表達顏色的信號去掉一些而使人察覺不到。因此,JPEG不直接對RGB模式的圖像進行壓縮,而是將圖像先轉(zhuǎn)換成YCbCr(YUV或YIQ)模式,以便于對亮度信號Y和色差信號CbCr進行分別采樣和轉(zhuǎn)換; 7.3.1 JPEG概述 1、JPEG的數(shù)據(jù)壓縮思想 人眼主要關(guān)注構(gòu)成圖像主體的低頻數(shù)據(jù),而對表現(xiàn)圖像細節(jié)的高頻數(shù)據(jù)的關(guān)注度和敏感性較低。利用這個特性可以把圖像中的高頻信號去掉而使人不易察覺。因此,JPEG對采樣后的Y、Cb、Cr矩陣分別實施FDCT,
35、得到對應(yīng)的頻率系數(shù)矩陣,并根據(jù)頻率系數(shù)的分布規(guī)律,選擇適當?shù)牧炕燃墝崿F(xiàn)對高、低頻數(shù)據(jù)的不同壓縮處理。7.3.1 JPEG概述 2、JPEG的數(shù)據(jù)壓縮過程 基于DCT的JPEG有損壓縮算法的實現(xiàn)過程分為:顏色模式轉(zhuǎn)換及采樣DCT變換量化編碼四個環(huán)節(jié),這個過程統(tǒng)稱為JPEG編碼過程。7.3.1 JPEG概述 2、JPEG的數(shù)據(jù)壓縮過程 原圖像(多塊)圖7-18 JPEG有損壓縮過程圖示FDCT量化編碼壓縮后的圖像數(shù)據(jù)系數(shù)矩陣量化表編碼表RGBYCbCr3、JPEG的數(shù)據(jù)恢復過程JPEG的數(shù)據(jù)恢復過程是對應(yīng)的數(shù)據(jù)壓縮過程的逆過程:解碼、逆量化、IDCT、YCbCr轉(zhuǎn)換成RGB圖像。這個過程統(tǒng)稱為J
36、PEG解碼過程。 7.3.2 顏色模式轉(zhuǎn)換RGB模式是按顏色表示圖像,無法針對“亮度和色度信號”進行不同處理。YCbCr模式是按亮度(Y)和色度(CbCr)表示圖像的。針對“亮度和色度信號”進行不同處理。RGBYCbCr轉(zhuǎn)換 Y = 0.2990R+0.5870G+0.1140BCb = 0.564(B-Y)Cr = 0.713(RY)YCbCrRGB轉(zhuǎn)換R=Y+1.402CrG= Y-0.344 Cb -0.714 CrB= Y+1.772 Cb7.3.2 顏色模式轉(zhuǎn)換數(shù)據(jù)采樣時就可以有意丟掉部分Cb和Cr數(shù)據(jù),以減少樣本數(shù)據(jù)量;JPEG采用4:1:1和4:2:2(Y:Cb:Cr)兩種采樣方
37、式;與RGB采樣相比,可減少三分之一以上的數(shù)據(jù)量。 7.3.2 顏色模式轉(zhuǎn)換 利用YCbCr顏色模式,JPEG對一個彩色圖像塊的采樣數(shù)據(jù)分別存儲在亮度Y、色差CR和CB三個矩陣中。根據(jù)采樣方式的不同,矩陣CB和矩陣CR中的多列元素為0。 7.3.3 DCT變換1、灰度坐標平移 從0255移到-128+127 Y(x,y)=Y(x,y)-128 CB(x,y)=CB(x,y)-128 CR(x,y)=CR(x,y)-1287.3.3 DCT變換2、FDCT JPEG將平移后亮度矩陣Y、紅色差矩陣CR和藍色差矩陣CB視為一個基本單元分別進行轉(zhuǎn)換,得到對應(yīng)的頻率系數(shù)矩陣。 相應(yīng)地,解碼時采用IDCT
38、,變換公式如下:7.3.4 量化與量化表JPEG標準采用線性均勻量化器;量化過程是對64個系數(shù)除以量化步長L;量化步長L由量化表決定;量化計算公式為:W(u,v)=C(u,v)/L(u,v);方括號表示“四舍五入取整”。 量化是在保持一定質(zhì)量的前提下,丟棄圖像中對視覺效果影響不大的信息。量化是多對一映射,會降低精度,因而也是造成JPEG算法信息損失的根源。 7.3.4 量化與量化表要去掉高頻信號,只要保證量化步長L(u,v)足夠大,就能使相除取整后的量化值W(u,v)為0;要確保頻率系數(shù)矩陣中的直流分量和低頻信號,只要量化步長L(u,v)較小,就能使相除取整后的低頻量化值W(u,v)落在許可的
39、范圍內(nèi)。 亮度和色差信號分別量化,亮度信號進行細量化,色差信號進行粗量化,可產(chǎn)生更高的壓縮比。 量化表的確定: 7.3.4 量化與量化表圖7-20 JPEG推薦的量化表亮度量化表色度量化表量化表中的元素取值是從廣泛的實驗中得出的。 量化舉例: W(u,v)=C(u,v)/L(u,v)亮度矩陣C619 -29 8 2 1 -3 0 1 22 -6 -4 0 7 0 -2 -3 11 0 5 -4 -3 4 0 -3 2 -10 5 0 0 7 3 2 6 2 -1 -1 -3 0 0 8 1 2 1 2 0 2 -2 -2 -8 -2 -4 1 2 1 -1 1 -3 1 5 -2 1 -1 1
40、 -316 11 10 16 24 40 51 6112 12 14 19 26 58 60 5513 13 16 24 40 57 69 5614 17 22 29 51 87 80 6217 22 37 56 68 109 103 7724 35 55 64 81 104 113 9249 64 78 87 103 121 120 10172 92 95 98 112 100 103 99亮度量化結(jié)果W39 -3 1 0 0 0 0 02 -1 0 0 0 0 0 01 0 0 0 0 0 0 00 -1 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00
41、 0 0 0 0 0 0 00 0 0 0 0 0 0 0亮度量化表L量化表可根據(jù)圖像的類型特點進行優(yōu)化。 7.3.5 編碼與編碼表 JPEG算法的編碼內(nèi)容包括DC系數(shù)編碼、AC系數(shù)編碼和熵編碼三部分。熵編碼中要用到不同的編碼表。1DC系數(shù)編碼編碼范圍:一幅圖像所有圖像塊的DC系數(shù);編碼方法:DPCM,即對相鄰塊DC系數(shù)的差值進行編碼(DCi=DCi-DCi-1);由于圖像中相鄰塊之間有很強的相關(guān)性,所以DC系數(shù)的差很小,可用較少的位數(shù)編碼;結(jié)果稱為DC碼。2、AC系數(shù)編碼“Z”型排序,可使低頻分量先出現(xiàn),高頻分量后出現(xiàn);沿“Z”字型路徑,采用行程編碼,可有效壓縮連續(xù)的0;編碼格式為: (前導
42、0的個數(shù),系數(shù)值,最后一個非0系數(shù)標志)AC系數(shù)編碼的結(jié)果稱為AC碼。 解碼時要根據(jù)此標志補足0的個數(shù)。 AC系數(shù)編碼舉例:亮度量化結(jié)果W39 -3 1 0 0 0 0 02 -1 0 0 0 0 0 01 0 0 0 0 0 0 00 -1 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0“Z”字型排序39 -3 1 0 0 0 0 02 -1 0 0 0 0 0 01 0 0 0 0 0 0 00 -1 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0
43、0 0 0 0 00 0 0 0 0 0 0 0AC系數(shù)排列結(jié)果:-3,2,1,-1,1,0,0,0,0,0,-1,0,0,采用行程編碼的編碼結(jié)果:(0,-3,0),(0,2,0),(0,1,0),(0,-1,0),(0,1,0),(5,-1,1) 52 個0系數(shù)被壓縮 3、熵編碼編碼對象:所有系數(shù)矩陣的DC碼和AC碼;編碼方法:基于統(tǒng)計特性的熵編碼(Huffman)不同編碼對象生成不同的編碼表,大概率信號用短碼,小概率信號用長碼。每個矩陣數(shù)據(jù)的DC碼與AC碼使用不同的編碼表;亮度與色度矩陣也使用不同的編碼表。7.3.6 JPEG2000介紹JPEG 2000是JPEG標準的改進版;采用“小波
44、變換”替代DCT,使所壓縮的圖像比JPEG圖像更細膩、更逼真;有效地提高了壓縮率,約比JPEG高30%50%;支持有損和無損壓縮,可用于遙感圖像、醫(yī)學圖像等高精度專業(yè)圖像壓縮;支持多次掃描(先輪廓后細節(jié))的漸進傳輸/顯示方式,改善了圖像的網(wǎng)絡(luò)傳輸和顯示特性。 7.3.7 JPEG的應(yīng)用 JPEG標準以其圖像質(zhì)量好、壓縮比高、支持多種顯示和傳輸方式等優(yōu)點,在靜止圖像和運動圖像的幀內(nèi)壓縮方面得到了廣泛應(yīng)用,絕大多數(shù)的圖像處理軟件都支持JPEG標準,在具體的圖像處理過程中,使用者應(yīng)根據(jù)JPEG算法的數(shù)據(jù)壓縮原理和圖像壓縮效果的控制方法,合理選擇控制參數(shù),以達到圖像質(zhì)量、文件大?。▔嚎s比)、傳輸速率、
45、傳輸方式、顯示方式等多方面的綜合效果要求。 Adobe Photoshop中保存JPEG文件時的參數(shù)選擇: 選擇圖像的壓縮比與圖像品質(zhì)選擇圖像傳輸和顯示的格式,“基線”格式是JPEG的標準傳輸和顯示格式,圖像逐行傳輸、逐行顯示;“基線已優(yōu)化”格式使用優(yōu)化的Huffman編碼,逐行傳輸和逐行顯示更流暢;“連續(xù)”格式提供多次掃描(先輪廓后細節(jié))的漸進傳輸/顯示方式,掃描次數(shù)可自定。 可下載專門的JPEG壓縮工具進行圖像壓縮和效果測試。7.4 運動圖像壓縮標準MPEG7.4.1 MPEG概述 MPEG是ISO指定的專門用于運動圖像壓縮的一個系列標準,其中包括MPEG-1、MPEG-2、MPEG-4、
46、MPEG-7以及MPEG-21等具體標準。其中MPEG-1是基礎(chǔ)標準,包括MPEG-1視頻、MPEG-1音頻和MPEG-1系統(tǒng)三大部分。應(yīng)用:VCD視盤。 本節(jié)重點介紹MPEG-1視頻(視頻源、幀類型、編碼結(jié)構(gòu)、運動估計與運動補償、編碼與解碼)。7.4.2 MPEG-1視頻源 MPEG-1視頻壓縮標準規(guī)定的視頻源格式為SIF(Source Input Format,源輸入格式),具體參數(shù)如下:標準名稱格式名稱幀率像素樣本(行列)YCrCbISO/MPEG-1SIF2528835214417614417630240360120180120180 視頻編碼前必須將視頻圖像轉(zhuǎn)換成逐行掃描圖像,并采用
47、YCbCr模式進行采樣,采樣格式:4:1:1。 特點:1)運動感由變化的幀序列產(chǎn)生; 2)連續(xù)多幀的背景(場景)相似。像素 視頻(Video)是隨時間變化連續(xù)播放多幅靜止圖像而產(chǎn)生的帶有動感的圖像序列。7.4.3 MPEG-1視頻幀類型 基于以上特點,MPEG將視頻分成若干個GOP (Group of Picture,圖像組),每個GOP中圖像幀分為I幀、B幀、P幀三種類型。I幀(I-Frame):基本信息幀(關(guān)鍵幀),是構(gòu)成GOP的第一幀,它提供一個場景的所有信息,是其他兩種幀信息的參考源;采用JPEG壓縮(屬幀內(nèi)編碼),壓縮比為1:7。P幀(Predicted Frame):前向預測幀,是
48、參考前一幅I幀或P幀圖像得到的預測圖像;儲存與之前一個已解壓畫面的差值,屬單向幀間編碼。壓縮比為1:20 。前一幀F(xiàn)1后一幀F(xiàn)2壓縮后的P幀P=F2-F1FF1F2當前幀前幀后幀參考參考B幀(Bi-predicted Frame):雙向預測幀,除了參考之前解壓過了的畫面外,亦會參考后面一幀中的畫面信息,屬雙向幀間編碼。壓縮比為1:50200 。形成B幀什么是“參考”? 尋找相鄰幀中同一圖像塊的移動軌跡運動矢量。B幀不保存圖像塊,而是保存圖像塊相對于相鄰幀中塊的運動矢量。三類幀可在視頻流中組合使用,如下圖。T(前)II幀壓縮比最小,P幀壓縮比居中,B幀壓縮比最大;增加B幀會減少I幀和P幀的相關(guān)性
49、,有利于體高壓縮比,但會降低圖像質(zhì)量。7.4.4 MPEG-1視頻編碼結(jié)構(gòu) MPEG-1 把視頻源分成圖像組(GOP,Group of Picture)、圖像(Picture)、切片(Slice)、宏塊(MB,MacroBlock)、像素塊(B,Block)共五個編碼對象。圖像組由I幀開頭的一串圖像幀組成,是視頻隨機存取的基本單位,其內(nèi)部結(jié)構(gòu)(P幀和B幀的組合順序)和長度(幀數(shù))均可變。 4:1:1 編碼時,MPEG-1在以上五個編碼對象上添加相應(yīng)的標志和相關(guān)信息,形成MPEG-1的視頻編碼結(jié)構(gòu)。 7.4.5 運動估計與運動補償 運動估計是一種幀間編碼方法,它通過“估計”前后兩幀的空間相關(guān)性,
50、來求得前后兩幀的“運動差幀間差”,由于對“幀間差”做編碼所需比特要比幀內(nèi)編碼所需的比特少很多,幀間差集中在零附近,可以用短的碼字傳送。 具體計算以宏塊或塊為單位。7.4.5 運動估計與運動補償當tt 時,前向運動估計。在參考幀t中搜索到當前幀t中的塊的最佳匹配時,可以得到相應(yīng)的運動場d(x:t,t+t),即可得到當前幀的運動矢量。 7.4.5 運動估計與運動補償根據(jù)運動矢量,編碼器將參考幀(或過去幀)位移,求得對當前幀的估計(預測幀),再將預測幀與當前幀做減法運算(運動匹配),求出預測幀與當前幀的預測誤差,并對此差值進行量化編碼,與運動矢量一起發(fā)送給接收端。 7.4.5 運動估計與運動補償在接
51、收端,解碼器收到運動矢量和已編碼的預測誤差后,先解碼,再按照運動矢量指明的位置,從已經(jīng)解碼的鄰近參考幀圖像中找到相應(yīng)的塊或宏塊,和預測誤差相加后就得到所需的塊或宏塊在當前幀中的位置。解碼器通過預測誤差和運動矢量求得“所需的塊或宏塊在當前幀中的位置”的過程稱為運動補償。 運動矢量幀間差過去幀當前幀的估計當前幀+位移補償7.4.6 MPEG視頻的編碼與解碼由MPEG-1視頻編碼器完成;提供對播放裝置的正放、圖像凍結(jié)、快進、快退和慢放功能以及隨機訪問能力;壓縮后的碼率為1.5Mbps。 具體編碼過程如下圖。1、編碼圖像插值、圖像校正、圖像增強等預處理,以改善圖像質(zhì)量。 注:圖像預測器,包含一個幀圖像
52、存儲器,可存儲相鄰幀或過去幀,預測器按照運動矢量對過去幀(或相鄰幀)做位移來求得“當前幀的估計”預測幀對于I幀,采用幀內(nèi)編碼,通過DCT變換、量化、熵編碼完成編碼過程 P幀和B幀,幀間編碼,1)當前幀和參考幀做運動估計,求運動矢量;2)通過圖像預測器,對參考幀中的宏塊作矢量運動,求得當前幀中宏塊的位置估計(當前幀的估計),再將當前幀與當前幀的估計做減法,求得預測誤差,然后對預測誤差進行DCT變換、量化和熵編碼。 經(jīng)過逆量化、IDCT,再與當前幀的估計相加,形成參考幀,以便下一幀編碼時使用。在接收端,由MPEG-1視頻解碼器完成;對收到的可變字長熵編碼進行解碼,通過逆量化和逆DCT變換,實現(xiàn)對編
53、碼數(shù)據(jù)的重構(gòu),然后再與圖像預測器相結(jié)合形成當前圖像(也為以后接收到的圖像做預測),經(jīng)過后處理(插入和濾波)得到結(jié)果圖像,實現(xiàn)視頻輸出。2、解碼7.5 視聽通信編碼標準H.26簡介 H.26是ITU-T(國際電聯(lián))制定的用于通信的音/視頻編碼系列標準,主要包括H.261、H.262、H.263、H.263+/+、H.26L、H.264等。H.262 是一個數(shù)字視頻編碼標準,在技術(shù)內(nèi)容上和ISO/IEC的MPEG-2視頻標準一致。 本節(jié)介紹H.261的基本內(nèi)容。 7.5.1 H.261標準 H.261視頻編碼標準又稱P64標準,它支持音頻和實時動態(tài)圖像的壓縮編碼和解碼,應(yīng)用目標是可視電話與電視會議
54、。其中P是一個可變參數(shù),取值范圍是130,所以該標準的最低傳輸速度是64Kbps,最高傳輸速度是1920Kbps。P參數(shù)的設(shè)置使得H.261能夠適應(yīng)不同帶寬的傳輸信道,具有更好的低速網(wǎng)絡(luò)適應(yīng)能力。 7.5.1 H.261標準H.261的視頻源格式 國際間的可視電話和視頻會議涉及國家和地區(qū)之間的電視制式問題,為了解決各國電視制式不一致的問題,H.261采用了CIF(Common Intermediate Format,公共中間格式)和QCIF來定義視頻畫面,不論何種電視制式,發(fā)送方先把自己國家的電視制式轉(zhuǎn)換成CIF/QCIF格式,經(jīng)H.261編碼后傳輸,接收方收到后再由CIF/QCIF格式轉(zhuǎn)換成
55、本國或本地區(qū)的電視制式。表7-2給出了CIF/QCIF與其他視頻格式的具體參數(shù)。 表7-2 CIF/QCIF及其他視頻格式參數(shù)表采用標準格式名稱幀率像素樣本(行列)YCrCbISO/MPEG-1SIF2528835214417614417630240360120180120180CCITT/H.261CIF29.97288352144176144176QCIF14417672887288CCIR601PAL25576720288360288360NTSC304807202403602403602畫面分割與數(shù)據(jù)結(jié)構(gòu) 采用CIF/QCIF 格式;畫面被分割若干個88的像素塊;像素塊又分為Y亮度塊、
56、Cb塊和Cr塊三種;4個亮度塊和1個Cr塊及1個Cb塊組成一個宏塊MB;33個MB 組成一個塊組GOB;一幀CIF圖像由12個GOB組成,一幀QCIF 圖像由3個GOB組成。畫面數(shù)據(jù)結(jié)構(gòu)由幀、GOB、MB、B組成四層結(jié)構(gòu)。3H.261的編解碼系統(tǒng) (1)編碼對圖像的I、P、B幀進行壓縮編碼。將幀圖像數(shù)據(jù)編排成四層結(jié)構(gòu),并通過熵編碼輸出。用于視頻數(shù)據(jù)的誤碼檢測和糾正 。傳輸緩沖器和碼率控制器用于保證輸出碼流盡可能穩(wěn)定。3H.261的編解碼系統(tǒng) (2)解碼 H.261視頻解碼器由視頻源解碼器、視頻復合解碼器、接收緩沖器和傳輸解碼器等四大部分組成,其結(jié)構(gòu)如圖7-33(b)所示。各部分功能與編碼器相反
57、。 7.5.2 H.263簡介H.263是ITU-T為低碼率通信而設(shè)計的視頻編碼標準,與H.261的編碼算法原理相同,但做了改善和擴充,提高了編碼能力和糾錯能力。H.263支持5種分辨率的視頻源格式(QCIF、CIF、SQCIF、4CIF和16CIF)。H.263標準在低碼率下能夠提供比H.261更好的圖像效果。 7.5.3 H.264簡介H.264主要是為了解決不同比特率、不同分辨率、不同質(zhì)量和業(yè)務(wù)需求情況下的視頻壓縮問題,它支持多種采樣模式,高品質(zhì)視頻采用4:4:4全采樣模式,一般質(zhì)量視頻采用其他采樣模式;支持幀間壓縮和幀內(nèi)壓縮,使用基于塊的運動矢量,幀間編碼充分利用不同圖像幀之間的時域統(tǒng)
58、計依賴性進行壓縮;幀內(nèi)編碼采用不同的空間預測模式,對一幅圖像中的空間統(tǒng)計依賴性加以利用。 7.5.3 H.264簡介H.264加強了對IP網(wǎng)絡(luò)、移動網(wǎng)絡(luò)的誤碼和丟包處理,具有更好的網(wǎng)絡(luò)適應(yīng)性;與H.263或MPEG-4相比,在相同質(zhì)量下,H.264的數(shù)碼率可減少一半左右,也就是說,在相同數(shù)碼率下,H.264的信噪比明顯提高。由于其出色的性能,H.264標準在國際上受到了廣泛地重視和歡迎,被人們稱為新一代視頻編碼標準。 7.5.3 H.264簡介H.264可廣泛應(yīng)用于:數(shù)字存儲媒體(ISM交互式光盤存儲)電視廣播(CATV有線電視、DBS直接廣播的衛(wèi)星視頻業(yè)務(wù)、DSL數(shù)字用戶線上的視頻業(yè)務(wù)、DT
59、TB數(shù)字地面電視廣播)網(wǎng)絡(luò)傳輸(MMM電子郵件、MSPN 分組交換網(wǎng)絡(luò)上的多媒體業(yè)務(wù))實時通信(視頻會議、可視電話、遠程監(jiān)控)等。本章小結(jié) 本章較為系統(tǒng)地介紹了多媒體數(shù)據(jù)壓縮的必要性、可能性以及多媒體數(shù)據(jù)壓縮編碼算法的分類等基本概念,并重點介紹了多種無損壓縮算法的基本思想和編碼過程,較為全面地介紹了有損壓縮算法的基本思想,從而系統(tǒng)地形成了多媒體數(shù)據(jù)壓縮的技術(shù)原理。最后,簡單介紹了JPEG、MPEG和H.26x系列視頻信息壓縮標準。通過學習本章,應(yīng)掌握以下基本內(nèi)容: 1)多媒體數(shù)據(jù)的最大特點就是數(shù)據(jù)量巨大,必須進行有效的數(shù)據(jù)壓縮后,才能在多媒體系統(tǒng)中有效地處理、存儲和傳輸。 2)多媒體數(shù)據(jù)中存在
60、著多種冗余信息(信息熵冗余、時間冗余、空間冗余、知識冗余、結(jié)構(gòu)冗余、聽覺冗余、視覺冗余等),因此對多媒體數(shù)據(jù)進行有效的編碼壓縮是可能的。 3)多媒體數(shù)據(jù)壓縮技術(shù)以去掉冗余信息為基本途徑,具體方法有多種,按壓縮效果可分為有損壓縮和無損壓縮兩種。無損壓縮不會丟失有用信息,可完全恢復,因而壓縮比較低;而有損壓縮則會丟失部分有用信息,還原時無法得到與原信息完全相同的信息,但損失的信息控制在人能接受的范圍內(nèi),因而壓縮比較高。 4)無損壓縮通過不同的方法去除冗余信息,常用的編碼壓縮方法有Huffman編碼、算術(shù)編碼、行程編碼和詞典編碼等。 5)有損壓縮主要從多媒體信息的采樣、量化入手,通過分析和去除各種可
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 版權(quán)承包協(xié)議樣本
- 房地產(chǎn)合同范本:房屋出售協(xié)議書
- 全日制勞動合同書參考格式
- 汽車租賃公司貨運合同范本
- 簡易工程監(jiān)理合同
- 拆遷補償委托協(xié)議樣本
- 商場裝修合同2024年
- 產(chǎn)品訂購協(xié)議書范本
- 張愛玲小說中的女性形象探析8400字
- 水產(chǎn)企業(yè)大連遠洋食品績效考核現(xiàn)狀、問題及對策12000字
- 小區(qū)車輛進出登記表
- 2023年安徽蚌埠市(市區(qū))外地返蚌考生中考報名的公告新
- 文網(wǎng)文游戲業(yè)務(wù)發(fā)展報告
- 廠房工程裝飾裝修工程施工方案
- 129運動主題班會
- YB/T 1428-1997炭素材料內(nèi)在水分的測定
- 鄭州大學模板課件
- 牛人總結(jié)雅思7.5以上經(jīng)驗63大頁超詳細
- 礦山地質(zhì)環(huán)境保護和土地復墾方案 編制規(guī)范指南規(guī)范
- 口腔科醫(yī)療護理技術(shù)操作規(guī)程版
- 在例題與命題研究中實現(xiàn)教師專業(yè)成長
評論
0/150
提交評論