




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)字圖像處理學(xué)數(shù)字圖像處理學(xué)王素玉王素玉 內(nèi)容提要圖像編碼概述5.1PCM編碼5.2統(tǒng)計(jì)編碼5.3預(yù)測(cè)編碼5.4變換編碼5.5矢量量化編碼5.6圖像視頻壓縮標(biāo)準(zhǔn)簡(jiǎn)介5.65.7圖像編碼屬于信源編碼范疇。其特點(diǎn)是利用圖像信號(hào)的統(tǒng)計(jì)特性及人眼睛的生理和心理特性對(duì)圖像進(jìn)行高效編碼。信源信源信源編碼信道編碼信道編碼調(diào)制調(diào)制傳輸信道傳輸信道噪聲噪聲解調(diào)解調(diào)信道解碼信道解碼信源解碼信源解碼信宿信宿數(shù)字通信系統(tǒng)模型5.1 圖像編碼概述信源編碼的主要任務(wù)是解決有效性問(wèn)題,也就是對(duì)信源實(shí)現(xiàn)壓縮處理,使處理后的信號(hào)更適宜數(shù)字通信系統(tǒng)。 信道編碼的任務(wù)是解決可靠性問(wèn)題。也就是盡量使處理過(guò)的信號(hào)在傳輸過(guò)程中不出錯(cuò)或少
2、出錯(cuò),既使出了錯(cuò)也要有能力盡量糾正錯(cuò)誤。圖像編碼主要是要研究壓縮數(shù)碼率,即高效編碼問(wèn)題。信源編碼的目的是提高編碼效率。 是否能提高編碼效率? 回答是肯定的。 從信息論的角度看,各種信源都存在大量的冗余成分。如果去掉這些冗余成分,就能提高編碼效率。所以,所謂第一代編碼就是圍繞著去除冗余度這一中心思想實(shí)現(xiàn)數(shù)據(jù)壓縮的。冗余度主要存在于兩個(gè)主要方面:1)、存在于信源的相關(guān)性之中;2)、存在于圖像信源各個(gè)元素出現(xiàn)概率的不均等之中。 去掉了冗余成分的信源固然精練了,但是,也變得脆弱了??垢蓴_性能也變差了。因此,在傳輸過(guò)程中,還要加入一些冗余成分以增加抗干擾能力。這就是信道編碼的任務(wù)了。 目的:使用最節(jié)儉的
3、方式進(jìn)行信息的表達(dá)。最初的思想:為出現(xiàn)概率高的字母賦予較短的編碼,概率低的賦予較長(zhǎng)的編碼 Morse電碼壓縮的可行性:數(shù)據(jù)之間存在相關(guān)性數(shù)據(jù)壓縮:在一定的數(shù)據(jù)存儲(chǔ)空間要求下,將相對(duì)龐大原始數(shù)據(jù)重組為滿(mǎn)足前述空間要求的數(shù)據(jù)集合,使得從數(shù)據(jù)集合恢復(fù)出的數(shù)據(jù)能夠與原數(shù)據(jù)保持一致,或者能夠獲得與原始數(shù)據(jù)一樣的使用品質(zhì)。 5.1.1數(shù)據(jù)壓縮的產(chǎn)生數(shù)據(jù)壓縮的產(chǎn)生壓縮時(shí)去掉冗余部分,即確定的或可推知的部分,用一種更接近信息本質(zhì)的描述來(lái)代替原來(lái)冗余的描述。信息能夠被壓縮的原因在于其本身存在大量的冗余。這些冗余主要是由信息之間的相似性和可推知性產(chǎn)生的。人的感官對(duì)信息之間的某些相似性不敏感,去掉這些冗余仍然不影響
4、人們對(duì)信息的感知和理解。5.1.2 數(shù)據(jù)壓縮原理數(shù)據(jù)壓縮原理同一景物表面上各像素點(diǎn)的顏色之間往往存在著空間連貫性,從而產(chǎn)生空間冗余。1. 空間冗余空間冗余運(yùn)動(dòng)圖像連續(xù)各幀間的相似性。2. 時(shí)間冗余時(shí)間冗余3. 結(jié)構(gòu)冗余結(jié)構(gòu)冗余紋理結(jié)構(gòu)的規(guī)律性4. 知識(shí)冗余知識(shí)冗余可由先驗(yàn)知識(shí)或背景知識(shí)得到的規(guī)律性的信息。5. 信息熵冗余信息熵冗余 信息熵:信息論中用來(lái)度量信息量的概念。 系統(tǒng)越有規(guī)律,信息熵越??;反之,信息熵越大。 圖像中平均每個(gè)像素使用的比特?cái)?shù)大于該圖像的信息熵,則圖像中存在冗余,稱(chēng)為信息熵冗余。6. 感官冗余感官冗余 人的視覺(jué)和聽(tīng)覺(jué)等感官對(duì)某些信息并不敏感。 如人類(lèi)可分辨的顏色只有1670
5、萬(wàn)種,高于24位真彩色的數(shù)據(jù)是沒(méi)有意義的。 有些信息在通常的視覺(jué)過(guò)程中與另外一些信息相比并不那么重要,這些信息被認(rèn)為是心理視覺(jué)冗余的,去除這些信息并不會(huì)明顯降低圖像質(zhì)量。感光冗余示例33K33K15K15K5.1.3 圖像壓縮的分類(lèi)圖像壓縮的分類(lèi)圖像壓縮編碼有損壓縮無(wú)損壓縮行程編碼LZW編碼霍夫曼編碼算術(shù)編碼無(wú)損預(yù)測(cè)編碼位平面編碼有損預(yù)測(cè)編碼分形編碼模型編碼子帶編碼神經(jīng)網(wǎng)絡(luò)編碼變換編碼K.L變換Haar變換Walsh.Hadamard變換離散余弦變換離散傅立葉變換斜變換小波變換第二代第二代編碼編碼1. 1. 無(wú)損壓縮無(wú)損壓縮 也稱(chēng)為冗余度壓縮,所壓縮的為原始信息中存在的冗余信息,對(duì)壓縮后的數(shù)據(jù)
6、進(jìn)行解碼,能夠完全恢復(fù)原始數(shù)據(jù),不損失任何信息。 壓縮比通常為2-4倍。(1)無(wú)損壓縮的必要性 一些重要的歸檔文件數(shù)據(jù),需要精確保留原始信息; 衛(wèi)星成像數(shù)據(jù),考慮數(shù)據(jù)采集的成本和未來(lái)的用途,不希望有任何數(shù)據(jù)損失; 醫(yī)學(xué)圖像,信息的丟失會(huì)影響診斷結(jié)果(2)無(wú)損壓縮技術(shù) 減少像素間冗余; 減少編碼冗余;(3 3)無(wú)損壓縮的產(chǎn)生)無(wú)損壓縮的產(chǎn)生 貝爾實(shí)驗(yàn)室的Claude Shannon(1948) 和 MIT的R.M.Fano(1949)分別提出了最早的對(duì)符號(hào)進(jìn)行有效編碼從而實(shí)現(xiàn)數(shù)據(jù)壓縮的Shannon-Fano編碼方法。 1952年 D.A.Huffman,最小冗余代碼的構(gòu)造方法。20世紀(jì)從60年
7、代到80年代早期,數(shù)據(jù)壓縮領(lǐng)域一直被Huffman編碼所壟斷。 1977年,LZ77,LZ78。 1984年,LZW,字典編碼- winzip。(4 4)無(wú)損壓縮算法)無(wú)損壓縮算法常見(jiàn)的無(wú)損壓縮技術(shù)包括:基于統(tǒng)計(jì)概率的方法和基于字典的技術(shù)。 基于統(tǒng)計(jì)概率的方法是依據(jù)信息論中的變長(zhǎng)編碼定理和信息熵有關(guān)知識(shí),用較短代碼代表出現(xiàn)概率大的符號(hào),用較長(zhǎng)代碼代表出現(xiàn)概率小的符號(hào),從而實(shí)現(xiàn)數(shù)據(jù)壓縮。 統(tǒng)計(jì)編碼方法中具有代表性的是利用概率分布特性的著名的霍夫曼(Huffman)編碼方法 ,另一種是算術(shù)編碼。 字典編碼:用符號(hào)代替一串字符;這一串字符可以是有意義的,也可以是無(wú)意義的。在編碼中僅僅把字符串看成是一
8、個(gè)號(hào)碼,而不去管它來(lái)表示什么意義。以牛津詞典為例,若編碼“data compression”這兩個(gè)英文單詞,查字典后發(fā)現(xiàn)“data”出現(xiàn)在地271頁(yè)的第13個(gè)字,“compression”出現(xiàn)在第213頁(yè)的第8個(gè)字。因此可以用(271,13)(213,8)這兩個(gè)記號(hào)來(lái)表示“data compression”。(5)無(wú)損壓縮定理:)無(wú)損壓縮定理:顯示一幅圖像需要多大的數(shù)據(jù)量?有沒(méi)有描述一幅圖像且沒(méi)有信息損失的最小數(shù)據(jù)量?信息量對(duì)于一個(gè)隨機(jī)事件x,如果它的出現(xiàn)概率是p(x),那么它包含的信息:I(x)稱(chēng)為x的自信息。如果p(x)=1(即事件總發(fā)生),那么I(x)=0。)(log)(1log)(xp
9、xpxII(x)的單位為的單位為bit。 一個(gè)具有隨機(jī)離散輸出的信源,這個(gè)信源從一個(gè)有限集合中產(chǎn)生一個(gè)隨機(jī)符號(hào)序列,這樣信源符號(hào)集B=b1,b2,bJ,其中每個(gè)元素bj稱(chēng)為信源符號(hào),信源產(chǎn)生符號(hào)bj這個(gè)事件的概率是P(bj)。 信源產(chǎn)生單個(gè)符號(hào)bj時(shí)的自信息是:I(bj)=-logP(bj)。如將每個(gè)信源輸出的平均信息記為H(u),則:JjjjbPbPuH12)(log)()(信息論中, H(u)定義為信息源的信息熵。H(u)定義了觀察到單個(gè)信源符號(hào)輸出時(shí)所獲得的平均信息。信息源的信息熵信息源的信息熵百度新聞截圖百度新聞截圖一幅圖像可以看作一個(gè)具有隨機(jī)離散輸出的信源,假設(shè)區(qū)間0,L-1內(nèi)的一個(gè)
10、離散隨機(jī)變量rk 表示圖像的灰度級(jí),并且每個(gè)rk出現(xiàn)的概率為pr(rk)。nnrpkkr)(這里L(fēng)是灰度級(jí)數(shù),nk是第k個(gè)灰度級(jí)在圖像中出現(xiàn)的次數(shù),n是圖像中的像素總數(shù)。則圖像的信息熵為:JjkrkrrprpRH12)(log)()(圖像信息圖像信息熵熵?zé)o失真編碼定理(香農(nóng)定理無(wú)失真編碼定理(香農(nóng)定理)設(shè)一幅圖像有MN個(gè)像素,每個(gè)像素占B比特,則整個(gè)圖像需要MNB比特。像素的平均比特?cái)?shù)可以通過(guò)對(duì)不同的灰度級(jí)賦予不同的比特長(zhǎng)度來(lái)減少。當(dāng)我們把出現(xiàn)概率大的灰度級(jí)用短碼表示,出現(xiàn)概率小的用長(zhǎng)碼表示,則表達(dá)每個(gè)像素所需的平均比特?cái)?shù)為:JjkkravgrlrpL1)()(香農(nóng)定理:香農(nóng)定理: 存在一種無(wú)
11、失真編碼方法,使編碼的平均長(zhǎng)度與圖像的熵任意地接近,熵是編碼所需比特?cái)?shù)的下限,即編碼時(shí),一定要用不比熵少的比特?cái)?shù)編碼才能保持原始圖像信息,即熵是無(wú)損圖像壓縮的下限。2. 有損壓縮有損壓縮無(wú)損壓縮的設(shè)計(jì)思想都是基于對(duì)信息表述方法的改變。雖然無(wú)損壓縮可以保證接收方獲得的信息與發(fā)送方相同,但是其壓縮率一定有極限。因此,采用忽略視覺(jué)不敏感的部分進(jìn)行有損壓縮是提高壓縮率的一條好的途徑。 有損壓縮是以丟失部分信息為代價(jià)來(lái)?yè)Q取高壓縮比。 解碼圖像與原始圖像會(huì)有差異,因此,需要評(píng)價(jià)壓縮后圖像的質(zhì)量。 描述解碼圖像相對(duì)原始圖像偏離程度的測(cè)度一般稱(chēng)為保真度(逼真度)準(zhǔn)則。 常用的準(zhǔn)則可分為兩大類(lèi):客觀保真度準(zhǔn)則和
12、主觀保真度準(zhǔn)則。5.2 PCM編碼脈沖編碼調(diào)制(Pulse coding ModulationPCM )是將模擬圖像信號(hào)變?yōu)閿?shù)字信號(hào)的基本手段。圖像信號(hào)的數(shù)據(jù)量大,在實(shí)時(shí)處理中要求響應(yīng)快,因此在電路設(shè)計(jì)與實(shí)現(xiàn)上有較大的難度。模擬圖像模擬圖像低通濾波取樣保持取樣保持編碼編碼傳輸信道傳輸信道解碼解碼低通濾波低通濾波解碼圖像解碼圖像量化量化(1)PCM編、譯碼原理編、譯碼原理限制頻帶限制頻帶,防止折疊誤差防止折疊誤差時(shí)間離散化時(shí)間離散化幅度離散化幅度離散化多值變多比特多值變多比特多比特變多值多比特變多值內(nèi)插及平滑內(nèi)插及平滑(2)PCM 編碼的量化噪聲編碼的量化噪聲 量化是對(duì)時(shí)間離散的模擬信號(hào)進(jìn)行幅度
13、離散化的過(guò)程,這個(gè)過(guò)程是去零取整的過(guò)程。 量化后的樣值與原信號(hào)相比大部分是近似關(guān)系。 把連續(xù)的數(shù)值限制在固定的臺(tái)階式的變化之下必然會(huì)帶來(lái)畸變。這種畸變?cè)诮邮斩耸菬o(wú)法克服的,只能使其盡量減小。量化噪聲與過(guò)載噪聲的形成量化噪聲與過(guò)載噪聲的形成 (a)輸入信號(hào)超過(guò)編碼范圍時(shí)的量化噪聲和過(guò)載噪聲的形成; (b)信號(hào)未超過(guò)編碼范圍,只有量化噪聲。 在PCM 編碼中,量化噪聲主要取決于碼的位數(shù),碼位數(shù)越多(即量化階數(shù)多)量化噪聲的功率越小。一個(gè)量化階的電壓可由下式表示: Vn2式中:V 為輸入信號(hào)電壓;n為樣值用二進(jìn)制數(shù)表示的比特?cái)?shù)。 均勻量化:在整個(gè)輸入幅度內(nèi)量化階是一個(gè)常數(shù); 非均勻量化:在輸入幅度范
14、圍內(nèi),量化階是變化的。 線(xiàn)性PCM 編碼中均采用均勻量化法。 在均勻量化中,設(shè)量化階為,量化噪聲在 內(nèi)可看成是均勻分布的。22 值得注意的是量化噪聲不同于其他噪聲,它的顯著特點(diǎn)是僅在有信號(hào)輸入時(shí)才出現(xiàn),所以它是數(shù)字化中特有的噪聲。一般情況下,直接測(cè)量比較困難。(3 3)編碼器、譯碼器)編碼器、譯碼器 編碼器的任務(wù)是把一個(gè)多值的數(shù)字量用多比特的二進(jìn)制量來(lái)表示。 如果量化器輸出M個(gè)值,那么,對(duì)應(yīng)于個(gè)值中的任何一個(gè)值編碼器將給定一個(gè)二進(jìn)制碼字。這個(gè)碼字將由m個(gè)二進(jìn)制數(shù)組成。通常情況下 M= 2m 。 編碼器的輸入與輸出關(guān)系是一一對(duì)應(yīng)的,其過(guò)程是可逆的,因此,不會(huì)引入任何誤差。 線(xiàn)性PCM 編碼一般采
15、用等長(zhǎng)碼,也就是說(shuō)每一個(gè)碼字都有相同的比特?cái)?shù)。其中用得最為普遍的是自然二進(jìn)碼,也有用格雷碼的。輸入自然二進(jìn)碼格雷碼0 0 00 0 00 0 10 0 10 1 00 1 10 1 10 1 01 0 01 1 01 0 11 1 11 1 01 0 11 1 11 0 0m1m2m3m4m5m6m7m8M=8的自然二進(jìn)碼和格雷碼的自然二進(jìn)碼和格雷碼 .統(tǒng)計(jì)編碼高效編碼的主要方法是盡可能去除信源中的冗余成份,從而以最少的數(shù)碼率傳遞最大的信息量。冗余度存在于像素間的相關(guān)性及像素值出現(xiàn)概率的不均等性之中。對(duì)于有記憶性信源來(lái)說(shuō)首先要去除像素間的相關(guān)性,從而達(dá)到壓縮數(shù)碼率的目的。對(duì)于無(wú)記憶性信源來(lái)說(shuō),
16、像素間沒(méi)有相關(guān)性,可以利用像素灰度值出現(xiàn)概率的不均等性,采用某種編碼方法,也可以達(dá)到壓縮數(shù)碼率的目的。根據(jù)像素灰度值出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼叫統(tǒng)計(jì)編碼。(1)編碼效率與冗余度 衡量編碼方法優(yōu)劣的準(zhǔn)則:編碼效率、冗余度設(shè)某個(gè)無(wú)記憶信源共有個(gè)消息,記作 。 其中各消息出現(xiàn)的概率分別為 ??砂堰@個(gè)信源用下式表示u uuuM123, ppppM123, XuuuuppppMM123123, 根據(jù)該信源的消息集合,在字母集中選取符號(hào)進(jìn)行編碼 。一般情況下取二元字母集 A1, 0。通常,這一離散信源中的各個(gè)消息出現(xiàn)的概率并不相等。根據(jù)信息論中熵的定義,可計(jì)算出該信源的熵如下式:Aaaaan ,1
17、23 iaiMiPPXHlog1)(式中H(X)代表熵,Pi 代表第i個(gè)消息出現(xiàn)的概率。 例如,設(shè)一離散信源如下例如,設(shè)一離散信源如下 Xuuuu123412 14 18 18 可算出該信源的熵可算出該信源的熵 H Xppiii()log 1421212141418181818742222loglogloglog比特比特/消息消息設(shè)對(duì)應(yīng)于每個(gè)消息的碼字由 Ni 個(gè)符號(hào)組成。也就是說(shuō)每個(gè)消息所對(duì)應(yīng)的碼字長(zhǎng)度各為 Ni 。那么,每個(gè)消息的平均碼長(zhǎng)可用下式表示式中 代表平均碼長(zhǎng),為信源中包含的消息的個(gè)數(shù),Pi 為第i個(gè)消息出現(xiàn)的概率, Ni 為第i個(gè)消息對(duì)應(yīng)的碼長(zhǎng)。就平均而言,每個(gè)符號(hào)所含有的熵為i
18、iMiNPN1SHXN()N編碼符號(hào)是在字母集 A 中選取的。如果編碼后形成一個(gè)新的等概率的無(wú)記憶信源,字母數(shù)為n,那么,它的最大熵應(yīng)為 logan比特/符號(hào),因此,這是極限值。編碼效率定義為:HXNna()lo g式中 代表編碼效率,H(X)為信源的熵, 為平均碼長(zhǎng),n為字母集合中的字母數(shù)。 N如果 ,則可認(rèn)為編碼效率已達(dá)到100,若 則可認(rèn)為編碼效率較低。由上述概念,編碼效率如下式表示:式中 代表編碼效率,H(X)為信源的熵, 為平均碼長(zhǎng),n為字母集合中的字母數(shù)。 H XNna()logH XNna()logHXNna()lo gN如果以比特(bit)作單位,log a 的底為2,根據(jù)上述
19、定義,則H XNn()log2100% %100 log)(2nNXH 顯然,如果 ,就說(shuō)明還有冗余度。因此,冗余度如下式表示%100nNXHnNRd22log)(log1 統(tǒng)計(jì)編碼要研究的問(wèn)題就在于設(shè)法減小 ,使 盡量趨近于1, 趨近于0。顯然 值有一個(gè)理論最低限,當(dāng) =1時(shí), 的最低限就是 H(X)/log2n 。 可以根據(jù)這一準(zhǔn)則來(lái)衡量編碼方法的優(yōu)劣。NRdNN例: 一個(gè)信源X和一個(gè)字母集合A如下 3 2, 1, A 81 81 41 u u u uX,0214321N 1121418181平均碼長(zhǎng)平均碼長(zhǎng)47)(XHbit/消息消息可求得信源可求得信源X的熵的熵所以bit)(81871
20、1874log1472dR顯然,編碼后還有 bit的冗余度, 沒(méi)有達(dá)到最低限。81N如果取An , ,0 12 uuuu13240 01 00 11 1 N 2121418182此時(shí) 那么可以編成如下等長(zhǎng)碼742278178182l o gRd的冗余度。18同樣有上例中的兩種編碼方法,其特點(diǎn)是碼字長(zhǎng)度均相等,這種碼叫等長(zhǎng)碼。顯然此例中的兩種等長(zhǎng)碼均沒(méi)有達(dá)到最低限。怎樣才能使信源編碼達(dá)到最低限呢? 再看下例的編碼方法選 作為編碼字符集。在這種編碼中,不用等長(zhǎng)碼,而是采用下面的原則來(lái)編碼,即 Pi 大的消息編短碼,Pi 小的消息編長(zhǎng)碼。An , ,0 12 例:例:111:110:10:0:432
21、1uuuu可計(jì)算出平均碼長(zhǎng)可計(jì)算出平均碼長(zhǎng)N 11221431831874其效率7474212lo g冗余度冗余度 Rd 0 由此可見(jiàn),這種編碼法的碼字平均長(zhǎng)度達(dá)到了最低限。這說(shuō)明用變長(zhǎng)編碼法可達(dá)到較高的效率。采用這種編碼方法,信源中的消息與碼字是一一對(duì)應(yīng)的,因而譯碼時(shí)也是準(zhǔn)確無(wú)誤的。在編、譯碼過(guò)程中并不損失任何信息。它是一種信息保持編碼法。幾種常用的統(tǒng)計(jì)編碼法幾種常用的統(tǒng)計(jì)編碼法變長(zhǎng)編碼是統(tǒng)計(jì)編碼中最為主要的一種方法。變長(zhǎng)編碼的目標(biāo)就是使平均碼長(zhǎng)達(dá)到低限,也就是使 最優(yōu),但是,這種最優(yōu)必須在一定的限制下進(jìn)行。 編碼的基本限制就是碼字要有單義性和非續(xù)長(zhǎng)性。N單義性代碼是指任意一個(gè)有限長(zhǎng)的碼字序
22、列只能被分割成一個(gè)一個(gè)的碼字,而任何其他分割方法都會(huì)產(chǎn)生一些不屬于碼字集合中的碼字。 非續(xù)長(zhǎng)代碼是指任意一個(gè)碼字都不是其他碼字的續(xù)長(zhǎng)。換句話(huà)說(shuō),就是碼字集合中的任意一個(gè)碼字都不是由其中一個(gè)碼字在后面添上一些碼元構(gòu)成的。非續(xù)長(zhǎng)代碼一定是單義的,但是,單義代碼卻不一定是非續(xù)長(zhǎng)的。信信 源源概概 率率碼碼 碼碼 碼碼 碼碼 0000011 00 110 01 1 00 1 11 01 11 1 10 1 1 1u112u241u381u481 從上面的例子可知,使 最短的碼只是在單義可譯性和非續(xù)長(zhǎng)性的約束下才有意義。至于變長(zhǎng)碼的存在定理以及 的最低限是否存在等問(wèn)題,在信息論中都有詳細(xì)的定理加以證明及
23、討論。 最為常用的變長(zhǎng)編碼方法是 霍夫曼(Huffman)碼 香農(nóng)費(fèi)諾(Shannon-Fano)碼。NN例:求下述信源的霍夫曼碼例:求下述信源的霍夫曼碼Xuuuuuu 0.25 0.20 0.15 0.10 0.05123456025.(2 2)霍夫曼碼)霍夫曼碼0.450.300.55碼字碼字 消息消息 概率概率 0 11 01 10 0 00 0 1 00 0 1 11u2u3u4u5u6u0.250.250.200.150.100.050 1010.250.250.200 10.300.2501010.150.45消消 息息概概 率率碼碼 字字1碼碼 字字2u10.250 11 0u2
24、0.251 00 1u30.201 10 0u40.150 0 01 1 1u50.100 0 1 01 1 0 1u60.050 0 1 11 1 0 0如對(duì)合并的消息賦以1 1,0 0值,則會(huì)得到如下表所示的另外一組碼。下面計(jì)算一下信源的熵,平均碼長(zhǎng),效率及冗余度。42.205.0log05.010.0log10.015.0log15.020.0log20.025.0log25.025.0log25.0log)(222222261iiippXH45. 205. 0410. 0415. 0320. 0225. 0225. 02N%2%9811R%9898. 02log45. 242. 2nl
25、ogN)X(Hd22所以,對(duì)于信源 X 的霍夫曼碼的編碼效率為98,尚有2的冗余度。設(shè)原始信源有個(gè)消息,即:1)把信源中的消息按出現(xiàn)的概率從大到小的順序排列,即:MMppppuuuuX321321 編碼步驟:Mpppp3212)把最后兩個(gè)出現(xiàn)概率最小的消息合并成一個(gè)消息,從而使信源的消息數(shù)減少一個(gè),并同時(shí)再次將信源中的消息的概率從大到小排列一次,得132113211MMppppuuuuX3)重復(fù)上述步驟,直到信源最后為如下所示的 形式為止。020102010p pu uXX04)將被合并的消息分別賦以1和0或0和1。對(duì)最后 X0也對(duì) 和 對(duì)應(yīng)地賦以1和0或0和1。 u1002u(3 3)香農(nóng)費(fèi)
26、諾碼)香農(nóng)費(fèi)諾碼 另外一種常用的變長(zhǎng)編碼是香農(nóng)費(fèi)諾碼。這種碼有時(shí)也可以得到最優(yōu)編碼性能。 它的編碼準(zhǔn)則要符合非續(xù)長(zhǎng)條件,在碼字中1和0是獨(dú)立的,而且是(或差不多是)等概率的。 這樣的準(zhǔn)則一方面可保證無(wú)需用間隔來(lái)區(qū)分碼字,同時(shí)又保證每傳輸位碼就有bit的信息量。第一步:設(shè)信源有非遞增的概率分布Xu u uup p ppMM123123 其中Mpppp321。把X分成兩個(gè)子集合,得 Xuuuuppppkk1123123 XuuuuppppkkkMkkkM2123123 編碼步驟編碼步驟成立。 iMkiikipp11并且保證 第二步:給兩個(gè)子集中的消息分賦值1或0。 第三步:重復(fù)第一步驟,將兩個(gè)子集
27、 、 再細(xì)分為2個(gè)子集,并且也同樣使兩個(gè)小子集里消息的概率之和相等或近似相等。 然后,重復(fù)第二步驟賦值。以這樣的步驟重復(fù)下去,直到每個(gè)子集內(nèi)只包含一個(gè)消息為止。對(duì)每個(gè)消息所賦過(guò)的值依次排列出來(lái)就可以構(gòu)成香農(nóng)費(fèi)諾碼。X1X2例:設(shè)有信源例:設(shè)有信源Xuuuuuuuu 1234567814141818116116116116其編碼流程如下圖所示。其編碼流程如下圖所示。 碼字碼字 消息消息 概率概率000110010111001101111011111u2u3u4u5u6u7u8u香農(nóng)香農(nóng)-費(fèi)諾碼編碼流程圖費(fèi)諾碼編碼流程圖1/81/81/161/161/161/16010101010 10 10 1
28、消 息概 率碼 字碼 字0 01 10 11 01 0 00 1 11 0 10 1 01 1 0 00 0 1 11 1 0 10 0 1 01 1 1 00 0 0 11 1 1 10 0 0 0u114u214u318u418u5116u6116u7116u8116香農(nóng)費(fèi)諾碼的平均碼長(zhǎng),效率及冗余度。香農(nóng)費(fèi)諾碼的平均碼長(zhǎng),效率及冗余度。信源的熵可計(jì)算于下:信源的熵可計(jì)算于下:H X()loglogloglogloglogloglog 141414141818181811611611611611611611611622222222 234比特比特/消息消息432416141614161 4
29、16138138124124181iiiNpN平均碼長(zhǎng)顯然 編碼效率已達(dá)到100。對(duì)于香農(nóng)費(fèi)諾碼來(lái)說(shuō),如果滿(mǎn)足下式10, Rdp uiNi() 2且且iMNi121 就會(huì)使編碼效率達(dá)到100。式中的 P(ui) 為消息 ui 出現(xiàn)的概率,Ni 是碼字的長(zhǎng)度。如果不滿(mǎn)足上述條件就不會(huì)有100的效率。例:設(shè)有一信源例:設(shè)有一信源Xuuuuuuuuu 0.49 0.14 0.14 0.07 0.07 0.04 0.02 0.02 0.01123456789編碼流程及形成的碼字如圖所示。對(duì)其進(jìn)行香農(nóng)編碼流程及形成的碼字如圖所示。對(duì)其進(jìn)行香農(nóng)- -費(fèi)諾編碼:費(fèi)諾編碼: 編碼編碼 消息消息 概率概率 01
30、00101110011011110111101111101111111u2u3u4u5u6u7u8u9u0.490.140.140.070.070.040.020.020.0101010 10 10 10 10 10 1 由此例可見(jiàn),由于信源不滿(mǎn)足上述的條件,編碼效率不能達(dá)到100。然而從結(jié)果上看,它仍然是一種相當(dāng)好的編碼。冗余度 Rd0007.效率 0993.平均碼長(zhǎng) N 233.H X(). 2313信源的熵在在ITU-T建議的彩色圖像編碼標(biāo)準(zhǔn)中的編碼表建議的彩色圖像編碼標(biāo)準(zhǔn)中的編碼表 游程游程/尺寸尺寸 亮度亮度AC系數(shù)系數(shù) 色度色度AC系數(shù)系數(shù)碼長(zhǎng)碼長(zhǎng) 碼字碼字 碼長(zhǎng)碼長(zhǎng) 碼字碼字0/
31、00/10/20/30/40/50/60/70/80/90/A1/142234578101616410100001100101111010111100011111000111111011011111111100000101111111110000011110022345567910124000110010101100011001111000111100011111010011111101101111111101001011AC系數(shù)系數(shù)Huffman碼表(續(xù))碼表(續(xù)) 游程游程/尺寸尺寸 亮度亮度AC系數(shù)系數(shù) 色度色度AC系數(shù)系數(shù) 碼長(zhǎng)碼長(zhǎng) 碼字碼字 碼長(zhǎng)碼長(zhǎng) 碼字碼字 1/21/31/41/
32、51/61/71/81/91/A2/12/22/357911161616161658101101111110011111101101111111011011111111100001001111111110000101111111111000011011111111100001111111111110000000111001111100111111101116891112161616165810111001111101101111101011111111011011111111010111111111100010001111111110001001111111111000101011111111
33、1000101111010111101111111110111特點(diǎn):Huffman碼和Shannon Fano碼不是唯一的;Huffman碼和Shannon Fano碼缺乏構(gòu)造性,即:不能用數(shù)學(xué)方法建立一一對(duì)應(yīng)關(guān)系,只能通過(guò)查表的方法構(gòu)成對(duì)應(yīng)關(guān)系。如果消息數(shù)目很大,所需的存儲(chǔ)器就大,設(shè)備就復(fù)雜。非等長(zhǎng)碼在傳輸、譯碼、存儲(chǔ)都不方便。(4 4)算術(shù)編碼()算術(shù)編碼(Arithmetic codingArithmetic coding)算術(shù)編碼的概念最早由J.Rissaner在1976年以后入先出的編碼形式引入,1979年他和G.G.Langdom 一起將其系統(tǒng)化。由于省去了乘法,因此,處理比較簡(jiǎn)單
34、。 1981年又將其推廣用于二值圖像編碼。對(duì)于二元平穩(wěn)馬爾可夫信源,效率可高于95%。在國(guó)際編碼標(biāo)準(zhǔn)中,JPEG2000、H.264都有算術(shù)編碼的應(yīng)用。 與Huffman碼不同,算術(shù)編碼是一種非分組編碼方法,或叫非塊碼。正因?yàn)樗阈g(shù)編碼不是分組編碼。因此,其譯碼也是一個(gè)字符一個(gè)字符的譯碼。符號(hào)符號(hào)概率(十進(jìn)制)概率(十進(jìn)制)1/81/81/41/41/21/21/81/8概率(二進(jìn)制)概率(二進(jìn)制)0.0010.0010.010.010.10.10.0010.001累積概率累積概率0 00.0010.0010.0110.0110.1110.1111a2a3a4a設(shè):有一4符號(hào)的信源,其分為 ,其
35、概率如下表和下圖所示。 算術(shù)編碼的基本原理4321,aaaa圖中符號(hào)出現(xiàn)的概率表示在概率區(qū)間之中,區(qū)間寬度表示概率值大小,圖中子區(qū)間的邊界值實(shí)際上是從下到上符號(hào)的累積概率,在算術(shù)編碼中通常用二進(jìn)制小數(shù)來(lái)表示概率。其中 的概率值在表中。4321,aaaa概率區(qū)間表示概率大小概率區(qū)間表示概率大小累積概率累積概率這里請(qǐng)注意二進(jìn)制數(shù)的計(jì)算規(guī)律:1)逢二進(jìn)一;2)二進(jìn)制數(shù)的表示3210123(1101.101)1 21 20 21 21 20 21 2 3)二進(jìn)制數(shù)乘上2倍小數(shù)點(diǎn)向右移一位,二進(jìn)制數(shù)除上2倍小數(shù)點(diǎn)向左移一位。如:0101.11)10()101.110(01.1101)10()101.11
36、0( 在算術(shù)編碼中,每個(gè)符號(hào)對(duì)應(yīng)的概率區(qū)間都是半開(kāi)區(qū)間, 即:該區(qū)間包括下端點(diǎn),而不包括上端點(diǎn)。如:1a對(duì)應(yīng)對(duì)應(yīng)00,0.001)0.001)2a對(duì)應(yīng)對(duì)應(yīng)0.001,0.011)0.001,0.011)等等?,F(xiàn)在以符號(hào)序列4233aaaa為例解釋一下編碼過(guò)程。a3a3a2a4注意:1)算術(shù)編碼產(chǎn)生的碼字實(shí)際上是一個(gè)二進(jìn)制小數(shù)的指針,該指針指向所編碼符號(hào)對(duì)應(yīng)的概率空間;2)按照上述原則,序列的第一個(gè)符號(hào)是 我們就用第3個(gè)子區(qū)間的指針來(lái)代表這個(gè)符號(hào);3)原理上講,指針指向區(qū)間0.011,0.111內(nèi)的任何部位都可以代表 a3 ;但為方便起見(jiàn),通常規(guī)定指向區(qū)間的下端點(diǎn)。因此,得碼字0.011。3a
37、上述遞歸過(guò)程,可將算術(shù)編碼的基本原理 總結(jié)如下:(1)初始狀態(tài) 編碼原點(diǎn)(指針?biāo)钢帲〤0=0 區(qū)間寬度為 A0=1.0(2)新編碼點(diǎn) Ci=編碼原點(diǎn)Ci-1上一級(jí)區(qū)間寬度Ai-1累積概率Pi 新區(qū)間 Ai=上一級(jí)區(qū)間寬度Ai-1pi 其中 pi 為所編符號(hào) ai 對(duì)應(yīng)的概率,Pi 為ai 的累積概率。因此, a3 a3 a2 a4 的編碼過(guò)程如下:第一個(gè)符號(hào):第一個(gè)符號(hào):a30001 0.0110.0111 0.10.1CA 原編碼點(diǎn)原編碼點(diǎn)原區(qū)間寬度原區(qū)間寬度符號(hào)累積概率符號(hào)累積概率原區(qū)間寬度原區(qū)間寬度符號(hào)概率符號(hào)概率區(qū)間寬度區(qū)間寬度編碼編碼第二個(gè)符號(hào):第二個(gè)符號(hào):a3110.011 0
38、.1 0.0110.10010.1 0.10.01CAa3 的累積概率的累積概率原編碼點(diǎn)原編碼點(diǎn)區(qū)間寬度區(qū)間寬度區(qū)間寬度區(qū)間寬度原區(qū)間寬度原區(qū)間寬度符號(hào)概率符號(hào)概率編碼編碼第三個(gè)符號(hào):第三個(gè)符號(hào):a2330.10010.01 0.0010.100110.01 0.010.0001CAa2 的累積概率的累積概率編碼編碼原編碼點(diǎn)原編碼點(diǎn)區(qū)間寬度區(qū)間寬度區(qū)間寬度區(qū)間寬度原區(qū)間寬度原區(qū)間寬度符號(hào)概率符號(hào)概率第四個(gè)符號(hào):a4440.10011 0.0001 0.1110.10100110.0001 0.0010.0000001CA以上是編碼過(guò)程。以上是編碼過(guò)程。編碼編碼原編碼點(diǎn)原編碼點(diǎn)區(qū)間寬度區(qū)間寬度a
39、4 的累積概率的累積概率區(qū)間寬度區(qū)間寬度原區(qū)間寬度原區(qū)間寬度符號(hào)概率符號(hào)概率解碼過(guò)程是:(收到的碼字串) (已解符號(hào)子區(qū)間的下端點(diǎn)) (字符概率)例: 0.1010011 解碼在解碼過(guò)程中,當(dāng)收到碼字串0.1010011時(shí),由于這個(gè)碼字串指向子區(qū)間0.011,0.111,因此,解出的第一個(gè)符號(hào)應(yīng)為 a3 ,然后用相反的步驟,從碼字串中減去已解符號(hào)子區(qū)間下端點(diǎn)的數(shù)值(累積概率),并將差值除以該子區(qū)間的寬度(概率值)則得到碼字串,即:100011.01 .0)0100011.0(1 .0)011.0()1010011.0(由上圖所示,該字串仍然落在0.011,0.111區(qū)間內(nèi),因此,解出的第二個(gè)字
40、符為 a3收到碼字串收到碼字串a(chǎn)3累積概率累積概率a3字符概率字符概率第三個(gè)字符:01011.01 .0001011.01 .0)011.0100011.0(a3 的累積概率的累積概率 a3的子區(qū)間寬度的子區(qū)間寬度(概率概率)字符落在0.001,0.011之間 因此是 a2收到碼字串收到碼字串第四個(gè)字符第四個(gè)字符111.001.000111.001.0)001.001011.0(a2 的區(qū)間下端點(diǎn)數(shù)值的區(qū)間下端點(diǎn)數(shù)值a2的概率的概率收到碼字串收到碼字串字符落在0.111,1.0之間 因此是 a4在算術(shù)編碼中,值得注意的問(wèn)題是進(jìn)位問(wèn)題。在Huffman碼中沒(méi)有這類(lèi)問(wèn)題。如上述的例子,編完第3個(gè)符
41、號(hào)之后得到的碼字是0.10011,對(duì)第四個(gè)符號(hào)編碼時(shí)前3位0.100就變成0.101。( a2 0.10011, a4 0.1010011)這就是相加過(guò)程中的進(jìn)位引起的。 在20世紀(jì)40年代,Weiner提出了最佳線(xiàn)性預(yù)測(cè)理論,1952年Oliver 和Harrison 等人認(rèn)識(shí)到了線(xiàn)性預(yù)測(cè)在通信中的作用,并建議把它用于降低冗余度。 預(yù)測(cè)編碼法是一種設(shè)備簡(jiǎn)單質(zhì)量較佳的高效編碼法。預(yù)測(cè)編碼方法主要有二種。(Delta modulation)或DM編碼法DPCM (Differential Pulse Code Modulation)5.5. 預(yù)測(cè)編碼預(yù)測(cè)編碼(Predictive CodingP
42、redictive Coding)5.4.1 5.4.1 預(yù)測(cè)編碼的基本原理預(yù)測(cè)編碼的基本原理 預(yù)測(cè)編碼的基本原理如下圖所示。假設(shè)有一個(gè)平均值為零,均方根值為 的平穩(wěn)信號(hào) 在時(shí)刻 被取樣,而且其相應(yīng)的樣值為 。 X t ( )t ttn12,xxxxn123, ix ixie編碼編碼 )(ns)(ns 譯碼譯碼 ieixixix23nn3211x2x3xnxnx3x2x1x1編碼原理圖中,xi 是下一個(gè)樣值。根據(jù)前面出現(xiàn)的n個(gè)樣值,可以得到 xi 的預(yù)測(cè)值 。式中 是 的前n個(gè)樣值。 是預(yù)測(cè)參數(shù)。設(shè) 為 與 之間的誤差值,則eixi xixxxxn123, xi123, , ,n xxxxxi
43、nn112233 xiexxiii 預(yù)測(cè)編碼就是要對(duì)誤差 進(jìn)行編碼,而不是對(duì)樣值直接編碼。那么,對(duì)誤差編碼果真可以壓縮數(shù)據(jù)率嗎?ei假如直接對(duì)樣值x編碼,那么正如前面談到的那樣,代碼平均長(zhǎng)度有一個(gè)下限 ,這個(gè)下限就是信源的熵 ,即NminH X()(log)()(minipipXHN同樣道理,如果對(duì)誤差信號(hào)進(jìn)行編碼,那么,它也應(yīng)該有一個(gè)下限,設(shè)為 。顯然,預(yù)測(cè)編碼可以壓縮數(shù)碼率的條件是H E( )H EH X( )()熵是概率分布的函數(shù),分布越均勻熵越大。熵值大,則其平均碼長(zhǎng)之下限必然會(huì)加大,碼率就會(huì)增高。反之,分布越集中熵值越小,其平均碼長(zhǎng)之下限就會(huì)越短,碼率就會(huì)降低。如果預(yù)測(cè)比較準(zhǔn)確,那么
44、誤差就會(huì)集中于不大的數(shù)值內(nèi),從而使 H(E)小于 H(X) 。 由于圖像信號(hào)中樣值的高度相關(guān)性,使得相鄰樣值之間的差別總是十分微小的,所以其差值分布十分集中。 樣值樣值 差值差值 0 0預(yù)測(cè)前后的概率密度分布示意圖預(yù)測(cè)前后的概率密度分布示意圖(a a)為圖像信號(hào)概率密度分布)為圖像信號(hào)概率密度分布(b b)為差值信號(hào)概率密度分布)為差值信號(hào)概率密度分布 對(duì)于視頻信號(hào)性質(zhì)來(lái)說(shuō),幀內(nèi)像素相關(guān)系數(shù)在0.85左右,幀間相關(guān)系數(shù)在0.95左右。由此可見(jiàn),圖像像素間的相關(guān)性是很大的,其壓縮潛力也是很大的。由上面的定性分析可知,預(yù)測(cè)編碼是可以壓縮碼率的。 一般情況,使用線(xiàn)性預(yù)測(cè)器,預(yù)測(cè)值與前面的n個(gè)已出現(xiàn)樣
45、值的關(guān)系線(xiàn)性關(guān)系,即線(xiàn)性預(yù)測(cè)的關(guān)鍵一步在于預(yù)測(cè)系數(shù) 的求解。預(yù)測(cè)誤差信號(hào)是一個(gè)隨機(jī)變量,它的均方誤差為 。i2iiiiExx22( ) xxxxxinn112233這里E 表示數(shù)學(xué)期望。通常把均方誤差最小的預(yù)測(cè)稱(chēng)為最佳預(yù)測(cè)。通過(guò)最小均方誤差準(zhǔn)則可求解預(yù)測(cè)系數(shù),即 E xxjniij( ) ,201 2 3 對(duì)于圖像編碼,特別是電視信號(hào)編碼,如果利用同一行的前r個(gè)樣值進(jìn)行預(yù)測(cè),叫一維預(yù)測(cè)。如果同時(shí)利用前面幾行的樣值預(yù)測(cè)就叫二維預(yù)測(cè)。電視圖像一般是一幀一幀連續(xù)發(fā)送的,那么可以利用前面若干幀進(jìn)行預(yù)測(cè),這時(shí)就是三維預(yù)測(cè)了。 5.4.2 5.4.2 (DMDM)編碼)編碼 )(tf)(tf)(te)(t
46、fCP )(ns)(ns編碼、譯碼原理方框圖編碼、譯碼原理方框圖放大限幅定時(shí)判決定時(shí)判決本地譯碼本地譯碼低通濾波低通濾波譯碼譯碼 M編碼器實(shí)際上就是1bit編碼的預(yù)測(cè)編碼器。它用一位碼字來(lái)表示式中f(t)為輸入視頻信號(hào), 是 f(t) 的預(yù)測(cè)值。當(dāng)差值e(t)為一個(gè)正的增量時(shí)用“1”碼來(lái)表示,當(dāng)差值e(t)為一個(gè)負(fù)的增量時(shí)用“0”碼來(lái)表示。e t ( )e tf tf t( )( )( )( )f t由上述原理看,DM中增量脈沖攜帶的是斜率信息。0dfdt0dfdt0dfdt發(fā)發(fā)“1”碼。碼。發(fā)發(fā)“0”碼。碼。交替出現(xiàn)交替出現(xiàn) “0” “1” 碼。碼。 在接收端: 當(dāng)譯碼器收到“1”時(shí),信號(hào)則
47、產(chǎn)生一個(gè)正跳變 收到“0”時(shí),則信號(hào)電壓產(chǎn)生一個(gè)負(fù)的跳變。 由此即可實(shí)現(xiàn)譯碼。譯碼器應(yīng)具有下述三個(gè)功能:譯碼器應(yīng)具有下述三個(gè)功能: ()收到()收到“1”1”時(shí),產(chǎn)生一個(gè)正斜變電壓,當(dāng)時(shí),產(chǎn)生一個(gè)正斜變電壓,當(dāng) 連續(xù)收到連續(xù)收到“1”1”時(shí),則連續(xù)上升;時(shí),則連續(xù)上升; ()收到()收到“0”0”時(shí),產(chǎn)生一個(gè)負(fù)斜變電壓,當(dāng)時(shí),產(chǎn)生一個(gè)負(fù)斜變電壓,當(dāng) 連續(xù)收到連續(xù)收到“0”0”時(shí),則連續(xù)下降;時(shí),則連續(xù)下降; ()正、負(fù)斜率相等,且具有記憶功能。()正、負(fù)斜率相等,且具有記憶功能。 DM譯碼原理譯碼原理 5. 5.4.3 DPCM4.3 DPCM編碼編碼 預(yù)測(cè)編碼的另一種有用的形式是DPCM編碼
48、(Differential Pulse Code Modulation)。這實(shí)際上是M和PCM兩種技術(shù)相結(jié)合的編碼方法。DPCM編、譯碼原理框圖編、譯碼原理框圖)(te)(nS)(tf)(nS)(te)(tf)(tf量化器編碼器編碼器預(yù)測(cè)器預(yù)測(cè)器解碼器解碼器預(yù)測(cè)器預(yù)測(cè)器(a)(b) 圖中(a)是編碼器原理框圖。輸入信號(hào)f(t)經(jīng)采樣后將樣值送入比較器,使得f(t)與預(yù)測(cè)值 相減得出誤差信號(hào),即: 。然后,將e(t)送入量化器量化為個(gè)電平之一 。 量化后的樣值再送入PCM編碼器中編碼,以便傳輸。另外一路是將e(t)送入相加器,在這里e(t)與 相加后再送入預(yù)測(cè)器,以便預(yù)測(cè)下一個(gè)樣值。( )f t
49、e tf tf t( )( )( )()MN 2( )f t 譯碼器的原理框圖如圖(b)所示。譯碼器收到碼字后首先經(jīng)PCM譯碼,得到e(t)后再送入相加器與預(yù)測(cè)值 相加得到 f(t)。另外,f(t)又送到預(yù)測(cè)器以便預(yù)測(cè)下一個(gè)樣值。( )f t由上面的原理可知,DPCM實(shí)際上是綜合了M和PCM兩種編碼技術(shù)的一種編碼方法,M實(shí)際上是一位二進(jìn)制碼的差分脈碼調(diào)制,也就是用1bit碼來(lái)表示增量值,而DPCM是N位二進(jìn)碼來(lái)表示e(t)值的編碼法。 5.4.4 圖像的預(yù)測(cè)編碼+ -符號(hào)符號(hào)編碼編碼壓縮圖像壓縮圖像輸入圖像輸入圖像e(i,j)f(i,j)預(yù)測(cè)器預(yù)測(cè)器), ( jif 霍夫曼編碼霍夫曼編碼 算術(shù)
50、編碼算術(shù)編碼+ +符號(hào)符號(hào)解碼解碼解壓縮圖像解壓縮圖像壓縮圖像壓縮圖像e(i,j),(jiff(i,j)預(yù)測(cè)器預(yù)測(cè)器無(wú)損無(wú)損預(yù)測(cè)預(yù)測(cè)利用圖像利用圖像/ /視頻在空間或時(shí)間上的相關(guān)性,通過(guò)鄰近像素視頻在空間或時(shí)間上的相關(guān)性,通過(guò)鄰近像素值預(yù)測(cè)當(dāng)前像素值,對(duì)預(yù)測(cè)殘差進(jìn)行編碼。值預(yù)測(cè)當(dāng)前像素值,對(duì)預(yù)測(cè)殘差進(jìn)行編碼。預(yù)測(cè)幀預(yù)測(cè)幀當(dāng)前幀當(dāng)前幀幀內(nèi)預(yù)測(cè)幀內(nèi)預(yù)測(cè)利用圖像的空間相關(guān)性,利用相鄰已編碼像素(圖像塊)利用圖像的空間相關(guān)性,利用相鄰已編碼像素(圖像塊),預(yù)測(cè)當(dāng)前編碼像素(圖像塊)的值;,預(yù)測(cè)當(dāng)前編碼像素(圖像塊)的值;算法簡(jiǎn)單,易于硬件實(shí)現(xiàn);算法簡(jiǎn)單,易于硬件實(shí)現(xiàn);容易產(chǎn)生誤碼擴(kuò)散;壓縮比低,很少獨(dú)
51、立使用;容易產(chǎn)生誤碼擴(kuò)散;壓縮比低,很少獨(dú)立使用;幀間預(yù)測(cè)幀間預(yù)測(cè) 利用視頻序列相鄰幀間的相關(guān)性,可以獲得比幀內(nèi)預(yù)測(cè)高利用視頻序列相鄰幀間的相關(guān)性,可以獲得比幀內(nèi)預(yù)測(cè)高得多的壓縮比;得多的壓縮比; 一般以圖像塊為單位進(jìn)行預(yù)測(cè);一般以圖像塊為單位進(jìn)行預(yù)測(cè);視頻編碼中的預(yù)測(cè)技術(shù)(視頻編碼中的預(yù)測(cè)技術(shù)(H.261)5.5 5.5 變換編碼(變換編碼(Transform CodingTransform Coding) 將空間域相關(guān)的像素點(diǎn)經(jīng)過(guò)將空間域相關(guān)的像素點(diǎn)經(jīng)過(guò)正交變換正交變換映射到另一個(gè)變換域,使變換后映射到另一個(gè)變換域,使變換后的系數(shù)之間的系數(shù)之間相關(guān)性相關(guān)性降低。變換域上應(yīng)滿(mǎn)足:降低。變換域
52、上應(yīng)滿(mǎn)足: 所有系數(shù)相互獨(dú)立所有系數(shù)相互獨(dú)立 能量集中于少數(shù)幾個(gè)系數(shù)上;能量集中于少數(shù)幾個(gè)系數(shù)上; 這些系數(shù)集中于一個(gè)最小的區(qū)域內(nèi)這些系數(shù)集中于一個(gè)最小的區(qū)域內(nèi) 保留保留少數(shù)重要系數(shù)少數(shù)重要系數(shù)就能很好的恢復(fù)出圖像,人眼幾乎覺(jué)察不出那些損就能很好的恢復(fù)出圖像,人眼幾乎覺(jué)察不出那些損失的系數(shù)。失的系數(shù)。 圖像正交變換實(shí)現(xiàn)數(shù)據(jù)壓縮的本質(zhì)在于:經(jīng)過(guò)多維坐標(biāo)系中的適當(dāng)?shù)膱D像正交變換實(shí)現(xiàn)數(shù)據(jù)壓縮的本質(zhì)在于:經(jīng)過(guò)多維坐標(biāo)系中的適當(dāng)?shù)淖鴺?biāo)旋轉(zhuǎn)和變換,能夠把坐標(biāo)旋轉(zhuǎn)和變換,能夠把散布在各個(gè)坐標(biāo)軸上的原始圖像數(shù)據(jù)散布在各個(gè)坐標(biāo)軸上的原始圖像數(shù)據(jù),在新,在新的坐標(biāo)系中,的坐標(biāo)系中,集中到少數(shù)坐標(biāo)軸上集中到少數(shù)坐標(biāo)
53、軸上,這樣可以采用較少的編碼比特來(lái),這樣可以采用較少的編碼比特來(lái)表示一幅子圖像,實(shí)現(xiàn)壓縮編碼。表示一幅子圖像,實(shí)現(xiàn)壓縮編碼。用一個(gè)可逆的、線(xiàn)性的變換(如傅立葉變換離散余弦變用一個(gè)可逆的、線(xiàn)性的變換(如傅立葉變換離散余弦變換等等),把圖像映射到變換系數(shù)集合;換等等),把圖像映射到變換系數(shù)集合;然后對(duì)該系數(shù)集合進(jìn)行量化和編碼;然后對(duì)該系數(shù)集合進(jìn)行量化和編碼;對(duì)于大多數(shù)自然圖像,重要系數(shù)的數(shù)量是比較少的,因?qū)τ诖蠖鄶?shù)自然圖像,重要系數(shù)的數(shù)量是比較少的,因而可以用量化(或完全拋棄),且僅以較小的圖像失真而可以用量化(或完全拋棄),且僅以較小的圖像失真為代價(jià)。為代價(jià)。變換編碼的基本思想變換編碼的基本思想
54、變換編碼的原理變換編碼的原理( , )F u v正向變換正向變換量化器量化器編碼器編碼器輸輸入入圖圖像像壓縮圖像壓縮圖像),( vuF解碼器解碼器合成合成nxnnxn的子圖的子圖壓縮的圖像壓縮的圖像解壓圖像解壓圖像逆向變換逆向變換圖像分塊圖像分塊圖像數(shù)據(jù)經(jīng)過(guò)正交變換后,空域中的總能量在變換域中得到圖像數(shù)據(jù)經(jīng)過(guò)正交變換后,空域中的總能量在變換域中得到保持,但像素之間的相關(guān)性下降,能量將會(huì)重新分布,并集保持,但像素之間的相關(guān)性下降,能量將會(huì)重新分布,并集中在變換域中少數(shù)的變換系數(shù)上,因此,選擇少數(shù)中在變換域中少數(shù)的變換系數(shù)上,因此,選擇少數(shù)F(u,v)F(u,v)來(lái)來(lái)重建圖像就可以達(dá)到壓縮數(shù)據(jù)的目
55、的,并且重建圖像僅引入重建圖像就可以達(dá)到壓縮數(shù)據(jù)的目的,并且重建圖像僅引入較小誤差。較小誤差。變換多采用變換多采用正交函數(shù)正交函數(shù)為基礎(chǔ)的變換。為基礎(chǔ)的變換。K-LK-L變換 -最優(yōu)變換,去相關(guān)效率高 -基函數(shù)不固定,計(jì)算復(fù)雜度高DCTDCT變換 -基函數(shù)固定,速度較快 -去相關(guān)效率較K-LK-L低離散小波變換(DWTDWT) -編碼效率高 -適用于可擴(kuò)展編碼經(jīng)典的正交變換方法經(jīng)典的正交變換方法(1)基于變換的壓縮算法()基于變換的壓縮算法(JPEG)88DCT變換變換ijjiyvjCuiCvuY,),(),(41,16) 12(cos)(),(uiuAuiC010)(21uuuA u、v分別
56、表示圖像子塊的水平、垂直頻率。分別表示圖像子塊的水平、垂直頻率。88DCT變換基圖像變換基圖像PCAPCA主成分截取主成分截取快速矢量量化快速矢量量化碼流組織碼流組織LOCO-ILOCO-I矢量量化碼書(shū)矢量量化碼書(shū)矢量量化矢量量化碼字索引碼字索引輸出輸出碼流碼流將變換矩陣寫(xiě)入碼流將變換矩陣寫(xiě)入碼流(2)基于)基于PCA的壓縮算法框架的壓縮算法框架第第1主成分主成分第第3主成分主成分第第9主成分主成分第第15主成分主成分第第30主成分主成分第第60主成分主成分第第90主成分主成分第第150主成分主成分第第224主成分主成分一組一組224波段的高光譜圖像波段的高光譜圖像K-L 變換結(jié)果變換結(jié)果K-
57、L 變換的特征值曲線(xiàn)變換的特征值曲線(xiàn)算法壓縮性能(3)基于小波變換的圖像壓縮示例小波分解小波分解LLLL子帶編碼子帶編碼LH1LH1子帶編碼子帶編碼HL1HL1子帶編碼子帶編碼HL3HL3子帶編碼子帶編碼.輸輸出出碼碼流流基于率基于率失真特失真特性的碼性的碼率最優(yōu)率最優(yōu)截?cái)嗨憬財(cái)嗨惴ǚㄝ斎胼斎胧噶渴噶?Y失真測(cè)度失真測(cè)度d d( (X,YX,Y) )碼書(shū)碼書(shū)Y1YN碼書(shū)碼書(shū)Y1YN計(jì)算計(jì)算dmindmin( (X,YX,Y),),置置()Xi尋找尋找Y Yi i( )iiYiiYi5.6 5.6 矢量量化編碼(矢量量化編碼(Vector QuantizationVector Quantizat
58、ion)利用相鄰數(shù)據(jù)間的相關(guān)性,將輸入的數(shù)據(jù)分組,每組利用相鄰數(shù)據(jù)間的相關(guān)性,將輸入的數(shù)據(jù)分組,每組m m個(gè)數(shù)個(gè)數(shù)據(jù)被描述成一個(gè)有據(jù)被描述成一個(gè)有m m個(gè)元素的矢量進(jìn)行整體量化。個(gè)元素的矢量進(jìn)行整體量化。5.7 圖像/視頻壓縮標(biāo)準(zhǔn)簡(jiǎn)介精確地保留所有信息精確地保留所有信息壓縮比較低壓縮比較低損失不重要信息損失不重要信息壓縮比較高壓縮比較高圖像圖像壓縮技術(shù)壓縮技術(shù)2002 音視頻編碼標(biāo)準(zhǔn)音視頻編碼標(biāo)準(zhǔn) 我國(guó)自主的視頻編碼標(biāo)準(zhǔn)我國(guó)自主的視頻編碼標(biāo)準(zhǔn)2006年獲頒為國(guó)家標(biāo)準(zhǔn)年獲頒為國(guó)家標(biāo)準(zhǔn)H. JPEGMPEGAVS1992 ISO與與CCITT通過(guò)通過(guò)JEPG2000 ISO與與CCITT通過(guò)通過(guò)J
59、EPG20001991 ISO/TEC通過(guò)通過(guò)MPEG-11994 ISO/TEC通過(guò)通過(guò)MPEG-21998 ISO/TEC通過(guò)通過(guò)MPEG-41988 CCITT通過(guò)通過(guò)H.2611995 ITU-T通過(guò)通過(guò)H.2632003.3 ITU-T與與ISO/IEC通過(guò)通過(guò)H.264數(shù)字圖像編碼的發(fā)展數(shù)字圖像編碼的發(fā)展HEVC也被稱(chēng)也被稱(chēng)為為H.2655.7.1 靜止圖像壓縮標(biāo)準(zhǔn) JPEG:(ISO10918-1) 無(wú)損壓縮,基于預(yù)測(cè)的方法 有損壓縮,基于DCT的分塊編碼技術(shù) JPEG-2000:(ISO15444) 基于DWT的多分辨率編碼技術(shù) 支持無(wú)損和有損壓縮,誤碼魯棒性好,支持漸進(jìn)傳輸,
60、支持感興趣區(qū)編碼 JPEG-LS:(ISO14495-1/ITU-T.87) 無(wú)損/近無(wú)損壓縮算法 算法復(fù)雜度低,壓縮比高,不支持可分級(jí)編碼,無(wú)抗誤碼能力(1 1)JPEGJPEG標(biāo)準(zhǔn)標(biāo)準(zhǔn)JPEG標(biāo)準(zhǔn)的由來(lái)1991年,聯(lián)合專(zhuān)家組提出了ISO CD建議草案,后經(jīng)過(guò)國(guó)際電子技術(shù)委員 會(huì)ISO/IEC的批準(zhǔn),正式成為第10918號(hào)標(biāo)準(zhǔn),并正式命名為“JPEG高質(zhì) 量靜止圖像壓縮編碼標(biāo)準(zhǔn)”,簡(jiǎn)稱(chēng)“JPEG標(biāo)準(zhǔn)”。JPEG的四種模式:DCT順序編碼模式 基本操作模式,也稱(chēng)基本系統(tǒng),所有JPEG編碼解碼器(有損)都必須支持基本系統(tǒng),采用二維余弦變換的編碼方案。 DCT遞增模式,該模式又叫累進(jìn)模式。 無(wú)失真
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度證件外借風(fēng)險(xiǎn)評(píng)估與管理合同
- 洗衣店裝修簡(jiǎn)易協(xié)議
- 二零二五年度商場(chǎng)家居用品柜臺(tái)租賃管理合同
- 2025年度建筑工程施工環(huán)境保護(hù)責(zé)任協(xié)議書(shū)
- 2025年度供應(yīng)鏈物流保密協(xié)議合同
- 文化產(chǎn)業(yè)借款融資居間合同
- 2025年度農(nóng)村土地承包經(jīng)營(yíng)權(quán)流轉(zhuǎn)及農(nóng)業(yè)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整合作合同
- 2025年度企業(yè)兼職市場(chǎng)營(yíng)銷(xiāo)人員勞務(wù)合同模板
- 2025年度房產(chǎn)贈(zèng)與資產(chǎn)重組合同
- 2025年度人工智能系統(tǒng)維護(hù)與數(shù)據(jù)安全合同
- 民營(yíng)企業(yè)職務(wù)犯罪預(yù)防
- 睿智醫(yī)藥科技股份有限公司財(cái)務(wù)分析研究
- 【品牌戰(zhàn)略】麥當(dāng)勞公司成功管理秘訣苦心經(jīng)營(yíng)
- 2024屆南通二模(又蘇北七市二模)數(shù)學(xué)試題
- 菜點(diǎn)與酒水知識(shí)課件
- 新修訂《中小學(xué)教師職業(yè)道德規(guī)范》解讀
- 品質(zhì)月工作總結(jié)
- 江西省南昌市2024屆高三一模語(yǔ)文試題及答案解析
- 第一章村集體經(jīng)濟(jì)組織會(huì)計(jì)制度講解
- 2024年濟(jì)南護(hù)理職業(yè)學(xué)院高職單招(英語(yǔ)/數(shù)學(xué)/語(yǔ)文)筆試歷年參考題庫(kù)含答案解析
- -藝術(shù)博覽會(huì)與藝術(shù)品拍賣(mài)
評(píng)論
0/150
提交評(píng)論