




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多媒體通信原理第2章數(shù)據(jù)壓縮編碼基本理論多媒體通信原理第2章數(shù)據(jù)壓縮編碼基本理論1本章主要內(nèi)容多媒體數(shù)據(jù)壓縮編碼基本原理多媒體數(shù)據(jù)壓縮編碼的必要性多媒體數(shù)據(jù)壓縮編碼的可行性壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的基本方法壓縮編碼算法的性能評(píng)價(jià)指標(biāo)幾種常見(jiàn)編碼預(yù)測(cè)編碼;變換編碼;統(tǒng)計(jì)編碼其他編碼…本章主要內(nèi)容多媒體數(shù)據(jù)壓縮編碼基本原理2多媒體壓縮技術(shù)概述?WhyWhatHowNecessitiesProbabilitiesTechniques&Standards多媒體壓縮技術(shù)概述?WhyWhatHowNecessitie32.1多媒體數(shù)據(jù)壓縮編碼基本原理多媒體數(shù)據(jù)壓縮編碼的必要性為什么要壓縮,不壓縮不行嗎?多媒體數(shù)據(jù)壓縮編碼的可行性為什么可以壓縮了,從哪些方面入手壓縮?壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的基本方法壓縮編碼算法的性能評(píng)價(jià)指標(biāo)2.1多媒體數(shù)據(jù)壓縮編碼基本原理多媒體數(shù)據(jù)壓縮編碼的必要性42.1.1多媒體數(shù)據(jù)壓縮編碼的必要性多媒體處理中涉及使用到各種媒體,會(huì)帶來(lái)巨大的數(shù)據(jù)量。從存儲(chǔ)和傳輸兩個(gè)方面考慮,這樣巨大的數(shù)據(jù)量都會(huì)帶來(lái)實(shí)現(xiàn)上的困難。舉例說(shuō)明:(1)存儲(chǔ)量:一幅圖像,空間分辨率為640×480,顏色編碼方式為真彩色,存儲(chǔ)這樣一幅未經(jīng)壓縮的圖像需要的存儲(chǔ)量為:640×480×24/8=921,600B2.1.1多媒體數(shù)據(jù)壓縮編碼的必要性多媒體處理中涉及使用到5多媒體數(shù)據(jù)壓縮編碼的必要性(2)傳輸帶寬:由網(wǎng)絡(luò)傳輸未經(jīng)壓縮的視頻信號(hào)(設(shè)每幀畫(huà)面分辨率均為640×480,24真彩色,且每秒30幀),將需要的傳輸帶寬為:640×480×24×30≈0.221Gb/s從上面兩個(gè)例子可以看出,未經(jīng)壓縮的媒體數(shù)據(jù)直接存儲(chǔ)或傳輸,在目前的技術(shù)水平和實(shí)現(xiàn)成本上考慮都是不可行的。多媒體數(shù)據(jù)壓縮編碼的必要性(2)傳輸帶寬:6多媒體數(shù)據(jù)壓縮編碼的必要性所以,壓縮的目的是為了滿足存儲(chǔ)容量和傳輸帶寬的要求。適當(dāng)?shù)亩嗝襟w數(shù)據(jù)壓縮編碼可以實(shí)現(xiàn)較低的時(shí)延和高的壓縮比,為多媒體技術(shù)的實(shí)現(xiàn)提供可能。壓縮編碼要求數(shù)據(jù)量盡量低,但又要保證解碼質(zhì)量。多媒體數(shù)據(jù)壓縮編碼的必要性所以,壓縮的目的是為了滿足存儲(chǔ)容量72.1.2多媒體數(shù)據(jù)壓縮編碼的可行性壓縮的可行性(可能性)存在于:多媒體數(shù)據(jù)之間具有很強(qiáng)的相關(guān)性,即數(shù)據(jù)間具有冗余性。多媒體數(shù)據(jù)常見(jiàn)的冗余性包括:1.空間冗余性-如:圖像中常見(jiàn)一些規(guī)則形狀的物體-如:圖像中通常相鄰的一塊面積上像素值基本相同2.1.2多媒體數(shù)據(jù)壓縮編碼的可行性壓縮的可行性(可能性)8空間冗余度空間冗余度9多媒體數(shù)據(jù)壓縮編碼的可行性2.時(shí)間冗余性-如:視頻序列中相鄰兩幀畫(huà)面的內(nèi)容通常都非常接近-如:音頻序列中相鄰兩個(gè)采樣值非常接近3.其他一些冗余性:-結(jié)構(gòu)冗余性-知識(shí)冗余性-視覺(jué)冗余性-聽(tīng)覺(jué)冗余性多媒體數(shù)據(jù)壓縮編碼的可行性2.時(shí)間冗余性10時(shí)間冗余度時(shí)間冗余度11人眼的視覺(jué)特性對(duì)圖像的邊界和輪廓比對(duì)圖像內(nèi)部的內(nèi)容更敏感對(duì)圖像中的亮度分量比對(duì)色度分量更敏感對(duì)低頻分量比對(duì)高頻分量更敏感眼睛具有視覺(jué)誤差,由此才可以產(chǎn)生視頻兩只眼睛具有視角差,由此產(chǎn)生出3維圖像人眼的視覺(jué)特性對(duì)圖像的邊界和輪廓比對(duì)圖像內(nèi)部的內(nèi)容更敏感12多媒體數(shù)據(jù)壓縮編碼的可行性信源數(shù)據(jù)等于信息量和信息冗余量之和。去除這些冗余量,只保存或者傳輸有用的信息量,則可以在保證語(yǔ)音、數(shù)據(jù)和視頻質(zhì)量的前提下,實(shí)現(xiàn)數(shù)據(jù)的有效壓縮。多媒體數(shù)據(jù)壓縮編碼的可行性信源數(shù)據(jù)等于信息量和信息冗余量之和132.1.3多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的理論基礎(chǔ)為Shannon信息論。它一方面給出了數(shù)據(jù)壓縮的理論極限,另一方面又指明了數(shù)據(jù)壓縮的技術(shù)途徑。Shannon理論內(nèi)容:設(shè)信息源X的符號(hào)集為xi(i=0,1,2,…,N),xi出現(xiàn)的概率為p(xi),則信息源X的熵定義為其中,H(X)的單位為bit,-log2p(xi)表示包含在xi中的信息量。2.1.3多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的理論基礎(chǔ)為14多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)Shannon理論認(rèn)為:信源中所含有的平均信息量(熵)是進(jìn)行無(wú)失真壓縮編碼的理論極限。如果設(shè)計(jì)的編碼方法的碼字平均長(zhǎng)度最接近熵,則說(shuō)明該編碼方法是最佳的。例如:某信源則此信源的熵為:說(shuō)明該信源編碼平均長(zhǎng)度最短的情況下為7/4。多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)Shannon理論認(rèn)為:信源中所152.1.4多媒體數(shù)據(jù)壓縮編碼的基本方法從是否能無(wú)失真地恢復(fù)被壓縮編碼的信息出發(fā),可以將數(shù)據(jù)壓縮分為兩大類:1.無(wú)損壓縮(冗余度壓縮,信息保持編碼,熵編碼)被壓縮的信息能無(wú)失真地恢復(fù)回來(lái)。2.有損壓縮(信息量壓縮,失真度編碼,源編碼)被壓縮的信息在恢復(fù)回來(lái)后,與壓縮之前的信息不是完全一樣,有一定的損失。2.1.4多媒體數(shù)據(jù)壓縮編碼的基本方法從是否能無(wú)失真地恢復(fù)16多媒體數(shù)據(jù)壓縮編碼的基本方法無(wú)損壓縮特點(diǎn):僅僅將被壓縮的媒體數(shù)據(jù)看成是一串沒(méi)有任何物理意義的數(shù)據(jù),消除它們的空間和時(shí)間上的相關(guān)性。解碼后可以完全恢復(fù)出數(shù)據(jù),沒(méi)有任何損失。壓縮比率通常比較低,一般為2:1~5:1。常用于文本數(shù)據(jù)和特殊場(chǎng)合(需要保持恢復(fù)數(shù)據(jù)質(zhì)量)的圖像數(shù)據(jù)。常見(jiàn)方式:游程(Run-length)編碼,Huffman編碼,算術(shù)編碼等。多媒體數(shù)據(jù)壓縮編碼的基本方法無(wú)損壓縮特點(diǎn):17多媒體數(shù)據(jù)壓縮編碼的基本方法有損壓縮特點(diǎn):在了解被壓縮的媒體數(shù)據(jù)的物理含義,并結(jié)合人的感官特性基礎(chǔ)上,消除數(shù)據(jù)間相關(guān)性和去掉人們不敏感的頻率分量而得到的壓縮編碼。由于在編碼中去掉了一些人們不敏感的分量,會(huì)造成在解碼時(shí)可以不能完全恢復(fù)出數(shù)據(jù),因此是有損編碼。壓縮比率通常比較高。常用于重構(gòu)信號(hào)不一定要求和原始信號(hào)完全相同的場(chǎng)合。常見(jiàn)方式:預(yù)測(cè)編碼,變換編碼,子帶編碼等。多媒體數(shù)據(jù)壓縮編碼的基本方法有損壓縮特點(diǎn):182.1.5壓縮編碼算法的性能評(píng)價(jià)指標(biāo)數(shù)據(jù)壓縮編碼算法的評(píng)估指標(biāo)包括:壓縮比保真度算法復(fù)雜性時(shí)延一個(gè)好的算法還要考慮:多媒體系統(tǒng)的軟、硬件適應(yīng)能力。應(yīng)用環(huán)境技術(shù)標(biāo)準(zhǔn)……2.1.5壓縮編碼算法的性能評(píng)價(jià)指標(biāo)數(shù)據(jù)壓縮編碼算法的評(píng)估19壓縮編碼算法的性能評(píng)價(jià)指標(biāo)壓縮比:壓縮比=壓縮前數(shù)據(jù)量/壓縮后數(shù)據(jù)量理論上講,在保證壓縮后圖像質(zhì)量的前提下,壓縮比越高越好。保真性:真是一個(gè)對(duì)壓縮質(zhì)量進(jìn)行評(píng)價(jià)的參數(shù),分為主觀保真度和客觀保真度??陀^保真度用重建信號(hào)質(zhì)量與原信號(hào)之間的均方誤差來(lái)衡量:xi和xi’分別對(duì)應(yīng)原信號(hào)和重建信號(hào),N2為總信息數(shù)量。壓縮編碼算法的性能評(píng)價(jià)指標(biāo)壓縮比:xi和xi’分別對(duì)應(yīng)原信號(hào)20壓縮編碼算法的性能評(píng)價(jià)指標(biāo)保真性:客觀保真性:將均方誤差作為由數(shù)據(jù)壓縮而產(chǎn)生的噪聲能量,定義壓縮信噪比為主觀保真性:在規(guī)定的觀測(cè)條件(圖像尺寸、對(duì)比度、亮度、觀測(cè)距離等)下,對(duì)一組標(biāo)準(zhǔn)圖像壓縮前后的質(zhì)量進(jìn)行對(duì)比的主觀評(píng)定標(biāo)準(zhǔn)。具體做法是對(duì)重建信號(hào)的特性進(jìn)行按等級(jí)評(píng)分,然后根據(jù)下式計(jì)算平均分MOS:其中,k為級(jí)別數(shù),ni為該類別的人數(shù),ci為分?jǐn)?shù)。壓縮編碼算法的性能評(píng)價(jià)指標(biāo)保真性:主觀保真性:在規(guī)定的觀測(cè)條212.2預(yù)測(cè)編碼預(yù)測(cè)編碼的基本思想:分析信號(hào)的相關(guān)性,利用已處理的信號(hào)預(yù)測(cè)待處理的信號(hào),得出預(yù)測(cè)值;然后僅對(duì)真實(shí)值與預(yù)測(cè)值之間的差值進(jìn)行編碼處理和傳輸。本方法之依據(jù):媒體(如聲音,圖像等)數(shù)據(jù)的相鄰采樣值都非常接近,即具有很強(qiáng)的相關(guān)性。利用相鄰采樣值間的相關(guān)性進(jìn)行預(yù)測(cè),可以實(shí)現(xiàn)很高的編碼效率。2.2預(yù)測(cè)編碼預(yù)測(cè)編碼的基本思想:22預(yù)測(cè)編碼預(yù)測(cè)編碼是一種有損編碼。因?yàn)樗膶?shí)現(xiàn)是基于聲音或圖像數(shù)據(jù)的物理特性--當(dāng)采樣間隔很密時(shí),相鄰采樣點(diǎn)之間取值非常接近。預(yù)測(cè)編碼利用數(shù)據(jù)間存在的時(shí)間相關(guān)性(聲音數(shù)據(jù))或空間相關(guān)性(圖像數(shù)據(jù))進(jìn)行數(shù)據(jù)壓縮。預(yù)測(cè)編碼預(yù)測(cè)編碼是一種有損編碼。因?yàn)樗膶?shí)現(xiàn)是基于聲音或圖像23預(yù)測(cè)編碼舉例30fps30fps15fpssubsamplinginterpolation時(shí)域預(yù)測(cè)編碼舉例30fps30fps15fpssubsampli24預(yù)測(cè)編碼舉例+-當(dāng)前幀下一幀差分幀預(yù)測(cè)編碼舉例+-當(dāng)前幀下一幀差分幀25預(yù)測(cè)編碼舉例預(yù)測(cè)編碼舉例262.2.1脈沖編碼調(diào)制(PCM)PCM編碼是最基本的一種模數(shù)轉(zhuǎn)換方法,實(shí)現(xiàn)步驟為:采樣:時(shí)間軸上的信號(hào)離散化量化:在幅度軸上對(duì)信號(hào)離散化編碼:按一定格式記錄采樣量化后的數(shù)字?jǐn)?shù)據(jù)t0t0Tt0量化n0g[n]2.2.1脈沖編碼調(diào)制(PCM)PCM編碼是最基本的一種模27脈沖編碼調(diào)制(PCM)
量化技術(shù):分為標(biāo)量量化和矢量量化。每種量化又可分為:均勻量化、非均勻量化、自適應(yīng)量化。標(biāo)量量化:對(duì)采樣數(shù)據(jù)逐個(gè)進(jìn)行量化。矢量量化:對(duì)采樣數(shù)據(jù)進(jìn)行分組,每組K個(gè)數(shù)構(gòu)成一個(gè)K維矢量,然后以矢量為單位,逐個(gè)對(duì)矢量進(jìn)行量化。均勻量化:量化步長(zhǎng)相同的量化。非均勻量化:量化步長(zhǎng)不相同,隨不同情況而改變的量化。自適應(yīng)量化:量化步長(zhǎng)對(duì)應(yīng)特定問(wèn)題自適應(yīng)變化。脈沖編碼調(diào)制(PCM)量化技術(shù):28脈沖編碼調(diào)制(PCM)量化目標(biāo)包括:給定量化分層級(jí)數(shù),滿足量化誤差最小。限定量化誤差,確定分層級(jí)數(shù),滿足以盡量小的平均比特?cái)?shù),表示量化輸出。PCM編碼方式是最早研制,且應(yīng)用最廣泛的一種編碼方法。但其壓縮比率不是特別高,比如語(yǔ)音信號(hào)使用PCM方式壓縮出來(lái)的數(shù)據(jù)速率為64Kbit/s。脈沖編碼調(diào)制(PCM)量化目標(biāo)包括:292.2.2差分脈沖編碼調(diào)制(DPCM)DPCM是對(duì)PCM的改進(jìn),利用了相鄰樣本值非常接近的特點(diǎn),在對(duì)它們進(jìn)行編碼時(shí),可以去掉它們之間的相關(guān)性進(jìn)行有效的信息傳遞?;舅枷耄焊鶕?jù)已處理的樣本值估算待處理信號(hào)的幅度大小,即預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化再編成PCM碼傳輸,接收端再將此差值與預(yù)測(cè)值相加,重建原始信號(hào)。2.2.2差分脈沖編碼調(diào)制(DPCM)DPCM是對(duì)PCM的30差分脈沖編碼調(diào)制(DPCM)具體處理過(guò)程參見(jiàn)下圖:量化器預(yù)測(cè)器d(k)s(k)PCM樣本k++I(k)sr(k)se(k-1)se(k)-z-1差分脈沖編碼調(diào)制(DPCM)具體處理過(guò)程參見(jiàn)下圖:量化器預(yù)測(cè)31差分脈沖編碼調(diào)制(DPCM)d(k)是離散輸入信號(hào)s(k)與預(yù)測(cè)器輸出的估算值se(k)之差。I(k)是對(duì)差值d(k)進(jìn)行量化編碼以減少冗余得到的編碼值。sr(k)為重構(gòu)信號(hào),是由量化差分信號(hào)I(k)與前一個(gè)時(shí)刻的預(yù)測(cè)值se(k-1)之和,作為確定下一個(gè)信號(hào)估算值的輸入信號(hào)。se(k)為將sr(k)作為輸入得到的預(yù)測(cè)輸出。差分脈沖編碼調(diào)制(DPCM)d(k)是離散輸入信號(hào)s(k)與32差分脈沖編碼調(diào)制(DPCM)差分脈沖編碼調(diào)制的優(yōu)點(diǎn):對(duì)實(shí)際值和預(yù)測(cè)值之差進(jìn)行量化編碼,則存儲(chǔ)或者傳送的不是絕對(duì)幅度值,由于數(shù)據(jù)采樣值間相關(guān)性較強(qiáng),這些樣點(diǎn)值間的差值比實(shí)際樣本值小很多,所以降低了數(shù)據(jù)量,也就降低了對(duì)傳輸信道容量的要求。差分脈沖編碼調(diào)制(DPCM)差分脈沖編碼調(diào)制的優(yōu)點(diǎn):332.2.3自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM是在DPCM的基礎(chǔ)上發(fā)展起來(lái)的,它是利用了線性預(yù)測(cè)的高效編碼模式?;舅枷耄?.在DPCM的基礎(chǔ)上,利用自適應(yīng)的方法改變量化步長(zhǎng),對(duì)小的差值使用小的量化步長(zhǎng)進(jìn)行編碼,對(duì)大的差值使用大的量化步長(zhǎng)進(jìn)行編碼。2.采用自適應(yīng)預(yù)測(cè)技術(shù)估算待處理的輸入樣本預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值盡量小。2.2.3自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM是34自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)具體處理過(guò)程參見(jiàn)下圖:差分量化器量化階調(diào)整逆量化器預(yù)測(cè)器預(yù)測(cè)PCM樣本PCM樣本+++-ADPCM差值自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)具體處理過(guò)程參見(jiàn)下圖:差35自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM的設(shè)計(jì)思路:1、盡可能從語(yǔ)音信號(hào)中消除冗余。2、對(duì)消除冗余后的信號(hào),以明顯而離散的方式,從自適應(yīng)角度進(jìn)行最佳編碼。質(zhì)量:在保證質(zhì)量情況下,可以將64Kbit/s的數(shù)據(jù)壓縮到32Kbit/s或16Kbit/s,甚至8Kbit/s、2.4Kbit/s、0.8Kbit/s。適用場(chǎng)合:用于資源受限的通信系統(tǒng),如蜂窩無(wú)線通信系統(tǒng)。自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM的設(shè)計(jì)思路:362.3變換編碼概述變換編碼的基本思想:利用各種變換手段,將信號(hào)從一個(gè)域變換到其正交空間中去,用變換系數(shù)來(lái)表示原始媒體數(shù)據(jù),并對(duì)變換系數(shù)進(jìn)行編碼,往往這個(gè)時(shí)候,變換系數(shù)都具有很容易壓縮的特性。本方法之依據(jù):很多媒體信號(hào)在某個(gè)域(如時(shí)間域或空間域)特性并不明顯,而變換到變換域(如頻域)去則可以得到很好的壓縮處理效果。2.3變換編碼概述變換編碼的基本思想:37變換編碼概述變換編碼要可用,必須要求其反變換存在。變換編碼示意圖:某個(gè)域的數(shù)據(jù)另外一個(gè)域的數(shù)據(jù)編碼/解碼嚴(yán)格來(lái)說(shuō),當(dāng)反變換存在時(shí),變換編碼是一種無(wú)損編碼。但是在實(shí)現(xiàn)時(shí),基于數(shù)字系統(tǒng)的精度有限,無(wú)法無(wú)失真地表示每個(gè)變換系數(shù),所以它其實(shí)是有損的。變換編碼概述變換編碼要可用,必須要求其反變換存在。某個(gè)域的數(shù)38變換編碼概述變換域編碼的優(yōu)點(diǎn):(1)在變換域里視頻圖像要比空間域里簡(jiǎn)單。(2)視頻圖像的相關(guān)性明顯下降,信號(hào)的能量主要集中在少數(shù)幾個(gè)變換系數(shù)上,采用量化和熵編碼可有效地壓縮其數(shù)據(jù)。(3)具有較強(qiáng)的抗干擾能力,傳輸過(guò)程中的誤碼對(duì)圖像質(zhì)量的影響遠(yuǎn)小于預(yù)測(cè)編碼。變換編碼概述變換域編碼的優(yōu)點(diǎn):392.3.1正交變換假設(shè)一個(gè)離散信號(hào)由N個(gè)采樣值組成,即一個(gè)N維向量,而每個(gè)采樣值代表N維信號(hào)空間中數(shù)據(jù)向量X的一個(gè)分量。正交變換就是為了尋找一個(gè)變換矩陣T,使得可以利用M維矩陣Y來(lái)近似表示X:Y=TX利用子集Y來(lái)恢復(fù)X時(shí),不會(huì)引起明顯的誤差。再對(duì)Y中的M個(gè)分量進(jìn)行壓縮,即可達(dá)到壓縮的目的。2.3.1正交變換假設(shè)一個(gè)離散信號(hào)由N個(gè)采樣值組成,即一個(gè)402.3.2離散傅立葉變換(DFT)和離散余弦變換(DCT)DFT實(shí)現(xiàn)將媒體數(shù)據(jù)從離散時(shí)域變換到離散頻域,以方便信號(hào)的頻域分析。DFT變換通過(guò)下面公式得到:其中,WNk為旋轉(zhuǎn)因子,WNk=e-j2π/N.2.3.2離散傅立葉變換(DFT)和離散余弦變換(DCT)41離散傅立葉變換(DFT)離散傅立葉變換將時(shí)域離散周期的序列映射成頻域離散周期的序列,如右圖所示。離散傅立葉變換(DFT)離散傅立葉變換將時(shí)域離散周期的序列映42離散余弦變換(DCT)離散余弦變換是DFT的一種特殊形式,當(dāng)基函數(shù)為離散余弦函數(shù)時(shí),DFT就成為了DCT。離散余弦變換主要用于圖像壓縮編碼,基本方法是先將整體圖像分成N×N像素塊,然后對(duì)N×N像素塊逐一進(jìn)行DCT變換。變換后得到像素塊的頻率系數(shù)矩陣,其中對(duì)應(yīng)的高頻成分系數(shù)通常為零,而低頻成分系數(shù)有較小的值。離散余弦變換(DCT)離散余弦變換是DFT的一種特殊形式,當(dāng)43離散余弦變換(DCT)離散余弦變換分一維DCT和二維DCT:(1)一維DCT為:C(u)為變換系數(shù)f(x)為長(zhǎng)度為N的序列,F(xiàn)(u)也為長(zhǎng)度為N的序列。離散余弦變換(DCT)離散余弦變換分一維DCT和二維DCT:44離散余弦變換(DCT)(2)二維DCT為:為變換函數(shù)。離散余弦變換(DCT)(2)二維DCT為:為變換函數(shù)。452.3.3子帶編碼子帶編碼的基本思想是把一個(gè)聲音或圖像的傅里葉頻譜分解(析)成若干個(gè)互不重疊的子頻帶,所有子帶的帶寬和仍為原信號(hào)的總頻帶。子帶編碼是一種以信號(hào)頻譜為依據(jù)的波形編碼方法,它首先用一組帶通濾波器將輸入信號(hào)按頻譜分開(kāi),然后讓每路子信號(hào)通過(guò)各自的自適應(yīng)PCM編碼器(ADPCM)編碼,經(jīng)過(guò)分接和解碼再?gòu)?fù)合成原始信號(hào)。2.3.3子帶編碼子帶編碼的基本思想是把一個(gè)聲音或圖像的傅46子帶編碼子帶編碼原理參見(jiàn)下圖:BPF1BPF2BPFx編碼器編碼器編碼器……復(fù)合器分解器譯碼器BPF1譯碼器譯碼器BPF2BPFN……x[n]x’[n]子帶編碼子帶編碼原理參見(jiàn)下圖:BPF1BPF2BPFx編碼器47子帶編碼子帶編碼的種類:(1)等帶寬子帶編碼:各子帶的帶寬ΔW是相同的。(2)變帶寬子帶編碼:各子帶的帶寬不相同。子帶編碼的優(yōu)點(diǎn):(1)每個(gè)子帶獨(dú)立自適應(yīng),可按每個(gè)子帶的能量調(diào)節(jié)量化階;(2)可根據(jù)各個(gè)子帶對(duì)感覺(jué)的作用大小共同設(shè)計(jì)最佳的比特?cái)?shù);(3)量化噪聲都限制在子帶內(nèi),某一頻帶的量化噪聲不會(huì)串到另一頻帶中去。
子帶編碼子帶編碼的種類:482.4統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼的基本思想:對(duì)于無(wú)記憶的信源,根據(jù)碼字出現(xiàn)的概率分布特性尋找概率與碼字長(zhǎng)度間的最優(yōu)化匹配,據(jù)此對(duì)信息進(jìn)行壓縮。本方法之依據(jù):根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼,其目的在于在消息和碼字之間找到明確的一一對(duì)應(yīng)關(guān)系,以便在恢復(fù)時(shí)能夠準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái),或者至少是極相似的找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系。2.4統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼的基本思想:49統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼是一種無(wú)損編碼,常用于圖像、文檔等要求無(wú)損失的壓縮中。實(shí)現(xiàn)原理:有些媒體(如圖像,文檔)數(shù)據(jù)中各樣點(diǎn)值的出現(xiàn)概率在編碼前可以統(tǒng)計(jì)出,結(jié)合其出現(xiàn)概率進(jìn)行的編碼可以充分降低數(shù)據(jù)量,同時(shí)又保證了媒體的質(zhì)量。由于在編碼過(guò)程中僅僅將這些媒體數(shù)據(jù)看成是一串?dāng)?shù)據(jù),沒(méi)有深入到其物理意義中去研究,所以壓縮比率并不高。統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼是一種無(wú)損編碼,常用于圖像、文檔等要求無(wú)損失502.4.1霍夫曼編碼基本思想:對(duì)于出現(xiàn)概率較大的符號(hào)取較短的碼長(zhǎng),而對(duì)概率較小的符號(hào)則取較長(zhǎng)的碼長(zhǎng)?;舴蚵幋a(HuffmanEncoding)又稱變長(zhǎng)度編碼,或最優(yōu)編碼,即遵照霍夫曼編碼原則的結(jié)果一定是平均碼長(zhǎng)最短?;舴蚵幋a的特點(diǎn):只適用于有限個(gè)離散信源;且實(shí)現(xiàn)起來(lái)相當(dāng)復(fù)雜。2.4.1霍夫曼編碼基本思想:51霍夫曼編碼編碼方法:按照一定的順序構(gòu)建二叉樹(shù)。舉例說(shuō)明:假設(shè)給定一個(gè)4×4的像素塊如右圖所示:1535421622512263第一步:將信源中各符號(hào)的概率計(jì)算出并按從大到小排序。SourceB=2A=1E=5C=3F=6D=4Probability5/163/163/162/162/161/16試計(jì)算其中各像素的霍夫曼編碼。編碼過(guò)程如下:霍夫曼編碼編碼方法:按照一定的順序構(gòu)建二叉樹(shù)。153542152霍夫曼編碼第二步:基于上面的概率分布表構(gòu)建二叉樹(shù)1.將兩個(gè)出現(xiàn)概率最小的消息合并成一個(gè)消息,然后重新按信源符號(hào)出現(xiàn)的概率從大到小排列。2.重復(fù)上面步驟1,直到得到的合并消息概率為1。3.將被合并的兩個(gè)消息分支分別賦值“0”和“1”,就得到二叉樹(shù)。B(5/16)A(3/16)E(3/16)C(2/16)F(2/16)D(1/16)3/165/166/1610/1616/161111100000霍夫曼編碼第二步:基于上面的概率分布表構(gòu)建二叉樹(shù)B(5/1653霍夫曼編碼第三步:根據(jù)構(gòu)建的二叉樹(shù),由樹(shù)根到每個(gè)樹(shù)葉的所有比特就構(gòu)成對(duì)應(yīng)信源符號(hào)的編碼。sourceABCDEFcode00101101111011110Code-length223424averagelength2.5bits/pixelCompressionratio2.5/3≈0.833霍夫曼編碼第三步:根據(jù)構(gòu)建的二叉樹(shù),由樹(shù)根到每個(gè)樹(shù)葉的所有比54霍夫曼編碼霍夫曼編碼中幾個(gè)值得注意的問(wèn)題:1.由于一個(gè)節(jié)點(diǎn)的上下兩個(gè)分支即可以賦值“0”,也可以賦值“1”,因此同一信源對(duì)應(yīng)的霍夫曼編碼并不唯一,但平均碼長(zhǎng)是相同的。2.霍夫曼編碼為唯一可譯碼,即碼的任意一串有限長(zhǎng)的碼符號(hào)序列只能被唯一譯成所對(duì)應(yīng)的信源符號(hào)。3.霍夫曼編碼不具有檢錯(cuò)和糾錯(cuò)的能力,如果碼串中有錯(cuò)誤,都會(huì)導(dǎo)致該碼譯錯(cuò),甚至產(chǎn)生誤碼擴(kuò)散?;舴蚵幋a霍夫曼編碼中幾個(gè)值得注意的問(wèn)題:55霍夫曼編碼4.霍夫曼是可變長(zhǎng)度碼,必須在存儲(chǔ)代碼前先進(jìn)行譯碼。5.霍夫曼對(duì)不同的信源,其編碼效率是不同的。當(dāng)信源概率分布很不均勻時(shí),霍夫曼碼會(huì)具有顯著效果。6.如果信源的實(shí)際概率模型與構(gòu)碼時(shí)所假設(shè)的概率模型有差異,實(shí)際的平均碼字將大于預(yù)期值,編碼效率將下降。這種情況下,唯一的解決辦法就是更換碼表,使之與實(shí)際概率模型匹配?;舴蚵幋a4.霍夫曼是可變長(zhǎng)度碼,必須在存儲(chǔ)代碼前先進(jìn)行譯碼562.4.2游程編碼基本思想:將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符或像素值用該符號(hào)加出現(xiàn)次數(shù)來(lái)表示。游程編碼又稱為行程編碼(Run-lengthEncoding),也是一種常用于文檔和圖像中的編碼方式。RLE編碼簡(jiǎn)單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如BMP、TIFF及AVI等格式文件的壓縮均采用此方法。2.4.2游程編碼基本思想:57游程編碼編碼方法:基本的游程編碼就是在數(shù)據(jù)流中直接用三個(gè)字符來(lái)表示,其數(shù)據(jù)結(jié)構(gòu)如圖所示:CcXSc數(shù)據(jù)量其中,Sc表示一個(gè)字符串在此位置,X代表構(gòu)成串的字符,Cc代表串的長(zhǎng)度。例:字符串AAABCDDDDDDDDBBBBB,游程編碼結(jié)果為3ABC8D5B.游程編碼編碼方法:CcXSc數(shù)據(jù)量其中,Sc表示一個(gè)字符串在58游程編碼優(yōu)點(diǎn):1、編碼方式簡(jiǎn)單,直觀。2、譯碼和編碼采用相同的規(guī)則進(jìn)行,得到與壓縮完全相同的數(shù)據(jù),從而可以實(shí)現(xiàn)無(wú)損壓縮。缺點(diǎn):1、在特定情況下,如單一顏色背景下的圖形圖像壓縮中可以取得較高的壓縮比;而對(duì)于復(fù)雜顏色的圖形圖像,則壓縮比較低。2、由于其在壓縮實(shí)現(xiàn)過(guò)程中未考慮被壓縮數(shù)據(jù)的物理含義,所以獲得的壓縮比也較低。游程編碼優(yōu)點(diǎn):59游程編碼游程編碼分類:(1)一維游程編碼:常用于文檔,聲音和圖像的無(wú)損編碼中。例如圖像中一維游程編碼是對(duì)圖像進(jìn)行逐行掃描,旨在消除每行像素(或水平分解元素)的相關(guān)性而沒(méi)有考慮行間像素(或垂直分解元素)的相關(guān)性。(2)二維游程編碼:常用于圖像編碼中,需要考慮每行像素和行間像素兩個(gè)方向的像素相關(guān)性。游程編碼游程編碼分類:602.4.3算術(shù)編碼基本思想:類似于Huffman編碼,對(duì)概率較大的符號(hào)采用短碼,對(duì)概率較小的符號(hào)采用長(zhǎng)碼,但Huffman編碼只能使用整數(shù)比特,而它可以利用分?jǐn)?shù)比特逼近于信源?;驹恚?、根據(jù)信源中出現(xiàn)不同符號(hào)序列的概率不同,把[0,1)區(qū)間劃分為互不重疊、寬度恰好是各符號(hào)序列的概率的子區(qū)間。2、信源中的各符號(hào)序列將可用各子區(qū)間中的任意一個(gè)實(shí)數(shù)表示,這個(gè)數(shù)就是該符號(hào)所對(duì)應(yīng)的碼。2.4.3算術(shù)編碼基本思想:61算術(shù)編碼算術(shù)編碼步驟:1、建立信源概率表。2、掃描信源發(fā)出的符號(hào)序列,對(duì)其進(jìn)行編碼。分類:1、靜態(tài)算術(shù)編碼:信源符號(hào)概率是固定的算術(shù)編碼。2、自適應(yīng)算術(shù)編碼:信源符號(hào)概率是動(dòng)態(tài)變化的算術(shù)編碼。算術(shù)編碼算術(shù)編碼步驟:62算術(shù)編碼舉例說(shuō)明靜態(tài)算術(shù)編碼:假設(shè)信源符號(hào)為{00,01,10,11},這些符號(hào)概率分別為{0.1,0.4,0.2,0.3}。根據(jù)這些概率,可把間隔[0,1)分成4個(gè)子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)。如果二進(jìn)制消息序列的輸入為:10001100101101編碼過(guò)程:第一個(gè)符號(hào)為10,它的編碼范圍對(duì)應(yīng)[0.5,0.7)而第二個(gè)符號(hào)00對(duì)應(yīng)的編碼范圍是[0,0.1)。因此,它的間隔就取[0.5,0.7)的第一個(gè)1/10作為新間隔[0.5,0.52)依此類推……算術(shù)編碼舉例說(shuō)明靜態(tài)算術(shù)編碼:63算術(shù)編碼自適應(yīng)算術(shù)編碼:首先假定各符號(hào)概率的初始值相同,然后其概率根據(jù)出現(xiàn)的情況做相應(yīng)的改變。自適應(yīng)模式可以不預(yù)先定義概率模型,但要求編碼器和譯碼器使用相同的概率模型。自適應(yīng)算術(shù)編碼的編碼效率很高,當(dāng)信源符號(hào)概率比較接近時(shí),可優(yōu)于Huffman編碼。具體編碼過(guò)程略。算術(shù)編碼自適應(yīng)算術(shù)編碼:642.5其他編碼隨著信號(hào)處理技術(shù)的發(fā)展,很多新的編碼技術(shù)出現(xiàn)并發(fā)展。常見(jiàn)的新編碼技術(shù)有:基于模型的編碼神經(jīng)網(wǎng)絡(luò)編碼小波編碼分形編碼混合編碼等
2.5其他編碼隨著信號(hào)處理技術(shù)的發(fā)展,很多新的編碼技術(shù)出現(xiàn)652.5.1基于模型的編碼基本思想:采用分析和合成的方法,先對(duì)數(shù)據(jù)的結(jié)構(gòu)和特征進(jìn)行分析,提取圖像的特征,并用某種模型進(jìn)行描述,得到模型的參數(shù)。編碼之后的數(shù)據(jù)僅包含媒體對(duì)象的特征參數(shù),因此,可以通過(guò)對(duì)這種編碼方式大大減少數(shù)據(jù)量。解碼時(shí),根據(jù)模型的參數(shù)和模型的先驗(yàn)知識(shí)重構(gòu)出圖像。2.5.1基于模型的編碼基本思想:采用分析和合成的方法,先66基于模型的編碼基于模型的編碼原理如下圖:運(yùn)動(dòng)估計(jì)表示分析模型調(diào)整圖像合成圖像生成(背景等)存儲(chǔ)傳輸輸出視頻輸入視頻源模型源模型基于模型的編碼基于模型的編碼原理如下圖:運(yùn)動(dòng)估計(jì)表示分析模型672.5.2神經(jīng)網(wǎng)絡(luò)編碼基本思想:利用人類神經(jīng)系統(tǒng)的工作原理來(lái)模擬非線性變換以及難以用模型描述的變換編碼。編碼方法:利用神經(jīng)網(wǎng)絡(luò)處理技術(shù)來(lái)實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)編碼的特點(diǎn):1.優(yōu)點(diǎn):采用并行分布處理;具有固有的非線性特性;具有強(qiáng)的適應(yīng)性和信息的融合能力。2.缺點(diǎn):訓(xùn)練時(shí)間過(guò)長(zhǎng),局部極小等問(wèn)題。2.5.2神經(jīng)網(wǎng)絡(luò)編碼基本思想:68神經(jīng)網(wǎng)絡(luò)編碼人工神經(jīng)網(wǎng)絡(luò)(ANN)的基本原理:受生物大腦的啟發(fā),試圖模仿人腦神經(jīng)系統(tǒng)的組成方式與思維過(guò)程而構(gòu)成的信息處理系統(tǒng),具有非線性、自學(xué)習(xí)性、容錯(cuò)性、聯(lián)想記憶和可以訓(xùn)練性等特點(diǎn)。ANN模型的處理能力主要由網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和網(wǎng)絡(luò)節(jié)點(diǎn)的功能所決定。理論上已證明,只要具有一個(gè)隱層的ANN網(wǎng)絡(luò)即可實(shí)現(xiàn)對(duì)任意實(shí)值的逼近,實(shí)現(xiàn)任何非線性映射。神經(jīng)網(wǎng)絡(luò)編碼人工神經(jīng)網(wǎng)絡(luò)(ANN)的基本原理:692.5.3小波編碼基本概念:它是傅立葉變換的發(fā)展,有效的解決了許多傅立葉變換無(wú)法解決的問(wèn)題,如精確分析突變信號(hào)和非平穩(wěn)信號(hào)等。其最常用于圖像編碼中?;舅枷耄簩⒃瓐D像分解成不同的頻率區(qū)域,用持續(xù)的壓縮編碼方法根據(jù)人的視覺(jué)、圖像的統(tǒng)計(jì)、細(xì)節(jié)和結(jié)構(gòu)等特征,對(duì)不同的頻率區(qū)域采用不同的壓縮編碼手段,從而減少數(shù)據(jù)量。2.5.3小波編碼基本概念:70小波編碼特點(diǎn):是多分辨率分析、時(shí)-頻分析和子帶編碼的一種統(tǒng)一方法。利用小波變換壓縮圖像,特別適合人眼的視覺(jué)特性,同時(shí)利于圖像的分層傳輸。優(yōu)點(diǎn):運(yùn)算速度快實(shí)現(xiàn)方便壓縮質(zhì)量好小波編碼特點(diǎn):71小波編碼具體步驟:首先進(jìn)行圖像小波分解,將一幅圖像經(jīng)過(guò)小波變換分解為一系列尺度(頻率)、方向、空間局部變化的子帶。然后在不同頻率分辨率層上采用不同的碼字長(zhǎng)度進(jìn)行編碼。編碼中根據(jù)不同分辨率要求,壓縮不必要的小波系數(shù),從而達(dá)到壓縮編碼的目的。注意:根據(jù)不同的信源情況,還可以選擇不同的小波變換,進(jìn)行自適應(yīng)小波分解。小波編碼具體步驟:722.5.4分形編碼基本思想:利用分形來(lái)描述幾何形狀,其中的不規(guī)則細(xì)節(jié)可以不同的尺度和角度重復(fù)出現(xiàn),這些尺度和角度可以用分形變換加以描述?;驹恚悍中味x為“一種由許多個(gè)與整體有某種相似性的局部所構(gòu)成的形體”。分形概念的提出及分形幾何學(xué)的創(chuàng)立為描述客觀世界提供了更準(zhǔn)確的數(shù)學(xué)模型。2.5.4分形編碼基本思想:73分形編碼基本原理:圖形學(xué)是幾何學(xué)的延伸與發(fā)展,分形模型研究成果的積累形成了新的圖像學(xué)分支——分形圖像學(xué)。而基于分形的圖像編碼方法實(shí)質(zhì)是對(duì)圖像中一個(gè)或多個(gè)相對(duì)大的部分施行壓縮變換來(lái)逼近圖像的每一部分。1990年,A.Jacquin提出了全自動(dòng)的可行的分形壓縮編碼方法,由于其可以獲得極高的壓縮比而得到廣泛關(guān)注。分形編碼基本原理:74分形編碼編碼壓縮過(guò)程:1、把原始圖像分成互不重疊的定義域塊(Range塊),這些塊能將原始圖像全部覆蓋,每一個(gè)Range塊大小均為B×B;每一Domain塊的大小均為D×D,且通常D=2B。2、為使壓縮后重構(gòu)圖像的質(zhì)量更好,相鄰的Domain塊之間在水平及垂直方向均有重疊,水平及垂直方向上位移量為B。依次對(duì)每一個(gè)Domain塊中相鄰的4個(gè)灰度值求平均,于是每一個(gè)大小為D×D(2B×2B)的Domain塊就變成了大小為B×B的Sub_Domain塊。分形編碼編碼壓縮過(guò)程:75分形編碼編碼壓縮過(guò)程:3、利用最小二乘法,并配合八種對(duì)稱變換算子,將收縮后的Domain塊(Sub_Domain塊)與Range塊進(jìn)行匹配運(yùn)算。4、若計(jì)算出的MSE小于給定誤差,則認(rèn)為匹配成功,否則繼續(xù)匹配,在找到最佳值域塊及仿射變換后,需要存儲(chǔ)其參數(shù)以便傳輸。5、這些參數(shù)包括:匹配成功的Domain塊塊號(hào)、Jacquin變換算子的編號(hào)以及比例因子S、偏移量O。分形編碼編碼壓縮過(guò)程:762.5.5混合編碼混合編碼是采用兩種或多種編碼方法進(jìn)行的壓縮編碼。常見(jiàn)混合編碼:1.變換編碼與DPCM編碼結(jié)合2.分形編碼與小波變換結(jié)合3.分形編碼與DCT變換結(jié)合4.分形編碼與向量量化結(jié)合5.變換編碼、量化編碼及游程編碼結(jié)合…2.5.5混合編碼混合編碼是采用兩種或多種編碼方法進(jìn)行的壓77混合編碼混合編碼常常是一些多媒體編碼標(biāo)準(zhǔn)使用的編碼方式,如:(1)JPEG:變換域編碼+量化編碼+游程編碼+Huffman編碼(2)MPEG:變換域編碼+量化編碼+游程編碼+Huffman編碼+預(yù)測(cè)編碼…(3)H.261:同MPEG混合編碼的有關(guān)研究工作在很多方面還存在不完善之處,需要進(jìn)一步探討和研究。混合編碼混合編碼常常是一些多媒體編碼標(biāo)準(zhǔn)使用的編碼方式,如:78本章小節(jié)多媒體數(shù)據(jù)壓縮的必要性多媒體數(shù)據(jù)壓縮的可能性多媒體數(shù)據(jù)壓縮的理論依據(jù)多媒體數(shù)據(jù)壓縮的具體技術(shù)1、無(wú)損壓縮2、有損壓縮3、混合編碼本章小節(jié)多媒體數(shù)據(jù)壓縮的必要性79課后練習(xí)試討論多媒體數(shù)據(jù)壓縮的可能性存在于什么地方?試列表歸納常見(jiàn)的有損編碼、無(wú)損編碼及混合編碼方式。請(qǐng)論述預(yù)測(cè)編碼的基本原理,以及相關(guān)改進(jìn)途徑?,F(xiàn)有8個(gè)待編碼的符號(hào)A0~A7,其概率分別為0.3,0.1,0.25,0.15,0.05,0.1,0.03,0.02,使用Huffman編碼算法求出這8個(gè)符號(hào)所分配的代碼。請(qǐng)分析并比較算術(shù)編碼與Huffman編碼。以小波編碼和分形編碼混合為例,說(shuō)明混合編碼。課后練習(xí)試討論多媒體數(shù)據(jù)壓縮的可能性存在于什么地方?80多媒體通信原理第2章數(shù)據(jù)壓縮編碼基本理論多媒體通信原理第2章數(shù)據(jù)壓縮編碼基本理論81本章主要內(nèi)容多媒體數(shù)據(jù)壓縮編碼基本原理多媒體數(shù)據(jù)壓縮編碼的必要性多媒體數(shù)據(jù)壓縮編碼的可行性壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的基本方法壓縮編碼算法的性能評(píng)價(jià)指標(biāo)幾種常見(jiàn)編碼預(yù)測(cè)編碼;變換編碼;統(tǒng)計(jì)編碼其他編碼…本章主要內(nèi)容多媒體數(shù)據(jù)壓縮編碼基本原理82多媒體壓縮技術(shù)概述?WhyWhatHowNecessitiesProbabilitiesTechniques&Standards多媒體壓縮技術(shù)概述?WhyWhatHowNecessitie832.1多媒體數(shù)據(jù)壓縮編碼基本原理多媒體數(shù)據(jù)壓縮編碼的必要性為什么要壓縮,不壓縮不行嗎?多媒體數(shù)據(jù)壓縮編碼的可行性為什么可以壓縮了,從哪些方面入手壓縮?壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的基本方法壓縮編碼算法的性能評(píng)價(jià)指標(biāo)2.1多媒體數(shù)據(jù)壓縮編碼基本原理多媒體數(shù)據(jù)壓縮編碼的必要性842.1.1多媒體數(shù)據(jù)壓縮編碼的必要性多媒體處理中涉及使用到各種媒體,會(huì)帶來(lái)巨大的數(shù)據(jù)量。從存儲(chǔ)和傳輸兩個(gè)方面考慮,這樣巨大的數(shù)據(jù)量都會(huì)帶來(lái)實(shí)現(xiàn)上的困難。舉例說(shuō)明:(1)存儲(chǔ)量:一幅圖像,空間分辨率為640×480,顏色編碼方式為真彩色,存儲(chǔ)這樣一幅未經(jīng)壓縮的圖像需要的存儲(chǔ)量為:640×480×24/8=921,600B2.1.1多媒體數(shù)據(jù)壓縮編碼的必要性多媒體處理中涉及使用到85多媒體數(shù)據(jù)壓縮編碼的必要性(2)傳輸帶寬:由網(wǎng)絡(luò)傳輸未經(jīng)壓縮的視頻信號(hào)(設(shè)每幀畫(huà)面分辨率均為640×480,24真彩色,且每秒30幀),將需要的傳輸帶寬為:640×480×24×30≈0.221Gb/s從上面兩個(gè)例子可以看出,未經(jīng)壓縮的媒體數(shù)據(jù)直接存儲(chǔ)或傳輸,在目前的技術(shù)水平和實(shí)現(xiàn)成本上考慮都是不可行的。多媒體數(shù)據(jù)壓縮編碼的必要性(2)傳輸帶寬:86多媒體數(shù)據(jù)壓縮編碼的必要性所以,壓縮的目的是為了滿足存儲(chǔ)容量和傳輸帶寬的要求。適當(dāng)?shù)亩嗝襟w數(shù)據(jù)壓縮編碼可以實(shí)現(xiàn)較低的時(shí)延和高的壓縮比,為多媒體技術(shù)的實(shí)現(xiàn)提供可能。壓縮編碼要求數(shù)據(jù)量盡量低,但又要保證解碼質(zhì)量。多媒體數(shù)據(jù)壓縮編碼的必要性所以,壓縮的目的是為了滿足存儲(chǔ)容量872.1.2多媒體數(shù)據(jù)壓縮編碼的可行性壓縮的可行性(可能性)存在于:多媒體數(shù)據(jù)之間具有很強(qiáng)的相關(guān)性,即數(shù)據(jù)間具有冗余性。多媒體數(shù)據(jù)常見(jiàn)的冗余性包括:1.空間冗余性-如:圖像中常見(jiàn)一些規(guī)則形狀的物體-如:圖像中通常相鄰的一塊面積上像素值基本相同2.1.2多媒體數(shù)據(jù)壓縮編碼的可行性壓縮的可行性(可能性)88空間冗余度空間冗余度89多媒體數(shù)據(jù)壓縮編碼的可行性2.時(shí)間冗余性-如:視頻序列中相鄰兩幀畫(huà)面的內(nèi)容通常都非常接近-如:音頻序列中相鄰兩個(gè)采樣值非常接近3.其他一些冗余性:-結(jié)構(gòu)冗余性-知識(shí)冗余性-視覺(jué)冗余性-聽(tīng)覺(jué)冗余性多媒體數(shù)據(jù)壓縮編碼的可行性2.時(shí)間冗余性90時(shí)間冗余度時(shí)間冗余度91人眼的視覺(jué)特性對(duì)圖像的邊界和輪廓比對(duì)圖像內(nèi)部的內(nèi)容更敏感對(duì)圖像中的亮度分量比對(duì)色度分量更敏感對(duì)低頻分量比對(duì)高頻分量更敏感眼睛具有視覺(jué)誤差,由此才可以產(chǎn)生視頻兩只眼睛具有視角差,由此產(chǎn)生出3維圖像人眼的視覺(jué)特性對(duì)圖像的邊界和輪廓比對(duì)圖像內(nèi)部的內(nèi)容更敏感92多媒體數(shù)據(jù)壓縮編碼的可行性信源數(shù)據(jù)等于信息量和信息冗余量之和。去除這些冗余量,只保存或者傳輸有用的信息量,則可以在保證語(yǔ)音、數(shù)據(jù)和視頻質(zhì)量的前提下,實(shí)現(xiàn)數(shù)據(jù)的有效壓縮。多媒體數(shù)據(jù)壓縮編碼的可行性信源數(shù)據(jù)等于信息量和信息冗余量之和932.1.3多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的理論基礎(chǔ)為Shannon信息論。它一方面給出了數(shù)據(jù)壓縮的理論極限,另一方面又指明了數(shù)據(jù)壓縮的技術(shù)途徑。Shannon理論內(nèi)容:設(shè)信息源X的符號(hào)集為xi(i=0,1,2,…,N),xi出現(xiàn)的概率為p(xi),則信息源X的熵定義為其中,H(X)的單位為bit,-log2p(xi)表示包含在xi中的信息量。2.1.3多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)數(shù)據(jù)壓縮的理論基礎(chǔ)為94多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)Shannon理論認(rèn)為:信源中所含有的平均信息量(熵)是進(jìn)行無(wú)失真壓縮編碼的理論極限。如果設(shè)計(jì)的編碼方法的碼字平均長(zhǎng)度最接近熵,則說(shuō)明該編碼方法是最佳的。例如:某信源則此信源的熵為:說(shuō)明該信源編碼平均長(zhǎng)度最短的情況下為7/4。多媒體數(shù)據(jù)壓縮編碼的理論基礎(chǔ)Shannon理論認(rèn)為:信源中所952.1.4多媒體數(shù)據(jù)壓縮編碼的基本方法從是否能無(wú)失真地恢復(fù)被壓縮編碼的信息出發(fā),可以將數(shù)據(jù)壓縮分為兩大類:1.無(wú)損壓縮(冗余度壓縮,信息保持編碼,熵編碼)被壓縮的信息能無(wú)失真地恢復(fù)回來(lái)。2.有損壓縮(信息量壓縮,失真度編碼,源編碼)被壓縮的信息在恢復(fù)回來(lái)后,與壓縮之前的信息不是完全一樣,有一定的損失。2.1.4多媒體數(shù)據(jù)壓縮編碼的基本方法從是否能無(wú)失真地恢復(fù)96多媒體數(shù)據(jù)壓縮編碼的基本方法無(wú)損壓縮特點(diǎn):僅僅將被壓縮的媒體數(shù)據(jù)看成是一串沒(méi)有任何物理意義的數(shù)據(jù),消除它們的空間和時(shí)間上的相關(guān)性。解碼后可以完全恢復(fù)出數(shù)據(jù),沒(méi)有任何損失。壓縮比率通常比較低,一般為2:1~5:1。常用于文本數(shù)據(jù)和特殊場(chǎng)合(需要保持恢復(fù)數(shù)據(jù)質(zhì)量)的圖像數(shù)據(jù)。常見(jiàn)方式:游程(Run-length)編碼,Huffman編碼,算術(shù)編碼等。多媒體數(shù)據(jù)壓縮編碼的基本方法無(wú)損壓縮特點(diǎn):97多媒體數(shù)據(jù)壓縮編碼的基本方法有損壓縮特點(diǎn):在了解被壓縮的媒體數(shù)據(jù)的物理含義,并結(jié)合人的感官特性基礎(chǔ)上,消除數(shù)據(jù)間相關(guān)性和去掉人們不敏感的頻率分量而得到的壓縮編碼。由于在編碼中去掉了一些人們不敏感的分量,會(huì)造成在解碼時(shí)可以不能完全恢復(fù)出數(shù)據(jù),因此是有損編碼。壓縮比率通常比較高。常用于重構(gòu)信號(hào)不一定要求和原始信號(hào)完全相同的場(chǎng)合。常見(jiàn)方式:預(yù)測(cè)編碼,變換編碼,子帶編碼等。多媒體數(shù)據(jù)壓縮編碼的基本方法有損壓縮特點(diǎn):982.1.5壓縮編碼算法的性能評(píng)價(jià)指標(biāo)數(shù)據(jù)壓縮編碼算法的評(píng)估指標(biāo)包括:壓縮比保真度算法復(fù)雜性時(shí)延一個(gè)好的算法還要考慮:多媒體系統(tǒng)的軟、硬件適應(yīng)能力。應(yīng)用環(huán)境技術(shù)標(biāo)準(zhǔn)……2.1.5壓縮編碼算法的性能評(píng)價(jià)指標(biāo)數(shù)據(jù)壓縮編碼算法的評(píng)估99壓縮編碼算法的性能評(píng)價(jià)指標(biāo)壓縮比:壓縮比=壓縮前數(shù)據(jù)量/壓縮后數(shù)據(jù)量理論上講,在保證壓縮后圖像質(zhì)量的前提下,壓縮比越高越好。保真性:真是一個(gè)對(duì)壓縮質(zhì)量進(jìn)行評(píng)價(jià)的參數(shù),分為主觀保真度和客觀保真度??陀^保真度用重建信號(hào)質(zhì)量與原信號(hào)之間的均方誤差來(lái)衡量:xi和xi’分別對(duì)應(yīng)原信號(hào)和重建信號(hào),N2為總信息數(shù)量。壓縮編碼算法的性能評(píng)價(jià)指標(biāo)壓縮比:xi和xi’分別對(duì)應(yīng)原信號(hào)100壓縮編碼算法的性能評(píng)價(jià)指標(biāo)保真性:客觀保真性:將均方誤差作為由數(shù)據(jù)壓縮而產(chǎn)生的噪聲能量,定義壓縮信噪比為主觀保真性:在規(guī)定的觀測(cè)條件(圖像尺寸、對(duì)比度、亮度、觀測(cè)距離等)下,對(duì)一組標(biāo)準(zhǔn)圖像壓縮前后的質(zhì)量進(jìn)行對(duì)比的主觀評(píng)定標(biāo)準(zhǔn)。具體做法是對(duì)重建信號(hào)的特性進(jìn)行按等級(jí)評(píng)分,然后根據(jù)下式計(jì)算平均分MOS:其中,k為級(jí)別數(shù),ni為該類別的人數(shù),ci為分?jǐn)?shù)。壓縮編碼算法的性能評(píng)價(jià)指標(biāo)保真性:主觀保真性:在規(guī)定的觀測(cè)條1012.2預(yù)測(cè)編碼預(yù)測(cè)編碼的基本思想:分析信號(hào)的相關(guān)性,利用已處理的信號(hào)預(yù)測(cè)待處理的信號(hào),得出預(yù)測(cè)值;然后僅對(duì)真實(shí)值與預(yù)測(cè)值之間的差值進(jìn)行編碼處理和傳輸。本方法之依據(jù):媒體(如聲音,圖像等)數(shù)據(jù)的相鄰采樣值都非常接近,即具有很強(qiáng)的相關(guān)性。利用相鄰采樣值間的相關(guān)性進(jìn)行預(yù)測(cè),可以實(shí)現(xiàn)很高的編碼效率。2.2預(yù)測(cè)編碼預(yù)測(cè)編碼的基本思想:102預(yù)測(cè)編碼預(yù)測(cè)編碼是一種有損編碼。因?yàn)樗膶?shí)現(xiàn)是基于聲音或圖像數(shù)據(jù)的物理特性--當(dāng)采樣間隔很密時(shí),相鄰采樣點(diǎn)之間取值非常接近。預(yù)測(cè)編碼利用數(shù)據(jù)間存在的時(shí)間相關(guān)性(聲音數(shù)據(jù))或空間相關(guān)性(圖像數(shù)據(jù))進(jìn)行數(shù)據(jù)壓縮。預(yù)測(cè)編碼預(yù)測(cè)編碼是一種有損編碼。因?yàn)樗膶?shí)現(xiàn)是基于聲音或圖像103預(yù)測(cè)編碼舉例30fps30fps15fpssubsamplinginterpolation時(shí)域預(yù)測(cè)編碼舉例30fps30fps15fpssubsampli104預(yù)測(cè)編碼舉例+-當(dāng)前幀下一幀差分幀預(yù)測(cè)編碼舉例+-當(dāng)前幀下一幀差分幀105預(yù)測(cè)編碼舉例預(yù)測(cè)編碼舉例1062.2.1脈沖編碼調(diào)制(PCM)PCM編碼是最基本的一種模數(shù)轉(zhuǎn)換方法,實(shí)現(xiàn)步驟為:采樣:時(shí)間軸上的信號(hào)離散化量化:在幅度軸上對(duì)信號(hào)離散化編碼:按一定格式記錄采樣量化后的數(shù)字?jǐn)?shù)據(jù)t0t0Tt0量化n0g[n]2.2.1脈沖編碼調(diào)制(PCM)PCM編碼是最基本的一種模107脈沖編碼調(diào)制(PCM)
量化技術(shù):分為標(biāo)量量化和矢量量化。每種量化又可分為:均勻量化、非均勻量化、自適應(yīng)量化。標(biāo)量量化:對(duì)采樣數(shù)據(jù)逐個(gè)進(jìn)行量化。矢量量化:對(duì)采樣數(shù)據(jù)進(jìn)行分組,每組K個(gè)數(shù)構(gòu)成一個(gè)K維矢量,然后以矢量為單位,逐個(gè)對(duì)矢量進(jìn)行量化。均勻量化:量化步長(zhǎng)相同的量化。非均勻量化:量化步長(zhǎng)不相同,隨不同情況而改變的量化。自適應(yīng)量化:量化步長(zhǎng)對(duì)應(yīng)特定問(wèn)題自適應(yīng)變化。脈沖編碼調(diào)制(PCM)量化技術(shù):108脈沖編碼調(diào)制(PCM)量化目標(biāo)包括:給定量化分層級(jí)數(shù),滿足量化誤差最小。限定量化誤差,確定分層級(jí)數(shù),滿足以盡量小的平均比特?cái)?shù),表示量化輸出。PCM編碼方式是最早研制,且應(yīng)用最廣泛的一種編碼方法。但其壓縮比率不是特別高,比如語(yǔ)音信號(hào)使用PCM方式壓縮出來(lái)的數(shù)據(jù)速率為64Kbit/s。脈沖編碼調(diào)制(PCM)量化目標(biāo)包括:1092.2.2差分脈沖編碼調(diào)制(DPCM)DPCM是對(duì)PCM的改進(jìn),利用了相鄰樣本值非常接近的特點(diǎn),在對(duì)它們進(jìn)行編碼時(shí),可以去掉它們之間的相關(guān)性進(jìn)行有效的信息傳遞?;舅枷耄焊鶕?jù)已處理的樣本值估算待處理信號(hào)的幅度大小,即預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化再編成PCM碼傳輸,接收端再將此差值與預(yù)測(cè)值相加,重建原始信號(hào)。2.2.2差分脈沖編碼調(diào)制(DPCM)DPCM是對(duì)PCM的110差分脈沖編碼調(diào)制(DPCM)具體處理過(guò)程參見(jiàn)下圖:量化器預(yù)測(cè)器d(k)s(k)PCM樣本k++I(k)sr(k)se(k-1)se(k)-z-1差分脈沖編碼調(diào)制(DPCM)具體處理過(guò)程參見(jiàn)下圖:量化器預(yù)測(cè)111差分脈沖編碼調(diào)制(DPCM)d(k)是離散輸入信號(hào)s(k)與預(yù)測(cè)器輸出的估算值se(k)之差。I(k)是對(duì)差值d(k)進(jìn)行量化編碼以減少冗余得到的編碼值。sr(k)為重構(gòu)信號(hào),是由量化差分信號(hào)I(k)與前一個(gè)時(shí)刻的預(yù)測(cè)值se(k-1)之和,作為確定下一個(gè)信號(hào)估算值的輸入信號(hào)。se(k)為將sr(k)作為輸入得到的預(yù)測(cè)輸出。差分脈沖編碼調(diào)制(DPCM)d(k)是離散輸入信號(hào)s(k)與112差分脈沖編碼調(diào)制(DPCM)差分脈沖編碼調(diào)制的優(yōu)點(diǎn):對(duì)實(shí)際值和預(yù)測(cè)值之差進(jìn)行量化編碼,則存儲(chǔ)或者傳送的不是絕對(duì)幅度值,由于數(shù)據(jù)采樣值間相關(guān)性較強(qiáng),這些樣點(diǎn)值間的差值比實(shí)際樣本值小很多,所以降低了數(shù)據(jù)量,也就降低了對(duì)傳輸信道容量的要求。差分脈沖編碼調(diào)制(DPCM)差分脈沖編碼調(diào)制的優(yōu)點(diǎn):1132.2.3自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM是在DPCM的基礎(chǔ)上發(fā)展起來(lái)的,它是利用了線性預(yù)測(cè)的高效編碼模式?;舅枷耄?.在DPCM的基礎(chǔ)上,利用自適應(yīng)的方法改變量化步長(zhǎng),對(duì)小的差值使用小的量化步長(zhǎng)進(jìn)行編碼,對(duì)大的差值使用大的量化步長(zhǎng)進(jìn)行編碼。2.采用自適應(yīng)預(yù)測(cè)技術(shù)估算待處理的輸入樣本預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值盡量小。2.2.3自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM是114自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)具體處理過(guò)程參見(jiàn)下圖:差分量化器量化階調(diào)整逆量化器預(yù)測(cè)器預(yù)測(cè)PCM樣本PCM樣本+++-ADPCM差值自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)具體處理過(guò)程參見(jiàn)下圖:差115自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM的設(shè)計(jì)思路:1、盡可能從語(yǔ)音信號(hào)中消除冗余。2、對(duì)消除冗余后的信號(hào),以明顯而離散的方式,從自適應(yīng)角度進(jìn)行最佳編碼。質(zhì)量:在保證質(zhì)量情況下,可以將64Kbit/s的數(shù)據(jù)壓縮到32Kbit/s或16Kbit/s,甚至8Kbit/s、2.4Kbit/s、0.8Kbit/s。適用場(chǎng)合:用于資源受限的通信系統(tǒng),如蜂窩無(wú)線通信系統(tǒng)。自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)ADPCM的設(shè)計(jì)思路:1162.3變換編碼概述變換編碼的基本思想:利用各種變換手段,將信號(hào)從一個(gè)域變換到其正交空間中去,用變換系數(shù)來(lái)表示原始媒體數(shù)據(jù),并對(duì)變換系數(shù)進(jìn)行編碼,往往這個(gè)時(shí)候,變換系數(shù)都具有很容易壓縮的特性。本方法之依據(jù):很多媒體信號(hào)在某個(gè)域(如時(shí)間域或空間域)特性并不明顯,而變換到變換域(如頻域)去則可以得到很好的壓縮處理效果。2.3變換編碼概述變換編碼的基本思想:117變換編碼概述變換編碼要可用,必須要求其反變換存在。變換編碼示意圖:某個(gè)域的數(shù)據(jù)另外一個(gè)域的數(shù)據(jù)編碼/解碼嚴(yán)格來(lái)說(shuō),當(dāng)反變換存在時(shí),變換編碼是一種無(wú)損編碼。但是在實(shí)現(xiàn)時(shí),基于數(shù)字系統(tǒng)的精度有限,無(wú)法無(wú)失真地表示每個(gè)變換系數(shù),所以它其實(shí)是有損的。變換編碼概述變換編碼要可用,必須要求其反變換存在。某個(gè)域的數(shù)118變換編碼概述變換域編碼的優(yōu)點(diǎn):(1)在變換域里視頻圖像要比空間域里簡(jiǎn)單。(2)視頻圖像的相關(guān)性明顯下降,信號(hào)的能量主要集中在少數(shù)幾個(gè)變換系數(shù)上,采用量化和熵編碼可有效地壓縮其數(shù)據(jù)。(3)具有較強(qiáng)的抗干擾能力,傳輸過(guò)程中的誤碼對(duì)圖像質(zhì)量的影響遠(yuǎn)小于預(yù)測(cè)編碼。變換編碼概述變換域編碼的優(yōu)點(diǎn):1192.3.1正交變換假設(shè)一個(gè)離散信號(hào)由N個(gè)采樣值組成,即一個(gè)N維向量,而每個(gè)采樣值代表N維信號(hào)空間中數(shù)據(jù)向量X的一個(gè)分量。正交變換就是為了尋找一個(gè)變換矩陣T,使得可以利用M維矩陣Y來(lái)近似表示X:Y=TX利用子集Y來(lái)恢復(fù)X時(shí),不會(huì)引起明顯的誤差。再對(duì)Y中的M個(gè)分量進(jìn)行壓縮,即可達(dá)到壓縮的目的。2.3.1正交變換假設(shè)一個(gè)離散信號(hào)由N個(gè)采樣值組成,即一個(gè)1202.3.2離散傅立葉變換(DFT)和離散余弦變換(DCT)DFT實(shí)現(xiàn)將媒體數(shù)據(jù)從離散時(shí)域變換到離散頻域,以方便信號(hào)的頻域分析。DFT變換通過(guò)下面公式得到:其中,WNk為旋轉(zhuǎn)因子,WNk=e-j2π/N.2.3.2離散傅立葉變換(DFT)和離散余弦變換(DCT)121離散傅立葉變換(DFT)離散傅立葉變換將時(shí)域離散周期的序列映射成頻域離散周期的序列,如右圖所示。離散傅立葉變換(DFT)離散傅立葉變換將時(shí)域離散周期的序列映122離散余弦變換(DCT)離散余弦變換是DFT的一種特殊形式,當(dāng)基函數(shù)為離散余弦函數(shù)時(shí),DFT就成為了DCT。離散余弦變換主要用于圖像壓縮編碼,基本方法是先將整體圖像分成N×N像素塊,然后對(duì)N×N像素塊逐一進(jìn)行DCT變換。變換后得到像素塊的頻率系數(shù)矩陣,其中對(duì)應(yīng)的高頻成分系數(shù)通常為零,而低頻成分系數(shù)有較小的值。離散余弦變換(DCT)離散余弦變換是DFT的一種特殊形式,當(dāng)123離散余弦變換(DCT)離散余弦變換分一維DCT和二維DCT:(1)一維DCT為:C(u)為變換系數(shù)f(x)為長(zhǎng)度為N的序列,F(xiàn)(u)也為長(zhǎng)度為N的序列。離散余弦變換(DCT)離散余弦變換分一維DCT和二維DCT:124離散余弦變換(DCT)(2)二維DCT為:為變換函數(shù)。離散余弦變換(DCT)(2)二維DCT為:為變換函數(shù)。1252.3.3子帶編碼子帶編碼的基本思想是把一個(gè)聲音或圖像的傅里葉頻譜分解(析)成若干個(gè)互不重疊的子頻帶,所有子帶的帶寬和仍為原信號(hào)的總頻帶。子帶編碼是一種以信號(hào)頻譜為依據(jù)的波形編碼方法,它首先用一組帶通濾波器將輸入信號(hào)按頻譜分開(kāi),然后讓每路子信號(hào)通過(guò)各自的自適應(yīng)PCM編碼器(ADPCM)編碼,經(jīng)過(guò)分接和解碼再?gòu)?fù)合成原始信號(hào)。2.3.3子帶編碼子帶編碼的基本思想是把一個(gè)聲音或圖像的傅126子帶編碼子帶編碼原理參見(jiàn)下圖:BPF1BPF2BPFx編碼器編碼器編碼器……復(fù)合器分解器譯碼器BPF1譯碼器譯碼器BPF2BPFN……x[n]x’[n]子帶編碼子帶編碼原理參見(jiàn)下圖:BPF1BPF2BPFx編碼器127子帶編碼子帶編碼的種類:(1)等帶寬子帶編碼:各子帶的帶寬ΔW是相同的。(2)變帶寬子帶編碼:各子帶的帶寬不相同。子帶編碼的優(yōu)點(diǎn):(1)每個(gè)子帶獨(dú)立自適應(yīng),可按每個(gè)子帶的能量調(diào)節(jié)量化階;(2)可根據(jù)各個(gè)子帶對(duì)感覺(jué)的作用大小共同設(shè)計(jì)最佳的比特?cái)?shù);(3)量化噪聲都限制在子帶內(nèi),某一頻帶的量化噪聲不會(huì)串到另一頻帶中去。
子帶編碼子帶編碼的種類:1282.4統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼的基本思想:對(duì)于無(wú)記憶的信源,根據(jù)碼字出現(xiàn)的概率分布特性尋找概率與碼字長(zhǎng)度間的最優(yōu)化匹配,據(jù)此對(duì)信息進(jìn)行壓縮。本方法之依據(jù):根據(jù)消息出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼,其目的在于在消息和碼字之間找到明確的一一對(duì)應(yīng)關(guān)系,以便在恢復(fù)時(shí)能夠準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái),或者至少是極相似的找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系。2.4統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼的基本思想:129統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼是一種無(wú)損編碼,常用于圖像、文檔等要求無(wú)損失的壓縮中。實(shí)現(xiàn)原理:有些媒體(如圖像,文檔)數(shù)據(jù)中各樣點(diǎn)值的出現(xiàn)概率在編碼前可以統(tǒng)計(jì)出,結(jié)合其出現(xiàn)概率進(jìn)行的編碼可以充分降低數(shù)據(jù)量,同時(shí)又保證了媒體的質(zhì)量。由于在編碼過(guò)程中僅僅將這些媒體數(shù)據(jù)看成是一串?dāng)?shù)據(jù),沒(méi)有深入到其物理意義中去研究,所以壓縮比率并不高。統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼是一種無(wú)損編碼,常用于圖像、文檔等要求無(wú)損失1302.4.1霍夫曼編碼基本思想:對(duì)于出現(xiàn)概率較大的符號(hào)取較短的碼長(zhǎng),而對(duì)概率較小的符號(hào)則取較長(zhǎng)的碼長(zhǎng)。霍夫曼編碼(HuffmanEncoding)又稱變長(zhǎng)度編碼,或最優(yōu)編碼,即遵照霍夫曼編碼原則的結(jié)果一定是平均碼長(zhǎng)最短?;舴蚵幋a的特點(diǎn):只適用于有限個(gè)離散信源;且實(shí)現(xiàn)起來(lái)相當(dāng)復(fù)雜。2.4.1霍夫曼編碼基本思想:131霍夫曼編碼編碼方法:按照一定的順序構(gòu)建二叉樹(shù)。舉例說(shuō)明:假設(shè)給定一個(gè)4×4的像素塊如右圖所示:1535421622512263第一步:將信源中各符號(hào)的概率計(jì)算出并按從大到小排序。SourceB=2A=1E=5C=3F=6D=4Probability5/163/163/162/162/161/16試計(jì)算其中各像素的霍夫曼編碼。編碼過(guò)程如下:霍夫曼編碼編碼方法:按照一定的順序構(gòu)建二叉樹(shù)。1535421132霍夫曼編碼第二步:基于上面的概率分布表構(gòu)建二叉樹(shù)1.將兩個(gè)出現(xiàn)概率最小的消息合并成一個(gè)消息,然后重新按信源符號(hào)出現(xiàn)的概率從大到小排列。2.重復(fù)上面步驟1,直到得到的合并消息概率為1。3.將被合并的兩個(gè)消息分支分別賦值“0”和“1”,就得到二叉樹(shù)。B(5/16)A(3/16)E(3/16)C(2/16)F(2/16)D(1/16)3/165/166/1610/1616/161111100000霍夫曼編碼第二步:基于上面的概率分布表構(gòu)建二叉樹(shù)B(5/16133霍夫曼編碼第三步:根據(jù)構(gòu)建的二叉樹(shù),由樹(shù)根到每個(gè)樹(shù)葉的所有比特就構(gòu)成對(duì)應(yīng)信源符號(hào)的編碼。sourceABCDEFcode00101101111011110Code-length223424averagelength2.5bits/pixelCompressionratio2.5/3≈0.833霍夫曼編碼第三步:根據(jù)構(gòu)建的二叉樹(shù),由樹(shù)根到每個(gè)樹(shù)葉的所有比134霍夫曼編碼霍夫曼編碼中幾個(gè)值得注意的問(wèn)題:1.由于一個(gè)節(jié)點(diǎn)的上下兩個(gè)分支即可以賦值“0”,也可以賦值“1”,因此同一信源對(duì)應(yīng)的霍夫曼編碼并不唯一,但平均碼長(zhǎng)是相同的。2.霍夫曼編碼為唯一可譯碼,即碼的任意一串有限長(zhǎng)的碼符號(hào)序列只能被唯一譯成所對(duì)應(yīng)的信源符號(hào)。3.霍夫曼編碼不具有檢錯(cuò)和糾錯(cuò)的能力,如果碼串中有錯(cuò)誤,都會(huì)導(dǎo)致該碼譯錯(cuò),甚至產(chǎn)生誤碼擴(kuò)散?;舴蚵幋a霍夫曼編碼中幾個(gè)值得注意的問(wèn)題:135霍夫曼編碼4.霍夫曼是可變長(zhǎng)度碼,必須在存儲(chǔ)代碼前先進(jìn)行譯碼。5.霍夫曼對(duì)不同的信源,其編碼效率是不同的。當(dāng)信源概率分布很不均勻時(shí),霍夫曼碼會(huì)具有顯著效果。6.如果信源的實(shí)際概率模型與構(gòu)碼時(shí)所假設(shè)的概率模型有差異,實(shí)際的平均碼字將大于預(yù)期值,編碼效率將下降。這種情況下,唯一的解決辦法就是更換碼表,使之與實(shí)際概率模型匹配。霍夫曼編碼4.霍夫曼是可變長(zhǎng)度碼,必須在存儲(chǔ)代碼前先進(jìn)行譯碼1362.4.2游程編碼基本思想:將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符或像素值用該符號(hào)加出現(xiàn)次數(shù)來(lái)表示。游程編碼又稱為行程編碼(Run-lengthEncoding),也是一種常用于文檔和圖像中的編碼方式。RLE編碼簡(jiǎn)單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如BMP、TIFF及AVI等格式文件的壓縮均采用此方法。2.4.2游程編碼基本思想:137游程編碼編碼方法:基本的游程編碼就是在數(shù)據(jù)流中直接用三個(gè)字符來(lái)表示,其數(shù)據(jù)結(jié)構(gòu)如圖所示:CcXSc數(shù)據(jù)量其中,Sc表示一個(gè)字符串在此位置,X代表構(gòu)成串的字符,Cc代表串的長(zhǎng)度。例:字符串AAABCDDDDDDDDBBBBB,游程編碼結(jié)果為3ABC8D5B.游程編碼編碼方法:CcXSc數(shù)據(jù)量其中,Sc表示一個(gè)字符串在138游程編碼優(yōu)點(diǎn):1、編碼方式簡(jiǎn)單,直觀。2、譯碼和編碼采用相同的規(guī)則進(jìn)行,得到與壓縮完全相同的數(shù)據(jù),從而可以實(shí)現(xiàn)無(wú)損壓縮。缺點(diǎn):1、在特定情況下,如單一顏色背景下的圖形圖像壓縮中可以取得較高的壓縮比;而對(duì)于復(fù)雜顏色的圖形圖像,則壓縮比較低。2、由于其在壓縮實(shí)現(xiàn)過(guò)程中未考慮被壓縮數(shù)據(jù)的物理含義,所以獲得的壓縮比也較低。游程編碼優(yōu)點(diǎn):139游程編碼游程編碼分類:(1)一維游程編碼:常用于文檔,聲音和圖像的無(wú)損編碼中。例如圖像中一維游程編碼是對(duì)圖像進(jìn)行逐行掃描,旨在消除每行像素(或水平分解元素)的相關(guān)性而沒(méi)有考慮行間像素(或垂直分解元素)的相關(guān)性。(2)二維游程編碼:常用于圖像編碼中,需要考慮每行像素和行間像素兩個(gè)方向的像素相關(guān)性。游程編碼游程編碼分類:1402.4.3算術(shù)編碼基本思想:類似于Huffman編碼,對(duì)概率較大的符號(hào)采用短碼,對(duì)概率較小的符號(hào)采用長(zhǎng)碼,但Huffman編碼只能使用整數(shù)比特,而它可以利用分?jǐn)?shù)比特逼近于信源?;驹恚?、根據(jù)信源中出現(xiàn)不同符號(hào)序列的概率不同,把[0,1)區(qū)間劃分為互不重疊、寬度恰好是各符號(hào)序列的概率的子區(qū)間。2、信源中的各符號(hào)序列將可用各子區(qū)間中的任意一個(gè)實(shí)數(shù)表示,這個(gè)數(shù)就是該符號(hào)所對(duì)應(yīng)的碼。2.4.3算術(shù)編碼基本思想:141算術(shù)編碼算術(shù)編碼步驟:1、建立信源概率表。2、掃描信源發(fā)出的符號(hào)序列,對(duì)其進(jìn)行編碼。分類:1、靜態(tài)算術(shù)編碼:信源符號(hào)概率是固定的算術(shù)編碼。2、自適應(yīng)算術(shù)編碼:信源符號(hào)概率是動(dòng)態(tài)變化的算術(shù)編碼。算術(shù)編碼算術(shù)編碼步驟:142算術(shù)編碼舉例說(shuō)明靜態(tài)算術(shù)編碼:假設(shè)信源符號(hào)為{00,01,10,11},這些符號(hào)概率分別為{0.1,0.4,0.2,0.3}。根據(jù)這些概率,可把間隔[0,1)分成4個(gè)子間隔:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)。如果二進(jìn)制消息序列的輸入為:10001100101101編碼過(guò)程:第一個(gè)符號(hào)為10,它的編碼范圍對(duì)應(yīng)[0.5,0.7)而第二個(gè)符號(hào)00對(duì)應(yīng)的編碼范圍是[0,0.1)。因此,它的間隔就取[0.5,0.7)的第一個(gè)1/10作為新間隔[0.5,0.52)依此類推……算術(shù)編碼舉例說(shuō)明靜態(tài)算術(shù)編碼:143算術(shù)編碼自適應(yīng)算術(shù)編碼:首先假定各符號(hào)概率的初始值相同,然后其概率根據(jù)出現(xiàn)的情況做相應(yīng)的改變。自適應(yīng)模式可以不預(yù)先定義概率模型,但要求編碼器和譯碼器使用相同的概率模型。自適應(yīng)算術(shù)編碼的編碼效率很高,當(dāng)信源符號(hào)概率比較接近時(shí),可優(yōu)于Huffman編碼。具體編碼過(guò)程略。算術(shù)編碼自適應(yīng)算術(shù)編碼:1442.5其他編碼隨著信號(hào)處理技術(shù)的發(fā)展,很多新的編碼技術(shù)出現(xiàn)并發(fā)展。常見(jiàn)的新編碼技術(shù)有:基于模型的編碼神經(jīng)網(wǎng)絡(luò)編碼小波編碼分形編碼混合編碼等
2.5其他編碼隨著信號(hào)處理技
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 樓頂?shù)跹b字體施工方案
- 教師節(jié)感恩作文
- 2025年度校園心理安全責(zé)任協(xié)議書(shū)
- 2025年度智能化支付解決方案與服務(wù)合同
- 二零二五年度實(shí)習(xí)教師實(shí)習(xí)崗位工作職責(zé)合同
- 二零二五年度能源合同履約金管理及能源節(jié)約措施
- 二零二五年度農(nóng)村房產(chǎn)轉(zhuǎn)讓合同(附帶農(nóng)村土地經(jīng)營(yíng)權(quán))
- 2025年度金融衍生品交易連帶責(zé)任保證合同
- 二零二五年度風(fēng)險(xiǎn)評(píng)估與風(fēng)險(xiǎn)控制合同
- 2025年度集體合同簽訂與產(chǎn)業(yè)工人隊(duì)伍建設(shè)
- 服務(wù)器巡檢報(bào)告模版
- 【員工創(chuàng)新績(jī)效研究文獻(xiàn)綜述】
- 2023年高中生物新教材人教版(2023年)必修二全冊(cè)教案
- 【高考核心詞匯考前沖刺】介詞短語(yǔ)辨析+單選100題高考英語(yǔ)詞匯查漏補(bǔ)缺沖刺訓(xùn)練
- 2023年供貨方案 醫(yī)療器械供貨方案(四篇)
- 夫妻吵架復(fù)合合同書(shū)
- 六年級(jí)上冊(cè)心理健康教育課件-健康上網(wǎng)快樂(lè)多 北師大版
- GB/T 23641-2018電氣用纖維增強(qiáng)不飽和聚酯模塑料(SMC/BMC)
- 情報(bào)信息收集報(bào)知
- 簡(jiǎn)約國(guó)潮行業(yè)通用中國(guó)風(fēng)鎏金PPT模板
- (省優(yōu))課件閩教版六下Unit-8-Farewell-Part-B課件
評(píng)論
0/150
提交評(píng)論