河北科技大學(xué)多媒體通信技術(shù)基礎(chǔ)第三章

上傳人：0*** IP屬地：湖北上傳時間：2023-02-02 格式：PPT 頁數(shù)：127 大?。?.60MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩122頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第3章數(shù)據(jù)壓縮的基本技術(shù)數(shù)據(jù)壓縮處理一般由兩個過程組成：編碼過程：對原始數(shù)據(jù)進(jìn)行編碼壓縮，以便存儲和傳輸；解碼過程：對壓縮的數(shù)據(jù)進(jìn)行解壓，恢復(fù)成可用的數(shù)據(jù)。根據(jù)解壓后數(shù)據(jù)的保真度，數(shù)據(jù)壓縮技術(shù)可分為無損壓縮編碼：解碼后的數(shù)據(jù)與原始數(shù)據(jù)完全相同，無任何偏差。這種編碼通?；谛畔㈧卦?，常用的編碼有哈夫曼編碼、算術(shù)編碼、行程編碼等。壓縮比比較低，一般在2:1-5:1。主要用于要求數(shù)據(jù)無損壓縮存儲和傳輸?shù)膱龊?，如傳真機(jī)有損壓縮編碼：解碼后的數(shù)據(jù)與原始數(shù)據(jù)相比有一定的偏差，但仍可保持一定的視聽質(zhì)量和效果。它主要是在保持一定保真度下對數(shù)據(jù)進(jìn)行壓縮，其壓縮比可達(dá)100:1。壓縮比越高，其解壓縮后的視、音頻質(zhì)量就越低。

分類：

a第一代圖像壓縮編碼方法基于香農(nóng)理論，80年代初趨于成熟，主要降低數(shù)據(jù)之間的相關(guān)性，去除冗余。

b第二代圖像壓縮編碼方法基于人類視覺特性的壓縮方法，其核心思想是力圖發(fā)現(xiàn)人眼是根據(jù)哪些關(guān)鍵特征來識別圖像、或圖像序列的，然后根據(jù)這些特征來構(gòu)造圖像模型。例如，根據(jù)人眼對物體的輪廓比對物體內(nèi)部細(xì)節(jié)更為敏感的特點(diǎn)，可以利用物體(而不是像素)的集合來表示圖像。

3.2數(shù)據(jù)壓縮的理論依據(jù)

3.2數(shù)據(jù)壓縮的理論依據(jù)數(shù)據(jù)壓縮的理論基礎(chǔ)為Shannon信息論。它一方面給出了數(shù)據(jù)壓縮的理論極限，另一方面又指明了數(shù)據(jù)壓縮的技術(shù)途徑。Shannon理論認(rèn)為：信源中所含有的平均信息量（熵）是進(jìn)行無失真壓縮編碼的理論極限。無記憶信源：如果設(shè)計的編碼方法的碼字平均長度最接近熵，則說明該編碼方法是最佳的。香農(nóng)三大定理是信息論的基礎(chǔ)理論。香農(nóng)三大定理是存在性定理，雖然并沒有提供具體的編碼實現(xiàn)方法，但為通信信息的研究指明了方向。第一定理：可變長無失真信源編碼定理采用無失真最佳信源編碼可使得用于每個信源符號的編碼位數(shù)盡可能的少，但它的極限是原始信號源的熵；超過了這一極限就不可能實現(xiàn)無失真的譯碼。第二定理：有噪信道編碼定理若在信息傳輸率R不大于信道容量C時，則存在一種編碼，當(dāng)碼長n足夠大時，它可以使信道輸出端的錯誤概率任意小，而信息傳輸率無限接近C；如果R>C，則不能找到一種編碼，使輸出端錯誤概率任意小。第三定理：

第三定理：保真度準(zhǔn)則下的信源編碼定理，或稱有損信源編碼定理只要碼長足夠長，總可以找到一種信源編碼，使編碼后的信息傳輸率R（單位：bit/信源符號）略大于率失真函數(shù)R(D)，而碼的平均失真度不大于給定的允許失真度，即D‘<=D設(shè)R(D)為一離散無記憶信源的信息率失真函數(shù)，并且有有限的失真度D，以及任意長的碼長N，ε>0,一定存在一種碼字個數(shù)為M≥2N[R(D)+ε]的信源編碼，使編碼后的平均失真度D‘<=D

3.2.3信源的相關(guān)性與序列熵的關(guān)系

3.3信息率-失真理論率失真函數(shù)R(D)：p32,(3-21)在一定允許失真D條件下的最低平均互信息量。從信源編碼的角度看：率失真函數(shù)是在允許失真不大于D時，信源編碼給出的平均互信息的下界。即對信源信息率壓縮的極限。從接收端看，就是在滿足失真不大于D的情況下，能夠再現(xiàn)信源信息所必須獲得的最低平均信息量。限失真信源編碼定理1設(shè)離散無記憶信源U的率失真函數(shù)為R(D),給定允許失真D，則當(dāng)信息率R>R(D),只要信源序列長度L足夠長，一定存在一種編碼方法其譯碼平均失真小于或等于D+ε逆定理：當(dāng)R<R(D)時,無論采用什么編譯碼方法，平均失真總是大于D。實際中解決的方法通常采用相反的思路，及給定信息率R，通過改變編碼方法尋找盡可能小的平均失真。例如：在最佳量化器的設(shè)計中，其中量化的分層數(shù)N給定，（相當(dāng)于信息熵給定）根據(jù)一定的誤差準(zhǔn)則，如均方誤差最小，可以設(shè)計出相應(yīng)的最佳量化器。3.5預(yù)測編碼目的：去除相鄰像素之間的冗余度，減小圖像信息在時間上和空間上的相關(guān)性來達(dá)到數(shù)據(jù)壓縮的目的?！跋噜彙保梢灾赶袼嘏c它在同一幀圖像內(nèi)上、下、左、右的像素之間的空間相鄰關(guān)系；也可以指該像素與相鄰的前幀、后幀圖像中對應(yīng)于同一空間位置上的像素(同位像素）之間時間上的相鄰關(guān)系。具體如下：對于一個圖像信源，首先根據(jù)某一模型，并利用以往的樣值對新樣值進(jìn)行預(yù)測，得出預(yù)測值，然后將預(yù)測值與實際樣值相減，得到誤差值，最后對誤差值進(jìn)行量化、編碼、傳輸

3.5.1差分脈沖編碼調(diào)制DPCM的簡化原理方框圖+-編碼壓縮圖像輸入圖像enxn

xn量化器ên預(yù)測器++解碼預(yù)測器解壓縮圖像壓縮圖像yn

xnên通過預(yù)測和差分，將x(n)轉(zhuǎn)化為差分信息e(n),降低了信息冗余圖中預(yù)測器的輸出：

N為預(yù)測器所采用的樣值數(shù)，也稱為預(yù)測器的階數(shù)。

等于各輸入樣值的線性組合，本預(yù)測器稱為線性預(yù)測器。在解碼器中有一個相同的預(yù)測器，收到的預(yù)測誤差信號經(jīng)解量化器DQ以后，與預(yù)測其的輸出相加，從而恢復(fù)出原信號。由于預(yù)測誤差的量化，解碼輸出的y(n)是x(n)的近似值。修正后的預(yù)測編碼器在前面的預(yù)測器中，編碼端利用原始信號為參考進(jìn)行預(yù)測，而在解碼端確是利用量化后的信號進(jìn)行預(yù)測，這種不匹配的情況導(dǎo)致重建信號有y(n)與輸入信號x(n)之間存在較大誤差。修正：編碼器反饋環(huán)模擬了解碼端結(jié)構(gòu)。增加一個反饋環(huán)，將量化誤差和過去預(yù)測函數(shù)相加，作為新的預(yù)測函數(shù)符號編碼壓縮圖像+-en輸入圖像xnQ->DQên預(yù)測器

xn++?xn

^xn=ên

+xn幾個概念：一維預(yù)測：被預(yù)測的樣值與用作預(yù)測的樣值在同一行內(nèi)二維預(yù)測：用作預(yù)測的樣值位于相鄰的不同行上

一維預(yù)測利用像素之間在水平方向上的相關(guān)性。在水平方向亮度變化緩慢的圖像，有較好的預(yù)測效果。如果水平方向上亮度有突變，那么一階的一維預(yù)測經(jīng)常會給出錯誤的預(yù)測數(shù)值。在這種情況下，采用下面的二維預(yù)測，會有較好的預(yù)測值。

圖3-14對應(yīng)于圖像黑白邊界處的幾個像素N階預(yù)測器的設(shè)計問題在最小均方誤差下的最佳預(yù)測器。下式表示預(yù)測誤差信號e(n)平方值的統(tǒng)計平均。若上式最小時，表示在最小均方誤差意義下，預(yù)測最準(zhǔn)確，此時色預(yù)測器稱為在最小均方誤差意義下的最佳預(yù)測器。最佳預(yù)測器的系數(shù)ai可以通過求極小值的方法求得。

如果對所需要壓縮的某類圖像的自相關(guān)函數(shù)已經(jīng)作過測量的話，則可通過求解上式所表示的方程組，獲得最佳預(yù)測器的系數(shù)值。另一個事實

預(yù)測誤差的平均功率比原信號的功率R(0)要小。在相同的均方量化誤差下，e(n)比x(n)要求較少的量化級數(shù)，因此，傳送e(n)比傳送x(n)的數(shù)據(jù)率要低。3.5.2序列圖像中運(yùn)動矢量的估值1.運(yùn)動矢量估值的必要性序列圖像在時間上的冗余情況可分如下幾種：

(1)對于靜止不動的場景，當(dāng)前幀和前一幀的圖像內(nèi)容是完全相同的；

(2)對于運(yùn)動的物體，只要知道其運(yùn)動規(guī)律，就可以從前一幀圖像推算出它在當(dāng)前幀中的位置；(3)攝像鏡頭對著場景橫向移動(稱為滑鏡頭)、焦距變化等操作會引起整個圖像的平移、放大或縮小。對于這種情況，只要攝像機(jī)的運(yùn)動規(guī)律和鏡頭改變的參數(shù)已知，圖像隨時間所產(chǎn)生的變化也是可以推算出來的。由電視圖像的相關(guān)性特點(diǎn)，可知：發(fā)送端不一定必須把每幀圖像上所有的像素都傳給收端，而只要將物體(或攝像機(jī))的運(yùn)動信息告知接收端，收端就可根據(jù)運(yùn)動信息和前一幀圖像的內(nèi)容來更新當(dāng)前幀圖像，這比全部傳送每幀圖像的具體細(xì)節(jié)所需的數(shù)據(jù)量要小得多。首先要做的是從圖像序列中提取運(yùn)動物體的信息－－運(yùn)動估值。為了簡單起見，做出如下假設(shè)：(1)物體是剛體．只在與攝像機(jī)鏡頭的光軸垂直的平面內(nèi)移動。即：物體的形變、旋轉(zhuǎn)、鏡頭焦距的變更等因素不考慮在內(nèi)；(2)無論物體移動到任何位置，照明條件都不變，即：同一物體在所有序列圖像中亮度沒有變化；(3)被物體遮擋的背景和由于物體移開而新暴露出來的背景部分都未不作特殊考慮。t時刻運(yùn)動物體的象素值bt可用它在時間以前的值bt-τ表示：含義：t時刻的圖像是t-τ時刻的圖像經(jīng)適當(dāng)位移D后的結(jié)果。運(yùn)動估值的分類：

a塊匹配方法b像素遞歸方法2.塊匹配方法方法描述：a.將圖像劃分為許多互不重疊的子塊，并認(rèn)為子塊內(nèi)所有像素的位移量都相同。（每個子塊視為一個“運(yùn)動物體”）b.尋找匹配塊假設(shè)在圖像序列中，t時刻對應(yīng)于第k幀圖像，t-τ時刻對應(yīng)于k-1幀圖像。對于k幀中的一個子塊，在k-1幀中尋找與其最相似的子塊，稱為匹配塊。K-1幀稱為K幀的參考幀c.尋找位移矢量認(rèn)為匹配塊在k-1幀中的位置就是k幀塊位移前的位置，根據(jù)(3-44)式則可以得到該子塊的位移矢量D。塊匹配方法中最重要的問題：(1)判別兩個子塊匹配的準(zhǔn)則；(2)尋找匹配塊搜索的方法。準(zhǔn)則a:歸一化的二維互相關(guān)函數(shù)（NCCF）當(dāng)NCCF為最大值時2個子塊匹配，對應(yīng)的i，j值即構(gòu)成位移矢量D。準(zhǔn)則b求2幀子塊亮度的均方差值MSE：當(dāng)MSE最小時．表示2個子塊匹配。c.MAD準(zhǔn)則求幀間子塊亮度差的絕對值的均值MAD：當(dāng)MAD最小時．表示2個子塊匹配。d.計算塊亮度差的絕對值和SAD：SAD(I,j)=MN*MAD(i,j)當(dāng)SAD最小時．表示2個子塊匹配。此準(zhǔn)則較常使用。研究結(jié)果表明，匹配判別準(zhǔn)則的不同對匹配精度，也即是對位移適量估值的精度影響不大。（2）搜索方法：為了節(jié)省計算量，在k-1幀中的匹配搜索只在一定范圍內(nèi)進(jìn)行。假設(shè)在τ時間間隔內(nèi)最大可能的水平和垂直位移量為dm個像素，則搜索范圍SR為

SR＝（M+2dm

）*（N+2dm

）1)全搜索:尋找最佳的匹配塊，需要將k-1幀中對應(yīng)的子塊在整個搜索區(qū)內(nèi)沿水平和垂直方向逐個像素移動，每移動一次計算一次判決函數(shù)。總的移動次數(shù)Q為

Q＝（2dm+1）2此種搜索方法運(yùn)算量非常大。2)塊匹配的快速搜索方法：舉例：三步法搜索過程：1）以待匹配塊中心的同位像素為中心，在中心點(diǎn)和與其距離4個像素的8個鄰域上計算判決函數(shù)SAD,取SAD最小的點(diǎn)作為下一步搜索的中心2）以該點(diǎn)為中心，對于中心相距2個像素的未搜索過的鄰域點(diǎn)進(jìn)行搜索3）以上一步中SAD最小的點(diǎn)為中心，對距離中心1個像素的未搜索過的鄰域點(diǎn)進(jìn)行搜索，最終找到最佳匹配位置。幾乎所有的快速搜索算法都基于如下的假設(shè)：當(dāng)偏離最佳匹配位置時，判決函數(shù)（匹配誤差）值是單調(diào)上升的。因此無需搜索所有點(diǎn)，只要沿著誤差值減少的方向進(jìn)行搜索，就能找到最佳匹配位置。保證任何情況下找到全局極值點(diǎn)是困難的。近幾年來人們提出了許多新的快速搜索算法，這些算法的搜索策略概括如下：1）運(yùn)動矢量預(yù)測：根據(jù)圖像內(nèi)容的連續(xù)性，相鄰塊的運(yùn)動矢量一般是相近的。2）搜索提前中止：預(yù)先設(shè)定匹配誤差閾值3）緊湊的搜索圖形3.5.3具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測1.前向預(yù)測概念：不直接傳送當(dāng)前幀的像素值，而傳送當(dāng)前幀（即第k幀）中像素x和前1幀(即k-1幀)的同位像素x’之間的差值，稱為幀間預(yù)測。對隔行掃描的電視信號，也可以用前一場來預(yù)測當(dāng)前場的像素(場間預(yù)測)。當(dāng)圖像中存在著運(yùn)動物體時簡單的預(yù)測不能收到好的效果。

考慮了物體移動的幀間預(yù)測方法稱為具有運(yùn)動補(bǔ)償?shù)膸g預(yù)測?；静襟E：(1)將圖像分割成靜止的背景和若干運(yùn)動的物體，各個物體可能有不同的位移。但構(gòu)成同一物體的所有像素的位移相同。通過運(yùn)動估值得到每個物體的位移矢量；(2)利用位移矢量計算經(jīng)運(yùn)動補(bǔ)償后的預(yù)測值；(3)除了對預(yù)測誤差進(jìn)行編碼、傳送以外，還需要傳送位移矢量以及如何進(jìn)行運(yùn)動物體和靜止背景的分割等方面的附加信息。實際上，將圖像分割成靜止區(qū)域和不同的運(yùn)動區(qū)域非常困難，當(dāng)實時地完成時就更加困難。方法將圖像分割成子塊，每塊看成是一個物體，按塊匹配的方法估計每個子塊的位移矢量，將經(jīng)過位移補(bǔ)償?shù)膸g預(yù)測誤差DFD和位移矢量D傳送給收端，收端就可以按下式從已經(jīng)收到的前1幀信息中恢復(fù)出該子塊：

bk(z)=bk-1(z-D)+DFD(z,D)下圖表示了K幀各塊及它們在k-1幀中對應(yīng)的匹配塊之間的關(guān)系從該塊的預(yù)測誤差和它的位移矢量所指向的k-1幀中的匹配塊，可以恢復(fù)出k幀中的對應(yīng)子塊。注意：當(dāng)子塊中的像素實際上屬于位移量不同的物體時，這種對整個子塊用同一位移量的預(yù)測就不夠準(zhǔn)確．會使預(yù)測誤差增加，從而影響到數(shù)據(jù)壓縮比的提高。2.后向預(yù)測和雙向預(yù)測概念：前向預(yù)測：后向預(yù)測:從后續(xù)的k+1幀圖像預(yù)測前面的k幀圖像雙向預(yù)測:采用前、后兩幀來預(yù)測中間幀討論：預(yù)測誤差越小，傳輸?shù)臄?shù)據(jù)量就越低。雙向預(yù)測所付出的代價是，對每一個子塊需要傳送2個位移矢量給收端，而且k幀的恢復(fù)必須等到接收到k+1幀之后才能進(jìn)行。即：編碼、解碼運(yùn)算的幀順序是k-1、k+1、k，而圖像顯示的順序是k-1、k、k+l。要保持處理和顯示的連續(xù)性，編碼端和解碼端就分別需要多引入1幀的延時。3.6正交變換編碼例1：單一頻率的正弦波在時域中：采樣、量化、編碼在頻域中：頻率、波幅、初相角時域上采樣值之間存在非常強(qiáng)的相關(guān)性，數(shù)據(jù)冗余度大，而在變換域上三個參數(shù)相互獨(dú)立，沒有相關(guān)性，描述信號的數(shù)據(jù)量大大減少。將空域圖像信號映射變換到另一個正交矢量空間及變換域，將圖像像素值轉(zhuǎn)變成一組非相關(guān)的系數(shù)，然后對這些系數(shù)進(jìn)行量化和編碼。目的：去除相關(guān)，壓縮數(shù)據(jù)。為信號找到一種最有效的表示方式。例2：由相鄰兩個像素組成的1×2子圖像中，設(shè)每個像素取8個灰度級（3bit量化），下圖中x1軸表示第一個像素可能取的8個灰度值，x2軸表示第二個像素可能取的8個灰度值，由x1,x2組成的二維坐標(biāo)空間中不同坐標(biāo)點(diǎn)對應(yīng)于不同的1×2子圖像。變換后的坐標(biāo)系中，圖像子塊的兩個像素之間的相關(guān)性減弱，能量的分布向x1’集中。3.6正交變換編碼0X1X1’X2’X23.6.1最佳線性正交變換思路：假設(shè)：一個離散信號由N個采樣值組成，則可以認(rèn)為它是一個在N維空間中的一個列向量XT=(x1,x2,…,xn)。為了找到有效的表示方法，可以選取X的一個正交變換，使

Y＝TX（3-53）YT=(y1,y2,…,yn)做變換的目的：要尋找一個變換矩陣T，將經(jīng)上式變換得到的Y用一個由M(M<N)個分量構(gòu)成的子集來近似。當(dāng)刪去Y中剩下的(N-M)個分量，僅用含M個分量的子集來恢復(fù)X時，不會引起明顯的誤差?；蛘哒f：用Y的只有M個分量的子集來代表有N個分量的信號X，從而達(dá)到數(shù)據(jù)壓縮的目的。關(guān)鍵是：尋找變換矩陣T，即：找到最佳正交變換。最佳的判斷標(biāo)準(zhǔn)：使得在恢復(fù)X時所產(chǎn)生的均方誤差最小。設(shè)變換矩陣具有下列形式

TH＝[φ1，φ2，…..，φN](3-54)φi是N維列向量，并且歸一化正交，即：

1（i＝k）

φiH.Φk＝(3-55)0（i<>k）

φi相互正交，故其線性獨(dú)立。以前的知識：N個線性獨(dú)立的向量可以生成一個N維空間，這一組向量稱為該空間的基，其中的每一個φi稱為基向量。由（3-54）和（3-55）知：TTH＝I

所以T的逆矩陣：T-1＝TH（3-56）當(dāng)T為實數(shù)矩陣，且T-1＝TH時，稱T為正交矩陣，對應(yīng)的變換為正交變換。由Y=TX和(3-56)式，得到

X＝THY＝y(tǒng)1φ1+y2φ2+…..+yNφN上式表明將X轉(zhuǎn)換到由基向量φi(i＝1，2，…，N)生成的N維空間(通常稱為變換域)中。yi代表X在φi上投影的大小，稱為變換系數(shù)。因此，由變換系數(shù)所構(gòu)成的向量Y是信號X在變換域中的表示。假設(shè)信號X是一個均值為零的隨機(jī)向量，即<X>=0。若只保留M(M<N)個變換系數(shù),將其余(N-M)個系數(shù)置為零，則所得到的X的近似值XM與原信號的差值ΔX為

ΔX＝X-XM＝其均方誤差MSE為

MSE＝<║ΔX║2>=<ΔXH.ΔX

=3—59）由Y=TX可知：標(biāo)量的轉(zhuǎn)置為其自身，（3-59）可改寫為：當(dāng)<X>=0時，<X.XH>即為X的協(xié)方差矩陣。可以證明得：φiHφi＝1的條件下，使MSE為最小的條件是上式看出φi和λi分別是矩陣的本征向量和本征值。也就是說，以信號的協(xié)方差矩陣的本征向量φi(i＝l，2，…，N)組成的變換矩陣是均方誤差準(zhǔn)則下的最佳變換矩陣，用此矩陣構(gòu)成的最佳變換Y＝TX稱為卡南洛伊夫變換KLT。

經(jīng)KL變換后，Y的協(xié)方差矩陣為（根據(jù)Y＝TX）KL變換解除了隨機(jī)向量X的分量之間的相關(guān)性，在變換域中Y的各分量之間是互不相關(guān)的應(yīng)用的先修知識：A為n階實對稱矩陣，則有正交矩陣P,使P-1AP=上式說明最小均方誤差等于Y向量中被丟棄的分量的方差之和。由此可知，應(yīng)該選擇具有較大方差的M個Y分量所構(gòu)成的子集來恢復(fù)X，以使得恢復(fù)后所產(chǎn)生的誤差最小。缺點(diǎn)：KL變換的基向量與信號的統(tǒng)計特性有關(guān)，變換矩陣不是恒定的，需要臨時計算，同時也缺乏相應(yīng)的快速算法3.6.2離散余弦變換選擇不同的正交基向量，可以得到不同的正交變換。從數(shù)學(xué)上可以證明，各種正交變換都能在不同程度上減小隨機(jī)向量的相關(guān)性。信號經(jīng)過大多數(shù)正交變換后，能量會相對集中在少數(shù)變換系數(shù)上，刪去對信號貢獻(xiàn)較小(方差小)的系數(shù)，只利用保留下來的系數(shù)恢復(fù)信號時，不會引起明顯的失真。因此，不同的正交變換，例如，離散傅氏變換(DFT)，離散余弦變換(DCT)，沃爾什-哈達(dá)馬變換(WHT)等均在數(shù)據(jù)壓縮中得到不同程度的應(yīng)用，只是在均方誤差準(zhǔn)則下，性能不如KLT好。余弦變換是傅立葉變換的一種特殊情況。當(dāng)傅立葉級數(shù)展開式中，被展開的函數(shù)是實偶函數(shù)時，傅立葉級數(shù)中只包含余弦項。余弦變換的名字由來，或稱之為離散余弦變換。離散余弦變換在數(shù)字圖像數(shù)據(jù)壓縮編碼技術(shù)中，可與最佳變換K-L變換媲美。因為DCT與K-L變換壓縮性能和誤差相接近，而DCT計算復(fù)雜度適中．又具有可分離特性．還有快速算法等特點(diǎn)，所以近年來在圖像數(shù)據(jù)壓縮中，采用離散余弦變換編碼的方案很多，特別是20世紀(jì)90年代迅速崛起的計算機(jī)多媒體技術(shù)當(dāng)中JPEG、MPEG、R.261等壓縮標(biāo)準(zhǔn)。都用到離散余弦變換編碼進(jìn)行數(shù)據(jù)壓縮。一維的DCT正變換和反變換DCT變換的核函數(shù)一維8個像素時對應(yīng)的基函數(shù)數(shù)據(jù)由一維DCT可以直接擴(kuò)展到二維，即u由此可以看出：DCT將能量集中于頻率平面的左上角DCT變換后信號能量主要集中于左上角4×4二維DCT的基圖像N=8時的變換矩陣T課后14題b圖對應(yīng)的圖像塊A：以下代碼產(chǎn)生變換矩陣jihanshujuzhen,并按矩陣運(yùn)算進(jìn)行DCT變換，最后將變換結(jié)果與Matlab中的二維DCT變換函數(shù)DCT2（）進(jìn)行比較在以變換系數(shù)F(u,v)作加權(quán)的情況下，由正交變換的基圖像的組合，可以重新得到原始圖像基于DFT的快速DCT算法

(3-75)為了進(jìn)一步簡化上述關(guān)系，注意到，由于上式右端是實數(shù)，因此左端也應(yīng)為實數(shù)。用An和Bn分別表示F(n)的實數(shù)和虛數(shù)部分，則有令上式的虛部為零則

將Bn代入(3-88)得到

(3-76)(3-76)(3-78)代入(3-75)得結(jié)論；一個函數(shù)的DCT系數(shù)可以由該函數(shù)對應(yīng)的偶函數(shù)的DFT系數(shù)的實部得到。

(3-78)討論:(1)先前知識，二維信號的傅氏變換的系數(shù)代表它所對應(yīng)的空間頻率分量的復(fù)振幅。(3-79)式表明，雖然DCT系數(shù)并不與空間頻率分量的復(fù)振幅嚴(yán)格相等，但有一定的對應(yīng)關(guān)系。特別是n＝0時的DCT系數(shù)與DFT的零頻分量一樣，代表空間域內(nèi)信號的均值；(2)一個函數(shù)的DCT系數(shù)可以通過與該函數(shù)對應(yīng)的偶函數(shù)的DFT系數(shù)得到。由于偶函數(shù)的對稱性減小了DFT中由于周期延拓而產(chǎn)生的空間域中邊緣的不連續(xù)性，從而使能量在頻率域內(nèi)更為集中。因此在數(shù)據(jù)壓縮應(yīng)用中．DCT比DFT具有更好的性能.3.4取樣頻率的轉(zhuǎn)換幾個概念

a抽取(下取樣）由高取樣率的樣值去推算低取樣率樣點(diǎn)上的數(shù)值的技術(shù)

b內(nèi)插（上取樣）由低取樣率的樣值去估計在原來較高頻率的取樣點(diǎn)上的樣值，這種技術(shù)稱為內(nèi)插。應(yīng)用：1）通過取樣頻率的轉(zhuǎn)換，可以使傳送數(shù)據(jù)量增多或減少，實現(xiàn)傳送圖像高低分辨率的轉(zhuǎn)換。2）當(dāng)需要將數(shù)字信號與一些特殊系統(tǒng)的時鐘同步時，可能需要進(jìn)行采樣率的轉(zhuǎn)換；3）一個數(shù)字電話系統(tǒng)，通過該系統(tǒng)傳輸?shù)募扔姓Z音信號，也有傳真（FAX）信號，甚至有視頻信號，這些信號的頻率成分相差甚遠(yuǎn)。因此，該系統(tǒng)應(yīng)具有多種抽樣頻率并自動地完成采樣率的轉(zhuǎn)換3.4.1下取樣(亞取樣）取樣頻率f1略高于奈氏頻率；用f2＝f1/n(f2小于奈氏頻率)作為取樣頻率直接對源信號抽樣，發(fā)生頻譜混疊情形。

取樣頻率為f1/2時發(fā)生頻譜混疊部分

為避免混疊失真，可先用一個低通濾波器將圖(a)所示的頻譜的基帶部分取出，恢復(fù)出原來的模擬信號，然后用另一低通濾波器將此模擬信號的頻帶限制到f2／2，再重新取樣，便可得到取樣頻率為f2的樣值。含義：將信號x(n)作M倍的抽取后得到的y(n)頻譜等于原信號的頻譜先做M倍的擴(kuò)展，再在w軸上作2πk的移位，幅度降為原來的1/M后再疊加以下2頁為證明過程利用周期序列的離散傅里葉級數(shù)DFS反變換：3.4.2上取樣線性內(nèi)插是一種廣泛的內(nèi)插方法，它利用兩相鄰樣值得加權(quán)和內(nèi)插出二者之間任意位置上的數(shù)值，每個樣值與該值到內(nèi)插位置的距離成反比。3.7子帶編碼3.7.1子帶編碼工作原理在子帶編碼中，如圖3-24所示.首先用一組帶通濾波器將輸入信號分成若干個在不同頻段上的子帶信號;然后將這些子帶信號經(jīng)過頻率搬移轉(zhuǎn)變成基帶信號，再對它們在奈氏頻率上分別取樣。取樣后的信號經(jīng)過量化、編碼，并合成成一個總的碼流傳送給接收端。在接收端，首先把碼流分成與原來的各子帶信號相對應(yīng)的子帶碼流，然后解碼、將頻譜搬移至原來的位置，最后經(jīng)帶通濾波、相加得到重建的信號。在子帶編碼中，若各子帶的帶寬△Wk是相同的，則稱為等帶寬子帶編碼；若△Wk是互不相同的，則稱為變帶寬子帶編碼。

子帶編碼的壓縮數(shù)據(jù)的原因和優(yōu)點(diǎn)：

(1)可以利用人耳(或人眼)對不同頻率信號的感知靈敏度不同的特性，在人的聽覺(或視覺)不敏感的頻段采用較租糙的量化，從而達(dá)到數(shù)據(jù)壓縮的目的；

(2)各子帶的量化噪聲都束縛在本子帶內(nèi)，這就可以避免能量較小的頻帶內(nèi)的信號被其它頻段中的量化噪聲所掩蓋。子帶編碼的關(guān)鍵部件討論：帶通濾波器組是子帶編碼的重要部件，它影響到子帶編碼的復(fù)雜程度和性能。問題1，注意到，如果各子帶的下截止頻率f1k恰好是該子帶寬度的整數(shù)倍，即

f1k＝n△Wk（k＝1，2…，M）（3-92）(其中n是一非負(fù)整數(shù)，M為子帶的個數(shù))，則可以不必將帶通信號搬移到基帶上，就直接以取樣頻率fsk＝2△Wk對子帶信號取樣，而不會產(chǎn)生混疊失真。滿足上式條件的子帶濾波器組稱為整數(shù)子帶濾波器組。以M＝4的變帶寬子帶為例：圖3-25給出了第3個子帶的取樣過程。圖中(a)是輸入信號的頻譜；(b)是第3個子帶信號的頻譜，其下截止頻率f13＝2△W3；(c)是以fs3＝2△W3的頻率對(b)取樣后，所得到的信號的頻譜。采用整數(shù)子帶濾波器組的優(yōu)點(diǎn)：采用整數(shù)于帶濾波器組省去了進(jìn)行頻譜搬移所需要的調(diào)制器和解調(diào)器，使系統(tǒng)得以簡化。輸入信號的總帶寬W，按下式計算：例子：下圖給出使用抽取和內(nèi)插的且M＝2的子帶編碼和解碼的原理方框圖。此時，系統(tǒng)的輸入和輸出看成是已在奈氏頻率下取樣的離散信號，圖(b)給出了它對應(yīng)的頻譜。假設(shè)用帶通濾波器取出圖(b)中斜線所示的上子帶．經(jīng)2：1抽取后的上子帶的頻譜如圖(c)所示。在接收端，再用1：2的內(nèi)插器，將頻譜恢復(fù)到原來的位置。在采用整數(shù)子帶濾波器的系統(tǒng)中，總的傳輸速率I為式中，Rk為第K個子帶中每個樣值量化的比特數(shù)。問題2，濾波器的具體實現(xiàn)不可能是理想的帶通，其幅度響應(yīng)不可避免地帶有有限的滾降。因此在劃分子帶時，有兩種情況：a子帶間有交疊，如圖所示；b：子帶之間有一定的間隙，如圖(b)所示。在(a)的情況下．按奈氏頻率取樣將會產(chǎn)生混疊失真；在(b)的情況下，由于原有信號的部分頻帶經(jīng)濾波而損失掉了．重建的信號會有失真，例如以話音為例，重建的語音會產(chǎn)生混響的主觀感覺。解決方法：正交鏡像濾波器比較好地解決了混疊失真的問題，從而降低了對濾波器滾降特性的要求，簡化了濾波器的復(fù)雜性，成為子帶編碼中最常采用的形式。3.9.5預(yù)測誤差和DCT系數(shù)的量化預(yù)測誤差通常近似地遵從圖3-33(a)所示的拉普拉斯分布。已知概率分布，即可設(shè)計量化器。用量化后的預(yù)測誤差重建原來的信號將引入失真，典型的失真情況如圖3-41所示。顆粒噪聲；邊緣忙亂；斜率過載。預(yù)測誤差的量化誤差特點(diǎn)：只引起周圍鄰近區(qū)域內(nèi)(局部)圖像的失真。斜率過載：在信號上升沿較陡峭時，預(yù)測誤差幅度很大，即使使用最大的量化值也無法表示出他的變化。表現(xiàn)為：圖像輪廓變模糊顆粒噪聲：在信號較為平坦區(qū)，信號微小的變化使量化后的預(yù)測誤差在量化器的兩個最小電平之間波動，造成重建信號的顆粒噪聲表現(xiàn)為：圖像在平坦區(qū)出現(xiàn)顆粒狀的細(xì)斑邊緣忙亂：由于原始圖像中存在噪聲，造成不同圖像幀之間在同一像素位置產(chǎn)生的量化噪聲不同，從而引起緩慢變化的邊緣出現(xiàn)不確定的現(xiàn)象。表現(xiàn)為：在變化不快的邊緣出現(xiàn)閃爍不定現(xiàn)象DCT系數(shù)的量化預(yù)測誤差的量化誤差只引起周圍鄰近區(qū)域內(nèi)(局部)圖像的失真，而一個DCT系數(shù)的量化誤差卻對產(chǎn)生此系效的整塊(全局)圖像的質(zhì)量產(chǎn)生影響?？紤]到圖像特性的不均勻性，通常將一幅圖像劃分成8X8，或16X16的小塊，再對塊圖像進(jìn)行變換。在圖像分塊做DCT時，直流(DC)分量的量化誤差將擴(kuò)大塊與塊之間灰度均值的差異，從而在重建圖像上顯現(xiàn)出明顯的分塊結(jié)構(gòu)，稱之為塊效應(yīng)。DCT的高頻系數(shù)在其幅度相當(dāng)小時，將被“裁斷“(即量化到零)。高頻系數(shù)的量化誤差(包括因截斷而產(chǎn)生的誤差)，將降低圖像的分辨率，使細(xì)節(jié)模糊，結(jié)果：在亮度突變的附近產(chǎn)生亮暗相間的條紋，在彩色突變處產(chǎn)生顏色的泄漏等。在活動圖像序列中，這些失真還可能造成原來被運(yùn)動物體遮擋而新暴露出來的背景處的圖像出現(xiàn)臟痕。DCT變換后，系數(shù)之間的相關(guān)性已經(jīng)很小，可以用各自獨(dú)立的量化器分別進(jìn)行量化。對變換系數(shù)量化的處理辦法一般分為兩種：分帶編碼和閾值編碼。分帶編碼方法是將變換系數(shù)分成幾個頻帶，每個頻帶根據(jù)所需量化的信號的統(tǒng)計特性，預(yù)先設(shè)定其量化的比特數(shù)，方差大的系數(shù)，給予較多的比特數(shù)值。由于各系數(shù)量化的比特數(shù)是固定的，所以該方法適于處理具有相同統(tǒng)計特性的圖象，例如：衛(wèi)星拍攝的地面照片。閾值編碼適合：對于統(tǒng)計特性差異較大的圖像，例如一般電視圖像。步驟：先設(shè)定一個(或一組)閾值，只對幅值大于、或等于閾值的系數(shù)進(jìn)行量化，小于閾值的則被截斷。優(yōu)點(diǎn):

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

河北科技大學(xué)多媒體通信技術(shù)基礎(chǔ)第三章

文檔簡介

溫馨提示

最新文檔

評論

河北科技大學(xué)多媒體通信技術(shù)基礎(chǔ)第三章

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔