多媒體數(shù)據(jù)壓縮編碼技術(shù)

上傳人：s*** IP屬地：廣東上傳時間：2025-05-28 格式：PPTX 頁數(shù)：118 大?。?.94MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩113頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多媒體數(shù)據(jù)壓縮編碼技術(shù)2多媒體數(shù)據(jù)壓縮編碼概述重要性、可能性、分類脈沖編碼調(diào)制統(tǒng)計編碼：編碼、算術(shù)編碼預(yù)測編碼：、、幀間預(yù)測變換編碼多媒體數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn)、3第一節(jié)數(shù)據(jù)壓縮編碼概述1.1多媒體數(shù)據(jù)壓縮編碼的重要性1.2多媒體數(shù)據(jù)壓縮編碼的可能性1.3多媒體數(shù)據(jù)壓縮編碼的分類41.1數(shù)據(jù)壓縮編碼的重要性在多媒體技術(shù)中，處理的多媒體數(shù)據(jù)都應(yīng)是數(shù)字信號，傳統(tǒng)的媒體信息需要進(jìn)行采樣和量化后方能在計算機(jī)中處理。ADC放大器5原始媒體信息數(shù)字化后的數(shù)據(jù)量巨大。例1：一頁B5（180×255）大小的文件，以中等分辨率300、8位色方式掃描，其數(shù)據(jù)量為6.61。保存一部《鹿鼎記》（1813頁）需要11983.93M（650M的得刻19張）。6例2：立體聲的激光唱盤，采樣頻率為44.1，量化位數(shù)為16，則一秒鐘的音頻數(shù)據(jù)量就可達(dá)172。650M的只可存儲1小時音樂。ADC7對于視頻，數(shù)據(jù)量的問題則更加突出。例3：采用制式，采樣格式為4:4:4，24位色，則一秒鐘的視頻數(shù)據(jù)量就可達(dá)31.3。電影《龍騎士》（時長100分鐘）需要約289張650M的存放。采集卡8由于多媒體信息的數(shù)據(jù)量十分龐大，給存儲器的存儲容量、通信線路的帶寬資源、傳輸速率以及計算機(jī)的處理速度都增加了極大壓力。解決方法：從硬件設(shè)備入手：增加存儲器、帶寬資源；研究新型線纜提高傳輸效率；使用快速的高檔計算機(jī)……從信息內(nèi)容入手：進(jìn)行數(shù)據(jù)壓縮編碼?！镜慕鉀Q之道9數(shù)據(jù)壓縮對多媒體應(yīng)用的意義通過數(shù)據(jù)壓縮技術(shù)可減少多媒體信息的數(shù)據(jù)量，其意義在于：提高了傳輸效率節(jié)約了存儲空間使計算機(jī)能夠?qū)崟r處理多媒體信息加快了處理速度101.2數(shù)據(jù)壓縮編碼的可能性多媒體數(shù)據(jù)能否進(jìn)行壓縮？研究表明，多媒體信息中存在大量的冗余，去掉這些冗余數(shù)據(jù)便可實現(xiàn)數(shù)據(jù)的壓縮。冗余數(shù)據(jù)可用信息原始的多媒體數(shù)據(jù)11音頻中的冗余音頻中的冗余信息主要有：時域冗余幅度的非均勻分布；樣本間的相關(guān)性；周期之間的相關(guān)性；基音之間的相關(guān)性；靜止系數(shù)（間隔）；長時自相關(guān)函數(shù)。頻域冗余非均勻的長時功率譜密度；語音特有的短時功率譜密度。人耳的聽感覺分辨能力有限。12圖像/視頻中的冗余圖像/視頻信息中包含有大量的冗余，主要有下列不同類型的冗余信息：空間冗余時間冗余結(jié)構(gòu)冗余知識冗余視覺冗余圖像區(qū)域的相同性冗余紋理的統(tǒng)計冗余13a.空間冗余空間冗余是靜態(tài)圖像中最主要的一種冗余。通常的圖像都描述了某個場景，其相鄰像素點之間存在一定的空間連貫性。如果編碼時不考慮這一相關(guān)性，就會造成空間冗余。左邊的圖像顯示了一個規(guī)則物體，其大量像素點的亮度、飽和度、色調(diào)等參數(shù)都一樣。

14b.時間冗余時間冗余是視頻中常見的一種冗余。序列圖像中，相鄰幀往往包含有相同的背景和運(yùn)動物體，只是運(yùn)動物體的位置有所變化，因此相鄰兩幀的數(shù)據(jù)差別很小，具有時間上的連貫性。如果編碼時不考慮這一相關(guān)性，就會造成時間冗余。15c.結(jié)構(gòu)冗余有些圖像中有規(guī)則紋理，其像素值存在明顯的分布模式，只要知道分布模式，便可通過某種方法生成圖像，這種數(shù)據(jù)冗余即結(jié)構(gòu)冗余。規(guī)則的紋理圖像16d.知識冗余對圖像的理解有時與某些知識有相當(dāng)大的相關(guān)性，例如人臉的圖像就具有同樣的五官位置?？梢愿鶕?jù)已有的知識構(gòu)造基本模型，并創(chuàng)建特征圖像庫，則只需提供少量的特征參數(shù)信息便可生成圖像，這種數(shù)據(jù)冗余即知識冗余。17e.視覺冗余視覺冗余是針對人眼的視覺特性而言的。人對圖像的敏感性是非均勻、非線性的，而一般的編碼卻是線性方式，因此存在視覺冗余。視覺系統(tǒng)對亮度比對色度敏感。視覺系統(tǒng)對低頻信號比對高頻信號敏感。視覺系統(tǒng)對靜止圖像比對運(yùn)動圖像敏感。視覺系統(tǒng)對水平、垂直線條比對斜線條敏感。隨著亮度的增加，視覺系統(tǒng)對量化誤差的敏感度降低。（高光區(qū)可用較少的量化位數(shù)）視覺系統(tǒng)把圖像的邊緣和非邊緣區(qū)域分開處理。視覺系統(tǒng)總是把視網(wǎng)膜上的圖像分解成若干個空間有向的頻率通道后，再做進(jìn)一步處理。18f.圖像區(qū)域的相同性冗余有的圖像存在一些相同或相近的區(qū)域，從而產(chǎn)生數(shù)據(jù)的重復(fù)性存儲，這就是圖像區(qū)域的相同性冗余?？梢灾挥涗浺粋€區(qū)域中各個像素的值，與其相同或相近的區(qū)域則不必記錄。向量量化方法就是針對這種冗余進(jìn)行數(shù)據(jù)壓縮的。19g.紋理的統(tǒng)計冗余有些紋理并不嚴(yán)格服從某一分布規(guī)律，但它在統(tǒng)計意義上又符合該規(guī)律，這種數(shù)據(jù)冗余即紋理的統(tǒng)計冗余。孔雀羽毛的紋理分布201.3數(shù)據(jù)壓縮編碼的分類21多媒體數(shù)據(jù)壓縮編碼方法有很多種，根據(jù)不同的依據(jù)可產(chǎn)生不同的分類：按照編碼算法的原理：分成脈沖編碼調(diào)制、預(yù)測編碼、變換編碼、量化與向量量化編碼、統(tǒng)計編碼、子帶編碼、結(jié)構(gòu)編碼、模型編碼、混合編碼等等；根據(jù)質(zhì)量有無失真：分成有損失編碼和無損失編碼；按照其作用域在空間或頻率上：分成空間方法、變換方法和混合方法；根據(jù)是否自適應(yīng)：分成自適應(yīng)性編碼和非適應(yīng)性編碼。22無損編碼和有損編碼實際上，信息進(jìn)行數(shù)字化時，量化誤差是不可避免的。此處的“無損”和“有損”是針對編碼過程而言的。無損編碼：也稱冗余壓縮法。將編碼后的數(shù)據(jù)進(jìn)行解碼，所得數(shù)據(jù)和編碼前的原始數(shù)據(jù)嚴(yán)格一致，壓縮比約為2:1~5:1，常用的算法有：編碼、算術(shù)編碼、行程編碼、詞典編碼等。有損編碼：也稱熵壓縮法。解碼得到的還原數(shù)據(jù)與原始數(shù)據(jù)之間存在一定的誤差，但并不影響人對原始資料表達(dá)信息的理解，壓縮比從幾倍到上百倍。2324壓縮軟件實際上就是使用上述這些算法進(jìn)行壓縮的。25衡量編碼方法優(yōu)劣的指標(biāo)衡量壓縮編碼方法優(yōu)劣的重要指標(biāo)有：壓縮比要高；壓縮與解壓的速度快；算法簡單，適合于硬件實現(xiàn)；解壓縮后還原信息的質(zhì)量高。26第二節(jié)脈沖編碼調(diào)制脈沖編碼調(diào)制：，即將連續(xù)模擬信號數(shù)字化，包括采樣、量化/編碼。模擬量經(jīng)過轉(zhuǎn)換，得到二進(jìn)制碼的過程，也稱編碼。其它的編碼方法都是

在模擬信號經(jīng)過

編碼后再進(jìn)行的壓縮

編碼方法。27編碼過程28第三節(jié)統(tǒng)計編碼數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論，根據(jù)信息論的原理，可以找到最佳的數(shù)據(jù)壓縮編碼方法。數(shù)據(jù)壓縮的理論極限是信息熵，統(tǒng)計編碼就是利用了信息熵原理，因此也稱作信息熵編碼、熵保存編碼或熵編碼。統(tǒng)計編碼是一種無損的壓縮方法，如香農(nóng)編碼、編碼、算術(shù)編碼等。293.1統(tǒng)計編碼的原理

——信息量和信息熵熵是信息論中的概念，是信息量的度量方法。要理解什么是“信息熵”，先得了解信息、信息量的含義。什么是“熵”？30下面以信源編碼模型來說明。編碼器信源（消息集）編碼輸出集X={x1,…,xn}Z={z1,…,zn}符號集Am={a1,…,am}X為消息集，由n個信號單元構(gòu)成Z為輸出集，由n個碼字構(gòu)成，與一一對應(yīng)。是符號集，由m個碼元構(gòu)成，符號集中間的碼元組成輸出碼字。31當(dāng)信源發(fā)出某個隨機(jī)事件（消息）后，接收端收到一個相應(yīng)的碼字。那么，接收到的這個碼字中包含了多少有用的信息呢？信息是用不確定性的量度定義的。消息出現(xiàn)的可能性愈小，則其帶給人們的信息就愈多；反之，消息出現(xiàn)的可能性愈大，則它能給人們提供的新信息（有用信息）就愈少。在數(shù)學(xué)上，一條消息所傳輸?shù)男畔⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。32信息量信息量：從N個可能事件中選出一個事件所需要的信息度量或含量。對于計算機(jī)的二進(jìn)制編碼，可以這么理解：從N個事件中辨別出一個特定事件，最少需要回答多少次“”疑問。事實上，每次提問都會得到一個“”的答復(fù)，可以用0或1表示，即1，如果提問n次，則信息量為。33示例例一：從1～64的整數(shù)中選出一個數(shù)。可先提問“是否大于32?”，以消除半數(shù)的可能，然后再進(jìn)行半數(shù)的詢問，這樣只需6次便可確定一個數(shù)，其信息量為6。例二：如果只要辨別某個數(shù)是否大于32，則只需詢問一次便可得出結(jié)論，其信息量只有1。從上兩例中可看出，大于或者小于32，這種情況的概率比具體等于某一個數(shù)的概率要大，但其信息量反而?。▎握{(diào)下降）。34信息量的數(shù)學(xué)表述信息論定義了一種度量信息量的方法：其中：I()是信源X發(fā)出后，接收端接收到的信息量的量度。P()是信源X發(fā)出的先驗概率，有：請用上述公式求例一的信息量。35信息熵如果將信源所有可能事件的信息量進(jìn)行統(tǒng)計平均（即求其數(shù)學(xué)期望），就得到了信息熵。信源X發(fā)出的（1,2,…），出現(xiàn)的概率為P()，則信源X的熵為：36示例假設(shè)一幅由40個像素組成的灰度圖像，共有5級灰度，每一級灰度都是一種信源發(fā)出的符號，分別用表示。40個像素中有15個灰度為A，7個灰度為B，7個灰度為C，6個灰度為D，5個灰度為E。試求該灰度圖像的熵。37∴該灰度圖像的熵為2.196。38統(tǒng)計編碼的目的統(tǒng)計編碼就根據(jù)信源信號出現(xiàn)概率的分布特性進(jìn)行壓縮的。統(tǒng)計編碼的目的：在信源符號和碼字之間建立明確的一一對應(yīng)關(guān)系；編碼過程中不丟失信息量（即信息熵的大小不變），以便在恢復(fù)時能準(zhǔn)確地再現(xiàn)原信號，實現(xiàn)無損壓縮；平均碼長或碼率應(yīng)盡量小。39熵和平均碼長可用熵來衡量該編碼是否為最佳編碼：當(dāng)，有冗余，不是最佳；當(dāng)，不可能出現(xiàn)；當(dāng)，是最佳編碼（稍大于）其中表示編碼器輸出碼字的平均碼長?？梢?，熵值是平均碼長的下限。403.2編碼最佳編碼定理：在變字長碼中，對于出現(xiàn)概率大的信息符號編以短字長的碼，對于出現(xiàn)概率小的信息符號編以長字長的碼。如果碼字長度嚴(yán)格按照符號概率的大小的相反順序排列，則平均碼字長度一定小于按任何其他符號順序排列方式得到的碼字長度。編碼：利用了最佳編碼定理，是最常用的一種統(tǒng)計編碼。41編碼方法先把信源符號按概率大小順序排列，并設(shè)法按逆次序分配碼字長度。

對于出現(xiàn)頻率大的符號用較少的位數(shù)來表示；對于出現(xiàn)頻率小的符號用較多的位數(shù)來表示。編碼方法采用的碼字長度是可變的，因此較難在壓縮編碼后的文件中進(jìn)行內(nèi)容的查找。42編碼的思路把信源符號按概率大小順序排列，并設(shè)法按逆次序分配碼字的長度。在分配碼字長度時，首先將出現(xiàn)概率最小的兩個符號的概率相加合成一個概率。把這個合成概率看成是一個新組合符號地概率，重復(fù)上述做法直到最后只剩下兩個符號概率為止。完成以上概率順序排列后，再反過來逐步向前進(jìn)行編碼，每一次有二個分支各賦予一個二進(jìn)制碼，可以對概率大的賦為0，概率小的賦為1。43編碼的步驟對每個信息符號進(jìn)行概率統(tǒng)計；將信源符號按概率的遞減順序排列；將最后的兩個小概率相加作為新符號的概率，此時概率個數(shù)將減少一個；重復(fù)第2、3步，直到只剩兩個概率；將概率大的賦“0”，概率小的賦“1”；逆順序往信源符號推，不是合并的編碼不變，如果是合并的，則在編碼后面按照第5步的方法添加0或1。44編碼實例信源X有7個信息符號，其概率為：請對其進(jìn)行編碼，寫出其碼樹、碼長，并計算平均碼長和熵。Ｘ1Ｘ2Ｘ3Ｘ4Ｘ5Ｘ6Ｘ70.350.200.150.100.100.060.0445信息符號概率第1步第2步第3步第4步第5步Ｘ10.350.350.350.350.400.60Ｘ20.200.200.200.250.350.40Ｘ30.150.150.200.200.25Ｘ40.100.100.150.20Ｘ50.100.100.10Ｘ60.060.10Ｘ70.04011000100011011001011010011001001001111011100100100111101110111146碼字的平均碼長為：熵為：47編碼小結(jié)平均碼長大于熵，小于等長碼的碼長。編碼能保證解碼的唯一性，短碼字不會是長碼字的前綴。編碼沒有錯誤保護(hù)功能。使用編碼時，接收端需保存一個與發(fā)送端完全相同的碼表。編碼在信源符號出現(xiàn)概率分布不均勻時編碼效率較高，若概率分別均勻時一般不采用編碼。編碼的壓縮比取決于信源符號出現(xiàn)的概率，越集中則壓縮比越高。483.3算術(shù)編碼20世紀(jì)60年代初，首次提出了算術(shù)編碼的概念。1976年，發(fā)展了算術(shù)編碼的實用技術(shù)。算術(shù)編碼方法比編碼復(fù)雜，但它不需要接收端保存一份碼表，且具有自適應(yīng)能力。算術(shù)編碼是目前實現(xiàn)高效壓縮數(shù)據(jù)中很有前途的編碼方法。49基本原理和編碼步驟算術(shù)編碼實際上是用一個浮點數(shù)代替一個輸入流中的符號。將實數(shù)半開區(qū)間[0,1)進(jìn)行分割，每一符號對應(yīng)[0,1)上的一個子區(qū)間，區(qū)間長度為該符號出現(xiàn)的概率；把要編碼的整段消息映射到[0,1)，根據(jù)這段消息符號的順序確定新的實數(shù)子區(qū)間；最終得到一個[0,1)上的子區(qū)間，從中任選一個實數(shù)，該實數(shù)就是對整段數(shù)據(jù)進(jìn)行編碼后的輸出代碼。50例：輸入“”，最后得到的子區(qū)間為[0.23,0.236)，取該區(qū)間的任一個數(shù)（一般取最小的值），如0.230即為””的編碼。51在算術(shù)編碼中，一段消息是用0到1之間的一個實數(shù)來編碼表示的。算術(shù)編碼方法用到了兩個基本的參數(shù)：信源符號的概率和編碼間隔。信源符號的概率決定了壓縮編碼的效率，也決定了編碼過程中的間隔。編碼間隔最終決定了符號編碼后的輸出。需要編碼的信息越長，則表示它的編碼間隔就越小，實數(shù)的小數(shù)位就越多。52編碼實例假設(shè)信源符號有4個(00,01,10,11)，其概率分別為(0.1,0.4,0.2,0.3)。根據(jù)概率把間隔[0,1)分成4個子間隔：[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)。消息序列的輸入為：100011001011015354二進(jìn)制的算術(shù)編碼計算機(jī)中任何消息都是由0、1組合而成的，可以理解為信源符號只有0和1。即：每次分割區(qū)間時，只要分成兩個子區(qū)間，一個對應(yīng)0，一個對應(yīng)1。例：已知二進(jìn)制符號中0出現(xiàn)的概率為0.25，1出現(xiàn)的概率為0.75，試對輸入流1011進(jìn)行算術(shù)編碼。55設(shè)C為子區(qū)間的左端起始位置，L為子區(qū)間的長度，則對于符號“0”，0，0.25；對于符號“1”，0.25，0.75。算術(shù)編碼步驟如下：步驟輸入符號 C L110.250.75200.250.75*0.25

=0.1875310.25+0.1875*0.250.1875*0.75 =0.296875 =0.14062541 0.296875+ 0.140625*0.75 0.140625*0.25 =0.10546875 =0.3320312556當(dāng)4個字符輸入完后，最終得到的子區(qū)間左端起始位置為0.33203125，終止位置為0.4375。換算成二進(jìn)制為：(0.33203125)(0.01010101)b(0.4375)(0.0111)b在0.01010101和0.0111之間取一個數(shù)，要求其二進(jìn)制形式的長度最短，如本例中取0.011，則該串輸入“1011”最終可編碼成011，數(shù)據(jù)量有所減少。57幾個問題由于計算機(jī)的精度有限，算術(shù)編碼的計算過程中容易發(fā)生溢出，可以采用限制小數(shù)位數(shù)的方法來解決。算術(shù)編碼器對消息只產(chǎn)生一個碼字（在區(qū)間[0,1)中的一個實數(shù)），譯碼器在接收到表示這個實數(shù)的所有位之前不能進(jìn)行譯碼。算術(shù)編碼對錯誤很敏感，如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。58自適應(yīng)能力事實上，由于人們事先無法知道精確的信源概率，因此編碼算法最好具有自適應(yīng)能力，解決這一問題最有效的方法是在編碼過程中進(jìn)行估算（動態(tài)建模）。算術(shù)編碼可以是靜態(tài)的，也可以是具有自適應(yīng)能力的動態(tài)編碼。在靜態(tài)算術(shù)編碼中，信源符號的概率是固定的。在自適應(yīng)算術(shù)編碼中，將根據(jù)編碼時符號出現(xiàn)的頻繁程度動態(tài)地修改信源符號的概率。動態(tài)建模是確定編碼器壓縮效率的關(guān)鍵。59算術(shù)編碼小結(jié)不必預(yù)先定義概率模型，具有自適應(yīng)能力，可根據(jù)當(dāng)前接收的數(shù)據(jù)不斷更改概率模型。若信源符號的概率值都很接近時，不宜使用編碼，建議使用算術(shù)編碼。算術(shù)編碼的實現(xiàn)較編碼更復(fù)雜，但對多幅圖像進(jìn)行測試的結(jié)果表明，算術(shù)編碼較編碼提高了5%左右的壓縮率，擴(kuò)展系統(tǒng)中采用的就是算術(shù)編碼。603.4游程編碼：，游程編碼，也稱行程編碼。用編碼方法得到的代碼為： 80315084180613.5詞典編碼詞典編碼是根據(jù)數(shù)據(jù)本身包含有重復(fù)內(nèi)容這一特性進(jìn)行壓縮的。詞典編碼是無損的。常見的詞典編碼算法有：77算法、78算法、算法等。62指針式詞典如77算法、算法、78算法。63索引式詞典如算法64第四節(jié)預(yù)測編碼預(yù)測編碼：先利用以往的樣本值對新樣本進(jìn)行預(yù)測，再將新樣本的實際值和預(yù)測值相減得到一個誤差值，最后對該誤差值進(jìn)行量化編碼傳送。如果樣本的時間或空間相關(guān)性較強(qiáng)，則誤差值的變化范圍將遠(yuǎn)遠(yuǎn)小于原始信號的變化范圍，量化等級可大量減少，從而實現(xiàn)數(shù)據(jù)壓縮。65預(yù)測編碼主要是利用數(shù)據(jù)在時間或空間上的相關(guān)性來進(jìn)行預(yù)測的，廣泛適用于音頻、圖像、視頻等媒體的編解碼。對于音頻，主要利用時間上的相關(guān)性，采用時間上的前幾個采樣值來做預(yù)測。對于靜止圖像，主要利用空間上的相關(guān)性，如同一行上的前幾個采樣值，甚至可以是前幾行上的像素。對于視頻，不僅可以利用時間上的相關(guān)性（幀間預(yù)測），還可以利用空間上的相關(guān)性（幀內(nèi)預(yù)測）。66674.1模擬信號進(jìn)行采樣量化后，如果直接使用編碼，則數(shù)據(jù)量將很大，此時可以使用預(yù)測編碼的思想來進(jìn)行二進(jìn)制編碼，常用的方法有線性預(yù)測和非線性預(yù)測。：差分(值)脈沖編碼調(diào)制，是線性預(yù)測方法。編碼器記錄與傳送的不是樣本的真實值，而是它與預(yù)測值的差。68的基本原理轉(zhuǎn)入f(i,j)e(i,j)量化器預(yù)測器預(yù)測器編碼器解碼器信道傳輸e’(i,j)f’(i,j)輸出f(i,j)f(i,j)f(i,j)f(i,j)發(fā)送端接收端e’(i,j)694.2：自適應(yīng)差分脈沖編碼調(diào)制。在中，預(yù)測器的預(yù)測系數(shù)和量化器的量化參數(shù)，都能夠根據(jù)原數(shù)據(jù)的區(qū)域分布特點自動調(diào)整，具有自適應(yīng)能力。自適應(yīng)預(yù)測：增加一個預(yù)測參數(shù)，該參數(shù)可根據(jù)預(yù)測值的大小自適應(yīng)調(diào)整；自適應(yīng)量化：量化階距的大小可自適應(yīng)調(diào)整。實踐證明，與相比，壓縮比更高，解碼后的質(zhì)量也更好。704.3幀間預(yù)測編碼幀間預(yù)測編碼技術(shù)是專門針對視頻對象的，利用連續(xù)幾幀之間存在的時間相關(guān)性來消除冗余。常見的幀間預(yù)測編碼方法有：條件補(bǔ)充法：若幀間各對應(yīng)像素的差值超過閾值，則傳送；若沒超過閾值則不傳送，接收端使用上一幀相應(yīng)像素值代替。運(yùn)動補(bǔ)償技術(shù)：跟蹤畫面內(nèi)運(yùn)動部分的位移情況，對其加以補(bǔ)償后再進(jìn)行幀間預(yù)測。71第五節(jié)變換編碼變換編碼技術(shù)較成熟，目前廣泛應(yīng)用于圖像、視頻的數(shù)據(jù)壓縮。算法思想：將空間域中的圖像信號映射變換到另一個正交的矢量空間中，產(chǎn)生一批變換系數(shù)，然后對這些變換系數(shù)進(jìn)行編碼。如果變換的新正交空間選擇得好，則可以減少數(shù)據(jù)間的相關(guān)性，從而減少了數(shù)據(jù)的冗余度，達(dá)到數(shù)據(jù)壓縮的目的。72例子有相鄰的兩個采樣值x1和x2，各用3位來表示，即有8種可能取值。考慮到樣值的相關(guān)性，x1和x2同時出現(xiàn)相近幅度的可能性最大，即圖中的直線陰影部分。信源的相關(guān)性越大，陰影部分就越扁平。73若將坐標(biāo)系旋轉(zhuǎn)45度，樣本值x1變換成y1，x2變換成y2。不管y1在0～7的可能等級內(nèi)如何變化，y2始終只在相當(dāng)小的范圍內(nèi)變化?？梢?，旋轉(zhuǎn)后y1和y2的相關(guān)性減小了。74變換編碼的原理圖子塊

1子塊

2子塊

n......正變換濾波量化編碼信道解碼逆變換綜合拼接源圖像（發(fā)送）恢復(fù)圖像（接收）75常用的變換方法常用變換有：沃爾什()變換傅立葉()變換離散正弦()變換離散余弦()變換哈爾()變換斜()變換()變換小波()變換…………76第六節(jié)多媒體數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)6.1靜態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn) ——6.2動態(tài)圖像壓縮編碼的國際標(biāo)準(zhǔn) ——1 ——2 ——4 ——7 ——21776.1標(biāo)準(zhǔn)：，聯(lián)合圖像專家組，于1986年由和聯(lián)合成立。標(biāo)準(zhǔn)即多灰度連續(xù)色調(diào)靜態(tài)圖像壓縮編碼，是適用于多級灰度、連續(xù)色調(diào)、靜態(tài)的數(shù)字圖像壓縮編碼標(biāo)準(zhǔn)。實際上，不僅適用于靜態(tài)圖像，視頻的幀內(nèi)壓縮就可采用編碼。78是一個適用范圍很廣的通用標(biāo)準(zhǔn)，其研發(fā)時的目標(biāo)如下：算法在圖像壓縮率方面應(yīng)接近當(dāng)前科學(xué)水平，圖像的保真度在較寬的壓縮范圍里的評價是“很好”、“優(yōu)秀”到與原圖像“不能區(qū)別”。算法可實際應(yīng)用于任何一類靜態(tài)數(shù)字圖像，對圖像的大小、顏色空間、像素的長寬比、圖像的內(nèi)容、復(fù)雜程度、顏色數(shù)及統(tǒng)計特性等都不加限制。在計算的復(fù)雜程度方面可以調(diào)整，因而可根據(jù)性能和成本要求來選擇用軟件執(zhí)行還是用硬件執(zhí)行。包括四種操作方式：順序編碼、累進(jìn)編碼、無失真編碼和分層編碼。79壓縮算法為了保證通用性，專家組開發(fā)了兩種基本的壓縮算法：基于離散余弦變換的有損壓縮?；诳臻g預(yù)測技術(shù)的無損壓縮。實際上，專家組還研究了一種稱做2000的標(biāo)準(zhǔn)，其采用的壓縮算法為基于小波（）變換的變換編碼。80的組成部分系統(tǒng)可分成三個組成部分：基本系統(tǒng)：是實現(xiàn)離散余弦變換編碼/解碼所需的最小功能集。擴(kuò)展系統(tǒng)：是為了滿足更為廣闊領(lǐng)域的應(yīng)用要求而設(shè)置的。獨(dú)立功能：相對于的基本系統(tǒng)和擴(kuò)展系統(tǒng)來說，使用空間預(yù)測方法的部分稱為獨(dú)立功能。81基于的無損壓縮如圖，預(yù)測器對原始數(shù)據(jù)X進(jìn)行預(yù)測，求得差值后再對差值進(jìn)行無失真的熵編碼。熵編碼器常采用編碼或算術(shù)編碼。82基于的有損壓縮基于預(yù)測編碼的壓縮比僅能達(dá)到2:1，而編碼的壓縮比可高達(dá)10:1～100:1。當(dāng)壓縮比小于40:1時，還原的圖像與原始圖像相比主觀效果幾乎一樣。壓縮效果（比特/像素）質(zhì)量0.25~0.50中～好0.50~0.75好～很好0.75~1.5極好1.2~2.0與原始圖像分不出來8384變換公式8×8的子塊作為變換的輸入。DCT變換使用下式計算：逆變換IDCT使用下式計算：85基于編碼的步驟基于編碼的計算步驟為：分割子塊：通常順序分割成8×8的子塊。對子塊進(jìn)行正向的離散余弦變換。對獲得的系數(shù)進(jìn)行量化處理。將量化后的系數(shù)進(jìn)行Z字形編排。對直流系數(shù)進(jìn)行編碼。對交流系數(shù)進(jìn)行游程編碼。熵編碼。866.2標(biāo)準(zhǔn)：，運(yùn)動圖像專家組，于1988年由與聯(lián)合成立，致力于運(yùn)動圖像及其伴音的編碼標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)包括三個部分：視頻：如、、就是采用這部分標(biāo)準(zhǔn)制作的電子產(chǎn)品。音頻：如3。系統(tǒng)：負(fù)責(zé)視頻和音頻的同步。87最初，專家組的工作項目是3個：1：在1.5傳輸速率下對圖像編碼。2：在l0傳輸速率下對圖像編碼。3：在40傳輸速率下對圖像編碼。l992年，2的適用范圍擴(kuò)大到（高清電視），能支持3的所有功能，于是便取消了3。到目前為止，共包括5個項目：1和2。4：針對低速率下的視頻、音頻編碼，更注重多媒體系統(tǒng)的交互性和靈活性。7：支持多媒體基于內(nèi)容的檢索。21：多媒體應(yīng)用框架。886.2.11標(biāo)準(zhǔn)1的主要任務(wù)：將視頻信號及其伴音信號以可接受的重建質(zhì)量，壓縮到約1.5的碼率，并復(fù)合成一個單一的位流，同時保證音視頻的同步。1主要用于在光盤上存儲視頻圖像()，它針對標(biāo)準(zhǔn)分辨率的圖像進(jìn)行壓縮(制為352×240，制為352×288)，每秒30幀，具備音質(zhì)。891標(biāo)準(zhǔn)的組成1標(biāo)準(zhǔn)包括了5個部分：系統(tǒng)(11172-1)：定義音頻、視頻及有關(guān)數(shù)據(jù)的同步；視頻(11172-2)：定義視頻信號的編解碼過程，亮度信號分辨率為360×240，色度信號分辨率為180×120；音頻(11172-3)：定義音頻的編解碼過程；一致性測試(11172-4)：規(guī)定如何測試編解碼器，以確認(rèn)是否符合前三部分的要求；軟件模擬(11172-5)：該部分并非標(biāo)準(zhǔn)，只是關(guān)于用軟件執(zhí)行前三部分的技術(shù)結(jié)果報告。901視頻1標(biāo)準(zhǔn)中實現(xiàn)視頻壓縮編碼的基本思想：在空間上的幀內(nèi)壓縮：采用基于變換的類算法；在時間上的幀間壓縮：采用基于塊的運(yùn)動補(bǔ)償技術(shù)。在視頻中，宏塊是最基本的編碼單元。運(yùn)動信息就包含在宏塊中，每個宏塊可有一至二個運(yùn)動矢量。91視頻數(shù)據(jù)流的結(jié)構(gòu)運(yùn)動圖像序列圖片組圖片圖片切片宏塊塊8像素8像素YUV采樣格式為4:2:092運(yùn)動矢量運(yùn)動矢量，也稱移動矢量。運(yùn)動矢量93視頻的圖像類型將視頻圖像分成3種類型：I圖像：也稱幀內(nèi)圖，采用基于的編碼技術(shù)壓縮，每像素壓縮后只需1～2。P圖像：也稱預(yù)測圖，用最近的前一個I圖像或P圖像預(yù)測得到(前向預(yù)測)，也可以作為下一次預(yù)測的參照圖像。B圖像：也稱插補(bǔ)圖、雙向預(yù)測圖，預(yù)測時需要同時使用前后兩個I圖像或P圖像作為參照圖像(雙向預(yù)測)。94四種預(yù)測方法：幀內(nèi)預(yù)測、前向預(yù)測、后向預(yù)測、雙向預(yù)測95典型的圖像類型次序編碼器允許選擇I圖像的頻率和位置，一般1秒鐘使用2次I圖像。編碼器也允許選擇在一對參照圖像之間的B圖像的數(shù)目。1秒?yún)⒄諑g有2個B圖像

每0.5秒就有1幀I圖像

IBBPBBPBBPBBPBBIBBPBBPBBPBBPBB典型的圖像類型次序96傳輸順序若接收端接收的1～7幀圖像順序不變，同樣為，則解碼第2幀B時，由于它是由第1幀I和第4幀P預(yù)測出的，但此時第4幀尚未恢復(fù)，將無法解碼。為了便于解碼器，編碼器需對圖像重新排序后再傳輸，以保證參照圖像先于B圖像恢復(fù)。上述1～7幀傳輸?shù)拇涡驊?yīng)為：4213756IPBBPBB97I圖像的編碼幀內(nèi)圖像I不參照任何其他圖像，可采用類似的壓縮算法。98P圖像的編碼P圖像使用兩種類型的參數(shù)來表示：當(dāng)前要編碼的宏塊與參考宏塊之間的差值；宏塊的運(yùn)動矢量。99B圖像的編碼100基于塊的運(yùn)動補(bǔ)償技術(shù)在方案中，運(yùn)動補(bǔ)償技術(shù)在宏塊這一等級工作，主要用來消除P圖像和B圖像在時間上的冗余。基于塊的運(yùn)動補(bǔ)償技術(shù)，即：在參照幀中尋找符合一定條件、當(dāng)前被預(yù)測塊宏塊的最佳匹配塊。找到匹配塊后，可直接使用匹配塊作為被預(yù)測塊，也可以將匹配塊＋預(yù)測誤差（采用編碼）作為被預(yù)測塊。101搜索運(yùn)動矢量102各種圖像類型的宏塊處理技術(shù)I圖像的數(shù)據(jù)量最大，B圖像的數(shù)據(jù)量最小。1036.2.22標(biāo)準(zhǔn)2標(biāo)準(zhǔn)于1993年發(fā)布，全稱為“信息技術(shù)——電視圖像和伴音信息的通用編碼”，是一個與數(shù)字電視廣播有關(guān)的、高質(zhì)量圖像和聲音的編碼標(biāo)準(zhǔn)。2在1的基本編碼算法基礎(chǔ)上進(jìn)行了擴(kuò)充，增加了許多新功能，如對隔行掃描電視的編碼、可變位速率等。2要達(dá)到的最基本目標(biāo)是：位速率為4～9，最高達(dá)15。1042可利用網(wǎng)絡(luò)提供的3~100的數(shù)據(jù)傳輸率，來支持具有更高分辨率圖像的壓縮和更高的圖像質(zhì)量。2是的指定標(biāo)準(zhǔn)，其音頻編碼可提供5.1聲道甚至7.1聲道。2標(biāo)準(zhǔn)定義了三種質(zhì)量不同的編碼方式：信噪比可變性、空間分辨率可變

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

多媒體數(shù)據(jù)壓縮編碼技術(shù)

文檔簡介

溫馨提示

最新文檔

評論

多媒體數(shù)據(jù)壓縮編碼技術(shù)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔