數(shù)據(jù)壓縮技術(shù)

上傳人：卓*** IP屬地：廣東上傳時(shí)間：2023-04-10 格式：PPT 頁(yè)數(shù)：63 大?。?.98MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩58頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)壓縮技術(shù)第1頁(yè)，共63頁(yè)，2023年，2月20日，星期五第3章數(shù)據(jù)壓縮技術(shù)多媒體技術(shù)的核心是計(jì)算機(jī)實(shí)時(shí)地綜合處理聲音、文字、圖形、圖像等信息，而為了使計(jì)算機(jī)能夠處理這些信息，就必須對(duì)它們進(jìn)行數(shù)字化，即把那些在時(shí)間和幅度上連續(xù)變化的聲音、圖形和圖像信號(hào)等，轉(zhuǎn)換成計(jì)算機(jī)能夠處理的、在時(shí)間和幅度上均為離散量的數(shù)字信號(hào)。這個(gè)過(guò)程，就稱(chēng)為多媒體數(shù)據(jù)編碼。20世紀(jì)90年代以來(lái)，移動(dòng)通信等無(wú)線接入和多媒體技術(shù)的大量引入，同時(shí)受到頻帶的限制，迫使人們采用壓縮編碼，如今，數(shù)據(jù)壓縮技術(shù)的應(yīng)用已經(jīng)有了一些封裝性很好的軟件工具和方法。第2頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.1多媒體信息的計(jì)算機(jī)表示多媒體信息的主要類(lèi)型有文本（text）、語(yǔ)音（voice）、音響（audio）、矢量圖（vectorgraphics）、位圖（bitmap）和視頻（video）等。通常，數(shù)字化的視頻和音頻信號(hào)其數(shù)據(jù)量是十分巨大的。例如，一幅640×480點(diǎn)陣的彩色圖像（16位色，即65536種顏色/像素）數(shù)據(jù)量約為4.92MB；BMP圖像通常保存的顏色深度有2（1位）、16（4位）、256（8位）、65536（16位）和1670萬(wàn)(16777216)（24位）種顏色（其中位是表示每點(diǎn)所用的數(shù)據(jù)位）。對(duì)于電視信號(hào)，如果以每秒25幀圖像的速度進(jìn)行播放，則要求這種信號(hào)必須以不低于122.9Mb/s速度進(jìn)行數(shù)據(jù)傳輸，才不至于造成失真；而音頻信號(hào)，如果采樣頻率為44.1kHz，量化為16位雙聲道立體聲，則650MB的光盤(pán)只能存放l個(gè)小時(shí)的播放量，并且要求其傳輸速率不低于1.4Mb/s。第3頁(yè)，共63頁(yè)，2023年，2月20日，星期五2011-11-4第4頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.1多媒體信息的計(jì)算機(jī)表示為了達(dá)到令人滿(mǎn)意的圖像、視頻畫(huà)面質(zhì)量和聽(tīng)覺(jué)效果，多媒體系統(tǒng)必須解決視頻、音頻信號(hào)數(shù)據(jù)的大容量存儲(chǔ)和實(shí)時(shí)傳輸問(wèn)題。而這些多媒體數(shù)據(jù)之間往往具有很大的相關(guān)性和冗余性，確實(shí)具有很大的壓縮潛力。第5頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.1多媒體信息的計(jì)算機(jī)表示以位圖（BMP）圖像為例，圖像數(shù)據(jù)中像素與像素之間無(wú)論是在行方向還是在列方向都具有很大的相關(guān)性，因而整體上數(shù)據(jù)的冗余度很大。在允許一定限度失真的前提下，可以對(duì)圖像數(shù)據(jù)進(jìn)行很大程度的壓縮（例如轉(zhuǎn)換成JPG格式）。這里所說(shuō)的失真一般都是在人眼允許的誤差范圍之內(nèi)，壓縮前后的圖像如果不做非常細(xì)致的對(duì)比很難覺(jué)察出兩者之間的差別。見(jiàn)圖3-1。第6頁(yè)，共63頁(yè)，2023年，2月20日，星期五圖3-1bmp圖片與jpg圖片的比較a）bmp圖片，900KBb）jpg圖片，41.2KB第7頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2數(shù)據(jù)壓縮編碼技術(shù)為了解決存儲(chǔ)、處理和傳輸多媒體數(shù)據(jù)的問(wèn)題，除了提高計(jì)算機(jī)本身的性能以及通信信道的帶寬外，更重要的則是對(duì)多媒體數(shù)據(jù)進(jìn)行高效實(shí)時(shí)的壓縮，壓縮的目的是要減少多媒體信息的存儲(chǔ)量和傳輸量，因此，數(shù)據(jù)壓縮編解碼自然成為了多媒體技術(shù)中的核心技術(shù)。第8頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.1多媒體的數(shù)據(jù)量、信息量和冗余量數(shù)據(jù)是用來(lái)記錄和傳送信息的，或者說(shuō)數(shù)據(jù)是信息的載體。對(duì)于人類(lèi)用計(jì)算機(jī)推理與計(jì)算來(lái)說(shuō)，真正有用的不是數(shù)據(jù)本身，而是數(shù)據(jù)所攜帶的信息。多媒體數(shù)據(jù)，尤其是圖像、音頻和視頻，其數(shù)據(jù)量是相當(dāng)大的，但那么大的數(shù)據(jù)量并不完全等于它們所攜帶的信息量。在信息論中，這就稱(chēng)為冗余。第9頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.1多媒體的數(shù)據(jù)量、信息量和冗余量多媒體數(shù)據(jù)中存在的數(shù)據(jù)冗余主要有以下幾種類(lèi)型。1）空間冗余：這是圖像數(shù)據(jù)中經(jīng)常存在的一種冗余。在同一幅圖像中，規(guī)則物體和規(guī)則背景（所謂規(guī)則是指表面是有序的而不是雜亂無(wú)章的排列）的表面物理特性具有相關(guān)性，這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。2）時(shí)間冗余：這是序列圖像（電視圖像、運(yùn)動(dòng)圖像）和語(yǔ)音數(shù)據(jù)中所經(jīng)常包含的冗余。圖像序列中的兩幅相鄰的圖像，后一幅圖像與前一幅圖像之間有較大的相關(guān)，這反映為時(shí)間冗余。同理，在語(yǔ)音中，由于人在說(shuō)話時(shí)其發(fā)音的音頻是一連續(xù)和漸變的過(guò)程，而不是一個(gè)完全時(shí)間上獨(dú)立的過(guò)程，因而存在著時(shí)間冗余?？臻g冗余和時(shí)間冗余是當(dāng)我們將圖像信號(hào)看作是概率信號(hào)時(shí)所反應(yīng)出的統(tǒng)計(jì)特性，因此有時(shí)這兩種冗余也被稱(chēng)為統(tǒng)計(jì)冗余。第10頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.1多媒體的數(shù)據(jù)量、信息量和冗余量3）信息熵冗余（編碼冗余）：信息熵冗余是指數(shù)據(jù)所攜帶的信息量少于數(shù)據(jù)本身而反映出來(lái)的數(shù)據(jù)冗余。4）結(jié)構(gòu)冗余：數(shù)字化圖像（例如草席圖像）中表面紋理存在著非常強(qiáng)的紋理結(jié)構(gòu)，稱(chēng)之為在結(jié)構(gòu)上存在冗余。5）知識(shí)冗余：有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性。例如人臉的圖像有固定的結(jié)構(gòu)等。這類(lèi)規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到，此類(lèi)冗余為知識(shí)冗余。6）視覺(jué)冗余：人類(lèi)的視覺(jué)系統(tǒng)由于受生理特性的限制，對(duì)于圖像場(chǎng)的變化并不是都能感知的。這些變化如果不被視覺(jué)所察覺(jué)的話，我們?nèi)哉J(rèn)為圖像是完好的或足夠好的。這樣的冗余，稱(chēng)之為視覺(jué)冗余。第11頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.2圖像壓縮預(yù)處理所謂圖像數(shù)據(jù)壓縮，就是要在不影響或少影響圖像質(zhì)量的前提下，盡量設(shè)法減少圖像數(shù)據(jù)中的數(shù)據(jù)量。首要任務(wù)，就是去除各種圖像數(shù)據(jù)中的冗余數(shù)據(jù)。刪除冗余數(shù)據(jù)必然會(huì)給圖像質(zhì)量帶來(lái)一定的損失，這就需要進(jìn)行相應(yīng)的預(yù)處理，來(lái)保證將這種損失降至最低限度。為此，圖像壓縮技術(shù)使用一些通用的預(yù)處理工具，如濾波器、色差信息二次抽樣、量化、預(yù)測(cè)編碼、運(yùn)動(dòng)補(bǔ)償、變長(zhǎng)編碼和圖像內(nèi)插等附加的能提供有效壓縮因子的圖像變換算法。第12頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.3數(shù)據(jù)壓縮方法數(shù)據(jù)壓縮處理一般由兩個(gè)過(guò)程組成：一是編碼過(guò)程，即將原始數(shù)據(jù)經(jīng)過(guò)編碼進(jìn)行壓縮，以便于存儲(chǔ)與傳輸；二是解碼過(guò)程，即對(duì)編碼數(shù)據(jù)進(jìn)行解碼，還原為可以使用的數(shù)據(jù)。第13頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.3數(shù)據(jù)壓縮方法按照出發(fā)點(diǎn)的不同，數(shù)據(jù)壓縮方法有幾種不同的分類(lèi)結(jié)果。根據(jù)解碼后的數(shù)據(jù)與原始數(shù)據(jù)是否完全一致，數(shù)據(jù)壓縮方法可分為可逆（無(wú)失真）編碼方法和不可逆（有失真）編碼方法兩類(lèi)。用可逆編碼方法壓縮的圖像，其解碼圖像與原始圖像嚴(yán)格相同，即壓縮是完全可恢復(fù)的或沒(méi)有偏差的。用不可逆編碼方法壓縮的圖像，其還原后的圖像較之原始圖像存在著一定的誤差，但這種誤差上限定在一定范圍內(nèi)，就視覺(jué)效果而言一般是可接受的。因此，不可逆編碼方法大多被用在把人類(lèi)視覺(jué)作為對(duì)象的場(chǎng)合下。第14頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.3數(shù)據(jù)壓縮方法根據(jù)壓縮原理的不同，數(shù)據(jù)壓縮方法可分為預(yù)測(cè)編碼、變換編碼、量化與向量量化編碼、信息熵編碼、分頻帶編碼（又稱(chēng)子帶編碼）、結(jié)構(gòu)編碼、基于知識(shí)的編碼等類(lèi)別。此外，還有統(tǒng)計(jì)編碼、行程編碼和算術(shù)編碼等方法。第15頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.4無(wú)損壓縮與有損壓縮常用的壓縮編碼可以分為兩大類(lèi)：一類(lèi)是無(wú)損壓縮法，也稱(chēng)冗余壓縮法、熵編碼；另一類(lèi)是有損壓縮法，也稱(chēng)熵壓縮法。第16頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.4無(wú)損壓縮與有損壓縮1.無(wú)損壓縮法無(wú)損壓縮法去掉或減少了數(shù)據(jù)中的冗余，但這些冗余值是可以重新插入到數(shù)據(jù)中的，因此，無(wú)損壓縮是可逆的過(guò)程。例如，需壓縮的數(shù)據(jù)長(zhǎng)時(shí)間不發(fā)生變化，此時(shí)連續(xù)的多個(gè)數(shù)據(jù)值將會(huì)重復(fù)；這時(shí)若只存儲(chǔ)不變樣值的重復(fù)數(shù)目，顯然會(huì)減少存儲(chǔ)數(shù)據(jù)量，且原來(lái)的數(shù)據(jù)可以從壓縮后的數(shù)據(jù)中重新構(gòu)造出來(lái)（或者叫做還原，解壓縮），信息沒(méi)有損失。因此，無(wú)損壓縮法也稱(chēng)無(wú)失真壓縮。典型的無(wú)損壓縮法主要是基于統(tǒng)計(jì)的編碼方案，如霍夫曼（Huffman）編碼、Fano-Shannon編碼、算術(shù)編碼、游程編碼（Run-length）、LZ編碼等。第17頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.4無(wú)損壓縮與有損壓縮無(wú)損壓縮法由于不會(huì)產(chǎn)生失真，因此在多媒體技術(shù)中一般用于文本數(shù)據(jù)的壓縮，它能保證完全地恢復(fù)原始數(shù)據(jù)，如磁盤(pán)文件的壓縮。但這種方法壓縮比較低，如LZ編碼、游程編碼、霍夫曼編碼的壓縮比一般在2:1~5:1之間。第18頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.4無(wú)損壓縮與有損壓縮2.有損壓縮法有損壓縮法壓縮了熵，會(huì)減少信息量。因?yàn)殪囟x為平均信息量，而損失的信息是不能再恢復(fù)的，因此這種壓縮法是不可逆的。常用的有損壓縮方法有PCM（脈沖編碼調(diào)制）、預(yù)測(cè)編碼、變換編碼（離散余弦變換方法）、插值和外推法（空域亞采樣、時(shí)域亞采樣、自適應(yīng)）等。新一代的數(shù)據(jù)壓縮方法，如矢量量化和子帶編碼、基于模型的壓縮、分形壓縮和小波變換壓縮等也已經(jīng)接近或達(dá)到實(shí)用水平。第19頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.4無(wú)損壓縮與有損壓縮有損壓縮法由于允許一定程度的失真，適用于重構(gòu)信號(hào)不一定非要和原始信號(hào)完全相同的場(chǎng)合，可用于對(duì)圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓縮。第20頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.2.5數(shù)據(jù)壓縮算法的綜合評(píng)價(jià)指標(biāo)數(shù)據(jù)壓縮方法的優(yōu)劣主要由所能達(dá)到的壓縮倍數(shù)、從壓縮后的數(shù)據(jù)所能恢復(fù)（或稱(chēng)重建）的圖像（或聲音）的質(zhì)量、以及壓縮和解壓縮的速度等幾方面來(lái)評(píng)價(jià)。此外，算法的復(fù)雜性和延時(shí)等也是應(yīng)當(dāng)考慮的因素。衡量一種數(shù)據(jù)壓縮技術(shù)好壞的指標(biāo)綜合起來(lái)就是：一壓縮比要大；二實(shí)現(xiàn)壓縮的算法要簡(jiǎn)單，壓縮、解壓速度快；三是恢復(fù)效果要好。第21頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3多媒體文件在大多數(shù)系統(tǒng)中，普通的文本文件由字節(jié)的線性序列組成，而對(duì)多媒體而言，情況就復(fù)雜多了。首先，視頻與音頻完全不同，它們由不同的設(shè)備捕獲（視頻為CCD芯片，音頻為麥克風(fēng)），具有不同的內(nèi)部結(jié)構(gòu)（視頻每秒有25~30幀，音頻每秒有44100個(gè)樣本），并且通過(guò)不同的設(shè)備來(lái)回放（視頻為顯示器，音頻為擴(kuò)音器）。第22頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3多媒體文件此外，大多數(shù)電影現(xiàn)在針對(duì)的是全世界的觀眾，而這些觀眾語(yǔ)言不同。這一情況有兩種處理方法。對(duì)于某些國(guó)家，需要產(chǎn)生一個(gè)額外的聲音軌跡，用當(dāng)?shù)卣Z(yǔ)言進(jìn)行配音，但是不包含音效。例如，在日本所有的電視都具有兩個(gè)聲道，電視觀眾看外國(guó)影片時(shí)可以聽(tīng)原聲語(yǔ)言也可以聽(tīng)日語(yǔ)，遙控器上有一個(gè)按鈕可以用來(lái)進(jìn)行語(yǔ)言選擇。在其他國(guó)家使用的是原始的聲音軌跡，配以當(dāng)?shù)卣Z(yǔ)言的字幕。除此之外，許多在電視中播放的電影現(xiàn)在也提供英文字幕，使講英語(yǔ)但是聽(tīng)力較弱的人可以觀看。第23頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3多媒體文件數(shù)字電影實(shí)際上可能由多個(gè)文件組成：一個(gè)視頻文件、多個(gè)音頻文件以及多個(gè)包含各種語(yǔ)言字幕的文本文件。第24頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3多媒體文件因此，文件系統(tǒng)需要跟蹤每個(gè)文件的多個(gè)“子文件”。一種可能的方案是像傳統(tǒng)的文件一樣管理每個(gè)子文件，并且要有一個(gè)新的數(shù)據(jù)結(jié)構(gòu)列出每個(gè)多媒體文件的全部子文件。另一方法是創(chuàng)造一種二維的i節(jié)點(diǎn)，使每一列列出每個(gè)子文件的全部塊。一般而言，其組織必須能夠使觀眾觀看電影時(shí)可以動(dòng)態(tài)地選擇使用哪個(gè)音頻及字幕軌跡。在各種情況下，還必須有保持子文件同步的某種方法，才能保證當(dāng)選中的音頻軌跡回放時(shí)與視頻保持同步。第25頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.1視頻編碼人類(lèi)的眼睛具有這樣的特性：當(dāng)一幅圖像閃現(xiàn)在視網(wǎng)膜上時(shí)，在它衰退之前將保持幾毫秒的時(shí)間。如果一個(gè)圖像序列以每秒50或更多張圖像閃現(xiàn)，眼睛并不會(huì)注意到它。所有基于視頻或影片膠片的運(yùn)動(dòng)圖像系統(tǒng)都利用了這一原理產(chǎn)生活動(dòng)的畫(huà)面。為了理解視頻系統(tǒng)，可以從簡(jiǎn)單的黑白電視開(kāi)始。

為了將二維圖像表示為作為時(shí)間函數(shù)的一維電壓，攝像機(jī)用一個(gè)電子束對(duì)圖像進(jìn)行橫向掃描并緩慢地向下移動(dòng)，記錄下電子束經(jīng)過(guò)處光的強(qiáng)度。在掃描的終點(diǎn)處，電子束折回，稱(chēng)為一幀（frame）。這一作為時(shí)間函數(shù)的光的強(qiáng)度以廣播方式傳播出去，接收機(jī)則重復(fù)掃描過(guò)程以重構(gòu)圖像。第26頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.1視頻編碼雖然每秒25幀足以捕獲平滑的運(yùn)動(dòng)，但是在這樣的幀率下，有許多人會(huì)感覺(jué)到圖像閃爍（因?yàn)樾碌膱D像尚未出現(xiàn)以前舊的圖像就已經(jīng)在視網(wǎng)膜上消失）。增加幀率就會(huì)對(duì)稀缺的帶寬提出更多的要求。因此要采取不同的方法，即首先顯示所有的奇數(shù)掃描線，接著再顯示所有的偶數(shù)掃描線。此處的半幀稱(chēng)為一個(gè)場(chǎng)（field）。實(shí)驗(yàn)表明，盡管人們?cè)诿棵?5幀時(shí)感覺(jué)到閃爍，但是在每秒50場(chǎng)時(shí)卻感覺(jué)不到，這一技術(shù)被稱(chēng)為隔行掃描，否則就稱(chēng)為逐行掃描。第27頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.1視頻編碼彩色視頻采用與單色（黑白）視頻相同的掃描模式，只不過(guò)使用了三個(gè)同時(shí)運(yùn)動(dòng)的電子束而不是一個(gè)運(yùn)動(dòng)電子束來(lái)顯示圖像，對(duì)于紅、綠和藍(lán)（RGB）這三個(gè)加性原色中的每一顏色使用一個(gè)電子束。這一技術(shù)能夠工作是因?yàn)槿魏晤伾伎梢杂杉t、綠和藍(lán)以適當(dāng)?shù)膹?qiáng)度線性疊加而構(gòu)造出來(lái)。然而，為了在一個(gè)信道上進(jìn)行傳輸，三個(gè)彩色信號(hào)必須組合成一個(gè)復(fù)合信號(hào)。為了使黑白接收機(jī)可以顯示傳輸?shù)牟噬娨暪?jié)目，NTSC、PAL和SECAM三種制式都將RGB信號(hào)線性組合為一個(gè)亮度信號(hào)和兩個(gè)色度信號(hào)，并使用不同系數(shù)從RGB信號(hào)構(gòu)造信號(hào)。第28頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.1視頻編碼由于人的眼睛對(duì)亮度信號(hào)比對(duì)色度信號(hào)敏感得多，所以色度信號(hào)不必非要精確地進(jìn)行傳輸。因此，亮度信號(hào)應(yīng)該用與舊的黑白信號(hào)相同的頻率進(jìn)行廣播，從而使其可以被黑白電視機(jī)接收。兩個(gè)色度信號(hào)則可以以更高的頻率用較窄的波段進(jìn)行廣播。某些電視機(jī)有標(biāo)著亮度、色調(diào)和飽和度（或者是亮度、色彩和顏色）字樣的旋鈕或調(diào)節(jié)裝置，可以分別控制這三個(gè)信號(hào)。理解亮度和色度對(duì)于理解視頻壓縮的工作原理是十分必要的。第29頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.1視頻編碼數(shù)字視頻最簡(jiǎn)單的表示方法是幀的序列，每一幀由呈矩形柵格的圖像要素即像素組成。對(duì)于彩色視頻，每一像素RGB三色中的每種顏色用8個(gè)二進(jìn)制位來(lái)表示，這樣可以表示224≈1600萬(wàn)種不同的顏色，而人的眼睛沒(méi)有能力區(qū)分這么多顏色。要產(chǎn)生平滑的運(yùn)動(dòng)效果，數(shù)字視頻像模擬視頻一樣必須每秒至少顯示25幀。然而，由于高質(zhì)量的計(jì)算機(jī)顯示器通常用存放在視頻RAM中的圖像每秒鐘掃描屏幕75次或更多次，因此所有計(jì)算機(jī)顯示器都采用逐行掃描。僅僅連續(xù)刷新（也就是重繪）相同的幀三次就足以消除閃爍。第30頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.1視頻編碼換言之，運(yùn)動(dòng)的平滑性是由每秒不同的圖像數(shù)決定的，而閃爍則是由每秒刷新屏幕的次數(shù)決定的。這兩個(gè)參數(shù)是不同的。一幅靜止的圖像以每秒20幀的頻率顯示不會(huì)表現(xiàn)出斷斷續(xù)續(xù)的運(yùn)動(dòng)，但是卻會(huì)出現(xiàn)閃爍，因?yàn)楫?dāng)一幀畫(huà)面在視網(wǎng)膜上消退時(shí)下一幀還沒(méi)有出現(xiàn)。一部電影每秒有20個(gè)不同的幀，在80Hz的刷新率下每一幀將連續(xù)繪制4次，這樣不會(huì)出現(xiàn)閃爍，但是運(yùn)動(dòng)將是斷斷續(xù)續(xù)的。第31頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.2音頻編碼音頻（聲音）波是一維的聲（壓）波。當(dāng)聲波進(jìn)入人耳的時(shí)候，鼓膜將振動(dòng)，導(dǎo)致內(nèi)耳的小骨隨之振動(dòng)，將神經(jīng)脈沖送入大腦，這些脈沖被收聽(tīng)者感知為聲音。類(lèi)似地，當(dāng)聲波沖擊麥克風(fēng)的時(shí)候，麥克風(fēng)將產(chǎn)生電信號(hào)，將聲音的振幅表示為時(shí)間的函數(shù)。第32頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.2音頻編碼音頻波可以通過(guò)模數(shù)轉(zhuǎn)換器（ADC）轉(zhuǎn)換成數(shù)字形式。ADC以電壓作為輸入，并且生成二進(jìn)制數(shù)作為輸出。圖3-2a）中為一個(gè)正弦波的例子。為了數(shù)字化地表示該信號(hào)，我們可以每隔△T秒對(duì)其進(jìn)行采樣，如圖3-2b）中的條棒高度所示。如果一個(gè)聲波不是純粹的正弦波，而是正弦波的線性疊加，其中存在的最高頻率成分為f，那么以2f的頻率進(jìn)行采樣就足夠了。第33頁(yè)，共63頁(yè)，2023年，2月20日，星期五圖3-2音頻的采樣與量化第34頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.3.2音頻編碼數(shù)字樣本是不準(zhǔn)確的。圖3-2c）中的樣本只允許9個(gè)值，從-1.00到1.00，步長(zhǎng)為0.25，因此，需要4個(gè)二進(jìn)制位來(lái)表示它們。8位樣本可以有256個(gè)不同的值，16位樣本可以有65536個(gè)不同的值。由于每一樣本的位數(shù)有限而引入的誤差稱(chēng)為量化噪聲。如果量化噪聲太大，耳朵就會(huì)感覺(jué)到。對(duì)聲音進(jìn)行采樣的兩個(gè)著名的例子是電話和音頻CD。數(shù)字化的聲音可以十分容易地在計(jì)算機(jī)上用軟件進(jìn)行處理。第35頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4視頻壓縮所有的壓縮系統(tǒng)都需要兩個(gè)算法：一個(gè)編碼算法:用于在源端對(duì)數(shù)據(jù)進(jìn)行壓縮，一個(gè)解碼算法:用于在目的端對(duì)數(shù)據(jù)進(jìn)行解壓縮。這些算法具有某些不對(duì)稱(chēng)性，這對(duì)于理解數(shù)據(jù)壓縮是十分重要的。第36頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4視頻壓縮首先，對(duì)于許多應(yīng)用而言，一個(gè)多媒體文檔（比如說(shuō)一部電影）只需要編碼一次（當(dāng)該文檔存儲(chǔ)在多媒體服務(wù)器上時(shí)），但是需要解碼數(shù)千次（當(dāng)該文檔被客戶(hù)觀看時(shí)）。這一不對(duì)稱(chēng)性意味著，假若解碼算法速度快并且不需要昂貴的硬件，那么編碼算法速度慢并且需要昂貴的硬件也是可以接受的。從另一方面來(lái)說(shuō)，對(duì)于諸如視頻會(huì)議這樣的實(shí)時(shí)多媒體而言，編碼速度慢是不可接受的，在這樣的場(chǎng)合，編碼必須即時(shí)完成。第37頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4視頻壓縮第二個(gè)不對(duì)稱(chēng)性是編碼/解碼過(guò)程不必是100％可逆的。也就是說(shuō)，當(dāng)對(duì)一個(gè)文件進(jìn)行壓縮并進(jìn)行傳輸，然后對(duì)其進(jìn)行解壓縮時(shí)，用戶(hù)可以期望取回原始的文件，準(zhǔn)確到最后一位。對(duì)于多媒體，這樣的要求是不存在的。視頻信號(hào)經(jīng)過(guò)編碼和解碼之后與原始信號(hào)只存在輕微的差異通常就是可以接受的。當(dāng)解碼輸出不與原始輸入嚴(yán)格相等時(shí)，系統(tǒng)被稱(chēng)為是有損的。所有用于多媒體的壓縮系統(tǒng)都是有損的，因?yàn)檫@樣可以獲得更好的壓縮效果。第38頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.1視聽(tīng)業(yè)務(wù)視頻編譯碼標(biāo)準(zhǔn)（H.261/263）1980年，國(guó)際電報(bào)電話咨詢(xún)委員會(huì)CCITT所屬的視頻編碼專(zhuān)家組的H.261建議被通過(guò)，這是CCITT制定的國(guó)際上第一個(gè)視頻壓縮標(biāo)準(zhǔn)，已成為可視電話和電話會(huì)議的國(guó)際標(biāo)準(zhǔn)。H.261名稱(chēng)為“視聽(tīng)業(yè)務(wù)視頻編譯碼標(biāo)準(zhǔn)”，它最初是針對(duì)在ISDN上實(shí)現(xiàn)電信會(huì)議應(yīng)用，特別是面對(duì)面的可視電話和視頻會(huì)議而設(shè)計(jì)的。第39頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.1視聽(tīng)業(yè)務(wù)視頻編譯碼標(biāo)準(zhǔn)（H.261/263）實(shí)際的編碼算法類(lèi)似于MPEG算法，但不能與后者兼容。H.261在實(shí)時(shí)編碼時(shí)比MPEG所占用的CPU運(yùn)算量少得多，此算法為了優(yōu)化帶寬占用量，引進(jìn)了在圖像質(zhì)量與運(yùn)動(dòng)幅度之間的平衡折中機(jī)制，也就是說(shuō)，劇烈運(yùn)動(dòng)的圖像比相對(duì)靜止的圖像質(zhì)量要差。因此這種方法是屬于恒定碼流可變質(zhì)量編碼，而非恒定質(zhì)量可變碼流編碼。第40頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.1視聽(tīng)業(yè)務(wù)視頻編譯碼標(biāo)準(zhǔn)（H.261/263）由于H.261所針對(duì)的可視電話信號(hào)最初考慮是在一般電話網(wǎng)中傳輸?shù)?，帶寬和碼率是其考慮的核心問(wèn)題。其每幀取樣點(diǎn)數(shù)比較低，且采取抽幀傳輸?shù)姆椒?，無(wú)法滿(mǎn)足數(shù)字電視壓縮編碼的要求，但H.261是此前壓縮編碼數(shù)十年研究的結(jié)果，成為以后JPEG和MPEG編碼方法的重要基礎(chǔ)。第41頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.1視聽(tīng)業(yè)務(wù)視頻編譯碼標(biāo)準(zhǔn)（H.261/263）H.263是關(guān)于低于64Kb/s比特率的窄帶通道視頻編碼建議，其目的是能在現(xiàn)有的電話網(wǎng)上傳輸活動(dòng)圖像。H.263是在H.261建議的基礎(chǔ)上發(fā)展起來(lái)的，其信源編碼算法仍然是幀間預(yù)測(cè)和DCT混合編碼。在H.261建議的基礎(chǔ)上，H.263將運(yùn)動(dòng)矢量的搜索增加為半像素點(diǎn)搜索，同時(shí)又增加了無(wú)限制運(yùn)動(dòng)矢量、基于語(yǔ)法的算術(shù)編碼、高級(jí)預(yù)測(cè)技術(shù)和PB幀編碼等4個(gè)高級(jí)選項(xiàng)，從而達(dá)到了進(jìn)一步降低碼速率和提高編碼質(zhì)量的目的。第42頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.1視聽(tīng)業(yè)務(wù)視頻編譯碼標(biāo)準(zhǔn)（H.261/263）H.263采用運(yùn)動(dòng)視頻編碼中常見(jiàn)的編碼方法，將編碼過(guò)程分為幀內(nèi)編碼和幀間編碼兩個(gè)部分，相當(dāng)于MPEG編碼的I幀和P幀。幀內(nèi)用改進(jìn)的DCT變換并量化，在幀間采用1/2像素運(yùn)動(dòng)矢量預(yù)測(cè)補(bǔ)償技術(shù)，使運(yùn)動(dòng)補(bǔ)償更加精確，量化后使用改進(jìn)的變長(zhǎng)編碼表（VLC）對(duì)量化數(shù)據(jù)進(jìn)行嫡編碼，得到最終的編碼系數(shù)。第43頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.2靜止圖像壓縮編碼標(biāo)準(zhǔn)（JPEG）在多媒體技術(shù)的發(fā)展過(guò)程中，靜止和活動(dòng)視頻圖像壓縮標(biāo)準(zhǔn)的制定和推廣起到了十分重要的作用。國(guó)際標(biāo)準(zhǔn)化組織（ISO）和國(guó)際電報(bào)電話咨詢(xún)委員會(huì)（CCITT）聯(lián)合成立“聯(lián)合圖像專(zhuān)家組”JPEG（jointphotographicexpertsgroup），在ITU、ISO和IEC等其他標(biāo)準(zhǔn)組織的支持下，該小組致力于制定適用于連續(xù)色調(diào)、多極灰度、彩色或單色靜止圖像數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)，經(jīng)過(guò)5年細(xì)致的工作，于1991年3月提出了JPEG標(biāo)準(zhǔn)“多灰度靜止圖像的數(shù)字壓縮編碼”，這是一個(gè)適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。第44頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.2靜止圖像壓縮編碼標(biāo)準(zhǔn)（JPEG）它包含兩部分：第一部分是無(wú)損壓縮，即基于空間線性預(yù)測(cè)技術(shù)的無(wú)失真壓縮算法，這種算法的壓縮比很低；第二部分是有損壓縮，這是基于離散余弦變換（DCT）和霍夫曼編碼的有損壓縮，也是目前主要應(yīng)用的一種算法。這后一種算法進(jìn)行圖像壓縮信息雖有損失，但壓縮比可以很大，例如壓縮比在20:1時(shí)，眼睛基本上看不出失真。JPEG標(biāo)準(zhǔn)對(duì)于多媒體而言是十分重要的，因?yàn)橛糜趬嚎s運(yùn)動(dòng)圖像的標(biāo)準(zhǔn)MPEG不過(guò)是分別對(duì)每一幀進(jìn)行JPEG編碼，再加上某些幀間壓縮和運(yùn)動(dòng)補(bǔ)償?shù)阮~外的特征。JPEG定義在國(guó)際標(biāo)準(zhǔn)ISO10918中，它具有4種模式和許多選項(xiàng)。第45頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.2靜止圖像壓縮編碼標(biāo)準(zhǔn)（JPEG）JPEG確實(shí)很復(fù)雜，但由于它通?？梢垣@得20:1或更好的壓縮效果，所以獲得廣泛的應(yīng)用。解碼一幅JPEG圖像需要反過(guò)來(lái)運(yùn)行上述算法。JPEG大體上是對(duì)稱(chēng)的：解碼一幅圖像花費(fèi)的時(shí)間與編碼基本相同。第46頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)MPEG（motionpictureexpertsgroup）標(biāo)準(zhǔn)是ISO/IEC委員會(huì)針對(duì)全活動(dòng)視頻的壓縮標(biāo)準(zhǔn)系列，是用于壓縮視頻的主要算法，并于1993年成為國(guó)際標(biāo)準(zhǔn)。MPEG包含MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21等。該標(biāo)準(zhǔn)包括MPEG視頻、MPEG音頻和MPEG系統(tǒng)三大部分。MPEG視頻是面向位速率約為1.5Mbit/s的全屏幕運(yùn)動(dòng)圖像的數(shù)據(jù)壓縮；MPEG音頻是面向每通道位速率為64、128和192kbit/s的數(shù)字音頻信號(hào)的壓縮；MPEG系統(tǒng)則面向解決多道壓縮視頻、音頻碼流的同步和合成問(wèn)題。第47頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)1.數(shù)字聲像壓縮標(biāo)準(zhǔn)（MPEG-1）MPEG標(biāo)準(zhǔn)MPEG-1（ISO11172）設(shè)計(jì)用于視頻錄像機(jī)質(zhì)量的輸出（對(duì)NTSC制式為352×240），它使用的位率為1.2Mbps。MPEG-2（ISO13818）設(shè)計(jì)用于將廣播質(zhì)量的視頻壓縮至4Mbps到6Mbps，這樣就可以適應(yīng)NTSC或PAL制式的廣播頻道。第48頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)2.通用視頻圖像壓縮編碼標(biāo)準(zhǔn)（MPEG-2）MPEG-2是一種既能兼容MPEG-1標(biāo)準(zhǔn)，又能滿(mǎn)足高分辨率數(shù)字電視和高分辨率數(shù)字衛(wèi)星接收機(jī)等方面要求的技術(shù)標(biāo)準(zhǔn)，它是由ISO的活動(dòng)圖像專(zhuān)家組和ITU-TS第15研究組于1994年共同制定的，在ITU-TS的協(xié)議系列中，被稱(chēng)為H.262。制定MPEG-2的初衷是得到一個(gè)針對(duì)廣播電視質(zhì)量（CCIR601格式）視頻信號(hào)的壓縮編碼標(biāo)準(zhǔn)，但實(shí)際上最后得到了一個(gè)通用的標(biāo)準(zhǔn)，它能在很寬的范圍內(nèi)對(duì)不同分辨率和不同輸出比特率的圖像信號(hào)有效地進(jìn)行編碼。第49頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)3.低比特率音視頻壓縮編碼標(biāo)準(zhǔn)（MPEG-4）運(yùn)動(dòng)圖像專(zhuān)家組于1999年2月正式公布了MPEG-4（ISO/IEC14496）標(biāo)準(zhǔn)第一版，同年年底推出MPEG-4第二版，并于2000年年初正式成為國(guó)際標(biāo)準(zhǔn)。第50頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法，它是針對(duì)數(shù)字電視、交互式繪圖應(yīng)用（影音合成內(nèi)容）、交互式多媒體（WWW、資料收集與分散）等整合及壓縮技術(shù)的需求而制定的國(guó)際標(biāo)準(zhǔn)。第51頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)4.多媒體內(nèi)容描述接口標(biāo)準(zhǔn)（MPEG-7）針對(duì)現(xiàn)有的國(guó)際標(biāo)準(zhǔn)中還沒(méi)有能夠解決多媒體信息定位問(wèn)題的工具，運(yùn)動(dòng)圖像專(zhuān)家組決定發(fā)展一個(gè)新的國(guó)際標(biāo)準(zhǔn)——MPEG-7，旨在解決對(duì)多媒體信息描述的標(biāo)準(zhǔn)問(wèn)題，并將該描述與所描述的內(nèi)容相聯(lián)系，以實(shí)現(xiàn)快速有效的搜索。只有首先解決了多媒體信息的規(guī)范化描述之后，才能更好地實(shí)現(xiàn)信息定位。該標(biāo)準(zhǔn)不包括對(duì)描述特征的自動(dòng)提取。它的正式名稱(chēng)是“多媒體內(nèi)容描述接口”，該標(biāo)準(zhǔn)于1998年10月提出，于2001年最終完成并公布。第52頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.4.3

MPEG標(biāo)準(zhǔn)5.多媒體框架（MPEG-21）MPEG-21的正式名稱(chēng)為MultimediaFramework（多媒體框架），其目的是建立一個(gè)規(guī)范且開(kāi)放的多媒體傳輸平臺(tái)，讓所有的多媒體播放裝置都能透過(guò)此平臺(tái)接收多媒體資料，使用者可以利用各種裝置、透過(guò)各種網(wǎng)絡(luò)環(huán)境去取得多媒體內(nèi)容，而無(wú)須知道多媒體資料的壓縮方式及使用的網(wǎng)絡(luò)環(huán)境。同樣地，多媒體內(nèi)容提供者或服務(wù)業(yè)者也不會(huì)受限于使用者的裝置及網(wǎng)絡(luò)環(huán)境，針對(duì)多種不同壓縮方法來(lái)提供多媒體內(nèi)容。該標(biāo)準(zhǔn)正是致力于在大范圍的網(wǎng)絡(luò)上實(shí)現(xiàn)透明的傳輸和對(duì)多媒體資源的充分利用。第53頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.5音頻壓縮CD品質(zhì)的音頻需要一個(gè)1.411Mbps帶寬的傳送，在因特網(wǎng)的實(shí)際傳送中需要進(jìn)行有效的壓縮。已經(jīng)發(fā)展出許多不同的音頻壓縮算法，最流行的算法是擁有三個(gè)層（變體）的MPEG音頻，其中MP3（MPEG音頻層3）功能最強(qiáng)大也最出名，它屬于MPEG視頻壓縮標(biāo)準(zhǔn)里的音頻部分。第54頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.5.1音頻壓縮方法音頻壓縮可以用兩種方法完成。在波形編碼技術(shù)中，信號(hào)通過(guò)傅立葉變換變換成頻率分量。另一種方法是感知編碼，這種技術(shù)是在人類(lèi)聽(tīng)覺(jué)系統(tǒng)中尋找某種細(xì)紋，用來(lái)對(duì)信號(hào)編碼，這種信號(hào)聽(tīng)起來(lái)與人的正常收聽(tīng)相同，盡管在示波器上看起來(lái)卻大相徑庭。感知編碼是基于心理聲學(xué)的——人們?nèi)绾胃兄曇舻目茖W(xué)。MP3正是基于感知編碼。第55頁(yè)，共63頁(yè)，2023年，2月20日，星期五3.5.1音頻壓縮方法感知編碼的關(guān)鍵特性在于一些聲音可以掩蓋住其他聲音。想象一個(gè)進(jìn)行現(xiàn)場(chǎng)直播的長(zhǎng)笛音樂(lè)會(huì)，突然間，附近的一群工人打開(kāi)他們的風(fēng)鎬開(kāi)始挖掘街道。這時(shí)沒(méi)有人可以再聽(tīng)到笛子的聲音，因?yàn)樗呀?jīng)被風(fēng)鎬的聲音給掩蓋了。從傳送角度看，只編碼風(fēng)鎬的頻段就足夠了，因?yàn)槁?tīng)眾無(wú)論如何都聽(tīng)不到笛子的聲音。這種技術(shù)就叫做頻段屏蔽——在一個(gè)頻段里響亮的聲音掩蓋住另一頻段中較柔和聲音的能力，這種較柔和聲音只有在沒(méi)有響亮聲音時(shí)才可以聽(tīng)到。事實(shí)上，即使風(fēng)鎬停止工作，在

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)壓縮技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)據(jù)壓縮技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔