多媒體信息數(shù)據(jù)壓縮_第1頁(yè)
多媒體信息數(shù)據(jù)壓縮_第2頁(yè)
多媒體信息數(shù)據(jù)壓縮_第3頁(yè)
多媒體信息數(shù)據(jù)壓縮_第4頁(yè)
多媒體信息數(shù)據(jù)壓縮_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1.5 多媒體數(shù)據(jù)壓縮技術(shù)1.5.1 多媒體數(shù)據(jù)的冗余類型1.5.2 數(shù)據(jù)壓縮方法1.5.3 視頻編碼的國(guó)際標(biāo)準(zhǔn)1.5.1 多媒體數(shù)據(jù)的冗余類型圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1. 空間冗余2. 時(shí)間冗余3. 視覺冗余空間冗余一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。時(shí)間冗余運(yùn)動(dòng)圖像一般為

2、位于一時(shí)間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場(chǎng)景畫面,所以稱為時(shí)間冗余。同理,語(yǔ)音數(shù)據(jù)中也存在著時(shí)間冗余。視覺冗余人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)近似線性的和均勻的,對(duì)視覺敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比 大2、壓縮的算法 簡(jiǎn)單3、恢復(fù)效果 好1.5.2 數(shù)

3、據(jù)壓縮方法壓縮處理一般是由兩個(gè)過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲(chǔ)與傳輸;二是解碼過程,此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮編碼編碼通過模型,我們已經(jīng)確定了對(duì)某一個(gè)符號(hào)該用多少位二進(jìn)制數(shù)進(jìn)行編碼。現(xiàn)在的問題是,如何設(shè)計(jì)一種編碼方案,使其盡量精確地用模型計(jì)算出來的位數(shù)表示某個(gè)符號(hào)。最先被考慮的問題是,如果對(duì) a 用 3 個(gè)二進(jìn)制位就可以表示,而對(duì) b 用 4 個(gè)二進(jìn)制位就可以表示,那么,在解碼時(shí),面對(duì)一連串的二進(jìn)制流,我怎么知道哪三個(gè)位是 a,哪四個(gè)位是 b 呢?所以,必須

4、設(shè)計(jì)出一種編碼方式,使得解碼程序可以方便地分離每個(gè)字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個(gè)字符的編碼,都不是另一個(gè)字符編碼的前綴。反過來說就是,任何一個(gè)字符的編碼,都不是由另一個(gè)字符的編碼加上若干位 0 或 1 組成??匆幌虑熬Y編碼的一個(gè)最簡(jiǎn)單的例子符號(hào) 編碼 A 0 B 10 C 110 D 1110 E 11110 有了上面的碼表,你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了:1110010101110110111100010 - DABBDCEAAB無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。其原理是統(tǒng)

5、計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有:RLE (run length encoding)行程編碼Huffman 編碼算術(shù)編碼LZW (lempel-ziv-welch)編碼1) 將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子,應(yīng)該得到: a - 16 b - 7 c - 6 d - 6 e - 5 2) 將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有: a - 16 b - 7- c - 6 d - 6 e - 5 3) 我們把第二步中劃分出的上部作為二叉樹的左子樹,記 0,下部作為二叉樹的右子樹,記 1。4) 分別對(duì)左右子樹重復(fù) 2 3 兩步,直到所有的符號(hào)都

6、成為二叉樹的樹葉為止。現(xiàn)在我們有如下的二叉樹: 根(root) 0 | 1 +-+-+ 0 | 1 0 | 1 +-+-+ +-+-+ | | | | a b c | 0 | 1 +-+-+ | | d e Huffman Huffman 編碼編碼Huffman 編碼構(gòu)造二叉樹的方法和 Shannon-Fano 正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹?,F(xiàn)在,我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí) Huffman 編碼方法。1) 將各個(gè)符號(hào)及其出現(xiàn)頻率分別作為不同的小二叉樹(目前每棵樹只有根節(jié)點(diǎn))。 a(16) b(7) c(6) d(6) e(5) 2) 在 1 中得到的樹林里找出頻率值最小

7、的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對(duì)上面的例子,我們得到一個(gè)新的樹林: | (11) a(16) b(7) c(6) +-+-+ | | d e 3) 對(duì)上面得到的樹林重復(fù) 2 的做法,直到所有符號(hào)都連入樹中為止。這一步完成后,我們有這樣的二叉樹: 根(root) 0 | 1 +-+-+ | 0 | 1 | +-+-+ | 0 | 1 0 | 1 a +-+-+ +-+-+ | | | | b c d e 由此,我們可以建立和 Shannon-Fano 編碼略微不同的編碼表: a - 0 b - 100 c - 101 d - 11

8、0 e - 111 對(duì)例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101 0 100 101 111 110 111 0 101 0 101 . 碼長(zhǎng)共 88 位。這比使用 Shannon-Fano 編碼要更短一點(diǎn)。讓我們回顧一下熵的知識(shí),使用我們?cè)诘诙聦W(xué)到的計(jì)算方法,上面的例子中,每個(gè)字符的熵為:Ea = - log2(16 / 40) = 1.322 Eb = - log2( 7 / 40) = 2.515 Ec = - log2( 6 / 40) = 2.737 Ed = - log2( 6 / 40) = 2.737 Ee =

9、- log2( 5 / 40) = 3.000 信息的熵為:也就是說,表示該條信息最少需要 86.601 位。我們看到,Shannon-Fano 編碼和 Huffman 編碼都已經(jīng)比較接近該信息的熵值了。(1)、行程編碼(RLE)RLE 編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B 。RLE編碼簡(jiǎn)單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.(3)、算術(shù)編碼其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔,消息越長(zhǎng),編碼表示它的間隔就越小,表示這一

10、間隔所需的二進(jìn)制位數(shù)就越多。該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。(4)、LZW編碼LZW(Lempel-Ziv-Welch)壓縮使用字典庫(kù)查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(kù)(庫(kù)開始是空的)中的字符串對(duì)比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫(kù)中的位置索引,否則將該字符串插入字典中。許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。另外,.GIF 和.TIF 格式的圖形文件也是按這一文件存儲(chǔ)的。有損壓縮圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息

11、為代價(jià),換取了較高的壓縮比。常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼、插值與外推等。新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。分形的方法是把一幅數(shù)字圖像,通過一分形的方法是把一幅數(shù)字圖像,通過一些圖像處理技術(shù),如顏色分割,邊緣檢些圖像處理技術(shù),如顏色分割,邊緣檢測(cè)、頻譜分析、統(tǒng)理變化分析等原始圖測(cè)、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實(shí)際上并不是找這樣的子圖像。分形集實(shí)際上并不是存儲(chǔ)所有可能的子圖像,而是存儲(chǔ)許多存儲(chǔ)所有可能的子圖像,而是存儲(chǔ)許多迭

12、代函數(shù),通過迭代函數(shù)的反復(fù)迭代,迭代函數(shù),通過迭代函數(shù)的反復(fù)迭代,可以恢復(fù)出原來的圖像可以恢復(fù)出原來的圖像混合壓縮混合壓縮是利用了各種單一壓縮的長(zhǎng)處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。該方法在許多情況下被應(yīng)用,如JPEG 和MPEG 標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù),進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11k

13、Hz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD15kHz立體聲112-128kbps14-12:11.5.3 視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3視頻通信編碼標(biāo)準(zhǔn)靜止圖像壓縮標(biāo)準(zhǔn)國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“ JPEG (joint photographic experts group)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡(jiǎn)稱JPEG標(biāo)準(zhǔn))。這是一個(gè)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包

14、含兩部分:1、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)視頻圖像壓縮的一個(gè)重要標(biāo)準(zhǔn)是MPEG (Moving Picture Experts Group)于1990年形成的一個(gè)標(biāo)準(zhǔn)草案(簡(jiǎn)稱MPEG標(biāo)準(zhǔn))。它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn)。 MPEG制訂過三種版本的運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn),即MPEG1、MPEG2和MPEG3。1998年又推出了兩種新的圖像壓縮編碼標(biāo)準(zhǔn),這就是MPEG4和MPEG7圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4 MPEG2MPEG1MJPEG特點(diǎn)兼容前幾種標(biāo)準(zhǔn),采用更為優(yōu)化的編碼技術(shù),基于場(chǎng)景描述和面向帶寬設(shè)計(jì)基于幀重建算法進(jìn)行壓縮和傳輸,動(dòng)態(tài)監(jiān)測(cè)圖像變化,根據(jù)對(duì)象的空間

15、及時(shí)間特征來調(diào)整壓縮方法,幀間加入預(yù)測(cè)幀單獨(dú)對(duì)一幀進(jìn)行壓縮,基本不考慮視頻流中不同幀之間的變化優(yōu)點(diǎn)圖像質(zhì)量好; 可變帶寬傳輸; 錯(cuò)誤恢復(fù)能力強(qiáng)。壓縮比可調(diào)范圍廣,支持包括高速體育運(yùn)動(dòng)在內(nèi)的活動(dòng)圖像在實(shí)時(shí)壓縮、每幀數(shù)據(jù)量和處理速度上優(yōu)于MJPEG圖像質(zhì)量好缺點(diǎn)無現(xiàn)成算法,實(shí)現(xiàn)的技術(shù)難度大 壓縮效率仍不理想、窄帶網(wǎng)傳輸質(zhì)量受限,對(duì)媒體的兼容能力有待提高圖像質(zhì)量相當(dāng)于VHS視頻,不能滿足廣播級(jí)的要求;傳輸帶寬有一定的要求。實(shí)時(shí)性差,壓縮效率低, 文件量巨大應(yīng)用領(lǐng)域固定和無線網(wǎng)絡(luò),交互AV服務(wù)以及遠(yuǎn)程傳輸DVD, 廣播級(jí)的數(shù)字電視, HDTVVCD, CD-ROM, VOD分辨率768X576(PAL

16、) 或720X480(NTSC)NTSC: 720X480SIF標(biāo)準(zhǔn)分辨率(NTSC:352X240;PAL: 352X288) 碼流多種帶寬可調(diào) 分 四 級(jí) , 3 -100Mbits/sec最高1.5Mbits/sec圖像質(zhì)量在各種碼率下畫質(zhì)良好極低碼率下無法保證圖像質(zhì)量基本無法進(jìn)行窄帶傳輸多路實(shí)時(shí)存儲(chǔ)多路實(shí)時(shí)存儲(chǔ),占用存儲(chǔ)空間小能實(shí)現(xiàn)多路實(shí)時(shí)存儲(chǔ),文件量大,消耗硬盤。能實(shí)現(xiàn)多路實(shí)時(shí)存儲(chǔ),文件量大,消耗硬盤。單路存儲(chǔ),丟幀切換聯(lián)網(wǎng)要求全帶寬解決方案, 支 持 P S T N ,ISDN,DDN,局域網(wǎng),廣域網(wǎng)等適用于局域網(wǎng)適用于局域網(wǎng)定制帶寬,不支持聯(lián)網(wǎng)。MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻和MPEG系統(tǒng)三大部分。MPEG算法除了對(duì)單幅圖像進(jìn)行編碼外(幀內(nèi)編碼),還利用圖像序列的相關(guān)特性去除幀間圖像冗余,大大提高了視頻圖像的壓縮比

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論