第6章 壓縮編碼標(biāo)準(zhǔn)_第1頁
第6章 壓縮編碼標(biāo)準(zhǔn)_第2頁
第6章 壓縮編碼標(biāo)準(zhǔn)_第3頁
第6章 壓縮編碼標(biāo)準(zhǔn)_第4頁
第6章 壓縮編碼標(biāo)準(zhǔn)_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章多媒體數(shù)據(jù)的壓縮本章要求

1、了解數(shù)據(jù)壓縮的必要性和數(shù)據(jù)中存在的各種冗余2、熟悉數(shù)據(jù)壓縮的基本原理和常用的數(shù)據(jù)壓縮方法3、掌握無損壓縮的編碼算法

(行程編碼哈夫曼編碼算術(shù)編碼)4、了解有損壓縮的編碼算法(統(tǒng)計(jì)編碼預(yù)測編碼、變換編碼)5、熟悉常用多媒體數(shù)據(jù)壓縮的標(biāo)準(zhǔn)6.1數(shù)據(jù)壓縮概述

1、

壓縮的必要性

聲音、圖像、視頻和動畫的數(shù)據(jù)量太大聲音1分鐘立體聲音樂采樣頻率為44.1KHZ,16位量化精度的數(shù)據(jù)量為

44.1*1000*16*2*60/8=10.09MB

存儲一首4分鐘的歌曲約需40MB圖像

1副640*480的RGB彩色圖像的存儲容量為

640*480*24/8=900KB視頻

1秒鐘(25幀/秒)的視頻數(shù)據(jù)量為

25*900KB=21.97MB1張650MB的CDROM光盤只能存儲約650/21.97=29.59秒的視頻空間冗余:圖像內(nèi)部相鄰像素之間的相關(guān)性時(shí)間冗余:視頻序列中前后幀之間的相關(guān)性視覺或聽覺冗余(人眼或人耳具有一定的掩蔽效應(yīng))知識冗余(具有規(guī)律性的結(jié)構(gòu),用于圖像理解上,如人臉)統(tǒng)計(jì)冗余(字符出現(xiàn)的頻率具有一定的規(guī)律性)結(jié)構(gòu)冗余(具有紋理結(jié)構(gòu)的圖像區(qū)域)信息熵冗余(即編碼冗余,用相同位數(shù)進(jìn)行編碼產(chǎn)生的冗余)2數(shù)據(jù)冗余6.2數(shù)據(jù)壓縮的基本原理1、信息編碼基礎(chǔ)壓縮的實(shí)質(zhì):根據(jù)數(shù)據(jù)的內(nèi)在聯(lián)系將數(shù)據(jù)從一種編碼映射為另一種編碼,又叫壓縮編碼。編碼器(壓縮)存儲器或網(wǎng)絡(luò)解碼器(解壓縮)輸入數(shù)據(jù)輸出數(shù)據(jù)數(shù)據(jù)壓縮過程數(shù)據(jù)壓縮方法的衡量指標(biāo)

壓縮率:越大越好

壓縮質(zhì)量:數(shù)據(jù)失真越小越好

壓縮與解壓縮的速度:速度越快越好2、數(shù)據(jù)壓縮方法無損壓縮有損壓縮混合編碼預(yù)測編碼變換編碼PCM編碼DPCM編碼ADPCM編碼幀間預(yù)測編碼離散余弦變換K-L變換小波變換JPEGMPEGH.261行程編碼哈夫曼編碼算術(shù)編碼香農(nóng)編碼LZW編碼統(tǒng)計(jì)編碼6.3數(shù)據(jù)壓縮的編碼算法無損壓縮編碼算法行程編碼哈夫曼編碼算術(shù)編碼

有損壓縮編碼算法

PCM(脈沖編碼調(diào)制)預(yù)測編碼變換編碼重點(diǎn)一、無損壓縮原理:

減少或去除數(shù)據(jù)中的冗余;優(yōu)點(diǎn):可以無失真地還原成原來的數(shù)據(jù);缺點(diǎn):但是壓縮比率較小,一般在2:1到5:1之間;應(yīng)用:壓縮數(shù)據(jù)或程序;1.行程編碼(游程編碼)原理:將連續(xù)相同的數(shù)據(jù)序列用重復(fù)次數(shù)和單個(gè)數(shù)據(jù)來表示。應(yīng)用:用于圖像文件的壓縮(尤其適合于由計(jì)算機(jī)生成的圖像)如bmp和tiff等圖像格式。

(1)多值信息的編碼

編碼格式:信息重復(fù)次數(shù)+被重復(fù)的信息

例:字符串為:atttefppppppddddss 行程編碼為:a3tef6p4d2s

(2)二值信息的編碼

編碼格式:0或1重復(fù)的次數(shù)

例如二進(jìn)制數(shù)據(jù)流為000111111000001111假設(shè)行程約定以0開始,則編碼為:3654若約定以1開始,則編碼為:036542.哈夫曼(Huffman)編碼算法步驟(1)按照符號出現(xiàn)的概率大小進(jìn)行排序(2)把最小的兩個(gè)概率值相加,得到一個(gè)新的概率序列(3)重復(fù)上述兩個(gè)步驟,直到概率值為1(4)從后往前進(jìn)行編碼,概率大的賦予1,概率小的賦予0。(反過來也可以)(5)寫出每個(gè)符號的碼字例1:字母ABCDE出現(xiàn)的概率分別為0.15、0.25、0.1、0.37和0.13,其哈夫曼編碼為:P(C)=0.1P(E)=0.13P(CE)=0.23P(A)=0.15P(ACE)=0.38P(B)=0.25P(D)=0.37P(BD)=0.62P(ACEBD)=100001111A:00B:10C:010D:11E:011

假設(shè)共有100個(gè)字符,若采用等長編碼,每個(gè)字符至少需要3位二進(jìn)制,100個(gè)字母需要300位,采用哈夫曼編碼則只需要15*2+25*2+10*3+37*2+13*3=223位。壓縮比為300:223=1.34:1例2:字母ABCDE出現(xiàn)的概率分別為0.53、0.25、0.07、0.05和0.1,其哈夫曼編碼為:A:1B:01C:0011D:0010E:000

若采用等長編碼,至少需要3位二進(jìn)制,100個(gè)字母需要300位,采用哈夫曼編碼則需要:53*1+25*2+7*4+5*4+10*3=181位壓縮比為300:181=1.65:10P(E)=0.1P(D)=0.05P(C)=0.07P(DC)=0.12P(EDC)=0.22P(B)=0.25P(EDCBA)=1000111P(EDCB)=0.47P(A)=0.53013、算術(shù)編碼編碼原理:將被編碼信源表示為[0,1)區(qū)間的一個(gè)實(shí)數(shù),根據(jù)各符號出現(xiàn)的概率構(gòu)造其所在區(qū)間,隨著信息字符的不斷出現(xiàn),其所在區(qū)間越來越小,對應(yīng)表示的實(shí)數(shù)也越來越小。例:假設(shè)有一個(gè)4個(gè)符號的信源A={a1,a2,a3,a4},各符號出現(xiàn)的概率及起始編碼區(qū)間如下表:信號字符出現(xiàn)概率起始編碼區(qū)間a10.2[0,0.2)a20.4[0.2,0.6)a30.2[0.6,0.8)a40.2[0.8,1.0)新區(qū)間的計(jì)算方法:新區(qū)間起始位置:前面區(qū)間起始位置+當(dāng)前區(qū)間左端*前面區(qū)間長度

新區(qū)間長度:當(dāng)前符號的概率*前面區(qū)間長度假設(shè)要傳送的消息為a1a2a3a2,算術(shù)編碼的過程為:①a1,取值區(qū)間為[0,0.2)②a2,起點(diǎn):0+0.2*0.2=0.04,長度0.4*0.2=0.08,新區(qū)間為[0.04,0.12)③a3,起點(diǎn):0.04+0.6*0.08=0.088,長度0.2*0.08=0.016,新區(qū)間為[0.088,0.104)④a2,起點(diǎn):0.088+0.2*0.016=0.0912,長度0.4*0.016=0.0064,新區(qū)間為[0.09120.0976)編碼結(jié)果:0.0912信號字符出現(xiàn)概率編碼范圍a10.2[0,0.2)a20.4[0.2,0.6)a30.2[0.6,0.8)a40.2[0.8,1.0)信息:a1a2a3a2信源符號0.20.120.1040.097600.040.0880.0912輸出區(qū)間內(nèi)任一數(shù)編碼區(qū)間a4a3a2a10.20.60.801二、有損壓縮原理:

減少或去除數(shù)據(jù)中的冗余,壓縮時(shí)會丟失部分?jǐn)?shù)據(jù),且丟失的數(shù)據(jù)無法恢復(fù);優(yōu)點(diǎn):壓縮比率較大;缺點(diǎn):解壓縮以后的數(shù)據(jù)與原始數(shù)據(jù)不完全一致;應(yīng)用:壓縮視頻、圖像和音頻等;1.PCM(PulseCodeModulation,脈沖編碼調(diào)制)采樣:按固定時(shí)間間隔獲取一個(gè)樣本值量化:按允許的誤差將樣本對應(yīng)到近似的數(shù)值(幅度上的離散化)。有均勻量化和非均勻量化。編碼:用二進(jìn)制代碼表示采樣量化后的樣本值。2.預(yù)測編碼(1)DPCM(差分脈沖編碼調(diào)制)編碼器量化器輸入預(yù)測器編碼器信道信道s+-ee’++s’s”編碼器預(yù)測器++s’s”e’輸出解碼器原始信號為:s,預(yù)測器產(chǎn)生的預(yù)測值為:s”預(yù)測誤差:e=s-s”發(fā)送端:發(fā)送經(jīng)過量化的誤差e’接收端:用相同的預(yù)測器獲得預(yù)測值s”,

輸出s’=s”+e’最終誤差為:

s’-s=s”+e’-s=e’–(s-s”)=e’-e(即量化器產(chǎn)生的量化誤差)(2)ADPCM(自適應(yīng)脈沖編碼調(diào)制)

自適應(yīng)量化:當(dāng)信號分布不均勻時(shí),能隨輸入信號的變化改變量化區(qū)間的大小。自適應(yīng)預(yù)測:采用過去的樣本值估算下一個(gè)輸入樣本的預(yù)測值,得到最小的實(shí)際樣本值與預(yù)測值之間的差值。(3)幀間預(yù)測編碼

利用視頻圖像各幀之間的時(shí)間相關(guān)性,減少幀內(nèi)圖像信號的冗余,即不直接傳送當(dāng)前幀的像素值,而是傳送x和其前一幀或后一幀對應(yīng)像素x’之間的差值。運(yùn)動補(bǔ)償?shù)膸g預(yù)測幀間內(nèi)插法(4)線性預(yù)測編碼(LinearPredictiveCoding,LPC)

采用過去的樣本值,以一種前向反饋的方式預(yù)測當(dāng)前采樣值,預(yù)測值可以用過去p個(gè)樣本值的線性組合來表示。該方法被廣泛應(yīng)用于語音處理。3.變換編碼將圖像信號從一個(gè)域(如時(shí)間域)變換到另外一個(gè)域(如頻率域),然后對變換后的信號進(jìn)行量化與編碼。正交變換前兩個(gè)樣本的聯(lián)合事件正交變換后兩個(gè)樣本的聯(lián)合事件例:有兩個(gè)相鄰的數(shù)據(jù)樣本x1和x2,每個(gè)樣本采用3bit編碼,各自都有8個(gè)幅度等級,兩個(gè)樣本的聯(lián)合事件共有64種可能,用64個(gè)點(diǎn)表示。對一般的像來說,兩個(gè)相鄰的數(shù)據(jù)樣本很有可能出現(xiàn)近似的幅度,即很可能出現(xiàn)在x1=x2直線附近。對該數(shù)據(jù)進(jìn)行正交變換,將坐標(biāo)系逆時(shí)針旋轉(zhuǎn)45度,在新坐標(biāo)系中y1對應(yīng)到x1=x2這條直線,那么變換后的數(shù)據(jù)樣本集中在y1軸上,對這部分?jǐn)?shù)據(jù)進(jìn)行量化、編碼和傳輸,其他數(shù)據(jù)不做處理,這樣就達(dá)到了壓縮數(shù)據(jù)的目的。常用的變換編碼方法有:1、K-L變換2、傅立葉變換3、離散余弦變換等1.電話語音壓縮標(biāo)準(zhǔn)

數(shù)據(jù):帶寬為200Hz~3.4kHz,采樣頻率為8kHz,8位量化,傳輸速率為64kb/s

語音壓縮標(biāo)準(zhǔn):G.722(64kb/s)、G.721(32kb/s)、G.728(16kb/s)和G.729(8kb/s)

應(yīng)用:數(shù)字電話通信。

6.4 常用多媒體數(shù)據(jù)壓縮標(biāo)準(zhǔn)

6.4.1音頻壓縮標(biāo)準(zhǔn)2.調(diào)幅廣播語音壓縮標(biāo)準(zhǔn)

數(shù)據(jù):帶寬為50hz~7khz的調(diào)幅廣播語音,使用16kHz采樣頻率和14位量化位數(shù)時(shí),所對應(yīng)的速率為224kb/s。

語音壓縮標(biāo)準(zhǔn):G.722應(yīng)用:優(yōu)質(zhì)語音、音樂、音頻會議和視頻會議等。3.高保真立體聲的寬帶音頻壓縮標(biāo)準(zhǔn)

數(shù)據(jù):采樣頻率44.1kHz,用16位量化,速率為每聲道705kb/s。語音壓縮標(biāo)準(zhǔn):MPEG音頻MPEG-1音頻:層Ⅰ(簡化的ASPEC)層Ⅱ(即MUSICAM,又稱MP2)層Ⅲ(又稱MP3)。

MPEG-2音頻:多聲道,5.1聲道形式及7.1聲道形式

應(yīng)用:影劇院、家庭影院系統(tǒng),及將來的高清晰度電視(HDTV)。6.4.2靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG(jointphotographicexpertsgroup)聯(lián)合照片專家組

1.JPEG標(biāo)準(zhǔn)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)的靜止數(shù)字圖像。支持很高的圖像分辨率和量化精度,具有較高的壓縮比和圖像質(zhì)量。包含了基于DCT的有損壓縮方法和基于預(yù)測方法的無損壓縮方法。

2.JPEG2000標(biāo)準(zhǔn)

特征:支持低比特率傳輸,支持無損和有損壓縮,象素精度和分辨率的漸進(jìn)式傳輸,感興趣域編碼,隨機(jī)碼流訪問和處理。經(jīng)典算法:包含三個(gè)部分:小波變換、畫布坐標(biāo)系統(tǒng)、嵌入式優(yōu)化截?cái)嗑幋a(EBCOT)。

壓縮標(biāo)準(zhǔn)屏幕比例分辨率幀頻備注MPEG-14:3352x24029.97NTSC制式MPEG-14:3352x28825PAL制式MPEG-24:3720×48029.97NTSC制式MPEG-24:3720×57625PAL制式HDTV16:91920*1080p60逐行,但并沒有信號源HDTV16:91920*1080i60隔行掃描,中國標(biāo)準(zhǔn)HDTV16:91280*720p60逐行,中國標(biāo)準(zhǔn)6.4.3運(yùn)動圖像和視頻壓縮編碼標(biāo)準(zhǔn)MPEG:運(yùn)動圖像專家組(MovingPictureExpertsGroup)

MPEG標(biāo)準(zhǔn)和HDTV標(biāo)準(zhǔn)視頻壓縮標(biāo)準(zhǔn)1.H.261和H.263標(biāo)準(zhǔn)國際電信聯(lián)盟電信標(biāo)準(zhǔn)組織ITU-T制定H.261:主要用來支持在ISDN上進(jìn)行可視電話、視頻會議和其它視聽服務(wù)。H.263:主要用于公共電話交換網(wǎng)絡(luò)(PSTN)上的視頻會議和其它可視化服務(wù),旨在以盡可能低的碼率(64kpbs以下)進(jìn)行通信。2.H.26L標(biāo)準(zhǔn)

在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。

支持的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論