第三章多媒體數(shù)據(jù)壓縮技術(shù)_第1頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第2頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第3頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第4頁
第三章多媒體數(shù)據(jù)壓縮技術(shù)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章多媒體數(shù)據(jù)壓縮技術(shù)第一節(jié)多媒體數(shù)據(jù)壓縮技術(shù)概述第二節(jié)靜態(tài)圖像壓縮編碼國際標(biāo)準(zhǔn)—JPEG第三節(jié)運(yùn)動(dòng)圖像壓縮編碼國際標(biāo)準(zhǔn)—MPEG一、多媒體數(shù)據(jù)壓縮編碼的必要性二、多媒體數(shù)據(jù)壓縮的可能性

三、數(shù)據(jù)壓縮技術(shù)的分類四、數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)

第一節(jié)多媒體數(shù)據(jù)壓縮技術(shù)概述

信息時(shí)代的重要特征是信息的數(shù)字化。

早期的計(jì)算機(jī)系統(tǒng)采用模擬方式表示信息,但存在著明顯的缺點(diǎn):①經(jīng)常會(huì)產(chǎn)生噪音和信號(hào)丟失,并且在復(fù)制過程中逐步積累噪音和誤差。②模擬信號(hào)不適合數(shù)字計(jì)算機(jī)加工處理。一、多媒體數(shù)據(jù)壓縮編碼的必要性

數(shù)字化后未經(jīng)壓縮的視頻和音頻等媒體信息的數(shù)據(jù)量是非常大的。1.圖像數(shù)據(jù)量的大小可用下面的公式來計(jì)算:

圖像數(shù)據(jù)量=圖像的總像素×色彩深度÷8(單位為Byte,簡寫為B)

例如,一幅640×480、24位(bit)真彩色的圖像,其文件大小為:

640×480×24÷8=921.6KB一、多媒體數(shù)據(jù)壓縮編碼的必要性2.雙通道立體聲激光唱盤,采用脈沖碼調(diào)制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時(shí)間內(nèi)的采樣數(shù)據(jù)量為: 44.1×1000×16×2÷8=176.4KB

一個(gè)650MB的CD—ROM,大約可存1小時(shí)的音樂。一、多媒體數(shù)據(jù)壓縮編碼的必要性

3.對(duì)動(dòng)態(tài)圖形和視頻圖像。例如對(duì)于彩色電視信號(hào),設(shè)代表光強(qiáng)Y的帶寬為4.2MHz、色彩I為1.5MHz和色飽和度Q為0.5MHz,采樣頻率>2倍原始信號(hào)頻率,各分量均被數(shù)字量化為8位,從而1秒鐘電視信號(hào)的數(shù)據(jù)量為:(4.2+1.5+0.5)×2×8×1000000÷8=12.3MB一、多媒體數(shù)據(jù)壓縮編碼的必要性

容量為650MB的CD—ROM僅能存1分鐘的原始電視數(shù)據(jù)。若為高清晰度電視(HDTV)其1秒鐘數(shù)據(jù)量約為150MB(1.2Gbps÷8),一張CD—ROM還存不下5秒鐘的HDTV圖像。

巨大數(shù)字化信息的數(shù)據(jù)量對(duì)計(jì)算機(jī)存儲(chǔ)資源和網(wǎng)絡(luò)帶寬有很高的要求,解決的辦法就是要對(duì)視、音頻的數(shù)據(jù)進(jìn)行大量的壓縮。播放時(shí),傳輸少量被壓縮的數(shù)據(jù),接收后再對(duì)數(shù)據(jù)進(jìn)行解壓縮并復(fù)原。1.空間冗余

一幅圖像中一般都有連續(xù)的有規(guī)則物體和規(guī)則背景的顏色分布,使圖像數(shù)據(jù)在空間上表現(xiàn)出相關(guān)性,我們可以通過改變物體表面顏色的像素存儲(chǔ)方式來利用空間相關(guān)性,達(dá)到減少數(shù)據(jù)量的目的。例:圖象中的“A”是一個(gè)規(guī)則物體。光的亮度、飽和度及顏色都一樣,因此,數(shù)據(jù)A有很大的冗余。

二、多媒體數(shù)據(jù)壓縮的可能性2.時(shí)間冗余

圖像序列中的相鄰幀圖像往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同。我們把一幀圖像中的某物體或場(chǎng)景可以由其他幀圖像中的物體或場(chǎng)景進(jìn)行處理后重構(gòu)出來,可以大大減少時(shí)間冗余。3.結(jié)構(gòu)冗余

有些圖像從大體上看存在著非常強(qiáng)的紋理結(jié)構(gòu),這些紋理具有較強(qiáng)的相似性稱此為結(jié)構(gòu)冗余。如草席圖結(jié)構(gòu)上存在冗余。二、多媒體數(shù)據(jù)壓縮的可能性4.知識(shí)冗余

有許多圖像的理解與某些基礎(chǔ)知識(shí)有相當(dāng)大的相關(guān)性。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗余。

例:人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上……

5.視覺冗余

人類視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感性是非均勻和非線性的,人眼并不能察覺圖像場(chǎng)的所有變化,人類視覺系統(tǒng)的分辨能力約為64灰度等級(jí),而一般圖像量化采用256灰度等級(jí),這類冗余稱視覺冗余。二、多媒體數(shù)據(jù)壓縮的可能性6.聽覺冗余

人耳對(duì)不同頻率的聲音的敏感性是不同的,并不能察覺所有頻率的變化,對(duì)某些頻率不必特別關(guān)注,因此存在聽覺冗余。

二、多媒體數(shù)據(jù)壓縮的可能性

根據(jù)多媒體數(shù)據(jù)冗余類型的不同,解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致、質(zhì)量有無損失來進(jìn)行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。

無失真壓縮法也稱無損壓縮,一般是利用數(shù)據(jù)的統(tǒng)計(jì)特性來進(jìn)行數(shù)據(jù)壓縮,對(duì)數(shù)據(jù)流中出現(xiàn)的各種數(shù)據(jù)進(jìn)行概率統(tǒng)計(jì)編碼,使得數(shù)據(jù)流經(jīng)壓縮后形成的代碼流總位數(shù)大大減少。無失真壓縮的特點(diǎn)是壓縮比較小,大約在2∶l至5∶l之間,主要用于文本數(shù)據(jù)、程序代碼和某些要求嚴(yán)格不丟失信息的環(huán)境中,常用的無失真壓縮編碼有如哈夫曼編碼等。三、數(shù)據(jù)壓縮技術(shù)的分類三、數(shù)據(jù)壓縮技術(shù)的分類

有失真壓縮法也稱有損壓縮,允許一定程度的失真,會(huì)丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復(fù),即解壓縮后并不能完全恢復(fù)成原來的數(shù)據(jù),但是根據(jù)人的視覺和聽覺的主觀評(píng)價(jià)是可以接受的,有失真壓縮法的冗余壓縮取決于初始信號(hào)的類型、前后的相關(guān)性、信號(hào)的語義內(nèi)容等,壓縮比可以從幾到幾百倍。常用的有失真壓縮編碼技術(shù)有預(yù)測(cè)編碼、變換編碼、模型編碼、混合編碼方法等。主要用于壓縮圖像、聲音等信息。

常用的圖像和視頻壓縮方法如圖2-1所示:

哈夫曼編碼行程編碼算術(shù)編碼LZW編碼圖像和視頻壓縮方法DCT編碼小波變換子帶編碼無失真壓縮有失真壓縮預(yù)測(cè)編碼變換編碼模型編碼運(yùn)動(dòng)補(bǔ)償混合編碼分形編碼JPEGMPEGH.261三、數(shù)據(jù)壓縮技術(shù)的分類四、數(shù)據(jù)壓縮技術(shù)的性能指標(biāo)節(jié)省圖象或視頻的存儲(chǔ)容量,增加訪問速度,使數(shù)字視頻能在PC機(jī)上實(shí)現(xiàn),需要進(jìn)行視頻和圖象的壓縮。有三個(gè)關(guān)鍵參數(shù)評(píng)價(jià)一個(gè)壓縮系統(tǒng)壓縮比圖象質(zhì)量壓縮和解壓的速度

另外也必須考慮每個(gè)壓縮算法所需的硬件和軟件。

1.壓縮比壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)例:512×480,

24bit/pixel(bpp)輸出15000byte輸入=737280byte壓縮比=737280/15000=492.圖象質(zhì)量壓縮方法:

無損壓縮

(圖象質(zhì)量不變)有損壓縮有損壓縮:失真情況很難量化,只能對(duì)測(cè)試的圖象進(jìn)行估計(jì)。模擬圖象質(zhì)量的指標(biāo):信噪比、分辨率必須觀察實(shí)際圖象以后估計(jì)。3.壓縮解壓速度在許多應(yīng)用中,壓縮和解壓可能不同時(shí)用,在不同的位置不同的系統(tǒng)中。所以,壓縮、解壓速度分別估計(jì)。靜態(tài)圖象中,壓縮速度沒有解壓速度嚴(yán)格;動(dòng)態(tài)圖象中,壓縮、解壓速度都有要求,因?yàn)樾鑼?shí)時(shí)地從攝像機(jī)或VCR中抓取動(dòng)態(tài)視頻。4.硬軟件系統(tǒng)有些壓縮解壓工作可用軟件實(shí)現(xiàn)。設(shè)計(jì)系統(tǒng)時(shí)必須充分考慮:算法復(fù)雜-壓縮解壓過程長算法簡單-壓縮效果差目前有些特殊硬件可用于加速壓縮/解壓。硬接線系統(tǒng)速度快,但各種選擇在初始設(shè)計(jì)時(shí)已確定,一般不能更改。因此在設(shè)計(jì)硬接線壓縮/解壓系統(tǒng)時(shí)必須先將算法標(biāo)準(zhǔn)化。2.2靜態(tài)圖像壓縮國際標(biāo)準(zhǔn)--JPEG2.2.1靜態(tài)圖像壓縮編碼JPEG概況

2.2.2JPEG壓縮編碼的基本系統(tǒng)(1)數(shù)據(jù)塊準(zhǔn)備(2)離散余弦正變換DCT(3)量化(4)DCT系數(shù)Z形掃描(5)DC系數(shù)編碼(6)AC系數(shù)編碼2.2.3JPEG壓縮編碼的擴(kuò)展系統(tǒng)2.2.1靜態(tài)圖像壓縮編碼JPEG概況JPEG(JointPhotographicExpertsGroup)是一個(gè)由ISO和IEC兩個(gè)組織機(jī)構(gòu)聯(lián)合組成的一個(gè)專家組,負(fù)責(zé)制定靜態(tài)的數(shù)字圖象數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn),因此又稱為JPEG標(biāo)準(zhǔn)。JPEG是一個(gè)適用范圍很廣的靜態(tài)圖象數(shù)據(jù)壓縮標(biāo)準(zhǔn),適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。

JPEG是國際上彩色、灰度、靜止圖像的第一個(gè)國際標(biāo)準(zhǔn)。用來在低分辨率到高分辨率的較寬范圍內(nèi)支持較高的圖像分辨率。它不僅適用于黑白、彩色照片和印刷圖片(高分辨率)等靜止圖像的壓縮,而且適用于傳送彩色傳真、電話會(huì)議、新聞圖片(低分辨率)的靜止圖像的壓縮,以及電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn)。2.2.1靜態(tài)圖像壓縮編碼JPEG概況2.2.1靜態(tài)圖像壓縮編碼JPEG概況它滿足以下要求:(1)達(dá)到或接近當(dāng)前壓縮比圖像保真度的技術(shù)水平,能覆蓋一個(gè)較寬的圖像質(zhì)量等級(jí)范圍,能得到“很好”到“極好”的評(píng)估,與原始圖像相比,人的視覺難以區(qū)分。(2)能適用于任何種類的連續(xù)色調(diào)的圖像,且長寬比都不受限制,同時(shí)也不受限于景物內(nèi)容、圖像的復(fù)雜程度和統(tǒng)計(jì)特性等。(3)計(jì)算機(jī)的復(fù)雜性是可控制的,其軟件可在各種CPU上完成,算法也可用硬件實(shí)現(xiàn)。(4)JPEG算法具有4種操作方式。第一,為順序編碼,每個(gè)圖像分量按從左到右,從上到下掃描,一次掃描完成編碼;第二,累進(jìn)編碼,圖像編碼在多次掃描中完成,接收端收到圖像是一個(gè)由粗糙到清晰的過程;第三,無失真編碼;第四,分層編碼,對(duì)圖像按多個(gè)分辨率編碼,接收端按其顯示分辨率有選擇地解碼。

變換編碼的基本思路:

1.編碼時(shí)略去某些能量很小的高頻分量以降低碼率。

2.變換編碼還可以根據(jù)人眼對(duì)不同頻率分量的敏感程度而對(duì)不同系數(shù)采用不同的量化臺(tái)階,以進(jìn)一步提高壓縮比。

JPEG開發(fā)的壓縮編碼算法有三種工作方式:

1.基本系統(tǒng)(單次掃描)。

2.?dāng)U展系統(tǒng)(常采用累進(jìn)編碼或分層編碼方式)。

3.無損壓縮編碼。2.2.1靜態(tài)圖像壓縮編碼JPEG概況2.2.2JPEG

壓縮編碼的基本系統(tǒng)

下面是一個(gè)基于離散余弦正變換DCT的有失真JPEG編碼的工作原理,圖2-11是基于DCT的JPEG編碼的過程框圖。

2.2.2JPEG

壓縮編碼的基本系統(tǒng)

順序編碼運(yùn)行方式2.2.3JPEG

壓縮編碼的擴(kuò)展系統(tǒng)1.基于DCT的累進(jìn)編碼運(yùn)行方式

累進(jìn)編碼方式要掃描多次2.2.3JPEG

壓縮編碼的擴(kuò)展系統(tǒng)2.分層編碼運(yùn)行方式

水平方向和垂直方向分辨率以2的倍數(shù)因子下降(降低原始圖像的空間分辨率),導(dǎo)出若干低分辨率的原圖像,分層后再采用JPEG的壓縮編碼方法進(jìn)行編碼,隨后以上重復(fù)步驟,直到圖像達(dá)到完整的分辨率編碼為止。2.2.3JPEG壓縮編碼的擴(kuò)展系統(tǒng)3.無損壓縮預(yù)測(cè)編碼運(yùn)行方式源圖像數(shù)據(jù)表說明預(yù)測(cè)器熵編碼器壓縮后圖像數(shù)據(jù)無損壓縮預(yù)測(cè)編碼

運(yùn)行方式Px2.3運(yùn)動(dòng)圖像壓縮編碼的國際標(biāo)準(zhǔn)—MPEG2.3.1運(yùn)動(dòng)圖像壓縮編碼—MPEG概況

2.3.2MPEG標(biāo)準(zhǔn)簡介

2.3.3MPEG標(biāo)準(zhǔn)化算法幀間編碼技術(shù)運(yùn)動(dòng)補(bǔ)償技術(shù)

2.3.4MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)

2.3.5MPEG音頻簡述MPEG本是MovingPicturesExpertsGroup,動(dòng)態(tài)圖象專家組的英文縮寫,這個(gè)專家組始建于1988年,專門負(fù)責(zé)為CD建立視頻和音頻標(biāo)準(zhǔn),其成員均為視頻、音頻及系統(tǒng)領(lǐng)域的技術(shù)專家。對(duì)于今天我們所范指的MPEG-X版本,是指一組由ITU(InternationalTelecommunicationsUnion)和ISO(InternationalStandardsOrganization)制定發(fā)布的視頻、音頻、數(shù)據(jù)的壓縮標(biāo)準(zhǔn)。

2.3.1運(yùn)動(dòng)圖像壓縮編碼—MPEG概況2.3.1運(yùn)動(dòng)圖像壓縮編碼—MPEG概況MPEG的締造者們?cè)却蛩汩_發(fā)四個(gè)版本:MPEG1-MPEG4,以適用于不同帶寬和數(shù)字影像質(zhì)量的要求。后由于MPEG3被放棄,所以現(xiàn)存只有三個(gè)版本的MPEG:MPEG-1,MPEG-2,MPEG-4。總體來說,MPEG在三方面優(yōu)于其他壓縮/解壓縮方案。首先,它做為一個(gè)國際化的標(biāo)準(zhǔn),MPEG具有很好的兼容性。其次,MPEG能夠比其他算法提供更好的壓縮比,最高可達(dá)200:1。再次,MPEG在提供高壓縮比的同時(shí),對(duì)數(shù)據(jù)的損失很小。2.3.1運(yùn)動(dòng)圖像壓縮編碼—MPEG概況

MPEG專家組工作將整個(gè)過程分為三步:

①要求

提出要求有雙重的目的:目標(biāo),競(jìng)爭的原則。

②竟?fàn)?/p>

提出了14個(gè)不同的方案。

③集中

測(cè)試和評(píng)價(jià),并綜合出一個(gè)最佳方案。2.3.2MPEG

標(biāo)準(zhǔn)簡介MPEG標(biāo)準(zhǔn)有:MPEG-1:1992年正式發(fā)布的數(shù)字電視標(biāo)準(zhǔn);MPEG-2:數(shù)字電視標(biāo)準(zhǔn);MPEG-3:于1992年合并到高清晰度電視(HDTV)工作組;MPEG-4:1999年發(fā)布的多媒體應(yīng)用標(biāo)準(zhǔn);MPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn),活動(dòng)圖像專家組在91年11月提出了“用于數(shù)據(jù)速率大約高達(dá)1.5MB/s的數(shù)字存儲(chǔ)媒體的電視圖像和伴音編碼”,作為ISO11172號(hào)建議,于92年通過,習(xí)慣上通稱MPEG-1標(biāo)準(zhǔn)。此標(biāo)準(zhǔn)主要是針對(duì)當(dāng)時(shí)具有這種數(shù)據(jù)輿率的CD-ROM開發(fā)的,用于在CD-ROM上存儲(chǔ)數(shù)字影視和上傳輸數(shù)字影。PAL制為352×288pixel/frame×25frame/sNTSC制為352×240pixel/frame×30frame/s。1.MPEG—1標(biāo)準(zhǔn)MPEG-1主要用于活動(dòng)圖像的數(shù)字存儲(chǔ),它包括MPEG-1系統(tǒng)、MPEG-1視頻、MPEG-1音頻三個(gè)部分MPEG-1系統(tǒng):將視頻信號(hào)及其伴音以可接收的重建質(zhì)量壓縮到約1.5MB/s的碼率,并復(fù)合成一個(gè)單一的MPEG位流,同時(shí)保證視頻和音頻的同步。MPEG-1視頻:用于滿足日益增長的多媒體存儲(chǔ)與表現(xiàn)的需要,即以一種通用格式在不同的數(shù)字存儲(chǔ)介質(zhì)如VCD、CD、DAT、硬盤和光盤中表示壓縮的視頻。該壓縮算法采用三個(gè)基本技術(shù):運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼、DCT技術(shù)和變字長編碼技術(shù)。MPEG-1音頻:規(guī)定聲音數(shù)據(jù)的編碼和解碼。1.MPEG—1標(biāo)準(zhǔn)1.MPEG—1

標(biāo)準(zhǔn)

設(shè)計(jì)目標(biāo)是把每秒傳送30幀、分辨率為360×240的亮度信號(hào),分辨率為180×120的色度信號(hào)的電視圖像壓縮成數(shù)據(jù)率為1.2Mbps的編碼圖像。

MPEG—1電視圖像的壓縮算法采用兩種基本壓縮技術(shù):①為減少時(shí)間冗余度,采用16×16個(gè)像素組成的圖像塊的運(yùn)動(dòng)補(bǔ)償技術(shù)。②為了減少空間冗余度,采用8×8圖像化的DCT變換技術(shù)。1.MPEG—1

標(biāo)準(zhǔn)

聲音壓縮編碼技術(shù)支持高壓縮的音頻數(shù)據(jù)流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音壓縮(如CD-DA音頻1.4Mbps壓縮為0.192Mbps)。支持兩個(gè)聲道,可設(shè)置成單聲道(mono)、雙聲道(dual)或立體聲(stereo)。例如采用MPEG—1算法可以把位速率降到0.192Mbps。

MPEG—1系統(tǒng)采用多路復(fù)合技術(shù),把數(shù)字電視圖像和聲音復(fù)合成單一數(shù)據(jù)位流,MPEG—1的數(shù)據(jù)位流分成內(nèi)外兩層,外層為系統(tǒng)層,內(nèi)層為壓縮層。2.MPEG—2

標(biāo)準(zhǔn)MPEG-2的標(biāo)準(zhǔn)號(hào)為ISO/IEC13818,標(biāo)準(zhǔn)名稱為“信息技術(shù)—電視圖像和伴音信息通用編碼”。它是聲音和圖像信號(hào)數(shù)字化的基礎(chǔ)標(biāo)準(zhǔn),將廣泛用于數(shù)字電視(包括HDTV)及數(shù)字聲音廣播、數(shù)字圖像與聲音信號(hào)的傳輸,多媒體等領(lǐng)域。MPEG-2標(biāo)準(zhǔn)是一個(gè)直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn),MPEG-2視頻利用網(wǎng)絡(luò)提供的更高的寬帶來支持具有更高分辨率圖像的壓縮和更高的圖像質(zhì)量。

2.MPEG—2

標(biāo)準(zhǔn)

設(shè)計(jì)目標(biāo)是把以166Mbps速度傳送每秒30幀、幀分辨率為720×572高分辨率的廣播級(jí)視頻圖像,壓縮后的傳送數(shù)據(jù)率約為3Mbps。

MPEG—2標(biāo)準(zhǔn)是HDTV、DVD以及新型數(shù)字式交互有線網(wǎng)所采用的數(shù)字視頻壓縮標(biāo)準(zhǔn)。

MPEG—2標(biāo)準(zhǔn)是MPEG—1標(biāo)準(zhǔn)的擴(kuò)充、豐富和完善,并與MPEG—1標(biāo)準(zhǔn)相兼容。2.MPEG—2

標(biāo)準(zhǔn)

MPEG—2標(biāo)準(zhǔn)主要分為四部分:

第一部分:系統(tǒng)。第二部分:視頻。第三部分:音頻。第四部分:一致性測(cè)試。

MPEG—2標(biāo)準(zhǔn)使計(jì)算機(jī)處理全彩色、全屏幕、全動(dòng)態(tài)的視頻圖像,同時(shí)也能使有線、無線、CD-ROM等傳輸和存儲(chǔ)介質(zhì)有效地傳送視頻圖像,并且具有CD的音質(zhì),使多媒體技術(shù)與通信和廣播等技術(shù)結(jié)合起來。2.MPEG—2

標(biāo)準(zhǔn)MPEG-2系統(tǒng):規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其他相關(guān)數(shù)據(jù)的同步性。MPEG-2視頻:定義了不同的功能檔次,每個(gè)檔次又分為幾個(gè)等級(jí),來適應(yīng)不同應(yīng)用的要求,并保證數(shù)據(jù)的可交換性。目前共有5個(gè)檔次,依功能增強(qiáng)逐次為:簡單型、基本型、信噪比可調(diào)型、空間可調(diào)型、增強(qiáng)型。4個(gè)等級(jí)為:(1)低級(jí)(352×288×29.79,面向VCR并與MPEG-1兼容)。(2)基本級(jí)(720×460×29.79或720×576×25,面向NTSC制式的視頻廣播信號(hào))。(3)高1440級(jí)(1400×1080×30或1400×1152×25,面向HDTV)。(4)高級(jí)(1920×1080×30或1920×1152×25,面向HDTV)MPEG-2音頻:MPEG-2音頻的基本特性之一是與MPEG-1音頻向后兼容,并且支持5.1或7.1通道的環(huán)繞立體聲。3.MPEG—4

標(biāo)準(zhǔn)

用來支持低比特率下的多媒體通信(公用電信網(wǎng)14.4~19.2Kbps),還支持用于通信、訪問和數(shù)字視聽數(shù)據(jù)處理的新方法。注重多媒體系統(tǒng)的交互性和靈活性,以最少量的數(shù)據(jù)、極低的音頻/視頻壓縮碼率來顯示建立精確的畫面,達(dá)到具有高效編碼、高效存儲(chǔ)與傳播以及可交互操作的特性。3.MPEG—4

標(biāo)準(zhǔn)它是為視聽數(shù)據(jù)的編碼和交互播放開發(fā)算法和工具,是一個(gè)數(shù)據(jù)速率很低的多媒體通信標(biāo)準(zhǔn)。其目標(biāo)是要在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且具有很強(qiáng)的交互功能。為此它引入了對(duì)象基表達(dá)的要領(lǐng),用來表達(dá)視聽對(duì)象(AVO),并擴(kuò)充了編碼的數(shù)據(jù)類型,由自然數(shù)據(jù)對(duì)象擴(kuò)展到計(jì)算機(jī)生成的合成數(shù)據(jù)對(duì)象,采用合成對(duì)象、自然對(duì)象混合編碼算法。在實(shí)現(xiàn)交互功能和重用對(duì)象中引入了組合,合成和編排等重要要領(lǐng)4.MPEG—7

標(biāo)準(zhǔn)

正式名稱為多媒體內(nèi)容描述接口。

MPEG—7標(biāo)準(zhǔn)只規(guī)定信息內(nèi)容描述格式,而不規(guī)定如何從原始的多媒體資料中抽取內(nèi)容描述和查詢、檢索方法。MPEG—7標(biāo)準(zhǔn)不針對(duì)特定的應(yīng)用領(lǐng)域,而是盡可能支持廣泛的應(yīng)用領(lǐng)域。下圖表示了MPEG-7的處理鏈(ProcessingChain),這是高度抽象的方框圖。MPEG-7的應(yīng)用領(lǐng)域很廣,包括:數(shù)字圖書館。例如,圖像目錄、音樂詞典等。多媒體目錄服務(wù)。例如,黃頁等。廣播式媒體的選擇。例如,無線電頻道、TV頻道等。個(gè)人電子新聞服務(wù)、多媒體創(chuàng)作等。教育、娛樂、新聞、旅游、醫(yī)療和電子商務(wù)等。視頻壓縮算法用到了三項(xiàng)基本技術(shù):①幀間編碼技術(shù)和基于塊的運(yùn)動(dòng)補(bǔ)償技術(shù)。②空間壓縮(也稱為幀內(nèi)壓縮)JPEG技術(shù)。③熵編碼,使用Huffman編碼技術(shù)。MPEG標(biāo)準(zhǔn)所用的編碼模型與JPEG的編碼模型類似,分為5個(gè)階段:

幀間編碼和運(yùn)動(dòng)補(bǔ)償、變換編碼、量化、直流分量DC及交流分量AC的編碼和熵編碼。2.3.3MPEG標(biāo)準(zhǔn)化算法1.幀間編碼技術(shù)

利用的時(shí)間相關(guān)性可進(jìn)一步消除視頻其相鄰幀之間具有冗余信息,提高壓縮比。

將圖像分成三種類型:

1.參考幀(I)(JPEG編碼)以自身圖像的相關(guān)性進(jìn)行壓縮處理,必須要傳送。

2.預(yù)測(cè)幀(P)

用前面的參考幀或預(yù)測(cè)幀作為參照?qǐng)D像信息進(jìn)行預(yù)測(cè)編碼,并可作為下一個(gè)預(yù)測(cè)幀(B幀圖像或P幀圖像)的參照?qǐng)D像信息。但因此可能引起預(yù)測(cè)誤差。1.幀間編碼技術(shù)3.雙向預(yù)測(cè)幀(B)

又稱插補(bǔ)幀,在預(yù)測(cè)時(shí),既可以使用前面或后面的視頻幀(I參考幀,P預(yù)測(cè)幀)進(jìn)行雙向預(yù)測(cè),也可以同時(shí)使用前后兩個(gè)視頻幀進(jìn)行預(yù)測(cè)編碼,但本身不能作為下一個(gè)預(yù)測(cè)幀的參照?qǐng)D像信息。(200∶1)在編碼時(shí),先對(duì)參考幀進(jìn)行變換編碼,然后對(duì)預(yù)測(cè)幀進(jìn)行編碼,再對(duì)兩者之間的雙向預(yù)測(cè)幀進(jìn)行編碼,這個(gè)過程對(duì)隨后的下一個(gè)預(yù)測(cè)幀和雙向預(yù)測(cè)幀重復(fù),直到完成所有幀的編碼為止。1.幀間編碼技術(shù)

采用下述四種預(yù)測(cè)技術(shù):①幀內(nèi)編碼

②前向預(yù)測(cè)③后向預(yù)測(cè)④雙向預(yù)測(cè)

圖3-20顯示一個(gè)典型的視頻圖像序列次序。

IBBPBBPBBPBBPBBIBB123456789101112131415161718

I幀和P幀間有兩個(gè)B幀每十五幀有一幅I幀圖像(0.5秒)1.幀間編碼技術(shù)

編碼器的輸出視頻圖像序列排列順序。1423756108IPBBPBBPB9131112161415……

BPBBIBB……

發(fā)送端編碼器的輸出到接收端解碼器的輸入端,經(jīng)解碼器的輸出,又恢復(fù)為圖3-12編碼器輸入順序顯示。2.運(yùn)動(dòng)補(bǔ)償技術(shù)(塊)

運(yùn)動(dòng)矢量選擇二維16×16像素塊作為一個(gè)的運(yùn)動(dòng)矢量處理。運(yùn)動(dòng)矢量又稱為宏塊,它有不同的類型:可以是I幀內(nèi)型,F(xiàn)前向預(yù)測(cè)型、B后向預(yù)測(cè)型和A平均值(雙向預(yù)測(cè))型。

概念:

當(dāng)前圖像可看作是前一幀圖像位移后的結(jié)果,其位移的內(nèi)容包括運(yùn)動(dòng)方向和運(yùn)動(dòng)幅度。運(yùn)動(dòng)補(bǔ)償方法是跟蹤畫面內(nèi)的運(yùn)動(dòng)情況并對(duì)其加以補(bǔ)償后,與當(dāng)前的圖像宏塊值相減得到預(yù)測(cè)誤差,再進(jìn)行編碼、傳送。2.運(yùn)動(dòng)補(bǔ)償技術(shù)(塊)

討論預(yù)測(cè)器計(jì)算表達(dá)式,設(shè)前一參照幀為I0,后一參照幀為I2,當(dāng)前幀為I1的示意圖,求預(yù)測(cè)值。

F前向B后向2.運(yùn)動(dòng)補(bǔ)償技術(shù)(塊)

表3-13給出了I幀內(nèi)塊、F前向預(yù)測(cè)塊、B后向預(yù)測(cè)塊和A平均值塊的預(yù)測(cè)器的計(jì)算表達(dá)式。為當(dāng)前幀I1的值,預(yù)測(cè)誤差I(lǐng)FBA

2.3.4

MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)圖像序列頭圖像組圖像組序列尾

圖像組圖像組頭圖象I、P、B圖象I、P、B圖像頭宏塊片宏塊片宏塊片頭宏塊宏塊18×828×838×848×858×868×88×8視頻序列層圖像組層宏塊片層宏塊層YCbCr圖像層塊層幀間編碼運(yùn)動(dòng)補(bǔ)償JPEGMPEG—2視頻數(shù)據(jù)流的六層結(jié)構(gòu)圖視頻數(shù)據(jù)流之間的關(guān)系圖圖像組層宏塊層8×8像素塊層

宏塊片層視頻序列層圖像層2.3.4

MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)1.視頻序列層:

圖像序列頭包含了圖像寬度、高度、像素長寬比、幀率、位率、緩沖區(qū)尺寸、量化矩陣等信息。

2.圖像組層:

圖像組頭包含時(shí)間代碼等信息,圖像組中的第一個(gè)圖像總是I圖像幀。

3.圖像層:

由圖像頭及多個(gè)宏塊片構(gòu)成的。圖像頭包含該圖像的編碼類型及碼表選擇等信息。2.3.4

MPEG視頻壓縮數(shù)據(jù)流結(jié)構(gòu)4.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論