視頻壓縮標準_第1頁
視頻壓縮標準_第2頁
視頻壓縮標準_第3頁
視頻壓縮標準_第4頁
視頻壓縮標準_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

視頻壓縮標準1第一頁,共七十四頁,編輯于2023年,星期四主要內容視頻壓縮標準發(fā)展歷史H.26X系列壓縮標準簡介MPEG系列壓縮標準簡介2第二頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準發(fā)展歷史ITU:ISO/IEC:H.261H.262H.263H.263+H.264MPEG1MPEG2MPEG4(Part2)MPEG7MPEG21MPEG4(Part10)3第三頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準對比H.261p×64kb/s視頻編碼標準

時間1990年12月輸入176×144(QCIF)352×288(CIF)幀速率可變<=30輸出p×64kb/s(p=1,2,…,32)壓縮率20~30小于MPEG1壓縮算法運動補償幀間預測與分塊DCT相結合的混合編碼應用可視電話、視頻會議等對稱應用4第四頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準對比(續(xù))MPEG1數(shù)據傳輸速率為1.5Mb/s的數(shù)字存儲媒體運動圖像及其伴音編碼標準時間1993年8月輸入視頻:352×240×30,352×288×25音頻:32、44.1、48kHz的線性PCM輸出1.5Mb/s、32-384Kb/s(音頻)壓縮率20~30壓縮算法運動補償幀間預測(單向預測+雙向預測)+DCT應用VCD、MP3、局域網視頻傳輸5第五頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準對比(續(xù))MPEG2H.262運動圖像及其伴音通用編碼標準

時間1994年11月輸入352×288~1920×1152采用頻率為16、22.05、24、32、44.1、48kHz的線性PCM、支持5.1聲道

輸出1.5-80Mb/s、8-640Kb/s(音頻)壓縮率30-40壓縮算法運動補償幀間預測(單雙向預測)+DCT、可伸縮性、前向兼容應用DVD、DVB、HDTV6第六頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準對比(續(xù))H.263H.263+甚低碼率通信的視頻編碼標準時間1996年3月、1998年1月輸入QCIF、CIF、128×96(SubQCIF)、704×576(4CIF)、1408×1152(16CIF)輸出30kb/s~壓縮率H.263+>H.263>MPEG2壓縮算法運動補償幀間預測(單雙向預測)+DCT局部算法改進可伸縮性應用通用電話交換網、局域網的視頻通信7第七頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準對比(續(xù))MPEG4(Part2)MPEG4Visual甚低碼率活動圖像及其伴音編碼標準時間1999年輸入≧176×144的多種分辨率格式輸出4.6Kb/s~64Kb/s壓縮率≧100壓縮算法基于對象的新一代編碼技術,注重交互性,即可包含自然對象,又可包含人工合成對象應用可應用范圍很廣、目前多用于因特網視頻傳輸、流媒體應用8第八頁,共七十四頁,編輯于2023年,星期四視頻壓縮標準對比(續(xù))H.264MPEG4(Part10)MPEG4AVC時間2003年5月輸入多種分辨率格式輸出壓縮率壓縮率最高的視頻壓縮標準,比MPEG4Visual節(jié)約50%的碼率壓縮算法基于傳統(tǒng)框架的混合編碼系統(tǒng),只是做了局部優(yōu)化。更注重編碼效率和可靠性應用視頻廣播、視頻通信和存儲媒體(CDDVD)等多種應用9第九頁,共七十四頁,編輯于2023年,星期四MPEG-1視頻壓縮標準

MPEG-1標準號為ISO/IEC11172,它由五部分組成:MPEG-1系統(tǒng)(MPEG-1Systems):規(guī)定視頻數(shù)據、聲音數(shù)據及其他相關數(shù)據的同步合成技術MPEG-1視頻編碼標準(MPEG-1Video)MPEG-1音頻編碼標準(MPEG-1Audio)MPEG-1一致性測試:詳細說明如何測試比特數(shù)據流和解碼器是否滿足MPEG-1前3個部分(Part1,2和3)中所規(guī)定的要求。MPEG-1軟件模擬:一個技術報告,給出了軟件執(zhí)行MPEG1前3個部分的運行結果。10第十頁,共七十四頁,編輯于2023年,星期四MPEG-1視頻壓縮標準輸入、輸出指標:MPEG視頻編碼器352×288×25×8×1.5352×240×30×8×1.530Mb/s1.15Mb/s26:111第十一頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運動補償幀間預測(temporal)+DCT(spatial)12第十二頁,共七十四頁,編輯于2023年,星期四Frame113第十三頁,共七十四頁,編輯于2023年,星期四Frame214第十四頁,共七十四頁,編輯于2023年,星期四ResidualFrame15第十五頁,共七十四頁,編輯于2023年,星期四象素運動軌跡16第十六頁,共七十四頁,編輯于2023年,星期四Block-basedMotionEstimationandCompensation17第十七頁,共七十四頁,編輯于2023年,星期四Block-basedMotionEstimationandCompensation18第十八頁,共七十四頁,編輯于2023年,星期四16×16BlockSize19第十九頁,共七十四頁,編輯于2023年,星期四8×8BlockSize20第二十頁,共七十四頁,編輯于2023年,星期四4×4BlockSize21第二十一頁,共七十四頁,編輯于2023年,星期四Sub-pixelMotionEstimationandCompensation子像素運動估值與補償22第二十二頁,共七十四頁,編輯于2023年,星期四Sub-pixelMotionEstimationandCompensation23第二十三頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼器框架24第二十四頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼器框架分塊25第二十五頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運動圖像序列圖片組(GOP)IBBPBBP…圖片條(Slice)宏塊MacroBlock1616塊(Block)88分割:26第二十六頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法GOP的組成:一個內幀是一個隨機訪問點。B圖像不能作為其它圖像的參考幀。I:內幀P:單向預測幀B:雙向預測幀27第二十七頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法視頻類型IPB平均MPEG-1CIF150000b50000b20000b38000bMPEG-2601400000b200000b80000b130000b為了在圖像質量和數(shù)據速率之間作出調整,MPEG編碼器允許(1)選擇內幀I的頻率和位置,(2)選擇I和P之間雙向預測幀B的數(shù)目。28第二十八頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運動補償技術在宏塊一級工作。宏塊分為四類:幀內宏塊,簡稱I塊前向預測宏塊,簡稱F塊后向預測宏塊,簡稱B塊平均宏塊,簡稱A塊

I圖像只包含I塊,P圖像只包含I塊和F塊,B圖像可以包含4種類型的宏塊。29第二十九頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法I圖像幀的壓縮算法:在空間方向上(內幀),MPEG-1壓縮采用JPEG壓縮算法來去掉冗余信息。30第三十頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法P圖像幀的壓縮算法:對于P宏塊,MPEG-1采用運動補償幀間預測算法來去掉時間軸上的冗余信息。31第三十一頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法運動矢量的概念32第三十二頁,共七十四頁,編輯于2023年,星期四MPEG1視頻壓縮算法基于塊的運動矢量估值算法——塊匹配法33第三十三頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法塊匹配法(BlockMatchingAlgorithm)需要解決兩個關鍵問題:(1)匹配準則(2)搜索算法34第三十四頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA中常用的匹配準則:絕對值:均方誤差:平均絕對幀差:35第三十五頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA常用搜索算法—二維對數(shù)搜索法:36第三十六頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA常用搜索算法—三步搜索法:37第三十七頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法BMA常用搜索算法—對偶搜索法:38第三十八頁,共七十四頁,編輯于2023年,星期四MPEG1視頻編碼算法B圖像幀的壓縮算法:39第三十九頁,共七十四頁,編輯于2023年,星期四40第四十頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮標準輸入、輸出指標:MPEG音頻編碼器32kHz,44.1kHz,48kHz16位PCM32kb/s~384kb/s層次壓縮率數(shù)據速率kb/s延遲(ms)14:138419/5026:1~8:1192~25635/100310:1~12:1112~12859/15041第四十一頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性:聽閾-頻率曲線42第四十二頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性:一個強純音會掩蔽在其附近同時發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時掩蔽43第四十三頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法聽覺系統(tǒng)的感知特性:一個強純音會掩蔽在其附近同時發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時掩蔽在時間上相鄰的聲音之間也有掩蔽現(xiàn)象,稱為時域掩蔽。時域掩蔽又分為超前掩蔽和滯后掩蔽。44第四十四頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法感知子帶壓縮算法算法以心理聲學模型為基礎,主要利用了聽覺閾值和聽覺掩蔽特性45第四十五頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法感知子帶壓縮算法1、將音頻信號用濾波器組分成32個子帶;2、用FFT將子帶變換到頻率域3、根據心理聲學模型估計各個子帶的感知閾值4、根據對感知閾值的估計對各個子帶進行比特分配和量化。MP3采用了與MP1、MP2不同的濾波器和心理聲學模型。46第四十六頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法MPEG-1Audio層1和層2編碼器和解碼器的結構47第四十七頁,共七十四頁,編輯于2023年,星期四MPEG-1音頻壓縮算法MPEG-1Audio層3編碼器和解碼器的結構48第四十八頁,共七十四頁,編輯于2023年,星期四H.261概述H.261也稱P×64,這是ITU-T(前身為CCITT)最早制定的關于視頻編碼的國際標準。考慮到ISDN的傳輸碼率以64kbps為單位,因此以p×64kbps(p=1~30)作為為H.261的標準碼率。H.261標準主要用于電視電話和電視會議。它支持QCIF(p=1、2)、CIF(p>2)兩種圖像輸入格式。49第四十九頁,共七十四頁,編輯于2023年,星期四H.261解決的問題第一是編碼算法問題。確立了一種合理的、保證圖像質量且為各國圖像編碼專家所公認的統(tǒng)一的算法。算法必須能夠實時操作,解碼延時要短。第二是與PCM標準兼容的問題。編解碼器以64~1920kb/s的工作速率去覆蓋N-ISDN或PCM一次群的通道。第三,解決電視制式不同的問題。為了使同一標準既能用于PAL(625)和NTSC(525)兩種電視制式系統(tǒng),源編碼基于中間格式CIF格式,所以輸入輸必須經轉換到CIF或QCIF格式再進行源編碼。50第五十頁,共七十四頁,編輯于2023年,星期四視頻編碼圖像格式一覽表51第五十一頁,共七十四頁,編輯于2023年,星期四H.261的信源編碼框架52第五十二頁,共七十四頁,編輯于2023年,星期四H.261的信源編碼算法一、將預測誤差或輸入圖像劃分成為8*8的象素塊。進一步,將4個亮度像塊和兩個在空間位置上與之重疊的色差像塊符合成一個16*16的宏塊(MB)。二、對于幀序列中的第一副圖像或景物變換后的第一副圖像,采用幀內變換編碼:利用8*8的DCT實現(xiàn)。各DCT系數(shù)經過線性量化、變長編碼后進入緩沖器,根據緩沖器的上溢和下溢,來反饋調節(jié)量化器的量化步長,以控制視頻編碼位流使之與信倒速率相匹配。53第五十三頁,共七十四頁,編輯于2023年,星期四H.261的信源編碼算法幀間預測采用混合方法:利用運動補償預測,當預測誤差超過某個門限后,對誤差做DCT、視覺加權量化及熵編碼。運動矢量信息編碼后也送到緩沖器中。DCT去除空間冗余度,而使用有運動補償?shù)膸g預測來去除時間上的冗余。這是一個典型的幀內/幀間自適應預測加DCT變換的混合算法。54第五十四頁,共七十四頁,編輯于2023年,星期四H.261的圖像復用編碼H.261源編碼后進行圖像復用編碼,實際上是把比特流分成圖像(Picture),像塊組(GOB:Groupofblocks),宏塊(MB:Macroblock)和像塊(Block),并附加相應的信息。按照CIF格式,每幀CIF圖像包含12個GOB,每個GOB包含33個MB,每個MB包含4個亮度數(shù)據塊和各1個Cb、Cr色度塊,每個B包含8*8象素。55第五十五頁,共七十四頁,編輯于2023年,星期四H.261的圖像復用編碼H.261數(shù)據流結構56第五十六頁,共七十四頁,編輯于2023年,星期四H.261視頻壓縮算法利用二維DCT減少圖像的空間域的冗余度;利用運動補償預測減少圖像的時間域冗余度;利用視覺加權量化減少圖像"灰度域"的冗余度;利用熵編碼來減少圖像的"頻率域"的冗余度。57第五十七頁,共七十四頁,編輯于2023年,星期四H.261與MPEG-1的對比58第五十八頁,共七十四頁,編輯于2023年,星期四MPEG-2通用視頻壓縮標準

MPEG-2的標準號為ISO/IEC13818,它主要由以下幾部分組成:MPEG-2系統(tǒng)(MPEG-1Systems)MPEG-2視頻編碼標準(MPEG-2Video)MPEG-2音頻編碼標準(MPEG-2Audio)MPEG-2高級音頻編碼標準(MPEG-2AAC)與MPEG-1一樣,MPEG-2只規(guī)定了碼流結構和解碼器算法規(guī)則,而把實際編碼器模型向設計者開放,以提供更多的選擇性和自由度。59第五十九頁,共七十四頁,編輯于2023年,星期四MPEG-2Video

MPEG-2Video與MPEG-1的基本編碼算法相同,只是增加了如下功能:(1)能夠在很寬的范圍內對不同分辨率和不同輸出比特率的圖像信號有效的進行壓縮。(2)處理隔行掃描的視頻信號的能力。(3)多樣化的取樣模式:4:2:0,4:2:2,4:4:4(4)可伸縮(Scalable)的視頻編碼模式:

編碼時可以在圖像質量和數(shù)據速率之間作出調整Ⅱ

解碼時只對碼流的一部分進行解碼和對碼流的全部進行解碼能夠分別獲得不同質量的重建圖像。60第六十頁,共七十四頁,編輯于2023年,星期四可伸縮性編碼模式(1)信噪比伸縮性(Signal-to-NoiseScalability)(2)空間分辨率伸縮性(SpatialScalability)(3)時間分辨率伸縮性(TemporalScalability)61第六十一頁,共七十四頁,編輯于2023年,星期四MPEG-2Video為了適應不同應用的需要,MPEG-2引入了配置(profiles)和等級(levels)的概念,每種配置定義一套新的算法,而每一個等級指定一套參數(shù)范圍(如圖像大小、幀速率和位速率)。62第六十二頁,共七十四頁,編輯于2023年,星期四MPEG-2VideoMPEG-2的配置配置(profile)特征簡單(Simple)4:2:0取樣,僅用I、P幀,支持隨機存取,不支持可伸縮性基本(Main)以上參數(shù),加上支持B幀信噪比可變以上參數(shù),加上信噪比可變性空間分辨率可變以上參數(shù),加上空間分辨率可變性高檔(High)以上參數(shù),4:2:2采樣方式63第六十三頁,共七十四頁,編輯于2023年,星期四MPEG-2VideoMPEG-2的等級等級(level)特征低級(Low)352×288,30幀/s,1.2Mb/s基本級(Main)720×576,30幀/s,4~15Mb/s高級(High)14401440×1152,60幀/s,60Mb/s高級(High)1920×1152,60幀/s,80Mb/s64第六十四頁,共七十四頁,編輯于2023年,星期四MPEG-2VideoMPEG-2的配置與等級的組合配置Profile等級低中高1440高1920簡單●

基本●

信噪比●

空間●

高●

65第六十五頁,共七十四頁,編輯于2023年,星期四MPEG-2Audio

MPEG-2標準委員會定義了兩種聲音數(shù)據壓縮格式:(1)MPEG-2Audio,或者稱為MPEG-2多通道(Multichannel)聲音,它與MPEG-1Audio是兼容的,所以又稱為MPEG-2BC(BackwardCompatible)。(2)另一種稱為MPEG-2AAC(AdvancedAudioCoding),因為它與MPEG-1聲音格式不兼容,因此通常稱為非后向兼容MPEG-2NBC(Non-Backward-Compatible)標準。66第六十六頁,共七十四頁,編輯于2023年,星期四MPEG-2BCAudio(1)增加了16kHz,22.05kHz和24kHz采樣頻率(2)擴展了編碼器的輸出速率范圍,由32~384kb/s擴展到8~640kb/s(3)增加了聲道數(shù),支持5.1聲道和7.1聲道的環(huán)繞聲。(4)MPEG-2還支持LinearPCM(線性PCM)和DolbyAC-3(AudioCodeNumber3)編碼MPEG-2BCAudio和MPEG-1Audio標準都使用相同種類的編譯碼器,層-1,-2和-3的結構也相同。MPEG-2聲音標準與MPEG-1標準相比,MPEG-2做了如下擴充:67第六十七頁,共七十四頁,編輯于2023年,星期四MPEG-2AACAAC支持的采用頻率可從8kHz到96kHz,AAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標準可支持48個主聲道、16個低頻音效加強通道LFE(lowfrequencyeffects)、16個配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個數(shù)據流。MPEG-2AAC在壓縮比為11:1,即每個聲道的數(shù)據率為(44.1×16)/11=64kb/s,而5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論