版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1第5章信源編碼標(biāo)準(zhǔn)掌握MPEG-2AAC的音頻編解碼原理熟悉DRA多聲道數(shù)字音頻編解碼的算法原理及關(guān)鍵技術(shù)了解新一代環(huán)繞多聲道音頻編碼格式理解MPEG-2、H.264/AVC標(biāo)準(zhǔn)中“類”和“級(jí)”的含義熟悉H.264/AVC標(biāo)準(zhǔn)的主要特點(diǎn)及性能了解H.265/HEVC標(biāo)準(zhǔn)的主要特點(diǎn)及性能了解我國具備自主知識(shí)產(chǎn)權(quán)的音視頻編碼標(biāo)準(zhǔn)(AVS)的性能及應(yīng)用本章學(xué)習(xí)目標(biāo)第5章信源編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2高級(jí)音頻編碼(AAC)算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)5.4新一代環(huán)繞多聲道音頻編碼格式5.5H.264/AVC視頻編碼標(biāo)準(zhǔn)5.6H.265/HEVC視頻編碼標(biāo)準(zhǔn)5.7AVS與AVS+視頻編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述國際上數(shù)字音視頻編碼標(biāo)準(zhǔn)主要有兩大系列。一個(gè)系列由國際標(biāo)準(zhǔn)化組織(ISO)和國際電工委員會(huì)(IEC)制定,另一個(gè)系列由國際電信聯(lián)盟電信標(biāo)準(zhǔn)部(ITU-T)制定。●ISO/IEC:JPEG,JPEG2000,MPEG-1/2/4/7
●
ITU-T:H.261/2/3/4制定這些標(biāo)準(zhǔn)的背景有所不同,面向的主要應(yīng)用也有所區(qū)別,它們采用的技術(shù)有很多共同點(diǎn),應(yīng)用領(lǐng)域有所重疊。兩者合作制定標(biāo)準(zhǔn):H.262/MPEG-2/
、H.264/MPEG-4AVC和H.265/HEVC制定視頻編碼標(biāo)準(zhǔn)的組織國際電信聯(lián)盟(ITU)ISO/IECInternationalTelecommunicationUnion(ITU)其委員會(huì)包括:CCITT(ConsultativeCommitteeonInternationalTelegraphand
Telephone),1956~1992CCIR(ConsultativeCommitteeonInternationalRadio),1927~19921992重組CCITT→ITU-TCCIR→ITU-R5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述ITUITU-RITU-TITU-D(發(fā)展)SG1SG2StudyGroup6-MultimediaWP1-ModemsandInterfaceV.34,V.25terWP2-SystemsH.320-ISDNH.323-LANH.324-POTST.120-DATAWP3-CodingG.7xx-AudioH.26x-VideoITU視頻編碼相關(guān)的研究小組ISO/IECIEC-InternationalElectrotechnicalCommission成立于1906年,致力于建立所有電工技術(shù)方面的國際標(biāo)準(zhǔn)瑞士法律下的非盈利、私立機(jī)構(gòu)ISO-InternationalStandardizationOrganization成立于1947年,“推動(dòng)工業(yè)標(biāo)準(zhǔn)的國際協(xié)調(diào)和統(tǒng)一”瑞士法律下的非盈利、私立機(jī)構(gòu)ISO/IEC
聯(lián)合技術(shù)委員會(huì)(ISO/IECJointTechnicalCommmittee1,JTC1)聯(lián)合致力于計(jì)算機(jī)相關(guān)的標(biāo)準(zhǔn)活動(dòng)占ISO和IEC總標(biāo)準(zhǔn)的30%視頻編碼標(biāo)準(zhǔn)組織ISOJTC1IECSubcommittee29AGWGAGMRAWG1WG12WG11SGSGSGJBIGJPEGMHEG5MHEG6需求Systems描述VideoAudioSNHCTests實(shí)現(xiàn)研究聯(lián)絡(luò)ISO/IEC視頻編碼相關(guān)的研究小組視頻編碼標(biāo)準(zhǔn)發(fā)展歷程視頻編碼標(biāo)準(zhǔn)發(fā)展歷程視頻編碼標(biāo)準(zhǔn)發(fā)展歷程ISO/IEC--MPEG-1,MPEG-2,MPEG-4,MPEG-4AVC/H.264,HEVCITU-T--H.261,H.262(MPEG-2),H.263,H.264,H.265中國AVS--AVS,AVS+下一代標(biāo)準(zhǔn)?---方向、技術(shù)?
年代
MPEG-1
1993
2001
1997
2005
MPEG-4AVC/H.2641989
MPEG-2MPEG-42013AVS下一代標(biāo)準(zhǔn)20092017視頻編碼標(biāo)準(zhǔn)發(fā)展歷程5.1.1H.26x系列標(biāo)準(zhǔn)ITU-T的視頻編碼專家組(VCEG)制定了H.26x標(biāo)準(zhǔn)系列,主要針對(duì)實(shí)時(shí)視頻通信領(lǐng)域的應(yīng)用,如可視電話、會(huì)議電視等。H.261:“速率為p×64kbit/s(p=1,2,…,30)視聽業(yè)務(wù)的視頻編解碼”,簡稱為p×64kbit/s標(biāo)準(zhǔn)。H.262:同MPEG-2的視頻部分(ISO/IEC13818-2)。H.263:低碼率視頻編碼標(biāo)準(zhǔn)。H.264:等同于MPEG-4AVC(ISO/IEC14496-10)。H.265:等同于MPEGHEVC(ISO/IEC23008-2)。
ITU-TH.2611988年制定,奠定了現(xiàn)代視頻編碼的基礎(chǔ):編碼結(jié)構(gòu)為:運(yùn)動(dòng)補(bǔ)償預(yù)測+DCT編碼+熵編碼關(guān)鍵技術(shù)包括16×16宏塊運(yùn)動(dòng)補(bǔ)償預(yù)測、8×8DCT、量化、環(huán)路濾波和變字長編碼(VLC)等。這些關(guān)鍵技術(shù)后來被其它標(biāo)準(zhǔn)采用。H.261v2(1993年早期)增加了后向兼容的高清晰度圖片模式(例如遠(yuǎn)程教學(xué)中的白板)圖像格式:CIForQCIF,幀率29.97fps數(shù)碼率為n×64kbit/s(64~1920kbit/s),典型為384kbit/s特性:低復(fù)雜、低時(shí)延后向兼容的一個(gè)標(biāo)準(zhǔn)被H.263和H.264超越H.261圖像格式ITU-RBT.601CIFQCIF720×576352×288176×144基于MC+DCT混合視頻編碼器反量化IDCTMC預(yù)測器DCT量化運(yùn)動(dòng)估計(jì)ME幀緩存器運(yùn)動(dòng)補(bǔ)償預(yù)測MC輸入信號(hào)編碼碼流(送信道)解碼幀(送顯示)運(yùn)動(dòng)矢量和塊模式數(shù)據(jù)(送信道)先前解碼的幀(虛框表示解碼器)熵編碼H.263:低碼率視頻編碼標(biāo)準(zhǔn)ITU-TH.263(V1:1995):取代H.261,成為視頻會(huì)議、可視電話和Internet視頻流的壓縮標(biāo)準(zhǔn)。H.263+(1997/1998年)&H.263++(2000年)圖像格式通常為CIF、QCIForSub-QCIF(128×96),幀率一般低于10fps。數(shù)碼率:任意,典型20kbps(對(duì)于PSTN)。在所有的數(shù)碼率上對(duì)優(yōu)于H.261,在一半數(shù)碼率上與
H.261具有相同的質(zhì)量是MPEG4標(biāo)準(zhǔn)的壓縮Core。H.263vs.H.261改進(jìn)的運(yùn)動(dòng)補(bǔ)償H.261:整數(shù)像素精度,環(huán)路濾波器,每個(gè)MB一個(gè)運(yùn)動(dòng)矢量H.263:半像素精度,無環(huán)路濾波器,每個(gè)MB一個(gè)運(yùn)動(dòng)矢量減少了Overhead支持更多的圖像格式附錄中定義了選項(xiàng)無限制的運(yùn)動(dòng)矢量(附錄D)基于語法的算術(shù)編碼(SAC)(附錄E)高級(jí)預(yù)測模式(AP)(附錄F)重疊塊運(yùn)動(dòng)補(bǔ)償(OverlappedBlockMotionCompensation,OBMC)每個(gè)MB中1或4個(gè)運(yùn)動(dòng)矢量切換PB幀圖像(附錄G)在H.263++增加了更多選項(xiàng)5.1.2MPEG-x系列標(biāo)準(zhǔn)
MPEG(MovingPictureExpertsGroup)是運(yùn)動(dòng)圖像專家組的英文縮寫。即ISO/IECJTC1/SC29/WG11。這個(gè)專家組開發(fā)的標(biāo)準(zhǔn)通常稱為MPEG標(biāo)準(zhǔn)。
MPEG-1:針對(duì)1.5Mbit/s以下數(shù)碼率的數(shù)字存儲(chǔ)媒體應(yīng)用的運(yùn)動(dòng)圖像及其伴音編碼,標(biāo)準(zhǔn)號(hào)ISO/IEC11172。MPEG-2:運(yùn)動(dòng)圖像及其伴音信息的通用編碼,標(biāo)準(zhǔn)號(hào)ISO/IEC13818。MPEG-4:視聽對(duì)象編碼,標(biāo)準(zhǔn)號(hào)ISO/IEC14496。MPEG-7:多媒體內(nèi)容描述接口,標(biāo)準(zhǔn)號(hào)ISO/IEC15938。MPEG-HPart2:同H.265,標(biāo)準(zhǔn)號(hào)ISO/IEC23008-2。
MPEG-1是針對(duì)1.5Mbit/s以下數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒介應(yīng)用的運(yùn)動(dòng)圖像及其伴音編碼的國際標(biāo)準(zhǔn)。MPEG-1的目標(biāo)是將壓縮后的視/音頻碼流存入光盤(如CD-ROM、VCD等),數(shù)據(jù)傳輸率為1.416Mbit/s,其中1.1Mbit/s用于視頻,128kbit/s用于音頻,其余的用于系統(tǒng)開銷。MPEG-1是一個(gè)開放的、統(tǒng)一的標(biāo)準(zhǔn),在商業(yè)上獲得了巨大的成功。盡管其圖像質(zhì)量僅相當(dāng)于VHS視頻的質(zhì)量,還不能滿足廣播級(jí)的要求,但已廣泛應(yīng)用于VCD等家庭視聽產(chǎn)品中。
5.1.2MPEG-x系列標(biāo)準(zhǔn)在制訂MPEG-1的過程中,廣播電視的設(shè)備制造商立即意識(shí)到MPEG技術(shù)對(duì)提高衛(wèi)星轉(zhuǎn)發(fā)器和有線電視信道效率的潛力。但數(shù)字電視廣播不能滿足于VHS的圖像質(zhì)量,數(shù)碼率也不必像MPEG-1限制得那樣低。于是MPEG為數(shù)字電視廣播的應(yīng)用制訂了MPEG-2標(biāo)準(zhǔn)。MPEG-1是MPEG-2的一個(gè)子集,任何MPEG-2的解碼器要能夠?qū)PEG-1的碼流進(jìn)行解碼。MPEG-2不是MPEG-1的簡單升級(jí),它在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。MPEG-2的應(yīng)用領(lǐng)域非常廣泛,包括存儲(chǔ)媒介中的DVD、廣播電視中的數(shù)字電視和HDTV、以及交互式的視頻點(diǎn)播(VOD)等。5.1.2MPEG-x系列標(biāo)準(zhǔn)MPEG-4
視聽對(duì)象編碼(Codingofaudio-visualobjects)標(biāo)準(zhǔn)(ISO/IEC14496),始于1993年的多媒體應(yīng)用標(biāo)準(zhǔn)1998年10月發(fā)布了版本11999年底完成了版本22000年初正式成為國際標(biāo)準(zhǔn)不斷更新和完善……目標(biāo)是為通信、廣播、存儲(chǔ)和其他應(yīng)用提供數(shù)據(jù)速率低而視聽質(zhì)量高的數(shù)據(jù)編碼方法和交互播放工具吸收了MPEG-1、MPEG-2和其他相關(guān)標(biāo)準(zhǔn)的許多特性引入了視聽對(duì)象(audio-visualobjects,AVO)編碼的概念5.1.2MPEG-x系列標(biāo)準(zhǔn)擴(kuò)充了編碼類型,由自然對(duì)象擴(kuò)展到合成對(duì)象采用了合成對(duì)象與自然對(duì)象混合編碼(Synthetic/NaturalHybridCoding,SNHC)算法引入了組合、合成和編排等重要概念,以實(shí)現(xiàn)交互功能和對(duì)象重用5.1.2MPEG-x系列標(biāo)準(zhǔn)發(fā)送端(b)接收端MPEG-4基于對(duì)象的系統(tǒng)模型5.1.2MPEG-x系列標(biāo)準(zhǔn)AVS(AudioVideocodingStandard)是我國具備自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn),是《信息技術(shù)——先進(jìn)音視頻編碼》系列標(biāo)準(zhǔn)的簡稱。AVS視頻標(biāo)準(zhǔn)(GB/T20090.2-2006)主要面向高清晰度和高質(zhì)量數(shù)字電視廣播、網(wǎng)絡(luò)電視、高密度激光數(shù)字存儲(chǔ)媒體和其他相關(guān)應(yīng)用,具有以下特點(diǎn):(1)性能高,編碼效率是MPEG-2的2倍以上,與H.264的編碼效率處于同一水平;(2)復(fù)雜度低,算法復(fù)雜度比H.264明顯低,軟硬件實(shí)現(xiàn)成本都低于H.264;(3)我國掌握主要知識(shí)產(chǎn)權(quán),專利授權(quán)模式簡單,費(fèi)用低。5.1.3AVS和AVS+標(biāo)準(zhǔn)熵編碼反量化反變換運(yùn)動(dòng)補(bǔ)償預(yù)測控制數(shù)據(jù)量化后的變換系數(shù)運(yùn)動(dòng)數(shù)據(jù)幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-0環(huán)濾波幀內(nèi)預(yù)測5.1.3AVS和AVS+標(biāo)準(zhǔn)AVS視頻編碼標(biāo)準(zhǔn)工具集雙向預(yù)測隔行編碼運(yùn)動(dòng)矢量預(yù)測子像素插值多參考幀預(yù)測可變塊大小預(yù)測幀內(nèi)預(yù)測變換和量化熵編碼環(huán)路濾波緩沖區(qū)管理其它圖像組頭防偽起始碼碼流順序時(shí)間參考索引AVS的的意義直接產(chǎn)業(yè)化成果:未來10年我國需要的4~5億顆解碼芯片,輻射超萬億的國民經(jīng)濟(jì)產(chǎn)業(yè)構(gòu)建完整的產(chǎn)業(yè)鏈:技術(shù)專利標(biāo)準(zhǔn)芯片系統(tǒng)制造業(yè)運(yùn)營業(yè)文化產(chǎn)業(yè)我國高清電視、直播衛(wèi)星等音視頻產(chǎn)業(yè)跨越發(fā)展的難得契機(jī)AVS產(chǎn)品形態(tài)芯片高清/標(biāo)清AVS解碼芯片,國內(nèi)需求量在未來十多年的時(shí)間內(nèi)年均將達(dá)到4000多萬片。軟件AVS節(jié)目制作與管理系統(tǒng),Linux和Window平臺(tái)上基于AVS標(biāo)準(zhǔn)的流媒體播出、點(diǎn)播、回放軟件整機(jī)機(jī)頂盒、播出服務(wù)器、編碼器、高清激光視盤機(jī)、高清數(shù)字電視機(jī)頂盒和接收機(jī)、手機(jī)、便攜式數(shù)碼產(chǎn)品等媒體運(yùn)營產(chǎn)業(yè)
AVS+視頻標(biāo)準(zhǔn)AVS工作組制定了AVS1-P2等視頻編碼標(biāo)準(zhǔn),并于2006年頒布為國標(biāo)GB/T20090.2-2006,之后于2012年在國標(biāo)的基礎(chǔ)上升級(jí)為AVS+,形成了廣電行業(yè)標(biāo)準(zhǔn)GY/T257.1-2012。AVS2視頻標(biāo)準(zhǔn)AVS標(biāo)準(zhǔn)針對(duì)視頻監(jiān)控的伸展檔AVS-S2又于2013年被國際電子電氣工程師協(xié)會(huì)(IEEE)標(biāo)準(zhǔn)化委員會(huì)接受并頒布為IEEE1857標(biāo)準(zhǔn)。2013年12月31日國家質(zhì)檢總局、國家標(biāo)準(zhǔn)委批準(zhǔn)發(fā)布了《信息技術(shù)先進(jìn)音視頻編碼第2部:視頻》(修訂)(國標(biāo)代號(hào)GB/T20090.2-2013)、《信息技術(shù)先進(jìn)音視頻編碼第10部:移動(dòng)語音和音頻》(國標(biāo)代號(hào)GB/T20090.10-2013)為國家標(biāo)準(zhǔn),標(biāo)準(zhǔn)將于2014年7月15日正式實(shí)施。AVS2是AVS+的下一代,即《信息技術(shù)--先進(jìn)音視頻編碼第2部:視頻》(修訂)。國標(biāo)代號(hào)GB/T20090.2-2013,簡稱AVS2視頻標(biāo)準(zhǔn)首要應(yīng)用目標(biāo)是超高清晰度(
4K或8K
)視頻。測試表明,AVS2視頻標(biāo)準(zhǔn)的壓縮效率已經(jīng)比上一代AVS國家標(biāo)準(zhǔn)和AVC/H.264國際標(biāo)準(zhǔn)提高了一倍,在場景類視頻編碼方面大幅度領(lǐng)先于最新國際標(biāo)準(zhǔn)HEVC,實(shí)現(xiàn)復(fù)雜度不高于同等級(jí)的編碼標(biāo)準(zhǔn)。第5章信源編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2高級(jí)音頻編碼(AAC)算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)5.4新一代環(huán)繞多聲道音頻編碼格式5.5H.264/AVC視頻編碼標(biāo)準(zhǔn)5.6H.265/HEVC視頻編碼標(biāo)準(zhǔn)5.7AVS與AVS+視頻編碼標(biāo)準(zhǔn)5.2
高級(jí)音頻編碼(AAC)算法MPEG-2標(biāo)準(zhǔn)定義了兩種音頻壓縮編碼算法:MPEG-2Audio(標(biāo)準(zhǔn)號(hào)為ISO/IEC13818-3),或稱為MPEG-2BC,它是與MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)(ISO/IEC11172-3)后向兼容的多聲道音頻編碼標(biāo)準(zhǔn);MPEG-2AAC(AdvancedAudioCoding,高級(jí)音頻編碼),標(biāo)準(zhǔn)號(hào)為ISO/IEC13818-7。因?yàn)樗cMPEG-1音頻壓縮編碼算法是不兼容的,所以也稱為MPEG-2NBC(NonBackwardCompatible,非后向兼容)標(biāo)準(zhǔn)。MPEG-2BC:對(duì)MPEG-1音頻編碼的擴(kuò)展,沒有增加新的編碼的算法增加了低采樣頻率(16kHz、22.05kHz、24
kHz)和低數(shù)碼率支持5.1或7.1聲道環(huán)繞聲支持多達(dá)7種語言和MPEG-1后向兼容5.2
高級(jí)音頻編碼(AAC)算法在MPEG-1音頻編碼的基礎(chǔ)上,MPEG-2音頻編碼能傳輸多路聲音,稱為MUSICAM環(huán)繞聲。5.2
高級(jí)音頻編碼(AAC)算法MPEG-2多聲道編解碼器RoLoRoLoMPEG-1
編碼器MPEG-1
解碼器MPEG-2
EncoderMPEG-2編碼器MPEG-2解碼器縮混RLCLSRSLFE重新混合RLCLSRSLFEMPEG-2Decoder前向兼容:MPEG-2多聲道解碼器可正確地對(duì)MPEG-1立體聲碼流進(jìn)行解碼后向兼容:MPEG-1立體聲解碼器可以從多聲道碼流中正確地對(duì)解碼出雙聲道立體聲信號(hào)5.2
高級(jí)音頻編碼(AAC)算法MPEG-2AAC(ISO/IEC13818-7)MPEG-2后向不兼容(Non-backwardcompatible,NBC)
改名為AAC(AdvancedAudioCoding)支持48個(gè)主聲道、16個(gè)低頻音效增強(qiáng)(LFE)聲道、16個(gè)配音聲道(overdubchannel)或者稱為多語言聲道(multilingualchannel)和16個(gè)數(shù)據(jù)流。采樣率8~96kHz數(shù)碼率為8~160kbps/聲道與MPEG-1的第2層相比,MPEG-2AAC的壓縮比可提高1倍,而且音質(zhì)更好;在質(zhì)量相同的條件下,MPEG-2AAC的數(shù)碼率大約是MPEG-1第3層(即MP3)的70%。5.2
高級(jí)音頻編碼(AAC)算法達(dá)到CD質(zhì)量水平的聲音測試44.1kHz,16bits/sample,立體聲=
1.411MbpsMP3需要128kbpsAAC需要96kbps5.2
高級(jí)音頻編碼(AAC)算法MPEG-2AAC(ISO/IEC13818-7)5.2
高級(jí)音頻編碼(AAC)算法主檔次(MainProfile)除了“增益控制(GainControl)”模塊之外低復(fù)雜度檔次(LowComplexityProfile)不使用預(yù)測模塊和增益控制模塊,瞬時(shí)噪聲整形(temporalnoiseshaping,TNS)濾波器的級(jí)數(shù)也有限
可分級(jí)的采樣率檔次(ScalableSamplingRateProfile)使用增益控制對(duì)信號(hào)作預(yù)處理,不使用預(yù)測模塊,TNS濾波器的級(jí)數(shù)和帶寬也都有限制
MPEG-2AAC的檔次5.2
高級(jí)音頻編碼(AAC)算法MPEG-4Time/FrequencyCodingM/S預(yù)測強(qiáng)度立體聲/耦合時(shí)域噪聲整形濾波器組增益控制工具比特流復(fù)接感知模型量化和編碼音頻信號(hào)ISO/IEC14496-3Subpart4CodedAudioBitStream控制流數(shù)據(jù)流BarkScaletoScaleFactorBandMapping窗長度判決SpectralNormal.AAC量化和編碼BSAC量化和編碼TwinVQ頻譜處理MPEG4通用音頻編碼:基于AAC的編碼時(shí)延主要由以下因素引起:幀長度分析和合成濾波器在編碼器中窗長度切換(2048vs256樣值)需要“l(fā)ook-ahead”時(shí)間。比特池匹配于變比特率(VariableBit-Rate,VBR)需求最小理論時(shí)延:110ms+210ms(比特池)(在24kHz取樣頻率和24kbit/s比特率時(shí))AAC低時(shí)延:幀長:只有512個(gè)樣值沒有提前預(yù)見時(shí)間(look-aheadtime)沒有比特池編碼增益損失:約20%MPEG4通用音頻編碼:AAC低時(shí)延第5章信源編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2高級(jí)音頻編碼(AAC)算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)5.4新一代環(huán)繞多聲道音頻編碼格式5.5H.264/AVC視頻編碼標(biāo)準(zhǔn)5.6H.265/HEVC視頻編碼標(biāo)準(zhǔn)5.7AVS與AVS+視頻編碼標(biāo)準(zhǔn)DRA數(shù)字音頻編解碼技術(shù)采用自適應(yīng)時(shí)頻分塊(AdaptiveTimeFrequencyTiling,ATFT)方法,實(shí)現(xiàn)對(duì)音頻信號(hào)的最優(yōu)分解,進(jìn)行自適應(yīng)量化和熵編碼,具有解碼復(fù)雜度低、壓縮效率高、音質(zhì)好等優(yōu)點(diǎn),可廣泛應(yīng)用于數(shù)字音頻廣播、數(shù)字電視、移動(dòng)多媒體、激光視盤機(jī)、網(wǎng)絡(luò)多媒體以及在線游戲、數(shù)字電影院等領(lǐng)域。
5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)DRA標(biāo)準(zhǔn)概況(1/4)標(biāo)準(zhǔn)名稱:《多聲道數(shù)字音頻編解碼技術(shù)規(guī)范》 (簡稱DRA音頻)標(biāo)準(zhǔn)類別:中國電子行業(yè)標(biāo)準(zhǔn)標(biāo)準(zhǔn)號(hào):SJ/T11386-2006標(biāo)準(zhǔn)批準(zhǔn)時(shí)間:2007年1月4日批準(zhǔn)部門:中華人民共和國信息產(chǎn)業(yè)部標(biāo)準(zhǔn)研發(fā)單位:廣州廣晟數(shù)碼技術(shù)有限公司DRA標(biāo)準(zhǔn)概況(2/4)DRA最大特點(diǎn)是用很低的解碼復(fù)雜度實(shí)現(xiàn)了國際先進(jìn)水平的壓縮效率。經(jīng)國家廣電總局規(guī)劃院多次測試表明,DRA技術(shù)在每聲道64kbps的碼率時(shí)即“達(dá)到了EBU定義的‘不能識(shí)別損傷’的音頻質(zhì)量”。DRA可應(yīng)用于數(shù)字電視、數(shù)字音頻廣播、數(shù)字電影院、網(wǎng)絡(luò)流媒體、IPTV及移動(dòng)多媒體等領(lǐng)域。DRA標(biāo)準(zhǔn)概況(3/4)DRA測試情況測試條件:5.1聲道384kbps碼率情況下,以5分為滿分4.94.54.24.04.0DRA標(biāo)準(zhǔn)概況(4/4)采樣頻率范圍8~192kHz采樣精度24bit比特率32~9612kpbs可支持的最大聲道數(shù)正常聲道64個(gè),低頻效果聲道(LFE)3個(gè),即64.3算法實(shí)現(xiàn)復(fù)雜度采用Motorola5636X定點(diǎn)DSP,只需48MIPS即可完成5.1聲道的384kpbs的解碼壓縮效率每聲道在64kbps碼率下“達(dá)到了EBU定義的‘不能識(shí)別損傷’的音頻質(zhì)量”編碼延遲43ms(48K采樣率),46ms(44.1K采樣率)技術(shù)指標(biāo)5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)DRA多聲道數(shù)字音頻編碼算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)DRA多聲道數(shù)字音頻解碼算法第5章信源編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2高級(jí)音頻編碼(AAC)算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)5.4新一代環(huán)繞多聲道音頻編碼格式5.5H.264/AVC視頻編碼標(biāo)準(zhǔn)5.6H.265/HEVC視頻編碼標(biāo)準(zhǔn)5.7AVS與AVS+視頻編碼標(biāo)準(zhǔn)5.4
新一代環(huán)繞多聲道音頻編碼格式DolbyDigitalPlus(DD+)5.4
新一代環(huán)繞多聲道音頻編碼格式DolbyTrueHDDolbyTureHD(杜比真高清)是Dolby公司于2005年9月8日推出的一種針對(duì)高清光盤格式開發(fā)的新一代無損音頻編碼格式,可為聽眾提供相當(dāng)于高分辨率錄音棚母版的音響效果。采用MLP無損壓縮技術(shù)最高數(shù)碼率可達(dá)18Mbit/s支持7.1聲道,最高可達(dá)13.1聲道5.4
新一代環(huán)繞多聲道音頻編碼格式DTS-HDDolbyTureHD(杜比真高清)是Dolby公司于2005年9月8日推出的一種針對(duì)高清光盤格式開發(fā)的新一代無損音頻編碼格式,可為聽眾提供相當(dāng)于高分辨率錄音棚母版的音響效果。采用MLP無損壓縮技術(shù)最高數(shù)碼率可達(dá)18Mbit/s支持7.1聲道,最高可達(dá)13.1聲道第5章信源編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2高級(jí)音頻編碼(AAC)算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)5.4新一代環(huán)繞多聲道音頻編碼格式5.5H.264/AVC視頻編碼標(biāo)準(zhǔn)5.6H.265/HEVC視頻編碼標(biāo)準(zhǔn)5.7AVS與AVS+視頻編碼標(biāo)準(zhǔn)VCL實(shí)現(xiàn)視頻數(shù)據(jù)的編解碼;NAL定義數(shù)據(jù)封裝格式,為VCL提供與網(wǎng)絡(luò)無關(guān)的統(tǒng)一接口H.264/AVC視頻編碼器的分層結(jié)構(gòu)H.264/AVC視頻編碼框圖變換/量化去除空間冗余運(yùn)動(dòng)補(bǔ)償預(yù)測去除時(shí)間冗余熵編碼去除變換系數(shù)的冗余熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊
幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流仍然采用先前標(biāo)準(zhǔn)中的MC+DCT混合編碼算法,相同的部分包括:16×16宏塊傳統(tǒng)的亮度和色度采樣格式4:2:0塊運(yùn)動(dòng)位移或矢量運(yùn)動(dòng)矢量越過圖像邊界的算法塊大小可變的運(yùn)動(dòng)補(bǔ)償塊變換(沒有采用小波或分形
waveletsorfractals)標(biāo)量量化I、P
和
B幀圖像類型變字長編碼Variable-lengthcodingH.264/AVC標(biāo)準(zhǔn)采用的已有技術(shù)多模式、多參考幀運(yùn)動(dòng)補(bǔ)償1/4pixel運(yùn)動(dòng)矢量精度多模式幀內(nèi)預(yù)測(I幀空域預(yù)測)去方塊效應(yīng)環(huán)路濾波器44整數(shù)變換熵編碼采用CAVLC或CABACSP-slices網(wǎng)絡(luò)適應(yīng)層NAL(NetworkAbstractionLayer)H.264/AVC標(biāo)準(zhǔn)采用的新技術(shù)動(dòng)機(jī):運(yùn)動(dòng)/固定目標(biāo)的大小是可變的許多小塊也可能需要花費(fèi)許多比特來編碼不同塊大小和形狀的運(yùn)動(dòng)補(bǔ)償1/4-pixel精度(源自MPEG-4ASP,但更復(fù)雜)以往的視頻編碼標(biāo)準(zhǔn)都采用了整像素或半像素的運(yùn)動(dòng)估計(jì),?-pixel比?-pixel獲得1.5~2dB增益,約節(jié)省20%的比特率?-pixel精度采用6抽頭濾波器得到7種可變塊大?。篐.264把每個(gè)16×16宏塊再細(xì)分,每個(gè)子塊分別進(jìn)行預(yù)測,提高了預(yù)測精度:保持完整的宏塊,水平(垂直)劃分為兩個(gè)子塊,大小為16×8(8x16)劃分成4個(gè)子塊,大小為8×8上述的4個(gè)8×8子塊可以進(jìn)一步劃分成更小的2或4個(gè)塊(8×4、4×8、4×4)。節(jié)省了15%以上的比特率多參考幀預(yù)測:假設(shè)為5個(gè)參考幀預(yù)測,相對(duì)于一個(gè)參考幀來說,可節(jié)省5%到10%比特率。H.264多模式、多參考幀運(yùn)動(dòng)補(bǔ)償16×168×84×4
1/4像素則由1/2像素線性內(nèi)插得到,例如:1/4像素精度運(yùn)動(dòng)補(bǔ)償1/2像素內(nèi)插采用6-TAP濾波器例如b點(diǎn)是由E、F、G、H、I、J計(jì)算得出:1/4像素精度運(yùn)動(dòng)補(bǔ)償?shù)男阅鼙容^Foreman30fpsQCIF熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊16x16pixels幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流H.264
可變大小塊運(yùn)動(dòng)補(bǔ)償大小和形狀可變塊(7種)8x804x80101234x48x4108x8Types016x16018x16MBTypes8x8012316x810不同匹配塊數(shù)量的性能比較Foreman30fpsQCIF熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊16x16pixels幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流多參考幀運(yùn)動(dòng)補(bǔ)償H.264多參考幀運(yùn)動(dòng)補(bǔ)償5個(gè)參考幀(33.19dB)1個(gè)參考幀(31.65dB)H.264多參考幀運(yùn)動(dòng)補(bǔ)償多參考幀的性能比較H.264多參考幀運(yùn)動(dòng)補(bǔ)償Foreman30fpsQCIF多參考幀的性能提高不明顯,這與圖像序列有很大關(guān)系。宏塊或塊基于先前編碼的塊進(jìn)行預(yù)測:先前編碼的塊位于當(dāng)前塊的上面和/或左面的塊亮度塊兩類幀內(nèi)預(yù)測方式:9種4×4幀內(nèi)預(yù)測模式,用于紋理區(qū)域。4種16×16幀內(nèi)預(yù)測模式,用于平滑區(qū)域。Mode0(垂直)Mode1(水平)Mode2(DC)Mode3(面)色度樣值只有4種8×8幀內(nèi)預(yù)測模式,類似于亮度樣值的16×16幀內(nèi)預(yù)測模式Mode0(Vertical)Mode1(Horizontal)Mode2(DC)Mode3(Plane)編碼參數(shù)規(guī)定了哪些相鄰塊用于預(yù)測,以及如何預(yù)測?多模式幀內(nèi)預(yù)測(I幀空域預(yù)測)熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊16x16pixels
幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流方向性空間預(yù)測模式 (亮度9種4×4預(yù)測模式)像素(a-p)由周圍解碼的像素(A-Q)進(jìn)行預(yù)測。例如模式3:右下對(duì)角線預(yù)測通過下式預(yù)測:
(A+2Q+I+2)>>2QABCDEFGHIabcdJefghKijklLmnopMNOP013456782-DCH.264中的4×4幀內(nèi)預(yù)測H.264中的4×4幀內(nèi)預(yù)測亮度分量4×4塊預(yù)測模式模式描述模式0(垂直)由A、B、C、D垂直推出相應(yīng)像素值模式1(水平)由I、J、K、L水平推出相應(yīng)像素值模式2(DC)由A~D及I~L平均值推出所有像素值模式3(下左對(duì)角線)由方向像素值內(nèi)插值得出相應(yīng)像素值模式4(下右對(duì)角線)由方向像素值內(nèi)插得出相應(yīng)像素值模式5(右垂直)由方向像素值內(nèi)插得出相應(yīng)像素值模式6(下水平)由方向像素值內(nèi)插得出相應(yīng)像素值模式7(左垂直)由方向像素值內(nèi)插得出相應(yīng)像素值模式8(上水平)由方向像素值內(nèi)插得出相應(yīng)像素值色度分量/亮度分量16×16塊預(yù)測模式模式描述模式0(垂直)由上邊像素推出相應(yīng)像素值模式1(水平)由左邊像素推出相應(yīng)像素值模式2(DC)由上邊和左邊像素平均值推出相應(yīng)像素值模式3(平面)利用線形“plane”函數(shù)及左、上像素推出相應(yīng)像素值幀內(nèi)預(yù)測性能分析Foreman30fpsQCIFH.264中的4×4整數(shù)變換動(dòng)機(jī):DCT需要實(shí)數(shù)運(yùn)算,反變換中引起了精度的損失。更小的圖像,更好的運(yùn)動(dòng)補(bǔ)償,意味著更小的空間相關(guān)性,不需要8×8變換4×4的塊可以有效的減弱重建圖像的塊效應(yīng)H.264使用了非常簡單的整數(shù)4×4變換:對(duì)4×4DCT非常精巧的逼近變換矩陣只包含+/-1和+/-2計(jì)算只需要加法、減法和移位結(jié)果顯示僅有可以忽略不計(jì)的質(zhì)量損失(~0.02dB)熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊16x16pixels幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流差值圖像基于4x4整數(shù)變換:主檔次:自適應(yīng)塊大小變換(8x4,4x8,8x8)對(duì)于8x8色度和16x16幀內(nèi)亮度塊DC系數(shù)再次變換8×816×164×4H.264中的4×4整數(shù)變換2D-DCT回顧2D-DCT的基為:正變換可表示為:
2D-DCT矩陣表示:正變換:反變換:A為離散余弦變換矩陣AT為A的轉(zhuǎn)置矩陣
2D-DCT變換矩陣A當(dāng)N=2時(shí),變換矩陣A為:當(dāng)N=4時(shí),變換矩陣A為:2D-DCT回顧H.264中的4×4整數(shù)變換4×4整數(shù)變換的表達(dá)式為:由于矩陣H只有±1與±2,只需加減法和左移即可完成變換,所以H.264的整數(shù)變換是無乘法的。基核矩陣H為:H.264中的4×4整數(shù)變換相應(yīng)的反變換表達(dá)式如下:
只需加法和右移的操作即可完成反變換,而反變換的輸入數(shù)據(jù)具有大的動(dòng)態(tài)范圍,所以造成的誤差很小。
最終得到反變換表達(dá)式如下:
H.264中的4×4整數(shù)變換H.264中4×4亮度的DC系數(shù)變換
此變換僅用于16×16的幀內(nèi)編碼塊的亮度信號(hào),每個(gè)4×4塊整數(shù)變換后,取出DC系數(shù)進(jìn)行再次進(jìn)行4×4Hadamard變換。正變換表達(dá)式如下:
反變換表達(dá)式為:H.264中2×2色度的DC系數(shù)變換
每個(gè)宏塊有兩個(gè)8×8色度塊,每個(gè)色度塊分為4個(gè)4×4塊。色度塊經(jīng)過變換之后,可分離出兩個(gè)2×2的DC系數(shù)塊,同亮度一樣再進(jìn)行一次2×2Hadamard變換:正變換表達(dá)式為:
反變換表達(dá)式為:H.264的量化不同于傳統(tǒng)意義的量化。避免了除法操作,減小了舍入誤差,與變換相配合,對(duì)應(yīng)于傳統(tǒng)意義上的量化,實(shí)際的量化步長已經(jīng)不是整數(shù)了。H.264的52個(gè)量化步長支持了廣泛的壓縮比,很好的做到了不同碼率視頻流的選擇。我們用變換編碼增益來衡量整數(shù)變換的性能,而編碼增益通常定義為,信號(hào)經(jīng)過變換以后再量化得到的信噪比,與直接對(duì)原始信號(hào)量化得到的信噪比,前者比后者的提高。如果輸入信號(hào)為一個(gè)平穩(wěn)的高斯-馬爾科夫隨機(jī)過程,相關(guān)系數(shù)是0.9,DCT、H.26L以及H.264的變換編碼增益分別是5.39dB、5.39dB、5.38dB。因此,H.264的整數(shù)變換約有0.01dB的損失。
H.264整數(shù)變換與量化的性能
——量化步長——經(jīng)變換后未縮放的矩陣系數(shù)——縮放系數(shù)
——量化后的系數(shù)
——變換后的系數(shù)
H.264量化技術(shù)H.264量化需要注意:避免除法運(yùn)算和浮點(diǎn)運(yùn)算;
將整數(shù)變換中的放大矩陣包含進(jìn)去其中W為整數(shù)變換后系數(shù)PF為放大因子,其值取決于其在4×4塊中的位置H.264量化技術(shù)Q01234567891011QStep
0.6250.68750.81250.87511.1251.251.3751.6251.7522.25Q12…18…24…30…36…51QStep
2.5…5…10…20…40…224量化參數(shù)Q與量化步長QStep的對(duì)應(yīng)關(guān)系
H.264標(biāo)準(zhǔn)定義了52個(gè)量化步長,對(duì)應(yīng)52個(gè)量化參數(shù)。量化參數(shù)每增加6,量化步長增加一倍。增加量化步長的范圍使得編碼器能夠在精確自如的控制比特率和圖像質(zhì)量間的均衡。動(dòng)機(jī):基于塊匹配的MC和塊變換將產(chǎn)生塊效應(yīng)在低碼率時(shí),人眼易于觀察到。以前的標(biāo)準(zhǔn)采用簡單的濾波器去“模糊”塊之間的邊界。H.264對(duì)每個(gè)邊界自適應(yīng)地選擇應(yīng)用5個(gè)去方塊效應(yīng)濾波器之一。例如,若兩個(gè)塊具有相同的運(yùn)動(dòng)矢量,就需要較小的濾波。提高了客觀質(zhì)量,以及在相同的PSNR下,減少了約7~9%比特率。H.264去方塊效應(yīng)環(huán)路濾波器熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊16x16pixels幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流水平沿(亮度)水平沿(色度)垂直沿(色度)垂直沿(亮度)16×16宏塊16×16宏塊H.264去方塊效應(yīng)環(huán)路濾波器
沒有去塊效應(yīng)濾波H.264/AVC去塊效應(yīng)濾波H.264去方塊效應(yīng)環(huán)路濾波器H.264熵編碼
動(dòng)機(jī):傳統(tǒng)的編碼器使用了固定的變字長碼本質(zhì)上都是Huffman類型碼沒有自適應(yīng),不能對(duì)概率>0.5的符號(hào)進(jìn)行有效編碼,因?yàn)橹辽傩枰粋€(gè)bit。H.263AnnexE定義了一個(gè)算術(shù)編碼器仍然是非自適應(yīng)的,使用了多個(gè)非二進(jìn)制的字母表,計(jì)算高度復(fù)雜H.264標(biāo)準(zhǔn)規(guī)定了兩種熵編碼:基于上下文的自適應(yīng)變長編碼(Context-basedAdaptiveVariableLengthCoding,CAVLC)基于上下文的自適應(yīng)二進(jìn)制算術(shù)編碼(Context-basedAdaptiveBinaryArithmeticCoding,CABAC)熵編碼反量化/變換運(yùn)動(dòng)補(bǔ)償控制數(shù)據(jù)量化的變換系數(shù)運(yùn)動(dòng)矢量幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-輸入視頻信號(hào)劃分成宏塊16x16pixels幀內(nèi)預(yù)測環(huán)路濾波視頻信號(hào)輸出視頻流H.264熵編碼
變換量化后的4×4(或2×2)塊進(jìn)行zig-zag掃描后,進(jìn)行CAVLC編碼。量化后的4×4塊有一些特點(diǎn):經(jīng)預(yù)測、變換和量化后,塊包含許多0,采用游程(Run)與幅度(level)的編碼方式可以有效的表示變換系數(shù),這也是以往傳統(tǒng)的編碼方式用到的。經(jīng)過量化后,許多Level是±1,通過zig-zag掃描可以把尾1(trailing1s)集中起來,CAVLC把這些Level統(tǒng)計(jì)出來。沒有塊結(jié)束標(biāo)志,非零系數(shù)的數(shù)目是需要編碼的。非零系數(shù)的Level越接近DC系數(shù)越大,而在高頻處比較小。CAVLC利用這個(gè)特點(diǎn)根據(jù)當(dāng)前編碼的變換系數(shù)選擇碼表。CAVLC編碼對(duì)象共有5個(gè)(或者編碼步驟有5步):非零系數(shù)的個(gè)數(shù)和尾1(trailing1s)的個(gè)數(shù)尾1的正負(fù)號(hào)其余非零系數(shù)的幅度(level)最后一個(gè)非零系數(shù)前零的總數(shù)游程(Run)H.264CAVLC熵編碼
對(duì)多數(shù)符號(hào)使用了自適應(yīng)概率模型通過使用上下文關(guān)系,利用了符號(hào)相關(guān)性。限制為二進(jìn)制算術(shù)編碼(binaryarithmeticcoding)所有的語法符號(hào)都轉(zhuǎn)換為bit串簡單和快速自適應(yīng)機(jī)制基于只用查表和移位方式的快速二進(jìn)制算術(shù)編解碼器399種預(yù)定義的上下文模型,分為組:例如模型14-20用于幀間宏塊類型的編碼模型的選擇基于前面編碼的信息(上下文關(guān)系)每個(gè)上下文模型適應(yīng)實(shí)驗(yàn)分布CAVLC平均節(jié)省了比特率10~15%H.264CABAC熵編碼
上下文模型二進(jìn)制化概率估計(jì)編碼引擎更新概率估計(jì)自適應(yīng)二進(jìn)制算術(shù)編碼器基于過去獲得的條件選擇一個(gè)模型非二進(jìn)制符號(hào)映射為二進(jìn)制序列使用提供的模型進(jìn)行編碼并更新模型獲得好的性能,源于:通過上下文選擇模型基于本地統(tǒng)計(jì)的自適應(yīng)估計(jì)算術(shù)編碼減少計(jì)算復(fù)雜度H.264CABAC熵編碼
CABAC性能(ITUH.26L(TML4)
測試模型)
QCIF:節(jié)省4.5%~15%比特率CIF:節(jié)省5%~32%比特率CABAC通過使用上下文,利用符號(hào)間相關(guān)性使用自適應(yīng)概率模型使用算術(shù)編碼使得每個(gè)符號(hào)有非整數(shù)比特CAVLC概率分布是靜態(tài)的碼字只能是整數(shù)比特H.264CABAC熵編碼H.264幀和片幀(Frame)、片(Slice)在H.263和MPEG中,每個(gè)幀是P幀或I幀:例外:P幀中的宏塊可能是幀內(nèi)編碼的,稱之為I塊(I-block).H.264推廣這點(diǎn):每個(gè)幀包含一個(gè)或多個(gè)片(slices):Slice是臨近的宏塊序列,當(dāng)不采用FMO時(shí),按其內(nèi)部的光柵掃描順序進(jìn)行處理。每個(gè)slice獨(dú)立地編碼和解碼I-slices,P-slices,B-slices(兩個(gè)參考幀)FMO(FlexibleMacroblockOrdering)通過SliceGroup改變了圖像分割成Slice的方式。每個(gè)SliceGroup以光柵掃描方式分割成一個(gè)或多個(gè)Slice。H.264幀和片幀F(xiàn)rames、片Slices在H.263和MPEG中,每個(gè)幀是P幀或I幀:例外:P幀中的宏塊可能是幀內(nèi)編碼的,稱之為I塊(I-block).H.264推廣這點(diǎn):每個(gè)幀包含一個(gè)或多個(gè)片(slices):Slice是臨近的宏塊序列,當(dāng)不采用FMO時(shí),按其內(nèi)部的光柵掃描順序進(jìn)行處理。每個(gè)slice獨(dú)立地編碼和解碼I-slices,P-slices,B-slices(兩個(gè)參考幀)FMO(FlexibleMacroblockOrdering)通過SliceGroup改變了圖像分割成Slice的方式。每個(gè)SliceGroup以光柵掃描方式分割成一個(gè)或多個(gè)Slice。FMO—靈活的宏塊排序H.264可進(jìn)行不同的性能配置,基于“profiles”&“l(fā)evels”:檔次(profile):編碼算法或工具的集合。級(jí)(level):對(duì)某些關(guān)鍵參數(shù)的限制(例如分辨率、碼率等)H.264分為4個(gè)檔次:Baseline、Main、Extended和High基本(Baseline):最小實(shí)現(xiàn),逐行掃描、I-frame、P-frame和CAVLC,但沒有CABAC、B-frame和SP-Slices,從視頻會(huì)議、無線視頻通信到數(shù)字影院,大多數(shù)應(yīng)用都是良好的。主(Main):增加了隔行掃描、B-Slices和CABAC等,廣播應(yīng)用擴(kuò)展(Extended):SP/SI幀,幀數(shù)據(jù)分割,流媒體應(yīng)用高(High):8*8DCT變換H.264/AVC有15級(jí):分辨率、容量、比特率、緩存器、參考幀數(shù)、解碼處理速度等圖像尺寸:QCIF~數(shù)字影院D-Cinema匹配國際上通行的設(shè)備和發(fā)送格式。H.264/AVC的檔次與級(jí)H.264/AVC的檔次H.264BaselineProfile(L2)I和Pslice(沒有Bslice)熵編碼CAVLC(Context-basedAdaptiveVLC,基于上下文的自適應(yīng)變字長碼)去塊效應(yīng)環(huán)路濾波器逐行掃描1/4像素運(yùn)動(dòng)估計(jì)和補(bǔ)償增強(qiáng)誤碼適應(yīng)性支持ASO(Arbitrarysliceordering,ASO)支持FMO(Flexiblemacroblockordering,F(xiàn)MO)支持冗余片(Redundantslices)應(yīng)用:IP視頻、視頻會(huì)議等支持所有的BaselineProfile算法,除了不支持BaselineProfile中增強(qiáng)的誤碼適應(yīng)性不包括Arbitrarysliceorder(ASO)不支持Flexiblemacroblockordering(FMO)不支持冗余片RedundantslicesI、P、BslicetypesCABAC
和CAVLC熵編碼隔行掃描和逐行掃描MB級(jí)幀/場切換B和P幀加權(quán)預(yù)測?像素運(yùn)動(dòng)估計(jì)和補(bǔ)償應(yīng)用:
電視廣播H.264MainProfileExtended
Profile
所有的Baselineprofile算法或工具Bslice加權(quán)預(yù)測SP/SI切換幀更多的誤碼可靠:數(shù)據(jù)分割(Datapartitioning)H.264ExtendedProfile27282930313233343536373839050100150200250Bit-rate[kbit/s]Foreman
QCIF10HzQualityY-PSNR[dB]MPEG-2H.263MPEG-4JVT/H.264/AVCH.264與MPEG-2/H.263/MPEG-4的性能比較TempeteCIF30Hz25262728293031323334353637380500100015002000250030003500Bit-rate[kbit/s]QualityY-PSNR[dB]MPEG-2H.263MPEG-4JVT/H.264/AVCH.264與MPEG-2/H.263/MPEG-4的性能比較MPEG-2203kbpsH.26439kbpsForeman,QCIF,30fpsH.264與MPEG-2的性能比較H.264與MPEG-2的性能比較H.264與MPEG-2的性能比較
CopyIP存儲(chǔ)DVR
IP視頻電話DTVH.264ISTBVODH.264視頻應(yīng)用環(huán)境IP視頻流DTVMPEG2
overIPSTB3GPPVODSIP/H.264
overIP轉(zhuǎn)碼視頻監(jiān)控H.264
overLAN/IPHFC轉(zhuǎn)碼轉(zhuǎn)碼H.264/AVC小結(jié)視頻編碼基于混合視頻編碼方案,原理上與其它標(biāo)準(zhǔn)類似,但有重要差別。新的關(guān)鍵技術(shù)特征:增強(qiáng)的運(yùn)動(dòng)補(bǔ)償小尺寸的整數(shù)變換增強(qiáng)的熵編碼CAVLC和CABAC其它:增強(qiáng)的去塊效應(yīng)濾波器等和其它標(biāo)準(zhǔn)相比,在相同質(zhì)量下,節(jié)省比特率50%以上,特別是對(duì)于允許使用B幀的較高延時(shí)應(yīng)用。主觀質(zhì)量感覺比客觀PSNR指標(biāo)更好。復(fù)雜度增加,編碼器3~4倍,解碼器2~3倍。ITU-TVCEG和ISO/IECMPEG聯(lián)合制定的標(biāo)準(zhǔn)H.264/MPEG4-10AVC第5章信源編碼標(biāo)準(zhǔn)5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2高級(jí)音頻編碼(AAC)算法5.3DRA多聲道數(shù)字音頻編解碼標(biāo)準(zhǔn)5.4新一代環(huán)繞多聲道音頻編碼格式5.5H.264/AVC視頻編碼標(biāo)準(zhǔn)5.6H.265/HEVC視頻編碼標(biāo)準(zhǔn)5.7AVS與AVS+視頻編碼標(biāo)準(zhǔn)在H.264基礎(chǔ)上增加了SAO濾波器5.6.1H.265/HEVC視頻編碼原理H.264H.265MB/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025企業(yè)汽車租賃合同范本
- 2024年綠色商業(yè)地產(chǎn)項(xiàng)目合作招商合同范本3篇
- 2025年度房屋買賣合同:某房地產(chǎn)開發(fā)公司與購房者之間的房屋買賣協(xié)議3篇
- 二零二五年度企業(yè)內(nèi)部員工培訓(xùn)與晉升承包協(xié)議3篇
- 二零二五年度農(nóng)村電網(wǎng)升級(jí)改造用電安全協(xié)議2篇
- 2025年度建筑安全施工質(zhì)量監(jiān)理服務(wù)合同2篇
- 2024年船運(yùn)合同范本3篇
- 2024年航空公司機(jī)上娛樂系統(tǒng)建設(shè)合同
- 2024版無人駕駛車輛技術(shù)轉(zhuǎn)讓協(xié)議
- 2025年度版權(quán)購買合同:圖書出版版權(quán)購買合同3篇
- 2021年中國保險(xiǎn)保障基金有限責(zé)任公司校園招聘筆試試題及答案解析
- 汽車維修人員培訓(xùn)管理制度
- GB∕T 37587-2019 埋地鋼質(zhì)彎管聚乙烯防腐帶耐蝕作業(yè)技術(shù)規(guī)范
- 消化內(nèi)科診療指南和技術(shù)操作規(guī)范
- 作文稿紙A4打印模板-
- CNAS質(zhì)量體系文件(質(zhì)量手冊(cè)程序文件)
- ojt問答題未升版ojt204
- 五年級(jí)語文滲透法制教育滲透點(diǎn)教案呈現(xiàn)
- 貝雷片-潮白新河鋼棧橋及鋼平臺(tái)計(jì)算說明書
- VF程序設(shè)計(jì)知識(shí)要點(diǎn)
- 凱普21種基因型HPV分型與其它比較
評(píng)論
0/150
提交評(píng)論