信源編碼標(biāo)準_第1頁
信源編碼標(biāo)準_第2頁
信源編碼標(biāo)準_第3頁
信源編碼標(biāo)準_第4頁
信源編碼標(biāo)準_第5頁
已閱讀5頁,還剩180頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

信源編碼標(biāo)準第一頁,共一百八十五頁,2022年,8月28日第五章信源編碼的標(biāo)準

5.1數(shù)字音視頻編碼標(biāo)準概述5.2MPEG-1音頻編碼標(biāo)準5.3杜比AC-3音頻編碼算法5.4MPEG-2音頻編碼標(biāo)準5.6MPEG-1和MPEG-2視頻編碼標(biāo)準5.7MPEG-4視頻編碼標(biāo)準5.8H.264/AVC視頻編碼標(biāo)準5.9AVS視頻編碼標(biāo)準第二頁,共一百八十五頁,2022年,8月28日2023/1/18視頻編碼國際標(biāo)準的制定

第三頁,共一百八十五頁,2022年,8月28日2023/1/185.1數(shù)字音視頻編碼標(biāo)準概述

國際上數(shù)字音視頻編碼標(biāo)準主要有兩大系列:(1)國際標(biāo)準化組織(ISO)和國際電工委員會(IEC)●ISO/IEC:JPEG,JPEG2000,MPEG-x

(2)國際電信聯(lián)盟電信標(biāo)準部(ITU-T)●ITU-T:H.26x第四頁,共一百八十五頁,2022年,8月28日2023/1/18第五頁,共一百八十五頁,2022年,8月28日1.JPEG標(biāo)準JPEG

(JointPhotographicExpertsGroup)是聯(lián)合圖片專家組的英文縮寫。ISO的JPEG主要針對靜止圖像的存儲領(lǐng)域,制定了JPEG系列標(biāo)準。●JPEG標(biāo)準:靜止圖像存儲壓縮標(biāo)準?!?/p>

JPEG-2000標(biāo)準:面向靜止圖像的壓縮標(biāo)準。比JPEG標(biāo)準壓縮效率高2倍以上,性能也更好?!?/p>

MJPEG標(biāo)準:面向視頻序列,將各幀分別編碼成JPEG圖像,成為JPEG圖像序列,但它們均為幀內(nèi)編碼幀,不進行幀間預(yù)測編碼。第六頁,共一百八十五頁,2022年,8月28日2023/1/182.H.26×標(biāo)準

ITU-T的視頻編碼專家組(VCEG)制定了H.26×標(biāo)準系列,主要針對實時視頻通信領(lǐng)域的應(yīng)用,如可視電話、會議電視等。

(1)H.261標(biāo)準:“速率為p×64kbit/s(p=1,2,…,30)視聽業(yè)務(wù)的視頻編解碼”,簡稱為p×64kbit/s標(biāo)準。

(2)H.262:同MPEG-2的視頻部分(ISO/IEC13818-2)(3)H.263:低碼率圖像壓縮標(biāo)準。支持<64kbit/s。(4)H.264:等同MPEG-4AVC(ISO/IEC14496-10)

第七頁,共一百八十五頁,2022年,8月28日2023/1/18

H.26×-----------MPEG在標(biāo)準體系構(gòu)造上,H.26×系列標(biāo)準更具有針對性。其僅僅涉及數(shù)字視頻壓縮編碼環(huán)節(jié),而未涉及其他系統(tǒng)層、及音頻層的內(nèi)容。所以H.26×系列標(biāo)準僅是多媒體通信系統(tǒng)中的一個功能模塊。

MPEG系列標(biāo)準則更系統(tǒng)化,其MPEG系列標(biāo)準涵蓋了整個多媒體系統(tǒng)的系統(tǒng)層、視頻、音頻等各個子系統(tǒng),形成了一個完整的體系。也可以這么說,H.26×標(biāo)準只相當(dāng)于MPEG標(biāo)準中的視頻編碼部分。第八頁,共一百八十五頁,2022年,8月28日2023/1/18H.261

H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開展雙向聲像業(yè)務(wù)(可視電話、視頻會議)而制定的,速率為64kb/s的整數(shù)倍。H.261只對CIF(352x288像素,會議電視)和QCIF(176x144像素,可視電話)兩種圖像格式進行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理。

H.261是最早的運動圖像壓縮標(biāo)準,它詳細制定了視頻編碼的各個部分,包括運動補償?shù)膸g預(yù)測、DCT變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。

由于在幀間壓縮算法中只預(yù)測到后1幀,所以在延續(xù)時間上比較有優(yōu)勢,但圖像質(zhì)量難以做到很高的清晰度,無法實現(xiàn)大壓縮比和變速率錄像等。

第九頁,共一百八十五頁,2022年,8月28日2023/1/18H.263

H.263是最早用于低碼率視頻編碼的ITU-T標(biāo)準,是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準。它是在H.261基礎(chǔ)上發(fā)展起來的,其標(biāo)準輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。

H.263與H.261相比采用了半象素的運動補償,并增加了4種有效的壓縮編碼模式。隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項,使其具有更廣泛的適用性。

H.263還吸取了MPEG的雙向運動預(yù)測等措施,進一步提高幀間編碼的預(yù)測精度,一般說,在低碼率時,采用H.263只要一半的速率可獲得和H.261相當(dāng)?shù)膱D像質(zhì)量。第十頁,共一百八十五頁,2022年,8月28日2023/1/18H.264

H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準。1996年制定H.263標(biāo)準后,ITU-T的視頻編碼專家組(VCEG)開始了兩個方面的研究:一個是短期研究計劃,在H.263基礎(chǔ)上增加選項(之后產(chǎn)生了H.263+與H.263++);另一個是長期研究計劃,制定一種新標(biāo)準以支持低碼率的視頻通信。長期研究計劃產(chǎn)生了H.26L標(biāo)準草案,其目標(biāo)是研制出新的壓縮標(biāo)準,與以前的任何標(biāo)準相比,效率要提高一倍,同時具有簡單、直觀的視頻編碼技術(shù),網(wǎng)絡(luò)友好的視頻描述,適合交互和非交互式應(yīng)用(廣播、存儲、流煤體)。

第十一頁,共一百八十五頁,2022年,8月28日2023/1/18H.264標(biāo)準

H.264具有壓縮效率高、算法先進、抗誤碼能力強、網(wǎng)絡(luò)親和性好等技術(shù)優(yōu)勢,因而極有可能會成為廣播電視、通信及存儲媒體領(lǐng)域的統(tǒng)一編碼標(biāo)準,而且會成為寬帶交互新媒體的國際標(biāo)準。

H.264能夠適應(yīng)現(xiàn)有以及未來網(wǎng)絡(luò)的發(fā)展要求,并能在網(wǎng)絡(luò)及廣播信道中傳輸與接收。在數(shù)字電視領(lǐng)域,H.264已成為數(shù)字高清晰度電視(HDTV)的編碼方案,因而對數(shù)字電視與高清晰度電視的普及與發(fā)展具有非常重要的意義。第十二頁,共一百八十五頁,2022年,8月28日2023/1/18

2001年,ISO的MPEG組織認識到H.26L潛在的優(yōu)勢,隨后ISO與ITU開始組建包括來自ISO/IECMPEG與ITU-TVCEG的聯(lián)合視頻組(JVT),JVT的主要任務(wù)就是將H.26L草案發(fā)展為一個國際性標(biāo)準。于是,在ISO/IEC中該標(biāo)準命名為AVC(AdvancedVideoCoding),作為MPEG-4標(biāo)準的第10個選項;在ITU-T中正式命名為H.264標(biāo)準。該標(biāo)準在2003年3月正式獲得批準。

第十三頁,共一百八十五頁,2022年,8月28日2023/1/183.MPEG標(biāo)準

MPEG(MovingPictureExpertsGroup)是運動圖片專家組的英文縮寫。這個專家組開發(fā)的標(biāo)準通常稱為MPEG標(biāo)準?!馦PEG-1:針對1.5Mbit/s以下數(shù)碼率數(shù)字存儲媒體應(yīng)用的運動圖像及其伴音編碼,標(biāo)準號ISO/IEC11172?!?/p>

MPEG-2:運動圖像及其伴音信息的通用編碼,標(biāo)準號

ISO/IEC13818?!?/p>

MPEG-4:音視對象編碼,標(biāo)準號ISO/IEC14496?!?/p>

MPEG-7:多媒體內(nèi)容描述接口,標(biāo)準號ISO/IEC15938?!?/p>

MPEG-21:多媒體框架,標(biāo)準號ISO/IEC21000。第十四頁,共一百八十五頁,2022年,8月28日2023/1/18

MPEG是壓縮運動圖像及其伴音的視音頻編碼標(biāo)準,它采用了幀間壓縮,僅存儲連續(xù)幀之間有差別的地方

,從而達到較大的壓縮比。

MPEG現(xiàn)有MPEG—1、MPEG—2和MPEG—4三個版本,以適應(yīng)于不同帶寬和圖像質(zhì)量的要求。

①、MPEG—1的視頻壓縮算法依賴于兩個基本技術(shù),一是基于16*16(像素*行)塊的運動補償,二是基于變換域的壓縮技術(shù)來減少空域冗余度,壓縮比相比M-JPEG要高,對運動不激烈的視頻信號可獲得較好的圖像質(zhì)量,但當(dāng)運動激烈時,圖像會產(chǎn)生馬賽克現(xiàn)象。第十五頁,共一百八十五頁,2022年,8月28日2023/1/18

MPEG-1以1.5Mbps的數(shù)據(jù)率傳輸視音頻信號,MPEG-1在視頻圖像質(zhì)量方面相當(dāng)于VHS錄像機的圖像質(zhì)量,視頻錄像的清晰度的彩色模式≥240TVL,兩路立體聲伴音的質(zhì)量接近CD的聲音質(zhì)。

MPEG-1是前后幀多幀預(yù)測的壓縮算法,具有很大的壓縮靈活性,能變速率壓縮視頻,可視不同的錄像環(huán)境,設(shè)置不同的壓縮質(zhì)量,從每小時80MB至400MB不等,但數(shù)據(jù)量和帶寬還是比較大。

第十六頁,共一百八十五頁,2022年,8月28日2023/1/18②、MPEG-2它是獲得更高分辨率(720*572)提供廣播級的視音頻編碼標(biāo)準。MPEG-2作為MPEG-1的兼容擴展,它支持隔行掃描的視頻格式和許多高級性能包括支持多層次的可調(diào)視頻編碼,適合多種質(zhì)量如多種速率和多種分辨率的場合。它適用于運動變化較大,要求圖像質(zhì)量很高的實時圖像。對每秒30幀、720*572分辨率的視頻信號進行壓縮,數(shù)據(jù)率可達3-10Mbps。由于數(shù)據(jù)量太大,不適合長時間連續(xù)錄像的需求。

第十七頁,共一百八十五頁,2022年,8月28日2023/1/18

③MPEG-4是為移動通信設(shè)備在Internet網(wǎng)實時傳輸視音頻信號而制定的低速率、高壓縮比的視音頻編碼標(biāo)準。

MPEG-4標(biāo)準是面向?qū)ο蟮膲嚎s方式,不是像MPEG-1和MPEG-2那樣簡單地將圖像分為一些像塊,而是根據(jù)圖像的內(nèi)容,其中的對象(物體、人物、背景)分離出來,分別進行幀內(nèi)、幀間編碼,并允許在不同的對象之間靈活分配碼率,對重要的對象分配較多的字節(jié),對次要的對象分配較少的字節(jié),從而大大提高了壓縮比,在較低的碼率下獲得較好的效果,

MPEG-4支持MPEG-1、MPEG-2中大多數(shù)功能,提供不同的視頻標(biāo)準源格式、碼率、幀頻下矩形圖形圖像的有效編碼。

第十八頁,共一百八十五頁,2022年,8月28日2023/1/18總之,MPEG-4有三個方面的優(yōu)勢:

①、具有很好的兼容性;

②、MPEG-4比其他算法提供更好的壓縮比,最高達200:1

③、MPEG-4在提供高壓縮比的同時,對數(shù)據(jù)的損失很小。所以,MPEG-4的應(yīng)用能大幅度的降低錄像存儲容量,獲得較高的錄像清晰度,特別適用于長時間實時錄像的需求,同時具備在低帶寬上優(yōu)良的網(wǎng)絡(luò)傳輸能力。第十九頁,共一百八十五頁,2022年,8月28日2023/1/184.AVS標(biāo)準

AVS視頻標(biāo)準(GB/T20090.2-2006)——我國具備自主知識產(chǎn)權(quán)的第二代信源編碼標(biāo)準,主要面向高清晰度和高質(zhì)量數(shù)字電視廣播、網(wǎng)絡(luò)電視、高密度激光數(shù)字存儲媒體等。(1)性能高,編碼效率是MPEG-2的2倍以上,與H.264的編碼效率處于同一水平;(2)復(fù)雜度低,算法復(fù)雜度比H.264明顯低,軟硬件實現(xiàn)成本都低于H.264;(3)我國掌握主要知識產(chǎn)權(quán),專利授權(quán)模式簡單,費用低。第二十頁,共一百八十五頁,2022年,8月28日2023/1/18AVS標(biāo)準

AVS(AudioVideoCodingStandard)的正式名稱為“信息技術(shù)-先進音視頻編碼”,包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理(DRM)等主要技術(shù)標(biāo)準及一致性測試等支撐標(biāo)準,主要面向HDTV、HD-DVD和寬帶流媒體等視頻應(yīng)用。第二十一頁,共一百八十五頁,2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準5.2.1MPEG-1音頻編碼標(biāo)準簡介MPEG-1音頻壓縮標(biāo)準是世界上第一個高保真音頻編碼標(biāo)準。MPEG-1音頻壓縮標(biāo)準的主要性能:輸入信號為線性PCM信號,采樣率為32,44.1或48kHz,輸出為32kb/s~384kb/s壓縮后碼流支持單聲道或雙聲道,共有4種模式。第二十二頁,共一百八十五頁,2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準(3)MPEG-1音頻壓縮標(biāo)準提供三個獨立的壓縮層次①層1的編碼器最為簡單,編碼器的輸出數(shù)據(jù)率為384kb/s,主要用于小型數(shù)字盒式磁帶(digitalcompactcassette,DCC)②層2的編碼器的復(fù)雜程度屬中等,編碼器的輸出數(shù)據(jù)率為256kb/s~192kb/s,其應(yīng)用包括數(shù)字廣播聲音(DAB)、數(shù)字音樂、CD-I(compactdisc-interactive)和VCD(videocompactdisc)等③層3的編碼器最為復(fù)雜,編碼器的輸出數(shù)據(jù)率為64kb/s,主要應(yīng)用于網(wǎng)絡(luò)音樂第二十三頁,共一百八十五頁,2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準5.2.2MPEG-1音頻編碼原理

MPEG音頻壓縮的的主要依據(jù)是人耳朵的聽覺特性,使用“心理聲學(xué)模型(psychoacousticmodel)”來達到壓縮聲音數(shù)據(jù)的目的聽覺系統(tǒng)中存在一個聽覺閾值電平,低于這個電平的聲音信號就聽不到,因此就可以把這部分信號去掉聽覺閾值的大小隨聲音頻率的改變而改變,各個人的聽覺閾值也不同。大多數(shù)人的聽覺系統(tǒng)對2kHz~5kHz之間的聲音最敏感。一個人是否能聽到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽覺閾值第二十四頁,共一百八十五頁,2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準3.聽覺系統(tǒng)存在掩蔽特性,聽覺閾值電平是自適應(yīng)的,即聽覺閾值電平會隨聽到的不同頻率的音頻而發(fā)生變化例如,同時有兩種頻率的音頻存在,一種是1000Hz的音頻,另一種是1100Hz的音頻,但它的強度比前者低18分貝,在這種情況下,1100Hz的音頻就聽不到4.數(shù)字音頻壓縮編碼主要原理:是編碼過程中保留有用信息的而丟掉被掩蔽的信號,其結(jié)果是編解碼后重構(gòu)的信號和原始音頻信號不完全相同,利用人耳的聽覺特性,將聲音中與聽覺無關(guān)的“不相關(guān)”部分去除。對于人耳來說很難感覺出他們之間的差異。第二十五頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-1音頻壓縮定義了3個層次,每個層次針對不同的應(yīng)用,它們的基本模型是相同的層1是最基礎(chǔ)的,層2和層3都在層1的基礎(chǔ)上有所提高。每個后繼的層次都有更高的壓縮比,但需要更復(fù)雜的編碼解碼器MPEG-1的音頻數(shù)據(jù)分成幀(frame),層1每幀包含384個樣本的數(shù)據(jù),每幀由32個子帶分別輸出的12個樣本組成。層2和層3每幀為1152個樣本第二十六頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-1音頻碼流構(gòu)成的幀格式層1、2和層3的子帶樣本層1幀:384樣本層2和層3:1152樣本第二十七頁,共一百八十五頁,2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準MPEG-1層1音頻壓縮技術(shù)子帶編碼濾波器組的劃分

MPEG-1音頻編碼器把輸入信號變換到32個頻域子帶中去。子帶的劃分方法有兩種,一種是線性劃分,另一種是非線性劃分。第二十八頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-1層1壓縮編碼器原理框圖第二十九頁,共一百八十五頁,2022年,8月28日2023/1/18(1)多通道濾波器(2)心理聲學(xué)模型MPEG音頻心理聲學(xué)模型主要實現(xiàn)步驟如下:(a)用快速傅立葉變換FFT將音頻樣值轉(zhuǎn)換到頻域。(b)將得到的頻率組成臨界頻帶。(c)在臨界頻帶的譜值中,將單音(似正弦)和非單音(似噪聲)分開。(d)在臨界頻帶決定噪聲掩蔽閾值之間,模型在不同的臨界頻帶給信號應(yīng)用適當(dāng)?shù)难诒魏瘮?shù)。(e)計算由臨界頻帶引起的每個子帶的掩蔽值。(f)計算每個子帶的SMR(信號掩蔽比)。第三十頁,共一百八十五頁,2022年,8月28日2023/1/18(3)比特分配比特分配過程決定分配給各個子帶的編碼比特數(shù),分配的依據(jù)是心理聲學(xué)模型的信息。LayerⅠ和LayerⅡ的比特分配過程是從計算掩蔽噪聲比開始的。MNR=SNR-SMR第三十一頁,共一百八十五頁,2022年,8月28日2023/1/18(4)比例因子按輸入信號的大小來增減量化步長,輸入信號小用較小的量化步長,輸入信號大用較大的量化步長。第三十二頁,共一百八十五頁,2022年,8月28日2023/1/18(5)碼流格式化——幀形成

MPEG-1音頻數(shù)據(jù)是分成幀(frame)傳送的,LayerⅠ每幀由32個子帶,每個子帶12個樣值,共384個樣值的數(shù)據(jù)組成。LayerⅠ的幀結(jié)構(gòu)如圖所示。第三十三頁,共一百八十五頁,2022年,8月28日2023/1/18

MPEG-1層1音頻編碼幀結(jié)構(gòu)1個子帶32個子帶第三十四頁,共一百八十五頁,2022年,8月28日2023/1/18LayerⅡ的特點LayerⅡ和LayerⅠ編碼原理類似,不同之處有以下幾點:LayerⅡ的每個子帶不是均勻帶寬;LayerⅡ使用的FFT精度高一些;LayerⅡ的幀長度碼流是LayerⅠ的3倍;第三十五頁,共一百八十五頁,2022年,8月28日2023/1/18

LayerⅡ和LayerⅠ幀結(jié)構(gòu)的不同之處在于描述比特分配的比特位數(shù)是不一樣的。

LayerⅡ的幀包含1152個PCM的樣值,如果取樣頻率為48kHz,一幀相當(dāng)于1152/48k=24ms的聲音樣值,這樣LayerⅡ的精確度為24ms,而對于LayerⅠ來言,精確度為8ms,如果用于編輯的話,LayerⅠ更精確。第三十六頁,共一百八十五頁,2022年,8月28日2023/1/18Layer2音頻編碼方框圖第三十七頁,共一百八十五頁,2022年,8月28日2023/1/18LayerⅡ碼流結(jié)構(gòu)圖第三十八頁,共一百八十五頁,2022年,8月28日2023/1/18Layer3音頻編碼

LayerⅢ(也即MP3)采用了LayerⅠ和LayerⅡ未用到的技術(shù)。不等寬子帶;MDCT----改進DCT;

哈夫曼編碼----無損編碼----提高壓縮比20%10:1第三十九頁,共一百八十五頁,2022年,8月28日2023/1/18LayerIII音頻編碼方框圖第四十頁,共一百八十五頁,2022年,8月28日2023/1/18LayerIII音頻解碼方框圖第四十一頁,共一百八十五頁,2022年,8月28日2023/1/185.3杜比AC-3音頻編碼算法

美國高級電視制式委員會(ATSC)規(guī)定電視伴音壓縮標(biāo)準是杜比(Dolby)實驗室開發(fā)的AC-3系統(tǒng)。該系統(tǒng)的音響效果為高保真立體環(huán)繞聲。AC是英語“音頻感覺編碼系統(tǒng)”的縮寫詞。目前市場流行的稱為“家庭影院”的音響系統(tǒng)多數(shù)采用此標(biāo)準。

杜比AC-3規(guī)定的取樣頻率為48kHz,它鎖定于27MHz的系統(tǒng)時鐘。每個音頻節(jié)目最多可有6個音頻信道。第四十二頁,共一百八十五頁,2022年,8月28日2023/1/18杜比AC-3環(huán)繞聲系統(tǒng)AC(AudioCoding)-3是一種播放高音質(zhì)和效果的環(huán)繞聲系統(tǒng)杜比AC-3系統(tǒng)利用心理聲學(xué)原理對音頻信號進行壓縮編碼其取樣頻率有32KHz、44.1KHz、48KHz對音頻聲道采用獨立方式編碼,將每個聲道的頻率范圍擴展到20Hz~20kHz全頻域杜比AC-3的基本聲道有5個,即前方左、右、中聲道,后方環(huán)繞左和環(huán)繞右聲道,另外還有一個超重低音聲道,共有6個聲道。其中超重低音聲道的最高頻率為120Hz,不能算一個完整的聲道,因此又稱為0.1聲道,這樣加起來便稱為5.1聲道

第四十三頁,共一百八十五頁,2022年,8月28日2023/1/18圖5-4五聲道立體聲揚聲器的安排C屏幕收聽區(qū)LRRsLs第四十四頁,共一百八十五頁,2022年,8月28日2023/1/18其特點有:

(1)全音頻聲道。AC-3系統(tǒng)播放的音質(zhì)清晰,聲場動態(tài)范圍廣,聲象重現(xiàn)逼真,具有真實現(xiàn)場感(2)立體環(huán)繞聲。AC-3系統(tǒng)具有左和右后方環(huán)繞聲道,其環(huán)繞包圍感很強,烘托現(xiàn)場氣氛逼真,可使視聽者進入出神入化的境界(3)聲道之間分離度高

第四十五頁,共一百八十五頁,2022年,8月28日2023/1/18從家庭影院的應(yīng)用和發(fā)展來看,杜比AC-3環(huán)繞聲系統(tǒng)將可能成為主流(1)美國已確定杜比AC-3環(huán)繞聲系統(tǒng)為HDTV(高清晰度電視)音頻信號的編碼和解碼標(biāo)準(2)數(shù)字視盤機(DVD)的音頻也采用AC-3音頻標(biāo)準(3)美國幾乎所有著名的電影公司制作的影片都按照AC-3系統(tǒng)錄制(4)目前世界著名的電子公司生產(chǎn)出的DVD機,A/V放大器都帶有AC-3解碼器第四十六頁,共一百八十五頁,2022年,8月28日2023/1/18⑴AC-3編碼原理概述AC-3編碼系統(tǒng)采用了全音域杜比噪聲衰減系統(tǒng),在沒有音頻信號掩蔽時,集中力量降低或消除噪聲,在其它時間根據(jù)人的聽覺頻率選擇性把每個聲道的音頻頻譜分割成不同帶寬的子頻帶,結(jié)果使噪聲處在距音頻信號頻率分量很近的頻率上,就很容易被音頻信號所遮蓋。除了降低噪聲以保證音質(zhì)外,杜比AC-3系統(tǒng)為降低數(shù)碼率,對各頻帶采用不同的取樣率,根據(jù)頻譜或節(jié)目的動態(tài)特性來分配各頻帶的比特數(shù)。第四十七頁,共一百八十五頁,2022年,8月28日2023/1/18杜比公司除運用上述聲學(xué)原理外,還運用了它擁有的杜比降噪技術(shù),開發(fā)出數(shù)碼化的“自適應(yīng)編碼”系統(tǒng)。這是一種極具選擇性和抑制噪聲能力的自適應(yīng)編碼體系。

AC-3將多聲道作為一個整體進行編碼,比單聲道編碼效率高,同時對各個聲道和每個聲音內(nèi)的各頻帶信號用不同的取樣率進行量化、對噪聲進行衰減或掩蔽,結(jié)果AC-3系統(tǒng)的數(shù)碼率降低而音質(zhì)損害很小。第四十八頁,共一百八十五頁,2022年,8月28日2023/1/18

AC-3至少可以處理20bit動態(tài)范圍的數(shù)字音頻信號,頻率范圍從20Hz~20kHz(0.5dB),3Hz和20.3kHz處為-3dB。重低音聲道頻率范圍為20~120Hz(0.5dB),3Hz和12Hz處為-3dB。且支持32kHz,44.1kHz,48kHz的取樣頻率。AC-3的數(shù)字音頻數(shù)據(jù)經(jīng)加誤碼糾錯后數(shù)碼率僅為384kb/s,因此ITU-R在1992年正式接受AC-3的5.1聲道格式。AC-3含有MPEG系統(tǒng)的時間印記(timestamp),故可與MPEG視頻同步。第四十九頁,共一百八十五頁,2022年,8月28日2023/1/18⑵AC-3系統(tǒng)的方框圖AC-3編碼器接受聲音PCM數(shù)據(jù),最后產(chǎn)生壓縮數(shù)據(jù)流。AC-3算法通過對聲音信號頻域表示的粗略量化,可以達到很高的編碼增益。圖5-8AC-3編碼器原理方框圖分析濾波器組6聲道PCM數(shù)據(jù)耦合預(yù)處理尾數(shù)量化窗處理頻譜包絡(luò)編碼核心比特分配AC-3數(shù)據(jù)幀格式AC-3碼流比特分配第五十頁,共一百八十五頁,2022年,8月28日2023/1/18

第一步把時間域內(nèi)的PCM數(shù)據(jù)值變換為頻域內(nèi)成塊的一系列變換系數(shù)。

AC-3解碼器輸入信號是一組頻譜信號,它是由時域信號PCM數(shù)據(jù)經(jīng)過時-頻變換而得到。該頻譜數(shù)據(jù)流分為指數(shù)部和尾數(shù)部兩部分,指數(shù)部分采用差分方式進行編碼,編碼后的指數(shù)代表了整個信號的頻譜,可作為頻譜包絡(luò)的參數(shù)。其尾數(shù)部分按照比特分配的結(jié)果進行量化。于是,量化尾數(shù)和頻譜包絡(luò)形成了AC-3碼流的主要信息,連同其它輔助信號(例如比特分配等)構(gòu)成了AC-3比特流。

第五十一頁,共一百八十五頁,2022年,8月28日2023/1/18

AC-3數(shù)據(jù)幀一個AC-3串行編碼的音頻數(shù)據(jù)流是由一個同步幀的序列所組成音頻樣本塊(AB)其中每個代表256個新的音頻樣本,AB0~AB5的每一塊代表一個編碼通道,可以被分別獨立解碼,塊的大小可以調(diào)整,但總數(shù)據(jù)量不變同步信息(SI)數(shù)碼流信息(BSI),包含描述編碼數(shù)據(jù)流業(yè)務(wù)的各種參數(shù)輔助數(shù)據(jù)(AUX)誤碼檢測(CRC)第五十二頁,共一百八十五頁,2022年,8月28日2023/1/18AC-3解碼器首先必須與編碼數(shù)據(jù)流同步,經(jīng)誤碼糾錯后再從碼流中分離出各種類型的數(shù)據(jù),如控制參數(shù)、系數(shù)配置參數(shù)、編碼后的頻譜包絡(luò)和量化后的尾數(shù)等。然后根據(jù)聲音的頻譜包絡(luò)產(chǎn)生比特分配信息,對尾數(shù)部分進行反量化,恢復(fù)變換系數(shù)的指標(biāo)和尾數(shù),再經(jīng)過合成濾波器組由頻域表示變換到時域表示,最后輸出重建的PCM數(shù)據(jù)值信號。

圖5-10AC-3解碼器原理方框圖AC-3幀同步、糾錯、解幀格頻譜包絡(luò)解碼比特分配比特分配信息尾數(shù)反量化合成濾波器組PCM碼流AC-3碼流第五十三頁,共一百八十五頁,2022年,8月28日2023/1/185.4MPEG-2音頻編碼標(biāo)準MPEG-2音頻壓縮MPEG-2聲音編碼標(biāo)準是MPEG為多聲道聲音開發(fā)的低碼率編碼方案,它是在MPEG-1聲音標(biāo)準基礎(chǔ)上發(fā)展而來的。和MPEG-1相比,MPEG-2聲音主要增加了三個方面的內(nèi)容支持5.1路環(huán)繞聲。它能提供5個全帶寬聲道(左、右、中和兩個環(huán)繞聲道),外加一個低頻效果增強聲道,統(tǒng)稱為5.1聲道支持多達8種語言或解說增加了低取樣和低碼率。在保持MPEG-1聲音的單聲道和立體聲的原有取樣率的情況下,MPEG-2又增加了三種取樣率,即把MPEG-1的取樣率降低了一半,(16kHz,22.05kHz,24kHz)以便提高碼率低于64kbit/s時的每個聲道的聲音質(zhì)量第五十四頁,共一百八十五頁,2022年,8月28日2023/1/182.MPEG-2的兩種音頻數(shù)據(jù)壓縮格式MPEG-2Audio,或者稱為MPEG-2多通道(Multichannel)音頻,與MPEG-1Audio兼容,所以又稱為MPEG-2BC(BackwardCompatible)MPEG-2AAC(AdvancedAudioCoding),與MPEG-1聲音格式不兼容,因此通常稱為非后向兼容MPEG-2NBC(Non-Backward-Compatible)標(biāo)準

第五十五頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-2AudioMPEG-2Audio(ISO/IEC13818-3)和MPEG-1Audio(ISO/IEC1117-3)標(biāo)準都使用相同種類的編譯碼器,LayerⅠ,LayerⅡ和LayerⅢ的結(jié)構(gòu)也相同MPEG-2音頻標(biāo)準與MPEG-1標(biāo)準相比,MPEG-2做了如下擴充:增加了16kHz,22.05kHz和24kHz采樣頻率擴展了編碼器的輸出速率范圍,由32~384kbit/s擴展到8~640kbit/s增加了聲道數(shù),支持5.1聲道和7.1聲道的環(huán)繞聲。此外MPEG-2還支持LinearPCM(線性PCM)和DolbyAC-3(AudioCodeNumber3)編碼

第五十六頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-2中的AAC編碼AAC:AdvancedAudioCoding先進音頻編碼,不向下兼容MPEG-2AAC是聲音感知編碼標(biāo)準,MPEG-2AAC主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個子帶中,用全局信號把噪聲掩蔽掉。AAC支持的采樣頻率可從8kHz到96kHzAAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標(biāo)準可支持48個主聲道、16個低頻音效加強通道LFE(lowfrequencyeffects)、16個配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個數(shù)據(jù)流第五十七頁,共一百八十五頁,2022年,8月28日2023/1/185.MPEG-2AAC壓縮比為11:1,即每個聲道的數(shù)據(jù)率為(44.1×16)/11=64kbit/s,而5個聲道的總數(shù)據(jù)率為320kbit/s的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別6.

與MPEG的LayerⅡ相比,MPEG-2AAC的壓縮率可提高1倍,而且質(zhì)量更高,與MPEG的LayerⅢ相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。第五十八頁,共一百八十五頁,2022年,8月28日2023/1/18(a)AAC采用了改進的余弦變換MDCT濾波器組。

(b)采用了新的時間/頻率編碼方案,即瞬時噪聲定形(TemporalNoiseShaping,TNS)。(c)因為音頻信號有較強的相關(guān)性,在AAC系統(tǒng)中采用了預(yù)測技術(shù),有效地提高了編碼效率。(d)能細致地控制量化步長大小,使得比特利用更為有效。(e)在AAC系統(tǒng)中采用了霍夫曼熵編碼,并配合靈活的碼流結(jié)構(gòu),進一步提高了編碼效率。

AAC增加的新編碼工具第五十九頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-2AAC的配置開發(fā)MPEG-2AAC標(biāo)準采用的方法與開發(fā)MPEGAudio標(biāo)準采用的方法不同。后者采用的方法是對整個系統(tǒng)進行標(biāo)準化,而前者采用的方法是模塊化的方法,把整個AAC系統(tǒng)分解成一系列模塊,用標(biāo)準化的AAC工具(advancedaudiocodingtools)對模塊進行定義AAC標(biāo)準定義了三種配置:基本類(MainProfile);----最好聲音質(zhì)量低復(fù)雜度類(LowComplexityProfile);--聲音質(zhì)量中可分級取樣率類(ScalableSamplingRateProfile)--差第六十頁,共一百八十五頁,2022年,8月28日2023/1/18

MPEG-2聲音多聲道擴展部分的數(shù)據(jù)結(jié)構(gòu) MPEG-2多聲道聲音編碼標(biāo)準和現(xiàn)有的MPEG-1聲音標(biāo)準保持后向兼容。在對原有的MPEG-1兩聲道增加獨立的環(huán)繞聲道時,MPEG-2盡量保特和MPEG-1聲音語法的兼容性,MPEG-2中的主聲道(左、右)仍然保持后向兼容,而環(huán)饒聲道采用新的編碼方法和語法第六十一頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-1、MPEG-2音頻參數(shù)的比較第六十二頁,共一百八十五頁,2022年,8月28日2023/1/185.5AVS音頻編碼標(biāo)準

我國的數(shù)字音視頻標(biāo)準工作組(AVS)完成了具有自主知識產(chǎn)權(quán)的面向數(shù)字電視、高密度激光存儲、網(wǎng)絡(luò)流媒體等重大音頻應(yīng)用的新一代音頻編碼壓縮技術(shù)標(biāo)準—AVS音頻編碼標(biāo)準,其編碼性能和壓縮效率已經(jīng)達到了國際上先進的MPEGAAC音頻編碼標(biāo)準,優(yōu)于MP3等音頻編碼技術(shù),并且還支持可分級編碼。第六十三頁,共一百八十五頁,2022年,8月28日2023/1/18

AVS音頻采用通用的感知音頻編碼框架,支持采樣率8kHz~96kHz的多聲道PCM信號輸入。它最多支持32個主聲道、8個低頻增強聲道,輸出碼率為每聲道為16kbps~96kbps,同時支持精細可分級編碼,可分級的編解碼步長為1kbps。

由于采用通用的感知音頻編碼框架,采用了最新的數(shù)字信號處理技術(shù)和編碼壓縮技術(shù),在64kbps的編碼碼率下達到了感知透明的編碼質(zhì)量,其編碼壓縮效率已達到1/10~1/16。第六十四頁,共一百八十五頁,2022年,8月28日2023/1/18心理聲學(xué)摸型長短窗判決IntMDCTSPSC立體聲編碼量化CBC熵編碼比特流格式化輸入PCM數(shù)據(jù)AVS音頻編碼流AVS音頻立體聲編碼原理框圖第六十五頁,共一百八十五頁,2022年,8月28日2023/1/18窗信息IntIMDCTSPSC立體聲解碼逆量化CBC解碼比特流去格式化AVS音頻編碼流解碼輸出PCMAVS音頻立體聲解碼原理框圖上下文比特平面編碼方極坐標(biāo)立體聲第六十六頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準MPEG-1是MPEG-2的一個子集,即MPEG-2能兼容MPEG-1MPEG-1目標(biāo)MPEG-1標(biāo)準的設(shè)計思想是在1Mbit/s到1.5Mbit/s的低帶寬條件下,提供盡可能高的圖像質(zhì)量(包括音頻,以下所指圖像均包括音頻)。針對CD-ROM、光盤的視頻存儲和放像所制定的數(shù)字電視標(biāo)準VCD使用MPEG-1標(biāo)準,圖像尺寸為352×288,標(biāo)準速率為1.2Mbit/s第六十七頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準1.MPEG-1標(biāo)準的內(nèi)容ISO/IEC11172包括三大部分:ISO/IEC11172-1第一部分系統(tǒng)ISO/IEC11172-2第二部分視頻ISO/IEC11172-3第三部分音頻MPEG-l標(biāo)準可以處理各種類型的活動圖像,其基本算法對于壓縮水平方向352個像素、豎直方向288個像素的空間分辨力,每秒24/25/30幅畫面的運動圖像有很好的效果在MPEG-l標(biāo)準中的一幀圖像的概念不同于電視中幀的概念,前者一定是逐行掃描的圖像,如果待處理信號是隔行掃描的圖像,則編碼前必須將其轉(zhuǎn)換成逐行掃描的格式第六十八頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準MPEG-1標(biāo)準采用了一系列技術(shù)以獲得高壓縮比對色差信號進行亞采樣,減少數(shù)據(jù)量采用運動補償技術(shù)減少幀間冗余度做二維DCT變換去除空間相關(guān)性對DCT系數(shù)進行量化,舍去不重要的信息,將量化后的DCT系數(shù)按照頻率重新排序?qū)CT系數(shù)進行變字長熵保持編碼對每數(shù)據(jù)塊的直流分量(DC)進行預(yù)測差分編碼第六十九頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準在MPEG-l標(biāo)準中,考慮到壓縮比和隨機存取這對矛盾,一共定義了四種圖像類型:I幀圖像:幀內(nèi)幀圖像,采用幀內(nèi)編碼,不參照其他圖像P幀圖像:預(yù)測幀圖像,參照前一幅I幀或P幀圖像做運動補償編碼B幀圖像:雙向預(yù)測幀圖像,參照前一幅和后一幅I幀或P幀圖像做雙向運動補償編碼D類圖像:直流(DC)圖像,這類圖像中只含直流分量,是為快放功能而設(shè)計的第七十頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準I幀、P幀、B幀示意圖第七十一頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準幀內(nèi)圖像I的壓縮編碼算法框圖第七十二頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準預(yù)測圖像P的壓縮編碼算法框圖第七十三頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準雙向預(yù)測圖像B的壓縮編碼算法框圖第七十四頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準I幀、P幀和B幀圖像的依賴關(guān)系第七十五頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準圖像的顯示順序和編碼順序顯示順序:編碼順序:第七十六頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準I幀、P幀、B幀的數(shù)據(jù)字節(jié)和壓縮比第七十七頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準編解碼延時問題由于編碼順序和顯示順序之間的差異,帶來編、解碼總延時達0.8~1秒時間這種延時對廣播性質(zhì)的圖像傳輸不會帶來任何影響,因為用戶并不能發(fā)現(xiàn)發(fā)射端與接收端信號起始時間的差異對于交互性質(zhì)的圖像傳輸,例如,數(shù)字會議電視則帶來十分不便。因為甲方圖像傳至乙方經(jīng)編碼、解碼要延時0.8~1秒時間;乙方圖像傳至甲方經(jīng)編碼、解碼也要延時0.8~1秒時間,這樣,如果甲對乙提一個問題,則1.8~2秒以后才能得到回答第七十八頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準解決編解碼延時過長問題減少B幀使兩個I幀之間的幀數(shù)減少,則編、解碼總延時下降,甚至可以把B幀、P幀全部取消,這樣,可以得到0延時。這種方式也稱M-JPEG(Motion-JPEG)方式。但此時的壓縮比降到了5:1~7:1延時與壓縮倍數(shù)是互相矛盾的第七十九頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準5.6.2.MPEG-1視頻流數(shù)據(jù)結(jié)構(gòu)視頻流數(shù)據(jù)由以下6部分組成:1.視頻序列2.圖像組3.圖像4.片(條)5.宏塊6.塊第八十頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準MPEG-1視頻流結(jié)構(gòu)第八十一頁,共一百八十五頁,2022年,8月28日2023/1/181.編碼原理

MPEG-2與MPEG-1視頻編解碼原理框圖基本相同。利用運動補償幀間預(yù)測編碼----消除時間冗余;利用DCT----消除空間冗余;對DCT系數(shù)進行熵編碼----消除符號統(tǒng)計冗余;

---------達到進一步壓縮數(shù)碼率的目的。

5.6.3MPEG-1與MPEG-2視頻編解碼原理第八十二頁,共一百八十五頁,2022年,8月28日2023/1/185.6.3MPEG-1與MPEG-2視頻編解碼原理2.編碼過程

(1)幀重排

(2)當(dāng)輸入的第一幀作為I幀圖像進入圖4-8所示的編碼器中時,開關(guān)K1,K2和K4在上方,K3在左方。

(3)當(dāng)P4作為P幀進入編碼器時,開關(guān)K1,K2和K4切換到下方,K3還在左方(4)當(dāng)B2作為B幀進入編碼器時,開關(guān)K1

在下方,K2

在上方,K3

在右方,K4

在中間。第八十三頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-2壓縮編碼原理框圖第八十四頁,共一百八十五頁,2022年,8月28日2023/1/183.圖像組(GroupofPictures,GOP)

在圖示的圖像序列中,每12幀中包含1個I幀、3個P幀和8個B幀,稱為一個圖像組(GOP)。

第八十五頁,共一百八十五頁,2022年,8月28日2023/1/18圖像序列原始順序第八十六頁,共一百八十五頁,2022年,8月28日2023/1/18經(jīng)過編碼器編碼后,6個視頻層次構(gòu)成的編碼視頻碼流稱為視頻基本碼流(ES)。

(1)在視頻序列層中,一個編碼的視頻序列由一個序列信頭開始,后面跟隨一個圖像組頭,然后是由許多圖像(I,P和B)組成的一系列GOP,視頻序列結(jié)束于一個序列終止碼。

(2)在圖像組層中,GOP頭中給出了時間碼和緊跟在I幀后面的B圖像的預(yù)測特性等信息。第八十七頁,共一百八十五頁,2022年,8月28日2023/1/18(3)在圖像層中,圖像頭中給出了時間參考信息、圖像編碼類型和VBV(視頻緩存校驗器)延時等信息。(4)在像條層中,像條頭中給出了像條垂直位置、量化因子碼等信息。(5)在宏塊層中,其中的宏塊類型碼中給出了宏塊屬性、運動矢量。(6)最后一層是塊層,給出了其DCT系數(shù)。第八十八頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準視頻基本碼流結(jié)構(gòu)第八十九頁,共一百八十五頁,2022年,8月28日2023/1/18MPEG-2解碼

MPEG-2解碼是MPEG-2編碼處理的逆過程,從編碼比特流中重建圖像幀。MPEG-2解碼框圖第九十頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準5.6.4MPEG-2功能擴展

1.MPEG-2有“按幀編碼”和“按場編碼”兩種模式

MPEG-1只支持逐行掃描,不支持隔行掃描;

MPEG-2允許逐行掃描和隔行掃描,基于“幀”和“場”編碼,顯著提高編碼效率;

第九十一頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準5.6.4MPEG-2功能擴展

2.MPEG-2增加了可分級編碼模式視頻編碼的可分級性----指視頻碼流數(shù)碼率的可調(diào)整性,即視頻數(shù)據(jù)只能壓縮一次,卻能以多種不同的幀頻、空間分辨率(清晰度)或視頻質(zhì)量進行解碼,從而支持多種用戶的不同需求。第九十二頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準考慮到要適應(yīng)不同數(shù)據(jù)速率設(shè)備的應(yīng)用,MPEG專家組定義了三種質(zhì)量不同的編碼方式:信噪比可分級性SNR(Signal-to-Noisescalability)是指圖像質(zhì)量的折中,對于基本層碼流使用較粗糙的量化比得到比較低的信噪比,而增強層碼流使用提高量化精度后的額外信息得到比較高的信噪比空間分辨率可分級性(Spatialscalability)是指圖像的空間分辨率的折中,對于基本層碼流使用比較低的圖像分辨率,而對于增強層碼流使用比較高的圖像分辨率時間分辨率可分級性(TemporalScalability)是指圖像在時間方向上分辨率的折中,幀頻隨分層級數(shù)而變化

三者可組合成多層混合可分級編碼第九十三頁,共一百八十五頁,2022年,8月28日2023/1/18第九十四頁,共一百八十五頁,2022年,8月28日2023/1/18第九十五頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準5.6.4MPEG-2功能擴展

3.MPEG-2定義了“類”和“級”的概念為了使MPEG-2能適應(yīng)圖像質(zhì)量從低到高的各種應(yīng)用領(lǐng)域,MPEG-2標(biāo)準定義了“類”(Profile,又稱為檔次)和“等級”(Level)?!邦悺笔钦麄€比特流構(gòu)成所定義的語法子集,即每種類對應(yīng)了一套新的壓縮處理算法,類共有5種?!暗燃墶笔菍Ρ忍亓鲄?shù)的一組定義了的限制,即每一個等級指定了一套參數(shù)范圍(如圖像大小、幀速率和位速率)。按圖像分辨率共有4種等級。同一類中的不同級,遵循共同的語法,只是參數(shù)不同而已。第九十六頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準第九十七頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準等級:Lowlovel類似于的CIF或MPEG-1的SIFMainlevel相應(yīng)于普通電視High-1440level略相應(yīng)于每行1440個抽樣的HDTVHighlevel略相應(yīng)于每行1920個抽樣的HDTV第九十八頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準MPEG-2標(biāo)準所容許的11個組合第九十九頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準MPEG-2容許的幀速率第一百頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準亮、色度格式和圖像編碼類型第一百零一頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準

MPEG-2的上限比特率(上限速率)第一百零二頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準5.6.4圖像格式MPEG-2的圖像格式(VideoFormat)分為4級低級圖像格式主級圖像格式高級窄屏幕圖像格式高級寬屏幕圖像格式第一百零三頁,共一百八十五頁,2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準第一百零四頁,共一百八十五頁,2022年,8月28日2023/1/18第一百零五頁,共一百八十五頁,2022年,8月28日2023/1/18第一百零六頁,共一百八十五頁,2022年,8月28日2023/1/18第一百零七頁,共一百八十五頁,2022年,8月28日2023/1/18第一百零八頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準MPEG-4的目標(biāo)是要在音視對象的形態(tài)下能夠高度可靠地完成視音頻壓縮數(shù)據(jù)通信,在超低帶寬(10Kbit/s到1Mbit/s)的條件下提供盡可能好的圖像質(zhì)量并且具有很強的交互功能MPEG-4提供了一種暫新的交互方式----基于內(nèi)容的交互,對每一個音視對象(AV)進行交互和操控。用戶可以改變場景中對象的位置、大小、視角、形狀等,甚至清除該對象。從1994年開始工作,1999年12月ISO/IEC制訂了MPEG-4標(biāo)準,在互聯(lián)網(wǎng)及移動通信中有較好的應(yīng)用第一百零九頁,共一百八十五頁,2022年,8月28日2023/1/18第一百一十頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準5.7.1MPEG-4標(biāo)準概述MPEG-4標(biāo)準支持7個新的功能。可粗略劃分為3類:基于內(nèi)容的交互性、高壓縮率和靈活多樣的存取模式1.基于內(nèi)容的交互性(Content-basedInteractivity)基于內(nèi)容的操作與比特流編輯:支持無須編碼就可進行基于內(nèi)容的操作與比特流編輯自然與合成數(shù)據(jù)混合編碼:提供將自然視頻圖像同合成數(shù)據(jù)(如文本、圖形等)有效結(jié)合的方式,同時支持交互性操作增強的時間域隨機存取:MPEG-4將提供有效的隨機存取方式:在有限的時間間隔內(nèi),可按幀或任意形狀的對象,對一音、視頻序列進行隨機存取第一百一十一頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準2.高壓縮率(Compression)提高編碼效率:與現(xiàn)有的或正在制定的標(biāo)準相比,在可比擬速率上,MPEG-4標(biāo)準將提供更好的主觀視覺質(zhì)量的圖像。一般地說,MPEG-4的壓縮倍數(shù)高達100倍。這一功能可望在迅速發(fā)展的移動通信網(wǎng)中獲得應(yīng)用,但值得注意的是:提高編碼效率不是MPEG-4的唯一的主要目標(biāo)。對多個并發(fā)數(shù)據(jù)流的編碼:MPEG-4將提供對一景物的有效多視角編碼,加上多伴音聲道編碼及有效的視聽同步。第一百一十二頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準3.靈活多樣的存取

(UniversalAccess)錯誤易發(fā)環(huán)境中的抗錯性(Robustness):“靈活多樣”是指允許采用各種有線、無線網(wǎng)和各種存儲媒體,MPEG-4將提高抗錯誤能力,尤其是在易發(fā)生嚴重錯誤的環(huán)境下的低比特應(yīng)用中(移動通信鏈路)基于內(nèi)容的尺度可變性(Content-basedScalability):內(nèi)容尺度可變性意味著給圖像中的各個對象分配優(yōu)先級。其中,比較重要的對象用較高的空間和/或時間分辨率表示?;趦?nèi)容的尺度可變性是MPEG-4的核心。第一百一十三頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準MPEG-4可視信息編碼MPEG-4可視信息的碼率范圍可從5kbit/s~64Kbit/s(CIF以下的分辨率和15Hz以下的幀頻)直至64kbit/s~4Mbit/s(ITU-R601的各種圖像分辨率),并支持MPEG-1和MPEG-2已經(jīng)提供的大多數(shù)功能。第一百一十四頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準傳統(tǒng)圖像編碼方法VSMPEG-4的基于對象的圖像編碼方法傳統(tǒng)圖像編碼方法依據(jù)信源編碼理論的框架,將圖像作為隨機信號,利用其隨機特性來達到壓縮的目的。這種方法本身未能考慮信息獲取者的主觀意義與主觀特性,未能考慮事件本身的特性如具體含義、重要性以及后果等等MPEG-4的圖像編碼的目標(biāo)在于采用現(xiàn)代圖像編碼方法,利用人眼視覺特性,抓住圖像信息傳輸?shù)谋举|(zhì),從輪廓、紋理的思路出發(fā),支持基于視覺內(nèi)容的交互功能,從而獲得更高的壓縮比和圖像質(zhì)量第一百一十五頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準5.7.2MPEG-4視頻編碼

MPEG-4使用視頻對象(VO,VideoObject)來描述圖像視頻對象的屬性:形狀(Shape) 外形,透明等運動(Motion) 位置,位移等紋理(Texture) 顏色,灰度等圖像(序列)是由視頻對象(包括背景)構(gòu)成的VOVOMV第一百一十六頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準針對視頻對象VO,進行如下編碼形狀編碼:描述視頻對象的形狀二值形狀編碼1:表示VOP中像素屬于視頻對象0:表示VOP中像素不屬于視頻對象灰度形狀編碼用0~255表示VOP的透明度,0表示完全透明,255表示完全不透明VOP:VideoObjectPlane,視頻對象面,表示視頻對象形成的畫面,其形狀可以是任意的,當(dāng)VOP是矩形時,則圖像編碼還原成傳統(tǒng)圖像編碼第一百一十七頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準運動信息編碼采用運動預(yù)測和運動補償技術(shù)去除圖像的幀間冗余度將VOP分為三類:I-VOP:幀內(nèi)VOP,采用幀內(nèi)編碼技術(shù)P-VOP:前向VOP,采用前向預(yù)測編碼技術(shù)B-VOP:雙向VOP,采用雙向預(yù)測編碼技術(shù)P-VOPB-VOPI-VOP第一百一十八頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準紋理編碼采用8×8DCT變換消除VOP的幀內(nèi)冗余度VOP宏塊VOP窗口8×8DCT8×8分級編碼:

視頻編碼的可分級性(scalability)是指碼率的可調(diào)整性,即視頻數(shù)據(jù)只壓縮一次,卻能以多個幀率、空間分辨率或視頻質(zhì)量進行解碼,從而可支持多種類型用戶的各種不同應(yīng)用要求。

----實現(xiàn)空間域、時間域多分辨率功能需求。第一百一十九頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準5.7.2MPEG-4基于VOP的視頻編碼基于VOP的視頻編碼方法示意圖第一百二十頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準VOP編碼原理圖對象分割第一百二十一頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準

MPEG-4編碼器基本框圖第一百二十二頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準MPEG-4視頻編碼舉例Sprite編碼舉例背景圖鑲嵌圖拼接重構(gòu)圖第一百二十三頁,共一百八十五頁,2022年,8月28日2023/1/18

MPEG-4通過視頻對象層(VideoObjectLayer)的數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)分級編碼。

MPEG-4提供了兩種基本分級工具,即時域分級(TemporalScalability)和空域分級(SpatialScalability),此外還支持時域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強層?;緦犹峁┝艘曨l序列的基本信息,增強層提供了視頻序列更高的分辨率和細節(jié)。

-------網(wǎng)絡(luò)帶寬和視頻效果具有很好的適應(yīng)性5.7.3MPEG-4可分級視頻編碼第一百二十四頁,共一百八十五頁,2022年,8月28日2023/1/185.7.4MPEG-4容錯視頻編碼MPEG-4視頻編碼標(biāo)準

----應(yīng)用于網(wǎng)絡(luò)傳輸時----誤碼、丟包、時延…-----要求:壓縮效率/音視同步/容錯掩錯1.再同步----等間隔比特位周期性設(shè)置同步標(biāo)記;失去同步----碼流中任何差錯都可能會導(dǎo)致失去同步解決方法:插入同步碼字(起始碼)能夠限制差錯傳遞到下一個同步碼字同步碼字應(yīng)該和其它碼字區(qū)別開同步碼字可以插入到圖像,條帶的起始位置第一百二十五頁,共一百八十五頁,2022年,8月28日2023/1/182.可逆的變長編碼RVLC----具備后向解碼能力,恢復(fù)部分丟失數(shù)據(jù);VLC只能前向解碼。傳統(tǒng)的VLC僅僅從前向唯一的解碼----當(dāng)一個VLC碼字出錯,則從當(dāng)前解碼碼字開始到下一個同步碼字之間的碼字不能解碼都要丟掉

RVLC既可以前向解碼,也可以后向解碼----如果一個RVLC碼字出錯,跳到下一個同步碼字前,從后向解碼,部分恢復(fù)數(shù)據(jù)第一百二十六頁,共一百八十五頁,2022年,8月28日2023/1/183.數(shù)據(jù)分割(DataPartitioning)將數(shù)據(jù)分成重要數(shù)據(jù)和一般數(shù)據(jù)分別放在碼流的不同位置重要的數(shù)據(jù)緊跟著放在同步字的后邊重要數(shù)據(jù):編碼模式,MV,DC系數(shù)一般數(shù)據(jù)放在重要數(shù)據(jù)的后邊一般數(shù)據(jù):AC系數(shù)

重要數(shù)據(jù)先于一般數(shù)據(jù)解碼

第一百二十七頁,共一百八十五頁,2022年,8月28日2023/1/185.7MPEG-4標(biāo)準典型節(jié)目碼流解碼器

第一百二十八頁,共一百八十五頁,2022年,8月28日2023/1/18

ITU-T的H.264標(biāo)準(ITU-TRec.H.264/ISO/IEC11496-10AVC)的工作由ISO/IEC下屬的運動圖像專家組MPEG和ITU下屬的視頻編碼專家組VCEG(VideoCodingExpertsGroup)共同成立的聯(lián)合視頻小組JVT(JointVideoTeam)負責(zé)完成。由于H.264采用了許多不同于以往標(biāo)準中使用的先進技術(shù),所以相對于以往的標(biāo)準,在相同的數(shù)碼率下用H.264標(biāo)準編碼能夠獲得更高的圖像質(zhì)量。5.8H.264/AVC視頻編碼標(biāo)準第一百二十九頁,共一百八十五頁,2022年,8月28日2023/1/18ITU-TRec.H.263H.26LISO/IEC11496-10(MPEG-4AVC)MPEG(MovingPictureExpertsGroup)

+

VCEG(VideoCodingExpertsGroup)JVT(JointVideoTeam)H.264概述國際標(biāo)準草案H.264/AVC第一百三十頁,共一百八十五頁,2022年,8月28日2023/1/18

H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準。H.264的特點:(1)更高的編碼效率和簡潔的表現(xiàn)形式。(2)對信道時延的適應(yīng)性較強,既能用于低時延的實時業(yè)務(wù)(會議電視),又可用于無時延限制的場合(視頻存儲)。(3)提高網(wǎng)絡(luò)適應(yīng)性,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,加強對誤碼和丟包的處理,提高解碼器的差錯恢復(fù)能力。(4)在編/解碼器中采用復(fù)雜度可分級設(shè)計,在圖像質(zhì)量和編碼處理之間可分級,以適應(yīng)不同復(fù)雜度的應(yīng)用。第一百三十一頁,共一百八十五頁,2022年,8月28日2023/1/18H.264標(biāo)準同以往標(biāo)準的區(qū)別

H.264標(biāo)準中諸如預(yù)測、變換、量化、熵編碼等基本功能模塊與前幾個標(biāo)準(MPEG-1,MPEG-2,MPEG-4,H.261,H.263)并無太大區(qū)別,變化主要體現(xiàn)在功能模塊的具體細節(jié)上。第一百三十二頁,共一百八十五頁,2022年,8月28日2023/1/185.8.1H.264/AVC視頻編碼器的分層結(jié)構(gòu)分層設(shè)計在網(wǎng)絡(luò)傳輸環(huán)境中,視頻編碼主要由視頻編碼層VCL和支持視頻在不同網(wǎng)絡(luò)之間傳輸?shù)木W(wǎng)絡(luò)抽象層NAL。第一百三十三頁,共一百八十五頁,2022年,8月28日2023/1/18

VCL實現(xiàn)視頻數(shù)據(jù)的編解碼;

NAL定義了數(shù)據(jù)封裝格式,為VCL提供與網(wǎng)絡(luò)無關(guān)的統(tǒng)一接口;視頻編碼層(VCL)----數(shù)據(jù)壓縮編碼的核心+差錯恢復(fù)工具參數(shù)集(記錄圖像序列相關(guān)信息,用以檢錯)靈活的宏塊排序(錯誤隱藏)冗余片網(wǎng)絡(luò)抽象層(NAL)----網(wǎng)絡(luò)適配網(wǎng)絡(luò)抽象層單元(NALU)的封裝、分割、合并將頭部信息+數(shù)據(jù)---映射到傳輸協(xié)議上----便于組幀、重同步第一百三十四頁,共一百八十五頁,2022年,8月28日2023/1/18分層結(jié)構(gòu)的優(yōu)點:擴展H.264的應(yīng)用范圍數(shù)字電視視頻會議視頻電話

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論