信源編碼標(biāo)準(zhǔn)_第1頁(yè)
信源編碼標(biāo)準(zhǔn)_第2頁(yè)
信源編碼標(biāo)準(zhǔn)_第3頁(yè)
信源編碼標(biāo)準(zhǔn)_第4頁(yè)
信源編碼標(biāo)準(zhǔn)_第5頁(yè)
已閱讀5頁(yè),還剩180頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信源編碼標(biāo)準(zhǔn)第一頁(yè),共一百八十五頁(yè),2022年,8月28日第五章信源編碼的標(biāo)準(zhǔn)

5.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述5.2MPEG-1音頻編碼標(biāo)準(zhǔn)5.3杜比AC-3音頻編碼算法5.4MPEG-2音頻編碼標(biāo)準(zhǔn)5.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)5.7MPEG-4視頻編碼標(biāo)準(zhǔn)5.8H.264/AVC視頻編碼標(biāo)準(zhǔn)5.9AVS視頻編碼標(biāo)準(zhǔn)第二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18視頻編碼國(guó)際標(biāo)準(zhǔn)的制定

第三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.1數(shù)字音視頻編碼標(biāo)準(zhǔn)概述

國(guó)際上數(shù)字音視頻編碼標(biāo)準(zhǔn)主要有兩大系列:(1)國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電工委員會(huì)(IEC)●ISO/IEC:JPEG,JPEG2000,MPEG-x

(2)國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)部(ITU-T)●ITU-T:H.26x第四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第五頁(yè),共一百八十五頁(yè),2022年,8月28日1.JPEG標(biāo)準(zhǔn)JPEG

(JointPhotographicExpertsGroup)是聯(lián)合圖片專家組的英文縮寫。ISO的JPEG主要針對(duì)靜止圖像的存儲(chǔ)領(lǐng)域,制定了JPEG系列標(biāo)準(zhǔn)?!馢PEG標(biāo)準(zhǔn):靜止圖像存儲(chǔ)壓縮標(biāo)準(zhǔn)?!?/p>

JPEG-2000標(biāo)準(zhǔn):面向靜止圖像的壓縮標(biāo)準(zhǔn)。比JPEG標(biāo)準(zhǔn)壓縮效率高2倍以上,性能也更好。●

MJPEG標(biāo)準(zhǔn):面向視頻序列,將各幀分別編碼成JPEG圖像,成為JPEG圖像序列,但它們均為幀內(nèi)編碼幀,不進(jìn)行幀間預(yù)測(cè)編碼。第六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/182.H.26×標(biāo)準(zhǔn)

ITU-T的視頻編碼專家組(VCEG)制定了H.26×標(biāo)準(zhǔn)系列,主要針對(duì)實(shí)時(shí)視頻通信領(lǐng)域的應(yīng)用,如可視電話、會(huì)議電視等。

(1)H.261標(biāo)準(zhǔn):“速率為p×64kbit/s(p=1,2,…,30)視聽業(yè)務(wù)的視頻編解碼”,簡(jiǎn)稱為p×64kbit/s標(biāo)準(zhǔn)。

(2)H.262:同MPEG-2的視頻部分(ISO/IEC13818-2)(3)H.263:低碼率圖像壓縮標(biāo)準(zhǔn)。支持<64kbit/s。(4)H.264:等同MPEG-4AVC(ISO/IEC14496-10)

第七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

H.26×-----------MPEG在標(biāo)準(zhǔn)體系構(gòu)造上,H.26×系列標(biāo)準(zhǔn)更具有針對(duì)性。其僅僅涉及數(shù)字視頻壓縮編碼環(huán)節(jié),而未涉及其他系統(tǒng)層、及音頻層的內(nèi)容。所以H.26×系列標(biāo)準(zhǔn)僅是多媒體通信系統(tǒng)中的一個(gè)功能模塊。

MPEG系列標(biāo)準(zhǔn)則更系統(tǒng)化,其MPEG系列標(biāo)準(zhǔn)涵蓋了整個(gè)多媒體系統(tǒng)的系統(tǒng)層、視頻、音頻等各個(gè)子系統(tǒng),形成了一個(gè)完整的體系。也可以這么說(shuō),H.26×標(biāo)準(zhǔn)只相當(dāng)于MPEG標(biāo)準(zhǔn)中的視頻編碼部分。第八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18H.261

H.261是ITU-T為在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上開展雙向聲像業(yè)務(wù)(可視電話、視頻會(huì)議)而制定的,速率為64kb/s的整數(shù)倍。H.261只對(duì)CIF(352x288像素,會(huì)議電視)和QCIF(176x144像素,可視電話)兩種圖像格式進(jìn)行處理,每幀圖像分成圖像層、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來(lái)處理。

H.261是最早的運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn),它詳細(xì)制定了視頻編碼的各個(gè)部分,包括運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、DCT變換、量化、熵編碼,以及與固定速率的信道相適配的速率控制等部分。

由于在幀間壓縮算法中只預(yù)測(cè)到后1幀,所以在延續(xù)時(shí)間上比較有優(yōu)勢(shì),但圖像質(zhì)量難以做到很高的清晰度,無(wú)法實(shí)現(xiàn)大壓縮比和變速率錄像等。

第九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18H.263

H.263是最早用于低碼率視頻編碼的ITU-T標(biāo)準(zhǔn),是ITU-T為低于64kb/s的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)。它是在H.261基礎(chǔ)上發(fā)展起來(lái)的,其標(biāo)準(zhǔn)輸入圖像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亞取樣圖像。

H.263與H.261相比采用了半象素的運(yùn)動(dòng)補(bǔ)償,并增加了4種有效的壓縮編碼模式。隨后出現(xiàn)的第二版(H.263+)及H.263++增加了許多選項(xiàng),使其具有更廣泛的適用性。

H.263還吸取了MPEG的雙向運(yùn)動(dòng)預(yù)測(cè)等措施,進(jìn)一步提高幀間編碼的預(yù)測(cè)精度,一般說(shuō),在低碼率時(shí),采用H.263只要一半的速率可獲得和H.261相當(dāng)?shù)膱D像質(zhì)量。第十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18H.264

H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。1996年制定H.263標(biāo)準(zhǔn)后,ITU-T的視頻編碼專家組(VCEG)開始了兩個(gè)方面的研究:一個(gè)是短期研究計(jì)劃,在H.263基礎(chǔ)上增加選項(xiàng)(之后產(chǎn)生了H.263+與H.263++);另一個(gè)是長(zhǎng)期研究計(jì)劃,制定一種新標(biāo)準(zhǔn)以支持低碼率的視頻通信。長(zhǎng)期研究計(jì)劃產(chǎn)生了H.26L標(biāo)準(zhǔn)草案,其目標(biāo)是研制出新的壓縮標(biāo)準(zhǔn),與以前的任何標(biāo)準(zhǔn)相比,效率要提高一倍,同時(shí)具有簡(jiǎn)單、直觀的視頻編碼技術(shù),網(wǎng)絡(luò)友好的視頻描述,適合交互和非交互式應(yīng)用(廣播、存儲(chǔ)、流煤體)。

第十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18H.264標(biāo)準(zhǔn)

H.264具有壓縮效率高、算法先進(jìn)、抗誤碼能力強(qiáng)、網(wǎng)絡(luò)親和性好等技術(shù)優(yōu)勢(shì),因而極有可能會(huì)成為廣播電視、通信及存儲(chǔ)媒體領(lǐng)域的統(tǒng)一編碼標(biāo)準(zhǔn),而且會(huì)成為寬帶交互新媒體的國(guó)際標(biāo)準(zhǔn)。

H.264能夠適應(yīng)現(xiàn)有以及未來(lái)網(wǎng)絡(luò)的發(fā)展要求,并能在網(wǎng)絡(luò)及廣播信道中傳輸與接收。在數(shù)字電視領(lǐng)域,H.264已成為數(shù)字高清晰度電視(HDTV)的編碼方案,因而對(duì)數(shù)字電視與高清晰度電視的普及與發(fā)展具有非常重要的意義。第十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

2001年,ISO的MPEG組織認(rèn)識(shí)到H.26L潛在的優(yōu)勢(shì),隨后ISO與ITU開始組建包括來(lái)自ISO/IECMPEG與ITU-TVCEG的聯(lián)合視頻組(JVT),JVT的主要任務(wù)就是將H.26L草案發(fā)展為一個(gè)國(guó)際性標(biāo)準(zhǔn)。于是,在ISO/IEC中該標(biāo)準(zhǔn)命名為AVC(AdvancedVideoCoding),作為MPEG-4標(biāo)準(zhǔn)的第10個(gè)選項(xiàng);在ITU-T中正式命名為H.264標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)在2003年3月正式獲得批準(zhǔn)。

第十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/183.MPEG標(biāo)準(zhǔn)

MPEG(MovingPictureExpertsGroup)是運(yùn)動(dòng)圖片專家組的英文縮寫。這個(gè)專家組開發(fā)的標(biāo)準(zhǔn)通常稱為MPEG標(biāo)準(zhǔn)。●MPEG-1:針對(duì)1.5Mbit/s以下數(shù)碼率數(shù)字存儲(chǔ)媒體應(yīng)用的運(yùn)動(dòng)圖像及其伴音編碼,標(biāo)準(zhǔn)號(hào)ISO/IEC11172。●

MPEG-2:運(yùn)動(dòng)圖像及其伴音信息的通用編碼,標(biāo)準(zhǔn)號(hào)

ISO/IEC13818?!?/p>

MPEG-4:音視對(duì)象編碼,標(biāo)準(zhǔn)號(hào)ISO/IEC14496?!?/p>

MPEG-7:多媒體內(nèi)容描述接口,標(biāo)準(zhǔn)號(hào)ISO/IEC15938?!?/p>

MPEG-21:多媒體框架,標(biāo)準(zhǔn)號(hào)ISO/IEC21000。第十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

MPEG是壓縮運(yùn)動(dòng)圖像及其伴音的視音頻編碼標(biāo)準(zhǔn),它采用了幀間壓縮,僅存儲(chǔ)連續(xù)幀之間有差別的地方

,從而達(dá)到較大的壓縮比。

MPEG現(xiàn)有MPEG—1、MPEG—2和MPEG—4三個(gè)版本,以適應(yīng)于不同帶寬和圖像質(zhì)量的要求。

①、MPEG—1的視頻壓縮算法依賴于兩個(gè)基本技術(shù),一是基于16*16(像素*行)塊的運(yùn)動(dòng)補(bǔ)償,二是基于變換域的壓縮技術(shù)來(lái)減少空域冗余度,壓縮比相比M-JPEG要高,對(duì)運(yùn)動(dòng)不激烈的視頻信號(hào)可獲得較好的圖像質(zhì)量,但當(dāng)運(yùn)動(dòng)激烈時(shí),圖像會(huì)產(chǎn)生馬賽克現(xiàn)象。第十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

MPEG-1以1.5Mbps的數(shù)據(jù)率傳輸視音頻信號(hào),MPEG-1在視頻圖像質(zhì)量方面相當(dāng)于VHS錄像機(jī)的圖像質(zhì)量,視頻錄像的清晰度的彩色模式≥240TVL,兩路立體聲伴音的質(zhì)量接近CD的聲音質(zhì)。

MPEG-1是前后幀多幀預(yù)測(cè)的壓縮算法,具有很大的壓縮靈活性,能變速率壓縮視頻,可視不同的錄像環(huán)境,設(shè)置不同的壓縮質(zhì)量,從每小時(shí)80MB至400MB不等,但數(shù)據(jù)量和帶寬還是比較大。

第十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18②、MPEG-2它是獲得更高分辨率(720*572)提供廣播級(jí)的視音頻編碼標(biāo)準(zhǔn)。MPEG-2作為MPEG-1的兼容擴(kuò)展,它支持隔行掃描的視頻格式和許多高級(jí)性能包括支持多層次的可調(diào)視頻編碼,適合多種質(zhì)量如多種速率和多種分辨率的場(chǎng)合。它適用于運(yùn)動(dòng)變化較大,要求圖像質(zhì)量很高的實(shí)時(shí)圖像。對(duì)每秒30幀、720*572分辨率的視頻信號(hào)進(jìn)行壓縮,數(shù)據(jù)率可達(dá)3-10Mbps。由于數(shù)據(jù)量太大,不適合長(zhǎng)時(shí)間連續(xù)錄像的需求。

第十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

③MPEG-4是為移動(dòng)通信設(shè)備在Internet網(wǎng)實(shí)時(shí)傳輸視音頻信號(hào)而制定的低速率、高壓縮比的視音頻編碼標(biāo)準(zhǔn)。

MPEG-4標(biāo)準(zhǔn)是面向?qū)ο蟮膲嚎s方式,不是像MPEG-1和MPEG-2那樣簡(jiǎn)單地將圖像分為一些像塊,而是根據(jù)圖像的內(nèi)容,其中的對(duì)象(物體、人物、背景)分離出來(lái),分別進(jìn)行幀內(nèi)、幀間編碼,并允許在不同的對(duì)象之間靈活分配碼率,對(duì)重要的對(duì)象分配較多的字節(jié),對(duì)次要的對(duì)象分配較少的字節(jié),從而大大提高了壓縮比,在較低的碼率下獲得較好的效果,

MPEG-4支持MPEG-1、MPEG-2中大多數(shù)功能,提供不同的視頻標(biāo)準(zhǔn)源格式、碼率、幀頻下矩形圖形圖像的有效編碼。

第十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18總之,MPEG-4有三個(gè)方面的優(yōu)勢(shì):

①、具有很好的兼容性;

②、MPEG-4比其他算法提供更好的壓縮比,最高達(dá)200:1

③、MPEG-4在提供高壓縮比的同時(shí),對(duì)數(shù)據(jù)的損失很小。所以,MPEG-4的應(yīng)用能大幅度的降低錄像存儲(chǔ)容量,獲得較高的錄像清晰度,特別適用于長(zhǎng)時(shí)間實(shí)時(shí)錄像的需求,同時(shí)具備在低帶寬上優(yōu)良的網(wǎng)絡(luò)傳輸能力。第十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/184.AVS標(biāo)準(zhǔn)

AVS視頻標(biāo)準(zhǔn)(GB/T20090.2-2006)——我國(guó)具備自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn),主要面向高清晰度和高質(zhì)量數(shù)字電視廣播、網(wǎng)絡(luò)電視、高密度激光數(shù)字存儲(chǔ)媒體等。(1)性能高,編碼效率是MPEG-2的2倍以上,與H.264的編碼效率處于同一水平;(2)復(fù)雜度低,算法復(fù)雜度比H.264明顯低,軟硬件實(shí)現(xiàn)成本都低于H.264;(3)我國(guó)掌握主要知識(shí)產(chǎn)權(quán),專利授權(quán)模式簡(jiǎn)單,費(fèi)用低。第二十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18AVS標(biāo)準(zhǔn)

AVS(AudioVideoCodingStandard)的正式名稱為“信息技術(shù)-先進(jìn)音視頻編碼”,包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理(DRM)等主要技術(shù)標(biāo)準(zhǔn)及一致性測(cè)試等支撐標(biāo)準(zhǔn),主要面向HDTV、HD-DVD和寬帶流媒體等視頻應(yīng)用。第二十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準(zhǔn)5.2.1MPEG-1音頻編碼標(biāo)準(zhǔn)簡(jiǎn)介MPEG-1音頻壓縮標(biāo)準(zhǔn)是世界上第一個(gè)高保真音頻編碼標(biāo)準(zhǔn)。MPEG-1音頻壓縮標(biāo)準(zhǔn)的主要性能:輸入信號(hào)為線性PCM信號(hào),采樣率為32,44.1或48kHz,輸出為32kb/s~384kb/s壓縮后碼流支持單聲道或雙聲道,共有4種模式。第二十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準(zhǔn)(3)MPEG-1音頻壓縮標(biāo)準(zhǔn)提供三個(gè)獨(dú)立的壓縮層次①層1的編碼器最為簡(jiǎn)單,編碼器的輸出數(shù)據(jù)率為384kb/s,主要用于小型數(shù)字盒式磁帶(digitalcompactcassette,DCC)②層2的編碼器的復(fù)雜程度屬中等,編碼器的輸出數(shù)據(jù)率為256kb/s~192kb/s,其應(yīng)用包括數(shù)字廣播聲音(DAB)、數(shù)字音樂(lè)、CD-I(compactdisc-interactive)和VCD(videocompactdisc)等③層3的編碼器最為復(fù)雜,編碼器的輸出數(shù)據(jù)率為64kb/s,主要應(yīng)用于網(wǎng)絡(luò)音樂(lè)第二十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準(zhǔn)5.2.2MPEG-1音頻編碼原理

MPEG音頻壓縮的的主要依據(jù)是人耳朵的聽覺(jué)特性,使用“心理聲學(xué)模型(psychoacousticmodel)”來(lái)達(dá)到壓縮聲音數(shù)據(jù)的目的聽覺(jué)系統(tǒng)中存在一個(gè)聽覺(jué)閾值電平,低于這個(gè)電平的聲音信號(hào)就聽不到,因此就可以把這部分信號(hào)去掉聽覺(jué)閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽覺(jué)閾值也不同。大多數(shù)人的聽覺(jué)系統(tǒng)對(duì)2kHz~5kHz之間的聲音最敏感。一個(gè)人是否能聽到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽覺(jué)閾值第二十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準(zhǔn)3.聽覺(jué)系統(tǒng)存在掩蔽特性,聽覺(jué)閾值電平是自適應(yīng)的,即聽覺(jué)閾值電平會(huì)隨聽到的不同頻率的音頻而發(fā)生變化例如,同時(shí)有兩種頻率的音頻存在,一種是1000Hz的音頻,另一種是1100Hz的音頻,但它的強(qiáng)度比前者低18分貝,在這種情況下,1100Hz的音頻就聽不到4.數(shù)字音頻壓縮編碼主要原理:是編碼過(guò)程中保留有用信息的而丟掉被掩蔽的信號(hào),其結(jié)果是編解碼后重構(gòu)的信號(hào)和原始音頻信號(hào)不完全相同,利用人耳的聽覺(jué)特性,將聲音中與聽覺(jué)無(wú)關(guān)的“不相關(guān)”部分去除。對(duì)于人耳來(lái)說(shuō)很難感覺(jué)出他們之間的差異。第二十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-1音頻壓縮定義了3個(gè)層次,每個(gè)層次針對(duì)不同的應(yīng)用,它們的基本模型是相同的層1是最基礎(chǔ)的,層2和層3都在層1的基礎(chǔ)上有所提高。每個(gè)后繼的層次都有更高的壓縮比,但需要更復(fù)雜的編碼解碼器MPEG-1的音頻數(shù)據(jù)分成幀(frame),層1每幀包含384個(gè)樣本的數(shù)據(jù),每幀由32個(gè)子帶分別輸出的12個(gè)樣本組成。層2和層3每幀為1152個(gè)樣本第二十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-1音頻碼流構(gòu)成的幀格式層1、2和層3的子帶樣本層1幀:384樣本層2和層3:1152樣本第二十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.2MPEG-1音頻編碼標(biāo)準(zhǔn)MPEG-1層1音頻壓縮技術(shù)子帶編碼濾波器組的劃分

MPEG-1音頻編碼器把輸入信號(hào)變換到32個(gè)頻域子帶中去。子帶的劃分方法有兩種,一種是線性劃分,另一種是非線性劃分。第二十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-1層1壓縮編碼器原理框圖第二十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18(1)多通道濾波器(2)心理聲學(xué)模型MPEG音頻心理聲學(xué)模型主要實(shí)現(xiàn)步驟如下:(a)用快速傅立葉變換FFT將音頻樣值轉(zhuǎn)換到頻域。(b)將得到的頻率組成臨界頻帶。(c)在臨界頻帶的譜值中,將單音(似正弦)和非單音(似噪聲)分開。(d)在臨界頻帶決定噪聲掩蔽閾值之間,模型在不同的臨界頻帶給信號(hào)應(yīng)用適當(dāng)?shù)难诒魏瘮?shù)。(e)計(jì)算由臨界頻帶引起的每個(gè)子帶的掩蔽值。(f)計(jì)算每個(gè)子帶的SMR(信號(hào)掩蔽比)。第三十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18(3)比特分配比特分配過(guò)程決定分配給各個(gè)子帶的編碼比特?cái)?shù),分配的依據(jù)是心理聲學(xué)模型的信息。LayerⅠ和LayerⅡ的比特分配過(guò)程是從計(jì)算掩蔽噪聲比開始的。MNR=SNR-SMR第三十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18(4)比例因子按輸入信號(hào)的大小來(lái)增減量化步長(zhǎng),輸入信號(hào)小用較小的量化步長(zhǎng),輸入信號(hào)大用較大的量化步長(zhǎng)。第三十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18(5)碼流格式化——幀形成

MPEG-1音頻數(shù)據(jù)是分成幀(frame)傳送的,LayerⅠ每幀由32個(gè)子帶,每個(gè)子帶12個(gè)樣值,共384個(gè)樣值的數(shù)據(jù)組成。LayerⅠ的幀結(jié)構(gòu)如圖所示。第三十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

MPEG-1層1音頻編碼幀結(jié)構(gòu)1個(gè)子帶32個(gè)子帶第三十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18LayerⅡ的特點(diǎn)LayerⅡ和LayerⅠ編碼原理類似,不同之處有以下幾點(diǎn):LayerⅡ的每個(gè)子帶不是均勻帶寬;LayerⅡ使用的FFT精度高一些;LayerⅡ的幀長(zhǎng)度碼流是LayerⅠ的3倍;第三十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

LayerⅡ和LayerⅠ幀結(jié)構(gòu)的不同之處在于描述比特分配的比特位數(shù)是不一樣的。

LayerⅡ的幀包含1152個(gè)PCM的樣值,如果取樣頻率為48kHz,一幀相當(dāng)于1152/48k=24ms的聲音樣值,這樣LayerⅡ的精確度為24ms,而對(duì)于LayerⅠ來(lái)言,精確度為8ms,如果用于編輯的話,LayerⅠ更精確。第三十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18Layer2音頻編碼方框圖第三十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18LayerⅡ碼流結(jié)構(gòu)圖第三十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18Layer3音頻編碼

LayerⅢ(也即MP3)采用了LayerⅠ和LayerⅡ未用到的技術(shù)。不等寬子帶;MDCT----改進(jìn)DCT;

哈夫曼編碼----無(wú)損編碼----提高壓縮比20%10:1第三十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18LayerIII音頻編碼方框圖第四十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18LayerIII音頻解碼方框圖第四十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.3杜比AC-3音頻編碼算法

美國(guó)高級(jí)電視制式委員會(huì)(ATSC)規(guī)定電視伴音壓縮標(biāo)準(zhǔn)是杜比(Dolby)實(shí)驗(yàn)室開發(fā)的AC-3系統(tǒng)。該系統(tǒng)的音響效果為高保真立體環(huán)繞聲。AC是英語(yǔ)“音頻感覺(jué)編碼系統(tǒng)”的縮寫詞。目前市場(chǎng)流行的稱為“家庭影院”的音響系統(tǒng)多數(shù)采用此標(biāo)準(zhǔn)。

杜比AC-3規(guī)定的取樣頻率為48kHz,它鎖定于27MHz的系統(tǒng)時(shí)鐘。每個(gè)音頻節(jié)目最多可有6個(gè)音頻信道。第四十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18杜比AC-3環(huán)繞聲系統(tǒng)AC(AudioCoding)-3是一種播放高音質(zhì)和效果的環(huán)繞聲系統(tǒng)杜比AC-3系統(tǒng)利用心理聲學(xué)原理對(duì)音頻信號(hào)進(jìn)行壓縮編碼其取樣頻率有32KHz、44.1KHz、48KHz對(duì)音頻聲道采用獨(dú)立方式編碼,將每個(gè)聲道的頻率范圍擴(kuò)展到20Hz~20kHz全頻域杜比AC-3的基本聲道有5個(gè),即前方左、右、中聲道,后方環(huán)繞左和環(huán)繞右聲道,另外還有一個(gè)超重低音聲道,共有6個(gè)聲道。其中超重低音聲道的最高頻率為120Hz,不能算一個(gè)完整的聲道,因此又稱為0.1聲道,這樣加起來(lái)便稱為5.1聲道

第四十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18圖5-4五聲道立體聲揚(yáng)聲器的安排C屏幕收聽區(qū)LRRsLs第四十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18其特點(diǎn)有:

(1)全音頻聲道。AC-3系統(tǒng)播放的音質(zhì)清晰,聲場(chǎng)動(dòng)態(tài)范圍廣,聲象重現(xiàn)逼真,具有真實(shí)現(xiàn)場(chǎng)感(2)立體環(huán)繞聲。AC-3系統(tǒng)具有左和右后方環(huán)繞聲道,其環(huán)繞包圍感很強(qiáng),烘托現(xiàn)場(chǎng)氣氛逼真,可使視聽者進(jìn)入出神入化的境界(3)聲道之間分離度高

第四十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18從家庭影院的應(yīng)用和發(fā)展來(lái)看,杜比AC-3環(huán)繞聲系統(tǒng)將可能成為主流(1)美國(guó)已確定杜比AC-3環(huán)繞聲系統(tǒng)為HDTV(高清晰度電視)音頻信號(hào)的編碼和解碼標(biāo)準(zhǔn)(2)數(shù)字視盤機(jī)(DVD)的音頻也采用AC-3音頻標(biāo)準(zhǔn)(3)美國(guó)幾乎所有著名的電影公司制作的影片都按照AC-3系統(tǒng)錄制(4)目前世界著名的電子公司生產(chǎn)出的DVD機(jī),A/V放大器都帶有AC-3解碼器第四十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18⑴AC-3編碼原理概述AC-3編碼系統(tǒng)采用了全音域杜比噪聲衰減系統(tǒng),在沒(méi)有音頻信號(hào)掩蔽時(shí),集中力量降低或消除噪聲,在其它時(shí)間根據(jù)人的聽覺(jué)頻率選擇性把每個(gè)聲道的音頻頻譜分割成不同帶寬的子頻帶,結(jié)果使噪聲處在距音頻信號(hào)頻率分量很近的頻率上,就很容易被音頻信號(hào)所遮蓋。除了降低噪聲以保證音質(zhì)外,杜比AC-3系統(tǒng)為降低數(shù)碼率,對(duì)各頻帶采用不同的取樣率,根據(jù)頻譜或節(jié)目的動(dòng)態(tài)特性來(lái)分配各頻帶的比特?cái)?shù)。第四十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18杜比公司除運(yùn)用上述聲學(xué)原理外,還運(yùn)用了它擁有的杜比降噪技術(shù),開發(fā)出數(shù)碼化的“自適應(yīng)編碼”系統(tǒng)。這是一種極具選擇性和抑制噪聲能力的自適應(yīng)編碼體系。

AC-3將多聲道作為一個(gè)整體進(jìn)行編碼,比單聲道編碼效率高,同時(shí)對(duì)各個(gè)聲道和每個(gè)聲音內(nèi)的各頻帶信號(hào)用不同的取樣率進(jìn)行量化、對(duì)噪聲進(jìn)行衰減或掩蔽,結(jié)果AC-3系統(tǒng)的數(shù)碼率降低而音質(zhì)損害很小。第四十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

AC-3至少可以處理20bit動(dòng)態(tài)范圍的數(shù)字音頻信號(hào),頻率范圍從20Hz~20kHz(0.5dB),3Hz和20.3kHz處為-3dB。重低音聲道頻率范圍為20~120Hz(0.5dB),3Hz和12Hz處為-3dB。且支持32kHz,44.1kHz,48kHz的取樣頻率。AC-3的數(shù)字音頻數(shù)據(jù)經(jīng)加誤碼糾錯(cuò)后數(shù)碼率僅為384kb/s,因此ITU-R在1992年正式接受AC-3的5.1聲道格式。AC-3含有MPEG系統(tǒng)的時(shí)間印記(timestamp),故可與MPEG視頻同步。第四十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18⑵AC-3系統(tǒng)的方框圖AC-3編碼器接受聲音PCM數(shù)據(jù),最后產(chǎn)生壓縮數(shù)據(jù)流。AC-3算法通過(guò)對(duì)聲音信號(hào)頻域表示的粗略量化,可以達(dá)到很高的編碼增益。圖5-8AC-3編碼器原理方框圖分析濾波器組6聲道PCM數(shù)據(jù)耦合預(yù)處理尾數(shù)量化窗處理頻譜包絡(luò)編碼核心比特分配AC-3數(shù)據(jù)幀格式AC-3碼流比特分配第五十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

第一步把時(shí)間域內(nèi)的PCM數(shù)據(jù)值變換為頻域內(nèi)成塊的一系列變換系數(shù)。

AC-3解碼器輸入信號(hào)是一組頻譜信號(hào),它是由時(shí)域信號(hào)PCM數(shù)據(jù)經(jīng)過(guò)時(shí)-頻變換而得到。該頻譜數(shù)據(jù)流分為指數(shù)部和尾數(shù)部?jī)刹糠?,指?shù)部分采用差分方式進(jìn)行編碼,編碼后的指數(shù)代表了整個(gè)信號(hào)的頻譜,可作為頻譜包絡(luò)的參數(shù)。其尾數(shù)部分按照比特分配的結(jié)果進(jìn)行量化。于是,量化尾數(shù)和頻譜包絡(luò)形成了AC-3碼流的主要信息,連同其它輔助信號(hào)(例如比特分配等)構(gòu)成了AC-3比特流。

第五十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

AC-3數(shù)據(jù)幀一個(gè)AC-3串行編碼的音頻數(shù)據(jù)流是由一個(gè)同步幀的序列所組成音頻樣本塊(AB)其中每個(gè)代表256個(gè)新的音頻樣本,AB0~AB5的每一塊代表一個(gè)編碼通道,可以被分別獨(dú)立解碼,塊的大小可以調(diào)整,但總數(shù)據(jù)量不變同步信息(SI)數(shù)碼流信息(BSI),包含描述編碼數(shù)據(jù)流業(yè)務(wù)的各種參數(shù)輔助數(shù)據(jù)(AUX)誤碼檢測(cè)(CRC)第五十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18AC-3解碼器首先必須與編碼數(shù)據(jù)流同步,經(jīng)誤碼糾錯(cuò)后再?gòu)拇a流中分離出各種類型的數(shù)據(jù),如控制參數(shù)、系數(shù)配置參數(shù)、編碼后的頻譜包絡(luò)和量化后的尾數(shù)等。然后根據(jù)聲音的頻譜包絡(luò)產(chǎn)生比特分配信息,對(duì)尾數(shù)部分進(jìn)行反量化,恢復(fù)變換系數(shù)的指標(biāo)和尾數(shù),再經(jīng)過(guò)合成濾波器組由頻域表示變換到時(shí)域表示,最后輸出重建的PCM數(shù)據(jù)值信號(hào)。

圖5-10AC-3解碼器原理方框圖AC-3幀同步、糾錯(cuò)、解幀格頻譜包絡(luò)解碼比特分配比特分配信息尾數(shù)反量化合成濾波器組PCM碼流AC-3碼流第五十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.4MPEG-2音頻編碼標(biāo)準(zhǔn)MPEG-2音頻壓縮MPEG-2聲音編碼標(biāo)準(zhǔn)是MPEG為多聲道聲音開發(fā)的低碼率編碼方案,它是在MPEG-1聲音標(biāo)準(zhǔn)基礎(chǔ)上發(fā)展而來(lái)的。和MPEG-1相比,MPEG-2聲音主要增加了三個(gè)方面的內(nèi)容支持5.1路環(huán)繞聲。它能提供5個(gè)全帶寬聲道(左、右、中和兩個(gè)環(huán)繞聲道),外加一個(gè)低頻效果增強(qiáng)聲道,統(tǒng)稱為5.1聲道支持多達(dá)8種語(yǔ)言或解說(shuō)增加了低取樣和低碼率。在保持MPEG-1聲音的單聲道和立體聲的原有取樣率的情況下,MPEG-2又增加了三種取樣率,即把MPEG-1的取樣率降低了一半,(16kHz,22.05kHz,24kHz)以便提高碼率低于64kbit/s時(shí)的每個(gè)聲道的聲音質(zhì)量第五十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/182.MPEG-2的兩種音頻數(shù)據(jù)壓縮格式MPEG-2Audio,或者稱為MPEG-2多通道(Multichannel)音頻,與MPEG-1Audio兼容,所以又稱為MPEG-2BC(BackwardCompatible)MPEG-2AAC(AdvancedAudioCoding),與MPEG-1聲音格式不兼容,因此通常稱為非后向兼容MPEG-2NBC(Non-Backward-Compatible)標(biāo)準(zhǔn)

第五十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-2AudioMPEG-2Audio(ISO/IEC13818-3)和MPEG-1Audio(ISO/IEC1117-3)標(biāo)準(zhǔn)都使用相同種類的編譯碼器,LayerⅠ,LayerⅡ和LayerⅢ的結(jié)構(gòu)也相同MPEG-2音頻標(biāo)準(zhǔn)與MPEG-1標(biāo)準(zhǔn)相比,MPEG-2做了如下擴(kuò)充:增加了16kHz,22.05kHz和24kHz采樣頻率擴(kuò)展了編碼器的輸出速率范圍,由32~384kbit/s擴(kuò)展到8~640kbit/s增加了聲道數(shù),支持5.1聲道和7.1聲道的環(huán)繞聲。此外MPEG-2還支持LinearPCM(線性PCM)和DolbyAC-3(AudioCodeNumber3)編碼

第五十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-2中的AAC編碼AAC:AdvancedAudioCoding先進(jìn)音頻編碼,不向下兼容MPEG-2AAC是聲音感知編碼標(biāo)準(zhǔn),MPEG-2AAC主要使用聽覺(jué)系統(tǒng)的掩蔽特性來(lái)減少聲音的數(shù)據(jù)量,并且通過(guò)把量化噪聲分散到各個(gè)子帶中,用全局信號(hào)把噪聲掩蔽掉。AAC支持的采樣頻率可從8kHz到96kHzAAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標(biāo)準(zhǔn)可支持48個(gè)主聲道、16個(gè)低頻音效加強(qiáng)通道LFE(lowfrequencyeffects)、16個(gè)配音聲道(overdubchannel)或者叫做多語(yǔ)言聲道(multilingualchannel)和16個(gè)數(shù)據(jù)流第五十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.MPEG-2AAC壓縮比為11:1,即每個(gè)聲道的數(shù)據(jù)率為(44.1×16)/11=64kbit/s,而5個(gè)聲道的總數(shù)據(jù)率為320kbit/s的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別6.

與MPEG的LayerⅡ相比,MPEG-2AAC的壓縮率可提高1倍,而且質(zhì)量更高,與MPEG的LayerⅢ相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。第五十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18(a)AAC采用了改進(jìn)的余弦變換MDCT濾波器組。

(b)采用了新的時(shí)間/頻率編碼方案,即瞬時(shí)噪聲定形(TemporalNoiseShaping,TNS)。(c)因?yàn)橐纛l信號(hào)有較強(qiáng)的相關(guān)性,在AAC系統(tǒng)中采用了預(yù)測(cè)技術(shù),有效地提高了編碼效率。(d)能細(xì)致地控制量化步長(zhǎng)大小,使得比特利用更為有效。(e)在AAC系統(tǒng)中采用了霍夫曼熵編碼,并配合靈活的碼流結(jié)構(gòu),進(jìn)一步提高了編碼效率。

AAC增加的新編碼工具第五十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-2AAC的配置開發(fā)MPEG-2AAC標(biāo)準(zhǔn)采用的方法與開發(fā)MPEGAudio標(biāo)準(zhǔn)采用的方法不同。后者采用的方法是對(duì)整個(gè)系統(tǒng)進(jìn)行標(biāo)準(zhǔn)化,而前者采用的方法是模塊化的方法,把整個(gè)AAC系統(tǒng)分解成一系列模塊,用標(biāo)準(zhǔn)化的AAC工具(advancedaudiocodingtools)對(duì)模塊進(jìn)行定義AAC標(biāo)準(zhǔn)定義了三種配置:基本類(MainProfile);----最好聲音質(zhì)量低復(fù)雜度類(LowComplexityProfile);--聲音質(zhì)量中可分級(jí)取樣率類(ScalableSamplingRateProfile)--差第六十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

MPEG-2聲音多聲道擴(kuò)展部分的數(shù)據(jù)結(jié)構(gòu) MPEG-2多聲道聲音編碼標(biāo)準(zhǔn)和現(xiàn)有的MPEG-1聲音標(biāo)準(zhǔn)保持后向兼容。在對(duì)原有的MPEG-1兩聲道增加獨(dú)立的環(huán)繞聲道時(shí),MPEG-2盡量保特和MPEG-1聲音語(yǔ)法的兼容性,MPEG-2中的主聲道(左、右)仍然保持后向兼容,而環(huán)饒聲道采用新的編碼方法和語(yǔ)法第六十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-1、MPEG-2音頻參數(shù)的比較第六十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.5AVS音頻編碼標(biāo)準(zhǔn)

我國(guó)的數(shù)字音視頻標(biāo)準(zhǔn)工作組(AVS)完成了具有自主知識(shí)產(chǎn)權(quán)的面向數(shù)字電視、高密度激光存儲(chǔ)、網(wǎng)絡(luò)流媒體等重大音頻應(yīng)用的新一代音頻編碼壓縮技術(shù)標(biāo)準(zhǔn)—AVS音頻編碼標(biāo)準(zhǔn),其編碼性能和壓縮效率已經(jīng)達(dá)到了國(guó)際上先進(jìn)的MPEGAAC音頻編碼標(biāo)準(zhǔn),優(yōu)于MP3等音頻編碼技術(shù),并且還支持可分級(jí)編碼。第六十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

AVS音頻采用通用的感知音頻編碼框架,支持采樣率8kHz~96kHz的多聲道PCM信號(hào)輸入。它最多支持32個(gè)主聲道、8個(gè)低頻增強(qiáng)聲道,輸出碼率為每聲道為16kbps~96kbps,同時(shí)支持精細(xì)可分級(jí)編碼,可分級(jí)的編解碼步長(zhǎng)為1kbps。

由于采用通用的感知音頻編碼框架,采用了最新的數(shù)字信號(hào)處理技術(shù)和編碼壓縮技術(shù),在64kbps的編碼碼率下達(dá)到了感知透明的編碼質(zhì)量,其編碼壓縮效率已達(dá)到1/10~1/16。第六十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18心理聲學(xué)摸型長(zhǎng)短窗判決IntMDCTSPSC立體聲編碼量化CBC熵編碼比特流格式化輸入PCM數(shù)據(jù)AVS音頻編碼流AVS音頻立體聲編碼原理框圖第六十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18窗信息IntIMDCTSPSC立體聲解碼逆量化CBC解碼比特流去格式化AVS音頻編碼流解碼輸出PCMAVS音頻立體聲解碼原理框圖上下文比特平面編碼方極坐標(biāo)立體聲第六十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)MPEG-1是MPEG-2的一個(gè)子集,即MPEG-2能兼容MPEG-1MPEG-1目標(biāo)MPEG-1標(biāo)準(zhǔn)的設(shè)計(jì)思想是在1Mbit/s到1.5Mbit/s的低帶寬條件下,提供盡可能高的圖像質(zhì)量(包括音頻,以下所指圖像均包括音頻)。針對(duì)CD-ROM、光盤的視頻存儲(chǔ)和放像所制定的數(shù)字電視標(biāo)準(zhǔn)VCD使用MPEG-1標(biāo)準(zhǔn),圖像尺寸為352×288,標(biāo)準(zhǔn)速率為1.2Mbit/s第六十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)1.MPEG-1標(biāo)準(zhǔn)的內(nèi)容ISO/IEC11172包括三大部分:ISO/IEC11172-1第一部分系統(tǒng)ISO/IEC11172-2第二部分視頻ISO/IEC11172-3第三部分音頻MPEG-l標(biāo)準(zhǔn)可以處理各種類型的活動(dòng)圖像,其基本算法對(duì)于壓縮水平方向352個(gè)像素、豎直方向288個(gè)像素的空間分辨力,每秒24/25/30幅畫面的運(yùn)動(dòng)圖像有很好的效果在MPEG-l標(biāo)準(zhǔn)中的一幀圖像的概念不同于電視中幀的概念,前者一定是逐行掃描的圖像,如果待處理信號(hào)是隔行掃描的圖像,則編碼前必須將其轉(zhuǎn)換成逐行掃描的格式第六十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)采用了一系列技術(shù)以獲得高壓縮比對(duì)色差信號(hào)進(jìn)行亞采樣,減少數(shù)據(jù)量采用運(yùn)動(dòng)補(bǔ)償技術(shù)減少幀間冗余度做二維DCT變換去除空間相關(guān)性對(duì)DCT系數(shù)進(jìn)行量化,舍去不重要的信息,將量化后的DCT系數(shù)按照頻率重新排序?qū)CT系數(shù)進(jìn)行變字長(zhǎng)熵保持編碼對(duì)每數(shù)據(jù)塊的直流分量(DC)進(jìn)行預(yù)測(cè)差分編碼第六十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)在MPEG-l標(biāo)準(zhǔn)中,考慮到壓縮比和隨機(jī)存取這對(duì)矛盾,一共定義了四種圖像類型:I幀圖像:幀內(nèi)幀圖像,采用幀內(nèi)編碼,不參照其他圖像P幀圖像:預(yù)測(cè)幀圖像,參照前一幅I幀或P幀圖像做運(yùn)動(dòng)補(bǔ)償編碼B幀圖像:雙向預(yù)測(cè)幀圖像,參照前一幅和后一幅I幀或P幀圖像做雙向運(yùn)動(dòng)補(bǔ)償編碼D類圖像:直流(DC)圖像,這類圖像中只含直流分量,是為快放功能而設(shè)計(jì)的第七十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)I幀、P幀、B幀示意圖第七十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)幀內(nèi)圖像I的壓縮編碼算法框圖第七十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)預(yù)測(cè)圖像P的壓縮編碼算法框圖第七十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)雙向預(yù)測(cè)圖像B的壓縮編碼算法框圖第七十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)I幀、P幀和B幀圖像的依賴關(guān)系第七十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)圖像的顯示順序和編碼順序顯示順序:編碼順序:第七十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)I幀、P幀、B幀的數(shù)據(jù)字節(jié)和壓縮比第七十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)編解碼延時(shí)問(wèn)題由于編碼順序和顯示順序之間的差異,帶來(lái)編、解碼總延時(shí)達(dá)0.8~1秒時(shí)間這種延時(shí)對(duì)廣播性質(zhì)的圖像傳輸不會(huì)帶來(lái)任何影響,因?yàn)橛脩舨⒉荒馨l(fā)現(xiàn)發(fā)射端與接收端信號(hào)起始時(shí)間的差異對(duì)于交互性質(zhì)的圖像傳輸,例如,數(shù)字會(huì)議電視則帶來(lái)十分不便。因?yàn)榧追綀D像傳至乙方經(jīng)編碼、解碼要延時(shí)0.8~1秒時(shí)間;乙方圖像傳至甲方經(jīng)編碼、解碼也要延時(shí)0.8~1秒時(shí)間,這樣,如果甲對(duì)乙提一個(gè)問(wèn)題,則1.8~2秒以后才能得到回答第七十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)解決編解碼延時(shí)過(guò)長(zhǎng)問(wèn)題減少B幀使兩個(gè)I幀之間的幀數(shù)減少,則編、解碼總延時(shí)下降,甚至可以把B幀、P幀全部取消,這樣,可以得到0延時(shí)。這種方式也稱M-JPEG(Motion-JPEG)方式。但此時(shí)的壓縮比降到了5:1~7:1延時(shí)與壓縮倍數(shù)是互相矛盾的第七十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)5.6.2.MPEG-1視頻流數(shù)據(jù)結(jié)構(gòu)視頻流數(shù)據(jù)由以下6部分組成:1.視頻序列2.圖像組3.圖像4.片(條)5.宏塊6.塊第八十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)MPEG-1視頻流結(jié)構(gòu)第八十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/181.編碼原理

MPEG-2與MPEG-1視頻編解碼原理框圖基本相同。利用運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼----消除時(shí)間冗余;利用DCT----消除空間冗余;對(duì)DCT系數(shù)進(jìn)行熵編碼----消除符號(hào)統(tǒng)計(jì)冗余;

---------達(dá)到進(jìn)一步壓縮數(shù)碼率的目的。

5.6.3MPEG-1與MPEG-2視頻編解碼原理第八十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6.3MPEG-1與MPEG-2視頻編解碼原理2.編碼過(guò)程

(1)幀重排

(2)當(dāng)輸入的第一幀作為I幀圖像進(jìn)入圖4-8所示的編碼器中時(shí),開關(guān)K1,K2和K4在上方,K3在左方。

(3)當(dāng)P4作為P幀進(jìn)入編碼器時(shí),開關(guān)K1,K2和K4切換到下方,K3還在左方(4)當(dāng)B2作為B幀進(jìn)入編碼器時(shí),開關(guān)K1

在下方,K2

在上方,K3

在右方,K4

在中間。第八十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-2壓縮編碼原理框圖第八十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/183.圖像組(GroupofPictures,GOP)

在圖示的圖像序列中,每12幀中包含1個(gè)I幀、3個(gè)P幀和8個(gè)B幀,稱為一個(gè)圖像組(GOP)。

第八十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18圖像序列原始順序第八十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18經(jīng)過(guò)編碼器編碼后,6個(gè)視頻層次構(gòu)成的編碼視頻碼流稱為視頻基本碼流(ES)。

(1)在視頻序列層中,一個(gè)編碼的視頻序列由一個(gè)序列信頭開始,后面跟隨一個(gè)圖像組頭,然后是由許多圖像(I,P和B)組成的一系列GOP,視頻序列結(jié)束于一個(gè)序列終止碼。

(2)在圖像組層中,GOP頭中給出了時(shí)間碼和緊跟在I幀后面的B圖像的預(yù)測(cè)特性等信息。第八十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18(3)在圖像層中,圖像頭中給出了時(shí)間參考信息、圖像編碼類型和VBV(視頻緩存校驗(yàn)器)延時(shí)等信息。(4)在像條層中,像條頭中給出了像條垂直位置、量化因子碼等信息。(5)在宏塊層中,其中的宏塊類型碼中給出了宏塊屬性、運(yùn)動(dòng)矢量。(6)最后一層是塊層,給出了其DCT系數(shù)。第八十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)視頻基本碼流結(jié)構(gòu)第八十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18MPEG-2解碼

MPEG-2解碼是MPEG-2編碼處理的逆過(guò)程,從編碼比特流中重建圖像幀。MPEG-2解碼框圖第九十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)5.6.4MPEG-2功能擴(kuò)展

1.MPEG-2有“按幀編碼”和“按場(chǎng)編碼”兩種模式

MPEG-1只支持逐行掃描,不支持隔行掃描;

MPEG-2允許逐行掃描和隔行掃描,基于“幀”和“場(chǎng)”編碼,顯著提高編碼效率;

第九十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)5.6.4MPEG-2功能擴(kuò)展

2.MPEG-2增加了可分級(jí)編碼模式視頻編碼的可分級(jí)性----指視頻碼流數(shù)碼率的可調(diào)整性,即視頻數(shù)據(jù)只能壓縮一次,卻能以多種不同的幀頻、空間分辨率(清晰度)或視頻質(zhì)量進(jìn)行解碼,從而支持多種用戶的不同需求。第九十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)考慮到要適應(yīng)不同數(shù)據(jù)速率設(shè)備的應(yīng)用,MPEG專家組定義了三種質(zhì)量不同的編碼方式:信噪比可分級(jí)性SNR(Signal-to-Noisescalability)是指圖像質(zhì)量的折中,對(duì)于基本層碼流使用較粗糙的量化比得到比較低的信噪比,而增強(qiáng)層碼流使用提高量化精度后的額外信息得到比較高的信噪比空間分辨率可分級(jí)性(Spatialscalability)是指圖像的空間分辨率的折中,對(duì)于基本層碼流使用比較低的圖像分辨率,而對(duì)于增強(qiáng)層碼流使用比較高的圖像分辨率時(shí)間分辨率可分級(jí)性(TemporalScalability)是指圖像在時(shí)間方向上分辨率的折中,幀頻隨分層級(jí)數(shù)而變化

三者可組合成多層混合可分級(jí)編碼第九十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第九十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第九十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)5.6.4MPEG-2功能擴(kuò)展

3.MPEG-2定義了“類”和“級(jí)”的概念為了使MPEG-2能適應(yīng)圖像質(zhì)量從低到高的各種應(yīng)用領(lǐng)域,MPEG-2標(biāo)準(zhǔn)定義了“類”(Profile,又稱為檔次)和“等級(jí)”(Level)?!邦悺笔钦麄€(gè)比特流構(gòu)成所定義的語(yǔ)法子集,即每種類對(duì)應(yīng)了一套新的壓縮處理算法,類共有5種。“等級(jí)”是對(duì)比特流參數(shù)的一組定義了的限制,即每一個(gè)等級(jí)指定了一套參數(shù)范圍(如圖像大小、幀速率和位速率)。按圖像分辨率共有4種等級(jí)。同一類中的不同級(jí),遵循共同的語(yǔ)法,只是參數(shù)不同而已。第九十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)第九十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)等級(jí):Lowlovel類似于的CIF或MPEG-1的SIFMainlevel相應(yīng)于普通電視High-1440level略相應(yīng)于每行1440個(gè)抽樣的HDTVHighlevel略相應(yīng)于每行1920個(gè)抽樣的HDTV第九十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)所容許的11個(gè)組合第九十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)MPEG-2容許的幀速率第一百頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)亮、色度格式和圖像編碼類型第一百零一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)

MPEG-2的上限比特率(上限速率)第一百零二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)5.6.4圖像格式MPEG-2的圖像格式(VideoFormat)分為4級(jí)低級(jí)圖像格式主級(jí)圖像格式高級(jí)窄屏幕圖像格式高級(jí)寬屏幕圖像格式第一百零三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.6MPEG-1和MPEG-2視頻編碼標(biāo)準(zhǔn)第一百零四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第一百零五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第一百零六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第一百零七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第一百零八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)MPEG-4的目標(biāo)是要在音視對(duì)象的形態(tài)下能夠高度可靠地完成視音頻壓縮數(shù)據(jù)通信,在超低帶寬(10Kbit/s到1Mbit/s)的條件下提供盡可能好的圖像質(zhì)量并且具有很強(qiáng)的交互功能MPEG-4提供了一種暫新的交互方式----基于內(nèi)容的交互,對(duì)每一個(gè)音視對(duì)象(AV)進(jìn)行交互和操控。用戶可以改變場(chǎng)景中對(duì)象的位置、大小、視角、形狀等,甚至清除該對(duì)象。從1994年開始工作,1999年12月ISO/IEC制訂了MPEG-4標(biāo)準(zhǔn),在互聯(lián)網(wǎng)及移動(dòng)通信中有較好的應(yīng)用第一百零九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18第一百一十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)5.7.1MPEG-4標(biāo)準(zhǔn)概述MPEG-4標(biāo)準(zhǔn)支持7個(gè)新的功能??纱致詣澐譃?類:基于內(nèi)容的交互性、高壓縮率和靈活多樣的存取模式1.基于內(nèi)容的交互性(Content-basedInteractivity)基于內(nèi)容的操作與比特流編輯:支持無(wú)須編碼就可進(jìn)行基于內(nèi)容的操作與比特流編輯自然與合成數(shù)據(jù)混合編碼:提供將自然視頻圖像同合成數(shù)據(jù)(如文本、圖形等)有效結(jié)合的方式,同時(shí)支持交互性操作增強(qiáng)的時(shí)間域隨機(jī)存取:MPEG-4將提供有效的隨機(jī)存取方式:在有限的時(shí)間間隔內(nèi),可按幀或任意形狀的對(duì)象,對(duì)一音、視頻序列進(jìn)行隨機(jī)存取第一百一十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)2.高壓縮率(Compression)提高編碼效率:與現(xiàn)有的或正在制定的標(biāo)準(zhǔn)相比,在可比擬速率上,MPEG-4標(biāo)準(zhǔn)將提供更好的主觀視覺(jué)質(zhì)量的圖像。一般地說(shuō),MPEG-4的壓縮倍數(shù)高達(dá)100倍。這一功能可望在迅速發(fā)展的移動(dòng)通信網(wǎng)中獲得應(yīng)用,但值得注意的是:提高編碼效率不是MPEG-4的唯一的主要目標(biāo)。對(duì)多個(gè)并發(fā)數(shù)據(jù)流的編碼:MPEG-4將提供對(duì)一景物的有效多視角編碼,加上多伴音聲道編碼及有效的視聽同步。第一百一十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)3.靈活多樣的存取

(UniversalAccess)錯(cuò)誤易發(fā)環(huán)境中的抗錯(cuò)性(Robustness):“靈活多樣”是指允許采用各種有線、無(wú)線網(wǎng)和各種存儲(chǔ)媒體,MPEG-4將提高抗錯(cuò)誤能力,尤其是在易發(fā)生嚴(yán)重錯(cuò)誤的環(huán)境下的低比特應(yīng)用中(移動(dòng)通信鏈路)基于內(nèi)容的尺度可變性(Content-basedScalability):內(nèi)容尺度可變性意味著給圖像中的各個(gè)對(duì)象分配優(yōu)先級(jí)。其中,比較重要的對(duì)象用較高的空間和/或時(shí)間分辨率表示?;趦?nèi)容的尺度可變性是MPEG-4的核心。第一百一十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)MPEG-4可視信息編碼MPEG-4可視信息的碼率范圍可從5kbit/s~64Kbit/s(CIF以下的分辨率和15Hz以下的幀頻)直至64kbit/s~4Mbit/s(ITU-R601的各種圖像分辨率),并支持MPEG-1和MPEG-2已經(jīng)提供的大多數(shù)功能。第一百一十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)傳統(tǒng)圖像編碼方法VSMPEG-4的基于對(duì)象的圖像編碼方法傳統(tǒng)圖像編碼方法依據(jù)信源編碼理論的框架,將圖像作為隨機(jī)信號(hào),利用其隨機(jī)特性來(lái)達(dá)到壓縮的目的。這種方法本身未能考慮信息獲取者的主觀意義與主觀特性,未能考慮事件本身的特性如具體含義、重要性以及后果等等MPEG-4的圖像編碼的目標(biāo)在于采用現(xiàn)代圖像編碼方法,利用人眼視覺(jué)特性,抓住圖像信息傳輸?shù)谋举|(zhì),從輪廓、紋理的思路出發(fā),支持基于視覺(jué)內(nèi)容的交互功能,從而獲得更高的壓縮比和圖像質(zhì)量第一百一十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)5.7.2MPEG-4視頻編碼

MPEG-4使用視頻對(duì)象(VO,VideoObject)來(lái)描述圖像視頻對(duì)象的屬性:形狀(Shape) 外形,透明等運(yùn)動(dòng)(Motion) 位置,位移等紋理(Texture) 顏色,灰度等圖像(序列)是由視頻對(duì)象(包括背景)構(gòu)成的VOVOMV第一百一十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)針對(duì)視頻對(duì)象VO,進(jìn)行如下編碼形狀編碼:描述視頻對(duì)象的形狀二值形狀編碼1:表示VOP中像素屬于視頻對(duì)象0:表示VOP中像素不屬于視頻對(duì)象灰度形狀編碼用0~255表示VOP的透明度,0表示完全透明,255表示完全不透明VOP:VideoObjectPlane,視頻對(duì)象面,表示視頻對(duì)象形成的畫面,其形狀可以是任意的,當(dāng)VOP是矩形時(shí),則圖像編碼還原成傳統(tǒng)圖像編碼第一百一十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)運(yùn)動(dòng)信息編碼采用運(yùn)動(dòng)預(yù)測(cè)和運(yùn)動(dòng)補(bǔ)償技術(shù)去除圖像的幀間冗余度將VOP分為三類:I-VOP:幀內(nèi)VOP,采用幀內(nèi)編碼技術(shù)P-VOP:前向VOP,采用前向預(yù)測(cè)編碼技術(shù)B-VOP:雙向VOP,采用雙向預(yù)測(cè)編碼技術(shù)P-VOPB-VOPI-VOP第一百一十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)紋理編碼采用8×8DCT變換消除VOP的幀內(nèi)冗余度VOP宏塊VOP窗口8×8DCT8×8分級(jí)編碼:

視頻編碼的可分級(jí)性(scalability)是指碼率的可調(diào)整性,即視頻數(shù)據(jù)只壓縮一次,卻能以多個(gè)幀率、空間分辨率或視頻質(zhì)量進(jìn)行解碼,從而可支持多種類型用戶的各種不同應(yīng)用要求。

----實(shí)現(xiàn)空間域、時(shí)間域多分辨率功能需求。第一百一十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)5.7.2MPEG-4基于VOP的視頻編碼基于VOP的視頻編碼方法示意圖第一百二十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)VOP編碼原理圖對(duì)象分割第一百二十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)

MPEG-4編碼器基本框圖第一百二十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)MPEG-4視頻編碼舉例Sprite編碼舉例背景圖鑲嵌圖拼接重構(gòu)圖第一百二十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

MPEG-4通過(guò)視頻對(duì)象層(VideoObjectLayer)的數(shù)據(jù)結(jié)構(gòu)來(lái)實(shí)現(xiàn)分級(jí)編碼。

MPEG-4提供了兩種基本分級(jí)工具,即時(shí)域分級(jí)(TemporalScalability)和空域分級(jí)(SpatialScalability),此外還支持時(shí)域和空域的混合分級(jí)。每一種分級(jí)編碼都至少有兩層VOL,低層稱為基本層,高層稱為增強(qiáng)層?;緦犹峁┝艘曨l序列的基本信息,增強(qiáng)層提供了視頻序列更高的分辨率和細(xì)節(jié)。

-------網(wǎng)絡(luò)帶寬和視頻效果具有很好的適應(yīng)性5.7.3MPEG-4可分級(jí)視頻編碼第一百二十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7.4MPEG-4容錯(cuò)視頻編碼MPEG-4視頻編碼標(biāo)準(zhǔn)

----應(yīng)用于網(wǎng)絡(luò)傳輸時(shí)----誤碼、丟包、時(shí)延…-----要求:壓縮效率/音視同步/容錯(cuò)掩錯(cuò)1.再同步----等間隔比特位周期性設(shè)置同步標(biāo)記;失去同步----碼流中任何差錯(cuò)都可能會(huì)導(dǎo)致失去同步解決方法:插入同步碼字(起始碼)能夠限制差錯(cuò)傳遞到下一個(gè)同步碼字同步碼字應(yīng)該和其它碼字區(qū)別開同步碼字可以插入到圖像,條帶的起始位置第一百二十五頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/182.可逆的變長(zhǎng)編碼RVLC----具備后向解碼能力,恢復(fù)部分丟失數(shù)據(jù);VLC只能前向解碼。傳統(tǒng)的VLC僅僅從前向唯一的解碼----當(dāng)一個(gè)VLC碼字出錯(cuò),則從當(dāng)前解碼碼字開始到下一個(gè)同步碼字之間的碼字不能解碼都要丟掉

RVLC既可以前向解碼,也可以后向解碼----如果一個(gè)RVLC碼字出錯(cuò),跳到下一個(gè)同步碼字前,從后向解碼,部分恢復(fù)數(shù)據(jù)第一百二十六頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/183.數(shù)據(jù)分割(DataPartitioning)將數(shù)據(jù)分成重要數(shù)據(jù)和一般數(shù)據(jù)分別放在碼流的不同位置重要的數(shù)據(jù)緊跟著放在同步字的后邊重要數(shù)據(jù):編碼模式,MV,DC系數(shù)一般數(shù)據(jù)放在重要數(shù)據(jù)的后邊一般數(shù)據(jù):AC系數(shù)

重要數(shù)據(jù)先于一般數(shù)據(jù)解碼

第一百二十七頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.7MPEG-4標(biāo)準(zhǔn)典型節(jié)目碼流解碼器

第一百二十八頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

ITU-T的H.264標(biāo)準(zhǔn)(ITU-TRec.H.264/ISO/IEC11496-10AVC)的工作由ISO/IEC下屬的運(yùn)動(dòng)圖像專家組MPEG和ITU下屬的視頻編碼專家組VCEG(VideoCodingExpertsGroup)共同成立的聯(lián)合視頻小組JVT(JointVideoTeam)負(fù)責(zé)完成。由于H.264采用了許多不同于以往標(biāo)準(zhǔn)中使用的先進(jìn)技術(shù),所以相對(duì)于以往的標(biāo)準(zhǔn),在相同的數(shù)碼率下用H.264標(biāo)準(zhǔn)編碼能夠獲得更高的圖像質(zhì)量。5.8H.264/AVC視頻編碼標(biāo)準(zhǔn)第一百二十九頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18ITU-TRec.H.263H.26LISO/IEC11496-10(MPEG-4AVC)MPEG(MovingPictureExpertsGroup)

+

VCEG(VideoCodingExpertsGroup)JVT(JointVideoTeam)H.264概述國(guó)際標(biāo)準(zhǔn)草案H.264/AVC第一百三十頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組(JVT)制定的新一代視頻壓縮編碼標(biāo)準(zhǔn)。H.264的特點(diǎn):(1)更高的編碼效率和簡(jiǎn)潔的表現(xiàn)形式。(2)對(duì)信道時(shí)延的適應(yīng)性較強(qiáng),既能用于低時(shí)延的實(shí)時(shí)業(yè)務(wù)(會(huì)議電視),又可用于無(wú)時(shí)延限制的場(chǎng)合(視頻存儲(chǔ))。(3)提高網(wǎng)絡(luò)適應(yīng)性,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語(yǔ)法,加強(qiáng)對(duì)誤碼和丟包的處理,提高解碼器的差錯(cuò)恢復(fù)能力。(4)在編/解碼器中采用復(fù)雜度可分級(jí)設(shè)計(jì),在圖像質(zhì)量和編碼處理之間可分級(jí),以適應(yīng)不同復(fù)雜度的應(yīng)用。第一百三十一頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18H.264標(biāo)準(zhǔn)同以往標(biāo)準(zhǔn)的區(qū)別

H.264標(biāo)準(zhǔn)中諸如預(yù)測(cè)、變換、量化、熵編碼等基本功能模塊與前幾個(gè)標(biāo)準(zhǔn)(MPEG-1,MPEG-2,MPEG-4,H.261,H.263)并無(wú)太大區(qū)別,變化主要體現(xiàn)在功能模塊的具體細(xì)節(jié)上。第一百三十二頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/185.8.1H.264/AVC視頻編碼器的分層結(jié)構(gòu)分層設(shè)計(jì)在網(wǎng)絡(luò)傳輸環(huán)境中,視頻編碼主要由視頻編碼層VCL和支持視頻在不同網(wǎng)絡(luò)之間傳輸?shù)木W(wǎng)絡(luò)抽象層NAL。第一百三十三頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18

VCL實(shí)現(xiàn)視頻數(shù)據(jù)的編解碼;

NAL定義了數(shù)據(jù)封裝格式,為VCL提供與網(wǎng)絡(luò)無(wú)關(guān)的統(tǒng)一接口;視頻編碼層(VCL)----數(shù)據(jù)壓縮編碼的核心+差錯(cuò)恢復(fù)工具參數(shù)集(記錄圖像序列相關(guān)信息,用以檢錯(cuò))靈活的宏塊排序(錯(cuò)誤隱藏)冗余片網(wǎng)絡(luò)抽象層(NAL)----網(wǎng)絡(luò)適配網(wǎng)絡(luò)抽象層單元(NALU)的封裝、分割、合并將頭部信息+數(shù)據(jù)---映射到傳輸協(xié)議上----便于組幀、重同步第一百三十四頁(yè),共一百八十五頁(yè),2022年,8月28日2023/1/18分層結(jié)構(gòu)的優(yōu)點(diǎn):擴(kuò)展H.264的應(yīng)用范圍數(shù)字電視視頻會(huì)議視頻電話

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論