（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf

上傳人：活*** IP屬地：寧夏上傳時(shí)間：2019-12-14 格式：PDF 頁數(shù)：46 大?。?.90MB 積分：18 舉報(bào) 版權(quán)申訴

（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf_第2頁

（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf_第3頁

（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf_第4頁

（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf_第5頁

已閱讀5頁，還剩41頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

摘要迅猛發(fā)展的數(shù)字技術(shù)，將人類生活帶入了一個(gè)全新的數(shù)字化、信息化社會(huì)。其中多媒體數(shù)碼產(chǎn)品的普及正是得益于視頻壓縮編碼技術(shù)的不斷進(jìn)步，尤其是對新一代視頻編碼標(biāo)準(zhǔn)h 2 6 4 標(biāo)準(zhǔn)方向的研究進(jìn)展。同時(shí)，遵循摩爾定律的半導(dǎo)體和信息技術(shù)的飛速發(fā)展，也為復(fù)雜的編碼算法的實(shí)時(shí)應(yīng)用奠定了硬件基礎(chǔ)。作為h 2 6 4 標(biāo)準(zhǔn)中的關(guān)鍵技術(shù)，熵編碼在隨機(jī)過程的統(tǒng)計(jì)特性基礎(chǔ)上，根據(jù) 數(shù)據(jù)的統(tǒng)計(jì)信息進(jìn)行編碼，減少了編碼冗余，從而進(jìn)一步提高了壓縮效率。本文主要研究應(yīng)用于h 2 6 4 基本檔次和擴(kuò)展檔次中的c a v l c 熵編碼。相對于 c a b a c 熵編碼，c a v l c 算法簡單、實(shí)現(xiàn)復(fù)雜度低，主要應(yīng)用于對編解碼時(shí)間要求苛刻、硬件有一定制約的情況下。但是采用軟件實(shí)現(xiàn)c a v l c 算法難以滿足高清視頻編碼的實(shí)時(shí)性要求。為此，本文在對c a v l c 算法進(jìn)行細(xì)致的研究和分析的基礎(chǔ)上，提出了一個(gè)高效的c a v l c 編碼器硬件結(jié)構(gòu)。本文首先簡要介紹了視頻編碼標(biāo)準(zhǔn)的發(fā)展歷史，并對幾種編碼標(biāo)準(zhǔn)進(jìn)行了比較，然后著重論述了h 2 6 4 視頻標(biāo)準(zhǔn)的編解碼框架以及關(guān)鍵技術(shù)，對h 2 6 4 中的 c a v l c 算法進(jìn)行了詳細(xì)的研究和分析，然后從架構(gòu)的角度提出了一個(gè)高效的 c a v l c 編碼器硬件結(jié)構(gòu)，接著對c a v l c 編碼器中主要的功能模塊的硬件結(jié)構(gòu)設(shè) 計(jì)進(jìn)行了詳細(xì)的介紹。最后，提出了c a v l c 編碼器的設(shè)計(jì)驗(yàn)證方法，并對仿真和綜合結(jié)果進(jìn)行了分析，實(shí)驗(yàn)結(jié)果表明本文提出的c a v l c 編碼器的硬件結(jié)構(gòu)可以滿足1 0 8 0 p 高清( 1 9 2 0 x1 0 8 0 3 0 t ) 視頻實(shí)時(shí)編碼的要求。關(guān)鍵詞：h 2 6 4 熵編碼c a v l cv l s i a b s t r a c t t h er a p i dd e v e l o p m e n to fd i g i t a lt e c h n o l o g yh a sb r o u g h th u m a ni n t oab r a n d - n e w d i 百t a la n di n f o r m a t i o ns o c i e t y t h ep o p u l a r i t yo fd i 西t a lm u l t i m e d i ap r o d u c t si s b e n e f i t e df r o mt h ep r o g r e s so fv i d e oc o m p r e s s i o nt e c h n o l o g y , e s p e c i a l l yt h en e w r e s e a r c hd e v e l o p m e n to ft h en e w e s tg e n e r a t i o nv i d e oc o d i n gs t a n d a r d h 2 6 4s t a n d a r d m e a n w h i l e ，a b i d i n gb ym o o r e sl a w , t h er a p i dd e v e l o p m e n to fs e m i c o n d u c t o r sa n d i n f o r m a t i o nt e c h n o l o g yl a i dt h eh a r d w a r eb a s i s f o rt h er e a l - t i m ea p p l i c a t i o n 謝也 c o m p l e xe n c o d i n ga l g o r i t h m s a st h e k e yt e c h n o l o g i e s i n h 2 6 4 ，e n t r o p yc o d i l l g b a s e do nt h es t a t i s t i c a l p r o p e r t i e so f s t o c h a s t i cp r o c e s s e s ，i sr e a l i z e db ys t a t i s t i ci n f o r m a t i o n , r e d u c i n gc o d i n g r e d u n d a n c y , f u r t h e ri m p r o v i n gt h ec o m p r e s s i o ne f f i c i e n c y t h i sp a p e rm a i n l yr e s e a r c h e so nc a v l ce n t r o p yc o d i n gi nh 2 6 4b a s e l i n ep r o f i l e a n de x t e n d e dp r o f i l e c o m p a r i n gw i t hc a b a c ，c a v l ca l g o r i t h mi ss i m p l et o u n d e r s t a n d , e a s yt oa c h i e v ei nt h ec a s eo f l o wc o m p l e x i t y , t i m e - c r i t i c a le n v i r o n m e n ta n d c e r t a i nh a r d w a r ec o n s t r a i n t s h o w e v e r , i ti sd i f f i c u l tt om e e tr e a l - t i m er e q u i r e m e n t so f h i g h - d e f i n i t i o nv i d e oe n c o d i n gi nc a v l c t h i sp a p e rp u t sf o r w a r dat h o r o u g hs t u d yi n c a v l ca l g o r i t h ma n dp r e s e n t sa ne f f i c i e n tc a v l ce n c o d e rb a s e do nh a r d w a r e a r c h i t e c t u r e t h i sp a p e r b r i e f l yd e s c r i b e st h eh i s t o r yd e v e l o p m e n to f v i d e oc o d i n gs t a n d a r da n d ac o m p a r i s o no fs e v e r a lc o d i n gs t a n d a r d s ，a n dt h e nf o c u s e so nt h ec e d e cf r a m e w o r ka n d k e yt e c h n o l o g i e so fh 2 6 4 t h e ni tm a k e sad e t a i l e ds t u d ya n da n a l y s i so fc a v l c a l g o r i t h m , a n dp r e s e n t sa ne f f i c i e n tc a v l ce n c o d e ri nh a r d w a r ea r c h i t e c t u r e ，f u r t h e ri t d e s c r i b e sm a i nm o d u l e so ft h ec a v l ce n c o d e ra r c h i t e c t u r ei nd e t a i l f i n a l l y , t h e i n t r o d u c t i o no ft h ec a v l ce n c o d e rd e s i g nv e r i f i c a t i o nm e t h o d si sg i v e n , a n d s i m u l a t i o na n ds y n t h e s i sp e r f o r m a n c es h o wt h a tt h ep r o p o s e dc a v l ce n c o d e r h a r d w a r ea r c h i t e c t u r ec a nm e e tt h eh d ( 19 2 0x10 8 0 3 0 0r e a l - t i m ev i d e oe n c o d i n g k e y w o r d ：h 2 6 4e n t r o p yc o d i n g c a v l cv l s i 第一章緒論第一章緒論 1 1 引言隨著計(jì)算機(jī)技術(shù)、通信技術(shù)和v l s i 技術(shù)的不斷發(fā)展，人們的生活和工作方式發(fā)生了巨大變化。傳統(tǒng)的一維音頻信號已經(jīng)難以滿足人們?nèi)找嬖鲩L的需要，二維的視頻等多媒體產(chǎn)品成為人們新的需求。多媒體信息提供給人們更多、更直觀的信息以及更豐富的感官享受。視頻會(huì)議、實(shí)時(shí)監(jiān)控和可視通信等領(lǐng)域的視頻信號承載的數(shù)據(jù)量大，給通信的帶寬和存儲(chǔ)帶來更大的挑戰(zhàn)，這就需要對視頻進(jìn)行壓縮編碼。多年來，國內(nèi)外許多學(xué)者和研究機(jī)構(gòu)在視頻的壓縮編碼領(lǐng)域進(jìn)行了大量的研究，使得視頻壓縮編碼技術(shù)取得了長足的進(jìn)步。隨著視頻編碼技術(shù)的進(jìn)一步產(chǎn)業(yè) 化，國際標(biāo)準(zhǔn)化組織i s o m c 成立了運(yùn)動(dòng)圖像壓縮編碼組織m p e g ，m p e g 專家組主要致力于運(yùn)動(dòng)圖像壓縮編碼標(biāo)準(zhǔn)的制定。經(jīng)過專家組不懈的努力，一些視頻的壓縮編碼國際標(biāo)準(zhǔn)相繼問世。國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部i t u t 的視頻編碼專家組v c e g 先后制定了h 2 6 1 、h 2 6 2 、h 2 6 3 、h 2 6 4 視頻編碼標(biāo)準(zhǔn)，而由m p e g 專家組先后制定m p e g - l 、m p e g 2 、m p e g - 4 視頻編碼標(biāo)準(zhǔn)，其中h 2 6 2 m p e g 2 和h 2 6 4 m p e g - 4a v c 由i t u t 與m p e g 聯(lián)合制定。特別是由i t u t 的視頻編碼專家組v c e g 和運(yùn)動(dòng)圖像專家組m p e g 聯(lián)合推出的新一代視頻編碼標(biāo)準(zhǔn)h 2 6 4 ，將視頻編碼技術(shù)推向了一個(gè)新的高度。這些視頻壓縮編碼標(biāo)準(zhǔn)的推出極大的促進(jìn) 了視頻壓縮編碼技術(shù)的發(fā)展和應(yīng)用。另一方面，隨著半導(dǎo)體技術(shù)以及集成電路技術(shù)的快速發(fā)展，使得硬件平臺(tái)的計(jì)算和處理速度不斷的提高。特別是f p g a 和d s p 的出現(xiàn)，使得復(fù)雜的視頻壓縮算法能夠用于實(shí)時(shí)應(yīng)用，才使得高清電視、視頻會(huì)議以及視頻通話等多媒體應(yīng)用得以實(shí)現(xiàn)，極大的豐富和方便了人們的工作和生活。 1 2 研究背景眾所周知，人類通過視覺獲取的信息量約占總信息量的7 0 ，而且視頻信息具有生動(dòng)直觀性、可信性等優(yōu)點(diǎn)。目前，視頻編碼技術(shù)有著廣闊的應(yīng)用范圍，如高清電視、視頻會(huì)議、可視電話、視頻監(jiān)控等業(yè)務(wù)。但是由于視頻信息的數(shù)據(jù)量大，如果不經(jīng)過壓縮處理，很難進(jìn)行傳輸和存儲(chǔ)，這就需要對視頻進(jìn)行壓縮編碼。 2 h 2 6 4 中c a v l c 編碼器的v l s i 結(jié)構(gòu)設(shè)計(jì) 數(shù)據(jù)壓縮編碼技術(shù)的基石是是香農(nóng)( s h a n n o n ) 于1 9 4 8 年創(chuàng)立的經(jīng)典的信息論，香農(nóng)認(rèn)為信源中都含有一定的冗余性，這些冗余來自于信源本身的相關(guān)性，也來自于信源符號概率分布的不均衡性，因此采用編碼的方式可以消除這種冗余。香農(nóng)第一定律( 率失真定律) 確定了如何在編碼過程中不損失任何信息，即在無損編碼條件下數(shù)據(jù)壓縮的理論極限是信息的熵，并指出了如何建立最優(yōu)的數(shù)據(jù)壓縮編碼方法。由于視頻圖像數(shù)據(jù)具有極強(qiáng)的相關(guān)性，也就是說有大量的冗余信息。視頻圖像幀與幀之間存在相關(guān)性，即存在時(shí)間冗余信息；一幅圖像內(nèi)部也存在著較強(qiáng)的相關(guān)性，即存在空間冗余信息。這樣就為視頻壓縮編碼提供了可能性。視頻壓縮編碼技術(shù)就是要將這些時(shí)間和空間的冗余信息去除，通過幀內(nèi)預(yù)測編碼和變換編碼消除視頻圖像的空間冗余信息，通過幀間預(yù)測編碼消除視頻圖像的時(shí)間冗余信息，再通過熵編碼進(jìn)一步去除統(tǒng)計(jì)的編碼冗余信息。為了在全世界范圍內(nèi)推進(jìn)視頻編碼壓縮技術(shù)和多媒體通信技術(shù)的發(fā)展和應(yīng) 用，國際標(biāo)準(zhǔn)化組織i s o 和國際電信聯(lián)盟i t u 制定了一系列視頻壓縮國際標(biāo)準(zhǔn)。由i t u 組織制定的標(biāo)準(zhǔn)主要是針對實(shí)時(shí)視頻通信的應(yīng)用，如視頻會(huì)議和可視電話等，它們以h 2 6 x 命名( 如h 2 6 1 、h 2 6 2 、h 2 6 3 和h 2 6 4 ) ；而由i s o 的m p e g 組織制定的標(biāo)準(zhǔn)主要針對視頻信息的存儲(chǔ)( 如d v d ) ，廣播電視和視頻流的網(wǎng)絡(luò)傳輸?shù)葢?yīng)用，它們以m p e g x 命名( m p e g - 1 、m p e g - 2 、m p e g - 4 等) 。2 0 0 3 年3 月，1 1 u t 和i s o 共同正式公布了h 2 6 4 視頻編碼標(biāo)準(zhǔn)，h 2 6 4 標(biāo)準(zhǔn)一方面吸收了以前視頻編碼標(biāo)準(zhǔn)中的一些行之有效的算法，另一方面采納了視頻編碼、圖像處理領(lǐng)域的最新研究成果，在提高壓縮編碼效率和增強(qiáng)網(wǎng)絡(luò)適應(yīng)能力等方面有了質(zhì)的飛躍，因此被人們稱為新一代視頻編碼標(biāo)準(zhǔn)。與以往的視頻編碼標(biāo)準(zhǔn)相比， h 2 6 4 視頻編碼標(biāo)準(zhǔn)在同樣的重建圖像質(zhì)量下碼率可以降低5 0 左右。通常情況下，與h 2 6 3 相比，在同樣的圖像質(zhì)量下，h 2 6 4 能將碼率降低一半左右；在同樣的碼率的情況下，h 2 6 4 的信噪比明顯提高。正是由于h 2 6 4 標(biāo)準(zhǔn)在編碼效率、圖像質(zhì)量、網(wǎng)絡(luò)適應(yīng)性等方面卓越的性能，使其在國際上成為研究的熱點(diǎn)。目前，h 2 6 4 視頻壓縮編碼的實(shí)現(xiàn)方式有很多：由于d s p 平臺(tái)在處理視頻信息的優(yōu)越性能，基于d s p 平臺(tái)的開發(fā)方式最多，如德州儀器1 r i 推出的d a v i n e i 系列d s p 主要面向多媒體應(yīng)用；基于成熟專用芯片a s i c 也是不錯(cuò)的選擇，如富士通公司的m b 8 6 h 5 1 芯片；還有基于現(xiàn)有的p 核可以在f p g a 上進(jìn)行開發(fā)。 1 3 本文研究內(nèi)容及意義本文主要研究h 2 6 4 視頻編碼標(biāo)準(zhǔn)中的c a v l c 熵編碼。熵編碼作為h 2 6 4 標(biāo) 準(zhǔn)中的關(guān)鍵技術(shù)對提高整個(gè)編碼系統(tǒng)的效率至關(guān)重要。h 2 6 4 中的熵編碼主要由兩第一章緒論 3 部分組成，即基于上下文的自適應(yīng)可變長編碼c a v l c ( c o n t e x t - a d a p t i v e v a r i a b l e 1 饑g t l lc o d i n g ) 和基于上下文的自適應(yīng)二進(jìn)制算術(shù)編碼c a b a c ( c o n t e x t - b a s e da d a p t i v eb i n a r ya r i t h m e t i cc o d i n g ) 。在h 2 6 4 標(biāo)準(zhǔn)中的b a s e l i n e p r o m e 只支持c a v l c ，而在m a i np r o f i l e 中同時(shí)支持c a v l c 和c a b a c 。這兩種編碼方法都是利用自適應(yīng)的上下文模型來提高編碼的效率。與c a v l c 相比， c a b a c 可以使碼率降低9 1 4 ，但是復(fù)雜度增加了2 5 3 0 。本文首先從視頻為什么需要編碼，為什么可以編碼入手，引出視頻編碼標(biāo)準(zhǔn) 的發(fā)展歷史，簡要分析各個(gè)階段的視頻編碼標(biāo)準(zhǔn)的性能比較和關(guān)鍵技術(shù)。接著發(fā) 展并過渡到新一代視頻編碼標(biāo)準(zhǔn)h 2 6 4 ，闡述了h - 2 6 4 的關(guān)鍵技術(shù)和性能上的優(yōu)越性。然后著重論述了h 2 6 4 視頻標(biāo)準(zhǔn)的編解碼框架，從h 2 6 4 的編碼流程上對編碼的各個(gè)階段進(jìn)行簡要的說明。接著著重論述了熵編碼算法，特別是對h 2 6 4 中的c a v l c 算法進(jìn)行了詳細(xì)的研究和分析，然后從架構(gòu)的角度提出了一個(gè)高效的 c a v l c 編碼器硬件結(jié)構(gòu)，接著對c a v l c 編碼器中主要的功能模塊的硬件結(jié)構(gòu)設(shè) 計(jì)進(jìn)行了詳細(xì)的介紹。最后，介紹了c a v l c 編碼器的設(shè)計(jì)驗(yàn)證方法，并對仿真、驗(yàn)證和綜合結(jié)果進(jìn)行了分析。本文具體章節(jié)安排如下：，第一章：緒論，首先介紹了視頻壓縮編碼的發(fā)展及應(yīng)用，接著介紹了h 2 6 4 視頻編碼技術(shù)的產(chǎn)生和研究背景，最后介紹了本文的研究內(nèi)容以及章節(jié)安排。第二章：首先論述了視頻編碼的必要性和可行性，接著介紹了視頻編解碼的發(fā)展歷程，比較了各個(gè)階段的視頻編碼標(biāo)準(zhǔn)的性能比較和關(guān)鍵技術(shù)，并對h 2 6 4 編解碼框架簡要分析，然后闡述了h 2 6 4 中的熵編碼基本原理，最后簡要分析并比較了兩種熵編碼。第三章：首先從理論上研究了c a v l c 編碼的流程，針對編碼的每個(gè)步驟進(jìn)行分析，得到優(yōu)化的編碼方案，從而給出了本文編碼器的實(shí)現(xiàn)方法，并使用本文的 c a v l c 編碼器中的重要信號進(jìn)行說明具體的實(shí)現(xiàn)流程。第四章：首先從系統(tǒng)架構(gòu)的角度提出了本文的c a v l c 編碼器硬件結(jié)構(gòu)，接著對c a v l c 編碼器中編碼非零系數(shù)個(gè)數(shù)和拖尾系數(shù)個(gè)數(shù)模塊、宏塊上下文管理模塊、編碼全部零個(gè)數(shù)模塊、編碼幅值模塊、編碼拖尾系數(shù)模塊以及編碼每個(gè)非零系數(shù)前零游程模塊等主要的功能模塊的硬件結(jié)構(gòu)設(shè)計(jì)進(jìn)行了詳細(xì)的介紹。然后介紹了a s i c 和f p g a 的開發(fā)流程，然后對本文采用的設(shè)計(jì)驗(yàn)證方法進(jìn)行了介紹，最后對驗(yàn)證結(jié)果和綜合結(jié)果進(jìn)行了分析。第五章：結(jié)束語，總結(jié)和全文，并對未來的研究和改進(jìn)工作進(jìn)行了展望。第二章h 2 6 4 視頻編碼的研究 5 第二章h 2 6 4 視頻編碼的研究 h 2 6 4 a v c t l j 標(biāo)準(zhǔn)是由國際電信聯(lián)盟i t u t 的視頻編碼專家組v c e g 和國際標(biāo) 準(zhǔn)化組織i s o 的運(yùn)動(dòng)圖像專家組m p e g 聯(lián)合提出的新一代視頻編碼標(biāo)準(zhǔn)。h 2 6 4 采用了一些新技術(shù)來提高編碼效率，如四分之一像素運(yùn)動(dòng)估計(jì)、幀內(nèi)預(yù)測、多參考幀、去塊效應(yīng)濾波和熵編碼。與之前的視頻編碼標(biāo)準(zhǔn)相比，h 2 6 4 在同樣的重建圖像質(zhì)量下碼率可以降低5 0 左右。熵編碼作為h 2 6 4 標(biāo)準(zhǔn)中的關(guān)鍵技術(shù)，對提高整個(gè)編碼系統(tǒng)的效率至關(guān)重要。 h 2 6 4 中的熵編碼主要由兩部分組成，即基于上下文的自適應(yīng)可變長編碼c a v l c ( c o n t e x t - a d a p t i v ev a r i a b l e 1 e n g t hc o d i n g ) 和基于上下文的自適應(yīng)二進(jìn)制算術(shù)編碼 c a b a c ( c o n t e x t - b a s e da d a p t i v eb i n a r ya r i t h m e t i cc o d i n g ) 。在h - 2 6 4 標(biāo)準(zhǔn)中的 b a s e l i n ep r o f i l e 只支持c a v l c ，而在m a i np r o f i l e 中同時(shí)支持c a v l c 和c a b a c 。這兩種編碼方法都是利用自適應(yīng)的上下文模型來提高編碼的效率。與c a v l c 相比，c a b a c 可以使碼率降低9 1 4 ，但是復(fù)雜度增加了2 5 3 0 。本文著重研究在b a s e l i n ep r o f i l 中支持的c a v l c 算法。本章首先簡要視頻編碼的必要性和可行性，接著介紹了視頻編碼標(biāo)準(zhǔn)的發(fā)展歷程，對各個(gè)階段的編碼標(biāo)準(zhǔn)進(jìn)行比較，詳細(xì)介紹了h 2 6 4 標(biāo)準(zhǔn)的編解碼框架和關(guān)鍵技術(shù)，然后對h 2 6 4 標(biāo)準(zhǔn)中熵編碼的算法進(jìn)行了簡要的分析。 2 1 視頻編碼的必要性和可行性由于視頻承載了海量信息，包含大量數(shù)據(jù)，對通信傳輸帶寬和數(shù)據(jù)存儲(chǔ)都提出了更高的要求。以常見的c i f 格式為例，每幅c i f 由2 8 8 行組成，每行包括3 5 2 個(gè)像素點(diǎn)；如果對每個(gè)像素點(diǎn)的r 、g 、b 分量都采用8b i t 數(shù)據(jù)進(jìn)行表示，當(dāng)幀速率為2 5 f p s 時(shí)，每秒c i f 圖像占用的數(shù)據(jù)量為： 2 8 8 3 5 2 3x8x2 5 = 5 9 4 m b i t 對于符合p a l 制式的標(biāo)準(zhǔn)電視信號的y ，c r ，c b 分量所占比特?cái)?shù)分別是 7 9 1 m b i t ，1 9 7 8 m b i t ，1 9 7 8 m b i t ，每秒p a l 制式的視頻數(shù)據(jù)量為： ( 7 9 1 + 1 9 7 8 + 1 9 7 8 ) 2 = 2 3 7 3 2m b i t 而高清晰電視h d t v 的數(shù)據(jù)量達(dá)到了1 2 g b p s 以上。與此同時(shí)，傳輸網(wǎng)絡(luò)的帶寬和存儲(chǔ)媒質(zhì)容量都非常有限，例如：公共交換電信網(wǎng)p s t n 的帶寬是 3 3 6 - - 5 6 k b p s ，綜合業(yè)務(wù)數(shù)字網(wǎng)i s d n 的帶寬是( 2 b + d ) 1 4 4 k b p s ，非對稱數(shù)字用 6 h 2 6 4 中c a v l c 編碼器的v l s i 結(jié)構(gòu)設(shè)計(jì) 戶環(huán)路a d s l 的帶寬是1 1 5 m b p s ，全球移動(dòng)通信系統(tǒng)g s m 帶寬為9 6 - - 1 4 4 k b p s ，而存儲(chǔ)介質(zhì)中c d r o m 大小為7 5 0 m b ，d v d r o m 大小為4 7 g b 可以看出，如果在d v d r o m 上保存p a l 制式的視頻數(shù)據(jù)，只能保存不到半分鐘的內(nèi)容。視頻數(shù)據(jù)這種海量性對存儲(chǔ)器、通信信道和計(jì)算機(jī)的處理速度增加了極大的壓力。因此無論是存儲(chǔ)、傳輸還是處理，數(shù)字視頻必須經(jīng)過有效的壓縮編碼才能具有實(shí)際應(yīng)用價(jià)值，而視頻數(shù)據(jù)由于具有多種相關(guān)性，只要采用相應(yīng)的方法去除相關(guān)性造成的各種冗余就能對原始視頻信號進(jìn)行有效的壓縮。一般而言，數(shù)字視頻信號的冗余可歸為以下幾類： 1 空間冗余：數(shù)字圖像是視頻基本組成元素，通過對模擬視頻信號進(jìn)行空間采樣得到的，所以構(gòu)成數(shù)字圖像的相鄰像素間具有較大相關(guān)性，即這些像素之間的像素值相差通常不會(huì)很大。各像素的值可以通過相鄰像素的數(shù)值預(yù)測出來，每個(gè)獨(dú)立的像素所攜帶的信息很少，這種像素間的冗余就稱為空間冗余。 2 時(shí)間冗余：由于視頻信號本質(zhì)上是一系列連續(xù)的圖像，為了達(dá)到連續(xù)的視頻效果，幀與幀之間的采樣間隔很小，對于2 5f p s 的視頻信號，間隔時(shí)間為0 0 4s 。因此相鄰視頻圖像間也存在著很強(qiáng)的相關(guān)性。對于靜止不動(dòng)的場景，相鄰兩幀的內(nèi)容是完全相同的；對于場景中的運(yùn)動(dòng)目標(biāo)，如果知道運(yùn)動(dòng)規(guī)律，這樣就可以很容易地從前一幀視頻圖像推算出它在當(dāng)前幀中的大致位置。 3 心理視覺冗余：在大多數(shù)情況下，人類視覺系統(tǒng)是視頻編碼系統(tǒng)的最終接受者。而人類的視覺系統(tǒng)具有非線性和非均勻的特點(diǎn)，人類感知的圖像亮度不僅與該點(diǎn)的反射光強(qiáng)有關(guān)，同時(shí)也受到相鄰的區(qū)域光強(qiáng)影響。另外人類視覺系統(tǒng)并非對所有視覺信息都具有相同的敏感度。視頻中的部分信息在通常的感知過程中與其他信息相比來說并不重要，所以就可以被視為心理視覺冗余，而且去除這些信息不會(huì)明顯降低人類感受到的圖像的質(zhì)量。 4 編碼冗余：如果對圖像的所有信息都采用相同長度的符號表示，需要使用較多比特才能完全表示圖像中的灰度和顏色信息。理想情況是按照像素信息的信息熵大小為其分配相應(yīng)的比特?cái)?shù)。而在實(shí)際情況中，很難得到像素的具體信息熵。在圖像的采樣和量化時(shí)一般方法是對所有像素分配相同比特?cái)?shù)，此時(shí)編碼采用的碼不能使平均比特?cái)?shù)達(dá)到或接近熵值，在這種情況下一定存在熵編碼冗余。 2 2 視頻編碼的發(fā)展與比較 1 9 4 8 年，o l i v e r 提出了第一個(gè)編碼理論一脈沖編碼調(diào)制：同年，s h a n n o n 提出并建立了信息率失真函數(shù)概念，后來進(jìn)一步確立了率失真理論，這些工作奠定了第二章h 2 6 4 視頻編碼的研究 7 信息編碼的理論基礎(chǔ)。主要編碼方法包括變換編碼、預(yù)測編碼和統(tǒng)計(jì)編碼。這些經(jīng)典方法被成為“第一代視頻壓縮編碼方法。這些編碼方法在中等壓縮率的情況下，提供了非常好的圖像質(zhì)量，但在低壓縮率情況下，無法令人滿意。這些技術(shù)都沒有利用圖像的結(jié)構(gòu)特點(diǎn)，只能以像素或塊為編碼的對象，設(shè)計(jì)時(shí)也沒有考慮人類視覺系統(tǒng)的特性、視頻圖像的具體特點(diǎn)，所以后來達(dá)到了頂峰。為了克服“第一代刀視頻壓縮編碼方法的局限性，k u n t 等人提出了“第二代視頻壓縮編碼方法，充分利用人的視覺心理、生理和圖像信源的各種特性，實(shí)現(xiàn) 從“波形編碼到“模型一編碼的轉(zhuǎn)變，獲得了更高的壓縮比?！暗诙曨l壓縮編碼方法結(jié)合計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)、人工智能與模式識別等多學(xué)科研究成果，為視頻編碼開拓了廣闊的前景。但是增加了分析的難度和實(shí)現(xiàn)的復(fù)雜性。近些年來，出現(xiàn)了一類充分利用人類視覺特性的“多分辨率編碼的方法，如子帶編碼和基于小波變換的編碼方法。這類方法使用不同類型的一維或二維線性數(shù)字濾波器對視頻圖像進(jìn)行整體分解，然后根據(jù)人類視覺的特性對不同頻段的數(shù)據(jù)進(jìn)行粗細(xì)不同的量化處理，以達(dá)到更好的壓縮效果。這類方法原理上是“波形編碼，仍屬于線性處理，可歸入經(jīng)典編碼方法，但它們又利用了人類視覺系統(tǒng)的特性，因此可以被看作是“第一代編碼技術(shù)向“第二代編碼技術(shù)的過渡。為了推進(jìn)視頻編碼壓縮技術(shù)的發(fā)展和應(yīng)用，國際標(biāo)準(zhǔn)化組織i s o 和國際電信聯(lián)盟i t u 制定了一系列視頻壓縮國際標(biāo)準(zhǔn)。m p e g 組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用，目前已提出m p e g 1 、m p e g 2 、m p e g - 4 等標(biāo)準(zhǔn)。， 1 m p e g - 1 標(biāo)準(zhǔn)：1 9 9 3 年8 月公布，用于傳輸1 5 m b p s 數(shù)據(jù)傳輸率的數(shù)字媒體運(yùn)動(dòng)圖像及其伴音的編碼。該標(biāo)準(zhǔn)包括五部分：第一部分說明了如何根據(jù)第二部分視頻內(nèi)容以及第三部分音頻內(nèi)容的規(guī)定，對音頻和視頻進(jìn)行復(fù)合編碼。第四部分說明了檢驗(yàn)解碼器或編碼器的輸出比特流是否符合前三部分規(guī)定的過程。第五部分用完整的c 語言實(shí)現(xiàn)了編碼和解碼器。該標(biāo)準(zhǔn)從頒布的那- n 起取得了成功，如v c d 和m p 3 的大量使用，w m d o w s 9 5 以后的版本都帶有一個(gè)m p e g 1 軟件解碼器，可攜式m p e g 1 攝像機(jī)等等。 2 m p e g 2 標(biāo)準(zhǔn)：1 9 9 4 年，m p e g 組織推出m p e g - 2 壓縮標(biāo)準(zhǔn)，針對標(biāo)準(zhǔn)數(shù)字電視和高清晰度電視在各種應(yīng)用下的壓縮方案和系統(tǒng)層的詳細(xì)規(guī)定，編碼碼率從每秒3m b i t - - 一1 0 0m b i t 。m p e g - 2 不是m p e g 1 的簡單升級，m p e g 2 在系統(tǒng)和傳送方面作了更加詳細(xì)的規(guī)定和進(jìn)一步的完善。m p e g 2 圖像壓縮原理是利用了圖像中的空間相關(guān)性和時(shí)間相關(guān)性，編碼時(shí)去除冗余信息，只保留少量非相關(guān)信息進(jìn)行傳輸，節(jié)省傳輸頻帶。而接收機(jī)利用這些非相關(guān)信息，按照一定的解碼算法，可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。 8 h 2 6 4 中c a v l c 編碼器的v l s i 結(jié)構(gòu)設(shè)計(jì) m p e g - 2 標(biāo)準(zhǔn)主要應(yīng)用在廣播電視領(lǐng)域中的視音頻資料的保存、電視節(jié)目的非線性編輯系統(tǒng)及其網(wǎng)絡(luò)、衛(wèi)星傳輸、電視節(jié)目的播出等方面 3 m p e g - 4 標(biāo)準(zhǔn)：到1 9 9 9 年，m p e g - 4 標(biāo)準(zhǔn)出臺(tái)，它提供了低碼率、高質(zhì)量的音視頻壓縮、編碼方案，推動(dòng)了視頻多媒體應(yīng)用的進(jìn)一步發(fā)展。m p e g - 4 的特點(diǎn)是其更加注重多媒體系統(tǒng)的交互性和靈活性，是第一個(gè)具有交互性的動(dòng)態(tài)圖像標(biāo)準(zhǔn)。它采用基于對象的編碼理念，將一幅景物分成在時(shí)間和空間上相互聯(lián) 系的若干視頻音頻對象，分別編碼后，經(jīng)過復(fù)用傳輸，接收端對不同的對象分別解碼，從而組合成所需要的視頻和音頻。這樣我們可以對不同對象采用不同的編碼方法和表示方法，又有利于不同數(shù)據(jù)類型間的融合，并且可以方便的實(shí) 現(xiàn)對于各種對象的操作及編輯。 m p e g - 4 是針對數(shù)字電視、交互式繪圖應(yīng)用、交互式多媒體等整合及壓縮技術(shù) 的需求而制定的國際標(biāo)準(zhǔn)，它將眾多的多媒體應(yīng)用集成在一個(gè)完整的框架內(nèi)，旨在為多媒體應(yīng)用提供標(biāo)準(zhǔn)的算法及工具，從而建立起一種能被多媒體的存儲(chǔ)、傳輸、檢索等應(yīng)用領(lǐng)域普遍采用的統(tǒng)一數(shù)據(jù)格式。作為新一代多媒體數(shù)據(jù)壓縮編碼的代表，m p e g - 4 第一次提出了基于內(nèi)容、基于對象的壓縮編碼思想，因而代表了現(xiàn)代數(shù)據(jù)壓縮編碼技術(shù)的發(fā)展方向，被廣泛應(yīng)用于因特網(wǎng)視音頻廣播、無線通信、電視電話、動(dòng)畫、電子游戲等方面。與此同時(shí)，國際電信聯(lián)盟( i t u t ) 的視頻編碼專家組( v c e g ) 也推出了h 2 6 1 、 h 2 6 3 、h 2 6 3 + 等一系列視頻壓縮編碼的國際標(biāo)準(zhǔn)，并且同m p e g 專家組一起推出了h 2 6 4 壓縮編碼國際標(biāo)準(zhǔn)，下面簡要分析比較幾種主要的視頻編碼標(biāo)準(zhǔn)： 1 h 2 6 1 視頻編碼標(biāo)準(zhǔn)：作為最早的運(yùn)動(dòng)圖像壓縮國際標(biāo)準(zhǔn)，h 2 6 1 視頻編碼標(biāo) 準(zhǔn)是r r u t 為在綜合業(yè)務(wù)數(shù)字網(wǎng)( i s d 上應(yīng)用雙向聲像業(yè)務(wù)( 可視電話、視頻會(huì)議) 而制定的，速率為6 4 k b s 的整數(shù)倍。它制定了視頻編碼的各個(gè)部分，包括幀間預(yù)測、d c t 變換、量化、熵編碼以及速率控制等部分。h 2 6 1 只處理 c i f 和q c i f 兩種圖像格式，每幀圖像分成圖像層、宏塊組( g o b ) 層、宏塊層、塊( b l o c k ) 層來處理。、 2 h 2 6 3 視頻編碼標(biāo)準(zhǔn)：在h 2 6 1 基礎(chǔ)上發(fā)展起來的，是最早用于低碼率視頻編碼的i t u t 標(biāo)準(zhǔn)，是i t u t 為低于6 4 k b s 的窄帶通信信道制定的視頻編碼標(biāo)準(zhǔn)。與h 2 6 1 相比采用了半像素的運(yùn)動(dòng)補(bǔ)償，并增加了4 種有效的壓縮編碼模式。隨后出現(xiàn)的第二版h 2 6 3 + 及h 2 6 3 + + 增加了許多選項(xiàng)，使其具有更廣泛的適用性。h 2 6 3 的標(biāo)準(zhǔn)輸入圖像的格式可以是s q c i f 、q c i f 、c i f 、4 c i f 或者1 6 c i f 彩色4 ：2 ：0 的亞取樣圖像。h 2 6 3 視頻編碼標(biāo)準(zhǔn)的關(guān)鍵技術(shù)包括允許運(yùn)動(dòng)矢量指向圖像以外的區(qū)域。當(dāng)某一運(yùn)動(dòng)矢量所指的參考宏塊位于圖像第二章h 2 6 4 視頻編碼的研究 9 之外時(shí)，就用其邊緣的圖像像素值來代替；使用算術(shù)編碼來代替霍夫曼編碼，在信噪比和重建圖像質(zhì)量相同的情況下可以降低碼率；允許一個(gè)宏塊中的4 個(gè) 8 8 亮度塊各自對應(yīng)一個(gè)運(yùn)動(dòng)矢量，從而提高了預(yù)測精度；兩個(gè)色度塊的運(yùn) 動(dòng)矢量取這4 個(gè)亮度塊運(yùn)動(dòng)矢量的平均值；補(bǔ)償時(shí)，使用重疊的塊運(yùn)動(dòng)補(bǔ)償， 8 x8 亮度塊的每個(gè)像素的補(bǔ)償值由3 個(gè)預(yù)測值加權(quán)平均得到，使用該模式可以產(chǎn)生顯著的編碼增益。 h 2 6 3 + 標(biāo)準(zhǔn)是h 2 6 3 標(biāo)準(zhǔn)的版本2 ，它在保證原h(huán) 2 6 3 標(biāo)準(zhǔn)的核心句法和語義不變的基礎(chǔ)上，增加了若干選項(xiàng)以提高壓縮效率或改善某些功能。它允許更大范圍的圖像輸入格式，允許自定義圖像的尺寸，從而拓寬了標(biāo)準(zhǔn)使用的范圍。 h 2 6 3 + 采用先進(jìn)的幀內(nèi)編碼模式和增強(qiáng)的p b 幀模式，改進(jìn)了h 2 6 3 的不足，增強(qiáng)了幀間預(yù)測的效果；采用去塊效應(yīng)濾波器提高了壓縮編碼效率。為適應(yīng)網(wǎng) 絡(luò)傳輸，h 2 6 3 + 增加了時(shí)間分級、空間分級和信噪比，這對噪聲信道和大量包丟失的網(wǎng)絡(luò)中傳送視頻信息很有意義。 3 h 2 6 4 視頻編碼標(biāo)準(zhǔn)：制定h 2 6 3 標(biāo)準(zhǔn)后，i t u t 的視頻編碼專家組( v c e g ) 開始了兩個(gè)方面的研究：一個(gè)在h 2 6 3 基礎(chǔ)上增加選項(xiàng)，最終產(chǎn)生了h 2 6 3 + 與h 2 6 3 + h h 2 6 3 + + 在h 2 6 3 + 基礎(chǔ)上增加了三個(gè)選項(xiàng)) ；另一個(gè)是長期研究計(jì)劃，制定一種支持低碼率的視頻通信的新標(biāo)準(zhǔn)，最終產(chǎn)生了h 2 6 l 標(biāo)準(zhǔn)草案，在壓縮效率方面與先期的視頻壓縮標(biāo)準(zhǔn)相比，具有明顯的優(yōu)越性。隨后，i s o 與i t u 開始組建包括來自i s o 的m p e g 組織與i t u t 的v c e g 組織的聯(lián)合視頻組 ( j v t ) ，主要任務(wù)就是將h 2 6 l 草案發(fā)展為一個(gè)國際性標(biāo)準(zhǔn)。在i s o i e c 中該標(biāo)準(zhǔn)命名為a v c ( a d v a n c e dv i d e oc o d i n g ) ，作為m p e g - 4 標(biāo)準(zhǔn)的第1 0 個(gè)選項(xiàng)；在i t u t 中被正式命名為h 2 6 4 標(biāo)準(zhǔn)。作為自m p e g - 2 視頻壓縮標(biāo)準(zhǔn)發(fā)布以后的最新視頻壓縮標(biāo)準(zhǔn)，h 2 6 4 在相同的重建圖像質(zhì)量下，數(shù)據(jù)壓縮比是m p e g 2 的2 倍以上，是m p e g - 4 的1 5 - - 2 倍；對信道時(shí)延的適應(yīng)性較強(qiáng)，既可工作于低時(shí)延模式以滿足實(shí)時(shí)業(yè)務(wù)，又可工作于無時(shí)延限制的場合；提高了網(wǎng)絡(luò)適應(yīng)性，采用“網(wǎng)絡(luò)友好的結(jié)構(gòu)和語法，加強(qiáng)了對誤碼和丟包的處理，提高解碼的差錯(cuò)恢復(fù)能力；采用復(fù)雜度的可分級設(shè)計(jì)，在圖像質(zhì)量和編碼處理之間可分級，以適應(yīng)不同等級的應(yīng)用。正是由于這些優(yōu)點(diǎn)，h 2 6 4 視頻壓縮標(biāo)準(zhǔn)被普遍認(rèn)為是最有影響力的行業(yè)標(biāo)準(zhǔn)。為什么h 2 6 4 視頻壓縮標(biāo)準(zhǔn)有如此好的壓縮性能? 相對于之前的幾個(gè)視頻壓縮標(biāo) 準(zhǔn)，h 2 6 4 引入t i t 多先進(jìn)的關(guān)鍵技術(shù)，大致如下： 1 4 x 4 整數(shù)變換：以前的編碼標(biāo)準(zhǔn)，如h 2 6 3 或m p e g - 4 ，都是采用8 8 的 d c t 變換。h 2 6 l 標(biāo)準(zhǔn)建議的整數(shù)變換接近于4 x 4 的d c t 變換，降低了算法 1 0 h 2 6 4 中c a v l c 編碼器的v l s i 結(jié)構(gòu)設(shè)計(jì) 的復(fù)雜度，也避免了反變換的失配問題，4 x 4 的塊也可以減小塊效應(yīng)。而h 2 6 4 的4 x 4 整數(shù)變換進(jìn)一步降低了編碼算法的復(fù)雜度，相比h 2 6 l 中建議的整數(shù) 變換，由以前3 2 b 的輸入殘差數(shù)據(jù)降為現(xiàn)在的1 6 b 運(yùn)算，而且整個(gè)變換沒有乘法，只需加法和一些移位運(yùn)算。新的變換對編碼的性能幾乎沒有影響，而且實(shí) 際編碼效果略好一些。 2 基于空域的幀內(nèi)預(yù)測技術(shù)：視頻編碼是通過去除圖像的時(shí)間與空間的相關(guān)性來達(dá)到壓縮的目的。空間相關(guān)性通過有效的變換來去除，如h 2 6 4 的整數(shù)變換；時(shí)間相關(guān)性則通過幀間預(yù)測來去除。這里所說的變換去除空間相關(guān)性，僅局限在所變換的塊內(nèi)，如8 8 塊或者4 x 4 塊，并沒有塊與塊之間的處理。h - 2 6 4 在空域中利用當(dāng)前塊的相鄰像素直接對每個(gè)系數(shù)做預(yù)測，提高了幀內(nèi)編碼的效率。幀內(nèi)預(yù)測時(shí)編碼器根據(jù)當(dāng)前塊相鄰的像素點(diǎn)計(jì)算預(yù)測值，再進(jìn)行差分編碼。幀內(nèi)編碼宏塊類型包括 n t r a1 6 x1 6 和i n t r a4 x 4 兩種。根據(jù)圖像平滑程度決定選用類型，如平滑簡單的區(qū)域采用i n t r a1 6 1 6 類型，而圖像細(xì)節(jié)方面需要準(zhǔn)確預(yù)測時(shí)，采用i n t r a4 4 型。 3 運(yùn)動(dòng)估計(jì)：在幀間編碼過程中，編碼器可以根據(jù)編碼的需要對宏塊進(jìn)行分割。內(nèi)容平滑的宏塊不作分割，包含細(xì)節(jié)的宏塊將根據(jù)情況分成2 個(gè)8 1 6 的塊，或者2 個(gè)1 6 8 的塊，或者4 個(gè)8 8 的塊，分割出的每個(gè)塊都有自己的參考幀標(biāo)號；8 8 的塊中如果還包含細(xì)節(jié)，可以被進(jìn)一步分割成2 個(gè)4 8 的塊，或者2 個(gè)8 4 的塊，或者4 個(gè)4 4 的塊，這時(shí)分割出的塊都使用相同的參考幀，不過每個(gè)塊都有自己的運(yùn)動(dòng)矢量。也就是說，一個(gè)宏塊最多需要發(fā)送4 個(gè) 參考幀標(biāo)號和1 6 個(gè)運(yùn)動(dòng)矢量。 h 2 6 4 的運(yùn)動(dòng)估計(jì)具有三個(gè)新特點(diǎn)：四分之一像素精度的運(yùn)動(dòng)估計(jì)：七種不同大小的塊進(jìn)行匹配；前向和后向多參考幀。幀間編碼時(shí)，一個(gè)宏塊( 1 6 1 6 ) 可以被分為1 6 8 、8 1 6 、8 8 三種塊，而8 8 的塊被稱為子宏塊，又可以分為8 4 、4 x 8 、4 x 4 三種塊。與以往標(biāo)準(zhǔn)的p 幀、b 幀不同，h 2 6 4 采用了前向與后向多個(gè)參考幀的預(yù)測。半像素精度的運(yùn)動(dòng)估計(jì)比整像素的運(yùn)動(dòng)估計(jì) 有效地提高了壓縮比，而四分之一像素精度的運(yùn)動(dòng)估計(jì)可帶來更好的壓縮效果。多參考幀預(yù)測方面，假設(shè)為5 個(gè)參考幀預(yù)測，相對于一個(gè)參考幀，可降低 5 - - 1 0 的碼率。 4 熵編碼：h 2 6 4 提供兩種熵編碼方法，一種是u v l c 結(jié)合基于上下文的自適應(yīng)可變長編碼c a v l c ( c o n t e x t - a d a p t i v ev a r i a b l e l e n g t hc o d i n g ) 的變長編碼，另一種是基于上下文的自適應(yīng)二進(jìn)制算術(shù)編碼c a b a c ( c o n t e x t - b a s e a a d a p t i v eb i n a r ya r i t h m e t i cc o d i n g ) 。在h 2 “標(biāo)準(zhǔn)中的b a s e l i n ep r o f i l e 只支持 c a v l c ，而在m a i np r o f i l e 中同時(shí)支持c a v l c 和c a b a c 。這兩種編碼方法都是利用自適應(yīng)的上下文模型，即根據(jù)相鄰塊的情況來編碼當(dāng)前塊，這樣便提第二章h 2 6 4 視頻編碼的研究高了編碼的效率。 5 d c t 變換和量化：h 2 6 4 中采用了基于4 4 像素塊的整數(shù)d c t 變換。與浮點(diǎn) 運(yùn)算相比，整數(shù)d c t 變換雖然會(huì)引起一些額外的誤差，但整數(shù)d c t 變換具有運(yùn)算量小、復(fù)雜度低等優(yōu)點(diǎn)。h 2 6 4 中采用標(biāo)量量化技術(shù)，將每個(gè)像素編碼映射為較小的數(shù)值。在不降低視覺效果的前提下，量化過程盡量減少圖像編碼長度，減少視覺恢復(fù)中不必要的信息。量化步長q p 決定量化器的壓縮率及圖像精度。如果q p 較大，則量化值的動(dòng)態(tài)范圍較小，相應(yīng)的編碼長度較小，但反量化時(shí)會(huì)損失較多的圖像細(xì)節(jié)信息；如果q p 較小，則量化值的動(dòng)態(tài)范圍較大，其相應(yīng)的編碼長度也較大，但圖像細(xì)節(jié)信息損失的較少。編碼器可以根據(jù)實(shí)際動(dòng)態(tài)范圍自動(dòng)改變q p 值，在編碼長度和圖像精度之間折中，達(dá)到最佳效果。 6 去塊效應(yīng)濾波器：方塊效應(yīng)也稱為馬賽克效應(yīng)，是基于塊的壓縮編碼時(shí)由于邊緣的數(shù)據(jù)在重建時(shí)比塊內(nèi)數(shù)據(jù)的精度低造成的。h 2 6 4 采用自適應(yīng)的環(huán)內(nèi)去方塊濾波器對塊的邊界進(jìn)行去塊濾波，濾除重建圖像中的方塊效應(yīng)。一個(gè)邊緣兩邊的像素是否需要去塊濾波，是由兩邊的像素亮度差的絕對值決定的，判定的門限值與量化系數(shù)有關(guān)。當(dāng)絕對值較大時(shí)，表明存在方塊效應(yīng)，需要去塊濾波，但是如果絕對值超出了當(dāng)前量化系數(shù)所能引起的誤差，說明是圖像內(nèi)容變化引起的，此時(shí)不需要去塊濾波。需要去塊濾波的邊緣部分，還要根據(jù)兩邊塊一的預(yù)測方式和運(yùn)動(dòng)矢量等信息決定去塊濾波的強(qiáng)度。 h 2 6 4 中經(jīng)過去塊濾波的圖像方塊效應(yīng)明顯減小，同時(shí)圖像中的細(xì)節(jié)部分基本無變化，避免了去塊濾波引起的圖像模糊，圖像的主觀質(zhì)量明顯提高。采用去塊濾波器后，在相同客觀質(zhì)量下編碼器輸出的比特率下降5 1 0 。目前，h 2 6 1 與h 2 6 3 已被廣泛應(yīng)用，成熟的產(chǎn)品已經(jīng)很多。h 2 6 3 與h 2 6 1 相比，增加了若干選項(xiàng)，提供了更靈活的編碼方式，壓縮效率提高。h 2 6 4 視頻編碼標(biāo)準(zhǔn)的推出，是視頻編碼標(biāo)準(zhǔn)的一次重要進(jìn)步，它與現(xiàn)有的m p e g 2 、m p e g - 4 及h 2 6 3 相比，具有明顯的優(yōu)越性，特別是在編碼效率上的提高。盡管h 2 6 4 的算法復(fù)雜度高，隨著集成電路技術(shù)的快速發(fā)展，h 2 6 4 的應(yīng)用已成為現(xiàn)實(shí)。 2 3h 2 6 4 視頻編碼標(biāo)準(zhǔn)概述 2 3 1h 2 6 4 視頻編解碼框架 h 2 6 4 編碼器的結(jié)構(gòu)框架如圖2 1 所示。當(dāng)前幀f n 以宏塊為單位依次進(jìn)入編碼器。編碼器包括兩個(gè)通路：前向編碼通路和反向重建圖像通路。 1 2 h 2 6 4 中c a v l c 編碼器的v l s i 結(jié)構(gòu)設(shè)計(jì) 圖2 1h 2 6 4 編碼器結(jié)構(gòu)框圖在前向編碼通路中，每個(gè)宏塊的編碼方式分為幀內(nèi)和幀間兩種編碼模式。當(dāng) 采用幀內(nèi)編碼模式時(shí)，由當(dāng)前幀f n 已重建的宏塊來預(yù)測宏塊，得到當(dāng)前宏塊的預(yù) 測值；當(dāng)采用幀間編碼模式時(shí)，是由當(dāng)前幀f n 的參考幀f n - 1 來對當(dāng)前宏塊進(jìn)行幀間預(yù)測( 運(yùn)動(dòng)估計(jì)) 得到當(dāng)前宏塊的預(yù)測值。然后由預(yù)測宏塊和當(dāng)前宏塊相減得到殘差宏塊，再對宏塊的殘差數(shù)據(jù)進(jìn)行d c t 變換和量化操作，得到殘差宏塊的變換系數(shù)，殘差的變換系數(shù)以及預(yù)測信息再經(jīng)過熵編碼得到最終的碼流。為了和解碼端保持一致，需要得到已編碼宏塊的重建宏塊，所以在編碼器中建立個(gè)反向重建通路。在反向重建通路中，d c t 變換和量化后的殘差的變換系數(shù)經(jīng)過反量化和反d c t 變換得到殘差數(shù)據(jù)的宏塊，殘差數(shù)據(jù)的宏塊與預(yù)測宏塊相加得到未經(jīng)去塊濾波的重建宏塊，再經(jīng)過去塊效應(yīng)濾波器得到重建圖像。 h 2 6 4 的視頻序列通常的編碼過程如圖2 2 所示，卜一櫳猿亭列一圖2 2 視頻序列編碼過程第二章h 2 6 4 視頻編碼的研究 1 3 所以一個(gè)視頻序列的編碼過程大致如下： 1 把一個(gè)視頻序列先按照上圖的結(jié)構(gòu)劃分為一幀幀連續(xù)的圖像，再把每幀圖像劃分為若干個(gè)片( s l i c e ) ，每個(gè)片劃分為宏塊，最終每個(gè)宏塊劃分為小塊，每個(gè) 小塊包含很多像素點(diǎn)，這樣編碼一個(gè)視頻序列就變?yōu)榫幋a一個(gè)個(gè)小塊的過程。 2 通過對塊的變換、量化和熵編碼，消除圖像中的空間冗余。 3 由于相鄰幀圖像存在很大的相似性( 即時(shí)間冗余) ，所以只需要將相鄰幀圖像間的變化

人人文庫> 全部分類> 畢業(yè)設(shè)計(jì) > 畢業(yè)論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf

文檔簡介

溫馨提示

最新文檔

評論

（通信與信息系統(tǒng)專業(yè)論文）h264中cavlc編碼器的vlsi結(jié)構(gòu)設(shè)計(jì).pdf

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔