數(shù)字通信技術03-3.ppt_第1頁
數(shù)字通信技術03-3.ppt_第2頁
數(shù)字通信技術03-3.ppt_第3頁
數(shù)字通信技術03-3.ppt_第4頁
數(shù)字通信技術03-3.ppt_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

3.4 圖像壓縮編碼標準,3,圖像壓縮編碼標準,內(nèi)容: 圖像壓縮編碼標準的種類,如JPEG、MPEG、H.26x 等標準,熟悉實現(xiàn)這些標準所采用的算法以及應用 要求: 掌握圖像壓縮編碼標準的種類,如JPEG、MPEG、H.26x 等標準,熟悉實現(xiàn)這些標準所采用的算法以及應用,4,引言,圖像編碼標準的分類 靜止圖像編碼標準 JPEG JPEG2000 活動圖像編碼標準 H.26X:H.261、H.263、H.264 MPEG: MPEG-1、 MPEG-2、 MPEG-4、 MPEG-7,3.4.1 靜止圖像壓縮標準,6,一、JPEG,JPEG研究小組 1986年,國際標準化組織ISO和國際電報電話咨詢委員會CCITT共同成立了聯(lián)合圖像專家組(Joint Photographic Experts Group),對靜止圖像壓縮編碼的標準進行了研究。 建議形成 JPEG小組于1988年提出建議書,1992年成為靜止圖像壓縮編碼的國際標準。JPEG是一個達到數(shù)字演播室標準的圖像壓縮編碼標準,其亮度信號與色度信號均按照ITUR601的規(guī)定取樣后劃分為8x8子塊進行編碼處理。,7,一、JPEG,JPEC標準主要涉及連續(xù)色調(灰度和彩色)靜止圖像的壓縮編碼。共提供了四種工作模式: 順序模式(基準模式):依掃描順序,從左到右、從上到下,一次完成對圖像的DCT變換和編碼; 漸進模式:多次掃描完成編碼,第一次掃描是對前一次的細化; 分層漸進模式:將原始圖像用不同的空間分辨率表示,每一種分辨率對應于一個掃描。 無損模式:只作簡單的預測,不引入量化,壓縮率比較低。,所有JPEC模式的編解碼器必須支持基準模式。當硬件處理的速度足夠快時,JPEC也能用于實時視頻的壓縮。,8,一、JPEG,9,Forward Discrete Cosine Transform,Quantizer,Entropy Encoder,Table Specification,Table Specification,Entropy Decoder,Dequantizer,Inverse DCT,Table Specification,Table Specification,Source Image Data,Reconstructed Image Data,Compressed Image Data,Compressed Image Data,8x8 blocks,一、JPEG,基準模式的JPEG編解碼框圖,10,一、JPEG,基準模式編碼過程: 輸入信號經(jīng)DCT變換后,按固定的亮度與色度量化矩陣進行非線性量化。 對量化后相鄰圖像塊的DCT直流系數(shù)單獨進行DPCM編碼。 對余下的63個交流系數(shù)進行游程編碼。 對DPCM編碼后的直流系數(shù)和游程編碼后的交流系數(shù)再進行Huffman編碼或算術編碼。 送緩存器輸出。,11,一、JPEG,JPEC算法的平均壓縮比為15:1,當壓縮比大于50時將會出現(xiàn)方塊效應。 為提高恢復圖像的質量,尤其是低碼率時的質量,并根據(jù)圖像質量、視覺感受和分辨率來達到漸進傳輸、對碼流進行隨機存取和處理、開放結構、向下兼容等要求,1999年3月形成了JPEC2000工作草案,并于2000年正式頒布,升級并取代了JPEC標準。,12,二、JPEG2000,正式名稱:ISO 15444 特點 采用以小波變換為主的多分辨率編碼方式,放棄了JPEG所采用的以DCT為主的分塊編碼方式; 將彩色靜態(tài)畫面采用的JPEG編碼方式與2值圖像采用的JBIG編碼方式統(tǒng)一起來,成為對應各種圖像的通用編碼方式,13,二、JPEG2000,JPEC2000編譯碼原理圖,14,compressione 100:1,compressione 100:1,/JPEG2000.htm,二、JPEG2000,JPEG2000性能,15,二、JPEG2000,JPEG2000新特性 漸進傳輸 無損壓縮和有損壓縮 感興趣區(qū)域壓縮 高壓縮率 連續(xù)色調和二值壓縮 碼流的隨機訪問和處理 容錯性 開放的框架結構 基于內(nèi)容的描述 WEB圖像簡單化,16,二、JPEG2000,漸進傳輸,17,二、JPEG2000,無損壓縮和有損壓縮 JPEG2000提供無損和有損兩種壓縮方式,無損壓縮在許多領域是必須的,例如醫(yī)學圖像中有時有損壓縮是不能忍受的,再如圖像檔案中為了保存重要的信息有較高的圖像質量是必然的要求。同時JPEG2000提供的是嵌入式碼流,允許從有損到無損的漸進解壓,這也是小波變換過程中分解與重構的特點。,18,二、JPEG2000,感興趣區(qū)域壓縮,對感興趣區(qū)域指定壓縮質量,19,二、JPEG2000,高壓縮率,20,二、JPEG2000,高壓縮率,3.4.2 運動圖像壓縮標準,22,一、圖像尺寸的規(guī)定,CCIR601建議 PAL: 625行/50場 720像素576行 NTSC:525行/60場 720像素480行 為了符合H.261建議或MPEG-1建議要求的碼率 亮度:720576/480360288/240 色差:360576/480180144/120 為了能分割為1616子塊 亮度352288 色差176144 即為H.261建議規(guī)定的“公用中間格式”(Common Intermedia Format),23,一、圖像尺寸的規(guī)定,視頻編碼圖像格式一覽表,SIF:Source Input Format,CIF:Common Intermedia Format,QCIF:Quarter CIF,24,二、H.261,簡介: H.261是第一個視頻圖像壓縮標準; H.261又稱為P64,分別對應視頻電話(p=1,2)與電話會議(p5); H.261支持QCIF(p=1,2)和CIF這兩種圖像格式。 H.261的編碼方法包括: DCT變換; 可控步長線性量化; 變長編碼及預測編碼。,25,二、H.261,H.261數(shù)據(jù)結構,26,二、H.261,圖像層,塊組層,宏塊層,塊層,MPEG視頻部分數(shù)據(jù)結構圖,27,二、H.261,H.261圖像序列的組成結構如下: 圖像層(Picture Layer, P):由圖像頭和GOB數(shù)據(jù)組成; 塊組層(Group of Block Layer,GOB):由一個GOB頭和MB數(shù)據(jù)組成; 宏塊層(Macro Block Layer,MB):由一個MB頭和B數(shù)據(jù)組成; 塊層(Block Layer,B):包括一個塊的DCT系數(shù)(包括亮度和色度),后接一個固定長度的結束碼(End Of Block,EOB)。,28,二、H.261,CIF格式,QCIF的GOB數(shù)是CIF的1/4,即3個GOB。其它結構與CIF相同。,29,二、H.261,H.261壓縮編碼原理圖,30,三、H.263,H.263 傳輸速率低于64K,適用于低比特率條件下對運動圖像進行壓縮編碼。 壓縮編碼算法:結構與H.261類似,包括幀間預測(含運動估計和運動補償)、DCT變換和變長熵編碼。不同點是:H.263的運動補償采用的是半像素精度,而H.261采用的是全像素精度和一個環(huán)路濾波器。 H.263增加了支持的圖像格式,編碼器必須支持sub-QCIF和QCIF中的一個,是否支持其他格式由用戶自己決定。其它格式包括:CIF、4CIF、16CIF。,31,三、H.263,H.263的可選模式 1、非限制運動矢量模式,能夠反映較快的圖像運動。 2、先進預測模式。這種模式能提高幀間預測的準確性,可以在比特率不變的情況下降低方塊效應,提高圖像的主觀質量。 3、算術編碼模式。用算術編碼方法代替缺省模式下的可變長編碼方法來實現(xiàn)熵編碼,在不損失信噪比的前提下可以把輸出比特率降低5%左右。 4、PB幀模式。該模式在不明顯增加比特率的同時,把圖像的幀速率提高一倍。,32,四、H.264,H.264 在較低帶寬上提供高質量圖像傳輸是H.264的應用亮點。 采用的新技術:統(tǒng)一的VLC符號編碼,高精度、多模式的位移估計,基于44塊的整數(shù)變換、分層的編碼語法等。 壓縮編碼算法:DPCM加變換編碼的混合編碼模式。,33,四、H.264,H.264具有以下幾個方面的特點 幀間預測 幀間預測用于降低圖像的時域相關性,通過采用多幀參考和更小預測區(qū)域等方法對下一幀進行精確預測,從而減少傳輸?shù)臄?shù)據(jù)量。在H.264中,對亮度塊的劃分方法有1616、168、816和88四種,而且當選取88劃分時,可以進一步按照88、84、48以及44進行亞分割。,34,四、H.264,幀內(nèi)預測 在H.264中,亮度塊可以有9種44塊和4種1616塊的幀內(nèi)預測模式,色度88塊的4種預測模式與亮度的4種1616塊的預測模式一樣。 分層設計 H.264的算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內(nèi)容表示,網(wǎng)絡提取層(NAL:Network Abstraction Layer)負責以網(wǎng)絡所要求的恰當?shù)姆绞綄?shù)據(jù)進行打包和傳送。,35,四、H.264,高精度、多模式運動估計 H.264支持1/4或1/8像素精度的運動矢量。與整數(shù)精度的空間預測相比,可以提高大于20的編碼效率。 44塊的整數(shù)變換 H.264與先前的標準相似,對殘差采用基于塊的變換編碼,但變換是整數(shù)操作而不是實數(shù)運算,其過程和DCT基本相似。這種方法的優(yōu)點在于:在編碼器中和解碼器中允許精度相同的變換和反變換,便于使用簡單的定點運算方式。也就是說,這里沒有“反變換誤差”。,36,四、H.264,統(tǒng)一的VLC H.264中熵編碼有兩種方法,一種是對所有的待編碼的符號采用統(tǒng)一的VLC(UVLC :Universal VLC),另一種是采用內(nèi)容自適應的二進制算術編碼(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可選項,其編碼性能比UVLC稍好,但計算復雜度也高。 面向IP和無線環(huán)境 H.264草案中包含了用于差錯消除的工具,便于壓縮視頻在IP和無線網(wǎng)絡中的傳輸。,37,四、H.264,面向網(wǎng)絡應用 H.264在系統(tǒng)層上提出了全新的概念,定義了VCL和NAL。其中VCL包括了VCL編碼器與VCL解碼器,主要功能是采用運動補償、變換編碼、熵編碼以及去方塊濾波等多種技術,進行視頻壓縮數(shù)據(jù)的高效組織與表示。 復雜度增加 H.264優(yōu)越性能的獲得不是沒有代價的,其代價是計算復雜度的大大增加,據(jù)估計,編碼的計算復雜度大約相當于H.263的3倍,解碼復雜度大約相當于H.263的2倍。,38,五、MPEG,MPEG: Moving Picture Exports Group,是ISO組織下屬的運動圖像專家小組的英文縮寫。 MPEG系統(tǒng)組成:由系統(tǒng)層和壓縮層組成,包括MPEG系統(tǒng)、MPEG視頻和MPEG音頻三個部分。 MPEG編碼過程:MPEG的基本編碼過程與H.261相似,即通過DCT進行幀間壓縮。除了在編碼語法上加進了一些特別規(guī)定外,與H.261的一個重要不同是MPEG在預測編碼中加進了一個雙向預測幀B幀。 MPEG特點:是不對稱算法,編碼算法很復雜,譯碼算法簡單。其主要應用于圖像存貯、電視廣播等方面。,39,五、MPEG,MPEG是ISO組織下屬的運動圖像專家小組Moving Picture Exports Group的英文縮寫,于1988年成立,是為數(shù)字視/音頻制定壓縮標準的專家組。 MPEG組織最初得到的授權是制定用于“活動圖像”編碼的各種標準,隨后擴充為“及其伴隨的音頻”及其組合編碼。后來針對不同的應用需求,解除了“用于數(shù)字存儲媒體”的限制,成為現(xiàn)在制定“活動圖像和音頻編碼”標準的組織。 目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標準。,40,六、MPEG-1,MPEG-1: MPEG-1主要是針對運動圖像和聲音在數(shù)字存儲時的壓縮編碼,典型應用如VCD等家用數(shù)字音像產(chǎn)品,其編碼最高碼率為1.5Mbps。 MPEG-l標準可以處理各種類型的活動圖像,其基本算法對于壓縮水平方向 360個像素豎直方向288個像素的空間分辨力,每秒24至30幅畫面的運動圖像有很好的效果,MPEG-l標準提供了一些錄像機的功能:正放,圖像凍結、快進、快倒和慢放。此外,還提供了隨機存儲的功能。,41,六、MPEG-1,MPEG-1標準共計包括五個部分 第一部分說明了如何根據(jù)第二部分(視頻)以及第三部分(音頻)的規(guī)定,對音頻和視頻進行復合編碼。第四部分說明了檢驗解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過程。第五部分是一個用完整的C語言實現(xiàn)的編碼和解碼器。,42,六、MPEG-1,MPEG-l標準采用了一系列技術以獲得高壓縮比 對色差信號進行亞取樣,減少數(shù)據(jù)量; 采用運動補償技術減少幀間冗余度; 做二維DCT變換去除空間相關性; 對DCT分量進行量化,舍去不重要的信息,將 量化后的DCT分量按照頻率重新排序; 將 DCT分量進行變字長編碼; 對每數(shù)據(jù)塊的直流分量(DC)進行預測差分編碼。,43,六、MPEG-1,MPEG-1標準從頒布的那一刻起,取得一連串的成功,如VCD和MP3的大量使用,Windows95以后的版本都帶有一個MPEG-1軟件解碼器,便攜式MPEG-1攝像機等等。,44,六、MPEG-1,【MP3】: MP3是MPEG-1格式中的音頻壓縮部分。MP3是英文“MPEG Audio Layer-3”的縮略語,“Layer-3”是 Layer-1, Layer-2以后,作為升級版(version up)的產(chǎn)品。與其前身相比,Layer-3 具有最好的壓縮率,并被命名為MP3,其應用最為廣泛,表3-7給出了Layer-1、 Layer-2及Layer-3的壓縮比。,45,六、MPEG-1,編碼格式 壓縮比 Layer-1 4:1 Layer-2 4:16:1 Layer-3 10:112:1 MP3本質上是指音頻文件壓縮的格式,現(xiàn)在我們通常說的MP3是指取樣該壓縮方法的音頻文件,有時也將能播放MP3的播放器簡稱為MP3。,46,七、MPEG-2,MPEG-2: 則針對數(shù)字電視的視音頻壓縮編碼, MPEG組織于1994年推出MPEG-2壓縮標準。 MPEG-2對數(shù)字電視各種等級的壓縮編碼方案及圖像編碼中劃分的層次作了詳細的規(guī)定,其編碼碼率可從3Mbps到100Mbps。MPEG-2特別適用于廣播級的數(shù)字電視的編碼和傳送,被認定為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論