多媒體技術基礎及應用課件_第1頁
多媒體技術基礎及應用課件_第2頁
多媒體技術基礎及應用課件_第3頁
多媒體技術基礎及應用課件_第4頁
多媒體技術基礎及應用課件_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

多媒體技術基礎及應用北京廣播電視大學呂小星副教授1多媒體技術基礎及應用北京廣播電視大學呂小星副教授1第4章多媒體數(shù)據(jù)壓縮編碼技術本章講課思路:靜態(tài)圖像壓縮編碼的國際標準(JPEG)變換編碼統(tǒng)計編碼預測編碼數(shù)據(jù)壓縮的基本概念2第4章多媒體數(shù)據(jù)壓縮編碼技術本章講課思路:靜態(tài)圖像壓縮編碼第二部分

(二)預測編碼3第二部分

(二)預測編碼3預測編碼(PredictiveCoding)是統(tǒng)計冗余數(shù)據(jù)壓縮理論的三個重要分支之一,它的理論基礎是現(xiàn)代統(tǒng)計學和控制論。預測編碼主要是減少了數(shù)據(jù)在時間和空間上的相關性,因而對于時間序列數(shù)據(jù)有著廣泛的應用價值。

4.4預測編碼4預測編碼(PredictiveCoding)是統(tǒng)計建立一個數(shù)學模型利用以往的樣本數(shù)據(jù)對新樣本值進行預測將預測值與實際值相減對其差值進行編碼這時差值很少可以減少編碼碼位。1.預測編碼的基本思想5建立一個數(shù)學模型利用以往的樣本數(shù)據(jù)2.預測編碼的分類預測編碼分為:線性預測和非線性預測62.預測編碼的分類預測編碼分為:63.DPCM和ADPCM

DPCM差分脈沖編碼調(diào)制

DifferentialPulseCodeModulation73.DPCM和ADPCMDPCM差分脈沖編碼調(diào)制

DPCM

編/解碼原理圖8DPCM編/解碼原理圖8信道DPCM系統(tǒng)發(fā)送編碼器預測器量化器接收解碼器預測器9信道DPCM系統(tǒng)發(fā)送編碼器預測器量化器接收解碼器預測器9最佳線性預測預測域例如:三階線性預測系統(tǒng)10最佳線性預測預測域例如:三階線性預測系統(tǒng)10預測域應用均方誤差最小準則,求出預測系數(shù)、、11預測域應用均方誤差最小準則,11均方誤差的表達式為12均方誤差的表達式為12解方程,得、、13解方程,13

DPCM

編/解碼原理圖14DPCM編/解碼原理圖14N階預測器的設計假定給定樣本序列:、、……預測那么預測誤差

15N階預測器的設計假定給定樣本序列:、、……15均方誤差的定義為:

假如是一個平穩(wěn)隨機過程,對各個取偏導數(shù),令其為零。16均方誤差的定義為:16通過線性方程組求出預測系數(shù)ai就得到n-1線性方程組,解系數(shù)。17通過線性方程組求出預測系數(shù)ai就得到n-1線性方程組,解斜率過載當預測誤差值很大(圖像邊界),而量化器的量化輸出不夠大時,出現(xiàn)斜率過載,使邊界變模糊。 DPCM線性預測系統(tǒng),較為常見的噪聲18斜率過載DPCM線性預測系統(tǒng),較為常見的噪聲18顆粒噪聲 在圖像灰度平坦區(qū)域(人的面部或背景),預測誤差絕對值較小,而量化器的輸出絕對值不夠小,將預測誤差擴大化,使量化輸出忽正忽負,出現(xiàn)粒狀斑點。

19顆粒噪聲19假輪廓噪聲 對于圖像中平滑上升或平滑下降區(qū)域,預測誤差絕對值很小,但經(jīng)過量化器后,由于量化器的步距較大,將差值擴大,使平滑區(qū)域變成一個個臺階,形成假輪廓噪聲。

2020邊沿繁忙 不同幀之間在同一像素位置產(chǎn)生的量化誤差各不相同,使邊緣處看到不斷閃爍變化的忙亂現(xiàn)象。21邊沿繁忙21ADPCM自適應預測編碼這種編碼方法中,量化器的步長和預測器的參數(shù)均能根據(jù)圖象的局部特征作自適應的調(diào)整。22ADPCM自適應預測編碼這種編碼方法中,量化器的已知三階預測器:設量化器最大輸出為emax,最小輸出為emin,某一個預測誤差的量化輸出為e′23已知三階預測器:設量化器最大輸出為emax,最小輸出為emi當不變 自動增大 自動減小24當不變244.幀間預測編碼幀間編碼技術處理的對象是序列圖像(也稱為運動圖像)。隨著大規(guī)模集成電路的迅速發(fā)展,已有可能把幾幀的圖像存儲起來作實時處理,利用幀間的時間相關性進一步消除圖像信號的冗余度,提高壓縮比。幀間編碼的技術基礎是預測技術。254.幀間預測編碼幀間編碼技術處理的對象是序列圖像(也稱為運動ONMLUKJIQPABCDEFGHRSTZ當前場的像素前一場的像素前一幀的像素圖4.19

幀間預測像素位置示意圖若最小,則用同一場同一掃描行上的前一個像素H最小,則用同一場上一掃描行上的像素B最小,則上一幀對應位置像素M(1)幀間預測26ONMLUKJIQPABCDEFGHRSTZ當前場的像素前一(1)條件傳送和內(nèi)插條件傳送:設置一個閾值“T”,對于幀間對應位置像素的亮度或色差信號值,大于T值傳送,小于T值者不傳送。一幀電視畫面,只傳送其中一部分活動比較明顯像素的幀間差值信號,可以有效降低傳輸比特率。這種傳送方式,稱為條件傳送。27(1)條件傳送和內(nèi)插條件傳送:設置一個閾值“T”,對于幀間(1)條件傳送和內(nèi)插內(nèi)插方法:當幀內(nèi)像素的空間分辨率降低時,如果采樣頻率降低一倍,那么對于未采樣像素的亮度或色差信號值,可用內(nèi)插(插補)方法補充。28(1)條件傳送和內(nèi)插28(1)條件傳送和內(nèi)插內(nèi)插方法舉例:fi-1圖4.17同一掃描行上像素插補fifi+129(1)條件傳送和內(nèi)插內(nèi)插方法舉例:fi-1圖4.17(1)條件傳送和內(nèi)插內(nèi)插方法舉例:fCfifAfBfD4.18隔場鄰近點像素插補30(1)條件傳送和內(nèi)插內(nèi)插方法舉例:fCfifAfBfD4.

3.運動補償

近幾年運動補償技術(MotionCompensation)十分活躍。在H.261,MPEG標準編碼中都用到這個技術。313.運動補償31

運動估計有下述三種方法:

(1)塊匹配法

(BlockMatchingAlgorithmBMA)(2)像素遞歸法

(PixelRecursiveAlgorithmPRA)(3)傅立葉變換法。32運動估計有下述三種方法:32塊匹配法圖4.19塊匹配位移估計算法33塊匹配法圖4.19塊匹配位移估計算法33塊匹配法假定當前幀中的一個M×N子塊是從第k—Ns幀平行移動而來,并設M×N子塊內(nèi)所有像素都具有同一個位移值(i,j)。假定運動物體在Ns幀差時間內(nèi)水平和垂直最大位移均為L,這樣我們可以在第k—Ns幀搜索區(qū)SR內(nèi)進行搜索,這里SR搜索區(qū)為(M+2L,N+2L)34塊匹配法假定當前幀中的一個M×N子塊是從第k—Ns幀平行移動匹配算法歸一化相關函數(shù)NCCF均方誤差MSE幀間絕對差MAD35匹配算法歸一化相關函數(shù)NCCF35計算兩幀中子塊的相關函數(shù)

當NCCF相關函數(shù)最大時,i,j就被定為子塊的水平和垂直的偏移值,但此式計算量大.36計算兩幀中子塊的相關函數(shù)36MSE是均方誤差,MAD是絕對差

取MES或MAD最小時的i,j值就是水平和垂直的偏移量。37MSE是均方誤差,MAD是絕對差37搜索方法窮盡搜索法二維對數(shù)法(TDL)三步搜索法(TTS)38搜索方法窮盡搜索法38取MAD最小值,新得到的i,j就是水平和垂直的偏移量。窮盡搜索法窮盡搜索法39取MAD最小值,新得到的i,j就是水平和垂直的偏移量。窮盡搜二維對數(shù)法(TDL)此算法用MSE均方誤差作為匹配準則,并在搜索窗口中用沿著最小誤差方向執(zhí)行對數(shù)二維搜索過程。40二維對數(shù)法(TDL)此算法用MSE均方誤差作為匹配40(1)5個初始點如圖所示取MSE為最小點,如(2)下一步搜索三個新位置,如最小誤差位置同前,如(3)步長除以2,并搜索圍繞次最小誤差的9個(3*3)點如41(1)5個初始點如圖所示取MSE為最小點,如三步搜索法(TTS)此搜索過程是一個由粗到細的過程,每一步搜索9個點,用MSE度量,找到最小搜索步長減半再搜索,共25個點。

三步搜索法42三步搜索法(TTS)此搜索過程是一個由粗到細的過程,每預測編碼小結重點掌握:預測編碼的基本思想預測編碼的分類ADPCM編碼方法中自適應系數(shù)m的變化條件43預測編碼小結重點掌握:43

多媒體技術基礎及應用呂小星副教授北京廣播電視大學理工教學部E-Mail:lvxx@Tel:621236482007.944多媒體技術基礎及應用呂小星副教授44第4章多媒體數(shù)據(jù)壓縮編碼技術本章講課思路:靜態(tài)圖像壓縮編碼的國際標準(JPEG)變換編碼統(tǒng)計編碼預測編碼數(shù)據(jù)壓縮的基本概念45第4章多媒體數(shù)據(jù)壓縮編碼技術本章講課思路:靜態(tài)圖像壓縮編碼第二部分

(三)變換編碼46第二部分

(三)變換編碼461.什么叫數(shù)據(jù)壓縮?定義(1):數(shù)據(jù)壓縮就是以最少的數(shù)碼表示信源所發(fā)的信號,減少容納給定消息集合或數(shù)據(jù)采樣集合的信號空間。

4.5變換編碼471.什么叫數(shù)據(jù)壓縮?4.5變換編碼47第四章多媒體數(shù)據(jù)壓縮編碼技術4.1數(shù)據(jù)壓縮編碼的重要性和分類4.2預測編碼4.3變換編碼4.4統(tǒng)計編碼4.5數(shù)據(jù)壓縮編碼的國際標準48第四章多媒體數(shù)據(jù)壓縮編碼技術4.1數(shù)據(jù)壓縮編碼的1、變換編碼的特點利用預測編碼可以去除圖象數(shù)據(jù)的時間和空間的冗余。它的優(yōu)點是直觀、簡捷、易于實現(xiàn),特別是用于硬件實現(xiàn)。但壓縮能力有限,DPCM一般只能壓縮到2~4bit/像素。491、變換編碼的特點利用預測編碼可以去除1、變換編碼的特點變換編碼是進行一種函數(shù)變換,映射變換從信號域變換到另一個信號域。501、變換編碼的特點變換編碼是進行一種函數(shù)例:有兩個相鄰采樣值X1和X2,每一采樣值用3bit編碼,因此有8個幅度等級,兩個為:8×8=64種。y2x2y1x151例:有兩個相鄰采樣值X1和X2,每一采變換編碼的系統(tǒng)構成信源序列變換變換域采樣量化編碼存儲和傳輸解碼反變換再現(xiàn)序列52變換編碼的系統(tǒng)構成信源序列變換變換域采樣量化編碼存儲和傳輸解2、K-L變換(Karhunen—Loeve)它是以統(tǒng)計特性為基礎的,也稱為特征向量變換。最優(yōu)的正交變換:特征向量矩陣向量指向數(shù)據(jù)變化最大的方向。缺點:計算過程復雜,變換速度慢。532、K-L變換(Karhunen—Loeve)它是以統(tǒng)計一、Y向量的平均向量為0,直流分量為0。二、Y的協(xié)方差矩陣協(xié)方差等于0方差對角線按減序排列K-L變換是最佳變換54一、Y向量的平均向量為0,直流分量為0。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論