EBMA算法實現(xiàn)與運動矢量場量化_第1頁
EBMA算法實現(xiàn)與運動矢量場量化_第2頁
EBMA算法實現(xiàn)與運動矢量場量化_第3頁
EBMA算法實現(xiàn)與運動矢量場量化_第4頁
EBMA算法實現(xiàn)與運動矢量場量化_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、作業(yè)三EBMA 算法實現(xiàn)與運動矢量場量化一、實驗內(nèi)容用 Matlab 實現(xiàn) EBMA 算法,計算運動補償誤差;對所求得的運動場用矢量量化方法進(jìn) 行編碼,碼書大小可自己指定。二、實驗背景運動估計是現(xiàn)階段所有視頻編碼相關(guān)的國際標(biāo)準(zhǔn)中的關(guān)鍵技術(shù)。運動估計的基本思想是 盡可能準(zhǔn)確地獲得序列圖像幀間的運動位移,即運動矢量。因為運動估計越準(zhǔn)確,預(yù)測補償 的圖像質(zhì)量越高,補償?shù)臍埐罹驮叫?,補償編碼所需位數(shù)越少,需要傳輸?shù)谋忍芈示驮叫 ?利用得到的運動矢量在幀間進(jìn)行運動補償。補償殘差經(jīng)過變換、量化、編碼后與運動矢量一 起經(jīng)過熵編碼,然后以比特流形式發(fā)送出去。運動估計作為視頻編碼的關(guān)鍵技術(shù),需要解決 的問題是如

2、何提高它的估算速度和精度。運動估計法主要分兩大類:像素遞推法和塊匹配法。運動估計算法中,塊匹配算法因具 有簡單、實用的特點而得到廣泛應(yīng)用。全搜索算法是簡單也是效果最好的一種匹配算法,通過的全搜素匹配得到的結(jié)果是全局 最優(yōu)的,但由于計算量很大,我們在編解碼中往往不采用這種方法,而只把他作為與其他算 法的一種比較。為了兼顧估算精度和運算速度,我們提出了一系列的快速算法??焖偎惴ㄍ?過限制搜索位置的數(shù)目來減小計算復(fù)雜度,但不利于估計小的運動且搜索容易陷入局部最 優(yōu)。目前存在的快速運動估計算法中,早期的三步法(TSS)和二維對數(shù)法(TDL)、新三步法 (NTSS)、四步法(FSS)、基于菱形的搜索算法

3、(DS)和基于六邊形的搜索算法(HEXBS)等。三、實驗原理(一)、全搜索運動估計塊匹配運動估計把圖像幀劃分為若干互不重疊的塊,并以塊為單位尋找目標(biāo)幀中每塊在 參考幀(上一幀或者其它幀)中最優(yōu)匹配的塊的相對位置,這個相對位置稱為運動矢量而參 考塊和匹配塊的差稱為殘差因此在視頻編碼時不需要對整幅圖像進(jìn)行處理而只需要對運動 矢量和殘差進(jìn)行編碼這樣就可以在解碼端恢復(fù)參考塊的圖像從而達(dá)到了壓縮的目的。如下圖 所示,假設(shè)圖像中每塊的大小為MXN, dxmax為參考塊水平方向可搜索最大位移而dymax 為參考塊垂直方向可搜索最大位移那么基于塊匹配的運動估計就是在參考幀(或者其它上一幀)的(M+2dxmax

4、)X(N+2dymax)候選區(qū)搜索窗口中找到和目標(biāo)幀的當(dāng)前大小為MXN的塊 的最匹配的塊則參考塊的運動矢量可用如下的數(shù)學(xué)公式描述:MV =(VxyVy=(兀)IR(人(皿心仁(m+xtn + y) = Maxm e 0,M -1,丹 e 0:N 17 jc e -dx max,dx max - lTjp e -dymaxdy max -1R表示相關(guān)性評價函數(shù),f(m,n)表示目標(biāo)或當(dāng)前幀圖像的灰度值。滿足R為最大時的X、Y為運動矢量,用MV表示。塊匹配估計準(zhǔn)則是判斷塊相似程度的依據(jù),因此匹配準(zhǔn)則的好壞直接影響了運動估計的 精度;另一方面,匹配運算復(fù)雜度、數(shù)據(jù)讀取復(fù)雜度和內(nèi)存管理復(fù)雜度在很大程度

5、上取決于 所采用的塊匹配準(zhǔn)則。我們這里用到的塊匹配準(zhǔn)則是:平均絕對誤差函數(shù)(Mean of Absolute Error, MAE)M NMAD(x, V)=爲(wèi)工工憶(朋,川)- _i (朋十芯川十尹)m=l n=l有些文獻(xiàn)中 MAD 演變?yōu)榻^對差和:SAD(x. y) = MN MAD(x.y)M N二工工龐(稅用)啟(用十兀丿十y)m = w=l在上述匹配準(zhǔn)則中,由于 SAD 只采用了加法和絕對值計算,便于計算和硬件實現(xiàn)而且它的匹配精度與MAD相差不大。此外搜索精度還與塊的大小、搜索窗的大小、搜索步長有關(guān)。(二)、運動矢量場的量化編碼運動估計所得到的每個運動矢量包含兩個分量,包括水平分量x

6、和垂直分量y。每個錨 定幀所產(chǎn)生的所有運動矢量構(gòu)成運動矢量場,利用矢量量化方法,可以對運動矢量場進(jìn)行矢 量量化,其中量化維數(shù)為2,由水平分量和垂直分量組成。我們用每一場中的所有運動矢量 來訓(xùn)練矢量量化的碼書,以達(dá)到比較優(yōu)化的量化效果即總體失真較小。在具體量化運動矢量場時,我們可以將每個運動矢量的想x, y分量看成是二維空間上 的一個矢量f,由此我們可以將運動矢量場的量化問題抽象為二維空間的分割為L個區(qū)域, 并由具有代表性的點g來表示區(qū)域B中的所有點。我們將B稱為分割區(qū)域,g稱為重建矢l l l l量或碼字,包含所有碼字的集合C = g,l e L稱為碼書,量化函數(shù)可以描述為:Q( f)二 g,

7、 f e B一般的,一個矢量量化器由碼字g和分割區(qū)域B確定。使用最近鄰量化器,對于任何ll輸入矢量f,通過將此矢量與所有的碼字相比較,并且在距離測度d (f,g )條件下尋找與Nl它最接近的一個來確定量化矢量。分割區(qū)域可以通過下面的公式確定:B = f e Rn : d (f, g ) d (f, g), Vl豐 1lNlNl也最簡單的 VQ 量化器是均勻點陣量化器,所有的分割區(qū)域具有相同的形狀和大小,但 是當(dāng)信源不是均勻分布時,它可能不是最有效的。對于一個給定的 N 維矢量和信源概率密 度函數(shù),希望設(shè)計出一種最佳量化器,對于給定的碼書大小L,使得給定的失真準(zhǔn)則最小化。 理想情況下,應(yīng)當(dāng)同時確

8、定碼字g和分割區(qū)域B使得平均失真最小,然而最優(yōu)解難以找到。ll可以使用替代的方法,首先對給定的碼字g,分割區(qū)域B應(yīng)該使所有區(qū)域上平均失真最小,ll其次對于給定的分割區(qū)域B,碼字的選擇應(yīng)當(dāng)使該區(qū)域內(nèi)的失真最小。l在運動矢量場2維矢量量化實驗過程中分別使用了256大小的碼書,并且使用重構(gòu)后的 運動矢量場應(yīng)用于預(yù)測圖像的重構(gòu),并比較重構(gòu)圖像與原始圖像的PSNR值。四、實驗步驟具體實驗步驟如下:1、讀入圖像,對當(dāng)前幀分塊,這里塊的大小我們?nèi)?6*16;2、對在參考幀的搜索窗內(nèi)搜索并計算MAD值;3、比較各塊MAD值的大小,找到當(dāng)前塊在參考幀里對應(yīng)的最匹配塊(此塊對應(yīng)的MAD 值最小),并保存相應(yīng)的運動

9、矢量;4、接著用得到的運動場和參考圖估計當(dāng)前幀圖像,并計算補償殘差;5、對運動矢量的倆分量分別進(jìn)行矢量量化編碼(具體操作參見作業(yè)一)。五、實驗結(jié)果分析(一)、全搜索運動估計我們?nèi)∫曨l的第1 和第 3 幀進(jìn)行運動補償。實驗參數(shù)如下:塊大小16x16;搜索范圍dmax=7;搜索精度:1像素;視頻大小720*400。運動估計結(jié)果:參考幀預(yù)測圖像補償誤差運動矢量圖2520151050 5 10 15 20 25 30 35 40 45預(yù)測圖像補償誤差運動矢量圖2520151050 5 10 15 20 25 30 35 40 45(二)、運動矢量場的量化編碼實驗采用LBG算法獲取碼書設(shè)計,碼字大小為4X4的子像素塊,碼書大小為256。25編碼后運動矢量圖201510525編碼后運動矢量圖20151050 5 10 15 20 25 30 35 40 45編碼結(jié)果如下: 由預(yù)測圖和原圖對照可以看出:利用運動估計方法,可以大大減少時間軸上相鄰兩幀之 間的數(shù)據(jù)冗余,這樣在編碼后可以大大減少需要傳輸?shù)拇a流,提高編碼器的性能。實驗驗證了 EMBA、運動補償技術(shù)在視頻編解碼過程中的應(yīng)用,以及運動矢量的無損編 碼傳輸對于重構(gòu)圖像質(zhì)量的影響。所以準(zhǔn)確的運動估計,以及無損的運

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論