多媒體技術(shù)之dct_第1頁
多媒體技術(shù)之dct_第2頁
多媒體技術(shù)之dct_第3頁
多媒體技術(shù)之dct_第4頁
多媒體技術(shù)之dct_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

離散余弦變換1.一維DCT變換2/3/20231二維DCT變換(1)二維DCT變換公式 一個(gè)N×N像塊f(x,y)(x,y=0,1,…,N-1)的二維DCT定義為2/3/202324.5DCT變換編碼DCT變換的矩陣2/3/202334.5DCT變換編碼88DCT變換的矩陣2/3/202344.5DCT變換編碼88DCT變換的矩陣的頻譜特性2/3/202354.5DCT變換編碼44DCT變換的矩陣2/3/202364.5DCT變換編碼44DCT變換的矩陣的頻譜特性2/3/202374.5DCT變換編碼44和88DCT變換的多通道形式參考文獻(xiàn):ChenJiazhong,Gaoyi,SunWeiping.FlexiblePredictionBlockDecompositionwithMulti-ChannelFilterbanksforVideoCoding.IETJournalofImageProcessing.已錄用2/3/20238JPEG標(biāo)準(zhǔn)中88DCT變換的量化矩陣4.5DCT變換編碼2/3/20239JPEG標(biāo)準(zhǔn)中的變換和量化舉例4.5DCT變換編碼原始圖像信號(hào)2/3/202310JPEG標(biāo)準(zhǔn)中的變換和量化舉例4.5DCT變換編碼經(jīng)過變換的圖像信號(hào),也叫做變換系數(shù)2/3/202311JPEG標(biāo)準(zhǔn)中的變換和量化舉例4.5DCT變換編碼經(jīng)過量化的變換系數(shù)2/3/202312JPEG標(biāo)準(zhǔn)中的變換和量化舉例4.5DCT變換編碼經(jīng)過反量化的變換系數(shù)2/3/202313JPEG標(biāo)準(zhǔn)中的變換和量化舉例4.5DCT變換編碼經(jīng)過反變換得到的圖像重建信號(hào)2/3/202314原始信號(hào)和重建信號(hào)的比較4.5DCT變換編碼2/3/202315DCT的MATLAB實(shí)現(xiàn)

第一種方法是使用函數(shù)dct2,該函數(shù)使用一個(gè)基于FFT的快速算法來提高當(dāng)輸入較大的輸入方陣時(shí)的計(jì)算速度。dct2函數(shù)的調(diào)用格式如下:B=dct2(A,[MN])或

B=dct2(A,M,N)

其中,A表示要變換的圖像,M和N是可選參數(shù),表示填充后的圖像矩陣大小。B表示變換后得到的圖像矩陣。

2/3/202316DCT的MATLAB實(shí)現(xiàn)第二種方法使用由函數(shù)dctmtx返回的DCT變換矩陣,這種方法較適合于較小的輸入方陣(如或方陣)。dctmtx的調(diào)用格式如下:D=dctmtx(N)其中,N表示DCT變換矩陣的維數(shù),D為DCT變換矩陣。2/3/202317分塊DCT繼而利用blkproc函數(shù)完成分塊操作。blkproc函數(shù)的調(diào)用格式入下:

B=blkproc(A,[mn],fun,P1,P2,...)

其中A為原始信號(hào)矩陣,[mn]為分塊的大小,fun為對(duì)每一個(gè)分塊x的操作規(guī)則,Pi是fun中調(diào)用的參數(shù)。對(duì)圖像進(jìn)行8×8DCT分塊操作,得到的8×8分塊DCT系數(shù)矩陣如下圖。

2/3/202318K-L變換對(duì)于一般的線性變換Y=TX,如果變換矩陣T是正交矩陣,并且它是由原始圖像數(shù)據(jù)矩陣X的斜方差矩陣S的特征向量所組成,則此式的變換稱為K-L變換。這與我們以前介紹各種變換是不同的,它們的變換核是固定不變的。如JPEG中我們用的DCT變換,它的變換核是88DCT變換的矩陣。協(xié)方差是反映的變量之間的二階統(tǒng)計(jì)特性,如果隨機(jī)向量的不同分量之間的相關(guān)性很小,則所得的協(xié)方差矩陣幾乎是一個(gè)對(duì)角矩陣。2/3/202319也就是說,我們應(yīng)該設(shè)法將協(xié)方差矩陣的非對(duì)稱元素化為零元素,就是設(shè)法將協(xié)方差矩陣對(duì)角化。也就是將原始數(shù)據(jù)集合變換到主分量空間(Y)使單一數(shù)據(jù)樣本的互相關(guān)性降低到最低點(diǎn)。如何做???

2/3/202320線性代數(shù)證明,對(duì)于一個(gè)實(shí)對(duì)稱矩陣Σ(即ΣT=Σ)的矩陣,必存在一個(gè)正交矩陣Q,使得其中對(duì)角矩陣Λ中的λ1λ2…..λn是實(shí)對(duì)角矩陣Σ的N個(gè)特征根。這給我們一個(gè)重要啟示:2/3/202321通過正交變換能夠?qū)f(xié)方差矩陣(實(shí)對(duì)稱矩陣)對(duì)角化,從而消除圖像的相關(guān)性??!

向量X通過正交變換后的向量Y的協(xié)方差矩陣為λ的對(duì)角矩陣,說明向量X的分量間的相關(guān)性已被消除,即正交變換能消除存在相關(guān)性的冗余度,這是采用正交變換消除圖像相關(guān)性的一個(gè)數(shù)學(xué)依據(jù)。通過正交矩陣T對(duì)向量X作正交變換Y=TX2/3/202322一維K-L變換2/3/202323K-L變換2/3/202324K-L變換2/3/202325K-L變換示例2/3/2023262/3/2023272/3/202328圖像的K-L變換我們知道真彩色圖像在matlab中是按三維矩陣來存儲(chǔ)的,所以對(duì)真彩色圖像的K-L變換我們要想辦法從三維矩陣變成二維矩陣來處理。2/3/202329其中,m和n分別為波段數(shù)(或稱變量數(shù))和每幅圖像中的像元數(shù);矩陣中每一行矢量表示一個(gè)波段的圖像。

2/3/202330K-L變換的具體過程

第一步,根據(jù)原始圖像數(shù)據(jù)矩陣X,求出它的協(xié)方差矩陣S,X的協(xié)方差矩陣為:

(即為第i個(gè)波段的均值)Mf=[X1,X2……,Xm]T2/3/202331

第二步,求S矩陣的特征值λ和特征向量,并且成變換矩陣T??紤]特征方程:

式中,I為單位矩陣,U為特征向量。協(xié)方差矩陣為2/3/202332解上述的特征方程即可求出協(xié)方差矩陣S的各個(gè)特征值將其按

排列,求得各特征值對(duì)應(yīng)的單位特征向量(經(jīng)歸一化)Uj:2/3/202333若以各特征方量為列構(gòu)成矩陣,即U矩陣滿足:UTU=UUT=I(單位矩陣),則U矩陣是正交矩陣。

U矩陣的轉(zhuǎn)置矩陣即為所求的K-L變換的變換矩陣A。

有了變換矩陣A,將其代入2/3/2023342/3/202335經(jīng)過K-L變換后,得到一組(m個(gè))新的變量(即Y的各個(gè)行向量),它們依次被稱為第一主成分、第二主成分、…第m主成分。這時(shí)若將Y矩陣的各行恢復(fù)為二維圖像時(shí),即可以得到m個(gè)主成分圖像。K-L變換是一種線性變換,而且是當(dāng)取Y的前p(p<m)個(gè)主成分經(jīng)反變換而恢復(fù)的圖像和原圖像X在均方誤差最小意義上的最佳正交變換。2/3/202336K-L變換特點(diǎn)

(1)由于K-L變換是正交線性變換,所以變換前后的方差總和不變,變換只是把原來的方差不等量的再分配到新的主成分圖像中。

(2)第一主成分包含了總方差的絕大部分(一般在80%以上),其余各主成分的方差依次減小。

2/3/202337KL在matlab中的實(shí)現(xiàn)實(shí)例中要用到的函數(shù)reshape語法:

B=reshape(A,m,n)

按列優(yōu)先提取A中的m*n個(gè)元素,返回這m*n結(jié)構(gòu)的B矩陣。

A=[1,2,3;4,5,6;7,8,9,10,11,12]B=reshape(A,6,2)

2/3/202338mean函數(shù)mean函數(shù)是求均值,其調(diào)用格式為mean(x,dim)例:A=[123;336;468;477];mean(A)(默認(rèn)dim=1)就會(huì)求每一列的均值ans=3.00004.50006.0000用mean(A,2)就會(huì)求每一行的均值ans=2.00004.00006.00006.00002/3/202339eig函數(shù)MATLAB中使用函數(shù)eig計(jì)算特征值和特征矢量,有兩種調(diào)用方法:e=eig(a),其中e是包含特征值的矢量;[v,d]=eig(a),其中v是一個(gè)與a相同的n×n階矩陣,它的每一列是矩陣a的一個(gè)特征值所對(duì)應(yīng)的特征矢量,d為對(duì)角陣,其對(duì)角元素即為矩陣a的特征值。2/3/202340例:計(jì)算特征值和特征矢量。a=[34

25

15;18

35

9;41

21

9]e=eig(a)[v,d]=eig(a)e=

68.5066

15.5122

-6.0187v=

-0.6227

-0.4409

-0.3105

-0.4969

0.6786

-0.0717

-0.6044

-0.5875

0.9479d=

68.5066

0

0

0

15.5122

0

0

0

-6.01872/3/202341Matlab中給一維向量排序是使用sort函數(shù):sort(A),排序是按升序進(jìn)行的,其中A為待排序的向量;若欲保留排列前的索引,則可用[sA,index]=sort(A),排序后,sA是排序好的向量,index是向量sA中對(duì)A的索引。索引使排列逆運(yùn)算成為可能。

2/3/202342MATLAB函數(shù)flipud(X)表示把1*N矩陣元素逆序排列。diag函數(shù)diag(D)%取D陣的對(duì)角元

2/3/202343K-L變換的最大優(yōu)點(diǎn)是去相關(guān)性好,可用于數(shù)據(jù)壓縮和圖像旋轉(zhuǎn)主要困難是由于協(xié)方差矩陣CX求特征值λ和特征向量解方程的計(jì)算量大,同時(shí)K-L變換是非分離的,二維不可分,一般情況下,K-L變換沒有快速算法K-L變換優(yōu)缺點(diǎn)2/3/202344奇異值分解設(shè)K為矩陣A的秩,則通過奇異值分解,矩陣A可以被分成三個(gè)矩陣:其中矩陣U是左奇異矩陣,V是右奇異矩陣,S是對(duì)角矩陣,其對(duì)角元素是矩陣A的奇異值,且滿足s1≥s2≥…sK>0。在實(shí)際中一般保留前R個(gè)奇異值,從而達(dá)到降維去噪音的目的。

2/3/202345奇異值分解在matlab中的實(shí)現(xiàn)格式s=svd(X)%返回矩陣X的奇異值向量

[U,S,V]=svd(X)%返回一個(gè)與X同大小的對(duì)角矩陣S,兩個(gè)正交矩陣U和V,且滿足=U*S*V‘。若A為m×n陣,則U為m×m陣,V為n×n陣。奇異值在S的對(duì)角線上,非負(fù)且按降序排列。

[U,S,V]=svd(X,0)%得到一個(gè)“有效大小”的分解,只計(jì)算出矩陣U的前n

列,矩陣S的大小為n×n。2/3/202346K-L變換的具體過程如下:

第一步,根據(jù)原始圖像數(shù)據(jù)矩陣X,求出它的協(xié)方差矩陣S,X的協(xié)方差矩陣為:

式中:(即為第i個(gè)波段的均值)2/3/202347S是一個(gè)實(shí)對(duì)稱矩陣。

第二步,求S矩陣的特征值λ和特征向量,并且成變換矩陣T。考慮特征方程:

式中,I為單位矩陣,U為特征向量。2/3/202348解上述的特征方程即可求出協(xié)方差矩陣S的各個(gè)特征值將其按排列,求得各特征值對(duì)應(yīng)的單位特征向量(經(jīng)歸一化)Uj:2/3/202349若以各特征方量為列構(gòu)成矩陣,即U矩陣滿足:UTU=UUT=I(單位矩陣),則U矩陣是正交矩陣。

U矩陣的轉(zhuǎn)置矩陣即為所求的K-L變換的變換矩陣T。

有了變換矩陣T,將其代入Y=TX,則:2/3/202350式中Y矩陣的行向量為第j主成分。2/3/202351經(jīng)過K-L變換后,得到一組(m個(gè))新的變量(即Y的各個(gè)行向量),它們依次被稱為第一主成分、第二主成分、…第m主成分。這時(shí)若將Y矩陣的各行恢復(fù)為二維圖像時(shí),即可以得到m個(gè)主成分圖像。K-L變換是一種線性變換,而且是當(dāng)取Y的前p(p<m)個(gè)主成分經(jīng)反變換而恢復(fù)的圖像和原圖像X在均方誤差最小意義上的最佳正交變換。2/3/202352它具有以下性質(zhì)和特點(diǎn):

(1)由于K-L變換是正交線性變換,所以變換前后的方差總和不變,變換只是把原來的方差不等量的再分配到新的主成分圖像中。

(2)第一主成分包含了總方差的絕大部分(一般在80%以上),其余各主成分的方差依次減小。

2/3/202353K-L(Karhunen-Loeve)變換K-L(Karhunen-Loeve)變換也叫做主成分分析或主分量分析,是在統(tǒng)計(jì)特征基礎(chǔ)上的多維(如多波段)正交線性變換,它也是遙感數(shù)字圖像處理中最常用也是最有用的一種變換算法。

由于遙感圖像的不同波段之間往往存在著很高的相關(guān)性,從直觀上看,就是不同波段的圖像很相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論