第五章 補(bǔ)充 常用壓縮編碼方法_第1頁(yè)
第五章 補(bǔ)充 常用壓縮編碼方法_第2頁(yè)
第五章 補(bǔ)充 常用壓縮編碼方法_第3頁(yè)
第五章 補(bǔ)充 常用壓縮編碼方法_第4頁(yè)
第五章 補(bǔ)充 常用壓縮編碼方法_第5頁(yè)
已閱讀5頁(yè),還剩59頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、常用壓縮編碼方法常用壓縮編碼方法2009.03.16統(tǒng)計(jì)編碼:屬于無(wú)失真編碼。根據(jù)信源符號(hào)出現(xiàn)概率的分布特性進(jìn)行編碼,讓概率大的信源符號(hào)用短碼字表示,讓概率小的信源符號(hào)用長(zhǎng)碼字表示,從而去除數(shù)據(jù)之間的冗余而達(dá)到壓縮的目的。預(yù)測(cè)編碼:根據(jù)離散信號(hào)之間存在一定的相關(guān)性特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。 變換編碼:屬于有失真的編碼。變換編碼是將原始數(shù)據(jù)從初始空間或時(shí)間域進(jìn)行數(shù)學(xué)變換,變換為更適合于壓縮的抽象域。關(guān)鍵的是要尋找一個(gè)最佳變換,使信息中最重要的部分易于識(shí)別。變換本身是可逆的無(wú)損的,為了取得更好的效果,忽略了一些編碼位數(shù)較長(zhǎng)的系數(shù)而成為了

2、有損編碼。 變換域有一定的物理意義,其系數(shù)包含信號(hào)的某些成分,根據(jù)需要做刪除,達(dá)到壓縮目的。分析/合成編碼:是基于某種模型的編碼方法,這些模型可以是聲道模型、語(yǔ)音模型、人體模型等。通過(guò)分析模型的具體特征,確定與之匹配的編碼。 其他編碼方法常見的有:其他編碼方法常見的有:混合編碼(混合編碼(Hybrid CodingHybrid Coding)、)、矢量量化(矢量量化(Vector QuantizeVector Quantize,VQVQ)、)、LZWLZW算法等。算法等。 人工神經(jīng)元網(wǎng)絡(luò)(人工神經(jīng)元網(wǎng)絡(luò)(Artificial Neural NetworkArtificial Neural Ne

3、twork,ANNANN)算法、)算法、分形(分形(FractalFractal)算法、小波()算法、小波(WaveletWavelet)算法)算法、基于對(duì)象(基于對(duì)象(Object-BasedObject-Based)的算法、)的算法、基于模型(基于模型(Model-BasedModel-Based)的算法等。)的算法等。 數(shù)據(jù)壓縮的性能指標(biāo)數(shù)據(jù)壓縮的性能指標(biāo) 衡量一種數(shù)據(jù)壓縮技術(shù)的重要性能指標(biāo)有壓縮比、衡量一種數(shù)據(jù)壓縮技術(shù)的重要性能指標(biāo)有壓縮比、壓縮速度、壓縮質(zhì)量和計(jì)算量。壓縮速度、壓縮質(zhì)量和計(jì)算量。 壓縮比壓縮比 壓縮比是指原始數(shù)據(jù)量和壓縮后數(shù)據(jù)量的比值。壓縮比是指原始數(shù)據(jù)量和壓縮后數(shù)據(jù)

4、量的比值。例如,例如,MPGEMPGE是一種包含音頻和圖像在內(nèi)的壓縮技術(shù),利用是一種包含音頻和圖像在內(nèi)的壓縮技術(shù),利用MPEG-1MPEG-1、MPEG-2MPEG-2、MPEG-4MPEG-4三個(gè)方案,三個(gè)方案,對(duì)音頻的感知編碼中,對(duì)音頻的感知編碼中,MPEG-1MPEG-1方案的音頻壓縮比是方案的音頻壓縮比是1:41:4,MPEG-2MPEG-2方案的音頻壓縮方案的音頻壓縮比是比是1:61:61:8 1:8 ,MPEG-4MPEG-4方案的音頻壓縮比是方案的音頻壓縮比是1:101:101:12 1:12 。但是但是MPEGMPEG對(duì)圖像的壓縮算法,所提供的壓縮比可以高達(dá)對(duì)圖像的壓縮算法,所

5、提供的壓縮比可以高達(dá)200:1200:1。利用。利用JPEGJPEG也可以有多種圖像的壓縮比,甚至可以也可以有多種圖像的壓縮比,甚至可以減小到原圖像的百分之一(壓縮比減小到原圖像的百分之一(壓縮比100:1100:1)。)。 壓縮速度壓縮速度壓縮速度指編碼或解碼的快慢程度。不同的應(yīng)用場(chǎng)合,對(duì)壓縮速度要求是不同的。對(duì)于一個(gè)壓縮系統(tǒng)而言,有對(duì)稱壓縮和非對(duì)稱壓縮之分。 對(duì)稱壓縮,就是壓縮和解壓縮都需要實(shí)時(shí)進(jìn)行的。例如:電視會(huì)議的圖形傳輸。 非對(duì)稱壓縮常常在解壓縮方面要求是實(shí)時(shí)的,但壓縮可以不是實(shí)時(shí)的。例如,多媒體CD-ROM的制作過(guò)程可以不是實(shí)時(shí)的,但解壓縮必須是實(shí)時(shí)的,否則用戶看到的就不是連續(xù)的圖

6、像。 壓縮質(zhì)量壓縮質(zhì)量 壓縮質(zhì)量是指壓縮以后對(duì)媒體的感知效果壓縮質(zhì)量是指壓縮以后對(duì)媒體的感知效果。有損壓縮才可能影響人對(duì)媒體的感知效果。壓縮質(zhì)量的好壞與壓縮質(zhì)量的好壞與壓縮算法壓縮算法、數(shù)據(jù)內(nèi)容數(shù)據(jù)內(nèi)容和和壓縮比壓縮比有密切的關(guān)系。有密切的關(guān)系。 例如,使用JPEG編碼時(shí),當(dāng)壓縮比為20:1時(shí),能看到圖像稍微有點(diǎn)變化,當(dāng)壓縮比大于20:1時(shí),一般圖像質(zhì)量開始變壞。統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼 統(tǒng)計(jì)編碼屬于一種無(wú)失真的編碼,具體實(shí)現(xiàn)的方統(tǒng)計(jì)編碼屬于一種無(wú)失真的編碼,具體實(shí)現(xiàn)的方法有多種,包括行程編碼、法有多種,包括行程編碼、 LZWLZW編碼、編碼、HuffmanHuffman編碼、算術(shù)編碼。編碼、算術(shù)編碼

7、。統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼又稱熵編碼。根據(jù)信息論的原理,我們可又稱熵編碼。根據(jù)信息論的原理,我們可以找到最佳的壓縮編碼方法,數(shù)據(jù)壓縮的理論極限以找到最佳的壓縮編碼方法,數(shù)據(jù)壓縮的理論極限是信息熵。也就是說(shuō),信息中可能存在著冗余信息,是信息熵。也就是說(shuō),信息中可能存在著冗余信息,要去除信息的冗余部分,使編碼后單位數(shù)據(jù)量等于要去除信息的冗余部分,使編碼后單位數(shù)據(jù)量等于其信息源的熵,就達(dá)到了壓縮極限。其信息源的熵,就達(dá)到了壓縮極限。 信息論認(rèn)為信源中存在的冗余度來(lái)自于信源本身信息論認(rèn)為信源中存在的冗余度來(lái)自于信源本身的相關(guān)性和信源概率分布的不均勻性。的相關(guān)性和信源概率分布的不均勻性。熵編碼要熵編碼要解決的問(wèn)

8、題,是如何利用信息熵理論減少數(shù)據(jù)在解決的問(wèn)題,是如何利用信息熵理論減少數(shù)據(jù)在存儲(chǔ)和傳輸中的冗余度存儲(chǔ)和傳輸中的冗余度, ,即即要找到去除信源的相關(guān)要找到去除信源的相關(guān)性和概率分布的不均勻性的方法。性和概率分布的不均勻性的方法。 預(yù)測(cè)編碼 常用的解除相關(guān)性的措施:預(yù)測(cè)和變換 預(yù)測(cè)有可能完全解決序列的相關(guān)性,但必須知道序列的概率統(tǒng)計(jì)特性 變換只能解除矢量?jī)?nèi)部的相關(guān)性,它可以有許多變換方式以適應(yīng)不同的信源。預(yù)測(cè)編碼預(yù)測(cè)編碼 預(yù)測(cè)編碼是一種有失真的編碼,預(yù)測(cè)編碼是一種有失真的編碼,DPCMDPCM編碼和編碼和ADPCMADPCM編碼是兩種較典型的預(yù)測(cè)編碼,它們比較適用于編碼是兩種較典型的預(yù)測(cè)編碼,它們

9、比較適用于聲音和圖像數(shù)據(jù)的壓縮。聲音和圖像數(shù)據(jù)的壓縮。 預(yù)測(cè)編碼預(yù)測(cè)編碼 預(yù)測(cè)編碼預(yù)測(cè)編碼是根據(jù)離散信號(hào)之間存在一定的相關(guān)性的是根據(jù)離散信號(hào)之間存在一定的相關(guān)性的特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差值進(jìn)行編碼。預(yù)測(cè)編碼根據(jù)預(yù)測(cè)器的設(shè)計(jì)分為線性預(yù)測(cè)和非線性預(yù)測(cè)編碼根據(jù)預(yù)測(cè)器的設(shè)計(jì)分為線性預(yù)測(cè)和非線性預(yù)測(cè)。但為了預(yù)測(cè)的效率,大多采用線性預(yù)測(cè)。預(yù)測(cè)。但為了預(yù)測(cè)的效率,大多采用線性預(yù)測(cè)。 預(yù)測(cè)編碼非常適用于聲音和圖像方面的壓縮。對(duì)預(yù)測(cè)編碼非常適用于聲音和圖像方面的壓縮。對(duì)于聲

10、音來(lái)講,預(yù)測(cè)的對(duì)象是聲波的下一個(gè)幅度、于聲音來(lái)講,預(yù)測(cè)的對(duì)象是聲波的下一個(gè)幅度、下一個(gè)音色。對(duì)于圖像而言,預(yù)測(cè)的對(duì)象是下一下一個(gè)音色。對(duì)于圖像而言,預(yù)測(cè)的對(duì)象是下一個(gè)像點(diǎn)、下一條線或下一幀。聲音和圖像中通常個(gè)像點(diǎn)、下一條線或下一幀。聲音和圖像中通常都存在冗余的信號(hào),而且在相鄰的音色或相鄰像都存在冗余的信號(hào),而且在相鄰的音色或相鄰像點(diǎn)之間的相關(guān)性比較強(qiáng),它們的差值比較小,這點(diǎn)之間的相關(guān)性比較強(qiáng),它們的差值比較小,這樣任何音色或像點(diǎn)都可以通過(guò)已知樣本值進(jìn)行預(yù)樣任何音色或像點(diǎn)都可以通過(guò)已知樣本值進(jìn)行預(yù)測(cè)。對(duì)于連續(xù)的多幀圖像,上下幀通常具有一些測(cè)。對(duì)于連續(xù)的多幀圖像,上下幀通常具有一些相同的部分內(nèi)容,

11、如背景和靜止的物體,可以預(yù)相同的部分內(nèi)容,如背景和靜止的物體,可以預(yù)計(jì)在一定的時(shí)間內(nèi)將不會(huì)發(fā)生變化。主要對(duì)其差計(jì)在一定的時(shí)間內(nèi)將不會(huì)發(fā)生變化。主要對(duì)其差值進(jìn)行編碼,可以達(dá)到壓縮的目的。值進(jìn)行編碼,可以達(dá)到壓縮的目的。 預(yù)測(cè)編碼時(shí)首先要存儲(chǔ)的是當(dāng)前內(nèi)容,接著以把預(yù)測(cè)編碼時(shí)首先要存儲(chǔ)的是當(dāng)前內(nèi)容,接著以把當(dāng)前內(nèi)容作為樣板,預(yù)測(cè)下一個(gè)信號(hào),將預(yù)測(cè)所當(dāng)前內(nèi)容作為樣板,預(yù)測(cè)下一個(gè)信號(hào),將預(yù)測(cè)所得的不同內(nèi)容進(jìn)行存儲(chǔ)或傳輸,如內(nèi)容相同則是得的不同內(nèi)容進(jìn)行存儲(chǔ)或傳輸,如內(nèi)容相同則是數(shù)據(jù)冗余,予以剔除。這樣數(shù)據(jù)量將會(huì)大幅度減數(shù)據(jù)冗余,予以剔除。這樣數(shù)據(jù)量將會(huì)大幅度減少,達(dá)到壓縮效果。少,達(dá)到壓縮效果。 預(yù)測(cè)編碼

12、常見的方法有預(yù)測(cè)編碼常見的方法有DPCMDPCM、ADPCMADPCM、MM、MM調(diào)制編碼。預(yù)測(cè)編碼主要采用壓縮圖像數(shù)據(jù)的調(diào)制編碼。預(yù)測(cè)編碼主要采用壓縮圖像數(shù)據(jù)的空間冗余和時(shí)間冗余的方法,簡(jiǎn)捷且易于實(shí)現(xiàn),但空間冗余和時(shí)間冗余的方法,簡(jiǎn)捷且易于實(shí)現(xiàn),但要求數(shù)據(jù)傳輸速度很高。另外,預(yù)測(cè)編碼方法的壓要求數(shù)據(jù)傳輸速度很高。另外,預(yù)測(cè)編碼方法的壓縮能力有限。為了進(jìn)一步提高數(shù)據(jù)壓縮的能力,可縮能力有限。為了進(jìn)一步提高數(shù)據(jù)壓縮的能力,可采用其它編碼方法,例如變換編碼。采用其它編碼方法,例如變換編碼。 差分脈沖編碼(差分脈沖編碼(DPCM)DPCM)的抽樣速率通常是與的抽樣速率通常是與PCMPCM相同,相同,

13、因此在編碼器中的帶限濾波器和解碼器中的平滑濾波因此在編碼器中的帶限濾波器和解碼器中的平滑濾波器基本上與器基本上與PCMPCM系統(tǒng)中的濾波器是一樣的,但是它不是系統(tǒng)中的濾波器是一樣的,但是它不是對(duì)每個(gè)采樣值進(jìn)行量化的,而是根據(jù)前一個(gè)樣值預(yù)測(cè)對(duì)每個(gè)采樣值進(jìn)行量化的,而是根據(jù)前一個(gè)樣值預(yù)測(cè)下一個(gè)樣值,并量化實(shí)際值和預(yù)測(cè)值之間的差值。差下一個(gè)樣值,并量化實(shí)際值和預(yù)測(cè)值之間的差值。差分脈沖編碼的基本原理如下,在發(fā)送端輸入的采樣信分脈沖編碼的基本原理如下,在發(fā)送端輸入的采樣信號(hào),經(jīng)量化器后傳送到編碼器,號(hào),經(jīng)量化器后傳送到編碼器, DPCMDPCM編碼器將產(chǎn)生不編碼器將產(chǎn)生不同抽樣值,簡(jiǎn)單的抽樣方法就是將

14、前一個(gè)輸入抽樣直同抽樣值,簡(jiǎn)單的抽樣方法就是將前一個(gè)輸入抽樣直接存儲(chǔ)在抽樣保持電路中,并使用模擬減法器來(lái)測(cè)試接存儲(chǔ)在抽樣保持電路中,并使用模擬減法器來(lái)測(cè)試抽樣有無(wú)變化。如果信號(hào)有變化,則差值被量化、被抽樣有無(wú)變化。如果信號(hào)有變化,則差值被量化、被編碼和傳輸。編碼和傳輸。 差分脈沖編碼的基本原理差分脈沖編碼的基本原理 量化器預(yù)測(cè)器XnEnEnXnXnqnqn恰好就是發(fā)送端的量化誤差。所以,恰好就是發(fā)送端的量化誤差。所以,DCPMDCPM系統(tǒng)系統(tǒng)中,量化器和預(yù)測(cè)器的設(shè)計(jì)是關(guān)鍵,好的預(yù)測(cè)器中,量化器和預(yù)測(cè)器的設(shè)計(jì)是關(guān)鍵,好的預(yù)測(cè)器編碼應(yīng)能根據(jù)信號(hào)的局部特性,調(diào)整量化器的步編碼應(yīng)能根據(jù)信號(hào)的局部特性,

15、調(diào)整量化器的步長(zhǎng)和預(yù)測(cè)器的參數(shù),使得許多預(yù)測(cè)值和實(shí)際值之長(zhǎng)和預(yù)測(cè)器的參數(shù),使得許多預(yù)測(cè)值和實(shí)際值之間差值為最小。間差值為最小。在接收端,經(jīng)過(guò)和發(fā)信端的預(yù)測(cè)完全相同的操作,在接收端,經(jīng)過(guò)和發(fā)信端的預(yù)測(cè)完全相同的操作,可以得到量化的原信號(hào),然后再通過(guò)低通濾波便可以得到量化的原信號(hào),然后再通過(guò)低通濾波便可恢復(fù)與原信號(hào)近似的波形??苫謴?fù)與原信號(hào)近似的波形。ADPCMADPCM編碼編碼 ADPCMADPCM自適應(yīng)差分編碼,它具有自適應(yīng)編碼的特自適應(yīng)差分編碼,它具有自適應(yīng)編碼的特性,該編碼包括自適應(yīng)量化和自適應(yīng)預(yù)測(cè)兩種性,該編碼包括自適應(yīng)量化和自適應(yīng)預(yù)測(cè)兩種形式。形式。ADPCMADPCM編碼的方法是針對(duì)

16、輸入樣值進(jìn)行自編碼的方法是針對(duì)輸入樣值進(jìn)行自適應(yīng)預(yù)測(cè),然后對(duì)預(yù)測(cè)誤差進(jìn)行量化編碼。適應(yīng)預(yù)測(cè),然后對(duì)預(yù)測(cè)誤差進(jìn)行量化編碼。 綜合了綜合了APCMAPCM的自適應(yīng)特性和的自適應(yīng)特性和DPCMDPCM系統(tǒng)的差分特性,系統(tǒng)的差分特性,是是一種性能比較好的波形編碼。一種性能比較好的波形編碼。它的核心想法是:它的核心想法是:利用自適應(yīng)的思想改變量化階的大小,即使用利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階小的量化階(step-size)(step-size)去編碼小的差值,使用去編碼小的差值,使用大的量化階去編碼大的差值大的量化階去編碼大的差值, ,使用過(guò)去的樣本使用過(guò)去的樣本值估算下一個(gè)輸入樣本

17、的預(yù)測(cè)值,使實(shí)際樣本值值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。和預(yù)測(cè)值之間的差值總是最小。ADPCMADPCM主要用于對(duì)中等質(zhì)量的音頻信號(hào)進(jìn)行高效主要用于對(duì)中等質(zhì)量的音頻信號(hào)進(jìn)行高效率壓縮。例如語(yǔ)音的壓縮、調(diào)幅廣播音質(zhì)的信號(hào)率壓縮。例如語(yǔ)音的壓縮、調(diào)幅廣播音質(zhì)的信號(hào)壓縮等。壓縮等。CCITTCCITT的的32kbit32kbits s語(yǔ)音編碼標(biāo)準(zhǔn)語(yǔ)音編碼標(biāo)準(zhǔn)G.721G.721采用采用ADPCMADPCM編碼方式,每個(gè)語(yǔ)音樣值相當(dāng)于用編碼方式,每個(gè)語(yǔ)音樣值相當(dāng)于用4 4個(gè)個(gè)二進(jìn)制位進(jìn)行編碼。二進(jìn)制位進(jìn)行編碼。 變換編碼變換編碼 變換編碼變換編碼是一種有失真編碼,所

18、謂變換主要是是一種有失真編碼,所謂變換主要是將原始數(shù)據(jù)的原來(lái)的時(shí)間或空間域進(jìn)行數(shù)學(xué)變將原始數(shù)據(jù)的原來(lái)的時(shí)間或空間域進(jìn)行數(shù)學(xué)變換,使得通過(guò)變換后能夠突出原始數(shù)據(jù)中的重?fù)Q,使得通過(guò)變換后能夠突出原始數(shù)據(jù)中的重要部分,以便重點(diǎn)處理。變換編碼中的較為典要部分,以便重點(diǎn)處理。變換編碼中的較為典型的是最佳變換(型的是最佳變換(K-LK-L變換)編碼和離散余弦變變換)編碼和離散余弦變換(換(DCTDCT)編碼,其中)編碼,其中K-LK-L變換是在均方誤差最變換是在均方誤差最小意義下導(dǎo)出的,其基向量是輸入數(shù)據(jù)向量協(xié)小意義下導(dǎo)出的,其基向量是輸入數(shù)據(jù)向量協(xié)方差矩陣的特征向量,這種變換矩陣將隨著輸方差矩陣的特征向

19、量,這種變換矩陣將隨著輸入數(shù)據(jù)的不同而不同,因此難于實(shí)現(xiàn)。入數(shù)據(jù)的不同而不同,因此難于實(shí)現(xiàn)。 圖像變換編碼不是直接對(duì)空間域圖像信號(hào)編碼,而圖像變換編碼不是直接對(duì)空間域圖像信號(hào)編碼,而是首先將當(dāng)前所表達(dá)的空間域圖像信號(hào)經(jīng)過(guò)變換映是首先將當(dāng)前所表達(dá)的空間域圖像信號(hào)經(jīng)過(guò)變換映射到另一個(gè)正交矢量空間,將得到一系列變換系數(shù),射到另一個(gè)正交矢量空間,將得到一系列變換系數(shù),然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。結(jié)果是重要的然后對(duì)這些變換系數(shù)進(jìn)行編碼處理。結(jié)果是重要的系數(shù)在變換到其他空間域后,其編碼的精確度高于系數(shù)在變換到其他空間域后,其編碼的精確度高于次重要的系數(shù)。變換本身是一種無(wú)損且可逆的技術(shù),次重要的系數(shù)。變

20、換本身是一種無(wú)損且可逆的技術(shù),為了能獲得更好的編碼效果,忽略了一些不重要的為了能獲得更好的編碼效果,忽略了一些不重要的系數(shù),由此成為了有損的技術(shù)。系數(shù),由此成為了有損的技術(shù)。 變換編碼原理如下。圖中,輸入信號(hào)經(jīng)過(guò)適當(dāng)?shù)恼儞Q編碼原理如下。圖中,輸入信號(hào)經(jīng)過(guò)適當(dāng)?shù)恼蛔儞Q到另一個(gè)頻域空間,相關(guān)性就會(huì)明顯減少,交變換到另一個(gè)頻域空間,相關(guān)性就會(huì)明顯減少,能量集中在頻域的少數(shù)低頻系數(shù)上,這樣就達(dá)到了能量集中在頻域的少數(shù)低頻系數(shù)上,這樣就達(dá)到了數(shù)據(jù)壓縮的效果。如果保留頻域中系數(shù)大的元素,數(shù)據(jù)壓縮的效果。如果保留頻域中系數(shù)大的元素,忽略小的系數(shù),然后輔以非線性量化來(lái)提高壓縮程忽略小的系數(shù),然后輔以非線性

21、量化來(lái)提高壓縮程度,最后進(jìn)行編碼,可獲得很高的壓縮比。度,最后進(jìn)行編碼,可獲得很高的壓縮比。 圖像傅立葉變換原圖像幅度譜相位譜圖像傅立葉變換原圖像幅度譜相位譜圖像傅立葉變換 幅度譜告訴我們圖像中某種頻率的成份有多少 相位譜告訴我們頻率成份位于圖像的什么位置 通常我們只關(guān)心幅度譜 下面兩個(gè)圖對(duì)應(yīng)的幅度譜是一樣(這里只顯示了其幅度譜,當(dāng)然相位譜是不一樣的)圖像傅立葉變換 從幅度譜中我們可以看出明亮線反映出原始圖像的灰度級(jí)變化,這正是圖像的輪廓邊圖像傅立葉變換 從幅度譜中我們可以看出明亮線和原始圖像中對(duì)應(yīng)的輪廓線是垂直的。如果原始圖像中有圓形區(qū)域那么幅度譜中也呈圓形分布圖像傅立葉變換 圖像中的顆粒狀

22、對(duì)應(yīng)的幅度譜呈環(huán)狀,但即使只有一顆顆粒,其幅度譜的模式還是這樣。圖像傅立葉變換 這些圖像沒(méi)有特定的結(jié)構(gòu),左上角到右下角有一條斜線,它可能是由帽子和頭發(fā)之間的邊線產(chǎn)生的 兩個(gè)圖像都存在一些小邊界圖像傅立葉變換 圖像發(fā)生旋轉(zhuǎn)時(shí),幅度譜也相應(yīng)的進(jìn)行了旋轉(zhuǎn)( , )( , ),( , )( , )f x yf rF u vF cos ,sin ,cos ,sinxryruv00 ( ,)( ,)f rF F圖像的K-L變換 K-L變換也叫霍特林(Hotelling)變換,是一種基于圖像統(tǒng)計(jì)特性的變換 K-L變換的協(xié)方差矩陣除對(duì)角線以外的元素都是零,消除了數(shù)據(jù)之間的相關(guān)性,從而在信息壓縮方面起著重要作用

23、。 K-L變換也稱分量分析(Primary Component Analysis, PCA)是圖像特征提取一種最優(yōu)正交線性變換,可以有效去掉一個(gè)隨機(jī)向量中各元素間的相關(guān)性。K-L變換編碼K-L變換編碼1PCA(主分量分析主分量分析/K-L)變換變換均值:均值:偏差:偏差:協(xié)方差矩陣:協(xié)方差矩陣:PCA變換:變換:PCA反變換:反變換:變換后均值為變換后均值為0,方差為:,方差為: ASIPP基于PCA方法特征臉空間的構(gòu)建 人臉識(shí)別就是將已檢測(cè)到的待識(shí)別人臉與數(shù)據(jù)庫(kù)中的已知人臉進(jìn)行比較匹配,得出相關(guān)信息,來(lái)鑒別該人是誰(shuí)。這一過(guò)程的核心是選擇恰當(dāng)?shù)娜四槺碚鞣绞脚c匹配策略,即選擇合適的人臉模式的特征

24、,根據(jù)所提取的特征進(jìn)行匹配。人臉特征表述人臉特征表述 ASIPP基于PCA方法特征臉空間的構(gòu)建 ORL標(biāo)準(zhǔn)人臉庫(kù)由40人,每人10幅11292圖像組成。這些圖像是拍攝于不同時(shí)期的;人的臉部表情和臉部細(xì)節(jié)有著不同程度的變化,比如,笑或不笑,眼睛或睜或閉,戴或不戴眼鏡;人臉姿態(tài)也有相當(dāng)程度的變化,深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)20度;人臉的尺度也有多達(dá)10的變化。ORL人臉庫(kù)人臉庫(kù)(英國(guó)劍橋大學(xué)英國(guó)劍橋大學(xué)) ASIPPPCA介紹介紹 基于PCA構(gòu)建特征臉空間是對(duì)圖像進(jìn)行K-L變換,以去除樣本間的相關(guān)性,然后根據(jù)特征值的大小選擇特征向量。這種方法首先將人臉圖像映射為高維空間的向量,然后應(yīng)用基于統(tǒng)計(jì)的離散K

25、-L變換方法,構(gòu)造一個(gè)各分量互不相關(guān)的特征空間,即特征臉空間,再將人臉圖像在高維空間中的向量映射到特征臉空間,得到特征系數(shù)?;赑CA方法特征臉空間的構(gòu)建 ASIPP特征值與特征圖像特征值與特征圖像 特征值ORL 20人 10幅 特征臉空間110201140 PCA構(gòu)建特征臉空間K-L 變換的應(yīng)用人臉識(shí)別圖像的離散余弦變換 DCT矩陣的左上角代表低頻分量,右下角代表高頻分量 由DCT域圖像我們能夠了解圖像主要包含低頻成份DCT域圖像域圖像空間域圖像空間域圖像DCT變換編碼DCT變換編碼DCT變換編碼DCT變換編碼DCT變換編碼DCT變換編碼DCT變換編碼DCT與與PCA的關(guān)系的關(guān)系其特征值為:

26、其特征值為:其特征向量為:其特征向量為:其根為:其根為:小波變換發(fā)展小波變換發(fā)展 1822年Fourier變換,在頻域的定位最準(zhǔn)確,無(wú)任何時(shí)域定位能力。 函數(shù),時(shí)域定位完全準(zhǔn)確,頻域無(wú)任何定位能力 1946年Gabor變換,STFT,窗函數(shù)的大小和形狀與時(shí)間和頻率無(wú)關(guān)而保持固定不變。不構(gòu)成正交基。 1980年Harr提出規(guī)范正交基。 1984年,Morlet提出了連續(xù)小波 1985年,Meyer,Grossmann,Daubecies提出離散的小波基 1986年,Meyer證明了不可能存在時(shí)域頻域同時(shí)具有正則性的正交小波基,證明了小波的自正交性。 1987年,Mallat統(tǒng)一了多分辨率分析和小波變換,給出了快速算法。 1988年,Daubecies在NSF的小波專題研討會(huì)進(jìn)行了講座。STFT STFT 與與 WaveletWavelet 應(yīng)用:應(yīng)用:將小波用于地震信號(hào)的分析與處理;將二進(jìn)小波變換用于圖像的邊緣檢測(cè)、圖像壓縮與重構(gòu);將連續(xù)小波變換用于渦流的研究;將小波變換用于噪聲中的未知瞬態(tài)信號(hào);將小波變換用于語(yǔ)音信號(hào)的分析、變換

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論