第10章 圖像表示與描述教材_第1頁
第10章 圖像表示與描述教材_第2頁
第10章 圖像表示與描述教材_第3頁
第10章 圖像表示與描述教材_第4頁
第10章 圖像表示與描述教材_第5頁
已閱讀5頁,還剩115頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第10章圖像表示與描述計算機與信息工程學(xué)院教師:宋相法計算機與信息工程學(xué)院計算機系辦公地點:計算機大樓207室E-Mail:xiangfasong@163.com本章主要內(nèi)容10.1背景10.2顏色特征10.3紋理特征10.4邊界特征10.5區(qū)域特征10.6主成份特征10.7特征提取的應(yīng)用10.1背景數(shù)字圖像分析與理解是圖像處理的高級階段,它研究的是利用計算機分析和識別周圍物體的視覺圖像,從而得出結(jié)論性的判斷。但是,計算機不認識圖像,只認識數(shù)字,為了讓計算機系統(tǒng)識別人類視覺系統(tǒng)能夠認識的圖像,就必須分析圖像的特征,并將其特征用數(shù)學(xué)的方法描述,從而使計算機具有識別圖像的能力,即圖像識別。10.1背景在識別過程中,對獲得的圖像直接進行識別是不現(xiàn)實的。原因在于:首先,圖像的數(shù)據(jù)量大,占用較大的存儲空間,難以滿足實時性要求;其次,圖像中包含有許多與識別無關(guān)的信息,需要進行特征的提取與選擇。進行特征的提取與選擇后,就能對被識別的圖像數(shù)據(jù)進行大量簡化,有利于圖像識別。因此,圖像的特征提取與特征選擇是圖像分析與識別的關(guān)鍵因素之一。10.1背景特征是通過測量或處理能夠抽取的數(shù)據(jù),圖像特征是指某一幅或一類圖像區(qū)別于其他圖像的本質(zhì)特點或特性。圖像特征有些是視覺直接感受到的自然特征,例如區(qū)域的亮度、邊緣的輪廓、紋理、色彩等;有些是需要通過變換或測量才能得到的人為特征,如直方圖、變換頻譜等。10.1背景當對形狀特征感興趣時,可以選擇外部表示;當注意力集中于區(qū)域?qū)傩詴r,可以選擇內(nèi)部表示,比如顏色和紋理。通常情況下,將圖像的多種特征組合在一起,形成一個n維特征向量來表示該圖像。該n維特征向量就是一個位于n維空間中的點,而圖像識別的任務(wù)就是找到對這個n維空間的一種劃分,使該類圖像與其他類圖像在空間上分開。10.1背景特征選擇和提取的基本任務(wù)是從眾多特征中找到最有效的特征。一幅圖像的特征有很多種類,每一種類又有多種不同的表示和描述方法。因此需要對特征進行選擇,選擇的特征不僅要能夠很好地描述圖像,更重要的是能夠很好地區(qū)分不同類別的圖像。我們希望選擇那些在同類圖像之間差別較?。ㄝ^小的類內(nèi)距),在不同類別的圖像之間差異較大(較大的類間距)的圖像特征。10.2顏色特征顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點的特征,所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻。顏色特征是圖像檢索和識別應(yīng)用中最為廣泛的視覺特征,與其他視覺特征相比,它對圖像的尺寸、方向、視角的依賴性較弱,因此,具有較高的穩(wěn)定性。10.2顏色特征灰度特征

圖像灰度特征可以在圖像的某些特定的像素點上或其鄰域內(nèi)測定,也可以在某個區(qū)域內(nèi)測定。以(i,j)為中心的(2M+1)×(2N+1)鄰域內(nèi)的平均灰度為:

除了灰度均值之外,在有些情況下,還可能要用到區(qū)域中的灰度最大值、最小值、中值、方差等。10.2顏色特征灰度特征【例1】如下圖所示,將圖像分成四個相等的方塊,計算左上角方塊的灰度均值,并計算整幅圖像像素灰度值的最大值和最小值。計算結(jié)果為:圖像左上角區(qū)域灰度平均值avg=124.4200,整幅圖像區(qū)域最大灰度值maxg=248,整幅圖像區(qū)域最小灰度值ming=22。

10.2顏色特征直方圖特征設(shè)圖像f的像素總數(shù)為n,灰度等級數(shù)為L,灰度為k的像素全圖共有nk個,那么:

hk稱為f的灰度直方圖。彩色圖像可以定義為它的各個顏色分量的直方圖。如果是RGB模型,可以分別計算R、G、B分量的直方圖;如果是HSI模型,可以分別計算H、S、I分量的直方圖。10.2顏色特征直方圖特征圖像灰度直方圖可以認為是圖像灰度概率密度的估計,可以由直方圖產(chǎn)生下列特征。(1)平均值:(2)方差:(3)能量:(4)熵:10.2顏色特征平均值avh=125.0509能量enh=0.0063熵enth=7.4480方差vah=2.2913e+03平均值avh=119.3140能量enh=0.0101熵enth=7.0480方差vah=3.8435e+03直方圖特征【例2】計算下列圖像的直方圖的有關(guān)特征。10.2顏色特征顏色矩圖像中任何顏色的分布均可以用它的矩來表示,顏色矩可以直接在RGB空間計算。由于顏色分布信息主要集中在低階矩,因此,僅采用顏色的一階矩、二階矩和三階矩就足以表達圖像的顏色分布。10.2顏色特征顏色矩

上述三種顏色矩的定義分別為:其中,pij是第i個顏色分量的第j個像素的值,n是圖像的像素點的個數(shù)。事實上,一階矩定義了每個顏色分量的平均值,二階矩和三階矩分別定義了顏色分量的方差和偏斜度。10.3紋理特征紋理是圖像描述的重要內(nèi)容,紋理特征描述圖像或圖像區(qū)域所對應(yīng)景物的表面性質(zhì)。類似于布紋、草地、磚砌墻面等重復(fù)性結(jié)構(gòu)稱為紋理。一般來說,紋理是對圖像的像素灰度級在空間上的分布模式的描述,反映物品的質(zhì)地,如粗糙度、光滑性、顆粒度、隨機性和規(guī)范性等。(a)布紋(b)草地(c)磚砌10.3紋理特征紋理的標志有三要素:一是某種局部的序列性,該序列在更大的區(qū)域內(nèi)不斷重復(fù);二是序列是由基本部分非隨機排列組成的;三是各部分大致都是均勻的統(tǒng)一體,紋理區(qū)域內(nèi)任何地方都有大致相同的尺寸結(jié)構(gòu)。紋理圖像在很大范圍內(nèi)沒有重大細節(jié)變化,在這些區(qū)域內(nèi)圖像往往顯示出重復(fù)性結(jié)構(gòu)。10.3紋理特征紋理可分為人工紋理和天然紋理。人工紋理是由符號排列組成的,這些符號可以是線條、點、字母、數(shù)字等。自然紋理是具有重復(fù)排列現(xiàn)象的自然景象,如磚墻、種子、森林、草地之類的照片。(b)自然紋理(a)人工紋理10.3紋理特征與顏色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區(qū)域中進行統(tǒng)計計算。在圖像識別中,此類區(qū)域性的特征具有一定的優(yōu)勢,可以避免由于局部的偏差造成識別錯誤。作為一種統(tǒng)計特征,紋理特征一般具有旋轉(zhuǎn)不變性,并且對于噪聲有較強的抵抗能力。10.3紋理特征常用的紋理特征包括以下幾種:統(tǒng)計法:統(tǒng)計法的典型代表中的一種是灰度共生矩陣的紋理特征分析方法,可以由灰度共生矩陣得到能量、慣性、熵和相關(guān)性四個參數(shù)。模型法:模型法以圖像的構(gòu)造模型為基礎(chǔ),采用模型的參數(shù)作為紋理特征。典型的方法是隨機場模型法,例如馬爾可夫隨機場模型和Gibbs隨機場模型法。10.3紋理特征常用的紋理特征包括以下幾種:幾何法:幾何法是建立在紋理基元理論基礎(chǔ)上的一種紋理特征分析方法。紋理基元理論認為,復(fù)雜的紋理可以由若干簡單的紋理基元以一定的有規(guī)律的形式重復(fù)排列構(gòu)成。在幾何法中,比較有影響的算法包括Voronio棋盤格特征法和結(jié)構(gòu)法。頻譜法:由于圖像的傅里葉頻譜能夠很好地描述圖像中的周期或近似周期的空間特性,所以有些在空間域很難描述檢測到的紋理特征在頻率域中可以很好地獲得。頻譜法是基于傅里葉頻譜特性,主要用于通過識別頻譜中高能量的窄波峰尋找圖像中的整體周期。10.3紋理特征灰度差分統(tǒng)計對于給定的灰度圖像{f(i,j);i=0,1,2,…,M-1;j=0,1,2,…,N-1}和取較小的整數(shù)△i、△j,求差分圖像:g稱為灰度差分。設(shè)灰度差分的所有可能取值共有m級,求出灰度差分圖像的歸一化直方圖{h(k),k=0,1,2,…,m-1},可以由灰度差分直方圖得到二次統(tǒng)計量,作為紋理特征,反映圖像的紋理細致程度。10.3紋理特征灰度差分統(tǒng)計常用的灰度差分統(tǒng)計量特征有(1)平均值(2)對比度(3)角度方向二階矩(4)熵平均值mean=0.0041對比度con=3.3132角度方向二階矩asm=0.9961熵ent=0.0260平均值mean=0.0042對比度con=7.3576角度方向二階矩asm=0.9974熵ent=0.0223灰度差分統(tǒng)計【例3】計算下列紋理圖像的灰度差分統(tǒng)計特征。10.3紋理特征平均值mean=0.0041對比度con=4.1022角度方向二階矩asm=0.9976熵ent=0.0184平均值mean=0.0046對比度con=21.0406角度方向二階矩asm=0.9927熵ent=0.057710.3紋理特征灰度差分統(tǒng)計【例3】計算下列紋理圖像的灰度差分統(tǒng)計特征。10.3紋理特征灰度共生矩陣

僅使用像素的灰度值計算得到的紋理度量不攜帶像素彼此之間的相對位置的信息。在描述紋理時,將像素的位置信息合并到紋理分析過程中的一種方法是不僅要考慮灰度的分布,還要考慮圖像中像素的相對位置。令Q是定義兩個像素彼此相對位置的一個算子,并考慮一幅具有L個可能灰度級的圖像f,令G為一個矩陣,其元素gij是灰度為zi和zj的像素對出現(xiàn)在f中由Q所指定的位置處的次數(shù),其中1≤i,j≤L。按這種方法形成的矩陣稱為灰度共生矩陣。10.3紋理特征灰度共生矩陣取0o、45o、90o、135o。算子Q一般由方向和距離d組成。對于給定的方向和距離,在方向為的直線上,一個像素灰度為i,另一個與其相距為d的像素的灰度為j的點對出現(xiàn)的次數(shù)作為這個矩陣的第(i,j)元素的值。對于一系列不同的d和,就有一系列不同的灰度共生矩陣。由于計算量的原因,一般d只取少數(shù)幾個值,而灰度共生矩陣下圖給出了一個如何用L=8和由d=1,定義的位置算子Q構(gòu)造共生矩陣的例子。左側(cè)的陣列是所考慮的小圖像,右側(cè)的陣列是矩陣G。我們看到,G的元素(1,1)是1,因為在f中,值為1的像素的右側(cè)也為1的像素僅出現(xiàn)了1次。類似地,G的元素(6,2)是3,因為在f中,值為6的像素的右側(cè)為值為2的像素出現(xiàn)了3次。按照這種方式,可計算出G的其他元素。圖像f共生矩陣G10.3紋理特征灰度共生矩陣圖像中可能的灰度級數(shù)決定了矩陣G的大小。對于一幅8比特圖像(256個可能的灰度級),G的大小為256x256。為了減少計算負擔,經(jīng)常使用的方法是,將灰度量化為幾段。例如,在256級灰度的情形下,通過令前16個灰度級等1,令接下來的16個灰度級等于2,依此類推,可完成量化工作。這將得到一個大小為16x16的矩陣。10.3紋理特征灰度共生矩陣灰度共生矩陣能夠反映出圖像灰度關(guān)于方向、相鄰間隔、變化幅度的綜合信息,是分析圖像的局部模式和像素排列規(guī)則的基礎(chǔ)。作為紋理分析的特征量,一般不是直接應(yīng)用計算的灰度共生矩陣,而是在灰度共生矩陣的基礎(chǔ)上再提取紋理特征量,稱為二次統(tǒng)計量。二次統(tǒng)計量主要有能量、對比度、熵、均勻度、相關(guān)等。10.3紋理特征灰度共生矩陣

(1)能量(2)對比度(3)熵(4)均勻度10.3紋理特征灰度共生矩陣(5)相關(guān)其中10.3紋理特征灰度共生矩陣【例4】計算圖像灰度共生矩陣二次統(tǒng)計量表示的紋理特征。對比度:0.2009

相關(guān):0.9080

能量:0.2173

均勻:0.9145熵:2.8944對比度:6.7837

相關(guān):0.7398

能量:0.0160

均勻:0.5365熵:6.721910.3紋理特征

對比度:0.6983

相關(guān):0.9521

能量:0.0861

均勻:0.8370

熵:4.2218對比度:2.4532相關(guān):0.5922能量:0.0400均勻:0.5976熵:5.3076灰度共生矩陣【例4】計算圖像灰度共生矩陣二次統(tǒng)計量表示的紋理特征。10.3紋理特征頻譜特征傅里葉頻譜是一種理想的可用于描繪周期或近似周期的二維圖像模式的方向性的方法。頻譜特征正是基于傅里葉頻譜的一種紋理描述。全局紋理模式在空域中很難檢測出來,但是轉(zhuǎn)換到頻率域中則很容易分辨出來。因此,頻譜紋理對區(qū)分周期模式或非周期模式及周期模式之間的不同十分有效。通常,全局紋理模式對應(yīng)于傅里葉頻譜中能量十分集中的區(qū)域,即峰值突起處。10.3紋理特征頻譜特征在實際應(yīng)用中,通常會把頻譜轉(zhuǎn)化到極坐標中用函數(shù)描述,從而簡化表達。其中,S是頻譜函數(shù),r和是坐標系中的變量。將這個二元函數(shù)通過固定其中一個變量轉(zhuǎn)化一元函數(shù),例如,對每一個方向,可以把看成是一個一元函數(shù);同樣地,對每一個頻率r,可用一元函數(shù)來表示。10.3紋理特征頻譜特征對給定的方向,分析其一元函數(shù),可以得到頻譜在從原點出發(fā)的某個放射方向上的行為特征。而對某個給定的頻率r,對其一元函數(shù)進行分析,將會獲取頻譜在以原點為中心的圓上的行為特征。10.3紋理特征頻譜特征分別對上述兩個函數(shù)按照其下標求和,則會獲得關(guān)于區(qū)域紋理的全局描述:其中,R0是以原點為中心的圓的半徑,

表示離圓心距離為r的圖像頻譜值的總和,表示旋轉(zhuǎn)角度為

時圖像頻譜值的總和。10.3紋理特征頻譜特征【例5】計算紋理圖像的頻譜特征。下圖(a)顯示了隨機分布的火柴圖像,圖(b)顯示了按周期排列后的火柴圖像。圖(c)和(d)顯示了相應(yīng)的傅里葉頻譜。兩個傅里葉頻譜中在二維方向上延伸的四邊形周期能量脈沖歸因于火柴的其余部分的粗糙背景的周期紋理。圖(c)中頻譜的其他占支配地位的分量是由圖(a)的隨機方向引起的。圖(d)中與背景無關(guān)的主要能量是沿水平軸分布的,它對應(yīng)于圖(b)中的較強垂直邊緣。(a)隨機分布的火柴圖像(b)有序排列的火柴圖像(c)圖(a)的傅里葉頻譜(d)圖(b)的傅里葉頻譜【例5】計算紋理圖像的頻譜特征。(e)圖(a)的S(r)曲線(f)圖(a)的S()曲線(g)圖(b)的S(r)曲線(h)圖(b)的S()曲線下圖(e)和(f)是隨機排列火柴的S(r)曲線和

曲線,類似地,下圖(g)和(h)是隨機排列火柴的S(r)曲線和曲線。隨機排列火柴的S(r)曲線表明沒有較強的周期分量。相反,有序排列火柴的S(r)曲線在r=15附近顯示了一個較強的尖峰,而在r=25附近顯示了一個較小的尖峰,它們分別對應(yīng)于圖(b)中亮區(qū)域和暗區(qū)域的水平重復(fù)周期。類似地,圖(c)中能量脈沖的隨機特性,在圖(f)所示的曲線中十分明顯。相比之下,圖(h)所示圖形在靠近原點、90o和180o的區(qū)域顯示了很強的能量分量。這與圖(d)中頻譜的能量分布是一致的。10.4邊界特征邊界描述主要借助于區(qū)域的外部特征即區(qū)域的邊界來描述區(qū)域。當希望關(guān)注區(qū)域的形狀特征時,一般會采用這種描述方式,我們可以選定某種預(yù)定的方案對邊界進行表達,再對邊界特征進行描述。如果一個目標區(qū)域邊界上的點的已被確定時,就可以利用這些邊界點來區(qū)分不同區(qū)域的形狀。這樣既可以節(jié)省存儲信息,又可以準確地確定物體。10.4邊界特征鏈碼在數(shù)字圖像中,邊界或曲線是由一些列離散的像素點組成的,其最簡單的表達方法是由美國學(xué)者佛雷曼(Freeman)提出的鏈碼方法。鏈碼用于表示由順次連接的具有指定長度和方向的直線段組成的邊界線。在典型的情況下,這種表示方法基于線段的4或8連接。每一段的方向使用數(shù)字編號方法進行編碼,如下圖所示。(a)4方向鏈碼(b)8方向鏈碼10.4邊界特征鏈碼獲取或處理數(shù)字圖像經(jīng)常使用在x和y方向上相同的網(wǎng)格格式。所以鏈碼可以通過以順時針方向沿著邊界線,并且對連接每對像素的線段賦予一個方向生成。但是有兩個原因使我們通常無法采用這種方法:得到的鏈碼往往太長;噪聲或是邊界線段的缺陷都會在邊界上產(chǎn)生干擾,任何沿著邊界的小干擾都會使編碼發(fā)生變化,使其無法和邊界形狀相一致。10.4邊界特征鏈碼經(jīng)常用于解決上述這些問題的一種方法是選取一個較大的網(wǎng)格間距來對邊界重取樣。如下圖(a)所示。然后,當邊界穿過網(wǎng)格時,將一個邊界點賦給大網(wǎng)格的一個節(jié)點,具體取決于原始邊界與該節(jié)點的接近程度,如圖(b)所示。然后,按這種方法得到的重取樣邊界可由一個4鏈碼或8鏈碼表示。圖(c)顯示了由4方向鏈碼表示的粗略邊界點,圖(d)顯示了由8方向鏈碼表示的粗略邊界點。(a)邊界線上的重取樣網(wǎng)格,(b)重取樣的結(jié)果,(c)4向鏈碼,(d)8向鏈碼abcd10.4邊界特征鏈碼圖(c)中的起始點(任意的)是在頂部左方的點,邊界是圖(b)的網(wǎng)格中容許的最短4或8通路。圖(c)中的邊界表達是鏈碼0033…01,圖(d)是鏈碼0766…12。編碼表達方法的精確度依賴于取樣網(wǎng)格的大小。邊界的鏈碼依賴于起始點。為了確定鏈碼所表示的曲線在圖像中的位置,并能由鏈碼準確的重建曲線,則需要標出起點的坐標。但是當用鏈碼來描述閉合邊界時,由于起點和終點重合,因此往往不關(guān)心起點的具體位置,起點位置的變化只引起鏈碼的循環(huán)位移。為了解決這個問題,必須將鏈碼進行歸一化處理。10.4邊界特征鏈碼給定一個從任意點開始而產(chǎn)生的鏈碼,可把它看作一個由各個方向數(shù)構(gòu)成自然數(shù),將這些方向數(shù)依一個方向循環(huán)以使它們所構(gòu)成的自然數(shù)的值最小,將轉(zhuǎn)換后所對應(yīng)的鏈碼起點作為這個邊界的歸一化鏈碼的起點。例如,4向鏈碼10103322的歸一化鏈碼為01033221。10.4邊界特征鏈碼用鏈碼表示給定目標的邊界時,如果目標平移,鏈碼不會發(fā)生變化,但如果目標旋轉(zhuǎn)則鏈碼會發(fā)生變化。利用鏈碼的一階差分來重新構(gòu)造1個序列(1個表示原鏈碼各段之間方向變化的新序列)。這相當于把鏈碼進行旋轉(zhuǎn)歸一化。這個差分可用相鄰2個方向數(shù)(按反方向)相減得到。例如,4向鏈碼10103322的一階差分是3133030。如果把編碼看做循環(huán)序列,則差分的第一個元素是通過鏈的最后一個成員放在第一個成員之前計算得到的。此時的結(jié)果是33133030。10.4邊界特征鏈碼【例6】對圖像邊界進行佛雷曼編碼。下圖(a)顯示了小鏡片中嵌入環(huán)形筆畫后的圖像,該圖像是大小為570x570的8比特灰度圖像。本例的目的是得到下圖(a)的最小值整數(shù)的佛雷曼鏈碼和最大物體外部邊界的一次差分。圖(b)顯示了使用一個大小大小為9x9的均值模板平滑原圖像后的結(jié)果,圖(c)是采用Otsu算法得到的全局閾值對該圖像進行閾值處理后的結(jié)果。(a)原圖(b)平滑圖(c)二值化圖10.4邊界特征鏈碼圖(d)是圖(c)中最大區(qū)域的外邊界。直接獲得該邊界的鏈碼會生成一個變化較小的較長序列,且不能表示該邊界的形狀。為降低可變性,在得到其邊界的鏈碼前,通常需要對該邊界重取樣。圖(e)是以節(jié)點間距為50個像素的網(wǎng)格對邊界重取樣后的結(jié)果,圖(f)是使用直線連接所得頂點后的結(jié)果,這一簡單近似保留了原始邊界的主要特征。

簡化后的邊界的8方向佛雷曼鏈碼是0000606666666444444242222202202,該邊界的起點是圖(f)的左上角。(d)外邊界圖(e)重取樣圖(f)重取樣連接圖10.4邊界特征基于分裂技術(shù)的多邊形近似由于噪聲以及采樣等的影響,邊界有許多較小的不規(guī)則處,這些不規(guī)則處常對鏈碼表達產(chǎn)生較明顯的干擾影響。一種抗干擾性能更好,更節(jié)省表達所需數(shù)據(jù)量的方法就是用多邊形去近似逼近邊界。多邊形是一系列線段的封閉集合,它可用來逼近大多數(shù)曲線到任意的精度。10.4邊界特征基于分裂技術(shù)的多邊形近似實踐中,多邊形表達的目的是用盡可能少的線段來代表邊界并保持邊界的基本形狀,這樣就可以用較少的數(shù)據(jù)和簡潔的形式來表達和描述邊界。采用分裂技術(shù)得到的多邊形可以近似表達和描述邊界。10.4邊界特征基于分裂技術(shù)的多邊形近似分裂邊界線段的一種方法是將線段不斷地細分為兩部分,直到滿足規(guī)定的準則為止。例如,一個要求可能是:一條邊界線段到連接其兩個端點的直線間的最大垂直距離不超過一個預(yù)設(shè)的閾值。如果準則滿足,則與直線有著最大距離的點就成為一個頂點,這樣就將初始線段分成了兩條子線段。這種方法在尋找變化顯著的點時具有優(yōu)勢。對一條閉合邊界,最好的起始點通常是邊界上的兩個最遠點。10.4邊界特征基于分裂技術(shù)的多邊形近似例如,下圖(a)顯示了一個物體的邊界,圖(b)顯示了該邊界關(guān)于其最遠點的細分。標記為c的點是頂部邊界線段到直線ab的垂直距離最遠的點。類似地,點d是底部線段上的最遠點。圖(c)顯示了使用分裂過程的最后結(jié)果,所用閾值為直線ab的長度的0.25倍。(a)原始邊界(b)邊界被分割為基于端點的線段(c)頂點連接(d)得到的多邊形10.4邊界特征標記圖

標記圖是邊界的一維函數(shù)表示,它可以使用各種方式來生成。一種最簡單的方式是以角度的函數(shù)的形式畫出質(zhì)心到(a)(b)重復(fù)出現(xiàn)的模式邊界的距離,如下圖所示。在圖(b)中中,標記圖由和(c)(d)(a)和(b)是圓形和方形物體;(c)和(d)是相應(yīng)的距離與角度標記間的關(guān)系標記圖【例7】兩個物體的標記圖。下圖(a)和(b)顯示了兩個二值物體,圖(c)和(d)是它們的邊界。圖(e)和(f)中相應(yīng)的標記圖以1o增量在0o到360o的范圍內(nèi)變化。標記圖中突出峰值的數(shù)量足以區(qū)分兩個物體的形狀。兩個二值區(qū)域,它們的外部邊界及相應(yīng)的標記。圖(e)和圖(f)中的水平軸對應(yīng)于從0o到360o之間的角度,角度增量為1o10.4邊界特征(a)(b)(c)(d)(e)(f)10.4邊界特征簡單的邊界描述子特征邊界長度:邊界長度是邊界所包圍的區(qū)域輪廓的周長。對4連通邊界,其長度為邊界上像素點個數(shù);對8連通邊界來說,其長度為垂直分量和水平分量的數(shù)量加上對角分量的倍,可給出曲線的準確長度。邊界直徑:邊界的直徑定義為:這里D是距離的度量,pi和pj是邊界上的點。長軸:連接直徑的兩個端點的直線段稱為邊界的長軸。短軸:與長軸垂直的直線段稱為邊界的短軸。10.4邊界特征簡單的邊界描述子特征離心率:長軸和短軸的比值稱為邊界的離心率。曲率:定義為斜率的變化率。一般來說,在數(shù)字化邊界上找到某一點曲率的可靠量度是困難的,因為這種邊界都較為“粗糙”。有時使用相鄰邊界線段的斜率差作為線段交點處的曲率描述。由于我們是順時針方向沿著邊界運動,當頂點p的斜率變化量為非負的時侯,稱這一點屬于凸線段;否則,稱p屬于凹線段。一點的曲率描述可以通過使用斜率變化的范圍進一步精確化。例如,如果斜率的變化小于10o,可認為它屬于近似直線的線段。如果大于90o,則屬于拐點。10.4邊界特征形狀數(shù)描述子特征形狀數(shù)是基于鏈碼的一種邊界形狀描述。根據(jù)鏈碼的起點位置不同,一個用鏈碼表達的邊界可以有多個一階差分。一個邊界的形狀數(shù)是這些差分中其值最小的一個序列。也就是說,形狀數(shù)是值最小的鏈碼的差分碼。每個形狀數(shù)都有一個對應(yīng)的階,這里的階定義為形狀數(shù)序列的長度,即碼的個數(shù)。10.4邊界特征形狀數(shù)描述子特征如下圖所示,用4-方向鏈碼表示法來表示階數(shù)為4,6,8階的邊界的形狀數(shù),黑點表示起始點。10.4邊界特征形狀數(shù)描述子特征在實際中對已給邊界由給定階計算邊界形狀數(shù)有以下幾個步驟:從所有滿足給定階要求的矩形中選取其長短軸比例最接近如下圖(a)所示的邊界的矩形,如圖(b)所示;(a)(b)10.4邊界特征形狀數(shù)描述子特征根據(jù)給定階將選出的矩形劃分為圖(c)所示的多個等邊正方形;求出與邊界最吻合的多邊形,如圖(d)所示;根據(jù)選出的多邊形,以圖(d)中的黑點為起點計算其鏈碼求出鏈碼的差分碼;循環(huán)差分碼使其數(shù)串值最小,從而得到已給邊界的形狀數(shù)。(c)(d)10.5區(qū)域特征一個區(qū)域由區(qū)域的外圍邊界和區(qū)域內(nèi)部組成。在上一節(jié)中,討論了區(qū)域外圍邊界的表示和描述,在這一節(jié)中,將主要討論區(qū)域內(nèi)部特征的表示和描述。10.5區(qū)域特征區(qū)域面積區(qū)域面積是區(qū)域的一個基本特征,它描述區(qū)域的大小。一幅灰度圖像經(jīng)過二值化之后,目標物體變成灰度值為1的區(qū)域,而背景的灰度值為0。對于目標區(qū)域R,設(shè)正方形像素的邊長為單位長,則其面積A的計算公式為可見,計算區(qū)域面積就是對屬于區(qū)域的像素計數(shù)。10.5區(qū)域特征位置

圖像中區(qū)域的位置定義為區(qū)域的面積中心,面積中心就是物體的重心O。因二值圖像質(zhì)量分布是均勻的,故重心和形心重合。若圖像中的物體對應(yīng)的像素位置為(xi,yi)(i=0,1,…,M-1;j=0,1,…,N-1),則可用下式計算位置坐標:10.5區(qū)域特征【例8】計算下圖物體的面積和重心。面積a1=93671重心x1=286.6828y1=286.311110.5區(qū)域特征孔如果在被封閉邊緣包圍的區(qū)域中不包含我們感興趣的像素,則稱此區(qū)域為圖形的孔洞,用字母H表示,如下圖所示,在區(qū)域中有兩個孔洞,即H=2。如果把區(qū)域中孔洞數(shù)作為拓撲描述符,則這個性質(zhì)將不受伸長或旋轉(zhuǎn)變換的影響,但是,如果撕裂或折疊時,孔洞數(shù)將發(fā)生變化。10.5區(qū)域特征連接部分

一個集合的連接部分就是它的最大子集,在此子集中,任何兩點都可以用一條完全處于子集中的曲線加以連接。圖形的連接部分數(shù)用字母C表示,如下圖中包含有三個連接成分,即C=3。10.5區(qū)域特征歐拉數(shù)圖形中連接部分數(shù)和孔洞數(shù)之差定義為歐拉數(shù),用字母E表示,即

E=C-H下圖給出了一個歐拉數(shù)的例子,其中圖(a)中有一個連接部分和一個孔洞,所以它的歐拉數(shù)為0,圖(b)有一個連接部分和兩個孔洞,所以它的歐拉數(shù)為-1。事實上,H、C和E都可以作為圖形的特征。它們的共同點是,只要圖形不撕開、不折疊,則它們的數(shù)值將不隨圖形變形而改變。因此,拓撲特性將不同于距離或基于距離測度所建立起來的其他任何性質(zhì)。10.5區(qū)域特征歐拉數(shù)當圖形是由一些直線所組成的多角網(wǎng)格時,歐拉數(shù)和組成多角網(wǎng)格的各特征元素有簡單的關(guān)系,稱為歐拉公式。如下圖所示的多角網(wǎng)格,把這樣的網(wǎng)格內(nèi)部區(qū)域分成面和孔,如果設(shè)頂點數(shù)為W,邊緣數(shù)為Q,面數(shù)為F,將得到下面的歐拉公式

W-Q+F=C-H=E

在下圖的多角網(wǎng)格中,有7個頂點、11條邊、2個面、1個連接區(qū)和3個孔,因此,對于該多角網(wǎng)格區(qū)域,則有7-11+2=1-3=-2。10.5區(qū)域特征偏心度

區(qū)域的偏心度e在一定程度上描述了區(qū)域的緊湊性。Tenenbaum提出了計算任意點集R偏心度的近似公式。計算平均向量計算ij矩10.5區(qū)域特征偏心度計算方向角計算偏心度的近似值10.5區(qū)域特征矩

當一個區(qū)域R只是以其內(nèi)部點的形式給出時,我們可以用矩特征描述,它對大小、旋轉(zhuǎn)和平移的變化都是不變的。

對于二維連續(xù)函數(shù)f(x,y),(p+q)階矩定義為:

p,q=0,1,2,…。如果f(x,y)是分段連續(xù)的并且僅在xy平面內(nèi)有限的部分具有非零值,則存在各階矩,并且矩的序列(mpq)由f(x,y)惟一決定。相反,(mpq)也惟一地決定f(x,y)。10.5區(qū)域特征矩中心矩定義為:這里10.5區(qū)域特征矩如果f(x,y)是數(shù)字圖像,則零階矩

當f(x,y)相當于物體的密度時,則零階矩m00是密度的總和,即物體的質(zhì)量。10.5區(qū)域特征矩

低階矩中的一階矩分別除以零階矩m00后所得的便是物體質(zhì)量中心的坐標,或者直接表示區(qū)域灰度重心的坐標。10.5區(qū)域特征矩

中心矩是反映區(qū)域R中的灰度相對于灰度重心是如何分布的度量。例如,

20和

02分別表示R圍繞通過灰度重心的垂直和水平軸線的慣性矩,若

20>

02,那么這可能是一個水平方向拉長的物體。

30和

03的幅值可以度量物體對于垂直和水平軸線的不對稱性。如果是完全對稱的形狀,其值應(yīng)為零。(p+q)階規(guī)格化中心矩為:矩利用二階和三階規(guī)格化中心矩,Hu在1962年導(dǎo)出了下面七個不變矩組:【例9】計算計算下列圖像的hu矩。黑的邊界是加上去的,以使本例的所有圖像都有相同的尺寸,圖像中0值不影響hu矩的計算。下圖(b)到(f)分別顯示了圖像(a)經(jīng)平移、縮小、鏡像、旋轉(zhuǎn)45度和旋轉(zhuǎn)90度操作后的結(jié)果。(a)(b)(c)(d)(e)(f)下表總結(jié)了上述6幅圖像的7個不變矩的值。為減小動態(tài)范圍,所顯示的值是。需要絕對值的原因是許多矩的值是負數(shù)或小數(shù);符號函數(shù)保留。表中的兩個關(guān)鍵點是:(1)矩的值接近程度與平移、尺度縮放、鏡像和旋轉(zhuǎn)無關(guān);(2)的符號對于鏡像圖像是不同的。不變矩原始圖像平移一半尺寸鏡像旋轉(zhuǎn)45o旋轉(zhuǎn)90o2.86622.86622.86622.86622.86622.86627.12637.12637.12637.12637.12637.126310.410910.410910.410910.410910.410910.410910.374210.374210.374210.374210.374210.374221.367421.367421.367421.367421.367421.367413.941713.941713.941713.941713.941713.9417-20.7809-20.7809-20.780920.7809-20.7809-20.780910.6運用主成分進行描述主成分基礎(chǔ)一幅彩色圖像由R、G、B三個分量圖像組成,這三幅圖像可以通過將每組三個對應(yīng)的像素表示成一個向量而看做一個單元。例如,令x1,x2和x3分別為這三幅圖像的第一個像素的值。這三個像素可以用三維列向量x的形式表示,即:10.6運用主成分進行描述主成分基礎(chǔ)如果有n幅已配準的圖像,那么向量將是n維的:

在下面的內(nèi)容中,我們假定所有的向量都是列向量,可以把它們寫成x=(x1,x2,…,xn)T的形式,T表示轉(zhuǎn)置。10.6運用主成分進行描述主成分基礎(chǔ)假設(shè)向量為隨機向量,總體向量的均值定義為:總體向量的方差矩陣定義為:對于從隨機總體中取樣的M個向量,均值向量可以通過使用常見的求平均值的表達式由樣本來近似得到。

利用式(10-1)至(10-3)可得總體向量的方差矩陣為(10-1)(10-2)(10-3)(10-4)10.6運用主成分進行描述主成分基礎(chǔ)【例10】計算向量x1=(0,0,0)T,x2=(1,0,0)T,x3=(1,1,0)T,x4=(1,0,1)T

的均值向量和協(xié)方差矩陣。根據(jù)式(10-3)可得均值向量根據(jù)式(10-4)可得協(xié)方差矩陣:10.6運用主成分進行描述主成分基礎(chǔ)

因為C是實對稱的,根據(jù)線性代數(shù)知識,總可以找到一組n個標準正交的特征向量。設(shè)C的n個特征值和對應(yīng)的特征向量為和,為了方便,對特征值按照降序排列,使,j=1,2,…,n-1。

令U為一個由C的特征向量組成其行元素的矩陣,并進行排序,使U的第一行為對應(yīng)最大特征值的特征向量,而最后一行為對應(yīng)最小特征值的特征向量。10.6運用主成分進行描述主成分基礎(chǔ)假設(shè)以U作為將x的向量映射到用y代表的向量的變換矩陣,如下式所示:

則這個表達式稱為主成份變換。(10-5)10.6運用主成分進行描述主成分基礎(chǔ)該變換的性質(zhì)如下:(1)這一變換得到的y向量的均值為0,即:(2)這一變換得到的y向量的協(xié)方差矩陣由下列表達式得到,即:Cy=UC

UT(3)根據(jù)U的構(gòu)成方式,Cy是一個對角矩陣,其主對角線上的元素是Cx的特征值,即:(10-8)(10-7)(10-6)10.6運用主成分進行描述主成份基礎(chǔ)(4)任何向量x都能通過相應(yīng)的y使用下列表達式重構(gòu)得到:

由于U的各行是正交向量,可以由式(10-5)得到式(10-9)。(10-9)10.6運用主成分進行描述主成份基礎(chǔ)

如果不使用C的所有特征向量,而僅取C的前k個最大特征值對應(yīng)的k個特征向量組成一個的矩陣,記為。向量組y則成為k維的。那么,使用向量組y和矩陣重構(gòu)將得到原向量組x的一個近似,記作,則有(10-10)10.6運用主成分進行描述主成份基礎(chǔ)

和之間的均方誤差可以由下列表達式給出:從上式可以看出,當k=n時,誤差為零。因為

單調(diào)減少,上式也說明誤差可以通過選擇k個具有最大特征值的特征向量而將至最小。(10-11)10.6運用主成分進行描述主成分描述主成分分析是將高維信號進行降維操作的一種重要手段,是從高維信號中提取出低維的主要信息,從而把高維空間中的信號映射到低維空間。主成分分析就是使用主成分來描述原來的高維復(fù)雜信號。10.6運用主成分進行描述主成分描述主成分分析步驟如下:計算輸入的高維信號的協(xié)方差矩陣;計算該協(xié)方差矩陣的特征值和特征向量;將特征向量按照它們對應(yīng)的特征值大小進行排序;挑選出與較大特征值對應(yīng)的重要特征向量;將原始信號投影到所選特征向量構(gòu)成的空間上,從而得到一個低維信號。10.6運用主成分進行描述主成分描述如前所述,主成分分析仍然會得到一個n維信號,只是這n維的信號已經(jīng)按照其重要性進行了排列,并且其重要性也有確切的參數(shù)來描述,用戶可以選擇其中最重要的k維作為最終的主成分描述。通常,需要設(shè)定一個閾值,使得這k維的信號的重要性之和占全部重要性之和的百分比大于該值。10.6運用主成分進行描述主成分描述在二十世紀九十年代初,Kirby和Sirovich開始討論利用PCA技術(shù)進行人臉圖像的最優(yōu)表示問題。并且由麻省理工學(xué)院媒體實驗室的M.Turk和A.Pentland將此技術(shù)用于人臉識別中,并稱為特征臉方法。從此,主成分分析引起了人臉識別研究者的廣泛關(guān)注M.Turk和A.Pentland將m×n的人臉圖像,重新排列為m*n維的列向量。則所有的訓(xùn)練圖像經(jīng)此變換后得到一組列向量:{x1,x2,…,xN},xi∈Rm*n,其中N代表訓(xùn)練樣本集中圖像的個數(shù)。將圖像看成一隨機列向量,并通過訓(xùn)練樣本對其均值向量和協(xié)方差矩陣進行估計,然后進行主成分分析。M.KirbyandL.Sirovich,"ApplicationoftheKarhunen-Loeveprocedureforthecharacterizationofhumanfaces",IEEETransactionsonPatternAnalysisandMachineIntelligence,1990,12(1),103-108.被引用次數(shù):2817M.TurkandA.Pentland,"Eigenfacesforrecognition",JournalofCognitiveNeuroscience,1991,3(1),71-96.被引用次數(shù):1375610.6運用主成分進行描述主成分描述【例11】對下圖所示的10幅人臉圖像組成的圖像集進行主成分描述。10.6運用主成分進行描述對人臉圖像組成的圖像集進行主成分分析提取后的10幅人臉圖像如下。其特征值為下:1.0e+04*(1.6191,0.2209,0.2028,0.1023,0.0860,0.0662,0.0490,0.0311,0.0283,0.0223),從中可以看出,第一個主成分對應(yīng)的特征值最大,其后主成分的重要程度值變得越來越小。10.7主成分在人臉圖像識別中的應(yīng)用人臉圖像識別人臉識別作為圖像媒體理解與認知的一個重要領(lǐng)域,可以在距離成像設(shè)備相當遠的范圍內(nèi)在人群中識別出特定的個體,在公共安全、人機交互、金融安全等方面具有的巨大商業(yè)前景,因此受到圖像處理、計算機視覺、模式識別與機器學(xué)習(xí)等領(lǐng)域的普遍重視。人臉識別的優(yōu)勢在于其自然性和非接觸性的特點。所謂自然性,是指該識別方式進行個體識別時所利用的生物特征相同。也就是說,人類是通過觀察和比較人臉區(qū)分和確認身份的,而指紋識別、虹膜識別等都不具有自然性,因為人類或者其他生物并不通過此類生物特征區(qū)別個體。10.7主成分在人臉圖像識別中的應(yīng)用人臉圖像識別非接觸性的特點使得該識別方法完全利用可見光獲取人臉圖像信息,而不同于指紋識別或者虹膜識別,需要利用電子儀器采集指紋,或者利用紅外線采集虹膜圖像,人臉圖像采集方式讓受試對象很容易接受,并且容易在公共場所搜索、識別特定的對象。人臉識別涉及到大量二維圖像的理解與認知,計算復(fù)雜性高、運算量大,而且具有較強的實時性要求,因此可以利用主成份分析進行降維,從而減少計算量。10.7主成分在人臉圖像識別中的應(yīng)用科幻電影常常是人類未來的預(yù)示器。回憶《諜中諜4》中的一個片斷。這是一個典型的“螳螂捕蟬,黃雀在后”的故事。男特工在使用人臉識別技術(shù)搜索到他的目標后,搶得文件,卻在折返的路上撞見女殺手。在被殺之前,他的人臉識別系統(tǒng)已經(jīng)識別出對面走來的殺手,但為時已晚。鏡頭中,男特工戴著的,是被我們稱之為“Contactlenses”的隱形眼鏡式攝像機。這種人臉識別技術(shù),是不是已經(jīng)從科幻電影世界走入現(xiàn)實了呢?10.7主成分在人臉圖像識別中的應(yīng)用人類社會其實早已進入了一個偉大的“看臉的時代”。2005年開始,我們購買的數(shù)碼相機里面就已具備所謂的“人臉識別”功能。實際這只是一種誤傳,我們的數(shù)碼相機里沒有“人臉識別”技術(shù),有的只是“人臉檢測”技術(shù)。它只管判斷有沒有“臉”,并不會識別它看到的人是誰。10.7主成分在人臉圖像識別中的應(yīng)用早些時候還有一則新聞,讓“人臉識別”登上了娛樂版的頭條。新聞故事說的是,演員趙薇的老公遭其司機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論