數(shù)字圖像處理實(shí)戰(zhàn)-PPT第5章 圖像特征提取_第1頁
數(shù)字圖像處理實(shí)戰(zhàn)-PPT第5章 圖像特征提取_第2頁
數(shù)字圖像處理實(shí)戰(zhàn)-PPT第5章 圖像特征提取_第3頁
數(shù)字圖像處理實(shí)戰(zhàn)-PPT第5章 圖像特征提取_第4頁
數(shù)字圖像處理實(shí)戰(zhàn)-PPT第5章 圖像特征提取_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

圖像特征提取1提取圖像的紋理特征目錄提取圖像的顏色特征2提取圖像的輪廓特征3提取圖像的形狀特征4顏色特征是在圖像檢索中廣泛應(yīng)用的視覺特征,也是人們識(shí)別圖像時(shí)最主要的感知特征,主要是因?yàn)轭伾蛨D像中所包含的場(chǎng)景和物體有非常強(qiáng)的相關(guān)性。自然界中,同種物體一般有相同的顏色特征,不同的物體可能有著不同的顏色特征。相對(duì)于其他圖像特征,顏色特征對(duì)圖像方向、尺寸和視角等的依賴性較小,具有較高的魯棒性,有不少的圖像檢索系統(tǒng)以顏色特征作為圖像檢索的主要手段。常用的顏色特征包括:顏色直方圖、顏色矩、顏色聚合向量和顏色相關(guān)圖。了解圖像的顏色特征顏色直方圖是被廣泛應(yīng)用在許多圖像檢索系統(tǒng)中的顏色特征,只包含了圖像中各顏色值出現(xiàn)的頻數(shù),可以描述不同色彩在整幅圖像中所占的比例。如果圖像可以分為多個(gè)區(qū)域,且前景與背景顏色分布具有明顯差異,那么顏色直方圖呈現(xiàn)雙峰形。但是顏色直方圖丟失了像素所在的空間位置信息,即無法描述圖像中存在的對(duì)象或物體。任一幅圖像都能唯一的給出一幅與之對(duì)應(yīng)的顏色直方圖,但不同的圖像可能有相同的顏色分布,從而具有相同的直方圖,因此直方圖與圖像是一對(duì)多的關(guān)系。在獲取顏色直方圖前,會(huì)對(duì)圖像顏色空間的顏色分量進(jìn)行分割,常用的顏色空間包含RGB、HSV顏色空間。顏色直方圖對(duì)圖像幾何變換中的旋轉(zhuǎn)、翻轉(zhuǎn)變化不敏感,具有一定的穩(wěn)定性。了解圖像的顏色特征1.顏色直方圖通過OpenCV中的calcHist函數(shù)可以計(jì)算圖像直方圖,語法格式如下。需要注意calcHist函數(shù)不實(shí)現(xiàn)直方圖的繪制。cv2.calcHist(images,channels,mask,histSize,ranges[,hist[,accumulate]])了解圖像的顏色特征參數(shù)名稱說明images接收array型常量,表示需要進(jìn)行直方圖繪制的圖像,無默認(rèn)值channels接收int型常量,表示用于計(jì)算直方圖的通道,無默認(rèn)值mask接收array,表示用于凸顯區(qū)域或掩蓋區(qū)域的掩膜,與輸入圖像具有相同的大小,無默認(rèn)值histSize接收int型常量,表示直方圖分成多少個(gè)區(qū)間,無默認(rèn)值ranges接收float型常量,表示統(tǒng)計(jì)像素值得區(qū)間,無默認(rèn)值accumulate接收bool,表示在多個(gè)圖像時(shí),是否累計(jì)計(jì)算像素值得個(gè)數(shù),默認(rèn)為FalsecalcHist函數(shù)參數(shù)接收的數(shù)據(jù)類型有所不同,例如,images參數(shù)不能直接接收?qǐng)D像數(shù)組,需要將圖像數(shù)組轉(zhuǎn)換列表的形式,即“[img_bgr]”,img_bgr表示RGB顏色空間的圖像數(shù)組。同時(shí)將histSize參數(shù)的值設(shè)置為256,表示統(tǒng)計(jì)每個(gè)像素值的數(shù)量。通過calcHist函數(shù)計(jì)算圖像直方圖,然后使用繪圖庫實(shí)現(xiàn)顏色直方圖繪制,得到的RGB顏色空間的顏色直方圖,如圖所示。從圖可以看出,三種顏色的顏色直方圖的數(shù)量峰值都是分布在像素值較低的位置,表明圖像的顏色總體偏暗色調(diào)。不同顏色對(duì)應(yīng)像素值數(shù)量的變化趨勢(shì)在0到150的區(qū)間內(nèi)基本相同,在150后紅色的像素?cái)?shù)量明顯高于其他兩種顏色,表明在圖像中存在一部分的鮮紅區(qū)域。了解圖像的顏色特征顏色矩是一種簡(jiǎn)單有效的顏色特征表示方法。顏色矩的優(yōu)點(diǎn)在于,不需要顏色空間量化,特征向量維數(shù)低。但在實(shí)驗(yàn)中發(fā)現(xiàn)顏色矩的檢索效率比較低,因而在實(shí)際應(yīng)用中往往用于過濾圖像以縮小檢索范圍。由于圖像的顏色信息主要分布于低階矩中,所以常用一階矩、二階矩和三階矩表達(dá)圖像的顏色分布。其中,一階矩描述平均顏色,反映了圖像整體的明暗程度;二階矩描述顏色標(biāo)準(zhǔn)差,反映了圖像顏色的分布范圍;三階矩描述顏色的偏移性,反映了圖像顏色分布的對(duì)稱性。一階矩、二階矩、三階矩的計(jì)算公式分別如下式所示。計(jì)算公式中的N為像素?cái)?shù)量,表示第i個(gè)顏色分量的第j個(gè)像素值。了解圖像的顏色特征2.顏色矩從顏色矩的計(jì)算公式可以看出,顏色矩也受圖像的像素?cái)?shù)量影響。但是在實(shí)際的應(yīng)用中,攝像設(shè)備的不同會(huì)導(dǎo)致獲取的圖像的尺寸不同。因此,在特定的情況下,對(duì)比兩圖的顏色矩時(shí),可以通過在原圖中切割出相同大小的圖像,從而消除圖片尺寸不統(tǒng)一的影響,如下圖所示。了解圖像的顏色特征自定義顏色矩計(jì)算函數(shù),并繪制顏色矩的直方圖,得到兩片葉子的各階顏色矩如圖所示。在該圖中,柱形表示各階顏色矩的數(shù)值大小,由此可知,兩片葉子的一階顏色矩存在較大的不同,主要體現(xiàn)在綠色分量和紅色分量中,第二片葉子的綠、紅分量接近第一片綠、紅分量的兩倍,因此在第二片葉子的色彩在總體上更加艷麗。在二階矩和三階矩中,第一片葉子均高于第二片葉子,表明在總體上第二片葉子的顏色分布更均勻。了解圖像的顏色特征了解圖像的顏色特征3.顏色聚合向量針對(duì)顏色直方圖和顏色矩?zé)o法表達(dá)圖像色彩的空間位置的缺點(diǎn),提出了圖像的顏色聚合向量。顏色聚合向量是顏色直方圖的一種演變,其核心思想是將屬于直方圖每個(gè)區(qū)間的像素分為兩部分。如果區(qū)間內(nèi)的像素所占據(jù)的連續(xù)區(qū)域的面積大于給定的閾值,那么該區(qū)域內(nèi)的像素作為聚合像素,否則作為非聚合像素。從而得到每個(gè)區(qū)間內(nèi)聚合像素的數(shù)量和非聚合像素的數(shù)量,則顏色聚合向量可以表示為。顏色聚合向量的計(jì)算主要包含量化、劃分連通區(qū)域、判斷聚合性和得到結(jié)果4個(gè)步驟。待計(jì)算顏色聚合向量的數(shù)據(jù)如下圖所示。首先對(duì)數(shù)據(jù)進(jìn)行量化,以10作為一個(gè)區(qū)間的寬度,將10~19內(nèi)的數(shù)據(jù)劃分為區(qū)間1,將20~29內(nèi)的數(shù)據(jù)劃分為區(qū)間2,并以此類推直到全部區(qū)間劃分完畢。量化的結(jié)果如下圖所示。了解圖像的顏色特征(1)量化連通區(qū)域的計(jì)算使用的是8鄰域,每個(gè)連通區(qū)域使用不同字母表示。劃分連通區(qū)域結(jié)果如下圖所示。了解圖像的顏色特征(2)劃分連通區(qū)域結(jié)合量化和劃分連通區(qū)域的結(jié)果統(tǒng)計(jì)連通區(qū)域中的像素?cái)?shù)量如下表所示。設(shè)定一個(gè)閾值τ,作為判斷連通區(qū)域中的像素是聚合還是非聚合的判斷依據(jù)。如果連通區(qū)域中的像素?cái)?shù)量大于閾值τ

,那么該區(qū)域中的像素是聚合的,否則像素是非聚合的。了解圖像的顏色特征(3)判斷聚合性連通區(qū)域ABCDE顏色區(qū)間12132像素?cái)?shù)量1215315設(shè)閾值為4,在顏色區(qū)間為1的情況下,像素?cái)?shù)量大于4的為12,小于4的為3,因此顏色區(qū)間為1時(shí)α=12、β=3。如果同一區(qū)間內(nèi)有多個(gè)符合條件的像素?cái)?shù)量,那么需要將像素?cái)?shù)量相加。例如,在顏色區(qū)間為2時(shí),像素?cái)?shù)量大于4的有15和5,則α=15+5=20。計(jì)算得到3個(gè)顏色區(qū)間的聚合性如下表所示。了解圖像的顏色特征顏色區(qū)間123α12200β301根據(jù)聚合性的統(tǒng)計(jì)結(jié)果,可以得到待計(jì)算數(shù)據(jù)的顏色聚合向量為。通過自定義函數(shù)計(jì)算得到顏色聚合向量的結(jié)果如下表所示。了解圖像的顏色特征(4)得到結(jié)果聚合非聚合012.03.0120.00.000.01.0了解圖像的顏色特征4.顏色相關(guān)圖顏色相關(guān)圖是圖像顏色分布的另一種表達(dá)方式,不但刻畫了某種顏色的像素占比,還表達(dá)了顏色隨距離變換的空間關(guān)系,反映了顏色之間的空間關(guān)系。如果還考慮顏色之間的相關(guān)性,那么顏色相關(guān)圖將會(huì)非常復(fù)雜龐大。一種簡(jiǎn)化方式是顏色自動(dòng)相關(guān)圖,僅僅考慮具有相同顏色的像素之間的空間關(guān)系。假設(shè)圖像I被量化為m種()顏色值。對(duì)于圖像I中的任意兩個(gè)像素點(diǎn)和,定義兩點(diǎn)之間的距離為,像素的距離集合表示為。則對(duì)于固定距離、、圖像I的顏色相關(guān)圖如下式所示。在該式中,表示圖像I與像素點(diǎn)距離為k且顏色值為的像素點(diǎn)的個(gè)數(shù)。自定義函數(shù)繪制顏色相關(guān)圖得,到顏色相關(guān)圖如右圖所示。在顏色相關(guān)圖中,明亮部分表示存在符合條件的像素點(diǎn),越明亮則符合條件的像素點(diǎn)越多。從圖可以看出,圖像中像素值在0~130之間的像素點(diǎn)有較廣泛的分布,說明圖像整體偏暗,顏色相對(duì)斑駁。但是像素值在150~200之間的像素點(diǎn)亦有不少的分布,說明圖像存在明亮部分。了解圖像的顏色特征在環(huán)境監(jiān)測(cè)中,對(duì)水資源的監(jiān)測(cè)至關(guān)重要,一張取樣后拍攝的水質(zhì)圖像如下左圖所示。在光照條件下,由于不同質(zhì)量的水中含有的物質(zhì)不同,對(duì)光的反射也不同,所以導(dǎo)致了水的顏色看起來不同。通過提取水質(zhì)圖像的顏色特征可以對(duì)水質(zhì)進(jìn)行分類。拍攝的水質(zhì)圖像不可避免的包含了杯子、紙張、草地等背景,因此需要對(duì)原始圖像進(jìn)行切割,保留相同大小的水質(zhì)部分的圖像并提取顏色矩特征,得到的部分分割后圖像如下右圖所示。提取水質(zhì)圖像的顏色特征提取了全部水質(zhì)圖像的顏色矩后,根據(jù)標(biāo)簽對(duì)顏色矩進(jìn)行分類,并繪制5類水質(zhì)圖像各階顏色矩均值折線圖,如右圖所示。從該圖可以看出,不同水質(zhì)圖像的顏色矩差距主要體現(xiàn)在一階顏色矩中,二階顏色矩和三階顏色矩的差距不大。因此,可以選擇一階顏色矩作為水質(zhì)圖像分類模型的特征數(shù)據(jù),創(chuàng)建水質(zhì)圖像分類模型。提取水質(zhì)圖像的顏色特征1提取圖像的紋理特征目錄提取圖像的顏色特征2提取圖像的輪廓特征3提取圖像的形狀特征4圖像的紋理特征在圖像檢索中有著重要的地位,與圖像的顏色、形狀等特征相比對(duì)圖像具有更強(qiáng)的描述能力、更加穩(wěn)定。紋理表現(xiàn)為物體表面某種重復(fù)性出現(xiàn)的微觀結(jié)構(gòu),能夠反映出圖像的灰度變化和空間結(jié)構(gòu)。20世紀(jì)70年代,隨著對(duì)紋理的深入分析,灰度共生矩陣的概念被提出。在此之后,基于紋理基元提出了局部二值模式?;叶裙采仃嚭途植慷的J匠1挥糜谔崛D像的紋理特征。了解圖像的紋理特征灰度共生矩陣(Grey-LevelCo-occurrenceMatrix,GLCM)可以反映出圖像灰度在一定方向和一定相距間隔的變化情況。通過計(jì)算得到的灰度共生矩陣能夠較好的反映出圖像的灰度變化關(guān)系以及結(jié)構(gòu)等信息。假設(shè)一張二維灰度圖像的大小為,其灰度被量化為級(jí)。則灰度共生矩陣水平方向分布域?yàn)?,豎直方向分布域?yàn)椋炕蠡叶鹊姆植加驗(yàn)?。存在一個(gè)映射函數(shù)I,使。灰度共生矩陣如下式所示。在該式中,為計(jì)算集合中元素的個(gè)數(shù);d和θ分別為點(diǎn)到點(diǎn)的距離和方向。θ的常見取值有0°(水平方向)、45°、90°(豎直方向)和135°,如右圖所示。了解圖像的紋理特征1.灰度共生矩陣待計(jì)算灰度共生矩陣的數(shù)據(jù)如下圖(1)所示,該數(shù)據(jù)被量化后包含3個(gè)量級(jí),其灰度矩陣的大小為3×3。當(dāng)d=1、θ=0°、時(shí),表示統(tǒng)計(jì)第一個(gè)元素為1,水平方向上距離為1的另一個(gè)元素為2的組合的個(gè)數(shù),如下圖(2)所示,需要注意的是,兩個(gè)元素的位置無先后之分。從圖(2)可以看出,符合條件的集合共有10個(gè)。則在灰度共生矩陣中,第“1”行第“2”列上元素的值為10。同理,第一個(gè)元素為2,水平方向上距離為1的另一個(gè)元素為3的組合的個(gè)數(shù)為10。了解圖像的紋理特征統(tǒng)計(jì)集合中所有組合的個(gè)數(shù)即可得到完整的灰度共生矩陣,如圖所示?;叶裙采仃囯m然提供了圖像灰度方向、間隔和變化幅度的信息。但灰度共生矩陣不能直接提供區(qū)別紋理的特性,因此需要在灰度共生矩陣的基礎(chǔ)上計(jì)算特征,常見的特征有均值、方差、標(biāo)準(zhǔn)差、同質(zhì)度、對(duì)比度、非相似性、熵、能量、角二階矩等。了解圖像的紋理特征通過scikits-image中的greycomatrix函數(shù)可以計(jì)算灰度共生矩陣,語法格式如下。skimage.feature.greycomatrix(image,distances,angles,levels=256,symmetric=False,normed=False)greycomatrix函數(shù)參數(shù)名稱及其說明如下表所示。了解圖像的紋理特征參數(shù)名稱說明images接收array,表示需要計(jì)算灰度共生矩陣的二維圖像,無默認(rèn)值distances接收array,表示像素對(duì)距離偏移量,無默認(rèn)值angles接收array,表示以弧度為單位的像素對(duì)角度,無默認(rèn)值levels接收int,表示表示計(jì)數(shù)的灰度級(jí)數(shù),默認(rèn)為256symmetric接收bool,表示輸出灰度共生矩陣是否需要對(duì)稱,默認(rèn)為Falsenormed接收bool,表示輸出灰度共生矩陣是否需要?dú)w一化,默認(rèn)為False通過scikits-image中的greycoprops函數(shù)可以計(jì)算部分灰度共生矩陣特征,語法格式如下。skimage.feature.greycoprops(P,prop='contrast')greycoprops函數(shù)參數(shù)名稱及其說明如下表所示。了解圖像的紋理特征參數(shù)名稱說明P接收array,表示輸入的灰度共生矩陣,無默認(rèn)值prop接收str,表示要計(jì)算的特征值,默認(rèn)為“contrast”編寫并運(yùn)行相應(yīng)代碼得到灰度共生矩的特征如下表所示。從該表可以看出,圖像并不具備較為明顯的紋理特征。同時(shí),能量和角二階矩的值較小,表明圖像灰度分布不均勻,像素隨機(jī)性比較大。了解圖像的紋理特征參數(shù)名稱contrast對(duì)比度dissimilarity非相似性homogeneity同質(zhì)度energy能量correlation相關(guān)性ASM角二階矩值84.5105.3310.4130.0430.9830.001局部二值模式(LocalBinaryPattern,LBP)通過計(jì)算固定窗口中心像素點(diǎn)灰度值與其周圍鄰域像素點(diǎn)灰度值的大小關(guān)系來反映圖像的微觀結(jié)構(gòu)。LBP方法已經(jīng)成為紋理特征提取和人臉特征提取的主要方法之一,并在這兩個(gè)問題中得到充分的研究和應(yīng)用。最原始的LBP方法定義在某中心像素及其周圍大小為3×3的矩形鄰域系統(tǒng)上。了解圖像的紋理特征2.局部二值模式為保留圖像中像素間的信息,以中心像素的灰度值為閾值,將鄰域內(nèi)所有像素的灰度值進(jìn)行二值化。大于或等于閾值的像素值編碼為1,小于閾值的像素值編碼為0,因此該方法稱為局部二值模式。以鄰域內(nèi)左上角的元素為起始點(diǎn),順時(shí)針或逆時(shí)針依次讀取二值化后的像素值,從而構(gòu)成一個(gè)8位的二進(jìn)制數(shù)字。將得到的二進(jìn)制數(shù)字轉(zhuǎn)為十進(jìn)制數(shù)字,并作為中心像素的新值。LBP的計(jì)算過程如下圖所示。了解圖像的紋理特征針對(duì)3×3的矩形鄰域中,無法捕獲大尺度的紋理結(jié)構(gòu)和特征不具備旋轉(zhuǎn)不變性,提出了具有不同尺寸的圓形鄰域和旋轉(zhuǎn)不變LBP,此處不展開進(jìn)行介紹。使用原始LBP提取圖像特征,得到的紋理特征圖像如下圖所示,其中(a)為原圖,(b)為紋理特征圖像。從圖(b)中可以看出,圖像中包含了一個(gè)戴著帽子的人,并且人物眼睛、鼻子、嘴巴均被較為清晰的表現(xiàn)出來。了解圖像的紋理特征在醫(yī)學(xué)視覺的圖像中,通過對(duì)組織病理切片的顯微圖像進(jìn)行分析,從而得到病灶的詳細(xì)情況,是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。圖像可能具有大量的層間變異、結(jié)構(gòu)形態(tài)多樣性導(dǎo)致的豐富的幾何結(jié)構(gòu)和復(fù)雜的紋理。4張組織切片圖像如圖所示,其中第1、2張圖像來自同一張圖像,第3、4張圖像來自同一張圖像。從該圖中可以看出,第1、2張圖像中不同的區(qū)域具有較為清晰邊界,同一區(qū)域中顏色分布均勻;第3、4張圖像各區(qū)域分布混亂沒有規(guī)律。因此可以計(jì)算圖像的紋理特征對(duì)其進(jìn)行分類。提取組織切片圖像的紋理特征計(jì)算組織切片圖像灰度共生矩陣,并提取特征值和計(jì)算相關(guān)矩陣,得到特征值相關(guān)矩陣如表所示。從該表可以看出,4張圖像的特征值都是高度相關(guān)的,均超過了99%,表明在本案例中采用灰度相關(guān)矩陣計(jì)算特征值并不能較好的對(duì)圖像進(jìn)行分類。但是,除了與自身的相關(guān)系數(shù)外,第1張圖像與第2張圖像的相關(guān)系數(shù)會(huì)高于與第3、4張圖像的相關(guān)系數(shù),第3張圖像與第4張圖像的相關(guān)系數(shù)會(huì)高于與第1、2張圖像的相關(guān)系數(shù)。因此可以得到結(jié)論:第1張圖像與第2張圖像更加類似,第3張圖像與第4張圖像更加類似。結(jié)論與實(shí)際情況相符。提取組織切片圖像的紋理特征參數(shù)名稱123411.0000000.9999690.9997470.99971120.9999691.0000000.9997190.99968630.9997470.9997191.0000000.99999940.9997110.9996860.9999991.0000001提取圖像的紋理特征目錄提取圖像的顏色特征2提取圖像的輪廓特征3提取圖像的形狀特征4從人類認(rèn)知事物的角度來看,目標(biāo)的特征描述和相似性評(píng)價(jià)是目標(biāo)識(shí)別中兩個(gè)關(guān)鍵環(huán)節(jié)。輪廓作為描述目標(biāo)特征的一種主要方式,在目標(biāo)識(shí)別中發(fā)揮著重要作用。因此,如何有效描述輪廓特征以及合理評(píng)價(jià)特征之間相似程度對(duì)于獲得目標(biāo)識(shí)別的最佳結(jié)果至關(guān)重要。輪廓檢測(cè)得到的是一系列相連的點(diǎn)組成的曲線,代表了物體的基本外形,相對(duì)于邊緣,輪廓是連續(xù)的,邊緣并不全部連續(xù)。輪廓是圖像目標(biāo)的典型特征,可以簡(jiǎn)單地解釋為連接具有相同顏色或強(qiáng)度的所有連續(xù)點(diǎn)(沿邊界)的曲線,是用于形狀分析以及對(duì)象檢測(cè)和識(shí)別的有用工具。輪廓檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域的重要研究方向,在一些實(shí)際性問題中起到了重要作用,如場(chǎng)景理解。了解圖像的輪廓特征在OpenCV中,定義了輪廓彼此之間具有某種關(guān)系,用于指定一個(gè)輪廓如何相互連接,例如,輪廓的子輪廓、父輪廓等。這種關(guān)系的表示稱為輪廓的層次結(jié)構(gòu),如下圖所示。0~5的編號(hào)表達(dá)了不同的輪廓。輪廓2和2a表示最外面的矩形框的外部和內(nèi)部輪廓。輪廓0、1、2不被其他任何輪廓包括,因此處于相同的層次結(jié)構(gòu)級(jí)別中。輪廓2a可以視為輪廓2的子級(jí)或?qū)⑤喞?視為輪廓2a的父級(jí)。輪廓3是輪廓2的子級(jí),位于下一個(gè)層次結(jié)構(gòu)中。輪廓4、5是輪廓3a的子級(jí),位于最后的層次結(jié)構(gòu)級(jí)別。了解圖像的輪廓特征通過OpenCV中的findContours函數(shù)可以檢測(cè)圖像的輪廓,語法格式如下。findContours函數(shù)參數(shù)名稱及其說明如下表所示。了解圖像的輪廓特征參數(shù)名稱說明image接收array,表示用于提取輪廓的圖像,常接收二值圖像,無默認(rèn)值mode接收int或檢測(cè)模式,表示輪廓的檢測(cè)模式,無默認(rèn)值method接收int或近似模式,表示輪廓的近似方法,無默認(rèn)值contours接收點(diǎn)的向量集合,表示輪廓檢測(cè)的其中一個(gè)輸出,每一組點(diǎn)集就是一個(gè)輪廓,無默認(rèn)值hierarchy接收array,表示輪廓檢測(cè)的另一個(gè)輸出,記錄輪廓之間的關(guān)系,四個(gè)維度分別代表同級(jí)后一個(gè)輪廓的序號(hào)、同級(jí)上一個(gè)輪廓的序號(hào)、第一個(gè)子輪廓序號(hào)和父輪廓序號(hào),無默認(rèn)值offset接收int,表示輪廓信息相對(duì)于原始圖像對(duì)應(yīng)點(diǎn)的偏移量,無默認(rèn)值cv.findContours(image,mode,method[,contours[,hierarchy[,offset]]])通過OpenCV中的drawContours函數(shù)可以繪制出檢測(cè)到的輪廓,語法格式如下。drawContours函數(shù)的參數(shù)名稱及其說明如下表所示。了解圖像的輪廓特征參數(shù)名稱說明image接收array,表示待繪制輪廓的原圖像,無默認(rèn)值contours接收點(diǎn)的向量集合,表示輪廓的集合,無默認(rèn)值contourIdx接收int,表示待繪制的輪廓的索引,無默認(rèn)值color接收Scalar,表示繪制輪廓的線條的顏色,無默認(rèn)值thickness接收int,表示繪制輪廓的線條的粗細(xì),默認(rèn)為1lineType接收int,表示繪制輪廓的線條的類型,默認(rèn)為L(zhǎng)INE_8hierarchy接收array,表示輪廓級(jí)別序號(hào)的列表,無默認(rèn)值maxLevel接收int,表示繪制輪廓的最大級(jí)別,默認(rèn)為輪廓中的最大級(jí)別offset接收int,表示輪廓信息相對(duì)于原始圖像對(duì)應(yīng)點(diǎn)的偏移量,無默認(rèn)值cv2.drawContours(image,contours,contourIdx,color[,thickness[,lineType[,hierarchy[,maxLevel[,offset]]]]])基于OpenCV實(shí)現(xiàn)輪廓檢測(cè),得到的結(jié)果如圖所示。在圖中,檢測(cè)得到的僅是圖像的外輪廓,可以通過修改findContours函數(shù)中的mode參數(shù)檢測(cè)不同層級(jí)的圖像輪廓,如全部層級(jí)的輪廓、僅外層輪廓等。了解圖像的輪廓特征智能分揀系統(tǒng)是智能制造中物料搬運(yùn)系統(tǒng)的一個(gè)重要分支,廣泛應(yīng)用于各個(gè)行業(yè)的生產(chǎn)物流系統(tǒng)或物流配送中心,是智能制造的重要組成部分。實(shí)現(xiàn)電容零件的自動(dòng)分揀的前提是對(duì)電容零件的定位,電容零件的圖像如右上圖所示。通過檢測(cè)輪廓可以輔助零件的定位,得到的結(jié)果如右下圖所示。從右下圖可以看出,待定位的電容零件的輪廓被較為準(zhǔn)確的檢測(cè)到,并顯示出明顯的矩形,但是由于零件的原圖較為模糊,導(dǎo)致零件與零件的輪廓融合為一個(gè)整體。因?yàn)榱慵母┮晥D是一個(gè)較為規(guī)則的矩形,所以在后續(xù)的定位步驟中,重點(diǎn)便在于該矩形的4個(gè)角點(diǎn)的定位,可以通過對(duì)輪廓圖像進(jìn)行直線檢測(cè)實(shí)現(xiàn)角點(diǎn)的定位,兩對(duì)平行線段相互垂直的交點(diǎn)即為角點(diǎn)。提取電容零件圖像的輪廓特征1提取圖像的紋理特征目錄提取圖像的顏色特征2提取圖像的輪廓特征3提取圖像的形狀特征4形狀通常與圖像中的特定目標(biāo)對(duì)象有關(guān),是人們的視覺系統(tǒng)對(duì)目標(biāo)的最初認(rèn)識(shí),有一定的語義信息,被認(rèn)為是比顏色特征和紋理特征更高一層的特征。形狀特征是圖像的核心特征之一,圖像的形狀信息不隨圖像顏色的變化而變化,是物體的穩(wěn)定特征。形狀特征可以非常直觀的區(qū)分不同的物體,是用于對(duì)圖像進(jìn)行分類的主要特征之一。通過構(gòu)建不同的大小的檢測(cè)窗口或生成不同圖像,使得不同大小的形狀特征均可被檢測(cè)到。在人臉檢測(cè)、目標(biāo)檢測(cè)中常用的形狀特征包括HOG特征、SIFT特征、Haar特征等。了解圖像的形狀特征HOG特征在對(duì)象識(shí)別與模式匹配中是一種常見的特征提取算法,是基于像素塊進(jìn)行特征直方圖提取的一種算法,對(duì)于對(duì)象局部的變形與光照影響有很好的穩(wěn)定性。其主要思想是在一副圖像中,局部目標(biāo)的表象和形狀(appearanceandshape)能夠被梯度或邊緣的方向密度分布很好地描述。HOG特征提取的流程主要包括以下幾個(gè)步驟。了解圖像的形狀特征1.

HOG特征伽馬矯正圖像梯度計(jì)算計(jì)算梯度直方圖特征向量歸一化(1)伽馬矯正首先將彩色圖像轉(zhuǎn)為灰度圖像,降低計(jì)算特征時(shí)所需的計(jì)算資源。轉(zhuǎn)為灰度圖像是可選操作,對(duì)于彩色圖像,可以分別對(duì)三顏色通道進(jìn)行特征計(jì)算。然后進(jìn)行伽馬(Gamma)矯正,主要用于增強(qiáng)圖像,提升圖像的暗部細(xì)節(jié)。伽馬矯正通過非線性變換,讓圖像從對(duì)曝光強(qiáng)度的線性相應(yīng)變得更接近人眼感受到的響應(yīng)。了解圖像的形狀特征(2)圖像梯度計(jì)算為了衡量圖像的灰度變化率,還需要計(jì)算圖像的梯度,梯度的計(jì)算分為水平和垂直兩個(gè)方向。圖像中像素點(diǎn)的水平和垂直方向的梯度,如下式所示,其中表示處的像素值。梯度幅值的計(jì)算公式與方向的計(jì)算公式分別如下式所示。了解圖像的形狀特征(3)計(jì)算梯度直方圖首先將圖像劃分成若干個(gè)塊(Block),每個(gè)塊由4(2×2)個(gè)細(xì)胞單元(cell)組成,每個(gè)細(xì)胞單元由64(8×8)個(gè)的單位像素(Pixel)組成。圖像中塊和細(xì)胞單元的劃分,如圖所示。了解圖像的形狀特征在HOG特征提取中,將一個(gè)塊視為一個(gè)滑動(dòng)窗口,滑動(dòng)步長(zhǎng)為一個(gè)細(xì)胞單元。假設(shè)一張?jiān)紙D像的大小為64×128,則從左到右滑動(dòng)窗口7次即可滑到圖像的最右邊,從上往下滑動(dòng)窗口15次即可滑到圖像的最下邊,因此整個(gè)圖像可以分為105(7×15)個(gè)塊。HOG特征提取窗口的滑動(dòng)過程,如右下圖所示。了解圖像的形狀特征通過計(jì)算得到一個(gè)細(xì)胞單元像素的梯度值和方向值如下圖所示。了解圖像的形狀特征在計(jì)算像素的梯度直方圖中,將角度范圍分成9份,對(duì)應(yīng)的角度為0、20、40、……、160度。需要注意的是,角度的范圍介于0到180度之間,而不是0到360度,這被稱為“無符號(hào)”梯度,兩個(gè)完全相反的方向被認(rèn)為是相同的。梯度直方圖的計(jì)算過程,如右圖所示。在中,角度為80度的像素的梯度值為2,所以在直方圖80度對(duì)應(yīng)的區(qū)間加上2。角度為10度的像素的梯度值為4,由于10度介于0度和20度之間,所以梯度值4被按比例分給0度和20度對(duì)應(yīng)的區(qū)間,即各區(qū)間加2。了解圖像的形狀特征(4)特征向量歸一化將一個(gè)塊內(nèi)所有細(xì)胞單元的特征向量串聯(lián)即可得到該塊的HOG特征。為消除光照變化和前后景對(duì)比度的變化帶來的影響,對(duì)每個(gè)塊進(jìn)行L2歸一化。歸一化后的塊描述符(向量)稱之為HOG描述符,則64×128大小的圖像共有7×15×4×9=3780個(gè)特征描述符。通過scikits-image中的hog函數(shù)可以提取HOG特征,語法格式如下。了解圖像的形狀特征skimage.feature.hog(image,orientations=9,pixels_per_cell=(8,8),cells_per_block=(3,3),block_norm='L2-Hys',visualize=False,transform_sqrt=False,feature_vector=True,multichannel=None,*,channel_axis=None)hog函數(shù)參數(shù)名稱及其說明如下表所示。了解圖像的形狀特征參數(shù)名稱說明image接收array,表示輸入的圖像,無默認(rèn)值orientations接收int,表示梯度方向劃分的個(gè)數(shù),默認(rèn)為9pixels_per_cell接收tuple,表示一個(gè)細(xì)胞單元的大小,默認(rèn)為(8,8)cells_per_block接收tuple,表示一個(gè)塊中有多少細(xì)胞單元,默認(rèn)為(3,3)block_norm接收“L1”“L1-sqrt”“L2”“L2-Hys”,表示歸一化的方法,默認(rèn)為“L2-Hys”visualize接收bool,表示是否同時(shí)返回HOG的圖像,默認(rèn)為Falsetransform_sqrt接收bool,表示是否在處理之前應(yīng)用冪律壓縮來規(guī)范化圖像,默認(rèn)為Falsefeature_vector接收bool,表示是否將數(shù)據(jù)作為特征向量返回,默認(rèn)為Truemultichannel接收bool,表示最后一個(gè)圖像維度視為顏色通道,默認(rèn)為Nonechannel_axis接收int,表示數(shù)組的哪個(gè)維度對(duì)應(yīng)于通道,默認(rèn)為None使用hog函數(shù)檢測(cè)HOG特征,得到的結(jié)果如下圖所示,其中(a)為原圖,(b)為檢測(cè)到的HOG特征。從圖中可以看出,提取的HOG特征像一根根細(xì)小的針,特征主要分布在圖像的邊緣處,圖像邊緣處像素的變化越大,則特征的顏色越深。了解圖像的形狀特征尺度不變特征轉(zhuǎn)換算法(Scale-invariantfeaturetransform,SIFT)由羅威(DavidLowe)在1999年發(fā)表并于2004年完善,常用于偵測(cè)和描述影像中的局部特征性,應(yīng)用于物體識(shí)別、機(jī)器人地圖感知與導(dǎo)航和影像追蹤等。SIFT算法包括以下四個(gè)步驟。了解圖像的形狀特征2.

SIFT特征構(gòu)建圖像金字塔關(guān)鍵點(diǎn)檢測(cè)確定關(guān)鍵點(diǎn)方向特征描述符(1)構(gòu)建圖像金字塔使用高斯金字塔表示尺度空間,尺度空間方法將傳統(tǒng)的單尺度圖像信息處理技術(shù)納入尺度不斷變化的動(dòng)態(tài)分析框架中,更容易獲取圖像的本質(zhì)特征。尺度空間中各尺度圖像的模糊程度逐漸變大,能夠模擬人在距離目標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過程。高斯金字塔的建立包括:對(duì)圖像做不同尺度的高斯模糊;對(duì)圖像做降采樣。通過對(duì)原始圖像不斷地降采樣,得到一系列大小不一的圖像,由大到小、從下到上構(gòu)成了金字塔狀的模型,如右圖所示。了解圖像的形狀特征在上張圖中,σ是尺度空間因子,值越小表示圖像被平滑的越少。金字塔的每層含有多張高斯模糊圖像,將金字塔中每層內(nèi)的多張圖像合稱為一組(Octave),金字塔每層只有一組圖像,總的組數(shù)和金字塔的層數(shù)相等。尺度歸一化的高斯拉普拉斯函數(shù)的極大值和極小值夠產(chǎn)生較為穩(wěn)定的圖像特征,同時(shí)高斯差分函數(shù)(DoG算子)與尺度歸一化的高斯拉普拉斯函數(shù)非常近似。將高斯金字塔每層中相鄰的兩張圖像相減,即可生成高斯差分金字塔,如右圖所示。了解圖像的形狀特征(2)關(guān)鍵點(diǎn)檢測(cè)關(guān)鍵點(diǎn)是由DoG金字塔的局部極值點(diǎn)組成的,關(guān)鍵點(diǎn)的初步探查通過DoG金字塔同一組內(nèi)相鄰兩張圖像之間的比較完成。為了尋找極值點(diǎn),每一個(gè)像素點(diǎn)要和它所有的相鄰點(diǎn)進(jìn)行比較,如右圖所示,中間的檢測(cè)點(diǎn)和它同尺度的8個(gè)相鄰點(diǎn)和上下相鄰尺度對(duì)應(yīng)的9×2個(gè)點(diǎn)共26個(gè)點(diǎn)比較,以確保在尺度空間和二維離散空間都檢測(cè)到極值點(diǎn)。了解圖像的形狀特征在DoG金字塔中檢測(cè)到的極值點(diǎn)是二維離散空間的極值點(diǎn)。離散空間極值點(diǎn)與連續(xù)空間極值點(diǎn)的差別,如右圖所示,其中以豎線與x軸相連的點(diǎn)為離散空間的點(diǎn)。使用子像素插值的方法,在離散空間插值得到連續(xù)空間極值點(diǎn),從而精確確定關(guān)鍵點(diǎn)的位置和尺度。在關(guān)鍵點(diǎn)檢測(cè)中會(huì)剔除不穩(wěn)定的邊緣響應(yīng)點(diǎn)。剔除邊緣響應(yīng)點(diǎn)主要有兩個(gè)原因:一方面圖像邊緣上的點(diǎn)難以精準(zhǔn)定位,具有定位歧義性;另一方面邊緣點(diǎn)很容易受到噪聲的干擾而變得不穩(wěn)定。了解圖像的形狀特征(3)確定關(guān)鍵點(diǎn)方向?yàn)榱耸姑枋龇哂行D(zhuǎn)不變性,需要利用圖像的局部特征為給每一個(gè)關(guān)鍵點(diǎn)分配一個(gè)基準(zhǔn)方向。使用直方圖統(tǒng)計(jì)鄰域內(nèi)像素的幅值和方向,方向直方圖將0~360度的方向范圍分為36個(gè)區(qū)間(柱),其中每個(gè)區(qū)間10度。直方圖的峰值方向代表了關(guān)鍵點(diǎn)的主方向,一個(gè)簡(jiǎn)化的方向直方圖如下圖所示,圖中只畫了八個(gè)方向的直方圖。方向直方圖的峰值則代表了該特征點(diǎn)處鄰域梯度的方向,以直方圖中最大值作為該關(guān)鍵點(diǎn)的主方向。為了增強(qiáng)匹配的魯棒性,保留峰值大于主方向峰值80%的方向作為該關(guān)鍵點(diǎn)的輔方向。了解圖像的形狀特征(4)特征描述符通過以上3個(gè)步驟,檢測(cè)到的關(guān)鍵點(diǎn)即為圖像的SIFT特征點(diǎn)。對(duì)于檢測(cè)到的特征點(diǎn)需要進(jìn)行數(shù)學(xué)層面的特征描述,即構(gòu)建特征描述符,用于后續(xù)的圖像匹配。構(gòu)建特征描述符主要包括以下幾個(gè)步驟。了解圖像的形狀特征確定計(jì)算描述子所需的區(qū)域。計(jì)算特征點(diǎn)鄰域范圍內(nèi)各點(diǎn)的梯度方向和梯度的幅值。將關(guān)鍵點(diǎn)的周圍區(qū)域分成16(4×4)塊,分別計(jì)算每個(gè)塊的梯度直方圖。對(duì)梯度直方圖進(jìn)行歸一化處理,減小光照對(duì)描述子的影響。在OpenCV中,通過SIFT_create函數(shù)創(chuàng)建特征檢測(cè)對(duì)象,其語法格式如下。SIFT_create函數(shù)的參數(shù)說明如下表所示。了解圖像的形狀特征參數(shù)名稱說明nfeatures接收int。表示保留最佳特性的數(shù)量。默認(rèn)為0noctaveLayers接收int。表示高斯金字塔最小層級(jí)數(shù)。默認(rèn)為3contrastThreshold接收double。表示對(duì)比度閾值用于過濾區(qū)域中的弱特征。默認(rèn)為0.04edgeThreshold接收double。表示用于過濾類似邊緣特征的閾值。默認(rèn)為10sigma接收double。表示高斯輸入層級(jí)。默認(rèn)為1.6cv2.SIFT_create([,nfeatures[,nOctaveLayers[,contrastThreshold[,edgeThreshold[,sigma]]]]])在OpenCV中,通過detectAndCompute函數(shù)實(shí)現(xiàn)在圖像上檢測(cè)SIFT特征點(diǎn),其語法格式如下。detectAndCompute函數(shù)會(huì)返回kp和des兩個(gè)對(duì)象,kp表示檢測(cè)到的SIFT特征點(diǎn),des表示計(jì)算的描述符,detectAndCompute函數(shù)的參數(shù)說明如下表所示。了解圖像的形狀特征參數(shù)名稱說明image接收array。表示輸入的圖像。無默認(rèn)值mask接收array。表示輸入的掩模。無默認(rèn)值descriptors接收array。表示計(jì)算描述符。無默認(rèn)值useProvidedKeypoints接收bool。表示使用提供的關(guān)鍵點(diǎn)。默認(rèn)為falsecv2.detectAndCompute(image,mask[,descriptors[,useProvidedKeypoints]])使用SIFT_create函數(shù)和detectAndCompute函數(shù)檢測(cè)SIFT特征,得到的結(jié)果如下圖所示,其中(a)為原圖,(b)為繪制了SIFT特征的圖像。從該圖可以看出,被檢測(cè)到的特征點(diǎn)主要分布在色彩斑駁的綠色植被覆蓋區(qū)域,背景的天空基本沒有特征點(diǎn)。了解圖像的形狀特征(1)Haar特征Haar特征是一種用于目標(biāo)檢測(cè)或識(shí)別的圖像特征描述子,Haar特征通常和AdaBoost分類器組合使用。Haar特征提取的實(shí)時(shí)性以及AdaBoost分類的準(zhǔn)確率,使其成為人臉檢測(cè)以及識(shí)別領(lǐng)域較為經(jīng)典的算法。Haar特征最早由帕帕喬治奧(Papageorigiou)等人提出。在2001年維奧拉(Viola)和瓊斯(Jones)在原基礎(chǔ)上提出了多種形式的Haar特征,拓展成為Haar-like。了解圖像的形狀特征3.Haar特征最終由林哈特(Lienhart)等人對(duì)Haar矩形特征做了進(jìn)一步的擴(kuò)展,加入了旋轉(zhuǎn)45度的矩形特征,形成了OpenCV現(xiàn)在的Haar分類器。目前常用的Harr-Like特征如下圖所示,主要分為邊緣特征、線特征、點(diǎn)特征和對(duì)角線特征。特征模板內(nèi)有白色和黑色兩種矩形,并定義該模板的特征值為白色矩形中像素值之和與黑色矩形中像素值之和的差值,其中白色區(qū)域的權(quán)值為正值,黑色區(qū)域的權(quán)值為負(fù)值。了解圖像的形狀特征權(quán)值與矩形區(qū)域的面積成反比,從而抵消兩種矩形區(qū)域面積不等造成的影響,保證Haar特征值在灰度分布均勻的區(qū)域特征值趨近于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論