sift算法詳解及應(yīng)用_第1頁(yè)
sift算法詳解及應(yīng)用_第2頁(yè)
sift算法詳解及應(yīng)用_第3頁(yè)
sift算法詳解及應(yīng)用_第4頁(yè)
sift算法詳解及應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2024/3/101/60尺度不變特征變換匹配算法

ScaleInvariantFeatureTransform

〔SIFT〕宋丹

109050562024/3/102SIFT簡(jiǎn)介SIFT算法實(shí)現(xiàn)細(xì)節(jié)提綱SIFT算法的應(yīng)用領(lǐng)域SIFT算法的擴(kuò)展與改進(jìn)2024/3/103SIFT簡(jiǎn)介

傳統(tǒng)的特征提取方法

成像匹配的核心問(wèn)題是將同一目標(biāo)在不同時(shí)間、不同分辨率、不同光照、不同位姿情況下所成的像相對(duì)應(yīng)。傳統(tǒng)的匹配算法往往是直接提取角點(diǎn)或邊緣,對(duì)環(huán)境的適應(yīng)能力較差,急需提出一種魯棒性強(qiáng)、能夠適應(yīng)不同光照、不同位姿等情況下能夠有效識(shí)別目標(biāo)的方法。2024/3/1041999年BritishColumbia大學(xué)大衛(wèi).勞伊〔DavidG.Lowe〕教授總結(jié)了現(xiàn)有的基于不變量技術(shù)的特征檢測(cè)方法,并正式提出了一種基于尺度空間的、對(duì)圖像縮放、旋轉(zhuǎn)甚至仿射變換保持不變性的圖像局部特征描述算子-SIFT〔尺度不變特征變換〕,這種算法在2004年被加以完善。SIFT提出的目的和意義DavidG.LoweComputerScienceDepartment

2366MainMall

UniversityofBritishColumbia

Vancouver,B.C.,V6T1Z4,CanadaE-mail:lowe@cs.ubc.ca

SIFT簡(jiǎn)介2024/3/105SIFT簡(jiǎn)介將一幅圖像映射〔變換〕為一個(gè)局部特征向量集;特征向量具有平移、縮放、旋轉(zhuǎn)不變性,同時(shí)對(duì)光照變化、仿射及投影變換也有一定不變性。OriginalimagecourtesyofDavidLowe2024/3/106SIFT簡(jiǎn)介SIFT算法特點(diǎn)SIFT特征是圖像的局部特征,其對(duì)旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對(duì)視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。

獨(dú)特性(Distinctiveness)好,信息量豐富,適用于在海量特征數(shù)據(jù)庫(kù)中進(jìn)行快速、準(zhǔn)確的匹配。

多量性,即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量SIFT特征向量。經(jīng)過(guò)優(yōu)化的SIFT算法可滿足一定的速度需求。

可擴(kuò)展性,可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合。

2024/3/107

目標(biāo)的自身狀態(tài)、場(chǎng)景所處的環(huán)境和成像器材的成像特性等因素影響圖像配準(zhǔn)/目標(biāo)識(shí)別跟蹤的性能。而SIFT算法在一定程度上可解決:目標(biāo)的旋轉(zhuǎn)、縮放、平移〔RST〕圖像仿射/投影變換〔視點(diǎn)viewpoint〕光照影響〔illumination〕目標(biāo)遮擋〔occlusion〕雜物場(chǎng)景〔clutter〕噪聲SIFT算法可以解決的問(wèn)題SIFT簡(jiǎn)介Back2024/3/108SIFT算法實(shí)現(xiàn)細(xì)節(jié)

SIFT算法實(shí)現(xiàn)步驟簡(jiǎn)述SIFT算法的實(shí)質(zhì)可以歸為在不同尺度空間上查找特征點(diǎn)〔關(guān)鍵點(diǎn)〕的問(wèn)題。

SIFT算法實(shí)現(xiàn)物體識(shí)別主要有三大工序,1、提取關(guān)鍵點(diǎn);2、對(duì)關(guān)鍵點(diǎn)附加詳細(xì)的信息〔局部特征〕也就是所謂的描述器;3、通過(guò)兩方特征點(diǎn)〔附帶上特征向量的關(guān)鍵點(diǎn)〕的兩兩比較找出相互匹配的假設(shè)干對(duì)特征點(diǎn),也就建立了景物間的對(duì)應(yīng)關(guān)系。2024/3/109

關(guān)鍵點(diǎn)檢測(cè)關(guān)鍵點(diǎn)描述關(guān)鍵點(diǎn)匹配消除錯(cuò)配點(diǎn)SIFT算法實(shí)現(xiàn)細(xì)節(jié)SIFT算法實(shí)現(xiàn)步驟2024/3/1010所謂關(guān)鍵點(diǎn),就是在不同尺度空間的圖像下檢測(cè)出的具有方向信息的局部極值點(diǎn)。根據(jù)歸納,我們可以看出特征點(diǎn)具有的三個(gè)特征:

尺度方向大小關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念1.哪些點(diǎn)是SIFT中要查找的關(guān)鍵點(diǎn)〔特征點(diǎn)〕?這些點(diǎn)是一些十分突出的點(diǎn)不會(huì)因光照條件的改變而消失,比方角點(diǎn)、邊緣點(diǎn)、暗區(qū)域的亮點(diǎn)以及亮區(qū)域的暗點(diǎn),既然兩幅圖像中有相同的景物,那么使用某種方法分別提取各自的穩(wěn)定點(diǎn),這些點(diǎn)之間會(huì)有相互對(duì)應(yīng)的匹配點(diǎn)。2024/3/1011

我們要精確表示的物體都是通過(guò)一定的尺度來(lái)反映的?,F(xiàn)實(shí)世界的物體也總是通過(guò)不同尺度的觀察而得到不同的變化。尺度空間理論最早在1962年提出,其主要思想是通過(guò)對(duì)原始圖像進(jìn)行尺度變換,獲得圖像多尺度下的尺度空間表示序列,對(duì)這些序列進(jìn)行尺度空間主輪廓的提取,并以該主輪廓作為一種特征向量,實(shí)現(xiàn)邊緣、角點(diǎn)檢測(cè)和不同分辨率上的特征提取等。尺度空間中各尺度圖像的模糊程度逐漸變大,能夠模擬人在距離目標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過(guò)程。尺度越大圖像越模糊。2.什么是尺度空間〔scalespace〕?關(guān)鍵點(diǎn)檢測(cè)的關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1012根據(jù)文獻(xiàn)《Scale-spacetheory:Abasictoolforanalysingstructuresatdifferentscales》我們可知,高斯核是唯一可以產(chǎn)生多尺度空間的核,一個(gè)圖像的尺度空間,L〔x,y,σ),定義為原始圖像I(x,y)與一個(gè)可變尺度的2維高斯函數(shù)G(x,y,σ)卷積運(yùn)算。關(guān)鍵點(diǎn)檢測(cè)高斯函數(shù)尺度是自然存在的,不是人為創(chuàng)造的!高斯卷積只是表現(xiàn)尺度空間的一種形式…關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/10133.高斯模糊

高斯模糊是在AdobePhotoshop等圖像處理軟件中廣泛使用的處理效果,通常用它來(lái)減小圖像噪聲以及降低細(xì)節(jié)層次。這種模糊技術(shù)生成的圖像的視覺(jué)效果是好似經(jīng)過(guò)一個(gè)半透明的屏幕觀察圖像。

關(guān)鍵點(diǎn)檢測(cè)關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1014關(guān)鍵點(diǎn)檢測(cè)r為模糊半徑,

在減小圖像尺寸的場(chǎng)合經(jīng)常使用高斯模糊。在進(jìn)行欠采樣的時(shí),通常在采樣之前對(duì)圖像進(jìn)行低通濾波處理。這樣就可以保證在采樣圖像中不會(huì)出現(xiàn)虛假的高頻信息。

關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1015在實(shí)際應(yīng)用中,在計(jì)算高斯函數(shù)的離散近似時(shí),在大概3σ距離之外的像素都可以看作不起作用,這些像素的計(jì)算也就可以忽略。通常,圖像處理程序只需要計(jì)算關(guān)鍵點(diǎn)檢測(cè)高斯模板大小的選擇0.000000670.000022920.000191170.000387710.000191170.000022920.000000670.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000191170.006559650.054721570.110981640.054721570.006559650.000191170.000387710.013303730.110981640.225083520.110981640.013303730.000387710.000191170.006559650.054721570.110981640.054721570.006559650.000191170.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000000670.000022920.000191170.000387710.000191170.000022920.00000067高斯模板關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1016高斯模糊具有圓對(duì)稱性。高斯模糊具有線性可分的性質(zhì),也可以在二維圖像上對(duì)兩個(gè)獨(dú)立的一維空間分別進(jìn)行計(jì)算。這樣可以大大減少了運(yùn)算的次數(shù)。對(duì)一幅圖像進(jìn)行屢次連續(xù)高斯模糊的效果與一次更大的高斯模糊可以產(chǎn)生同樣的效果,大的高斯模糊的半徑是所用多個(gè)高斯模糊半徑平方和的平方根。例如,使用半徑分別為6和8的兩次高斯模糊變換得到的效果等同于一次半徑為10的高斯模糊效果,根據(jù)這個(gè)關(guān)系,使用多個(gè)連續(xù)較小的高斯模糊處理不會(huì)比單個(gè)高斯較大處理時(shí)間要少。高斯模糊的性質(zhì)關(guān)鍵點(diǎn)檢測(cè)關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1017高斯金子塔的構(gòu)建過(guò)程可分為兩步:〔1〕對(duì)圖像做高斯平滑;〔2〕對(duì)圖像做降采樣。

為了讓尺度表達(dá)其連續(xù)性,在簡(jiǎn)單下采樣的根底上加上了高斯濾波。一幅圖像可以產(chǎn)生幾組〔octave〕圖像,一組圖像包括幾層〔interval〕圖像。4.高斯金字塔關(guān)鍵點(diǎn)檢測(cè)關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1018高斯圖像金字塔共o組、s層,那么有:關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念σ——尺度空間坐標(biāo);s——sub-level層坐標(biāo);σ0——初始尺度;S——每組層數(shù)〔一般為3~5〕。2024/3/1019高斯金字塔的初始尺度當(dāng)圖像通過(guò)相機(jī)拍攝時(shí),相機(jī)的鏡頭已經(jīng)對(duì)圖像進(jìn)行了一次初始的模糊,所以根據(jù)高斯模糊的性質(zhì):M、N分別為圖像的行數(shù)和列數(shù)——第0層尺度——被相機(jī)鏡頭模糊后的尺度高斯金字塔的組數(shù)關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1020高斯金字塔的組內(nèi)尺度與組間尺度組內(nèi)尺度是指同一組〔octave〕內(nèi)的尺度關(guān)系,組內(nèi)相鄰層尺度化簡(jiǎn)為:組間尺度是指不同組直接的尺度關(guān)系,相鄰組的尺度可化為:

由此可見(jiàn),相鄰兩組的同一層尺度為2倍的關(guān)系關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1021最后可將組內(nèi)和組間尺度歸為:i——金字塔組數(shù)n——每一組的層數(shù)關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念2024/3/1022關(guān)鍵點(diǎn)檢測(cè)的相關(guān)概念上一組圖像的底層是由前一組圖像的倒數(shù)第二層圖像隔點(diǎn)采樣生成的。這樣可以保持尺度的連續(xù)性。??為啥?2024/3/1023

關(guān)鍵點(diǎn)檢測(cè)——DOG通過(guò)研究Lowe教授的論文發(fā)現(xiàn),所有特征點(diǎn)的檢測(cè)都是基于了尺度不變的特性,特征點(diǎn)的檢測(cè)占據(jù)了論文的大局部的篇章,具有十分重要的意義!Lindeberg在文獻(xiàn)《Scale-spacetheory:Abasictoolforanalysingstructuresatdifferentscales》指出尺度標(biāo)準(zhǔn)化的LoG算子具有真正的尺度不變性。LoG算子即〔LaplacionofGaussian〕,可以由高斯函數(shù)梯度算子GOG構(gòu)建尺度標(biāo)準(zhǔn)化的GoG算子尺度標(biāo)準(zhǔn)化的LoG算子2024/3/1024LOG算子與高斯核函數(shù)的關(guān)系通過(guò)推導(dǎo)可以看出,LOG算子與高斯核函數(shù)的差有直接關(guān)系,由此引入一種新的算子DOG〔DifferenceofGaussians〕,即高斯差分算子。關(guān)鍵點(diǎn)檢測(cè)——DOG2024/3/1025DoG〔DifferenceofGaussian〕函數(shù) DoG在計(jì)算上只需相鄰尺度高斯平滑后圖像相減,因此簡(jiǎn)化了計(jì)算!關(guān)鍵點(diǎn)檢測(cè)——DOG應(yīng)該是同一組內(nèi)的相鄰層吧?2024/3/1026DoG高斯差分金字塔 對(duì)應(yīng)DOG算子,我們要構(gòu)建DOG金字塔我們可以通過(guò)高斯差分圖像看出圖像上的像素值變化情況?!踩绻麤](méi)有變化,也就沒(méi)有特征。特征必須是變化盡可能多的點(diǎn)?!矰OG圖像描繪的是目標(biāo)的輪廓。關(guān)鍵點(diǎn)檢測(cè)——DOG2024/3/1027關(guān)鍵點(diǎn)檢測(cè)——DOG2024/3/1028在檢測(cè)極值點(diǎn)前對(duì)原始圖像的高斯平滑以致圖像喪失高頻信息,所以Lowe建議在建立尺度空間前首先對(duì)原始圖像長(zhǎng)寬擴(kuò)展一倍,以保存原始圖像信息,增加特征點(diǎn)數(shù)量。在Lowe的論文中,將第0層的初始尺度定為1.6,圖片的初始尺度定為0.5,那么圖像金字塔第0層的實(shí)際尺度為

當(dāng)對(duì)圖像長(zhǎng)寬擴(kuò)展一倍時(shí),便構(gòu)建了-1層,該層尺度為關(guān)鍵點(diǎn)檢測(cè)——DOGP.S.:圖像插值時(shí),選用的插值函數(shù)可以是多種多樣的。2024/3/1029中間的檢測(cè)點(diǎn)和它同尺度的8個(gè)相鄰點(diǎn)和上下相鄰尺度對(duì)應(yīng)的9×2個(gè)點(diǎn)共26個(gè)點(diǎn)比較,以確保在尺度空間和二維圖像空間都檢測(cè)到極值點(diǎn)。DoG的局部極值點(diǎn)關(guān)鍵點(diǎn)是由DOG空間的局部極值點(diǎn)組成的。為了尋找DoG函數(shù)的極值點(diǎn),每一個(gè)像素點(diǎn)要和它所有的相鄰點(diǎn)比較,看其是否比它的圖像域和尺度域的相鄰點(diǎn)大或者小。DoG局部極值檢測(cè)2024/3/1030在極值比較的過(guò)程中,每一組圖像的首末兩層是無(wú)法進(jìn)行極值比較的,為了滿足尺度變化的連續(xù)性,我們?cè)诿恳唤M圖像的頂層繼續(xù)用高斯模糊生成了3幅圖像,高斯金字塔有每組S+3層圖像。DOG金字塔每組有S+2層圖像右圖為不同尺度不同層間極值檢測(cè)示意圖。P.S.:我們只犧牲了-1組的第0層和第N組的最高層DoG局部極值檢測(cè)2024/3/1031DoG局部極值檢測(cè)

關(guān)鍵點(diǎn)精確定位

為了提高關(guān)鍵點(diǎn)的穩(wěn)定性,需要對(duì)尺度空間DoG函數(shù)進(jìn)行曲線擬合。利用DoG函數(shù)在尺度空間的Taylor展開(kāi)式:其極值點(diǎn)

由于DoG值對(duì)噪聲和邊緣較敏感,因此,在上面DoG尺度空間中檢測(cè)到局部極值點(diǎn)還要經(jīng)過(guò)進(jìn)一步的檢驗(yàn)才能精確定位為特征點(diǎn)。2024/3/1032DoG局部極值檢測(cè)上式去除那些比照度較低的不穩(wěn)定極值點(diǎn)。Lowe的試驗(yàn)顯示,所有取值小于0.04的極值點(diǎn)均可拋棄〔像素灰度值范圍[0,1]〕。

在計(jì)算過(guò)程中,分別對(duì)圖像的行、列及尺度三個(gè)量進(jìn)行了修正,其修正結(jié)果如下:為修正值在Lowe的程序中,對(duì)坐標(biāo)進(jìn)行了五次修正。將修正后的結(jié)果代入式

求解得2024/3/1033DoG局部極值檢測(cè)

去除邊緣響應(yīng)僅僅去除低比照度的極值點(diǎn)對(duì)于極值點(diǎn)的對(duì)于特征點(diǎn)穩(wěn)定性是遠(yuǎn)遠(yuǎn)不夠的。DoG函數(shù)在圖像邊緣有較強(qiáng)的邊緣響應(yīng),因此我們還需要排除邊緣響應(yīng)。DoG函數(shù)的〔欠佳的〕峰值點(diǎn)在橫跨邊緣的方向有較大的主曲率,而在垂直邊緣的方向有較小的主曲率。主曲率可以通過(guò)計(jì)算在該點(diǎn)位置尺度的2×2的Hessian矩陣得到,導(dǎo)數(shù)由采樣點(diǎn)相鄰差來(lái)估計(jì):表示DOG金字塔中某一尺度的圖像x方向求導(dǎo)兩次2024/3/1034

在兩特征值相等時(shí)達(dá)最小,隨r的增長(zhǎng)而增長(zhǎng)。Lowe論文中建議r取10。DoG局部極值檢測(cè)D的主曲率和H的特征值成正比,為了防止直接的計(jì)算這些特征值,而只是考慮它們的之間的比率。令為最大特征值,為最小的特征值,那么時(shí)將關(guān)鍵點(diǎn)保存,反之剔除2024/3/1035關(guān)鍵點(diǎn)方向分配

通過(guò)尺度不變性求極值點(diǎn),可以使其具有縮放不變的性質(zhì),利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性,我們可以為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù)方向,從而使描述子對(duì)圖像旋轉(zhuǎn)具有不變性。

像素點(diǎn)的梯度表示梯度幅值:梯度方向:我們通過(guò)求每個(gè)極值點(diǎn)的梯度來(lái)為極值點(diǎn)賦予方向。2024/3/1036關(guān)鍵點(diǎn)方向分配

方向直方圖的生成確定關(guān)鍵點(diǎn)的方向采用梯度直方圖統(tǒng)計(jì)法,統(tǒng)計(jì)以關(guān)鍵點(diǎn)為原點(diǎn),一定區(qū)域內(nèi)的圖像像素點(diǎn)對(duì)關(guān)鍵點(diǎn)方向生成所作的奉獻(xiàn)。2024/3/10371.直方圖以每10度方向?yàn)橐粋€(gè)柱,共36個(gè)柱,柱所代表的方向?yàn)橄袼攸c(diǎn)梯度方向,柱的長(zhǎng)短代表了梯度幅值。

2.根據(jù)Lowe的建議,直方圖統(tǒng)計(jì)半徑采用3*1.5*σ。

3.在直方圖統(tǒng)計(jì)時(shí),每相鄰三個(gè)像素點(diǎn)采用高斯加權(quán),根據(jù)Lowe的建議,模板采用[0.25,0.5,0.25],并連續(xù)加權(quán)兩次。關(guān)鍵點(diǎn)方向分配關(guān)于方向直方圖的幾點(diǎn)說(shuō)明2024/3/1038關(guān)鍵點(diǎn)方向分配關(guān)鍵點(diǎn)主方向:極值點(diǎn)周圍區(qū)域梯度直方圖的主峰值也是特征點(diǎn)方向關(guān)鍵點(diǎn)輔方向:在梯度方向直方圖中,當(dāng)存在另一個(gè)相當(dāng)于主峰值80%能量的峰值時(shí),那么將這個(gè)方向認(rèn)為是該關(guān)鍵點(diǎn)的輔方向。

這可以增強(qiáng)匹配的魯棒性,Lowe的論文指出大概有15%關(guān)鍵點(diǎn)具有多方向,但這些點(diǎn)對(duì)匹配的穩(wěn)定性至為關(guān)鍵。

關(guān)鍵點(diǎn)的主方向與輔方向2024/3/1039關(guān)鍵點(diǎn)方向分配確定計(jì)算關(guān)鍵點(diǎn)直方圖的高斯函數(shù)權(quán)重函數(shù)參數(shù);生成含有36柱的方向直方圖,梯度直方圖范圍0~360度,其中每10度一個(gè)柱。由半徑為圖像區(qū)域生成;對(duì)方向直方圖進(jìn)行兩次平滑;求取關(guān)鍵點(diǎn)方向〔可能是多個(gè)方向〕;對(duì)方向直方圖的Taylor展開(kāi)式進(jìn)行二次曲線擬合,精確關(guān)鍵點(diǎn)方向;

方向分配實(shí)現(xiàn)步驟

圖像的關(guān)鍵點(diǎn)已檢測(cè)完畢,每個(gè)關(guān)鍵點(diǎn)有三個(gè)信息:位置、尺度、方向;同時(shí)也就使關(guān)鍵點(diǎn)具備平移、縮放、和旋轉(zhuǎn)不變性。Back2024/3/1040關(guān)鍵點(diǎn)描述

描述的目的

描述的思路

通過(guò)對(duì)關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊,計(jì)算塊內(nèi)梯度直方圖,生成具有獨(dú)特性的向量,這個(gè)向量是該區(qū)域圖像信息的一種抽象,具有唯一性。描述的目的是在關(guān)鍵點(diǎn)計(jì)算后,用一組向量將這個(gè)關(guān)鍵點(diǎn)描述出來(lái),這個(gè)描述子不但包括關(guān)鍵點(diǎn),也包括關(guān)鍵點(diǎn)周圍對(duì)其有奉獻(xiàn)的像素點(diǎn)。用來(lái)作為目標(biāo)匹配的依據(jù),也可使關(guān)鍵點(diǎn)具有更多的不變特性,如光照變化、3D視點(diǎn)變化等。2024/3/1041關(guān)鍵點(diǎn)描述以下圖是一個(gè)SIFT描述子事例。其中描述子由2×2×8維向量表征,也即是2×2個(gè)8方向的方向直方圖組成。左圖的種子點(diǎn)由8×8單元組成。每一個(gè)小格都代表了特征點(diǎn)鄰域所在的尺度空間的一個(gè)像素,箭頭方向代表了像素梯度方向,箭頭長(zhǎng)度代表該像素的幅值。然后在4×4的窗口內(nèi)計(jì)算8個(gè)方向的梯度方向直方圖。繪制每個(gè)梯度方向的累加可形成一個(gè)種子點(diǎn),如右圖所示:一個(gè)特征點(diǎn)由4個(gè)種子點(diǎn)的信息所組成。2024/3/1042關(guān)鍵點(diǎn)描述Lowe實(shí)驗(yàn)結(jié)果說(shuō)明:描述子采用4×4×8=128維向量表征,綜合效果最優(yōu)〔不變性與獨(dú)特性〕。2024/3/1043關(guān)鍵點(diǎn)描述是關(guān)鍵點(diǎn)所在組〔octave〕的組內(nèi)尺度,1.確定計(jì)算描述子所需的圖像區(qū)域

描述子梯度方向直方圖由關(guān)鍵點(diǎn)所在尺度的模糊圖像計(jì)算產(chǎn)生。圖像區(qū)域的半徑通過(guò)下式計(jì)算:128維關(guān)鍵點(diǎn)描述子生成步驟2024/3/1044關(guān)鍵點(diǎn)描述2.將坐標(biāo)移至關(guān)鍵點(diǎn)主方向那么旋轉(zhuǎn)角度后新坐標(biāo)為:

2024/3/1045:等于描述子窗口寬度×直方圖列數(shù)〔取4〕的一半;關(guān)鍵點(diǎn)描述:該點(diǎn)與關(guān)鍵點(diǎn)的列距離;:該點(diǎn)與關(guān)鍵點(diǎn)的行距離;3.在圖像半徑區(qū)域內(nèi)對(duì)每個(gè)像素點(diǎn)求其梯度幅值和方向,然后對(duì)每個(gè)梯度幅值乘以高斯權(quán)重參數(shù),生成方向直方圖。2024/3/10464.在窗口寬度為2X2的區(qū)域內(nèi)計(jì)算8個(gè)方向的梯度方向直方圖,繪制每個(gè)梯度方向的累加值,即可形成一個(gè)種子點(diǎn)。然后再在下一個(gè)2X2的區(qū)域內(nèi)進(jìn)行直方圖統(tǒng)計(jì),形成下一個(gè)種子點(diǎn),共生成16個(gè)種子點(diǎn)。5.描述子向量元素門(mén)限化及門(mén)限化后的描述子向量標(biāo)準(zhǔn)化。描述子向量元素門(mén)限化:方向直方圖每個(gè)方向上梯度幅值限制在一定門(mén)限值以下〔門(mén)限一般取0.2〕。描述子向量元素標(biāo)準(zhǔn)化:為得到的128描述子向量,為標(biāo)準(zhǔn)化后的向量

關(guān)鍵點(diǎn)描述2024/3/1047關(guān)鍵點(diǎn)描述關(guān)鍵點(diǎn)描述子向量的標(biāo)準(zhǔn)化正是可去除滿足此模型的光照影響。對(duì)于圖像灰度值整體漂移,圖像各點(diǎn)的梯度是鄰域像素相減得到,所以也能去除。Back2024/3/1048關(guān)鍵點(diǎn)匹配分別對(duì)模板圖〔參考圖,referenceimage〕和實(shí)時(shí)圖〔觀測(cè)圖,observationimage〕建立關(guān)鍵點(diǎn)描述子集合。目標(biāo)的識(shí)別是通過(guò)兩點(diǎn)集內(nèi)關(guān)鍵點(diǎn)描述子的比對(duì)來(lái)完成。具有128維的關(guān)鍵點(diǎn)描述子的相似性度量采用歐式距離。2024/3/1049關(guān)鍵點(diǎn)匹配原圖像目標(biāo)圖像窮舉匹配2024/3/1050

模板圖中關(guān)鍵點(diǎn)描述子:實(shí)時(shí)圖中關(guān)鍵點(diǎn)描述子:

任意兩描述子相似性度量:

要得到配對(duì)的關(guān)鍵點(diǎn)描述子,需滿足:關(guān)鍵點(diǎn)匹配2024/3/1051關(guān)鍵點(diǎn)的匹配可以采用窮舉法來(lái)完成,但是這樣消耗的時(shí)間太多,一般都采用一種叫kd樹(shù)的數(shù)據(jù)結(jié)構(gòu)來(lái)完成搜索。搜索的內(nèi)容是以目標(biāo)圖像的關(guān)鍵點(diǎn)為基準(zhǔn),搜索與目標(biāo)圖像的特征點(diǎn)最鄰近的原圖像特征點(diǎn)和次鄰近的原圖像特征點(diǎn)。關(guān)鍵點(diǎn)匹配Kd樹(shù)是一個(gè)平衡二叉樹(shù)2024/3/1052關(guān)鍵點(diǎn)匹配Back2024/3/1053關(guān)鍵點(diǎn)匹配并不能標(biāo)志著算法的結(jié)束,因?yàn)樵谄ヅ涞倪^(guò)程中存在著大量的錯(cuò)配點(diǎn)。消除錯(cuò)配點(diǎn)圖中交叉的綠線為錯(cuò)配點(diǎn)2024/3/1054消除錯(cuò)配點(diǎn)RANSAC〔RandomSampleConsensus,隨機(jī)抽樣一致〕是一種魯棒性的參數(shù)估計(jì)方法。RANSAC簡(jiǎn)介RANSAC實(shí)質(zhì)上就是一個(gè)反復(fù)測(cè)試、不斷迭代的過(guò)程。RANSAC的根本思想:首先根據(jù)具體問(wèn)題設(shè)計(jì)出某個(gè)目標(biāo)函數(shù),然后通過(guò)反復(fù)提取最小點(diǎn)集估計(jì)該函數(shù)中參數(shù)的初始值,利用這些初始值把所有的數(shù)據(jù)分為“內(nèi)點(diǎn)”〔inlier〕和“外點(diǎn)“〔outlier〕,最后用所有的內(nèi)點(diǎn)重新計(jì)算和估計(jì)函數(shù)的參數(shù)。2024/3/1055消除錯(cuò)配點(diǎn)RANSAC事例如何估計(jì)最佳直線?重復(fù)進(jìn)行,擬合最優(yōu)直線隨機(jī)取兩樣本點(diǎn)擬合直線擬合直線:Back2024/3/1056SIFT算法的應(yīng)用

SIFT算法目前在軍事、工業(yè)和民用方面都得到了不同程度的應(yīng)用,其應(yīng)用已經(jīng)滲透了很多領(lǐng)域,典型的應(yīng)用如下:

物體識(shí)別機(jī)器人定位與導(dǎo)航圖像拼接三維建模手勢(shì)識(shí)別視頻跟蹤筆記鑒定指紋與人臉識(shí)別犯罪現(xiàn)場(chǎng)特征提取

……2024/3/1057SIFT算法的應(yīng)用

物體識(shí)別2024/3/1058SIFT算法的應(yīng)用

圖像拼接Demo2024/3/1059

三維建模SIFT算法的應(yīng)用2024/3/1060SIFT算法的應(yīng)用

手勢(shì)識(shí)別目前,手勢(shì)識(shí)別已應(yīng)用于等設(shè)備上。2024/3/1061

筆記鑒定SIFT算法的應(yīng)用2024/3/1062

來(lái)自網(wǎng)友的創(chuàng)意——周正龍的老虎SIFT算法的應(yīng)用圖1周正龍的華南虎照片與年畫(huà)上的華南虎照片12點(diǎn)匹配圖2周正龍的華南虎照片與真實(shí)的華南虎照片0點(diǎn)匹配Back2024/3/1063SIFT算法的擴(kuò)展與改進(jìn)SIFT在圖像的不變特征提取方面擁有無(wú)與倫比的優(yōu)勢(shì),但其并不是完美的,仍然存在著實(shí)時(shí)性不高、有時(shí)特征點(diǎn)較少、對(duì)邊緣模糊的目標(biāo)無(wú)法準(zhǔn)確提取特征點(diǎn)等缺陷。自從1999年,SIFT算法問(wèn)世以來(lái),人們從未停止對(duì)它的優(yōu)化和改進(jìn)。2024/3/106

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論