sift算法詳解及應(yīng)用_第1頁
sift算法詳解及應(yīng)用_第2頁
sift算法詳解及應(yīng)用_第3頁
sift算法詳解及應(yīng)用_第4頁
sift算法詳解及應(yīng)用_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、BEIJING INSTITUTE OF TECHNOLOGY2022/5/191/60尺度不變特征變換匹配算法 Scale Invariant Feature Transform (SIFT)宋丹 10905056Scale Invariant Feature TransformSIFT2022/5/1921. SIFT簡介2. SIFT算法實(shí)現(xiàn)細(xì)節(jié)3. SIFT算法的應(yīng)用領(lǐng)域4. SIFT算法的擴(kuò)展與改進(jìn)Scale Invariant Feature TransformSIFT2022/5/193l 傳統(tǒng)的特征提取方法傳統(tǒng)的特征提取方法 成像匹配的核心問題是將同一目標(biāo)在成像匹配的核心問題是

2、將同一目標(biāo)在不同時(shí)間不同時(shí)間、不同不同分辨率分辨率、不同光照不同光照、不同位姿不同位姿情況下所成的像相對應(yīng)。情況下所成的像相對應(yīng)。傳統(tǒng)的匹配算法往往是直接提取角點(diǎn)或邊緣,對環(huán)境的傳統(tǒng)的匹配算法往往是直接提取角點(diǎn)或邊緣,對環(huán)境的適應(yīng)能力較差,急需提出一種魯棒性強(qiáng)、能夠適應(yīng)不同適應(yīng)能力較差,急需提出一種魯棒性強(qiáng)、能夠適應(yīng)不同光照、不同位姿等情況下能夠有效識(shí)別目標(biāo)的方法。光照、不同位姿等情況下能夠有效識(shí)別目標(biāo)的方法。Scale Invariant Feature TransformSIFT2022/5/19419991999年年British ColumbiaBritish Columbia大學(xué)大衛(wèi)

3、大學(xué)大衛(wèi). .勞伊(勞伊(David G.LoweDavid G.Lowe)教授總結(jié)了現(xiàn)有)教授總結(jié)了現(xiàn)有的基于不變量技術(shù)的特征檢測方法,并正式提出了一種基于尺度空間的、對的基于不變量技術(shù)的特征檢測方法,并正式提出了一種基于尺度空間的、對圖像縮放、旋轉(zhuǎn)甚至仿射變換保持不變性的圖像局部特征描述算子圖像縮放、旋轉(zhuǎn)甚至仿射變換保持不變性的圖像局部特征描述算子SIFTSIFT(尺度不變特征變換),這種算法在(尺度不變特征變換),這種算法在20042004年被加以完善。年被加以完善。l SIFT提出的目的和意義提出的目的和意義David G. LoweComputer Science Departmen

4、t2366 Main MallUniversity of British ColumbiaVancouver, B.C., V6T 1Z4, Canada E-mail: lowecs.ubc.caScale Invariant Feature TransformSIFT2022/5/195l 將一幅圖像映射(變換)為一個(gè)將一幅圖像映射(變換)為一個(gè)局部特征向量集局部特征向量集;特征向量具有平;特征向量具有平移、縮放、旋轉(zhuǎn)不變性,同時(shí)對光照變化、仿射及投影變換也有一定不移、縮放、旋轉(zhuǎn)不變性,同時(shí)對光照變化、仿射及投影變換也有一定不變性。變性。Original image courtesy of

5、 David LoweScale Invariant Feature TransformSIFT2022/5/196l SIFT算法特點(diǎn)算法特點(diǎn) SIFT SIFT特征是圖像的特征是圖像的局部特征局部特征,其對旋轉(zhuǎn)、尺度縮放、亮度變化,其對旋轉(zhuǎn)、尺度縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩(wěn)定性。定性。 獨(dú)特性獨(dú)特性(Distinctiveness)(Distinctiveness)好,信息量豐富,適用于在海量特征好,信息量豐富,適用于在海量特征數(shù)據(jù)庫中進(jìn)行快速、準(zhǔn)確的匹配。數(shù)據(jù)庫中進(jìn)行快速、準(zhǔn)確的匹配。 多量

6、性,即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量多量性,即使少數(shù)的幾個(gè)物體也可以產(chǎn)生大量SIFTSIFT特征向量。特征向量。 經(jīng)過優(yōu)化的經(jīng)過優(yōu)化的SIFTSIFT算法可滿足一定的速度需求。算法可滿足一定的速度需求。 可擴(kuò)展性,可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合??蓴U(kuò)展性,可以很方便的與其他形式的特征向量進(jìn)行聯(lián)合。 Scale Invariant Feature TransformSIFT2022/5/197 目標(biāo)的自身狀態(tài)、場景所處的環(huán)境和成像器材的成像特性等因素目標(biāo)的自身狀態(tài)、場景所處的環(huán)境和成像器材的成像特性等因素影響圖像配準(zhǔn)影響圖像配準(zhǔn)/ /目標(biāo)識(shí)別跟蹤的性能。而目標(biāo)識(shí)別跟蹤的性能。而SIFT

7、SIFT算法在一定程度上可解決:算法在一定程度上可解決: 目標(biāo)的旋轉(zhuǎn)、縮放、平移(目標(biāo)的旋轉(zhuǎn)、縮放、平移(RST) 圖像仿射圖像仿射/投影變換(視點(diǎn)投影變換(視點(diǎn)viewpoint) 光照影響(光照影響(illumination) 目標(biāo)遮擋(目標(biāo)遮擋(occlusion) 雜物場景(雜物場景(clutter) 噪聲噪聲l SIFT SIFT算法可以解決的問題算法可以解決的問題BackScale Invariant Feature TransformSIFT2022/5/198 l SIFT SIFT算法實(shí)現(xiàn)步驟簡述算法實(shí)現(xiàn)步驟簡述SIFTSIFT算法的實(shí)質(zhì)可以歸為在不同尺度空間上查找特征點(diǎn)(關(guān)

8、鍵點(diǎn))的問題。算法的實(shí)質(zhì)可以歸為在不同尺度空間上查找特征點(diǎn)(關(guān)鍵點(diǎn))的問題。 SIFTSIFT算法實(shí)現(xiàn)物體識(shí)別主要有三大工序,算法實(shí)現(xiàn)物體識(shí)別主要有三大工序,1 1、提取關(guān)鍵點(diǎn);、提取關(guān)鍵點(diǎn);2 2、對關(guān)鍵點(diǎn)附加、對關(guān)鍵點(diǎn)附加詳細(xì)的信息(局部特征)也就是所謂的描述器;詳細(xì)的信息(局部特征)也就是所謂的描述器;3 3、通過兩方特征點(diǎn)(附帶上、通過兩方特征點(diǎn)(附帶上特征向量的關(guān)鍵點(diǎn))的兩兩比較找出相互匹配的若干對特征點(diǎn),也就建立了特征向量的關(guān)鍵點(diǎn))的兩兩比較找出相互匹配的若干對特征點(diǎn),也就建立了景物間的對應(yīng)關(guān)系。景物間的對應(yīng)關(guān)系。 Scale Invariant Feature Transform

9、SIFT2022/5/1991. 關(guān)鍵點(diǎn)檢測關(guān)鍵點(diǎn)檢測2. 關(guān)鍵點(diǎn)描述關(guān)鍵點(diǎn)描述 3. 關(guān)鍵點(diǎn)匹配關(guān)鍵點(diǎn)匹配4. 消除錯(cuò)配點(diǎn)消除錯(cuò)配點(diǎn)l SIFT SIFT算法實(shí)現(xiàn)步驟算法實(shí)現(xiàn)步驟Scale Invariant Feature TransformSIFT2022/5/1910所謂關(guān)鍵點(diǎn),就是在不同所謂關(guān)鍵點(diǎn),就是在不同尺度空間尺度空間的圖像下檢測出的具有方向的圖像下檢測出的具有方向信息的局部極值點(diǎn)。信息的局部極值點(diǎn)。根據(jù)歸納,我們可以看出特征點(diǎn)具有的三個(gè)特征:根據(jù)歸納,我們可以看出特征點(diǎn)具有的三個(gè)特征: 尺度尺度 方向方向 大小大小1. 1. 哪些點(diǎn)是哪些點(diǎn)是SIFTSIFT中要查找的關(guān)鍵點(diǎn)(

10、特征點(diǎn))?中要查找的關(guān)鍵點(diǎn)(特征點(diǎn))? 這些點(diǎn)是一些這些點(diǎn)是一些十分突出的點(diǎn)不會(huì)因光照條件的改變而消失十分突出的點(diǎn)不會(huì)因光照條件的改變而消失,比如,比如角點(diǎn)角點(diǎn)、邊緣點(diǎn)邊緣點(diǎn)、暗區(qū)域的亮點(diǎn)暗區(qū)域的亮點(diǎn)以及以及亮區(qū)域的暗點(diǎn)亮區(qū)域的暗點(diǎn),既然兩幅圖像中有相同的景物,既然兩幅圖像中有相同的景物,那么使用某種方法分別提取各自的穩(wěn)定點(diǎn),這些點(diǎn)之間會(huì)有相互對應(yīng)的匹配那么使用某種方法分別提取各自的穩(wěn)定點(diǎn),這些點(diǎn)之間會(huì)有相互對應(yīng)的匹配點(diǎn)。點(diǎn)。 Scale Invariant Feature TransformSIFT2022/5/1911 我們要精確表示的物體都是通過一定的尺度來反映的。現(xiàn)實(shí)世界的我們要精確表

11、示的物體都是通過一定的尺度來反映的?,F(xiàn)實(shí)世界的物體也總是通過不同尺度的觀察而得到不同的變化。物體也總是通過不同尺度的觀察而得到不同的變化。 尺度空間理論最早在尺度空間理論最早在19621962年提出,其主要思想是通過對原始圖像進(jìn)年提出,其主要思想是通過對原始圖像進(jìn)行尺度變換,獲得圖像多尺度下的尺度空間表示序列,對這些序列進(jìn)行行尺度變換,獲得圖像多尺度下的尺度空間表示序列,對這些序列進(jìn)行尺度空間主輪廓的提取,并以該主輪廓作為一種特征向量,實(shí)現(xiàn)邊緣、尺度空間主輪廓的提取,并以該主輪廓作為一種特征向量,實(shí)現(xiàn)邊緣、角點(diǎn)檢測和不同分辨率上的特征提取等。角點(diǎn)檢測和不同分辨率上的特征提取等。 尺度空間中各尺

12、度圖像的模糊程度逐漸變大,能夠模擬人在距離目尺度空間中各尺度圖像的模糊程度逐漸變大,能夠模擬人在距離目標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過程。標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過程。 尺度越大圖像越模糊。尺度越大圖像越模糊。2. 2. 什么是尺度空間(什么是尺度空間(scale spacescale space )?)?Scale Invariant Feature TransformSIFT2022/5/1912 根據(jù)文獻(xiàn)根據(jù)文獻(xiàn)Scale-space theory: A basic tool for analysing Scale-space theory: A basic tool for

13、analysing structures at different scalesstructures at different scales我們可知,高斯核是唯一可以產(chǎn)生我們可知,高斯核是唯一可以產(chǎn)生多尺度空間的核,一個(gè)圖像的尺度空間,多尺度空間的核,一個(gè)圖像的尺度空間,L L(x,y,) ,x,y,) ,定義為原始圖像定義為原始圖像I(x,y)I(x,y)與一個(gè)可變尺度的與一個(gè)可變尺度的2 2維高斯函數(shù)維高斯函數(shù)G(x,y,) G(x,y,) 卷積運(yùn)算。卷積運(yùn)算。 , , ,*,L x yG x yI x y22221()(),exp22iiiixxyyG x y高斯函數(shù)高斯函數(shù)尺度是自然存

14、在的,不是人為創(chuàng)造的!高斯卷尺度是自然存在的,不是人為創(chuàng)造的!高斯卷積只是表現(xiàn)尺度空間的一種形式積只是表現(xiàn)尺度空間的一種形式Scale Invariant Feature TransformSIFT2022/5/19133.3. 高斯模糊高斯模糊 高斯模糊是在高斯模糊是在Adobe PhotoshopAdobe Photoshop等圖像處理軟件中廣泛使用的處理等圖像處理軟件中廣泛使用的處理效果,通常用它來減小圖像噪聲以及降低細(xì)節(jié)層次。這種模糊技術(shù)生成效果,通常用它來減小圖像噪聲以及降低細(xì)節(jié)層次。這種模糊技術(shù)生成的圖像的視覺效果是好像經(jīng)過一個(gè)半透明的屏幕觀察圖像。的圖像的視覺效果是好像經(jīng)過一個(gè)半

15、透明的屏幕觀察圖像。 Scale Invariant Feature TransformSIFT2022/5/1914 2221rrexp22G22r= xyr r為模糊半徑,為模糊半徑, 在減小圖像尺寸的場合經(jīng)常使用高斯模糊。在進(jìn)行欠采樣的時(shí),在減小圖像尺寸的場合經(jīng)常使用高斯模糊。在進(jìn)行欠采樣的時(shí),通常在采樣之前對圖像進(jìn)行低通濾波處理。這樣就可以保證在采樣通常在采樣之前對圖像進(jìn)行低通濾波處理。這樣就可以保證在采樣圖像中不會(huì)出現(xiàn)虛假的高頻信息。圖像中不會(huì)出現(xiàn)虛假的高頻信息。 Scale Invariant Feature TransformSIFT2022/5/1915在實(shí)際應(yīng)用中,在計(jì)算高斯

16、函數(shù)的離散近似時(shí),在大概在實(shí)際應(yīng)用中,在計(jì)算高斯函數(shù)的離散近似時(shí),在大概33距離之外距離之外的像素都可以看作不起作用,這些像素的計(jì)算也就可以忽略。的像素都可以看作不起作用,這些像素的計(jì)算也就可以忽略。通常,圖像處理程序只需要計(jì)算通常,圖像處理程序只需要計(jì)算(61) (61)高斯模板大小的選擇高斯模板大小的選擇0.000000670.000022920.000191170.000387710.000191170.000022920.000000670.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000

17、191170.006559650.054721570.110981640.054721570.006559650.000191170.000387710.013303730.110981640.225083520.110981640.013303730.000387710.000191170.006559650.054721570.110981640.054721570.006559650.000191170.000022920.000786330.006559650.013303730.006559650.000786330.000022920.000000670.000022920.000

18、191170.000387710.000191170.000022920.00000067高斯模板高斯模板Scale Invariant Feature TransformSIFT2022/5/1916高斯模糊具有圓對稱性。高斯模糊具有圓對稱性。高斯模糊具有高斯模糊具有線性可分線性可分的性質(zhì),也可以在的性質(zhì),也可以在二維圖像上對兩個(gè)獨(dú)立的一二維圖像上對兩個(gè)獨(dú)立的一維空間分別進(jìn)行計(jì)算維空間分別進(jìn)行計(jì)算。這樣可以大大。這樣可以大大減少了運(yùn)算的次數(shù)減少了運(yùn)算的次數(shù)。 對一幅圖像進(jìn)行多次連續(xù)高斯模糊的效果與一次更大的高斯模糊可以對一幅圖像進(jìn)行多次連續(xù)高斯模糊的效果與一次更大的高斯模糊可以產(chǎn)生同樣的效果

19、,大的高斯模糊的半徑是所用多個(gè)高斯模糊半徑平方產(chǎn)生同樣的效果,大的高斯模糊的半徑是所用多個(gè)高斯模糊半徑平方和的平方根。例如,使用半徑分別為和的平方根。例如,使用半徑分別為 6 6 和和 8 8 的兩次高斯模糊變換得的兩次高斯模糊變換得到的效果等同于一次半徑為到的效果等同于一次半徑為 10 10 的高斯模糊效果,的高斯模糊效果, 根據(jù)這個(gè)關(guān)系,使用多個(gè)連續(xù)較小的高斯模糊處理不會(huì)比單個(gè)高斯較根據(jù)這個(gè)關(guān)系,使用多個(gè)連續(xù)較小的高斯模糊處理不會(huì)比單個(gè)高斯較大處理時(shí)間要少。大處理時(shí)間要少。 高斯模糊的性質(zhì)高斯模糊的性質(zhì)226810Scale Invariant Feature TransformSIFT2

20、022/5/1917高斯金子塔的構(gòu)建過程可分為高斯金子塔的構(gòu)建過程可分為兩步:兩步:(1 1)對圖像做高斯平滑;)對圖像做高斯平滑;(2 2)對圖像做降采樣。)對圖像做降采樣。 為了讓尺度體現(xiàn)其連續(xù)性,在簡單為了讓尺度體現(xiàn)其連續(xù)性,在簡單下采樣的基礎(chǔ)上加上了高斯濾波。下采樣的基礎(chǔ)上加上了高斯濾波。一幅圖像可以產(chǎn)生幾組(一幅圖像可以產(chǎn)生幾組(octaveoctave)圖像,一組圖像包括幾層圖像,一組圖像包括幾層(intervalinterval)圖像。)圖像。 4. 4. 高斯金字塔高斯金字塔Scale Invariant Feature TransformSIFT2022/5/1918高斯圖像

21、金字塔共高斯圖像金字塔共o o組、組、s s層,層,則有:則有:0( )2sSs尺度空間坐標(biāo);尺度空間坐標(biāo);s ssub-levelsub-level層坐標(biāo);層坐標(biāo);0 0初始尺度;初始尺度;S S每組層數(shù)(一般為每組層數(shù)(一般為35)。)。Scale Invariant Feature TransformSIFT2022/5/1919 高斯金字塔的初始尺度高斯金字塔的初始尺度當(dāng)圖像通過相機(jī)拍攝時(shí),相機(jī)的鏡當(dāng)圖像通過相機(jī)拍攝時(shí),相機(jī)的鏡頭已經(jīng)對圖像進(jìn)行了一次初始的模頭已經(jīng)對圖像進(jìn)行了一次初始的模糊,所以根據(jù)高斯模糊的性質(zhì):糊,所以根據(jù)高斯模糊的性質(zhì):2logmin,3OM NM M、N N分別

22、為圖像的行數(shù)和列數(shù)分別為圖像的行數(shù)和列數(shù)0initinitprepre0initinitprepreinit第第0 0層尺度層尺度pre被相機(jī)鏡頭模糊后的尺度被相機(jī)鏡頭模糊后的尺度 高斯金字塔的組數(shù)高斯金字塔的組數(shù)Scale Invariant Feature TransformSIFT2022/5/1920 高斯金字塔的組內(nèi)尺度與組間尺度高斯金字塔的組內(nèi)尺度與組間尺度0( )2sSs組內(nèi)尺度是指同一組(組內(nèi)尺度是指同一組(octave)內(nèi)的)內(nèi)的尺度關(guān)系,組內(nèi)相鄰層尺度化簡為:尺度關(guān)系,組內(nèi)相鄰層尺度化簡為:112Sss組間尺度是指不同組直接的尺度關(guān)組間尺度是指不同組直接的尺度關(guān)系,相鄰組的

23、尺度可化為:系,相鄰組的尺度可化為:1( )2s SSoos222s SsSSoo 由此可見,相鄰兩組的同一層尺度為由此可見,相鄰兩組的同一層尺度為2倍的關(guān)系倍的關(guān)系Scale Invariant Feature TransformSIFT2022/5/1921 最后可將組內(nèi)和組間尺度最后可將組內(nèi)和組間尺度歸為:歸為:i i金字塔組數(shù)金字塔組數(shù)n n每一組的層數(shù)每一組的層數(shù)1212( ,)inkkk12Sk Scale Invariant Feature TransformSIFT2022/5/1922上一組圖像的底層是由前上一組圖像的底層是由前一組圖像的倒數(shù)第二層圖一組圖像的倒數(shù)第二層圖像隔

24、點(diǎn)采樣生成的。像隔點(diǎn)采樣生成的。 這樣可以保持尺度的連續(xù)這樣可以保持尺度的連續(xù)性。性。?為啥?為啥?Scale Invariant Feature TransformSIFT2022/5/1923 通過研究通過研究LoweLowe教授的論文發(fā)現(xiàn),所有特征點(diǎn)的檢測都是基于了尺度不教授的論文發(fā)現(xiàn),所有特征點(diǎn)的檢測都是基于了尺度不變的特性,特征點(diǎn)的檢測占據(jù)了論文的大部分的篇章,變的特性,特征點(diǎn)的檢測占據(jù)了論文的大部分的篇章,具有十分重要的具有十分重要的意義!意義!LindebergLindeberg在文獻(xiàn)在文獻(xiàn)Scale-space theory: A basic tool for analysin

25、g Scale-space theory: A basic tool for analysing structures at different scalesstructures at different scales指出尺度規(guī)范化的指出尺度規(guī)范化的LoGLoG算子具有真正算子具有真正的尺度不變性。的尺度不變性。LoGLoG算子即(算子即(Laplacion of GaussianLaplacion of Gaussian), ,可以由高斯函數(shù)梯度算子可以由高斯函數(shù)梯度算子GOGGOG構(gòu)建構(gòu)建22222GGGxy尺度規(guī)范化的尺度規(guī)范化的GoGGoG算子算子尺度規(guī)范化的尺度規(guī)范化的LoGLoG算

26、子算子22GScale Invariant Feature TransformSIFT2022/5/192422, , ,1G x y kG x ykG222( , ,)( , ,)( , ,)(1)Gauss x y kGauss x yLOG x yGkLOGLOG算子與高斯核函數(shù)的關(guān)系算子與高斯核函數(shù)的關(guān)系通過推導(dǎo)可以看出,通過推導(dǎo)可以看出,LOGLOG算子與高斯核函數(shù)的差有直接關(guān)系,算子與高斯核函數(shù)的差有直接關(guān)系,由此引入一種新的算子由此引入一種新的算子DOGDOG(Difference of GaussiansDifference of Gaussians),),即即高斯差分算子。高

27、斯差分算子。22222GGGxyScale Invariant Feature TransformSIFT2022/5/1925DoGDoG(Difference of GaussianDifference of Gaussian)函數(shù))函數(shù), , ,*,L x yG x yI x y, , , ,*, , ,D x yG x y kG x yI x yL x y kL x yDoGDoG在計(jì)算上只需相鄰尺度高斯平滑后圖像相減,因此簡化了計(jì)算!在計(jì)算上只需相鄰尺度高斯平滑后圖像相減,因此簡化了計(jì)算!應(yīng)該是同一組內(nèi)的相鄰層吧?應(yīng)該是同一組內(nèi)的相鄰層吧?Scale Invariant Featur

28、e TransformSIFT2022/5/1926DoGDoG高斯差分金字塔高斯差分金字塔對應(yīng)對應(yīng)DOGDOG算子,我們要構(gòu)建算子,我們要構(gòu)建DOGDOG金字塔金字塔我們可以通過我們可以通過高斯差分圖高斯差分圖像像看出圖像上的像素值變看出圖像上的像素值變化情況。(如果沒有變化,化情況。(如果沒有變化,也就沒有特征。特征必須也就沒有特征。特征必須是變化盡可能多的點(diǎn)。)是變化盡可能多的點(diǎn)。)DOGDOG圖像描繪的是目標(biāo)的圖像描繪的是目標(biāo)的輪廓。輪廓。Scale Invariant Feature TransformSIFT2022/5/1927Scale Invariant Feature Tr

29、ansformSIFT2022/5/1928 在檢測極值點(diǎn)前對原始圖像的高斯平滑以致圖像丟失高頻信息,所以在檢測極值點(diǎn)前對原始圖像的高斯平滑以致圖像丟失高頻信息,所以LoweLowe建議在建立尺度空間前首先對原始圖像長寬擴(kuò)展一倍,以保留原始圖像建議在建立尺度空間前首先對原始圖像長寬擴(kuò)展一倍,以保留原始圖像信息,增加特征點(diǎn)數(shù)量。信息,增加特征點(diǎn)數(shù)量。 在在LoweLowe的論文中,將第的論文中,將第0 0層的初始尺度定為層的初始尺度定為1.61.6,圖片的初始尺度定為,圖片的初始尺度定為0.50.5,則圖像金字塔第則圖像金字塔第0 0層的實(shí)際尺度為層的實(shí)際尺度為1.6 1.60.5 0.51.5

30、2 當(dāng)對圖像長寬擴(kuò)展一倍時(shí),便構(gòu)建了當(dāng)對圖像長寬擴(kuò)展一倍時(shí),便構(gòu)建了-1-1層,該層尺度為層,該層尺度為1.6 1.6(2 0.5) (2 0.5)1.25P.S.:P.S.:圖像插值時(shí),選用的插值函數(shù)可以是多種多樣的。圖像插值時(shí),選用的插值函數(shù)可以是多種多樣的。Scale Invariant Feature TransformSIFT2022/5/1929 中間的檢測點(diǎn)和它同尺度的中間的檢測點(diǎn)和它同尺度的8個(gè)相鄰點(diǎn)和上下相鄰尺度對應(yīng)的個(gè)相鄰點(diǎn)和上下相鄰尺度對應(yīng)的92個(gè)點(diǎn)共個(gè)點(diǎn)共26個(gè)點(diǎn)比較,以確保在尺度空間和二維圖像空間都檢測到極個(gè)點(diǎn)比較,以確保在尺度空間和二維圖像空間都檢測到極值點(diǎn)。值點(diǎn)。

31、 l DoG的局部極值點(diǎn)的局部極值點(diǎn) 關(guān)鍵點(diǎn)是由關(guān)鍵點(diǎn)是由DOGDOG空間的局部極值點(diǎn)組成的。空間的局部極值點(diǎn)組成的。為了尋找為了尋找DoGDoG函數(shù)的極值點(diǎn),函數(shù)的極值點(diǎn),每一個(gè)像素點(diǎn)要和它所有的相鄰點(diǎn)比較,看其是否比它的圖像域和尺度域每一個(gè)像素點(diǎn)要和它所有的相鄰點(diǎn)比較,看其是否比它的圖像域和尺度域的相鄰點(diǎn)大或者小。的相鄰點(diǎn)大或者小。Scale Invariant Feature TransformSIFT2022/5/1930 在極值比較的過程中,在極值比較的過程中,每一組圖像的首末兩層是無法每一組圖像的首末兩層是無法進(jìn)行極值比較的,為了滿足尺進(jìn)行極值比較的,為了滿足尺度變化的連續(xù)性,我們

32、在每一度變化的連續(xù)性,我們在每一組圖像的頂層繼續(xù)用高斯模糊組圖像的頂層繼續(xù)用高斯模糊生成了生成了3幅圖像,高斯金字塔幅圖像,高斯金字塔有每組有每組S+3層圖像。層圖像。DOG金字金字塔每組有塔每組有S+2層圖像層圖像 右圖為不同尺度不同層間右圖為不同尺度不同層間極值檢測示意圖。極值檢測示意圖。P.S.: P.S.: 我們只犧牲了我們只犧牲了-1-1組的第組的第0 0層層和第和第N N組的最高層組的最高層Scale Invariant Feature TransformSIFT2022/5/1931l 關(guān)鍵點(diǎn)精確定位關(guān)鍵點(diǎn)精確定位 為了提高關(guān)鍵點(diǎn)的穩(wěn)定性,需要對尺度空間為了提高關(guān)鍵點(diǎn)的穩(wěn)定性,需

33、要對尺度空間DoGDoG函數(shù)進(jìn)行曲線擬合。利用函數(shù)進(jìn)行曲線擬合。利用DoGDoG函數(shù)在尺度空間的函數(shù)在尺度空間的TaylorTaylor展開式:展開式:2212TTDDD XDXXXXX其極值點(diǎn)其極值點(diǎn), ,TXx y 由于由于DoGDoG值對噪聲和邊緣較敏感值對噪聲和邊緣較敏感, ,因此因此, ,在上面在上面DoGDoG尺度空間中檢測到局部尺度空間中檢測到局部極值點(diǎn)還要經(jīng)過進(jìn)一步的檢驗(yàn)才能精確定位為特征點(diǎn)。極值點(diǎn)還要經(jīng)過進(jìn)一步的檢驗(yàn)才能精確定位為特征點(diǎn)。Scale Invariant Feature TransformSIFT2022/5/1932 上式去除那些對比度較低的不穩(wěn)定極值點(diǎn)。上式

34、去除那些對比度較低的不穩(wěn)定極值點(diǎn)。Lowe的試驗(yàn)顯示,所的試驗(yàn)顯示,所有取值小于有取值小于0.04的極值點(diǎn)均可拋棄(的極值點(diǎn)均可拋棄(像素灰度值范圍像素灰度值范圍0,1)。)。12TDD XDXX 在計(jì)算過程中,分別對圖像的行、列及尺度三個(gè)量進(jìn)行了修正,其在計(jì)算過程中,分別對圖像的行、列及尺度三個(gè)量進(jìn)行了修正,其修正結(jié)果如下:修正結(jié)果如下:為修正值為修正值X在在LoweLowe的程序中,對坐標(biāo)進(jìn)行了五次修正。的程序中,對坐標(biāo)進(jìn)行了五次修正。212()TDDXXX 將修正后的結(jié)果代入式將修正后的結(jié)果代入式 2212TTDDD XDXXXXX求解得求解得2212TTDDD XDXXXXXScale

35、 Invariant Feature TransformSIFT2022/5/1933l 去除邊緣響應(yīng)去除邊緣響應(yīng) 僅僅去除低對比度的極值點(diǎn)對于極值點(diǎn)的對于特征點(diǎn)穩(wěn)定性是遠(yuǎn)遠(yuǎn)不僅僅去除低對比度的極值點(diǎn)對于極值點(diǎn)的對于特征點(diǎn)穩(wěn)定性是遠(yuǎn)遠(yuǎn)不夠的。夠的。DoGDoG函數(shù)在圖像邊緣有較強(qiáng)的邊緣響應(yīng),因此我們還需要排除邊緣函數(shù)在圖像邊緣有較強(qiáng)的邊緣響應(yīng),因此我們還需要排除邊緣響應(yīng)。響應(yīng)。 DoGDoG函數(shù)的(欠佳的)峰值點(diǎn)在橫跨邊緣的方向有較大的主曲率,而函數(shù)的(欠佳的)峰值點(diǎn)在橫跨邊緣的方向有較大的主曲率,而在垂直邊緣的方向有較小的主曲率。主曲率可以通過計(jì)算在該點(diǎn)位置尺在垂直邊緣的方向有較小的主曲率。

36、主曲率可以通過計(jì)算在該點(diǎn)位置尺度的度的2 22 2的的HessianHessian矩陣矩陣得到,導(dǎo)數(shù)由采樣點(diǎn)相鄰差來估計(jì)得到,導(dǎo)數(shù)由采樣點(diǎn)相鄰差來估計(jì):xxxyxyyyDDHDDxxD表示表示DOGDOG金字塔中某一尺度的圖像金字塔中某一尺度的圖像x x方向求導(dǎo)兩次方向求導(dǎo)兩次Scale Invariant Feature TransformSIFT2022/5/1934221Tr HrDet Hr 在兩特征值相等時(shí)達(dá)最小,隨在兩特征值相等時(shí)達(dá)最小,隨r的增長而增長。的增長而增長。Lowe論文中建議論文中建議r取取10。21rrr2221Tr HrDet Hr D的主曲率和的主曲率和H的特征值

37、成正比,為了避免直接的計(jì)算這些特征值,而只的特征值成正比,為了避免直接的計(jì)算這些特征值,而只是考慮它們的之間的比率。令為是考慮它們的之間的比率。令為 最大特征值最大特征值 , 為最小的特征值,則為最小的特征值,則xxyyTr HDDxxyyxyxyDet HDDDD時(shí)將關(guān)鍵點(diǎn)保留,反之剔除時(shí)將關(guān)鍵點(diǎn)保留,反之剔除Scale Invariant Feature TransformSIFT2022/5/1935 通過尺度不變性求極值點(diǎn),可以使其具有縮放不變的性質(zhì),利用通過尺度不變性求極值點(diǎn),可以使其具有縮放不變的性質(zhì),利用關(guān)鍵點(diǎn)鄰域像素的梯度方向分布特性,我們可以為每個(gè)關(guān)鍵點(diǎn)指定方向關(guān)鍵點(diǎn)鄰域像素

38、的梯度方向分布特性,我們可以為每個(gè)關(guān)鍵點(diǎn)指定方向參數(shù)方向,參數(shù)方向,從而使描述子對圖像旋轉(zhuǎn)具有不變性。從而使描述子對圖像旋轉(zhuǎn)具有不變性。,IIgradI x yxy22,1,1,1,1m x yL xyL xyL x yL x y1,1,1,tan1,1,L x yL x yx yL xyL xyl 像素點(diǎn)的梯度表示像素點(diǎn)的梯度表示梯度幅值:梯度方向:我們通過求每個(gè)極值點(diǎn)的梯度來為極值點(diǎn)賦予方向。我們通過求每個(gè)極值點(diǎn)的梯度來為極值點(diǎn)賦予方向。Scale Invariant Feature TransformSIFT2022/5/1936l 方向直方圖的生成方向直方圖的生成 確定關(guān)鍵點(diǎn)的方向采用

39、梯度直方圖統(tǒng)計(jì)法,統(tǒng)計(jì)以關(guān)鍵點(diǎn)為原確定關(guān)鍵點(diǎn)的方向采用梯度直方圖統(tǒng)計(jì)法,統(tǒng)計(jì)以關(guān)鍵點(diǎn)為原點(diǎn),一定區(qū)域內(nèi)的圖像像素點(diǎn)對關(guān)鍵點(diǎn)方向生成所作的貢獻(xiàn)。點(diǎn),一定區(qū)域內(nèi)的圖像像素點(diǎn)對關(guān)鍵點(diǎn)方向生成所作的貢獻(xiàn)。Scale Invariant Feature TransformSIFT2022/5/1937 1. 1.直方圖以每直方圖以每1010度方向?yàn)橐粋€(gè)柱,共度方向?yàn)橐粋€(gè)柱,共3636個(gè)柱,柱所代表的方向?yàn)橄駛€(gè)柱,柱所代表的方向?yàn)橄袼攸c(diǎn)梯度方向,柱的長短代表了梯度幅值。素點(diǎn)梯度方向,柱的長短代表了梯度幅值。 2.2.根據(jù)根據(jù)LoweLowe的建議,直方圖統(tǒng)計(jì)半徑采用的建議,直方圖統(tǒng)計(jì)半徑采用3 3* *1

40、.51.5* *。 3.3.在直方圖統(tǒng)計(jì)時(shí),每相鄰三個(gè)像素點(diǎn)采用高斯加權(quán),根據(jù)在直方圖統(tǒng)計(jì)時(shí),每相鄰三個(gè)像素點(diǎn)采用高斯加權(quán),根據(jù)LoweLowe的的建議,模板采用建議,模板采用0.25,0.5,0.250.25,0.5,0.25,并連續(xù)加權(quán)兩次。,并連續(xù)加權(quán)兩次。關(guān)于方向直方圖的幾點(diǎn)說明關(guān)于方向直方圖的幾點(diǎn)說明Scale Invariant Feature TransformSIFT2022/5/1938 關(guān)鍵點(diǎn)關(guān)鍵點(diǎn)主方向主方向:極值點(diǎn)周圍區(qū)域梯度直方圖的:極值點(diǎn)周圍區(qū)域梯度直方圖的主主峰值也是特征點(diǎn)方向峰值也是特征點(diǎn)方向 關(guān)鍵點(diǎn)關(guān)鍵點(diǎn)輔方向輔方向:在梯度方向直方圖中,當(dāng)存在另一個(gè)相當(dāng)于主峰

41、值在梯度方向直方圖中,當(dāng)存在另一個(gè)相當(dāng)于主峰值 80%能量的峰值時(shí),則將這個(gè)方向認(rèn)為是該關(guān)鍵點(diǎn)的輔方向。能量的峰值時(shí),則將這個(gè)方向認(rèn)為是該關(guān)鍵點(diǎn)的輔方向。 這可以增強(qiáng)匹配的魯棒性這可以增強(qiáng)匹配的魯棒性,LoweLowe的論文指出大概有的論文指出大概有15%15%關(guān)鍵點(diǎn)具有關(guān)鍵點(diǎn)具有多方向,但這些點(diǎn)對匹配的穩(wěn)定性至為關(guān)鍵。多方向,但這些點(diǎn)對匹配的穩(wěn)定性至為關(guān)鍵。 關(guān)鍵點(diǎn)的主方向與輔方向關(guān)鍵點(diǎn)的主方向與輔方向Scale Invariant Feature TransformSIFT2022/5/19391. 確定計(jì)算關(guān)鍵點(diǎn)直方圖的高斯函數(shù)權(quán)重函數(shù)參數(shù)確定計(jì)算關(guān)鍵點(diǎn)直方圖的高斯函數(shù)權(quán)重函數(shù)參數(shù) ;2

42、. 生成含有生成含有36柱的方向直方圖,梯度直方圖范圍柱的方向直方圖,梯度直方圖范圍0360度,其中每度,其中每10度一個(gè)柱。由半徑為圖像區(qū)域生成;度一個(gè)柱。由半徑為圖像區(qū)域生成;3. 對方向直方圖進(jìn)行兩次平滑;對方向直方圖進(jìn)行兩次平滑;4. 求取關(guān)鍵點(diǎn)方向(可能是多個(gè)方向);求取關(guān)鍵點(diǎn)方向(可能是多個(gè)方向);5. 對方向直方圖的對方向直方圖的Taylor展開式進(jìn)行二次曲線擬合,精確關(guān)鍵點(diǎn)方向;展開式進(jìn)行二次曲線擬合,精確關(guān)鍵點(diǎn)方向;l 方向分配實(shí)現(xiàn)步驟方向分配實(shí)現(xiàn)步驟 圖像的關(guān)鍵點(diǎn)已檢測完畢,每個(gè)關(guān)鍵點(diǎn)有三個(gè)信息:位置、尺度、圖像的關(guān)鍵點(diǎn)已檢測完畢,每個(gè)關(guān)鍵點(diǎn)有三個(gè)信息:位置、尺度、方向;同

43、時(shí)也就使關(guān)鍵點(diǎn)具備平移、縮放、和旋轉(zhuǎn)不變性。方向;同時(shí)也就使關(guān)鍵點(diǎn)具備平移、縮放、和旋轉(zhuǎn)不變性。BackScale Invariant Feature TransformSIFT2022/5/1940l 描述的目的描述的目的l 描述的思路描述的思路 通過對關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊,計(jì)算塊內(nèi)梯度直方圖,生通過對關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊,計(jì)算塊內(nèi)梯度直方圖,生成具有獨(dú)特性的向量,這個(gè)向量是該區(qū)域圖像信息的一種抽象,具成具有獨(dú)特性的向量,這個(gè)向量是該區(qū)域圖像信息的一種抽象,具有唯一性。有唯一性。 描述的目的是在關(guān)鍵點(diǎn)計(jì)算后,用一組向量將這個(gè)關(guān)鍵點(diǎn)描描述的目的是在關(guān)鍵點(diǎn)計(jì)算后,用一組向量將這個(gè)關(guān)鍵點(diǎn)描述出

44、來,這個(gè)描述子不但包括關(guān)鍵點(diǎn),也包括關(guān)鍵點(diǎn)周圍對其有貢述出來,這個(gè)描述子不但包括關(guān)鍵點(diǎn),也包括關(guān)鍵點(diǎn)周圍對其有貢獻(xiàn)的像素點(diǎn)。用來作為目標(biāo)匹配的依據(jù),也可使關(guān)鍵點(diǎn)具有更多的獻(xiàn)的像素點(diǎn)。用來作為目標(biāo)匹配的依據(jù),也可使關(guān)鍵點(diǎn)具有更多的不變特性,如光照變化、不變特性,如光照變化、3D視點(diǎn)變化等。視點(diǎn)變化等。Scale Invariant Feature TransformSIFT2022/5/1941 下圖是一個(gè)下圖是一個(gè)SIFT描述子事例。其中描述子由描述子事例。其中描述子由228維向量表征,也維向量表征,也即是即是22個(gè)個(gè)8方向的方向方向的方向直方圖組成。直方圖組成。左圖的種子點(diǎn)由左圖的種子點(diǎn)由8

45、8單元組成。每一單元組成。每一個(gè)小格都代表了特征點(diǎn)鄰域所在的尺度空間的一個(gè)像素,箭頭方向代表了像素個(gè)小格都代表了特征點(diǎn)鄰域所在的尺度空間的一個(gè)像素,箭頭方向代表了像素梯度方向,箭頭長度代表該像素的幅值。然后在梯度方向,箭頭長度代表該像素的幅值。然后在44的窗口內(nèi)計(jì)算的窗口內(nèi)計(jì)算8個(gè)方向的個(gè)方向的梯度方向直方圖。繪制每個(gè)梯度方向的累加可形成一個(gè)種子點(diǎn),如右圖所示:梯度方向直方圖。繪制每個(gè)梯度方向的累加可形成一個(gè)種子點(diǎn),如右圖所示:一個(gè)特征點(diǎn)由一個(gè)特征點(diǎn)由4個(gè)種子點(diǎn)的信息所組成。個(gè)種子點(diǎn)的信息所組成。Scale Invariant Feature TransformSIFT2022/5/1942

46、LoweLowe實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)結(jié)果表明表明:描述子描述子采用采用4 44 48 8128128維向量表征維向量表征,綜合效果最優(yōu)綜合效果最優(yōu)(不變性與獨(dú)(不變性與獨(dú)特性)。特性)。Scale Invariant Feature TransformSIFT2022/5/1943 是關(guān)鍵點(diǎn)所在組(是關(guān)鍵點(diǎn)所在組(octave)的組內(nèi)尺度,)的組內(nèi)尺度,1. 確定確定計(jì)算計(jì)算描述子所需的圖像區(qū)域描述子所需的圖像區(qū)域 描述子梯度方向直方圖由關(guān)鍵點(diǎn)所在尺度的模糊圖像計(jì)算產(chǎn)描述子梯度方向直方圖由關(guān)鍵點(diǎn)所在尺度的模糊圖像計(jì)算產(chǎn)生。圖像區(qū)域的半徑通過下式計(jì)算生。圖像區(qū)域的半徑通過下式計(jì)算:32112octdra

47、diusoct4d l 128維關(guān)鍵點(diǎn)描述子生成步驟維關(guān)鍵點(diǎn)描述子生成步驟Scale Invariant Feature TransformSIFT2022/5/19442. 將坐標(biāo)移至關(guān)鍵點(diǎn)主方向?qū)⒆鴺?biāo)移至關(guān)鍵點(diǎn)主方向那么旋轉(zhuǎn)角度后新坐標(biāo)為:那么旋轉(zhuǎn)角度后新坐標(biāo)為: cossinsincosxxyy Scale Invariant Feature TransformSIFT2022/5/1945:等于描述子窗口寬度 直方圖列數(shù)(取4)的一半; 22,exp1112kkrcowxyweightgrad Ix ydddkxkyw3:該點(diǎn)與關(guān)鍵點(diǎn)的列距離;:該點(diǎn)與關(guān)鍵點(diǎn)的行距離;3.3.在圖像半徑

48、區(qū)域內(nèi)對每個(gè)像素點(diǎn)求其梯度幅值和方向,然后對每個(gè)梯在圖像半徑區(qū)域內(nèi)對每個(gè)像素點(diǎn)求其梯度幅值和方向,然后對每個(gè)梯度幅值乘以高斯權(quán)重參數(shù),生成方向直方圖。度幅值乘以高斯權(quán)重參數(shù),生成方向直方圖。 Scale Invariant Feature TransformSIFT2022/5/19464.4.在窗口寬度為在窗口寬度為2X22X2的區(qū)域內(nèi)計(jì)算的區(qū)域內(nèi)計(jì)算8 8個(gè)方向的梯度方向直方圖,繪制每個(gè)個(gè)方向的梯度方向直方圖,繪制每個(gè)梯度方向的累加值,即可形成一個(gè)種子點(diǎn)。然后再在下一個(gè)梯度方向的累加值,即可形成一個(gè)種子點(diǎn)。然后再在下一個(gè)2X22X2的區(qū)域的區(qū)域內(nèi)進(jìn)行直方圖統(tǒng)計(jì),形成下一個(gè)種子點(diǎn),共生成內(nèi)進(jìn)

49、行直方圖統(tǒng)計(jì),形成下一個(gè)種子點(diǎn),共生成1616個(gè)種子點(diǎn)。個(gè)種子點(diǎn)。12128,Ww ww12128, ,Ll ll5.5.描述子向量元素門限化及門限化后的描述子向量規(guī)范化。描述子向量元素門限化及門限化后的描述子向量規(guī)范化。描述子向量元素門限化:描述子向量元素門限化:方向直方圖每個(gè)方向上梯度幅值限制在一定門限值以下(門限一般取方向直方圖每個(gè)方向上梯度幅值限制在一定門限值以下(門限一般取0.20.2)。)。描述子向量元素規(guī)范化:描述子向量元素規(guī)范化:為得到的為得到的128128描述子向量描述子向量, ,為規(guī)范化后的向量為規(guī)范化后的向量 Scale Invariant Feature Transfo

50、rmSIFT2022/5/1947 關(guān)鍵點(diǎn)關(guān)鍵點(diǎn)描述子向量的規(guī)范化正是可去除描述子向量的規(guī)范化正是可去除滿足此模型的光照滿足此模型的光照影影響響。對于圖像灰度值整體漂移對于圖像灰度值整體漂移 ,圖像各點(diǎn)的梯度是鄰域像素相減得,圖像各點(diǎn)的梯度是鄰域像素相減得到,所以也能去除。到,所以也能去除。1281/jjiilww1,2,128j BackBackScale Invariant Feature TransformSIFT2022/5/1948 分別對模板圖(參考圖,分別對模板圖(參考圖,reference imagereference image)和實(shí)時(shí)圖(觀測)和實(shí)時(shí)圖(觀測圖,圖,obse

51、rvation imageobservation image)建立關(guān)鍵點(diǎn)描述子集合。目標(biāo)的識(shí)別是通)建立關(guān)鍵點(diǎn)描述子集合。目標(biāo)的識(shí)別是通過兩點(diǎn)集內(nèi)關(guān)鍵點(diǎn)描述子的比對來完成。具有過兩點(diǎn)集內(nèi)關(guān)鍵點(diǎn)描述子的比對來完成。具有128128維的關(guān)鍵點(diǎn)描述子維的關(guān)鍵點(diǎn)描述子的相似性度量采用歐式距離。的相似性度量采用歐式距離。Scale Invariant Feature TransformSIFT2022/5/1949原圖像原圖像目標(biāo)圖像目標(biāo)圖像窮舉匹配窮舉匹配Scale Invariant Feature TransformSIFT2022/5/195012128,iiiiRr rr12128,iiiiS

52、sss12821,iiijijjd R Srs 模板圖中關(guān)鍵點(diǎn)描述子:模板圖中關(guān)鍵點(diǎn)描述子: 實(shí)時(shí)圖中關(guān)鍵點(diǎn)描述子:實(shí)時(shí)圖中關(guān)鍵點(diǎn)描述子: 任意兩描述子相似性度量:任意兩描述子相似性度量: 要得到配對的關(guān)鍵點(diǎn)描述子, 需滿足:ijipRSThresholdRS實(shí)時(shí)圖中距離 最近的點(diǎn) 實(shí)時(shí)圖中距離 的次最近點(diǎn) ,ijd R SScale Invariant Feature TransformSIFT2022/5/1951關(guān)鍵點(diǎn)的匹配可以采用窮舉法來完成,但是這樣耗費(fèi)的時(shí)間太多,一關(guān)鍵點(diǎn)的匹配可以采用窮舉法來完成,但是這樣耗費(fèi)的時(shí)間太多,一般都采用一種叫般都采用一種叫kdkd樹的數(shù)據(jù)結(jié)構(gòu)來完成搜索

53、。搜索的內(nèi)容是以目標(biāo)圖樹的數(shù)據(jù)結(jié)構(gòu)來完成搜索。搜索的內(nèi)容是以目標(biāo)圖像的關(guān)鍵點(diǎn)為基準(zhǔn),搜索與目標(biāo)圖像的特征點(diǎn)最鄰近的原圖像特征點(diǎn)像的關(guān)鍵點(diǎn)為基準(zhǔn),搜索與目標(biāo)圖像的特征點(diǎn)最鄰近的原圖像特征點(diǎn)和次鄰近的原圖像特征點(diǎn)。和次鄰近的原圖像特征點(diǎn)。KdKd樹是一個(gè)平衡二叉樹樹是一個(gè)平衡二叉樹Scale Invariant Feature TransformSIFT2022/5/1952BackScale Invariant Feature TransformSIFT2022/5/1953關(guān)鍵點(diǎn)匹配并不能標(biāo)志著算法的結(jié)束,因?yàn)樵谄ヅ涞倪^程中存在著大關(guān)鍵點(diǎn)匹配并不能標(biāo)志著算法的結(jié)束,因?yàn)樵谄ヅ涞倪^程中存在著大量

54、的錯(cuò)配點(diǎn)。量的錯(cuò)配點(diǎn)。圖中交叉的綠線為錯(cuò)配點(diǎn)圖中交叉的綠線為錯(cuò)配點(diǎn)Scale Invariant Feature TransformSIFT2022/5/1954 RANSACRANSAC(Random Sample ConsensusRandom Sample Consensus,隨機(jī)抽樣一致隨機(jī)抽樣一致 ) 是一是一種魯棒性的參數(shù)估計(jì)方法。種魯棒性的參數(shù)估計(jì)方法。 RANSAC RANSAC簡介簡介RANSACRANSAC實(shí)質(zhì)上就是一個(gè)反復(fù)測試、不斷迭代的過程。實(shí)質(zhì)上就是一個(gè)反復(fù)測試、不斷迭代的過程。 RANSAC RANSAC的的基本思想基本思想: 首先根據(jù)具體問題設(shè)計(jì)出某個(gè)目標(biāo)函數(shù),然

55、后通過反復(fù)提取首先根據(jù)具體問題設(shè)計(jì)出某個(gè)目標(biāo)函數(shù),然后通過反復(fù)提取最小點(diǎn)集估計(jì)該函數(shù)中參數(shù)的初始值,利用這些初始值把所有的數(shù)最小點(diǎn)集估計(jì)該函數(shù)中參數(shù)的初始值,利用這些初始值把所有的數(shù)據(jù)分為據(jù)分為“內(nèi)點(diǎn)內(nèi)點(diǎn)”( inlier inlier )和)和“外點(diǎn)外點(diǎn)“(outlieroutlier),最后用所有),最后用所有的內(nèi)點(diǎn)重新計(jì)算和估計(jì)函數(shù)的參數(shù)。的內(nèi)點(diǎn)重新計(jì)算和估計(jì)函數(shù)的參數(shù)。Scale Invariant Feature TransformSIFT2022/5/1955 RANSAC RANSAC事例事例如何估計(jì)最佳直線?重復(fù)進(jìn)行,擬合最優(yōu)直線ykxb隨機(jī)取兩樣本點(diǎn)擬合直線擬合直線:Back

56、BackScale Invariant Feature TransformSIFT2022/5/1956 SIFTSIFT算法目前在軍事、工業(yè)和民用方面都得到了不同程度的應(yīng)用,算法目前在軍事、工業(yè)和民用方面都得到了不同程度的應(yīng)用,其應(yīng)用已經(jīng)滲透了很多領(lǐng)域,典型的應(yīng)用如下:其應(yīng)用已經(jīng)滲透了很多領(lǐng)域,典型的應(yīng)用如下: 物體識(shí)別物體識(shí)別 機(jī)器人定位與導(dǎo)航機(jī)器人定位與導(dǎo)航 圖像拼接圖像拼接 三維建模三維建模 手勢識(shí)別手勢識(shí)別 視頻跟蹤視頻跟蹤 筆記鑒定筆記鑒定 指紋與人臉識(shí)別指紋與人臉識(shí)別 犯罪現(xiàn)場特征提取犯罪現(xiàn)場特征提取 Scale Invariant Feature TransformSIFT20

57、22/5/1957 物體識(shí)別物體識(shí)別Scale Invariant Feature TransformSIFT2022/5/1958 圖像拼接圖像拼接DemoScale Invariant Feature TransformSIFT2022/5/1959 三維建模三維建模Scale Invariant Feature TransformSIFT2022/5/1960 手勢識(shí)別手勢識(shí)別目前,手勢識(shí)別已應(yīng)用于手機(jī)等設(shè)備上。目前,手勢識(shí)別已應(yīng)用于手機(jī)等設(shè)備上。Scale Invariant Feature TransformSIFT2022/5/1961 筆記鑒定筆記鑒定Scale Invariant Feature TransformSIFT2022/5/1962 來自網(wǎng)友的創(chuàng)意來自網(wǎng)友的創(chuàng)意周正龍的老虎周正龍的老虎圖圖1 1周正龍的華南周正龍的華南虎照片與年畫上的虎照片與年畫上的華南虎照片華南虎照片1212

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論