




已閱讀5頁,還剩72頁未讀, 繼續(xù)免費(fèi)閱讀
(精密儀器及機(jī)械專業(yè)論文)基于對偶四元數(shù)的三維物體匹配方法的研究.pdf.pdf 免費(fèi)下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
哈爾濱工程大學(xué)碩士學(xué)位論文 摘要 三維物體識別一直是計(jì)算機(jī)視覺的一個重要方向,如何快速而準(zhǔn)確 的識別出物體的形狀與方位是研究的關(guān)鍵問題之一。工程中存在諸多實(shí) 際應(yīng)用,并可進(jìn)行有效簡化。例如,在可視化導(dǎo)航應(yīng)用中,兩個相鄰位 置的變換通常很小或者近似知道。但是對于復(fù)雜物體,特別是自由形態(tài) 物體,由于描述的復(fù)雜性以及分割的低可靠性使得問題變得尤為困難。 本文討論的基于模型幾何學(xué)原理的匹配算法正是為滿足這一需求而提 出的。匹配過程中,物體是用任意形狀的曲線表示,即實(shí)際中可能存在 的任意空間曲線,并將曲線用序列點(diǎn)集的形式表示。算法直接對用深度 圖建立的物體表面三維數(shù)據(jù)坐標(biāo)進(jìn)行處理,而不需要對物體的特征進(jìn)行 假設(shè)與分割。算法的思想是在迭代最近點(diǎn)匹配算法( i c p ) 的基礎(chǔ)上將一 條曲線上的點(diǎn)與另一條曲線上的最近點(diǎn)迭代匹配,利用最小二乘法的優(yōu) 化算法估計(jì)相應(yīng)點(diǎn)的三維變換,從而不斷減小兩條曲線( 序列點(diǎn)) 間的 平均距離。仿真試驗(yàn)表明,這是一種高效、精確的三維物體識別與配準(zhǔn) 的估計(jì)方法。 論文對近十年來三維物體識別系統(tǒng)必須解決的傳感器類型、三維物 體表達(dá)方法和匹配策略等三個方面問題進(jìn)行了綜述,并對主要方法進(jìn)行 了分類和總結(jié)。提出了一種精確而有效的估計(jì)三維物體運(yùn)動參數(shù)的數(shù)學(xué) 方法一對偶四元數(shù)法,并通過實(shí)驗(yàn)檢驗(yàn)了對偶四元數(shù)法的性能、精度和 速度。論文將對偶四元數(shù)法應(yīng)用到三維物體識別的匹配算法中,利用最 小二乘的思想提出了一種基于迭代最近點(diǎn)的匹配算法。通過對實(shí)際應(yīng)用 中的幾個問題的討論,明確了算法需要解決的關(guān)鍵技術(shù)和主要運(yùn)算步 驟。通過模擬數(shù)據(jù)仿真試驗(yàn),驗(yàn)證了算法的魯棒性和有效性。 關(guān)鍵詞:計(jì)算機(jī)視覺;i c p 算法;幾何匹配;對偶四元數(shù)法 ;墮璽鎏三堡奎塵壘l :耋童鎏苧 ; a b s t r a c t 3 do b j e c tr e c o g n i t i o ni sac h a l l e n g ep r o b l e mi nc o m p u t e rv i s i o n , i nw h i c ht h em o s ti m p o r t a n tt a s ki sh o wt oi d e n t i f yt h es h a p ea n dt h e p o s eo ft h eo b je c tr a p i d l ya n da c c u r a t e l y t h e r ea r em a n yp r a c t i c a l a p p l i c a t i o n si np r o je c t i nv i s u a ln a v i g a t i o n ,f o re x a m p l e ,t h em o t i o n b e t w e e ns u c c e s s i v ep o s i t i o n si su s u a l l ye i t h e rs m a l lo ra p p r o x i m a t e l y k n o w n b u tr e g a r d i n gt oc o m p l e xo b j e c te s p e c i a l l yf r e e - f o r mo b j e c t , i t i sd i f f i c u l tt oa c h i e v ep r o p e rr e g i s t r a t i o nr e s u l tb e c a u s eo ft h e c o m p l e x i t yo fr e p r e s e n t a t i o na n dl o ws e g m e n t a t i o nr e l i a b i l i t y t h e m a t c h i n ga l g o r i t h m d e s c r i b e di n t h i s r e p o r t t h a ti sb a s e do n g e o m e t r i cp r i n c i p l e o fm o d e lm e e t st h i sn e e d i n p r o c e s s o f r e c o g n i t i o n ,o b j e c t s a r e r e p r e s e n t e db y f r e e f o r m c u r v e s ,i e , a r b i t r a r ys p a c ec u r v e so ft h et y p ef o u n di np r a c t i c e ac u r v e i s a v a i l a b l ei nt h ef o r mo fas e to fc h a i n e dp o i n t s t h ea l g o r i t h md e a l s w i t h3 do b j e c tc o o r d i n a t ed i r e c t l yw i t h o u tn e e do fa ne x p l i c i to b j e c t d e s c r i p t i o ni nt e r m so fp r i m i t i v e s t h ei d e ao fa l g o r i t h mi sl i e d i n i t e r a t i v e l ym a t c h i n gp o i n t so no n ec u r v et ot h ec l o s e s tp o i n t so nt h e o t h e r ,w h i c hb a s e do ni t e r a t i v e l yc l o s e s tp o i n t ( i c p ) a l g o r i t h m a l e a s t s q u a r e st e c h n i q u ei su s e dt oe s t i m a t e3 dm o t i o nf r o mt h ep o i n t c o r r e s p o n d e n c e s ,w h i c hr e d u c e st h ea v e r a g ed i s t a n c eb e t w e e nc u r v e s i nt h et w os e t s t h er e s u l t so fe m u l a t i o ne x p e r i m e n tw i t hs y n t h e t i c a n dr e a ld a t ai n d i c a t et h a ti t i sa ne f f i c i e n ta n da c c u r a t ee s t i m a t i o n m e t h o do f3 do b j e c tr e c o g n i t i o na n dr e g i s t r a t i o n t h er e p o r ts u m m a r i z e st h r e ep r o b l e m si n c l u d i n gs e n s o rt y p e s , 3 do b j e c tr e p r e s e n t a t i o nm e t h o d sa n dm a t c h i n gs t r a t e g i e sd u r i n gl0 y e a r s ,w h i c hn e e dt ob es o l v e db y3 do b j e c tr e c o g n i t i o ns y s t e m , f u r t h e r m o r e ,i tc l a s s i f i e sa n ds u m su pt h o s eo fm a i nm e t h o d s t h e n , w ew o r ko u ta na c c u r a t ea n de f f i c i e n tm a t h e m a t i c sm e t h o d ,d u a l q u a t e r n i o na l g o r i t h m ,w h i c hc a nb e u s e dt o e s t i m a t e3do b je c t m o t i o n p a r a m e t e r s ,a n d v a l i d a t et h e a l g o r i t h m sp e r f o r m a n c e , p r e c i s i o n a n ds p e e d b ye x p e r i m e n t s l a s t ,w ea p p l yt h e d u a l q u a t e r n i o na l g o r i t h mt om a t c h i n ga l g o r i t h mo f3 do b j e c tr e c o g n i t i o n a n dm a k eu s eo fl e a s t s q u a r e s t e c h n i q u e t o p r o p o s e a m a t c h i n g m e t h o db a s e do ni t e r a t i v ec l o s e s tp o i n t t h ek e yt e c h n o l o g i e sa n d 哈爾濱上程火學(xué)碩士學(xué)位論文 m a i no p e r a t i o ns t e p so fa l g o r i t h ma r ec o n f i r m e db yd e m o n s t r a t i n g s e v e r a lp r o b l e m si n p r a c t i c a la p p l i c a t i o n s w ea p p l ye m u l a t i o n e x p e r i m e n tw i t hs y n t h e t i ca n dr e a ld a t at op r o v et h ev a l i d i t ya n d r o b u s to fo u rm e t h o d k e yw o r d :c o m p u t e rv i s i o n ,i c pa l g o r i t h m ,g e o m e t r i cm a t c h i n g d u a lq u a t e r n i o na l g o r i t h m 哈爾濱工程大學(xué) 學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:本論文的所有工作,是在導(dǎo)師的指導(dǎo) 下,由作者本人獨(dú)立完成的。有關(guān)觀點(diǎn)、方法、數(shù)據(jù)和文 獻(xiàn)的引用已在文中指出,并與參考文獻(xiàn)相對應(yīng)。除文中已 注明引用的內(nèi)容外,本論文不包含任何其他個人或集體已 經(jīng)公開發(fā)表的作品成果。對本文的研究做出重要貢獻(xiàn)的個 人和集體,均己在文中以明確方式標(biāo)明。本人完全意識到 本聲明的法律結(jié)果由本人承擔(dān)。 作者( 簽字) : 日期:年月 日 哈爾濱工程大學(xué)碩士學(xué)位論文 第1 章緒論 1 1 引言 計(jì)算機(jī)視覺是在圖像處理的基礎(chǔ)上發(fā)展出來的新興學(xué)科,它從信息處理的層 次研究信息的認(rèn)識過程,研究視覺信息處理的計(jì)算機(jī)理論、表達(dá)與計(jì)算方法。從 視覺計(jì)算理論出發(fā),可以將計(jì)算機(jī)視覺研究分為自上而下的三個階段【l j ,即視覺 信息從最初的原始數(shù)據(jù)( - - 維數(shù)據(jù)) 到最終的三維環(huán)境表達(dá)所經(jīng)歷的三個階段。 第一階段是構(gòu)成所謂的“要素圖”或“基元圖”( p r i m a r ys k e t c h ) ,它由二維圖像 中的邊緣點(diǎn)、直線段、曲線、頂點(diǎn)、文理等基本幾何元素或特征組成;第二階段, 稱為環(huán)境的2 5 維表述,即部分不完整的三維信息描述:從“計(jì)算”語言上講, 就是重建三維物體在觀察者為中心的坐標(biāo)系下的三維物體形狀。事實(shí)上,從各個 不同角度觀察物體獲得的信息都是不完整的。因此,2 5 維物體表述必須進(jìn)一步處 理以得到物體的完整三維描述,而且必須是物體本身某一固定坐標(biāo)下的描述,這 一階段稱為三維階段。 計(jì)算機(jī)視覺處理的目的是由從景物圖像中提取的信息實(shí)現(xiàn)對景物的描述。一 般可以把計(jì)算機(jī)視覺大體分為對二維數(shù)據(jù)的處理和對三維數(shù)據(jù)的處理兩個大的方 向。對二維數(shù)據(jù)的處理通常按如下方式進(jìn)行:從圖像中提取諸如邊緣這樣的特征, 或者將圖像分割成區(qū)域,得到一個有用特性值標(biāo)記的圖像特征組成的表示圖,然 后對其作分組處理已得到有關(guān)信息。對三維數(shù)據(jù)的處理過程要復(fù)雜的多,由于三 維物體數(shù)據(jù)描述的復(fù)雜性和物體特征分割的低可靠性使三維數(shù)據(jù)的處理過程很難 直接使用傳統(tǒng)的對二維數(shù)據(jù)的一般處理方法。然而在很多情況下,我們需要實(shí)現(xiàn) 對三維數(shù)據(jù)的處理,例如機(jī)器人行為、計(jì)算機(jī)虛擬現(xiàn)實(shí)模擬、工業(yè)制造中三維物 體數(shù)據(jù)的獲得與描述等,其中應(yīng)用最廣,涉及計(jì)算機(jī)處理領(lǐng)域最多的是種被稱 為反n - r 程( r e v e r s ee n g i n e e r i n g ) 的方法,即對已經(jīng)存在的實(shí)物建立計(jì)算機(jī)幾何模 型。反向工程的主要應(yīng)用領(lǐng)域包括計(jì)算機(jī)圖形學(xué)、機(jī)器視覺以及醫(yī)學(xué)成像等。反 向工程一般涉及數(shù)據(jù)獲取、預(yù)處理、數(shù)據(jù)分割與融合、c a d 模型建立等領(lǐng)域。一 般流程如圖1 1 所示。 哈爾濱工程大學(xué)碩士學(xué)位論文 甸睜圄嗡回 圖1 1 反向工程的流程圖 1 2 課題的研究背景、目的和意義 計(jì)算機(jī)視覺系統(tǒng)的目標(biāo)是解釋已有的“視覺”數(shù)據(jù),并使用這些解釋去完成 任務(wù)。在自動導(dǎo)航、自動檢測、裝配任務(wù)與醫(yī)學(xué)圖像分析等領(lǐng)域都存在這種應(yīng)用 的需求,三維物體識別是計(jì)算機(jī)視覺系統(tǒng)的基本功能,目前已成為該領(lǐng)域的研究 熱點(diǎn)。 計(jì)算機(jī)視覺系統(tǒng)一般可分為兩大類【l 】:一類是深度重建的計(jì)算機(jī)視覺系統(tǒng), 另一類是基于知識的計(jì)算機(jī)視覺系統(tǒng)。前者主要是從圖像中得到物體的形狀特征, 這些特征包括立體視覺、運(yùn)動、灰度、紋理等,而后得到2 5 維圖,即在以觀察 者為中心的坐標(biāo)系中,把可見表面的朝向,大致輪廓及光的不連續(xù)輪廓表達(dá)清楚, 最終和三維模型匹配,其識另工作是在三維域中進(jìn)行的。第二類則是根據(jù)圖像特 征,通過感知機(jī)構(gòu)得到圖像中物體的二維特征結(jié)構(gòu)群,它包括能代表圖像中物體 的大部分信息,而且在較大的觀察范圍內(nèi)特征是不變的,而后通過基于知識的匹 配過程在模型中找到對應(yīng)的結(jié)構(gòu),和三維模型進(jìn)行匹配,一個較為完整的計(jì)算機(jī) 視覺系統(tǒng)必須包括圖像獲取,低層次的邊界檢測、分割、物體的建模、匹配和識 別幾個部分。 三維物體識別是計(jì)算機(jī)視覺的重要組成部分,它的任務(wù)是識別出圖像中有什 么類型的物體,并反映出物體在圖像所反映的場景中的位置和方向,如果在識別 過程中要利用有關(guān)物體的先驗(yàn)知識,則稱為基于模型的三維物體識別。在基于模 型的三維物體識別中,一般要通過兩個階段的處理,以完成對圖像中3 d 物體的 識別和定位 2 1 ,即首先通過傳感器獲取的場景輸入數(shù)據(jù)來得到場景的表達(dá),然后 將它與數(shù)據(jù)庫中存儲的物體表達(dá)相匹配,具體來說,三維物體識別系統(tǒng)必須解決 如下幾個問題 3 1 :( 1 ) 獲取原始數(shù)據(jù)的傳感器類型;( 2 ) 三維物體模型表達(dá)( 構(gòu) 2 哈爾濱工程大學(xué)碩士學(xué)位論文 造) 方法;( 3 ) 描述原始數(shù)據(jù)和物體模型的工具:( 4 ) 從輸入數(shù)據(jù)獲得的物體描 述和物體模型描述之間的匹配方法。其中,傳感器決定了輸入數(shù)據(jù)的分辨率、準(zhǔn) 確性和類型( 2 d 和3 d 信息) ;而模型則提供了視覺系統(tǒng)的先驗(yàn)知識;表達(dá)則用 于表述采集的數(shù)據(jù)和物體模型,是計(jì)算機(jī)視覺中的一個關(guān)鍵論題;另外,知識表 達(dá)還決定了匹配策略、匹配策略的魯棒性和系統(tǒng)效率,并且在匹配過程中表達(dá)還 用來計(jì)算物體的不同特征。由于匹配策略是在識別系統(tǒng)運(yùn)行時(shí)執(zhí)行的,因此它必 須解決數(shù)據(jù)和模型表述之間的二義性【4 】。一旦確定了正確的匹配,則根據(jù)物體模 型,既可以將已定位物體的方向和變換計(jì)算出來,最終完成物體識別的任務(wù)。 如上所述,匹配策略的設(shè)計(jì)是整個計(jì)算機(jī)視覺系統(tǒng)設(shè)計(jì)的關(guān)鍵技術(shù)和重要環(huán) 節(jié),也是本課題研究的重點(diǎn)。本課題就是針對三維物體識別中的匹配方法進(jìn)行理 論和實(shí)驗(yàn)研究。 1 3 國內(nèi)外研究動態(tài)及課題引出 1 3 1 三維物體匹配策略 對三維物體進(jìn)行空間定位與識別是計(jì)算機(jī)視覺應(yīng)用研究領(lǐng)域中極為活躍的 課題之一,國內(nèi)外已有不少學(xué)者在這方面作了許多工作,并取得一定成就。根據(jù) 3 d 物體識別過程,從輸入圖像中得到物體表達(dá)后,就需要對場景中存在的物體進(jìn) 行識別和定位。這種識別是通過將場景中得到的物體特征和物體模型中的特征進(jìn) 行匹配來完成的,而各種識別方法的不同之處不僅在于使用不同的物體表達(dá)方法, 而且也在于如何完成場景特征和模型特征之間的匹配、如何從場景模型特征匹配 中得到一致解釋和如何從一致解釋中得到姿態(tài)估計(jì)。針對這一問題,國際上也有 許多學(xué)者進(jìn)行了大量的研究工作,如今三維物體識別的主要匹配方法有【5 】:假 設(shè)檢驗(yàn)法;解釋樹;基于圖的識別方法;霍夫姿態(tài)聚類;幾何哈西表; 迭代模型擬合技術(shù);基于神經(jīng)網(wǎng)絡(luò)的匹配方法。這些方法的具體形式將在第 二章中作詳細(xì)描述。 本課題選取迭代模型擬合法,這類方法的一個明顯特征是在計(jì)算上的迭代過 程。當(dāng)三維物體用參數(shù)進(jìn)行表達(dá)描述,并在該參數(shù)既能確定形狀,也能確定物體 姿態(tài)的情況下,可以使用迭代模型擬合的方法。此時(shí),物體識別和姿態(tài)估計(jì)可簡 3 哈爾濱工程大學(xué)碩士學(xué)位論文 化成估算圖像數(shù)據(jù)中的模型( 姿態(tài)) 參數(shù),且可與存儲的模型參數(shù)表達(dá)相匹配, 即通過迭代的方法求解一個約束線性方程或者非線性方程系統(tǒng),并選擇與場景有 最小平方和誤差的解,作為估計(jì)參數(shù)。比較典型的是b e s l 、c h e n 和z h a n g 等提出 的最臨近點(diǎn)匹配算法,其目的是為了找到兩幅深度圖之間的變換關(guān)系,具體實(shí)現(xiàn) 過程是通過迭代的方法找到平均平方誤差最小的變換,也稱作i c p 算法( i t e r a t i v e c l o s e s t p o i n t s ) ,該方法廣泛用于3 d 物體的識別。 將i c p 算法應(yīng)用到3 d 物體識別中必須考慮到幾個關(guān)鍵問題,分別是:初值 和全局最優(yōu)化、匹配點(diǎn)的選擇、對應(yīng)關(guān)系的確定、風(fēng)b 性變換、迭代終止條件、魯 棒性、快速收斂陛和精度評估等,它們之間是相互影響的。其中前四個是i c p 算 法的主要步驟,但是它們的執(zhí)行都影響后三個問題。之前已有許多學(xué)者針對i c p 算法的基本技術(shù)進(jìn)行改進(jìn),p n z h a n g 用魯棒核代替誤差函數(shù)加強(qiáng)了基本技術(shù);c h e n 和m e d i o m 假設(shè)模型點(diǎn)能由曲面法線提供,它使得點(diǎn)對點(diǎn)的距離被點(diǎn)對切平面的 距離所代替。這兩種擴(kuò)展在基本算法上都提高了收斂性,而且沒有大幅度增加計(jì) 算量。為了將i c p 算法更有效的應(yīng)用到3 d 物體識別中,本文提出的迭代匹配算 法以實(shí)現(xiàn)對i c p 算法的幾個主要步驟進(jìn)行改進(jìn),包括偽點(diǎn)匹配、最大距離容限、 對偶四元數(shù)法計(jì)算變換矩陣等,在不同程度上提高了匹配性能。 i c p 算法的最基本前提或者說假設(shè)條件就是澳4 量值無誤差,但是這在實(shí)際中 是不存在的,而且由于野值點(diǎn)( o u t l i e r s ) 的存在,可能使得i c p 算法不能正常工 作,所以如何提高算法的魯棒性是i c p 算法在目標(biāo)識別應(yīng)用中需要研究的方向之 一。再有,i c p 算法被證明是單調(diào)收斂到局部最小的,但是如何讓i c p 算法快速 地收斂到全局最優(yōu)也是i c p 算法的改進(jìn)方向之一。在增強(qiáng)算法的魯棒性的同時(shí)必 然增加算法的復(fù)雜性和計(jì)算時(shí)間,魯棒性和快速收斂性是相互矛盾的,因此在實(shí) 際應(yīng)用中應(yīng)該綜合考慮系統(tǒng)的情況來折衷選擇算法的魯棒性和快速性。本文針對 這一問題提出了一種改進(jìn)算法,即l m j c p 算法l 司,將非線性最優(yōu)化算法 ( l e v e n b e r g - m a r q u a r d t ) 引入到i c p 算法中,通過非線性最優(yōu)化直接最小化模型 數(shù)據(jù)的擬合誤差,提高算法的收斂速度。使用該方法來生成一個魯棒誤差函數(shù), 這個函數(shù)大大增加了所給樣本的收斂半徑,而且在速度上沒有很大的損失。因此 從整體上可以改進(jìn)算法的魯棒性i 翮時(shí)又提高快速收斂性。 4 哈爾濱工程大學(xué)碩士學(xué)位論文 1 3 2 幾何匹配技術(shù) 幾何匹配在計(jì)算機(jī)視覺和機(jī)器人視覺中是一個普遍存在而難于解決的問題, 主要有兩個方面的應(yīng)用:目標(biāo)識別和可視化導(dǎo)航。對于目標(biāo)識別問題是將觀測數(shù) 據(jù)與代表不同目標(biāo)的預(yù)存模型相匹配;可視化導(dǎo)航問題是匹配不同時(shí)刻的動態(tài)場 景觀測數(shù)據(jù)以便再現(xiàn)目標(biāo)的運(yùn)動和解釋場景。1 9 8 5 年以前的絕大部分工作主要集 中在多面體目標(biāo)f 】,通常使用幾何元素,如,點(diǎn)、線和平面,與我們生活的真實(shí)世 界相比,這當(dāng)然非常有限。最近,曲線目標(biāo)已經(jīng)引起很多計(jì)算機(jī)視覺研究者的注 意。本文采用曲線特別是任意形狀的曲線即現(xiàn)實(shí)中發(fā)現(xiàn)的任意空間曲線來表示三 維物體目標(biāo)。 任意形狀的曲線用序列點(diǎn)集合表示。對任意形狀的曲線已經(jīng)有文獻(xiàn)提出了幾 種匹配技術(shù)。第一類技術(shù)是測量曲率的極值,然后用于匹配【s 】,但是曲率極值的 精確定位是非常困難的,特別是曲線非常平滑的時(shí)候。曲線的很小變化就改變了 曲率極值的數(shù)值及其在曲線上的位置,因而,基于曲率極值的匹配對噪聲極為敏 感。第二類技術(shù)是將曲線變換為一個局部序列旋轉(zhuǎn)和平移不變特征( 即曲率和撓 率) ,曲線的匹配問題就簡化為一維串匹配問題 9 ,1 0 , 1 1 】,由于使用更多的信息,這 類方法可能比第一類方法更具魯棒性,但是這些方法仍然受噪聲干擾的影響,因 為它們是用曲線的弧長來采樣獲得點(diǎn)集,這些弧長本身對噪聲是敏感的。 上述方法是希用全局匹配準(zhǔn)則的思想來處理任意形狀曲線的兩個點(diǎn)集,它們 因大的運(yùn)動或變換而不同,這種處理大運(yùn)動的能力對于目標(biāo)識別來說通常是非常 重要的。在很多其它的應(yīng)用中,如可視化導(dǎo)航,相繼兩幀( 框架) 中曲線的運(yùn)動 通常要么較小( 因?yàn)槟繕?biāo)的最大速度是有限的,而采樣頻率可以很高) ,要么在一 個合理的精度內(nèi)是已知的( 因?yàn)橐粋€移動的載體通常安裝幾種儀表如計(jì)程儀和慣 性系統(tǒng),可以提供這些運(yùn)動信息) ,對后一種情況,第一幀可以首先應(yīng)用給定的估 計(jì)產(chǎn)生中間幀,之后認(rèn)為中間幀與第一幀之間的運(yùn)動很小。在運(yùn)動很小的前提下 就可以應(yīng)用迭代匹配算法對第二幀進(jìn)行估計(jì)。 本文提出的匹配方法正是針對小運(yùn)動的三維物體進(jìn)行配準(zhǔn),即直接對物體三 維數(shù)據(jù)進(jìn)行處理運(yùn)算,以獲得三維物體的識別與定位。 5 哈爾濱工程大學(xué)碩士學(xué)位論文 1 4 論文主要研究內(nèi)容 完成對圖像中3 d 物體的識別和定位,一般要通過兩個階段的處理,即首先 通過傳感器獲取的場景輸入數(shù)據(jù)來得到場景的表達(dá),然后將它與數(shù)據(jù)庫中存儲的 物體表達(dá)相匹配。由于本課題的重點(diǎn)在于匹配算法的研究與驗(yàn)證,因此對于三維 物體識別中的數(shù)據(jù)獲取和三維物體模型的構(gòu)造方法只在第二章的綜述中有所介 紹,不對其進(jìn)行深究。 本文主要研究三維物體數(shù)據(jù)的匹配方法。這種方法是一種基于模型的幾何學(xué) 匹配方法,使用最小二乘法估計(jì)數(shù)據(jù)間的剛體變換獲得最佳旋轉(zhuǎn)矩陣和最佳平移 向量。物體與模型間的比較是通過迭代最近點(diǎn)匹配算法( i c p ) 的思想實(shí)現(xiàn)的,簡單 原理如圖1 2 所示。 圖1 2 匹配算法簡單原理圖 雖然本文的算法應(yīng)用了i c p 算法的思想,但是與通常意義上的i c p 算法比較, 還有所不同。主要表現(xiàn)在,匹配過程中每一個步驟的具體實(shí)現(xiàn)方法都有不同的考 慮,并且有所改進(jìn)。包括偽點(diǎn)匹配、最大距離容限、迭代終止k - q q :、k d 樹尋找 最近點(diǎn)、引入加權(quán)系數(shù)和對偶四元數(shù)法計(jì)算剛體變換參數(shù)等。論文主要研究內(nèi)容 及結(jié)構(gòu)安排如下: 第二章圍繞著三維物體識別系統(tǒng)必須解決的傳感器類型、三維物體表達(dá)方法 和匹配策略等三個方面問題,對近十年來的研究成果進(jìn)行了綜述,并對主要方法 進(jìn)行了分類和總結(jié)。 第三章提出一種新的算法,用對偶四元數(shù)來解決物體定位問題。物體定位與 物體識別是計(jì)算機(jī)視覺中一脈相承的問題,都是要用最小二乘法的最優(yōu)技術(shù)估計(jì) 6 哈爾溟工程大學(xué)碩士學(xué)位論文 剛體變換參數(shù)t 。這一章首先介紹了算法的理論基礎(chǔ),包括對偶數(shù)、四元數(shù)、對 偶四元數(shù),及剛體變換的對偶四元數(shù)表示法與相似矩陣表示法之間的轉(zhuǎn)換,以及剛 體變換中各個參數(shù)的求取方法。其次將物體定位參數(shù)的估計(jì)作為最優(yōu)化問題,通 過最小化一個與方向和位置誤差總和有關(guān)的單值函數(shù)解出物體的方位。其中,物 體數(shù)據(jù)與模型數(shù)據(jù)是用對偶四元數(shù)表示,則計(jì)算物體位置和方向的方法就是要選 擇對偶四元數(shù)使用其表示的誤差函數(shù)最小化。最后通過實(shí)驗(yàn)檢驗(yàn)了對偶四元數(shù)算 法的性能、精度和速度。 第四章研究了三維物體識別中的匹配方法,提出一種基于迭代最近點(diǎn)的匹配 算法。物體數(shù)據(jù)與模型數(shù)據(jù)都用3 d 點(diǎn)集合表示,算法通過迭代的方法找到平均平 方誤差最小的變換實(shí)現(xiàn)物體與模型的匹配。首先研究算法匹配過程中的四個步驟: 尋找最近點(diǎn)、偽點(diǎn)匹配、匹配更新、計(jì)算運(yùn)動,其中尋找最近點(diǎn)是整個過程中最 耗時(shí)的步驟,本文選用尼d 樹的方法大大加速了這一過程;偽點(diǎn)匹配中對參加匹 配的點(diǎn)對引入了兩個限制條件,最大距離容限和方向的一致性。匹配更新中將最 大距離容限在每次迭代過程中進(jìn)行更新,它是在距離統(tǒng)計(jì)的基礎(chǔ)上適當(dāng)?shù)卦O(shè)置的, 因此算法更具魯棒性。計(jì)算運(yùn)動是從更新的匹配中計(jì)算兩圖像間的運(yùn)動,選用對 偶四元數(shù)法計(jì)算剛體的旋轉(zhuǎn)和平移。將運(yùn)動應(yīng)用到物體數(shù)據(jù)中的所有點(diǎn)和它們的 切線上,完成數(shù)據(jù)更新。算法引入了迭代終止條件:平移誤差和旋轉(zhuǎn)誤差,在程 序滿足終止條件時(shí)終止迭代過程。接下來討論了實(shí)際中應(yīng)該考慮的問題包括搜索 最近點(diǎn),參數(shù)d 的選擇,和不確定性,這幾方面細(xì)化了算法使其更有效的應(yīng)用到 實(shí)際中。最后模擬數(shù)據(jù)進(jìn)行了仿真試驗(yàn),分析實(shí)驗(yàn)結(jié)果驗(yàn)證了算法的魯棒性和有 效性。 第五章總結(jié)i c p 算法的派生形式,針對算法的收斂性和魯棒性簡單介紹了一 種改進(jìn)算法,即l m - i c p 算法,將非線性最優(yōu)化算法( l e v e n b e r g - m a r q u a r d t 算法) 引入到i c p 算法中,通過非線性最優(yōu)化直接最小化模型數(shù)據(jù)的擬合誤差,從而提 高算法的收斂速度。 哈爾濱工程大學(xué)碩士學(xué)位論文 第2 章三維物體的表述與匹配方法 2 1 引言 計(jì)算機(jī)視覺的根本目的是由從景物圖像數(shù)據(jù)中提取景物特征的描述,并利用 這些描述去完成特定的任務(wù),如船舶的自動導(dǎo)航、自動操縱避碰、機(jī)械零件裝配 任務(wù)或醫(yī)學(xué)圖像分析等,物體表達(dá)是匹配和識別的基礎(chǔ)。 計(jì)算機(jī)視覺系統(tǒng)的處理過程要通過兩個階段,現(xiàn)將圖像中的三維物體的識別 和定位 2 1 ,即通過傳感器獲取的物體輸入數(shù)據(jù)獲得物體的表達(dá);然后將它與模型 庫中存儲的物體表達(dá)相匹配。具體來說,識別系統(tǒng)必須解決如下幾個問題1 3 :( 1 ) 獲取原始數(shù)據(jù)的傳感器類型;( 2 ) 三維物體模型構(gòu)造及構(gòu)造方法;( 3 ) 描述原始數(shù)據(jù) 和物體模型的數(shù)字化工具;( 4 ) 輸入的物體描述數(shù)據(jù)和模型的描述數(shù)據(jù)之間的匹配 方法。其中,傳感器決定了輸入數(shù)據(jù)的分辨率、準(zhǔn)確性和類型( 2 d 或3 d 信息) ; 而模型是視覺系統(tǒng)的先驗(yàn)知識;物體的表達(dá)則用于描述采集的數(shù)據(jù)和物體模型之 間的相互關(guān)系,是計(jì)算機(jī)視覺中需要解決的一個關(guān)鍵問題;同時(shí),表達(dá)決定了匹 配的實(shí)現(xiàn)方法及這些方法的魯棒性和完成的效率,并且在匹配過程中還必須用表 達(dá)來描述物體的特征、衡量配準(zhǔn)的精度。由于匹配是在物體識別之前進(jìn)行,因此, 匹配必須解決測量數(shù)據(jù)和模型描述之間的二義性。一旦確定了正確的匹配,就可 以根據(jù)模型庫中的模型實(shí)現(xiàn)物體的識別,最終完成導(dǎo)航或避碰等要求的任務(wù)。 2 2 獲取測量數(shù)據(jù)的傳感器 目前,獲取測量數(shù)據(jù)常常采用兩類傳感器:一類是灰度傳感器( i n t e n s i t y s e n s o r ) ,得到的是物體每個象索點(diǎn)對應(yīng)的一個亮度測量;另一類是深度傳感器 ( r a n g es e n s o r ) ,其鋇l 量數(shù)據(jù)是象索點(diǎn)對應(yīng)于從傳感器到物體表面的距離?;叶葌?感器獲得的數(shù)據(jù)受環(huán)境光照強(qiáng)度、物體表面反射特性和紋理特征等多種因素的影 響,不是于采用幾何特征的物體模型匹配,而深度圖像能夠明確表達(dá)三維物體的 幾何特征,更適合根據(jù)物體幾何信息進(jìn)行匹配的三維物體識別,因此得到了廣泛 的應(yīng)用。圖2 2 為深度圖像與灰度圖像獲取方法的比較示意圖。 8 哈爾濱工程大學(xué)碩士學(xué)位論文 l i js f ) 6 f j0 n j ” 飄 ( a ) 獲取一幅灰度圖像 毫 ,曼4 0 。j 蠢、二| | 、疊 獲取一幅灰度圖像 9 氛 穆o 、 x i w 1 、,q,。n;噸 0 鑷 嘶 。暑l 乳 j :t i ;o 0 n o 日 哈爾濱工程大學(xué)碩士學(xué)位論文 ( c ) 獲取一幅深度圖像 ( m 獲取一幅深度圖像 圖2 2 ( a ) 、( b ) 、( c ) 、( d ) 為深度圖像與灰度圖像獲取方法的比較示意圖 2 3 三維物體表達(dá)方法 可以利用物體的其它信息如顏色、紋理、材質(zhì)等來改善識別系統(tǒng)的性能,本 哈爾濱工程大學(xué)碩士學(xué)位論文 文只討論物體的幾何表達(dá)方法,而且具備下述條件0 1 :( 1 ) 明確性( 沒有兩個物體有 相同的表達(dá)) ;( 2 ) 唯一性( 使用同一表達(dá)方法的每個物體必須只有一種描述) ;( 3 ) 不敏感性( 物體在部分被遮擋的情況下會缺少部分?jǐn)?shù)據(jù)) :( 4 ) 方便匹配和存儲。 2 3 1 表達(dá)方法的分類 三維物體表達(dá)方法可以分為以物體為中心的( o b j e c tc e n t e r e d ) 和以觀察者為中 心的( v i e w e rc e n t e r e d ) 兩類。其中,以物體為中心的表達(dá)方法是在物體本身坐標(biāo)系 中描述物體,并使用與觀察者視點(diǎn)無關(guān)的特征( 如拐角、孔洞、邊等等) 來描述物 體;以觀察者為中心的表達(dá)方法則依賴于從某一個或多個視角來確定物體的外觀, 并使用與視點(diǎn)相關(guān)的特征( 例如,遮擋的邊緣、輪廓和形狀等) 。 根據(jù)描述三維物體所使用的幾何特征不同,可以按照圖2 1 將表達(dá)方法從低 到高分為如下6 類:基于三維點(diǎn)的表達(dá)方法,主要使用物體的深度方向的數(shù)據(jù)、 表面點(diǎn)的法線方向和曲撓率大小等信息;基于凸點(diǎn)的表達(dá)方法,利用物體的頂 點(diǎn)、拐角點(diǎn)和曲率極大、極小值點(diǎn)等信息;基于輪廓的表達(dá)方法,主要是用物 體的邊緣信息;基于表面的表達(dá)方法,主要使用物體的表面信息,例如平面、 球面、二次曲面以及面與面之間的連接關(guān)系等;基于體的表達(dá)方法,主要使用 體素、橢球體、超級橢球體等體描述符;基于零件的表達(dá)方法,主要分析物體 的基本組成部分,例如體元( g e o n ) 方法。 2 3 2 表達(dá)方法的特點(diǎn) 下面分別介紹幾類有代表性的三維物體表達(dá)方法,并具體論述各種方法的主 要特點(diǎn)【5 1 。 ( 1 ) 基于基本表面特征的方法 物體表達(dá)為面、邊和頂點(diǎn)的序列是在圖像投影中與視角無關(guān)的特征,如g r i l l l s o n 和l o z a n o - p e m s 曾使用邊、直線段和方向矢量來表達(dá)多面體,由于使用多面體來 表達(dá)逼近曲面物體的表面,需要大量的存儲空間,所以可能使用平面和二次曲面 方程來描述曲面表面或根據(jù)表面點(diǎn)的高斯曲率和平均曲率將表面片分成峰、凹、 鞍) 等等一些主要的形狀更為合適。 同時(shí)s t e i n 和m e d i o n i 提出了一種結(jié)構(gòu)表達(dá)方法,這種方法根據(jù)表面法矢量 哈爾濱工程大學(xué)碩士學(xué)位論文 的分布來確定邊和局部表面,因此它能夠處理任意形狀的物體表面;另外,c h i t r a d o r a j 提出了3 d 自由形態(tài)物體的c o s m o s 表達(dá)方法,這種方法是先定義表面小 區(qū)域上的歸一化形狀索引特征,然后在全部表面上進(jìn)行統(tǒng)計(jì),以得到形狀譜,再 根據(jù)形狀索引特征得到最大一致形狀表面片,兩者聯(lián)合起來則構(gòu)成對任意形狀物 體的表達(dá)。 一般來說,基于局部邊界和表面等基本表面特征的方法,對獲取數(shù)據(jù)中的 噪聲敏感,并且準(zhǔn)確性要依賴于是否能夠從輸入圖像可靠地提取和描述物體特 征。 ( 2 ) 基于表面不連續(xù)性的表達(dá)( d i s c o n t i n u i t y - b a s e dr e p r e s e n t a t i o n ) 法 用物體表面的不連續(xù)性來表達(dá)物體,如用物體的屋脊和階越邊緣來構(gòu)造邊緣 鏈接圖,其中,節(jié)點(diǎn)表示連接關(guān)系;邊表示連接到一起的邊緣;而c h e n 和s t o c k m a n 則綜合使用了表面和斷點(diǎn)的信息,來標(biāo)記邊緣,并定義了飛邊( w i n g ) 的概念,即 每條飛邊是一個面、邊緣、面的三元組;另外,c h e n 和s t o c k m a n 還使用二維輪 廓特征來描述3 d 任意形狀物體。由于基于表面不連續(xù)性的表達(dá)方法是利用物體 的邊緣信息,因此降低了存儲空間的需求,提高了高層處理的效率,但在大多數(shù) 情況下,這種表達(dá)是不完整的,因?yàn)樗鼇G失了某些表面信息特性。 ( 3 ) 擬合表面參數(shù)表達(dá)法 將物體表面用參數(shù)方程擬合。如u m a s u l h a u 分析了高階代數(shù)方程某些參數(shù)具 備的不變特性,并用它們來表達(dá)3 d 物體的表面片;李松濤提出了一種雙二次變 量正交多項(xiàng)式的曲面擬臺方法,該方法可根據(jù)擬合得到的代數(shù)方程參數(shù)來計(jì)算物 體表面特征;另外使用b 樣條表面也可擬合3 d 表面,但表面擬合與識別的范圍 約束和收斂性都是需要徹底研究的領(lǐng)域。 另外,超二次曲面特征最早由b a r r 引入計(jì)算機(jī)視覺領(lǐng)域,而從深度圖像獲取 超二次曲面表達(dá)也是通過對輸入數(shù)據(jù)進(jìn)行隱含方* l ( i m p l i c i te q u a t i o n ) 擬合得到的。 周林還提出了一種擴(kuò)展超二次喵面的表達(dá)方法,它比超二次曲面具有更強(qiáng)的描述 能力。 在這類方法中,物體遮擋再次成為難以解決的問題,因?yàn)橛晌矬w部分外觀生 成的代數(shù)多項(xiàng)式與由物體全部外觀生成的多項(xiàng)式可能不同,而且它首先需要進(jìn)行 區(qū)域分割,然后通過表面擬合才能得到代數(shù)方程的參數(shù),這樣得到的參數(shù)準(zhǔn)確性 將依賴于分割的結(jié)果。 哈爾濱工程人學(xué)碩士學(xué)位論文 ( 4 ) 基于定位的表達(dá)( o r i e n t a t i o n - b a s e dr e p r e s e n t a t i o n ) 法。 對物體表面上的任一點(diǎn),都可以在高斯球( 單位球) 上找到與之表面方向相同 的一點(diǎn),這樣就可以得到物體表面上的點(diǎn)到高斯球的映射。如果該物體表面是一 凸性物體的表面,則上述映射是一一映射的,但高斯球表示的缺點(diǎn)是存在二義性, 它不能保存物體的變換和尺寸信息。一些改進(jìn)方法是將物體的表面法矢量根據(jù)支 撐函數(shù)映射到單位球上,例如廣義高斯圖像( g e 玎懿d i z e dg 孤塔s i a n h a g e ,g g i ) 由于 存儲了單位球上直接相鄰點(diǎn)之間的連接信息,因此確保了對所有物體表達(dá)的唯一 性;又如g h o s 和k u m a r 對支撐函數(shù)進(jìn)行了討論,并證明了一些看似差異很大的 表達(dá)方法,其本質(zhì)上都是相同類型的支撐函數(shù)表達(dá),同時(shí)也討論了表達(dá)非凸物體 的支撐函數(shù)。 基于定位的表達(dá)方法主要描述物體的表面信息,雖然它是一種全局的表達(dá)方 法,但從識別的角度看,它們太煩瑣,且不能處理物體有被部分遮擋的情況,而 且,從由多個物體的場景圖像生成的高斯圖中分割出單獨(dú)屬于不同物體的區(qū)域, 也是非常困難的問題。 ( 5 ) 基于網(wǎng)格的表達(dá)法 網(wǎng)格表達(dá)法就是圖形學(xué)中使用的三維任意形態(tài)物體描述方法,它使用多邊形 來表示物體的形狀,常用的是四邊形和三角形格網(wǎng),由于其數(shù)據(jù)量大,因而存儲、 傳輸和運(yùn)算都比較困難,很難直接用在三維物體識別中,因此經(jīng)常要轉(zhuǎn)換為其它 表達(dá)。在這方面j o h n s o n 作了較有成效的研究,它將格網(wǎng)中某個基準(zhǔn)頂點(diǎn)與其它 頂點(diǎn)的幾何位置關(guān)系轉(zhuǎn)換成一個二維圖像,稱為s p i n - i m a g e , 它可用來描述物體的 三維特征,進(jìn)而實(shí)現(xiàn)識別和定位等工作。雖然引入了簡化算法,但使用s p i n i m a g e 的操作計(jì)算還是太復(fù)雜。 ( 6 ) 體素( v o x e l ) 法 體素表達(dá)主要用于描述物體的體特征,它類似于像素在平面中代表一小塊面 積,而體素在空間中則代表- d , 塊體積,它將物體描述成一個互不重疊的立方體 的集合,這些體素( 立方體) 分布在三維方形網(wǎng)格里緊密排列,并填充物體所占的 空間。素表達(dá)并不適用于3 d 物體識別,主要用于物體的表面重建和建模上。 門) 八叉樹( o a r e e ) 法 八叉樹( o a r e e ) 法以分層的方式來描述物體,它是一種每個節(jié)點(diǎn)有8 個分支 ( o c t a n t ) 的樹型結(jié)構(gòu),且它的根節(jié)點(diǎn)是一個能夠完全包住物體的立方體,分層描述 1 1 哈爾濱工程大學(xué)碩士學(xué)位論文 時(shí)它將物體所占的空間逐層迭代地劃分為8 個分量,迭代的停止條件是每個最終 的子立方體在某種特征上是同質(zhì)的,如c h i e n 等提出了使用3 對相互垂直的深度 圖像來生成物體o l c l l e e 模型的方案閡;而l i 則提出了一種利用任意視角深度圖像 來構(gòu)造o c t r e e 的方法它能夠描述物體的凹面,雖然o e t r e e 表達(dá)能描述物體的全 局性的體特征,但它不是一種精確的表示法,其描述物體的近似程度取決于分割 的精度。 ( 8 ) 構(gòu)造實(shí)體幾何法( c o n s t r u c t i v es o l i dg e o m e t r y , c s g ) 法 構(gòu)造實(shí)體幾何法是用系統(tǒng)定義的簡單幾何形體,經(jīng)過并、交、差等布爾組合, 來構(gòu)造出所需要的復(fù)雜實(shí)體,而每個物體表示乘一棵樹,樹的葉節(jié)點(diǎn)是快、楔、 柱等簡單物體或它們的變形,其它節(jié)點(diǎn)是構(gòu)造物體的布爾操作。一般構(gòu)造實(shí)體幾 何法經(jīng)常用在構(gòu)造物體的模型上,特別是在c a d c a m 系統(tǒng)中,而用在物體識別 的時(shí)候則較少。這種表達(dá)方法的缺點(diǎn)是不能精確的表達(dá)物體,即表達(dá)不唯一,且 建造時(shí)所用的簡單剛體知識對識別系統(tǒng)來說,效果不好,因?yàn)樽R別系統(tǒng)種只有物 體表面是可視的,而物體的組成部件可能被遮擋。 ( 9 ) 體基元( g e o n ) 法 體基元表達(dá)可以作為物體的高層次表達(dá)方法。b i e d e r m a n 提出人腦一定程度 上可使用物體的組成部分來識別物體,而且可以用二維線條來描述物體組成部分 的形狀,因此他根據(jù)4 種二維屬性,定義了2 4 類體基元,以用來描述物體的組成 部分。n g u y e n 和l e v i n e 應(yīng)用了b i e d e r m a n 提出的體基元種類,并以物體的邊緣 連接圖作為系統(tǒng)輸入,然后將邊緣連接圖分解為子圖,每個子圖代表物體的一個 組成部分,并對應(yīng)于一個體基元,而體基元之間的連接關(guān)系由物體的凹邊緣和t 型連接確定。這種基本體基元的表達(dá)還可以使用超二次曲面和廣義柱的方法。體 基元表達(dá)方法的缺點(diǎn)是基元特性集合不一致,缺乏對這些集合存在的必要性、充 分性和正確性的論證。另外,從物體的單幅外觀表現(xiàn)來計(jì)算所有這些基元特性也 非常困難。 ( 1 0 ) 掃描( s w e e p i n g ) 法 掃描法表達(dá)是將形狀描述成一個2 d 函數(shù)在3 d 空間中的掃描,其掃描的方 式有平移和旋轉(zhuǎn)網(wǎng)兩種。這類方法中用得最廣的是廣義柱( g e n e r a l i z e dc y l i n d e r ) , 而最普通的廣義柱是一個圓沿著與圓平面垂直的軸平移所得到的柱體,而且如果 圓的半徑是軸位置的線性函數(shù),則平移的結(jié)果是廣義錐。為描述更多類型的形狀, 哈爾濱工程大學(xué)碩士學(xué)位論文 基于三維點(diǎn)的表達(dá)( 3 dp o i n t - b a s e dr e p r e s e n t a t i o n ) i 基于凸點(diǎn)的表j 盤( s a l i e n t - p o i n tb a s e dr e p r e s e n t a t i o n ) l 基于輪廓的表達(dá)( c o n t o u r - b a s e dr e p r e s e n t a t i o n ) i 基于表面的表達(dá)( s u f a c e - b a s e dr e p r e s e n t a t i o n ) l 基于體的表達(dá)( v o l u m e t r i c - b a s e dr e p r e s e n t a t i o n ) i 基于零件的表達(dá)( p a r t s - b a s e dr e p r e s e n t a t i o n ) 圖2 1三維物體表達(dá)方法分類 人們定義了多種廣義柱,例如,直線均勻廣義柱( s t r a i g h th o m o g e n e o u sg e n e r a l i z e d c y l i n d e r s ) * 1 曲面剛體旋轉(zhuǎn)( c u r v e ds o l i dr e v o l u t i o n ) 。廣義柱的缺點(diǎn)是表達(dá)可能不唯 一,因?yàn)闉榱吮磉_(dá)數(shù)局,其起始的橫界面可能以不同方式定義,因而致使相同的 數(shù)據(jù)點(diǎn)有不同的表達(dá)方法。 ( 1 1 ) 以觀察者為中心的表達(dá)法 以物體為中心的表達(dá)方法,其目的都是在以一種本質(zhì)的方式來表達(dá)物體的全 部形狀;而以觀察者為中心的表達(dá)方法則是將物體表達(dá)成一個2 d 外觀的集合, 而不是單一的模型。其中外觀圖方法f i ka s p e c tg r a p h ) 就是將三維物體的所有二維 外觀,分別組成有一定意義的外觀聚類集合。它是將物體的視點(diǎn)空間,分割成一 些具有相同外觀表現(xiàn)( a p p e a r a n c e ) 的區(qū)域,稱為a s p e c t ,并由發(fā)生在兩類相鄰觀察 ( v i e w ) 之間的視覺事件( v i s u a le v e n t ) 分開,當(dāng)物體的輪廓拓?fù)浒l(fā)生變化時(shí),就產(chǎn) 生一個視覺事件。基于外觀的表達(dá)是采取了一個連接圖的方式,其圖中每個節(jié)點(diǎn) 對應(yīng)一個外觀,每條邊即對應(yīng)視覺事件。 哈爾濱工程大學(xué)碩士學(xué)位論文 大多數(shù)以觀察者為中心的表達(dá),其主要缺點(diǎn)是描述物體不簡潔,因而如果物 體由幾個參數(shù)方程描述,則以觀察者為中心的表達(dá)就明顯不合適,但是,在描述 那些形狀不能由簡單分析方式或一套方程來獲得的復(fù)雜物體時(shí),這種方法就扮演 了一個重要的角色。 表2 1 是對以上這些方法的總結(jié)。 2 4 匹配方法 從輸入圖像中得到物體表達(dá)后,就需要對場景中存在的物體進(jìn)行匹配和定 位,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年生態(tài)修復(fù)工程中生態(tài)系統(tǒng)服務(wù)功能評估與生態(tài)系統(tǒng)服務(wù)評估技術(shù)國際合作項(xiàng)目進(jìn)展
- 2025年分布式能源交易市場與能源互聯(lián)網(wǎng)協(xié)同發(fā)展研究報(bào)告
- 城市地下綜合管廊建設(shè)項(xiàng)目2025年專項(xiàng)債券資金申請與智能化管理報(bào)告
- 城市供水廠自動化系統(tǒng)2025年智能化改造項(xiàng)目實(shí)施效果與社會責(zé)任評估報(bào)告
- 展覽會現(xiàn)場網(wǎng)絡(luò)通信及Wi-Fi接入補(bǔ)充協(xié)議
- 智能門鎖系統(tǒng)云存儲與數(shù)據(jù)同步服務(wù)合同
- 智能客服系統(tǒng)定制開發(fā)與全場景智能語音交互服務(wù)協(xié)議
- 離婚房產(chǎn)居住權(quán)保留與子女撫養(yǎng)權(quán)及共同財(cái)產(chǎn)分割及債務(wù)清償及支付及分擔(dān)及協(xié)議
- 海外留學(xué)考試自習(xí)室租賃及考試輔導(dǎo)培訓(xùn)協(xié)議
- 部編人教版小學(xué)語文教學(xué)改革計(jì)劃
- 2025年北京市朝陽區(qū)高三二模-政治+答案
- 溫州市普通高中2025屆高三第三次適應(yīng)性考試物理試題及答案
- 《光纖激光切割技術(shù)》課件
- 10.信息光子技術(shù)發(fā)展與應(yīng)用研究報(bào)告(2024年)
- 2025年下半年商務(wù)部外貿(mào)發(fā)展事務(wù)局第二次招聘8人易考易錯模擬試題(共500題)試卷后附參考答案
- 《行政法與行政訴訟法》課件各章節(jié)內(nèi)容-第一章 行政法概述
- 浙江2025年浙江省地質(zhì)院本級及所屬部分事業(yè)單位招聘筆試歷年參考題庫附帶答案詳解
- 2025年廣東廣州中物儲國際貨運(yùn)代理有限公司招聘筆試參考題庫含答案解析
- 海外安保面試題及答案
- 危重患者的早期康復(fù)
- 鄉(xiāng)村振興戰(zhàn)略相關(guān)試題及答案
評論
0/150
提交評論