物體識別過程_第1頁
物體識別過程_第2頁
物體識別過程_第3頁
物體識別過程_第4頁
物體識別過程_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在計算機視覺領(lǐng)域,一個典型的物體識別系統(tǒng)往包含以下幾個階段: 預(yù)處理, 特征提取,特征選擇,建模,匹配,定位。123預(yù)處理預(yù)處理幾乎是所有計算機視覺算法的第一步,其動機是盡可能在不改變圖像 承載的本質(zhì)信息的前提下,使得每張圖像的表觀特性(如顏色分布,整體明暗, 尺寸大小等)盡可能的一致,以便于之后的處理過程。預(yù)處理有生物學(xué)的對應(yīng)。 瞳孔,虹膜和視網(wǎng)膜上的一些細(xì)胞的行為類似于某些預(yù)處理步驟,如自適應(yīng)調(diào)節(jié)入射光的動態(tài)區(qū)域等等。預(yù)處理和特征提取之間的界線不完全分明。 有時兩者交 叉在一起。它主要完成模式的采集、模數(shù)轉(zhuǎn)換、濾波、消除模糊、減少噪聲、糾 正幾何失真等預(yù)處理操作。因此也要求相應(yīng)的設(shè)備來實現(xiàn)

2、。預(yù)處理經(jīng)常與具體的采樣設(shè)備和所處理的問題有關(guān)。 例如,從圖象中將汽車 車牌的號碼識別出來,就需要先將車牌從圖像中找出來, 再對車牌進(jìn)行劃分,將 每個數(shù)字分別劃分開。做到這一步以后,才能對每個數(shù)字進(jìn)行識別。以上工作都 應(yīng)該在預(yù)處理階段完成。從理論上說,像預(yù)處理這種先驗式的操作是不應(yīng)該有的。 因為它并不為任何 目的服務(wù),所以完全可以隨意為之而沒有“應(yīng)該怎么做”的標(biāo)準(zhǔn),大部分情況下 預(yù)處理是看著實驗結(jié)果說話。這是因為計算機視覺目前沒有一個整體的理論框 架,無法從全局的高度來指導(dǎo)每一個步驟應(yīng)該如何進(jìn)行。在物體識別中所用到的典型的預(yù)處理方法不外乎直方圖均衡及濾波幾種。 像高斯模糊可以用來使得之后 的梯

3、度計算更為準(zhǔn)確;而直方圖均衡可以克服一定程度的光照影響。值得注意的是,有些特征本身已經(jīng)帶有預(yù)處理的屬性,因此不需要再進(jìn)行預(yù)處理操作。預(yù)處理通常包括五種基本運算:(1) 編碼:實現(xiàn)模式的有效描述,適合計算機運算。(2) 閥值或者濾波運算:按需要選出某些函數(shù),抑制另一些。(3) 模式改善:排除或修正模式中的錯誤,或不必要的函數(shù)值。(4) 正規(guī)化:使某些參數(shù)值適應(yīng)標(biāo)準(zhǔn)值,或標(biāo)準(zhǔn)值域。(5) 離散模式運算:離散模式處理中的特殊運算。2.4特征提取特征提取的目的是從模式樣本中提取能代表該模式特有的性質(zhì)。 這是模式分 類中最關(guān)鍵的一步,但又是最難以控制的一步。其準(zhǔn)則是提取盡量少的特征,而 能使分類的誤差最

4、小。但隨之而來就有了矛盾,特征提取在分類之前完成,事先 并不知道哪些特征能使分類誤差最小,目前還無法解決這個矛盾。特征提取負(fù)責(zé) 從圖像中得到重要的信息以交給下一層使用,而忽略不太重要的信息。特征提取 的設(shè)計關(guān)鍵點在于在“哪里提取特征”及“提取什么特征”。對于“在哪里提取特征”這個問題,有兩種答案。某些系統(tǒng)僅在那些“應(yīng)該 提取”的地方提取特征,以保證得到的特征都是有效的,同時處理時間不會太長。 為此就必須設(shè)計“興趣點檢測器”以在真正提取特征之前找到那些位置。此類檢 測器的設(shè)計思路是希一望這些點在仿射變換下保持不變,這樣就能獲得對于扭曲及光線變化的魯棒性。另一些系統(tǒng)則采用密集采樣方式,對于圖像上的

5、每一個點 都進(jìn)行特征提取。前一種方式具有效率高的特點,然而如何選取興趣點檢測器本 身就是一個相當(dāng)艱難的任務(wù),并且會給系統(tǒng)引入不適當(dāng)?shù)南闰灒沟米罱K結(jié)果隨 著被測物體類別的不同會有偏離,與物體識別的精神不相符合;后一種方式速度 是其較大的問題。對于“提取什么特征”這個問題,答案則要豐富許多。對于局部特征,已開 發(fā)的系統(tǒng)中已存在很多可用的。局部特征也可以分為形狀(Shape)及材質(zhì)(Texture )兩類。這兩類特征編碼本質(zhì)上不同的信息,有不同的能力。形狀特征, 如線段,曲率,其具有的一大特性是對于光照及形變的不變性,然而同時也有提取時間長及對遮擋敏感的缺點,某些方法由于數(shù)學(xué)上的限制,無法用于自相

6、交或 者非閉合曲線等等在自然圖像中司空見慣的情況。另一方面,一些材質(zhì)特征,如圖像小塊,小波系數(shù)等等,提取時間相對較短,并且對于遮擋的抵抗強些,但是 缺乏各方面的不變性;還有一些材質(zhì)特征如直方圖,則具有相當(dāng)強的變換不變性, 但代價是丟失了空間信息。近年來,子空間方法,如主成分分析(PCA),辨別成分分析(LDA),也成為 一種相對重要的特征提取手段。這種方法將圖像拉長成為高維空間的向量, 并進(jìn) 行奇異值分解以得到特征方向。人臉識別便是其較為成功的應(yīng)用范例。 此類方法 能處理有全局噪聲的情況,并且模型相當(dāng)簡單易實現(xiàn);然而這種算法割裂了圖像 的內(nèi)部結(jié)構(gòu),因此在本質(zhì)上是非視覺的,模型的內(nèi)在機制較難令人

7、理解,也沒有 任何機制能消去施加于圖像上的仿射變換。2.2圖像特征提取方法圖像特征提取就是提取出一幅圖像中不同于其他圖像的根本屬性,以區(qū)別不同的圖像。如灰度、亮度、紋理和形狀等等特征都是與圖像的視覺外觀相對應(yīng)的; 而還有一些則缺少自然的對應(yīng)性,如顏色直方圖、灰度直方圖和空間頻譜圖等。基于圖像特征進(jìn)行物體識別實際上是根據(jù)提取到圖像的特征來判斷圖像中 物體屬于什么類別。形狀、紋理和顏色等特征是最常用的視覺特征, 也是現(xiàn)階段 基于圖像的物體識別技術(shù)中采用的主要特征。下面分別介紹一下圖像的形狀、紋 理和顏色特征的提取方法。2.2.1圖像形狀特征提取形狀特征是反映出圖像中物體最直接的視覺特征,大部分物體

8、可以通過分辨 其形狀來進(jìn)行判別。所以,在物體識別中,形狀特征的正確提取顯得非常重要。常用的圖像形狀特征提取方法有兩種:基于輪廓的方法和基于區(qū)域的方法。 這兩種方法的不同之處在于:對于基于輪廓的方法來說,圖像的輪廓特征主要針 對物體的外邊界,描述形狀的輪廓特征的方法主要有: 樣條、鏈碼和多邊形逼近 等;而在基于區(qū)域的方法中,圖像的區(qū)域特征則關(guān)系到整個形狀區(qū)域,描述形狀的區(qū)域特征的主要方法有:區(qū)域的面積、凹凸面積、形狀的主軸方向、縱橫比、 形狀的不變矩等。這些關(guān)于形狀的特征目前已得到了廣泛的應(yīng)用。典型的形狀特 征描述方法有:邊界特征法,傅里葉形狀描述符法,幾何參數(shù)法,形狀不變矩法。222圖像紋理特

9、征提取圖像的紋理是與物體表面結(jié)構(gòu)和材質(zhì)有關(guān)的圖像的內(nèi)在特征,反映出來的是圖像的全局特征。圖像的紋理可以描述為:一個鄰域內(nèi)像素的灰度級發(fā)生變化的 空間分布規(guī)律,包括表面組織結(jié)構(gòu)、與周圍環(huán)境關(guān)系等許多重要的圖像信息。典 型的圖像紋理特征提取方法有:統(tǒng)計方法,幾何法,模型法,信號處理法。典型 的統(tǒng)計方法是灰度共生矩陣紋理特征分析方法,幾何法是建立在基本的紋理元素 理論基礎(chǔ)上的一種紋理特征分析方法,模型法是將圖像的構(gòu)造模型的參數(shù)作為紋 理特征,而信號處理法主要是小波變換為主。2.2.3圖像顏色特征提取圖像的顏色特征描述了圖像或圖像區(qū)域的物體的表面性質(zhì), 反映出的是圖像 的全局特征。一般來說,圖像的顏色

10、特征是基于像素點的特征, 只要是屬于圖像 或圖像區(qū)域內(nèi)的像素點都將會有貢獻(xiàn)。 典型的圖像顏色特征提取方法有:顏色直 方圖,顏色集,顏色矩。顏色直方圖是最常用的表達(dá)顏色特征的方法,它的優(yōu)點是能簡單描述圖像中 不同色彩在整幅圖像中所占的比例,特別適用于描述一些不需要考慮物體空間位 置的圖像和難以自動分割的圖像。而顏色直方圖的缺點是它無法描述圖像中的某 一具體的物體,無法區(qū)分局部顏色信息。顏色集可以看成是顏色直方圖的一種近似表達(dá)。 具體方法是:首先將圖像從 RGB顏色空間轉(zhuǎn)換到視覺均衡的顏色空間;然后將視覺均衡的顏色空間量化;最 后,采用色彩分割技術(shù)自動地將圖像分為幾個區(qū)域, 用量化的顏色空間中的某

11、個 顏色分量來表示每個區(qū)域的索引,這樣就可以用一個二進(jìn)制的顏色索引集來表示一幅圖像顏色矩方法是基于圖像中任何的顏色分布都可以用相應(yīng)的矩來表示這個數(shù) 學(xué)基礎(chǔ)上的。由于顏色分布信息主要集中在低階矩中,因此,表達(dá)圖像的顏色分 布僅需要采用顏色的一階矩、二階矩和三階矩。125特征選擇再好的機器學(xué)習(xí)算法,沒有良好的特征都是不行的 ;然而有了特征之后,機 器學(xué)習(xí)算法便開始發(fā)揮自己的優(yōu)勢。 在提取了所要的特征之后,接下來的一個可 選步驟是特征選擇。特別是在特征種類很多或者物體類別很多, 需要找到各自的 最適應(yīng)特征的場合。嚴(yán)格地來說,任何能夠在被選出特征集上工作正常的模型都 能在原特征集上工作正常,反過來進(jìn)行

12、了特征選擇則可能會丟掉一些有用的特 征;不過由十計算上的巨大開銷,在把特征放進(jìn)模型里訓(xùn)練之前進(jìn)行特征選擇仍 然是相當(dāng)明智的。126建模一般物體識別系統(tǒng)賴以成功的關(guān)鍵基礎(chǔ)在于,屬于同一類的物體總是有一些 地方是相同的。而給定特征集合,提取相同點,分辨不同點就成了模型要解決的 問題。因此可以說模型是整個識別系統(tǒng)的成敗之所在。 對于物體識別這個特定課 題,模型主要建模的對象是特征與特征之間的空間結(jié)構(gòu)關(guān)系;主要的選擇準(zhǔn)則, 一是模型的假設(shè)是否適用于當(dāng)前問題;二是模型所需的計算復(fù)雜度是否能夠承 受,或者是否有盡可能高效精確或者近似的算法。2.7匹配在得到訓(xùn)練結(jié)果之后(在描述、生成或者區(qū)分模型中常表現(xiàn)為一

13、簇參數(shù)的取 值,在其它模型中表現(xiàn)為一組特征的獲得與存儲),接下來的任務(wù)是運用目前的 模型去識別新的圖像屬于哪一類物體, 并且有可能的話,給出邊界,將物體與圖 像的其它部分分割開。一般當(dāng)模型取定后,匹配算法也就自然而然地出現(xiàn)。 在描 述模型中,通常是對每類物體建模,然后使用極大似然或是貝葉斯推理得到類別 信息;生成模型大致與此相同,只是通常要先估出隱變量的值, 或者將隱變量積 分,這一步往往導(dǎo)致極大的計算負(fù)荷; 區(qū)分模型則更為簡單,將特征取值代入分 類器即得結(jié)果。128定位在成功地識別出物體之后,對物體進(jìn)行定位成為進(jìn)一步的工作。一些模型, 如描述生成模型,或是基于部分的模型天生具有定位的能力,因

14、為它們所要處理 的對象就是特征的空間分布,而特征包方法相對較難定位,即使是能定位,準(zhǔn)確 程度也不如前者。不過近年來經(jīng)過改進(jìn)的特征包方法也可以做相當(dāng)精確的定位。 一部分是因為圖像預(yù)分割及生成模型的引入, 另一部分則歸功于一些能夠?qū)μ卣?包得到的特征進(jìn)行重構(gòu)的方法。126分類器分類器是模式識別中研究最成熟的部分。按特征類型分為數(shù)值型分類器和符 號型兩大類。數(shù)值型分類器包括統(tǒng)計分類器(統(tǒng)計理論為基礎(chǔ))、模糊分類器(模 糊集理論為基礎(chǔ))、人工神經(jīng)元網(wǎng)絡(luò)(模擬生物神經(jīng)系統(tǒng)的電子系統(tǒng),也可以用 軟件在計算機上實現(xiàn))、人工智能分類器(基于邏輯推理或?qū)<蚁到y(tǒng)結(jié)構(gòu))。符號 型分類器包括句法分類器(基于句法分析和

15、自動機理論)、人工智能分類器(基 于邏輯推理或?qū)<蚁到y(tǒng)結(jié)構(gòu))。其中符號型分類器具有更大的靈活性,所以能處理較為復(fù)雜的模式分類問 題。但是目前對符號型分類器的研究遠(yuǎn)沒有數(shù)值型分類器成熟。所有模式識別系統(tǒng)都需要經(jīng)過訓(xùn)練、驗證、改進(jìn),并反復(fù)多次,以完成最終 設(shè)計。127訓(xùn)練訓(xùn)練時分類器參數(shù)必需確定。為達(dá)到客觀、公正目的,樣本的制備是關(guān)鍵。 至少要滿足下列條件:具有充分的代表性和完備性;獨立于系統(tǒng)設(shè)計,測試樣本 要與訓(xùn)練樣本相互獨立;標(biāo)準(zhǔn)化的設(shè)計,標(biāo)準(zhǔn)化的使用規(guī)范;權(quán)威性。常見困難 是消耗大量時間、金錢和人力。在圖像模式識別的處理過程中,一般主要分為預(yù)處理,特征或基元提取,分 類訓(xùn)練,分類這幾個步驟。

16、(1)預(yù)處理它主要完成模式的采集、模數(shù)轉(zhuǎn)換、濾波、消除模糊、減少噪聲、糾正幾何 失真等預(yù)處理操作。因此也要求相應(yīng)的設(shè)備來實現(xiàn)(2)特征或基元提取特征提取實現(xiàn)由模式空間向特征空間的轉(zhuǎn)換,有效地壓縮維數(shù)。一般地說,它該是在一定分類準(zhǔn)則下的最佳或次最佳變換器。模式識別中,分類器的分類規(guī)則固然重要,但是,如果所基于的模式特征沒 有包含足夠的待識客體的信息或未能提取反映客體特征的信息,那么,識別的結(jié)果將面目全非。所以說,在設(shè)計分類器之前,能夠快速、有效地進(jìn)行特征提取是 模式識別的關(guān)鍵。不幸的是,直到目前為止還沒有形成特征提取的一般理論,隨著識別任務(wù)的不同,特征提取的方法也不一樣。此外,如果待識別的模式樣本本 身攜帶反映不同模式本質(zhì)特性的特征,則特征提取也不一定需要。(3)分類訓(xùn)練為了能使分類器有效地進(jìn)行分類判決,還必須對分類器進(jìn)行訓(xùn)練(學(xué)習(xí))。分類器的訓(xùn)練學(xué)習(xí)是模式識別的一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論