模式識(shí)別及其在數(shù)字圖像處理中的應(yīng)用_第1頁
模式識(shí)別及其在數(shù)字圖像處理中的應(yīng)用_第2頁
模式識(shí)別及其在數(shù)字圖像處理中的應(yīng)用_第3頁
模式識(shí)別及其在數(shù)字圖像處理中的應(yīng)用_第4頁
模式識(shí)別及其在數(shù)字圖像處理中的應(yīng)用_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

模式識(shí)別及其在數(shù)字圖像處理中的應(yīng)用摘要:模式識(shí)別是人工智能領(lǐng)域的基礎(chǔ),隨著計(jì)算機(jī)和人工智能技術(shù)的發(fā)展,模式識(shí)別在圖像處理中的應(yīng)用日益廣泛。近年來,模式識(shí)別也去的了很多讓人矚目的成就,有很多不可忽視的進(jìn)展。數(shù)字圖像處理又稱為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過程。圖像是人類獲取和交換信息的主要來源,圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方面面。隨著人類活動(dòng)范圍的不斷擴(kuò)大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。基于模式識(shí)別的圖像處理隨著當(dāng)今計(jì)算機(jī)和人工智能技術(shù)的發(fā)展,已經(jīng)成為了圖像識(shí)別領(lǐng)域的蹤影研究方向。本文首先介紹了圖像模式識(shí)別的基本理論和基本方法,然后闡述了模式識(shí)別在圖像處理中應(yīng)用理論,最后舉例說明了模式識(shí)別在圖像處理中的具體應(yīng)用。關(guān)鍵字:模式識(shí)別;人工智能;圖像處理;特征提取;識(shí)別方法1模式識(shí)別技術(shù)的基本理論1.1模式識(shí)別的基本框架模式識(shí)別是通過計(jì)算機(jī)對(duì)信息進(jìn)行處理、判別的一種分類過程,是信號(hào)處理與人工智能的一個(gè)重要分支。人工智能是專門研究用機(jī)器人模仿人的動(dòng)作、感覺和思維過程與規(guī)律的一門學(xué)科,而模式識(shí)別就是通過計(jì)算機(jī)用數(shù)學(xué)技術(shù)方法來研究模式的自動(dòng)處理和判讀。我們把環(huán)境與客體統(tǒng)稱為“模式”。隨著計(jì)算機(jī)技術(shù)和人工智能的發(fā)展,人類有可能研究復(fù)雜的信息處理過程。信息處理過程的一個(gè)重要形式是生命體對(duì)環(huán)境及客體的識(shí)別。對(duì)人類來說,特別重要的是對(duì)光學(xué)信息(通過視覺器官來獲得)和聲學(xué)信息(通過聽覺器官來獲得)的識(shí)別。這是模式識(shí)別的兩個(gè)重要方面。在圖像處理中,識(shí)別場(chǎng)景中的對(duì)象或區(qū)域是一個(gè)重要課題。圖像模式識(shí)別的任務(wù)是從策略對(duì)象集的場(chǎng)景中識(shí)別對(duì)象。每個(gè)對(duì)象都是一種模式,并且策略值是模式的特征,同特征的相似對(duì)象集屬于具體的模式類,測(cè)量特征的技術(shù)稱為特征提取。模式識(shí)別的基本框架如圖1所示:圖1模式識(shí)別的基本框架1.2模式識(shí)別的方法1.2.1決策理論法在模式識(shí)別中,已經(jīng)使用了一些模式分類技術(shù)。這些技術(shù)中的一些技術(shù)被稱為決策理論技術(shù),在這種技術(shù)中,未知的模式分類是由一些確定的、統(tǒng)計(jì)的或者模糊理論的基本原理進(jìn)行決策。決策理論的模塊圖如圖2所示:圖2決策理論模式分類器模塊圖決策理論模式識(shí)別技術(shù)主要分為基于有監(jiān)督學(xué)習(xí)的分類方法和使用無監(jiān)督技術(shù)的分類方法。有監(jiān)督的分類方法又可分為有參數(shù)分類器和非參數(shù)分類器。在有參數(shù)監(jiān)督的分類中,用大量標(biāo)注訓(xùn)練樣本模式集訓(xùn)練分類器,并估計(jì)每類模式的統(tǒng)計(jì)參數(shù)。其中,最小距離分類器和最大似然分類器是頻繁使用的有監(jiān)督算法。無監(jiān)督分類技術(shù)不考慮參數(shù),常使用一些非參數(shù)的技術(shù),例如K近鄰技術(shù)、Parzen窗技術(shù)等。在無監(jiān)督的情況下,根據(jù)一些相似標(biāo)準(zhǔn)機(jī)器分割整個(gè)數(shù)據(jù)集,結(jié)構(gòu)產(chǎn)生了聚類集,模式中的每個(gè)聚類集都屬于具體類。1.2.2句法方法在句法模式識(shí)別中,關(guān)鍵問題是使用屬于不同模式類的樣本集推斷適當(dāng)?shù)奈姆?。文法推斷問題是一個(gè)首要問題。這種方法是基于基本假設(shè),每個(gè)模式至少存在一個(gè)文法描述。每個(gè)模式類文法描述的識(shí)別和提取形成了設(shè)計(jì)綜合模式分類器的核心問題。文法推斷問題包括使用在研究中的樣本模式集獲得文法的算法開發(fā)。因此這可以視為使用有限的并且增長的訓(xùn)練模式集進(jìn)行學(xué)習(xí)的方法。在文法模式分類中,屬于特殊模式類的字符串可以作為形成屬于語言的句子,這些句子對(duì)應(yīng)于模式類。如果每個(gè)字符串都屬于該模式類,機(jī)器就可以識(shí)別這個(gè)模式類,對(duì)于不在該模式類中的任何字符串,機(jī)器決策它是否是語言的成員,要么拒絕,要么永久接受。對(duì)于自動(dòng)機(jī)的自動(dòng)化造句而言,接受字符串屬于特殊模式類,已經(jīng)有了一些成熟的技術(shù)。1.2.3人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)已經(jīng)廣泛使用于圖像分割和對(duì)象分類問題。這些網(wǎng)絡(luò)本質(zhì)上是學(xué)習(xí)網(wǎng)絡(luò),用于場(chǎng)景中像素或?qū)ο蟮姆诸悺K鼈兪谴罅炕ヂ?lián)的神經(jīng)元集,并行地執(zhí)行學(xué)習(xí)任務(wù)。神經(jīng)元由生物神經(jīng)元建模,因此它們被命名為神經(jīng)網(wǎng)絡(luò)。根據(jù)學(xué)習(xí)過程的類型,這些網(wǎng)絡(luò)可以分為有監(jiān)督或無監(jiān)督網(wǎng)絡(luò)。1.2.4小結(jié)人臉的側(cè)視圖選擇的標(biāo)志點(diǎn)是:鼻子點(diǎn)、頜下點(diǎn)、前額點(diǎn)、鼻梁點(diǎn)、眉間點(diǎn)和嘴角點(diǎn)。將側(cè)面臉的數(shù)字圖像變化為側(cè)面外形輪廓,然后提取標(biāo)志點(diǎn)。側(cè)面面孔圖像是一幅二進(jìn)制圖像,從每個(gè)側(cè)面輪廓獲得的標(biāo)志點(diǎn)提取7個(gè)距離測(cè)量和一個(gè)區(qū)域測(cè)量。3.4.2距離和區(qū)域測(cè)量計(jì)算距離測(cè)量的提取標(biāo)志點(diǎn)如圖4所示,正視圖和側(cè)視圖的特征集合形成組合特征向量,這些特征向量陣列表示面部圖片,所以我們希望對(duì)于不同的臉部,這些向量陣列是不同的。我們將這些特征陣列存儲(chǔ)在文件中,并且具有主索引號(hào)。為了消除尺度作用,將鼻子點(diǎn)和鼻梁點(diǎn)間的距離,側(cè)視圖的距離測(cè)量和面積測(cè)量值,兩眼間的距離和正面臉的測(cè)量值進(jìn)行歸一化處理。圖4側(cè)面面部點(diǎn)3.5人臉識(shí)別從人臉的正視圖和側(cè)視圖提取最佳特征集,并且將這些特征值存儲(chǔ)在獨(dú)立的文件中,主要臉數(shù)據(jù)文件中的向量稱為M向量,對(duì)于未知的樣本,測(cè)試數(shù)據(jù)文件包含15維特征向量。為了減少匹配特征向量值計(jì)算的復(fù)雜性,將這些特征向量與它們的主索引一起升序存儲(chǔ)。將測(cè)試特征值插到每個(gè)特征向量(列)的排序特征列表的適當(dāng)位置。測(cè)試樣本模式的兩個(gè)最近鄰居在每列中進(jìn)行識(shí)別,并且評(píng)估它們的相似性。下面就K-近鄰算法給出人臉識(shí)別的步驟:步驟1在每一列,將特征值與它們的主索引一起升序排列。步驟2在每列的適當(dāng)位置插入測(cè)試樣本的每個(gè)特征向量。步驟3在每列中去掉兩個(gè)最近鄰居,并對(duì)兩個(gè)最近的鄰居計(jì)算測(cè)試模式的相似性,每個(gè)都有主索引。步驟4對(duì)所有主索引計(jì)算測(cè)試模式的所有相似性。步驟5給測(cè)試人臉分配具有最大相似性值的主索引。如果在測(cè)試文件中的人臉不屬于任何存儲(chǔ)在主要數(shù)據(jù)文件的人臉,對(duì)于這個(gè)測(cè)試臉,將給出與其最相似的分類索引。4結(jié)語隨著計(jì)算機(jī)和人工智能技術(shù)的發(fā)展,人們對(duì)模式識(shí)別技術(shù)在圖像處理中的應(yīng)用越來越重視。同時(shí),模式識(shí)別涉及并利用到數(shù)學(xué)、計(jì)算機(jī)科學(xué)等多學(xué)科的理論知識(shí),而將這些學(xué)科的新技術(shù)和成就綜合運(yùn)用到模式識(shí)別中,提出更符合需求的模式識(shí)別技術(shù)是今后值得研究的重要課題。5參考文獻(xiàn)[1]邊肇祺,張學(xué)工,等.模式識(shí)別(第二版)[M].北京:清華大學(xué)出版社2000-01.[2]沈清,湯森.模式識(shí)別導(dǎo)論[M].長沙:國防科技大學(xué)出版社,1991.[3]KarayiannisNB,PaiPI.Afuzzyvectorquantizationalgorithmsandtheirapplicationinimagecompression[J].IEEETransactiononImageProcessing,1995,4(9):1193-1201.[4]ChenLi,YapKim-Hui.AfuzzyK-nearest-neighbouralgorithmtoblindimagedeconvolution[A].IEEEInternationalConferenceonSystems,Ma

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論