版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 目錄摘要3Abstract4第1章緒論51.1自動(dòng)識別課題背景51.2 機(jī)器視覺51.2.1 機(jī)器視覺的發(fā)展概況51.2.2 機(jī)器視覺與圖像處理71.3 圖像處理與識別技術(shù)91.4 圖像處理與識別系統(tǒng)101.4.1 關(guān)于計(jì)算機(jī)圖像處理系統(tǒng)101.4.2 圖像處理與識別系統(tǒng)的構(gòu)成111.5 斑馬線自動(dòng)識別系統(tǒng)課題研究容12第2章圖像處理與識別與圖像理解142.1 二值圖像分析142.1.1 閾值運(yùn)算152.2 圖像區(qū)域分析172.2.1區(qū)域與邊緣172.3 圖像處理與識別與圖像理解所研究的容192.3.1 圖像處理技術(shù)192.3.2 圖像識別技術(shù)202.3.3 圖像理解212.4 圖像處理與識
2、別與圖像理解的關(guān)系242.4.1 圖像處理242.4.2 圖像理解252.5 圖像處理工具M(jìn)ATLAB26第三章斑馬線自動(dòng)識別系統(tǒng)主要算法283.1 邊緣檢測283.2 坎尼(Canny)算子293.3 模板匹配算法32第4章基于matlab的斑馬線自動(dòng)識別系統(tǒng)354.1 系統(tǒng)結(jié)構(gòu)流圖354.2 系統(tǒng)功能模塊分析與實(shí)現(xiàn)364.2.1 圖像分割模塊364.2.2 模板讀取模塊404.2.3 圖像識別模塊404.3 GUI界面設(shè)計(jì)與系統(tǒng)測試42結(jié)論45致47參考文獻(xiàn)48摘要機(jī)器視覺也稱圖像分析與理解。機(jī)器視覺的發(fā)展推動(dòng)智能系統(tǒng)的發(fā)展,也拓寬計(jì)算機(jī)與各種智能機(jī)器的研究圍和應(yīng)用領(lǐng)域。圖像處理與識別技術(shù)
3、是機(jī)器視覺的一個(gè)重要組成部分。圖像處理與識別技術(shù)的發(fā)展經(jīng)歷了初創(chuàng)期,發(fā)展期,普與期,和實(shí)用期4個(gè)階段。20世紀(jì)90年代是圖像技術(shù)的實(shí)用化時(shí)期,特點(diǎn)就是圖像處理的信息量巨大,對處理速度的要求極高。人行道路的斑馬線自動(dòng)識別系統(tǒng)的課題設(shè)計(jì),以一幅交通道路識別為例,具體介紹了斑馬線自動(dòng)識別的原理。整個(gè)處理過程分為圖像預(yù)處理、圖像邊緣提取、圖像定位、圖像分割、圖像識別五大模塊,用MATLAB軟件編程來實(shí)現(xiàn)每一個(gè)部分,最后識別出人行道路圖像。在研究的同時(shí)對其中出現(xiàn)的問題進(jìn)行了具體分析。關(guān)鍵詞:機(jī)器視覺 圖像處理 自動(dòng)識別 預(yù)處理 邊緣提取 圖像定位 圖像分割 圖像識別AbstractMachine vis
4、ion is alsoImage analysis and understanding.The development of machine vision promote the progress of Intelligent system ,and also widen the research and applicationfield of computer and every intelligent machine.Technology of image processing and recognition is the important component of machine vi
5、sion. The progress of image processing and recognition have four phases that is initial period development period universalperiod and practical period.The practical period of image technology is 1990s 20th century.Thefeatures is that the information of image processing too big,and so that,its proces
6、sing speed must be fast.The course of traffic signautomatism recognition system,with one traffic sign recognition, the principle of the traffic sign recognition is introducedconcretely .This process was divided into imagepre-process, imageedge extraction,image location, image division and imagerecog
7、nition, which is implemented separated by using MATLAB. The traffic sign image is recognized at last. At the same time, the problems are also analyzed .And solved in the process. Keywords: Machine vision image processingautomatism recognitionpre-process edge extractionimage locationimage division im
8、agerecognition第1章 緒論1.1自動(dòng)識別課題背景人類在征服自然、改造自然和推動(dòng)社會(huì)進(jìn)步的過程中,面臨著自身能力、能量的局限性,因而發(fā)明和創(chuàng)造了許多機(jī)器來輔助或代替人類完成任務(wù)智能機(jī)器,包括智能機(jī)器人,是這種機(jī)器最理想的形式,也是人類科學(xué)研究中所面臨的最大挑戰(zhàn)之一智能機(jī)器是指這樣一種系統(tǒng),它能模擬人類的功能,能感知外部世界并有效地解決人所能解決問題人類感知外部世界主要是通過視覺、觸覺、聽覺和嗅覺等感覺器官,其中約80%的信息是由視覺獲取的因此,對于智能機(jī)器來說,賦予機(jī)器以人類視覺功能對發(fā)展智能機(jī)器是與其重要的,也由此形成了一門新的學(xué)科機(jī)器視覺(也稱機(jī)器視覺或圖像分析與理解等)機(jī)器視
9、覺的發(fā)展不僅將大大推動(dòng)智能系統(tǒng)的發(fā)展,也將拓寬計(jì)算機(jī)與各種智能機(jī)器的研究圍和應(yīng)用領(lǐng)域。1.2 機(jī)器視覺1.2.1 機(jī)器視覺的發(fā)展概況70年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開設(shè)“機(jī)器視覺”( Machine Vision)課程,由國際著名學(xué)者BKPHorn教授講授同時(shí),MIT AI 實(shí)驗(yàn)室吸引了國際上許多知名學(xué)者參與機(jī)器視覺的理論、算法、系統(tǒng)設(shè)計(jì)的研究,David Marr教授就是其中的一位他于1973年應(yīng)邀在MIT AI 實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,1977年提出了不同于積木世界分析方法的計(jì)算視覺理論(computational vision),該
10、理論在80年代成為機(jī)器視覺研究領(lǐng)域中的一個(gè)十分重要的理論框架可以說,對機(jī)器視覺的全球性研究熱潮是從 20世紀(jì)80年代開始的,到了80年代中期,機(jī)器視覺獲得了蓬勃發(fā)展,新概念、新方法、新理論不斷涌現(xiàn),比如,基于感知特征群的物體識別理論框架,主動(dòng)視覺理論框架,視覺集成理論框架等到目前為止,機(jī)器視覺仍然是一個(gè)非?;钴S的研究領(lǐng)域許多會(huì)議論文集都反應(yīng)了該領(lǐng)域的最新進(jìn)展,比如,International Conference on Computer Vision and Pattern Recognition(CVPR); International Conference on Computer Visi
11、on(ICCV); International Conference on Pattern Recognition(ICPR); International Conference on Robotics and Automation(ICRA); Workshop on Computer Vision,and numerous conferences of SPIE還有許多學(xué)術(shù)期刊也包含了這一領(lǐng)域的最新研究成果, 如,IEEE Transaction on Pattern Analysis and Machine Intelligence(PAMI);Computer Vision,Graph
12、ics,and Image Processing(CVGIP);IEEE Transaction on Image Processing; IEEE Transaction on Systems,Man,and Cybernetics(SMC); Machine Vision and Applications;International Journal on Computer Vision(IJCV); Image and Vision Computing;and Pattern Recognition每年還出版許多研究專集、學(xué)術(shù)著作、技術(shù)報(bào)告,舉行專題討論會(huì)等所有這些都是研究機(jī)器視覺與其應(yīng)用
13、的很好信息來源Marr的視覺計(jì)算理論Marr1982立足于計(jì)算機(jī)科學(xué),系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面業(yè)已取得的所有重要成果,是視覺研究中迄今為止最為完善的視覺理論Marr建立的視覺計(jì)算理論,使機(jī)器視覺研究有了一個(gè)比較明確的體系,并大大推動(dòng)了機(jī)器視覺研究的發(fā)展人們普遍認(rèn)為,機(jī)器視覺這門學(xué)科的形成與Marr的視覺理論有著密切的關(guān)系事實(shí)上,盡管20世紀(jì)70年代初期就有人使用機(jī)器視覺這個(gè)名詞Binford,1971,但正是Marr 70年代末建立的視覺理論促使機(jī)器視覺這一名詞的流行1.2.2 機(jī)器視覺與圖像處理機(jī)器視覺相關(guān)的學(xué)科有許多與機(jī)器視覺密切相關(guān)的領(lǐng)域與機(jī)器視覺與其它學(xué)科的關(guān)系如下圖像
14、處理是一個(gè)發(fā)展比較成熟的領(lǐng)域圖像處理技術(shù)通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復(fù)任務(wù)則留給人來完成圖像處理包括圖像增強(qiáng)、圖像壓縮和模糊校正與非聚焦圖像等課題機(jī)器視覺系統(tǒng)把圖像作為輸入,產(chǎn)生的輸出為另一種形式,比如圖像中物體輪廓的表示因此,機(jī)器視覺的重點(diǎn)是在人的最小干預(yù)下,由計(jì)算機(jī)自動(dòng)恢復(fù)場景信息圖像處理算法在機(jī)器視覺系統(tǒng)的早期階段起著很大的作用,它們通常被用來增強(qiáng)特定信息并抑制噪聲計(jì)算機(jī)圖形學(xué)是通過幾何基元,如線、圓和自由曲面,來生成圖像,它在可視化(Visualization)和虛擬現(xiàn)實(shí)(Virtual Reality)中起著很重要的作
15、用機(jī)器視覺正好是解決相反的問題,即從圖像中估計(jì)幾何基元和其它特征因此,計(jì)算機(jī)圖形學(xué)屬于圖像綜合,機(jī)器視覺屬于圖像分析這兩個(gè)領(lǐng)域在其發(fā)展的早期階段是沒有什么聯(lián)系的,但是近十幾年來發(fā)展的越來越相近了機(jī)器視覺使用了計(jì)算機(jī)圖形學(xué)中的曲線和曲面表示方法以與其它的一些技術(shù),而計(jì)算機(jī)圖形學(xué)也使用機(jī)器視覺技術(shù),以便在計(jì)算機(jī)中建立逼真的圖像模型可視化和虛擬現(xiàn)實(shí)把這兩個(gè)領(lǐng)域緊密地聯(lián)系在一起模式識別主要用于識別各種符號、圖畫等平面圖形模式一般指一類事物區(qū)別于其它事物所具有的共同特征。模式識別方法主要有統(tǒng)計(jì)方法和句法方法兩種,統(tǒng)計(jì)方法是指從模式抽取一組特征值,并以劃分特征空間的方法來識別每一個(gè)模式。句法方法是指利用一
16、組簡單的子模式(模式基元)通過文法規(guī)則來描述復(fù)雜的模式。模式識別方法是機(jī)器視覺識別物體的重要基礎(chǔ)之一機(jī)器視覺識別物體還經(jīng)常需要其它的技術(shù)我們將在物體識別部分簡要地討論統(tǒng)計(jì)模式識別的主要容人工智能(artificial intelligent, AI)涉與到智能系統(tǒng)的設(shè)計(jì)和智能計(jì)算的研究在經(jīng)過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進(jìn)行表示,并分析和理解場景人工智能有三個(gè)過程:感知、認(rèn)知和行動(dòng)感知把反應(yīng)現(xiàn)實(shí)世界的信息轉(zhuǎn)換成信號,并表示成符號,認(rèn)知是對符號進(jìn)行各種操作,行動(dòng)則把符號轉(zhuǎn)換成影響周圍環(huán)境的信號人工智能的許多技術(shù)在機(jī)器視覺的各個(gè)方面起著重要作用事實(shí)上,機(jī)器視覺通常被
17、視為人工智能的一個(gè)分支人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks, ANNs)是一種信息處理系統(tǒng),它是由大量簡單的處理單元(稱為神經(jīng)元)通過具有強(qiáng)度的連接(connection)相互聯(lián)系起來,實(shí)現(xiàn)并行分布式處理(parallel distribution processing, PDP)人工神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)是可以通過改變連接強(qiáng)度來調(diào)整系統(tǒng),使之適應(yīng)復(fù)雜的環(huán)境,實(shí)現(xiàn)類似人的學(xué)習(xí)、歸納和分類等功能人工神經(jīng)網(wǎng)絡(luò)已經(jīng)在許多工程技術(shù)領(lǐng)域得到了廣泛的應(yīng)用神經(jīng)網(wǎng)絡(luò)作為一種方法和機(jī)制將用于解決機(jī)器視覺中的許多問題神經(jīng)物理學(xué)與認(rèn)知科學(xué)長期將人類視覺作為主要的研究對象機(jī)器視覺中已有的許多
18、方法與人類視覺極為相似目前,許多機(jī)器視覺研究者對研究人類視覺計(jì)算模型比研究機(jī)器視覺系統(tǒng)更感興趣,希望機(jī)器視覺更加自然化,更加接近生物視覺。1.3 圖像處理與識別技術(shù)圖像就是用各種觀測系統(tǒng)以不同形式和手段觀測客觀世界而獲得的,可以直接或間接作用于人眼而產(chǎn)生視知覺的實(shí)體。人類從外界獲得的信息約有75%來自于視角系統(tǒng),也就是說,人類的大部分信息都是從圖像中獲得。圖像處理是人類視覺延伸的重要手段,可以使人們看到任意波長上所測得的圖像。例如,借助伽馬相機(jī),X光機(jī),人們可以看到紅外和超聲圖像;借助CT可看到物體部的斷層圖像;借助相應(yīng)工具可看到立體圖像。1964年,美國在太空拍回的大量月球照片就是使用了計(jì)算
19、機(jī)對圖像進(jìn)行了處理,使原本不清晰的圖像信息得以清晰再現(xiàn)。這是這門技術(shù)發(fā)展的重要里程碑。此后,圖像處理技術(shù)在空間研究方面得到廣泛應(yīng)用。總體來說,圖像處理技術(shù)的發(fā)展經(jīng)歷了初創(chuàng)期,發(fā)展期,普與期,和實(shí)用期4個(gè)階段。20世紀(jì)90年代是圖像技術(shù)的實(shí)用化時(shí)期,圖像處理的信息量巨大,對處理速度的要求極高。圖像識別所討論的問題,是研究用計(jì)算機(jī)代替人工自動(dòng)地處理大量的物理信息,解決人類生理器官所不能識別的問題,從而部分代替人的腦力勞動(dòng)。人類識別圖像的過程總是先找出它們外形或顏色的某些特征進(jìn)行比較分析,判斷,然后加以分門別類,即識別它們。人們在研制自動(dòng)識別機(jī)時(shí)也往往借鑒人的思維活動(dòng),采用同樣的處理方法,然后圖像的
20、灰度與色彩是由光強(qiáng)和波長不同的光波引起,它們與景物表面的特性,方向,光線條件以與干預(yù)等多種因素有關(guān)。在各種惡劣的工作環(huán)境中,圖像與景物已有較大的差別。因此要區(qū)分圖像屬于哪一類,往往要經(jīng)過預(yù)處理,分割,特征抽取,分析,分類,識別等一系列過程?,F(xiàn)在這些技術(shù)完全可通過計(jì)算機(jī)進(jìn)行模擬,對圖像信息進(jìn)行處理來達(dá)到對它的區(qū)別。21世紀(jì)的圖像技術(shù)要向高質(zhì)量化方面發(fā)展,主要體現(xiàn)在以下幾點(diǎn):首先高分辨率,高速度,圖像處理技術(shù)發(fā)展的最終目標(biāo)是要實(shí)現(xiàn)圖像的實(shí)時(shí)處理,這在移動(dòng)目標(biāo)的生成,識別和跟蹤上有著重要意義;其次是立體化,立體化所包括的信息最為完整和豐富,數(shù)字全息技術(shù)將有利于達(dá)到這個(gè)目的;再者是智能化,其目的是實(shí)現(xiàn)
21、圖像的智能生成,處理,識別和理解。1.4 圖像處理與識別系統(tǒng)1.4.1 關(guān)于計(jì)算機(jī)圖像處理系統(tǒng)計(jì)算機(jī)圖像處理技術(shù)是以計(jì)算機(jī)為核心的應(yīng)用技術(shù),因此,計(jì)算機(jī)圖像處理系統(tǒng)的發(fā)展,是隨著計(jì)算機(jī)技術(shù)的提高而提高的。從系統(tǒng)的層次來看,可分為高、中、低3個(gè)檔次;從圖像傳感器的敏感區(qū)域看,又可分為可見光、紅外、近紅外、X射線、雷達(dá)、伽瑪射線、超聲波等圖像處理系統(tǒng);從采集部件與景物的距離上來說,還可以分成遙感、宏觀和微觀圖像處理系統(tǒng);就應(yīng)用場所而言,又能分成通用圖像處理系統(tǒng)和專用圖像處理系統(tǒng)。通用圖像處理系統(tǒng)一般用于研究開發(fā),因此,要求傳感器敏感區(qū)間寬,線性度好;而專用系統(tǒng)一般用于特殊用途,是在通用系統(tǒng)研究基礎(chǔ)
22、上,研制開發(fā)的為現(xiàn)實(shí)某一個(gè)或幾個(gè)功能的商用系統(tǒng)。因此,在保證性能的前提下,由價(jià)格因素決定系統(tǒng)的配置。1、高檔圖像處理系統(tǒng)采用高速芯片設(shè)計(jì),完全適合圖像和信號處理特有規(guī)律的并行陣列圖像處理機(jī)。這類系統(tǒng)采用多CPU或多機(jī)結(jié)構(gòu),可以以并行或流水線方式工作。2、中檔圖像處理工作站以小型機(jī)或工作站為主控計(jì)算機(jī),加上圖像處理器構(gòu)成。這類系統(tǒng)有較強(qiáng)的交互處理能力,同時(shí),由于用通用機(jī)做主控機(jī),因而在系統(tǒng)環(huán)境下,具有較好的再開發(fā)能力。3、抵擋的微機(jī)圖像處理系統(tǒng)由微機(jī)加上圖像采集卡構(gòu)成,其結(jié)構(gòu)簡單,是一種便于普與和推廣的圖像處理系統(tǒng),也是本書著重介紹的系統(tǒng)。1.4.2 圖像處理與識別系統(tǒng)的構(gòu)成微機(jī)圖像處理系統(tǒng)由圖
23、像的采集部件、主機(jī)和圖像的輸出部件3個(gè)部分組成。1、采集部件。原始的圖像數(shù)據(jù)是通過圖像采集部件進(jìn)入計(jì)算機(jī)的,因此,圖像采集部件的作用是采集原始的模擬圖像數(shù)據(jù),并將模擬信號轉(zhuǎn)換成數(shù)字信號。計(jì)算機(jī)在接收到圖像的數(shù)字信號后,將其存入存。微機(jī)圖像處理系統(tǒng)常用的圖像采集部件有攝像頭加上視頻圖像采集卡、圖像掃描儀以與數(shù)碼攝像機(jī)等。2、圖像處理部件。在微機(jī)圖像處理系統(tǒng)中,圖像處理工作是由微機(jī)完成的,微機(jī)的擴(kuò)展槽上插有帶幀存儲(chǔ)器的采集卡,圖像處理的過程通常包含從幀存儲(chǔ)器讀取數(shù)據(jù)到計(jì)算機(jī)存、處理存中的圖像數(shù)據(jù)和送數(shù)據(jù)回圖像幀存儲(chǔ)器3個(gè)步驟。對于直接使用存的采集卡,則只需和存進(jìn)行數(shù)據(jù)交換,計(jì)算機(jī)的存越大,CPU的
24、運(yùn)算速度越快,圖像處理的速度也越快。3、識別結(jié)果的輸出部件。圖像的輸出是圖像處理的最終目的。從廣義的角度來講,圖像的輸出形式可以分為兩種:一種是根據(jù)圖像處理的結(jié)果做出判斷,例如質(zhì)量檢測中的合格和不合格,輸出不一定以圖像骯作為最終形式,而只需做出提示供人或機(jī)器做出選擇。這種提示可以是計(jì)算機(jī)屏幕信息或是電平信號的高低,這樣的輸出往往用于成熟研究的應(yīng)用上。另一種則是以圖像為輸出方式,它包括中間過程的監(jiān)視以與結(jié)果圖像的輸出。圖像輸出方式有屏幕輸出、打印輸出和視頻硬拷貝輸出。1.5 斑馬線自動(dòng)識別系統(tǒng)課題研究容斑馬線識別,最基本的就是對那些斑馬線圖標(biāo)圖片的識別,即是對圖片的處理和識別,圖像格式一般都是R
25、GB等。主要是對輸入的原始RGB圖像進(jìn)行處理這一過程借用了大量的圖像處理技術(shù)和算法,如圖像濾波、圖像增強(qiáng)、邊緣檢測等,以便從圖像中抽取諸如角點(diǎn)、邊緣、線條、邊界以與色彩等關(guān)于場景的基本特征;這一過程還包含了各種圖像變換(如校正)、圖像紋理檢測、圖像運(yùn)動(dòng)檢測等。對一幅圖像進(jìn)行一系列處理之后,提取出系統(tǒng)要求的感興趣區(qū)域,最后和之前做好的模板匹配比較,就得出一組相關(guān)的比較系數(shù),從這一組系數(shù)中取出一個(gè)最大值,就可以識別出圖像就是這個(gè)值指定的模板。斑馬線自動(dòng)識別系統(tǒng)圖像處理與識別包括斑馬線圖像的預(yù)處理,圖像的分割以與圖像的匹配識別。處理識別流程如下:斑馬線圖像的邊緣提取、分割斑馬線圖像的預(yù)處理(圖像變換
26、、增強(qiáng))輸入斑馬線圖像最后將圖像進(jìn)行匹配識別將分割的斑馬線圖像進(jìn)行后期處理圖1-1 處理識別流程圖50 / 50第2章 圖像處理與識別與圖像理解2.1 二值圖像分析一幅數(shù)字圖像是一個(gè)二維陣列,陣列元素值稱為灰度值或強(qiáng)度值實(shí)際上,圖像在量化成數(shù)字圖像前是一個(gè)連續(xù)強(qiáng)度函數(shù)的集合,場景信息就包含在這些強(qiáng)度值中圖像強(qiáng)度通常被量化成256個(gè)不同灰度級,對某些應(yīng)用來說,也常有32、64、128或512個(gè)灰度級的情況,在醫(yī)療領(lǐng)域里甚至使用高達(dá)4096(12bits)個(gè)灰度級很明顯,灰度級越高,圖像質(zhì)量越好,但所需的存也越大在機(jī)器視覺研究的早期,由于存和計(jì)算能力非常有限,而且十分昂貴,因此視覺研究人員把精力主
27、要集中在研究輸入圖像僅包含兩個(gè)灰度值的二值視覺系統(tǒng)上人們注意到,人類視覺在理解僅由兩個(gè)灰度級組成的線條、輪廓影像或其它圖像時(shí)沒有任何困難,而且應(yīng)用場合很多 隨著計(jì)算機(jī)計(jì)算能力的不斷增強(qiáng)和計(jì)算成本的不斷下降,人們普遍開始研究基于灰度圖像、彩色圖像和深度圖像的視覺系統(tǒng)盡管如此,二值視覺系統(tǒng)還是十分有用的,其原因如下: 計(jì)算二值圖像特性的算法非常簡單,容易理解和實(shí)現(xiàn),并且計(jì)算速度很快 二值視覺所需的存小,對計(jì)算設(shè)備要求低工作在256個(gè)灰度級的視覺系統(tǒng)所需存是工作在一樣大小二值圖像視覺系統(tǒng)所需存的八倍如若利用游程長度編碼等技術(shù)。還可使所需存進(jìn)一步減少由于二值圖像中的許多運(yùn)算是邏輯運(yùn)算而不是算術(shù)運(yùn)算,所
28、以所需的處理時(shí)間很短(3)許多二值視覺系統(tǒng)技術(shù)也可以用于灰度圖像視覺系統(tǒng)上在灰度或彩色圖像中,表示一個(gè)目標(biāo)或物體的一種簡易方法就是使用物體模板(mask),物體模板就是一幅二值圖像,其中1表示目標(biāo)上的點(diǎn),0表示其它點(diǎn)在物體從背景中分離出來后,為了進(jìn)行決策,還需要求取物體的幾何和拓?fù)涮匦?,這些特性可以從它的二值圖像計(jì)算出來因此,盡管我們是在二值圖像上討論這些方法,但它們的應(yīng)用并不限于二值圖像一般來說,當(dāng)物體輪廓足以用來識別物體且周圍環(huán)境可以適當(dāng)?shù)乜刂茣r(shí),二值視覺系統(tǒng)是非常有用的當(dāng)使用特殊的照明技術(shù)和背景并且場景中只有少數(shù)物體時(shí),物體可以很容易地從背景中分離出來,并可得到較好的輪廓,比如,許多工業(yè)
29、場合都屬于這種情況二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明條件和物體的反射特性二值圖像可用來計(jì)算特定任務(wù)中物體的幾何和拓?fù)涮匦?,在許多應(yīng)用中,這種特性對識別物體來說是足夠的二值視覺系統(tǒng)已經(jīng)在光學(xué)字符識別、染色體分析和工業(yè)零件的識別中得到了廣泛應(yīng)用2.1.1 閾值運(yùn)算視覺系統(tǒng)中的一個(gè)重要問題是從圖像中識別代表物體的區(qū)域(或子圖像),這種對人來說是件非常容易的事,對計(jì)算機(jī)來說卻是令人吃驚的困難為了將物體區(qū)域同圖像其它區(qū)域分離出來,需要首先對圖像進(jìn)行分割把圖像劃分成區(qū)域的過程稱為分割,即把圖像劃分成區(qū)域,使得每一個(gè)區(qū)域?qū)?/p>
30、應(yīng)一個(gè)候選的物體下面給出分割的嚴(yán)格定義定義分割是把像素聚合成區(qū)域的過程,使得:l 整幅圖像 (是一個(gè)完備分割 )l ,(是一個(gè)完備分割)l 每個(gè)區(qū)域滿足一個(gè)謂詞,即區(qū)域的所有點(diǎn)有某種共同的性質(zhì)l 不同區(qū)域的圖像,不滿足這一謂詞正如上面所表明的,分割滿足一個(gè)謂詞,這一謂詞可能是簡單的,如分割灰度圖像時(shí)用的均勻灰度分布、一樣紋理等謂詞,但在大多數(shù)應(yīng)用場合,謂詞十分復(fù)雜在圖像理解過程中,分割是一個(gè)非常重要的步驟二值圖像可以通過適當(dāng)?shù)胤指罨叶葓D像得到如果物體的灰度值落在某一區(qū)間,并且背景的灰度值在這一區(qū)間之外,則可以通過閾值運(yùn)算得到物體的二值圖像,即把區(qū)間的點(diǎn)置成1,區(qū)間外的點(diǎn)置成0對于二值視覺,分割
31、和閾值化是同義的閾值化可以通過軟件來實(shí)現(xiàn),也可以通過硬件直接完成通過閾值運(yùn)算是否可以有效地進(jìn)行圖像分割,取決于物體和背景之間是否有足夠的對比度設(shè)一幅灰度圖像中物體的灰度分布在區(qū)間,經(jīng)過閾值運(yùn)算后的圖像為二值圖像,即:如果物體灰度值分布在幾個(gè)不相鄰區(qū)間時(shí),閾值化方案可表示為:其中Z是組成物體各部分灰度值的集合圖31是對一幅灰度圖像使用不同閾值得到的二值圖像輸出結(jié)果閾值算法與應(yīng)用領(lǐng)域密切相關(guān)事實(shí)上,某一閾值運(yùn)算常常是為某一應(yīng)用專門設(shè)計(jì)的,在其它應(yīng)用領(lǐng)域可能無法工作閾值選擇常常是基于在某一應(yīng)用領(lǐng)域獲取的先驗(yàn)知識,因此在某些場合下,前幾輪運(yùn)算通常采用交互式方式來分析圖像,以便確定合適的閾值但是,在機(jī)器
32、視覺系統(tǒng)中,由于視覺系統(tǒng)的自主性能(autonomy)要求,必須進(jìn)行自動(dòng)閾值選擇現(xiàn)在已經(jīng)研究出許多利用圖像灰度分布和有關(guān)的物體知識來自動(dòng)選擇適當(dāng)閾值的技術(shù)2.2 圖像區(qū)域分析圖像中的區(qū)域是指相互連結(jié)的具有相似特性的一組像素由于區(qū)域可能對應(yīng)場景中的物體,因此,區(qū)域的檢測對于圖像解釋十分重要一幅圖像可能包含若干個(gè)物體,而每一個(gè)物體又可能包含對應(yīng)于物體不同部位的若干個(gè)區(qū)域?yàn)榱司_解釋一幅圖像,首先要把一幅圖像劃分成對應(yīng)于不同物體或物體不同部位的區(qū)域2.2.1區(qū)域與邊緣圖像區(qū)域劃分有兩種方法:一種是基于區(qū)域的方法,另一種是使用邊緣檢測的輪廓預(yù)估方法在基于區(qū)域的方法中,把所有對應(yīng)于一個(gè)物體的像素組合在一
33、起,并進(jìn)行標(biāo)記,以表示它們屬于一個(gè)區(qū)域,這一處理過程稱為分割在某一評判標(biāo)準(zhǔn)下,把像素分配給某一區(qū)域,就可以把這些像素同圖像其余部分分開圖像分割中的兩個(gè)最基本的原則是數(shù)值相似性和空間接近性如果兩個(gè)像素具有相似的強(qiáng)度特性,或它們之間十分靠近,則可以把它們分配到同一區(qū)域,例如,兩個(gè)像素之間的數(shù)值相似性度量可以是它們的灰度值之差,也可以是區(qū)域灰度值分布;它們的空間接近性度量可以是歐幾里德距離,也可以是區(qū)域致密度 相似性和接近性原則來源于如下假設(shè):同一物體上的點(diǎn)投影到圖像上得到的像素點(diǎn)在空間上十分靠近,且具有相似的灰度值很顯然,這一假設(shè)并不是在任何情況下都成立然而可以使用這一假設(shè)來組合圖像中的像素,然后
34、利用相關(guān)域知識來匹配物體模型和區(qū)域在簡單的情況下,可以通過閾值法和連通成份標(biāo)記法來進(jìn)行圖像分割對于復(fù)雜的圖像,可以使用更高級的方法實(shí)現(xiàn)圖像分割 分割也可以通過求取區(qū)域邊界上的像素來進(jìn)行這些像素點(diǎn)(也稱為邊緣)可以通過搜尋鄰近像素的方法來得到由于邊緣像素是在邊界上,在邊界兩邊的區(qū)域具有不同的灰度值,這樣,區(qū)域的邊界可以通過測量鄰近像素差值來求取盡管邊緣檢測可能使用誘導(dǎo)特性(如紋理和運(yùn)動(dòng))來檢測邊緣但大多數(shù)邊緣檢測器僅使用強(qiáng)度特性作為邊緣檢測的基礎(chǔ)在理想的圖像中,一個(gè)區(qū)域是由一條封閉輪廓線包圍著原則上,區(qū)域分割和邊緣檢測應(yīng)該產(chǎn)生一樣的結(jié)果,即使用邊界跟蹤算法可以得到區(qū)域的邊緣(或封閉的輪廓線);反
35、過來,使用區(qū)域填充算法也可以得到邊緣所包圍的區(qū)域但在實(shí)際的圖像中,很少能夠從區(qū)域中得到正確的邊緣,反之亦然由于噪聲和其它因素的影響,不論是區(qū)域分割還是邊緣檢測,都無法提供完整的信息2.3 圖像處理與識別與圖像理解所研究的容2.3.1 圖像處理技術(shù)1圖像數(shù)字化其目的是將模擬形式的數(shù)字圖像通過數(shù)字化設(shè)備變?yōu)閿?shù)字計(jì)算機(jī)可用的離散的圖像數(shù)據(jù)。2圖像變換為了達(dá)到某種目的(通常是從圖像中獲得某種重要的信息)而對圖像使用一種數(shù)學(xué)技巧,經(jīng)過變換后的圖像更為方便、容易地處理和操作。3圖像增強(qiáng)圖像增強(qiáng)的主要目標(biāo)是改善圖像的質(zhì)量。采用某種特殊的技術(shù)來突出圖像中的某些信息,削弱或消除某些無關(guān)信息,從而有目的地強(qiáng)調(diào)圖像
36、的整體或局部特征。常常用來改善人對圖像的視覺效果,讓觀察者能看到更加直接、清晰、適于分析的信息。直方圖修正、灰度變換、強(qiáng)化圖像輪廓等都是常用的手段。4圖像分割在圖像的研究和應(yīng)用中,人們往往僅對圖像的某些部分感興趣。它們一般對應(yīng)圖像中特定的、具有獨(dú)特性質(zhì)的區(qū)域。圖像分割就是把圖像分割成各具特性的區(qū)域并提取出感興趣的目標(biāo)。5圖像分析圖像分析也可稱為圖像理解,主要研究從圖像中提取有用的數(shù)據(jù)或信息,生成非圖像的描述或表示。圖像分析的容分為特征提取、圖像分割、符號描述、紋理分析、運(yùn)動(dòng)圖像分析和圖像的檢測和配準(zhǔn)。2.3.2 圖像識別技術(shù)圖像識別是近20年來發(fā)展起來的一門新型技術(shù)科學(xué),它以研究某些對象或過程
37、的分類與描述為主要容。圖像識別所研究的領(lǐng)域十分廣泛,它可以是醫(yī)學(xué)圖像中的癌細(xì)胞識別;機(jī)械加工中的零部件的識別、分類;可以是從遙感圖片中辨別農(nóng)作物、森林、湖泊與軍事設(shè)施;可以是自導(dǎo)引小車中的路徑識別;郵政系統(tǒng)中自動(dòng)分煉信函;交通管制、識別違章行使的汽車牌照;銀行的支票識別、識別等。上述都是圖像識別研究的課題??偟脕碚f所研究的問題,主要是分類問題。1 圖像識別系統(tǒng)的組成一個(gè)圖像識別系統(tǒng)主要包括3部分:圖像信息獲取;信息加工和處理、抽取特征;判斷和分類。如圖22所示。被識別圖像圖像信息獲取處理、特征抽取識別判斷圖22圖像識別系統(tǒng)框圖2 圖像識別方法圖像識別的方法較多,大體上可以歸納為兩類方法:統(tǒng)計(jì)方
38、法(數(shù)學(xué)方法)和語言(或結(jié)構(gòu))學(xué)方法,后者亦稱句法結(jié)構(gòu)識別方法。統(tǒng)計(jì)方法以數(shù)學(xué)上決策理論為基礎(chǔ),根據(jù)這種理論建立了統(tǒng)計(jì)學(xué)識別模型。其基本模型是在對研究的圖像進(jìn)行大量統(tǒng)計(jì)分析,找出規(guī)律性認(rèn)識,抽出反映圖像本質(zhì)特征進(jìn)行識別。在這種方法中,大量工作在于如何抽取圖像的特征或決定統(tǒng)計(jì)參數(shù),即所謂參數(shù)法。另外,還有非參數(shù)決策法,如鄰近法則,它是一種跳過概率的估計(jì)而直接進(jìn)行決策的方法。對于特征抽取,必須把圖像的大量原始信息縮減為少數(shù)的特征,例如采用分差分布、特征向量法。對文字、符號等可只抽取幾何圖形特征,對聲波信號可抽取頻普特征。為了抽取特征,有時(shí)要對原始圖像信息進(jìn)行各種變換,空間投影,把多維的圖像點(diǎn)簡化到
39、幾個(gè)坐標(biāo)分量上。句法結(jié)構(gòu)識別法立足于分析圖像的結(jié)構(gòu),一幅圖像可以模仿語言構(gòu)造,用一些語句來表達(dá)。語句的結(jié)構(gòu)是由詞、短語等組成,并按照一定的語法表達(dá)出來。也就是說,語句由短語組成,而短語由單詞組成,其中最基本的元素就是單詞。那么一些語句又怎么樣和圖像發(fā)生聯(lián)系呢?這可從圖像的形成說起,任何一幅圖像,總是由一些點(diǎn)、直線、斜線、弧線與環(huán)組成,分析圖像的這些基本元素,看它們按怎樣的規(guī)則構(gòu)成圖像,這就是結(jié)構(gòu)分析的課題。這些基本元素就相當(dāng)于言句中的單詞;那些直線、曲線可看成短語,它們的全體按怎樣的規(guī)則構(gòu)成整個(gè)圖像,就相當(dāng)于語法結(jié)構(gòu)。而對圖像識別來說,就相當(dāng)于檢查圖像所代表的某一類句型,是否符合事先規(guī)定的語法
40、。若語確,則認(rèn)為識別出結(jié)果。2.3.3 圖像理解圖像理解的研究顯然要涉與或包含研究獲取圖像的方法、裝置和具體應(yīng)用的實(shí)現(xiàn),這就形成了所謂的計(jì)算機(jī)視覺。1、傳感器引起失真的補(bǔ)償人的圖像是用灰度的二維陣列表示的,通常由于傳感器的特性會(huì)引起幾何學(xué)上或者光學(xué)上的失真,因此需進(jìn)行補(bǔ)償。2、圖像特征的提取圖像凡是亮度發(fā)生急劇變化的地方,都是對應(yīng)于不同物體面與面之間的邊緣,這是一個(gè)重要特征,所以把圖像中亮度急劇變化的點(diǎn)提取出來并對其性質(zhì)進(jìn)行描述(如邊緣的方向、幅度、直方圖等),對這些特征點(diǎn)的統(tǒng)計(jì)分布狀況進(jìn)行研究,可認(rèn)識到物體的構(gòu)造。如果把相鄰的特征點(diǎn)連接起來則可以構(gòu)成輸入圖像的曲線。3、景物特征的提取在觀看物
41、體時(shí)看到的不僅是亮度急劇變化的點(diǎn),同時(shí)還有各個(gè)面的方向、距離、顏色反射率,這些特征與照明的情況和視點(diǎn)的位置無關(guān),是物體所固有的特征。為了與圖像上特征相區(qū)別,一般稱為景物特征。4、景物的分割物體的發(fā)現(xiàn)利用景物的特征,把其性質(zhì)大致一樣的領(lǐng)域分割開來,這與圖像處理中把亮度一樣的領(lǐng)域分割出來的領(lǐng)域法一樣。5、物體的識別從景物所發(fā)現(xiàn)的各物體再參照物體的模型來識別物體,與此同時(shí)確定各物體的位置和方向。6、景物的識別研究各物體之間的連接關(guān)系,由這個(gè)連接關(guān)系和模型來認(rèn)識更復(fù)雜的物體,從而可以對景物的全體進(jìn)行描述。特征描述的一致性物體的模型景物的描述物體的描述分離的描述復(fù)雜物體的模型關(guān)于景物的先驗(yàn)知識圖像顏色、
42、形狀、紋理景物的特征圖像特征提取圖像景物傳感器的模型圖2-3 典型的圖像理解系統(tǒng)2.4 圖像處理與識別與圖像理解的關(guān)系 在研究圖像理解時(shí),往往要進(jìn)行圖像的處理、識別與圖像理解的過程,三者關(guān)系非常密切,互相交錯(cuò)。2.4.1 圖像處理在研究圖像首先要對獲得的圖像進(jìn)行預(yù)處理以濾去影響的因素,作為幾何、彩色校正等。這樣可提高信噪比:有時(shí)由于信息微弱,無法辨識,還得進(jìn)行增強(qiáng)處理。并且為了從圖像中找到需要識別的東西,還得對圖像進(jìn)行分割,也就是進(jìn)行定位和分離,以分出不同的物體。為了給觀察者以清晰的圖像,還要對圖像進(jìn)行改善,即進(jìn)行復(fù)原處理,它是把已經(jīng)退化了的圖像加以重建或恢復(fù)的過程,以便改進(jìn)圖像的保真度。在實(shí)
43、際處理中,由于圖像信息量非常大,在存儲(chǔ)與傳送中,還要對圖像進(jìn)行壓縮。上述工作必須用計(jì)算機(jī)來完成,因而要進(jìn)行編碼等工作。之前等等都是圖像處理的工作,因此,圖像處理包括圖像增強(qiáng),圖像編碼,圖像壓縮,圖像復(fù)原,圖像分割等。輸入的是圖像,輸出的也是圖像,過程如下所示:圖像處理(編碼、壓縮、增強(qiáng)、分割、復(fù)原)圖像輸入圖像輸出2-4圖像處理示意圖圖像識別是在上述分割后的每個(gè)部分中,找出它的形狀與紋理等特征,即特征抽?。ㄓ袝r(shí)也包括圖像分割),以便對圖像進(jìn)行分類并對整個(gè)圖像作結(jié)構(gòu)上的分析。所以,對圖像識別來說,輸入的是圖像,輸出的是類別和圖像的結(jié)構(gòu)分析,如下圖所示:圖像處理(編碼、壓縮、增強(qiáng)、分割、復(fù)原)圖像
44、類別結(jié)構(gòu)分析2-5圖像識別示意圖2.4.2 圖像理解所謂圖像理解是一個(gè)總稱。上述圖像處理與圖像識別的最終目的就在于對圖像作描述和解釋,以便最終理解它是什么圖像。所以它是在圖像處理與識別的基礎(chǔ)上,再根據(jù)分類作結(jié)構(gòu)句法分析,去描述圖像和解釋圖像。圖像處理、識別、與理解之間的關(guān)系如圖:圖像處理(編碼、壓縮、增強(qiáng)、分割、復(fù)原)圖像圖像描述解釋2-6圖像理解示意圖2.5 圖像處理工具M(jìn)ATLABMATLAB 語言的首創(chuàng)者 Cleve Moler 教授在數(shù)值分析,特別是在數(shù)值線性代數(shù)的領(lǐng)域中很有影響, 他參與編寫了數(shù)值分析領(lǐng)域一些著名的著作和兩個(gè)重要的 Fortran 程序 EISPACK 和LINPAC
45、K。他曾在密西根大學(xué)、斯坦福大學(xué)和新墨西哥大學(xué)任數(shù)學(xué)與計(jì)算機(jī)科學(xué)教授。1980 年前后,當(dāng)時(shí)的新墨西哥大學(xué)計(jì)算機(jī)系主任 Moler 教授在講授線性代數(shù)課程時(shí),發(fā)現(xiàn)了用其他高級語言變成極為不便,便構(gòu)思并開發(fā)了 MATLAB (MATrix LABoratory,即矩陣實(shí)驗(yàn)室), 這一軟件利用了當(dāng)時(shí)數(shù)值線性代數(shù)領(lǐng)域最高水平的 EISPACK 和 LINPACK 兩大軟件包中可靠的子程序,用 Fortran 語言編寫了集命令翻譯、科學(xué)計(jì)算于一身的一套交互式軟件系統(tǒng)。MATLAB 語言是當(dāng)今國際上科學(xué)界 (尤其是自動(dòng)控制領(lǐng)域) 最具影響力、也是最有活力的軟件。它起源于矩陣運(yùn)算,并已經(jīng)發(fā)展成一種高度集成
46、的計(jì)算機(jī)語言。它提供了強(qiáng)大的科學(xué)運(yùn)算、靈活的程序設(shè)計(jì)流程、高質(zhì)量的圖形可視化與界面設(shè)計(jì)、便捷的與其他程序和語言接口的功能。MATLAB 語言在各國高校與研究單位起著重大的作用。MATLAB的數(shù)字圖像處理功能很強(qiáng)大,其自帶的圖像處理工具箱(Image processing Toolbox)包括了經(jīng)典圖像處理的許多方面,如圖像的幾何操作、鄰域和區(qū)域操作、圖像變換、圖像的恢復(fù)和增強(qiáng)、線性濾波器設(shè)計(jì)、圖像分析和統(tǒng)計(jì)、色彩、集合與形態(tài)操作等方面,同時(shí),MATLAB還提供了對多種圖像文件格式的讀寫和顯示,這使得在MATLAB的集成環(huán)境中可以輕松實(shí)現(xiàn)圖像處理。在圖像幾何操作方面,MATLAB的圖像幾何操作提
47、供了插值函數(shù),圖像尺寸調(diào)整,以與任意角度的圖像旋轉(zhuǎn),可以對圖像進(jìn)行縮放、旋轉(zhuǎn)和剪切等操作。在圖像濾波方面,MATLAB圖像片理工具箱提供了多個(gè)函數(shù)用于設(shè)計(jì)和實(shí)現(xiàn)多種濾波操作,圖像的線性濾波操作即可用MATLAB預(yù)定義的多種濾波器進(jìn)行濾波,也可以根據(jù)需要用MATLAB實(shí)現(xiàn)自定義的濾波器進(jìn)行濾波。在圖像變換方面,MATLAB圖像處理工具箱提供了Fourier變換,離散余弦變換,Radon變換以與這些變換的逆變換等,同時(shí)民可以利用MATLAB的小波變換工具箱來實(shí)現(xiàn)圖像的小波變換。在圖像分析方面,MATLAB圖像處理工具箱支持多種標(biāo)準(zhǔn)的圖像處理操作,以方便用戶對圖像進(jìn)行分析和調(diào)整。MATLAB圖像處理
48、工具箱提供了多個(gè)函數(shù)對圖像的像素進(jìn)行操作,包括:選定像素的灰度值,沿圖像中某個(gè)路徑的灰度值,圖像的灰度的輪廓圖,圖像灰度直方圖,圖像灰度的摘要統(tǒng)計(jì)以與圖像區(qū)域的特征度量。MATLAB 圖像分析技術(shù)可以提取圖像的結(jié)構(gòu)信息。如,MATLAB圖像處理工具箱提供的多種邊緣檢測算子可以提取圖像的邊界信息。MATLAB圖像處理工具箱己經(jīng)實(shí)現(xiàn)了如Log算子、Canny算子、Sobel算子、Prewitt算子、Roberts算子等多種經(jīng)典的檢測邊界檢測算法,MATLAB中的圖像處理技術(shù)用于改善圖像,包括對圖像噪聲的操作,濾波以減少噪音,以與對圖像的顏色和灰度的調(diào)整,如,圖像灰度直方圖修下和直方圖均衡化。第三章
49、斑馬線自動(dòng)識別系統(tǒng)主要算法3.1 邊緣檢測邊緣(edge)是指圖像局部強(qiáng)度變化最顯著的部分邊緣主要存在于目標(biāo)與目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征和形狀特征等圖像分析的重要基礎(chǔ)圖像分析和理解的第一步常常是邊緣檢測(edge detection)圖像中的邊緣通常與圖像強(qiáng)度或圖像強(qiáng)度的一階導(dǎo)數(shù)的不連續(xù)性有關(guān)圖像強(qiáng)度的不連續(xù)可分為:(1) 階躍不連續(xù),即圖像強(qiáng)度在不連續(xù)處的兩邊的像素灰度值有著顯著的差異;(2) 線條不連續(xù),即圖像強(qiáng)度突然從一個(gè)值變化到另一個(gè)值,保持一個(gè)較小的行程后又返回到原來的值在實(shí)際中,階躍和線條邊緣圖像是很少見的,由于大多數(shù)傳感元件具有低頻特性
50、,使得階躍邊緣變成斜坡型邊緣,線條邊緣變成屋頂形邊緣,其中的強(qiáng)度變化不是瞬間的,而是跨越一定的距離,這些邊緣如圖31所示圖31 兩種常見的邊緣,(a) 階躍函數(shù),(b) 線條函數(shù)其中第一排為理想信號,第二排對應(yīng)實(shí)際信號對一個(gè)邊緣來說,有可能同時(shí)具有階躍和線條邊緣特性例如在一個(gè)表面上,由一個(gè)平面變化到法線方向不同的另一個(gè)平面就會(huì)產(chǎn)生階躍邊緣;如果這一表面具有鏡面反射特性且兩平面形成的棱角比較圓滑,則當(dāng)棱角圓滑表面的法線經(jīng)過鏡面反射角時(shí),由于鏡面反射分量,在棱角圓滑表面上會(huì)產(chǎn)生明亮光條,這樣的邊緣看起來象在階躍邊緣上疊加了一個(gè)線條邊緣由于邊緣可能與場景中物體的重要特征對應(yīng),所以它是很重要的圖像特征
51、。比如,一個(gè)物體的輪廓通常產(chǎn)生階躍邊緣,因?yàn)槲矬w的圖像強(qiáng)度不同于背景的圖像強(qiáng)度3.2 坎尼(Canny)算子檢測階躍邊緣的基本思想是在圖像中找出具有局部最大梯度幅值的像素點(diǎn)檢測階躍邊緣的大部分工作集中在尋找能夠用于實(shí)際圖像的梯度數(shù)字逼近由于實(shí)際的圖像經(jīng)過了攝像機(jī)光學(xué)系統(tǒng)和電路系統(tǒng)(帶寬限制)固有的低通濾波器的平滑,因此,圖像中的階躍邊緣不是十分陡立圖像也受到攝像機(jī)噪聲和場景中不希望的細(xì)節(jié)的干擾圖像梯度逼近必須滿足兩個(gè)要求:(1) 逼近必須能夠抑制噪聲效應(yīng),(2) 必須盡量精確地確定邊緣的位置抑制噪聲和邊緣精確定位是無法同時(shí)得到滿足的,也就是說,邊緣檢測算法通過圖像平滑算子去除了噪聲,但卻增加了
52、邊緣定位的不確定性;反過來,若提高邊緣檢測算子對邊緣的敏感性,同時(shí)也提高了對噪聲的敏感性有一種線性算子可以在抗噪聲干擾和精確定位之間提供最佳折衷方案,它就是高斯函數(shù)的一階導(dǎo)數(shù),對應(yīng)于圖像的高斯函數(shù)平滑和梯度計(jì)算梯度的數(shù)值逼近可用上述中列出的和方向上的一階偏導(dǎo)的有限差分來表示高斯平滑和梯度逼近相結(jié)合的算子不是旋轉(zhuǎn)對稱的這種算子在邊緣方向上是對稱的,在垂直邊緣的方向上是反對稱的(沿梯度方向)這也意味著該算子對最急劇變化方向上的邊緣特別敏感,但在沿邊緣這一方向上是不敏感的,其作用就象一個(gè)平滑算子在高斯噪聲中,一個(gè)典型的邊緣代表一個(gè)階躍的強(qiáng)度變化。根據(jù)這個(gè)模型,好的邊緣檢測算子應(yīng)該有3個(gè)指標(biāo):低失誤概
53、率,即真正的邊緣點(diǎn)盡可能少的丟失又要盡可能避免將非邊緣點(diǎn)檢測為邊緣;高位置精度,檢測的邊緣應(yīng)盡可能接近真實(shí)的邊緣;對每一個(gè)邊緣點(diǎn)有惟一的響應(yīng),得到單像素寬度的邊緣??材崴阕犹岢隽诉吘壦阕拥娜缦?個(gè)準(zhǔn)則。(1)信噪比準(zhǔn)則信噪比越大,提取的邊緣質(zhì)量越高。信噪比SNR定義為:其中G(x)代表邊緣函數(shù),h(x)代表寬度為W的濾波器的脈沖響應(yīng),代表高斯噪聲的均方差。(2)定位精度準(zhǔn)則邊緣定位精度L如下定義:其中和分別是G(x)和h(x)的導(dǎo)數(shù)。L越大表明定位精度越高。(3)單邊緣響應(yīng)準(zhǔn)則為了保證單邊緣只有一個(gè)響應(yīng),檢測算子的脈沖響應(yīng)導(dǎo)數(shù)的零交叉點(diǎn)平均距離應(yīng)滿足:是的二階導(dǎo)數(shù)。以上述指標(biāo)和準(zhǔn)則為基礎(chǔ),利用
54、泛函求導(dǎo)的方法可導(dǎo)出坎尼邊緣檢測器是信噪比與定位之乘積的最優(yōu)逼近算子,表達(dá)式近似于高斯函數(shù)的一階導(dǎo)數(shù)。將坎尼3個(gè)準(zhǔn)則相結(jié)合可以獲得最優(yōu)的檢測算子??材徇吘墮z測的算法步驟如下:(1)用高斯濾波器平滑圖像;(2)用一階偏導(dǎo)的有限差分來計(jì)算梯度的幅值和方向;(3)對梯度幅值進(jìn)行非極大值抑制;(4)用雙閥值算法檢測和連接邊緣??材崴阕右部梢杂肕ATLAB中的edge函數(shù)來檢測邊緣:BW=edge(I,canny,thresh,sigma)式中thresh是邊緣檢測的閥值,sigma是高斯濾波器的值,默認(rèn)為2。3.3 模板匹配算法認(rèn)知是一個(gè)把未知與已知聯(lián)系起來的過程。對一個(gè)復(fù)雜的視覺系統(tǒng)來說,它的部常同
55、時(shí)存在著多種輸入和其它知識共存的表達(dá)形式。感知是把視覺輸入與事前已有表達(dá)結(jié)合的過程,而識別也需要建立或發(fā)現(xiàn)各種部表達(dá)式之間的聯(lián)系。模板匹配的基本概念:模板就是一幅已知的小圖像。模板匹配就是在一幅大圖像中搜尋目標(biāo),已知該圖中有要找的目標(biāo),且該目標(biāo)同模板有一樣的尺寸、方向和圖像,通過一定的算法可以在圖中找到目標(biāo),確定其坐標(biāo)位置。以8位圖像(其1 個(gè)像素由1 個(gè)字節(jié)描述)為例,模板T( m × n 個(gè)像素)疊放在被搜索圖S( W × H 個(gè)像素)上平移,模板覆蓋被搜索圖的那塊區(qū)域叫子圖Sij。i,j 為子圖左上角在被搜索圖S上的坐標(biāo)。搜索圍是:通過比較T和Sij的相似性,完成模板匹配過程。兩個(gè)函數(shù)的相關(guān)性定義,可用下式表示:表示的復(fù)共軛,我們知道相關(guān)理論相似于卷積理論,和分別表示和的傅利葉變換,根據(jù)卷積理論有:和可知卷積是空間域過濾和頻率域過濾之間的紐帶,相關(guān)的重要用途在于匹配,在匹配中是一幅包物體或區(qū)域的圖像。如果要確定是否包含有感興趣的物體或區(qū)域,讓作為那個(gè)物體的區(qū)域(通常稱該物體為模板)。如果匹配成功,2個(gè)函數(shù)的相關(guān)值會(huì)在找到中相應(yīng)點(diǎn)的位置上達(dá)到最大。從上面的分析可知:相關(guān)算法可以有兩種方法,可以在空間域進(jìn)行,也可以在頻率域進(jìn)行。由傅利葉分析中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年勞動(dòng)仲裁裁決和解協(xié)議
- 2025年加盟商業(yè)合同
- 2025年大數(shù)據(jù)智能分析合作協(xié)議
- 2025年冷藏海鮮運(yùn)送合同
- 2025年創(chuàng)業(yè)投資協(xié)議解除協(xié)議
- 2025版信托投資公司綠色金融借款合同規(guī)范2篇
- 二零二五年度五人共同投資人工智能技術(shù)研發(fā)協(xié)議3篇
- 二零二五年度大型公共場所監(jiān)控網(wǎng)絡(luò)升級改造合同3篇
- 2025年度舞蹈教師舞蹈教材編寫與出版合同
- 2025年度房地產(chǎn)項(xiàng)目銀行過橋墊資借款合同
- 物業(yè)民法典知識培訓(xùn)課件
- 2023年初中畢業(yè)生信息技術(shù)中考知識點(diǎn)詳解
- 2024-2025學(xué)年八年級數(shù)學(xué)人教版上冊寒假作業(yè)(綜合復(fù)習(xí)能力提升篇)(含答案)
- 《萬方數(shù)據(jù)資源介紹》課件
- 第一章-地震工程學(xué)概論
- 《中國糖尿病防治指南(2024版)》更新要點(diǎn)解讀
- 浙江省金華市金東區(qū)2022-2024年中考二模英語試題匯編:任務(wù)型閱讀
- 青島版(五四制)四年級數(shù)學(xué)下冊全冊課件
- 大健康行業(yè)研究課件
- 租賃汽車可行性報(bào)告
- 計(jì)算機(jī)輔助設(shè)計(jì)AutoCAD繪圖-課程教案
評論
0/150
提交評論