基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別_第1頁
基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別_第2頁
基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別_第3頁
基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別_第4頁
基于MATLAB的BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于MATLAB BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別 基于MATLAB BP神經(jīng)網(wǎng)絡(luò)的數(shù)字圖像識(shí)別 【摘要】 隨著現(xiàn)代社會(huì)的發(fā)展,信息的形式和數(shù)量正在迅猛增長。其中很大一部分是圖像,圖像可以把事物生動(dòng)的呈現(xiàn)在我們面前,讓我們更直觀地接受信息。同時(shí),計(jì)算機(jī)已經(jīng)作為一種人們普遍使用的工具為人們的生產(chǎn)生活服務(wù)。如今我們也可以把這些技術(shù)應(yīng)用在交通領(lǐng)域。作為智能交通系統(tǒng)(InteUigent Traffic System,簡稱ITS)中的一個(gè)重要組成部分的車牌識(shí)別技術(shù),當(dāng)然就是其中的重點(diǎn)研究對(duì)象。車輛牌照識(shí)別(License P1ate Recognition,簡稱LPR),是一種關(guān)于計(jì)算機(jī)的包括圖像處理、數(shù)學(xué)

2、技術(shù)、數(shù)據(jù)庫、信息技術(shù)以及智能技術(shù)于一體的綜合技術(shù)。用MATLAB做車牌識(shí)別比用其他工具有許多優(yōu)勢(shì),因?yàn)镸ATLAB在圖像的灰度化、二值化、濾波等方面都有很大優(yōu)勢(shì),所以,本次實(shí)驗(yàn)我們利用MATLAB的這些優(yōu)點(diǎn)來對(duì)車牌進(jìn)行識(shí)別?!娟P(guān)鍵詞】BP神經(jīng)網(wǎng)絡(luò);圖像識(shí)別;字符識(shí)別;特征提取;車牌;Matlab 一 課題研究背景(一) 圖像識(shí)別的提出及應(yīng)用隨著信息化時(shí)代的不斷發(fā)展,人們?cè)絹碓蕉嗟厥褂眯畔⒒氖侄蝸斫鉀Q各種問題辦公自動(dòng)化、先進(jìn)制造業(yè)、電子商務(wù)等利用計(jì)算機(jī)技術(shù)而產(chǎn)生的新興行業(yè)正不斷靠近我們的生活。在信息社會(huì)中,我們每天都接觸大量的數(shù)據(jù)工作數(shù)據(jù)、個(gè)人數(shù)據(jù)、無意間獲得的數(shù)據(jù)等在這些數(shù)據(jù)中,有些數(shù)據(jù)需

3、要我們?nèi)斯ぬ幚恚行﹦t可以利用計(jì)算機(jī)快速準(zhǔn)確的完成字符識(shí)別就是其中的一個(gè)范疇。字符識(shí)別是一種圖像識(shí)別技術(shù),他的輸入是一張帶有某種字符的圖片,而輸出則是計(jì)算機(jī)中對(duì)于圖片中字符的反應(yīng)結(jié)果。所以,可以廣泛的應(yīng)用于各種領(lǐng)域:如,車牌檢測(cè)、手寫識(shí)別、自動(dòng)閱讀器、機(jī)器視覺在生活生產(chǎn)的各個(gè)方面都起到了非常重要的作用。(二)圖像識(shí)別技術(shù)的發(fā)展趨勢(shì)雖然圖像識(shí)別技術(shù)還不是非常成熟,但現(xiàn)其已經(jīng)有了很多可喜的成果,比如圖像模式識(shí)別,圖像文字識(shí)別。并且其還在飛速的發(fā)展著,圖像識(shí)別的應(yīng)用正朝著不同的領(lǐng)域滲透著,像計(jì)算機(jī)圖像生成,圖像傳輸與圖像通信,高清晰度電視,機(jī)器人視覺及圖像測(cè)量,辦公室自動(dòng)化,像跟蹤及光學(xué)制導(dǎo),醫(yī)用

4、圖像處理與材料分析中的圖像分析系統(tǒng),遙感圖像處理和空間探測(cè),圖像變形技術(shù)等等。從所列舉的圖像技術(shù)的多方面應(yīng)用及其理論基礎(chǔ)可以看出,它們無一不涉及高科技的前沿課題,充分說明了圖像技術(shù)是前沿性與基礎(chǔ)性的有機(jī)統(tǒng)一??梢灶A(yù)計(jì)21世紀(jì),圖像技術(shù)將經(jīng)歷一個(gè)飛躍發(fā)展的成熟階段,為深入人民生活創(chuàng)造新的文化環(huán)境,成為提高生產(chǎn)的自動(dòng)化、智能化水平的基礎(chǔ)科學(xué)之一。圖像技術(shù)的基礎(chǔ)性研究,特別是結(jié)合人工智能與視覺處理的新算法,從更高水平提取圖像信息的豐富內(nèi)涵,成為人類運(yùn)算量最大、直觀性最強(qiáng),與現(xiàn)實(shí)世界直接聯(lián)系的視覺和“形象思維”這一智能的模擬和復(fù)現(xiàn),是一個(gè)很難而重要的任務(wù)?!皥D像技術(shù)”這一上世紀(jì)后期誕生的高科技之花,其

5、前途是不可限量的。隨著21世紀(jì)經(jīng)濟(jì)全球化和信息時(shí)代的發(fā)展,作為信息來源的自動(dòng)檢測(cè)、圖像識(shí)別技術(shù)越來越受到人們的重視。近年來計(jì)算機(jī)的飛速發(fā)展和數(shù)字圖像處理技術(shù)的日趨成熟,為傳統(tǒng)的交通管理帶來了巨大轉(zhuǎn)變。圖像處理技術(shù)發(fā)展相當(dāng)快,而其中對(duì)汽車牌照等相關(guān)信息的自動(dòng)采集和管理對(duì)于交通車輛管理、園區(qū)車輛管理、停車場(chǎng)管理、交警稽查等方面有著十分重要的意義,成為信息處理技術(shù)的一項(xiàng)重要研究課題。汽車牌照自動(dòng)識(shí)別系統(tǒng)就是在這樣的背景與目的下進(jìn)行研究開發(fā)的。車輛牌照識(shí)別(License Plate Recognition,LPR)技術(shù)作為交通管理自動(dòng)化的重要手段之一,其任務(wù)是分析、處理汽車監(jiān)控圖像,自動(dòng)識(shí)別汽車牌照

6、號(hào)碼,并進(jìn)行相關(guān)智能化數(shù)據(jù)庫管理。(三)圖像識(shí)別的機(jī)理圖像識(shí)別是人工智能的一個(gè)重要領(lǐng)域。為了編制模擬人類圖像識(shí)別活動(dòng)的計(jì)算機(jī)程序,人們提出了不同的圖像識(shí)別模型。例如模板匹配模型。這種模型認(rèn)為,識(shí)別某個(gè)圖像,必須在過去的經(jīng)驗(yàn)中有這個(gè)圖像的記憶模式,又叫模板。當(dāng)前的刺激如果能與大腦中的模板相匹配,這個(gè)圖像也就被識(shí)別了。例如有一個(gè)字母A,如果在腦中有個(gè)A模板,字母A的大小、方位、形狀都與這個(gè)A模板完全一致,字母A就被識(shí)別了。這個(gè)模型簡單明了,也容易得到實(shí)際應(yīng)用。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識(shí)別,而事實(shí)上人不僅能識(shí)別與腦中的模板完全一致的圖像,也能識(shí)別與模板不完全一致的圖像。例如

7、,人們不僅能識(shí)別某一個(gè)具體的字母A,也能識(shí)別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時(shí),人能識(shí)別的圖像是大量的,如果所識(shí)別的每一個(gè)圖像在腦中都有一個(gè)相應(yīng)的模板,也是不可能的。為了解決模板匹配模型存在的問題,格式塔心理學(xué)家又提出了一個(gè)原型匹配模型。這種模型認(rèn)為,在長時(shí)記憶中存儲(chǔ)的并不是所要識(shí)別的無數(shù)個(gè)模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗(yàn)所要識(shí)別的圖像。如果能找到一個(gè)相似的原型,這個(gè)圖像也就被識(shí)別了。這種模型從神經(jīng)上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對(duì)一些不規(guī)則的,但某些方面與原型相似的圖像的識(shí)別。但是,這種模

8、型沒有說明人是怎樣對(duì)相似的“刺激”進(jìn)行辨別和加工的,它也難以在計(jì)算機(jī)程序中得到實(shí)現(xiàn)。因此又有人提出了一個(gè)更復(fù)雜的模型,即“泛魔”識(shí)別模型。所謂泛魔,即這個(gè)模型把圖像識(shí)別過程分為不同的層次,每一層次都有承擔(dān)不同職責(zé)的特征分析機(jī)制稱作一種小魔鬼,由于有許許多多這樣的機(jī)制在起作用,因此叫做“泛魔”識(shí)別模型。這一模型的特點(diǎn)在于它的層次的劃分。自20世紀(jì)60年代初期出現(xiàn)第一代產(chǎn)品開始,經(jīng)過30多年的不斷發(fā)展改進(jìn),字符識(shí)別技術(shù)的研究已經(jīng)取得了令人矚目的成果。目前印刷體的識(shí)別技術(shù)已經(jīng)達(dá)到較高水平。識(shí)別范圍也從原來指定的印刷體數(shù)字、英文字母和部分符號(hào),發(fā)展成為可以自動(dòng)進(jìn)行版面分析、表格識(shí)別,實(shí)現(xiàn)混合文字、多字

9、體、多字號(hào)、橫豎混排識(shí)別的強(qiáng)大的計(jì)算機(jī)信息快速錄入工具。對(duì)印刷體漢字的識(shí)別率達(dá)到98以上,即使對(duì)印刷質(zhì)量較差的文字其識(shí)別率也達(dá)到95以上。(四)本文的研究內(nèi)容本文將以車牌作為研究對(duì)象,從數(shù)字、字母、漢字開始逐步提高識(shí)別的范圍,針對(duì)圖片中的字符提出一套切實(shí)可行的識(shí)別算法,并且在試驗(yàn)中不斷改進(jìn)。在開發(fā)期間,以功能強(qiáng)大的Matlab作為編程平臺(tái),利用一些行之有效的技術(shù)提高識(shí)別算法的性能,從而完成相應(yīng)的識(shí)別軟件。二 算法分析與設(shè)計(jì) (一)特征分析中國汽車牌照中使用的字符集包括59個(gè)漢字、25個(gè)大寫英文字母(字母不包含I)和10個(gè)阿拉伯?dāng)?shù)(0-9),三種類型共94個(gè),且都是印刷體,結(jié)構(gòu)固定、筆畫規(guī)范。牌

10、照在圖像中占有的高度從20個(gè)像素到50個(gè)像素不等。對(duì)于國內(nèi)牌照來說,一般的車輛正面牌照中水平排列著7個(gè)字符,其標(biāo)準(zhǔn)車牌樣式:XlX2:X3X4X5X6X7;X1是各省,直轄市的簡稱:如“蘇” 、“桂”,或者特種車輛類型如“警”;全角X2是英文字母,表示各省的不同地區(qū);X3從是英文字母或阿拉伯?dāng)?shù)字; ; X3X4X5X6X7均是阿拉伯?dāng)?shù)字。 (二)技術(shù)路線 1 原理分析 由于車輛牌照是機(jī)動(dòng)車唯一的管理標(biāo)識(shí)符號(hào),在交通管理中具有不可替代的作用,因此車輛牌照識(shí)別系統(tǒng)應(yīng)具有很高的識(shí)別正確率,對(duì)環(huán)境光照條件、拍攝位置和車輛行駛速度等因素的影響應(yīng)有較大的容閾,并且要求滿足實(shí)時(shí)性要求。區(qū)域搜索與分割字符分割

11、歸一化字符特征提取單字識(shí)別圖像輸入預(yù)處理圖2-1 牌照識(shí)別系統(tǒng)原理圖該系統(tǒng)是計(jì)算機(jī)圖像處理與字符識(shí)別技術(shù)在智能化交通管理系統(tǒng)中的應(yīng)用,它主要由牌照?qǐng)D像的采集和預(yù)處理、牌照區(qū)域的定位和提取、牌照字符的分割和識(shí)別等幾個(gè)部分組成,如圖1所示。其基本工作過程如下:(1)當(dāng)行駛的車輛經(jīng)過時(shí),觸發(fā)埋設(shè)在固定位置的傳感器,系統(tǒng)被喚醒處于工作狀態(tài);一旦連接攝像頭光快門的光電傳感器被觸發(fā),設(shè)置在車輛前方、后方和側(cè)面的相機(jī)同時(shí)拍攝下車輛圖像;(2)由攝像機(jī)或CCD攝像頭拍攝的含有車輛牌照的圖像通視頻卡輸入計(jì)算機(jī)進(jìn)行預(yù)處理,圖像預(yù)處理包括圖像轉(zhuǎn)換、圖像增強(qiáng)、濾波和水平矯正等;(3)由檢索模塊進(jìn)行牌照搜索與檢測(cè),定位

12、并分割出包含牌照字符號(hào)碼的矩形區(qū)域;(4)對(duì)牌照字符進(jìn)行二值化并分割出單個(gè)字符,經(jīng)歸一化后輸入字符識(shí)別系統(tǒng)進(jìn)行識(shí)別。2 總體設(shè)計(jì)方案車輛牌照識(shí)別整個(gè)系統(tǒng)主要是由車牌定位和字符識(shí)別兩部分組成,其中車牌定位又可以分為圖像預(yù)處理及邊緣提取模塊和牌照的定位及分割模塊;字符識(shí)別可以分為字符分割與特征提取和單個(gè)字符識(shí)別兩個(gè)模塊。為了用于牌照的分割和牌照字符的識(shí)別,原始圖像應(yīng)具有適當(dāng)?shù)牧炼龋^大的對(duì)比度和清晰可辯的牌照?qǐng)D像。但由于該系統(tǒng)的攝像部分工作于開放的戶外環(huán)境,加之車輛牌照的整潔度、自然光照條件、拍攝時(shí)攝像機(jī)與牌照的距離和角度以及車輛行駛速度等因素的影響,牌照?qǐng)D像可能出現(xiàn)模糊、歪斜和缺損等嚴(yán)重缺陷,因

13、此需要對(duì)原始圖像進(jìn)行識(shí)別前的預(yù)處理。牌照的定位和分割是牌照識(shí)別系統(tǒng)的關(guān)鍵技術(shù)之一,其主要目的是在經(jīng)圖像預(yù)處理后的原始灰度圖像中確定牌照的具體位置,并將包含牌照字符的一塊子圖像從整個(gè)圖像中分割出來,供字符識(shí)別子系統(tǒng)識(shí)別之用,分割的準(zhǔn)確與否直接關(guān)系到整個(gè)牌照字符識(shí)別系統(tǒng)的識(shí)別率。由于拍攝時(shí)的光照條件、牌照的整潔程度的影響,和攝像機(jī)的焦距調(diào)整、鏡頭的光學(xué)畸變所產(chǎn)生的噪聲都會(huì)不同程度地造成牌照字符的邊界模糊、細(xì)節(jié)不清、筆劃斷開或粗細(xì)不均,加上牌照上的污斑等缺陷,致使字符提取困難,進(jìn)而影響字符識(shí)別的準(zhǔn)確性。因此,需要對(duì)字符在識(shí)別之前再進(jìn)行一次針對(duì)性的處理。車牌識(shí)別的最終目的就是對(duì)車牌上的文字進(jìn)行識(shí)別。主

14、要應(yīng)用的為模板匹配方法。因?yàn)橄到y(tǒng)運(yùn)行的過程中,主要進(jìn)行的都是圖像處理,在這個(gè)過程中要進(jìn)行大量的數(shù)據(jù)處理,所以處理器和內(nèi)存要求比較高,CPU要求主頻在600HZ及以上,內(nèi)存在128MB及以上。系統(tǒng)可以運(yùn)行于Windows98、Windows2000或者Windows XP操作系統(tǒng)下,程序調(diào)試時(shí)使用matlab。三 具體技術(shù)路線(1)圖像預(yù)處理及邊緣提取在車牌自動(dòng)識(shí)別系統(tǒng)中,車輛圖像是通過圖像采集卡將運(yùn)動(dòng)的車輛圖像抓拍下來,并以位圖的格式存放到系統(tǒng)內(nèi)存中,這時(shí)的車輛數(shù)字圖像雖然沒有被人為損傷過,但在實(shí)際道路上行駛的車輛常會(huì)因?yàn)楦鞣N各樣的原因使得所拍攝的車輛圖像效果不理想,如外界光線對(duì)車牌的不均勻反

15、射、極強(qiáng)陽光形成的車牌處陰影、攝像機(jī)快門值設(shè)置過大而引起的車輛圖像拖影、攝像頭聚焦或后背焦沒有調(diào)整到位而形成的車輛圖像不清晰、由于視頻傳輸線而引起的圖像質(zhì)量下降、所拍攝圖像中存在的噪聲干擾、所安裝的車牌不規(guī)范或車輛行駛變形等,這些都給車牌的模糊識(shí)別增加了難度。圖像預(yù)處理技術(shù)可最大限度提高車牌正確識(shí)別率,這些圖像預(yù)處理包括圖像灰度化、平滑、傾斜校正、灰度修正等。 輸入車牌圖像灰度校正平滑處理提取邊緣 圖3-1 預(yù)處理及邊緣提取流程圖 1、圖像的采集與轉(zhuǎn)換考慮到現(xiàn)有牌照的字符與背景的顏色搭配一般有藍(lán)底白字、黃底黑字、白底紅字、綠底白字和黑底白字等幾種,利用不同的色彩通道就可以將區(qū)域與背景明顯地區(qū)分

16、出來,例如,對(duì)藍(lán)底白字這種最常見的牌照,采用藍(lán)色B有多余的空格。 通道時(shí)牌照區(qū)域?yàn)橐涣恋木匦?,而牌照字符在區(qū)域中并不呈現(xiàn)。因?yàn)樗{(lán)色(255,0,0)與白色(255,255,255)在通道中并無區(qū)分,而在G、R 通道或是灰度圖像中并無此便利。同理對(duì)白底黑字的牌照可用R 通道,綠底白字的牌照可以用G 通道就可以明顯呈現(xiàn)出牌照區(qū)域的位置,便于后續(xù)處理。原圖、灰度圖及其直方圖見圖2與圖3。對(duì)于將彩色圖像轉(zhuǎn)換成灰度圖像時(shí),圖像灰度值可由下面的公式計(jì)算: (3-1) (3-2) 圖 3-2 原圖和它的灰度圖以及灰度直方圖2、邊緣提取邊緣是指圖像局部亮度變化顯著的部分,是圖像風(fēng)、紋理特征提取和形狀特征提取等

17、圖像分析的重要基礎(chǔ)。所以在此我們要對(duì)圖像進(jìn)行邊緣檢測(cè)。圖象增強(qiáng)處理對(duì)圖象牌照的可辨認(rèn)度的改善和簡化后續(xù)的牌照字符定位和分割的難度都是很有必要的。增強(qiáng)圖象對(duì)比度度的方法有:灰度線性變換、圖象平滑處理等。(1)灰度校正由于牌照?qǐng)D像在拍攝時(shí)受到種種條件的限制和干擾,圖像的灰度值往往與實(shí)際景物不完全匹配,這將直接影響到圖像的后續(xù)處理。如果造成這種影響的原因主要是由于被攝物體的遠(yuǎn)近不同,使得圖像中央?yún)^(qū)域和邊緣區(qū)域的灰度失衡,或是由于攝像頭在掃描時(shí)各點(diǎn)的靈敏度有較大的差異而產(chǎn)生圖像灰度失真,或是由于曝光不足而使得圖像的灰度變化范圍很窄。這時(shí)就可以采用灰度校正的方法來處理,增強(qiáng)灰度的變化范圍、豐富灰度層次,

18、以達(dá)到增強(qiáng)圖像的對(duì)比度和分辨率。我們發(fā)現(xiàn)車輛牌照?qǐng)D像的灰度取值范圍大多局限在r=(50,200)之間,而且總體上灰度偏低,圖象較暗。根據(jù)圖象處理系統(tǒng)的條件,最好將灰度范圍展開到s=(0,255)之間,為此我們對(duì)灰度值作如下的變換: s = T(r) r=r min,,r max (3-3) 使得SSmin, Smax,其中,T為線性變換,灰度線性變換 (3-4) 圖3-3 線性圖(3)若 r(50,200)s(0,255) 則: (3-5) (4) 圖3-4 灰度增強(qiáng)后的圖像(2)平滑處理 對(duì)于受噪聲干擾嚴(yán)重的圖像,由于噪聲點(diǎn)多在頻域中映射為高頻分量,因此可以在通過低通濾波器來濾除噪聲,但實(shí)際

19、中為了簡化算法,也可以直接在空域中用求鄰域平均值的方法來削弱噪聲的影響,這種方法稱為圖象平滑處理。例如,某一象素點(diǎn)的鄰域S有兩種表示方法:8鄰域和4鄰域分別對(duì)應(yīng)的鄰域平均值為 (3-6) 23i,j144325i,j1678圖 3-5 鄰域及其鄰域模板 (5)其中,M 為鄰域中除中心象素點(diǎn)f(i,j) 之外包括的其它象素總數(shù),對(duì)于4鄰域M=4,8 鄰域M=8。然而,鄰域平均值的平滑處理會(huì)使得圖像灰度急劇變化的地方,尤其是物體邊緣區(qū)域和字符輪廓等部分產(chǎn)生模糊作用。為了克服這種平均化引起的圖像模糊現(xiàn)象,我們給中心點(diǎn)象素值與其鄰域平均值的差值設(shè)置一固定的閾值,只有大于該閾值的點(diǎn)才能替換為鄰域平均值,

20、而差值不大于閾值時(shí),仍保留原來的值,從而減少由于平均化引起的圖像模糊。 圖3-6 平滑處理后的圖像圖像中車輛牌照是具有比較顯著特征的一塊圖像區(qū)域,這此特征表現(xiàn)在:近似水平的矩形區(qū)域;其中字符串都是按水平方向排列的;在整體圖像中的位置較為固定。正是由于牌照?qǐng)D像的這些特點(diǎn),再經(jīng)過適當(dāng)?shù)膱D象變換,它在整幅中可以明顯地呈現(xiàn)出其邊緣。邊緣提取是較經(jīng)典的算法,此處邊緣的提取采用的是Roberts算子。 圖3-7未濾波直接提取出的邊緣,經(jīng)灰度校正后提取的邊緣以及經(jīng)平滑處理后提取的邊緣 對(duì)比以上幾幅圖片,圖8的邊緣已經(jīng)模糊掉了。圖7中包含的噪聲太多,圖9未經(jīng)濾波直接提取出的邊緣圖像最清晰,所包含的有用信息最多

21、。分析這種情況產(chǎn)生的原因,歸納起來主要有以下方面: 1、原始圖像清晰度比較高,從而簡化了預(yù)處理 2、圖像的平滑處理會(huì)使圖像的邊緣信息受到損失,圖像變得模糊 3、圖像的銳化可以增強(qiáng)圖像中物體的邊緣輪廓,但同時(shí)也使一些噪聲得到了增強(qiáng)綜上所述,結(jié)合MATLAB實(shí)驗(yàn)過程,得出不是每一種圖像處理之初都適合濾波和邊界增強(qiáng)。本次汽車車牌的識(shí)別,為了保存更多的有用信息,經(jīng)過多次比較,選擇圖9作為后期處理的依據(jù)。 2 車牌的定位與分割 車牌定位對(duì)車牌識(shí)別系統(tǒng)來說至關(guān)重要,目前已經(jīng)提出了很多車牌定位的方法,這些方法都具有一個(gè)共同的出發(fā)點(diǎn),即通過牌照區(qū)域的特征來判斷牌照。根據(jù)不同的實(shí)現(xiàn)方法,大致可以把現(xiàn)有的定位方法

22、分為直接法和間接法兩類。 1)直接法。直接分析圖像的特征,如基于線模板的二值化圖像中的角檢測(cè)算法,該算法利用車牌的邊框角點(diǎn),檢測(cè)車牌的四個(gè)角點(diǎn),并以此來定位車牌?;谥本€邊緣識(shí)別的圖像區(qū)域定位算法,并且利用該算法定位車牌的邊框線,以此定位車牌。利用車牌的尺寸、字符間距、字符特征等紋理特征定位車牌。利用車牌部分垂直高頻豐富的特點(diǎn)先利用小波提取圖像的垂直高頻信息,然后利用數(shù)學(xué)形態(tài)學(xué)方法對(duì)小波分解后的細(xì)節(jié)圖像進(jìn)行一系列的形態(tài)運(yùn)算,進(jìn)一步消除無用的信息和噪聲,以定位車牌。 2)間接法。主要是指利用神經(jīng)網(wǎng)絡(luò)法或者遺傳算法定位車牌的方法。利用神經(jīng)網(wǎng)絡(luò)和遺傳算法等柔性方法進(jìn)行計(jì)算是當(dāng)前研究熱點(diǎn)之一。利用遺傳

23、算法對(duì)圖像進(jìn)行優(yōu)化搜索,結(jié)合區(qū)域特征矢量構(gòu)造的適應(yīng)度函數(shù),最終尋找到車牌的牌照區(qū)域的最佳定位參量。目前較為常用的方法是先提取車輛圖像的邊緣,然后結(jié)合車輛牌照的幾何特征,分析二值化邊緣圖像像素在水平和垂直方向的投影,判斷出車輛牌照的位置。 對(duì)圖像進(jìn)行腐蝕去除雜質(zhì)通過計(jì)算尋找X和Y方向車牌的區(qū)域完成車牌定位對(duì)分割出的車牌做進(jìn)一步處理 圖3-8 牌照定位于分割流程圖(1)牌照區(qū)域的定位牌照?qǐng)D像經(jīng)過了以上的處理后,牌照區(qū)域已經(jīng)十分明顯,而且其邊緣得到了勾勒和加強(qiáng)。此時(shí)可進(jìn)一步確定牌照在整幅圖像中的準(zhǔn)確位置。這里選用的是數(shù)學(xué)形態(tài)學(xué)的方法,其基本思想是用具有一定形態(tài)的機(jī)構(gòu)元素去量度和提取圖像中的對(duì)應(yīng)形狀以

24、達(dá)到對(duì)圖像分析和識(shí)別的目的。數(shù)學(xué)形態(tài)學(xué)的應(yīng)用可以簡化圖像數(shù)據(jù),保持它們基本的形態(tài)特征,并除去不相干的結(jié)構(gòu)。在本程序中用到了膨脹和閉合這兩個(gè)基本運(yùn)算,最后還用了bwareaopen來去除對(duì)象中不相干的小對(duì)象。 圖 3-9 腐蝕后圖像,平滑圖像的輪廓以及從對(duì)象中移除小對(duì)象后圖像(2)牌照區(qū)域的分割對(duì)車牌的分割可以有很多種方法,本程序是利用車牌的彩色信息的彩色分割方法。根據(jù)車牌底色等有關(guān)的先驗(yàn)知識(shí),采用彩色像素點(diǎn)統(tǒng)計(jì)的方法分割出合理的車牌區(qū)域,確定車牌底色藍(lán)色RGB對(duì)應(yīng)的各自灰度范圍,然后行方向統(tǒng)計(jì)在此顏色范圍內(nèi)的像素點(diǎn)數(shù)量,設(shè)定合理的閾值,確定車牌在行方向的合理區(qū)域。然后,在分割出的行區(qū)域內(nèi),統(tǒng)計(jì)

25、列方向藍(lán)色像素點(diǎn)的數(shù)量,最終確定完整的車牌區(qū)域。圖 3-10 行方向區(qū)域和最終定位出來的車牌(3)車牌進(jìn)一步處理經(jīng)過上述方法分割出來的車牌圖像中存在目標(biāo)物體、背景還有噪聲,要想從圖像中直接提取出目標(biāo)物體,最常用的方法就是設(shè)定一個(gè)閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群,即對(duì)圖像二值化。均值濾波是典型的線性濾波算法,它是指在圖像上對(duì)目標(biāo)像素給一個(gè)模板,該模板包括了其周圍的臨近像素。再用模板中的全體像素的平均值來代替原來像素值。 圖 3-11 裁剪出來的車牌的進(jìn)一步處理過程3 字符的分割與歸一化m,n=size(d),逐排檢查有沒有白色像素點(diǎn),設(shè)置1=j0。在網(wǎng)絡(luò)訓(xùn)練階段

26、用準(zhǔn)備好的樣本數(shù)據(jù)依次通過輸入層、隱層和輸出層。比較輸出結(jié)果和期望值,若沒有達(dá)到要求的誤差程度或者訓(xùn)練次數(shù),即經(jīng)過輸出層、隱層和輸入層,來調(diào)節(jié)權(quán)值,以便使網(wǎng)絡(luò)成為一定適應(yīng)能力的模型。 用matlab 神經(jīng)網(wǎng)絡(luò)工具箱,用BP神經(jīng)網(wǎng)絡(luò)生成網(wǎng)絡(luò)函數(shù),部分程序如下:net=newff(pr,25 1,logsig purelin, traingdx, learngdm);net.trainParam.epochs=3000;net.trainParam.goal=0.001;net.trainParam.show=10;net.trainParam.lr=0.05;net=train(net,p,t)

27、即創(chuàng)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。其中權(quán)值函數(shù)為“l(fā)ogsig”,學(xué)習(xí)函數(shù)為:“purelin”.運(yùn)行后,可在matlab上得到:LOADING.ans =LOAD OK.TRAINGDX, Epoch 0/3000, MSE 18.0267/0.001, Gradient 19.9528/1e-006TRAINGDX, Epoch 10/3000, MSE 6.55309/0.001, Gradient 1.92177/1e-006TRAINGDX, Epoch 20/3000, MSE 5.08303/0.001, Gradient 1.59205/1e-006TRAINGDX, Epoch 30/3

28、000, MSE 3.32551/0.001, Gradient 1.35881/1e-006TRAINGDX, Epoch 40/3000, MSE 1.70977/0.001, Gradient 0.830963/1e-006TRAINGDX, Epoch 50/3000, MSE 0.808399/0.001, Gradient 0.588341/1e-006TRAINGDX, Epoch 60/3000, MSE 0.255181/0.001, Gradient 0.301763/1e-006TRAINGDX, Epoch 70/3000, MSE 0.0629529/0.001, G

29、radient 0.146848/1e-006TRAINGDX, Epoch 80/3000, MSE 0.0175261/0.001, Gradient 0.0906425/1e-006TRAINGDX, Epoch 90/3000, MSE 0.0146519/0.001, Gradient 0.364925/1e-006TRAINGDX, Epoch 100/3000, MSE 0.0122441/0.001, Gradient 0.238192/1e-006TRAINGDX, Epoch 110/3000, MSE 0.010538/0.001, Gradient 0.158065/1

30、e-006TRAINGDX, Epoch 120/3000, MSE 0.00900871/0.001, Gradient 0.0498804/1e-006TRAINGDX, Epoch 130/3000, MSE 0.00778895/0.001, Gradient 0.0471643/1e-006TRAINGDX, Epoch 140/3000, MSE 0.00642256/0.001, Gradient 0.0267898/1e-006TRAINGDX, Epoch 150/3000, MSE 0.00506427/0.001, Gradient 0.0207391/1e-006TRA

31、INGDX, Epoch 160/3000, MSE 0.00378743/0.001, Gradient 0.0155848/1e-006TRAINGDX, Epoch 170/3000, MSE 0.00259925/0.001, Gradient 0.012315/1e-006TRAINGDX, Epoch 180/3000, MSE 0.00149217/0.001, Gradient 0.0137463/1e-006TRAINGDX, Epoch 190/3000, MSE 0.00134022/0.001, Gradient 0.0518653/1e-006TRAINGDX, Ep

32、och 200/3000, MSE 0.00132563/0.001, Gradient 0.0549096/1e-006TRAINGDX, Epoch 210/3000, MSE 0.00125472/0.001, Gradient 0.0293791/1e-006TRAINGDX, Epoch 220/3000, MSE 0.00120414/0.001, Gradient 0.0082813/1e-006TRAINGDX, Epoch 230/3000, MSE 0.00115466/0.001, Gradient 0.00760885/1e-006TRAINGDX, Epoch 240

33、/3000, MSE 0.00108049/0.001, Gradient 0.00798138/1e-006TRAINGDX, Epoch 248/3000, MSE 0.000995008/0.001, Gradient 0.00708329/1e-006TRAINGDX, Performance goal met.即神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程。誤差曲線即測(cè)試樣例經(jīng)訓(xùn)練后的實(shí)際輸出結(jié)果和期望輸出的差值情況。其變化如圖21,圖22。 圖 3-15 訓(xùn)練過程中誤差曲線變化 圖 3-16 訓(xùn)練結(jié)束時(shí)誤差曲線 可見,當(dāng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成后,其樣本得出的輸出結(jié)果和期望輸出結(jié)果完全相同,即誤差為零。下面就圖23所

34、示測(cè)試樣例進(jìn)行測(cè)試。 圖 3 -17 測(cè)試樣例識(shí)別結(jié)果如下:FileName:D:testa = 3答案正確。其識(shí)別圖形如圖24。 圖 3-18 識(shí)別結(jié)果圖形訓(xùn)練后神經(jīng)網(wǎng)絡(luò)以及權(quán)重結(jié)果信息為:net = Neural Network object: architecture: numInputs: 1 numLayers: 2 biasConnect: 1; 1 inputConnect: 1; 0 layerConnect: 0 0; 1 0 outputConnect: 0 1 targetConnect: 0 1 numOutputs: 1 (read-only) numTargets:

35、 1 (read-only) numInputDelays: 0 (read-only) numLayerDelays: 0 (read-only) subobject structures: inputs: 1x1 cell of inputs layers: 2x1 cell of layers outputs: 1x2 cell containing 1 output targets: 1x2 cell containing 1 target biases: 2x1 cell containing 2 biases inputWeights: 2x1 cell containing 1

36、input weight layerWeights: 2x2 cell containing 1 layer weight functions: adaptFcn: trains initFcn: initlay performFcn: mse trainFcn: traingdx parameters: adaptParam: .passes initParam: (none) performParam: (none) trainParam: .epochs, .goal, .lr, .lr_dec, .lr_inc, .max_fail, .max_perf_inc, .mc, .min_

37、grad, .show, .time weight and bias values: IW: 2x1 cell containing 1 input weight matrix LW: 2x2 cell containing 1 layer weight matrix b: 2x1 cell containing 2 bias vectors other: userdata: (user stuff) 由此可見,程序可滿足期望要求。當(dāng)然,也經(jīng)常有識(shí)別錯(cuò)誤的情況發(fā)生。對(duì)于識(shí)別錯(cuò)誤情況的分析可知,主要原因:一是牌照自身的污漬等影響了圖像的質(zhì)量;二是牌照字符的分割失敗導(dǎo)致的識(shí)別錯(cuò)誤;再就是部分字符的

38、形狀相似性,比如,B 和8;A 和4 等字符識(shí)別結(jié)果可能發(fā)生混淆的情況。總之,盡管目前牌照字符的識(shí)別率還不理想,但是只要在分割出的字符的大小、位置的歸一化,以及嘗試提取分類識(shí)別能力更好的特征值和設(shè)計(jì)分類器等環(huán)節(jié)上再完善,進(jìn)一步提高識(shí)別率是完全可行的。四 總結(jié)(一)課題小結(jié) 在車輛牌照字符識(shí)別系統(tǒng)的研究領(lǐng)域,近幾年出現(xiàn)了許多切實(shí)可行的識(shí)別技術(shù)和方法,從這些新技術(shù)和方法中可以看到兩個(gè)明顯的趨勢(shì):一是單一的預(yù)處理和識(shí)別技術(shù)都無法達(dá)到理想的結(jié)果,多種方法的有機(jī)結(jié)合才能使系統(tǒng)有效識(shí)別能力提高。在此次實(shí)驗(yàn)中,也汲取了以上一些算法的思想,結(jié)合實(shí)際,反復(fù)比較,綜合分析;二是在有效性和實(shí)用的原則下,結(jié)合神經(jīng)網(wǎng)絡(luò)和人工智能的新技術(shù)的應(yīng)用是研究的一個(gè)方向。 根據(jù)車牌特點(diǎn),一般采用的車牌定位算法有:1.邊緣檢測(cè)定位算法;2.利用哈夫變換進(jìn)行車牌定位;3.色彩分割提取車牌等。這里我采用的是邊緣檢測(cè)的方法實(shí)現(xiàn)定位的。字符

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論