車輛牌照圖像識別算法研究與實(shí)現(xiàn)_第1頁
車輛牌照圖像識別算法研究與實(shí)現(xiàn)_第2頁
車輛牌照圖像識別算法研究與實(shí)現(xiàn)_第3頁
車輛牌照圖像識別算法研究與實(shí)現(xiàn)_第4頁
車輛牌照圖像識別算法研究與實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Q260046902專業(yè)做論文西南科技大學(xué)畢業(yè)設(shè)計(jì)(論文)題目名稱:車輛牌照圖像識別算法研究與實(shí)現(xiàn)西南科技大學(xué)本科生畢業(yè)論文PAGEIV車輛牌照圖像識別算法研究與實(shí)現(xiàn)摘要:近年來隨著國民經(jīng)濟(jì)的蓬勃發(fā)展,國內(nèi)高速公路、城市道路、停車場建設(shè)越來越多,對交通控制、安全管理的要求也日益提高。因此,汽車牌照識別技術(shù)在公共安全及交通管理中具有特別重要的實(shí)際應(yīng)用意義。本文對車牌識別系統(tǒng)中的車牌定位、字符分割和字符識別進(jìn)行了初步研究。對車牌定位,本文采用投影法對車牌進(jìn)行定位;在字符分割方面,本文使用閾值規(guī)則進(jìn)行字符分割;針對車牌圖像中數(shù)字字符識別的問題,本文采用了基于BP神經(jīng)網(wǎng)絡(luò)的識別方法。在學(xué)習(xí)并掌握了數(shù)字圖像處理和模式識別的一些基本原理后,使用VC++6.0軟件利用以上原理針對車牌識別任務(wù)進(jìn)行編程。實(shí)現(xiàn)了對車牌的定位和車牌中數(shù)字字符的識別。關(guān)鍵詞:車牌定位;字符分割;BP神經(jīng)網(wǎng)絡(luò);車牌識別;VC++ResearchandRealizationofLicensePlateRecognitionAlgorithmAbstract:Inrecentyears,withthevigorousdevelopmentofthenationaleconomy,therearemoreandmoreconstructinthedomesticexpressway,urbanroad,andparkingarea.Therequisitiononthetrafficcontrol,safetymanagementimprovesdaybyday.Therefore,licenseplaterecognitiontechnologyhastheparticularlyimportantpracticalapplicationvalueinthepublicsecurityandthetrafficcontrol.Inthepaper,apreliminaryresearchwasmadeonthelicenselocation,characterssegmentandcharactersrecognitionofthelicenseplaterecognition.Onthelicenselocation,theprojectionwasusedtolocatethelicenseplate;Onthecharacterssegmentation,theliminalrulewasusedtodividethecharacters;Inordertosolvetheproblemofthedigitalcharactersrecognitionintheplate,BPnervenetworkwasusedtorecognizethedigitalcharacters.Afterstudyingandmasteringsomebasicprinciplesofthedigitalimageprocessingandpatternrecognition,thetaskoflicenseplaterecognitionwasprogrammedwithVC++6.0usingaboveprinciples.Thelicenselocationandthedigitalcharactersrecognitioninthelicenseplatewereimplemented.Keywords:licenselocation,characterssegmentation,BPnervenetwork,licenseplaterecognition,VC++目錄第1章緒論 11.1課題研究背景 11.2車輛牌照識別系統(tǒng)原理 11.3車輛牌照識別在國內(nèi)外研究現(xiàn)狀 21.4本文主要工作及內(nèi)容安排 3第2章車輛牌照的定位方法 42.1車輛牌照圖像的預(yù)處理 42.1.1256色位圖灰度化 42.1.2灰度圖像二值化 52.1.3消除背景干擾去除噪聲 62.2車輛牌照的定位方法簡介 62.3系統(tǒng)采用的定位方法 72.3.1車輛牌照的水平定位 72.3.2車輛牌照的垂直定位 72.3.3定位的算法實(shí)現(xiàn) 102.4實(shí)驗(yàn)結(jié)果分析 12第3章車輛牌照的字符分割 133.1車牌預(yù)處理 133.1.1去邊框處理 133.1.2去噪聲處理 133.1.3梯度銳化 153.1.4傾斜調(diào)整 163.2字符分割方法簡介 173.3系統(tǒng)采用的分割方法 193.3.1算法介紹 193.3.2算法的實(shí)現(xiàn) 203.4字符分割實(shí)驗(yàn)結(jié)果 21第4章特征提取與字符識別 224.1字符的特征提取 224.2字符的識別方法簡介 234.3系統(tǒng)采用的識別方法 244.3.1人工神經(jīng)網(wǎng)絡(luò)簡介 244.3.2BP神經(jīng)網(wǎng)絡(luò)識別車牌 254.3.3BP神經(jīng)網(wǎng)絡(luò)識別算法實(shí)現(xiàn) 284.4實(shí)驗(yàn)結(jié)果分析 29總結(jié) 32致謝 33參考文獻(xiàn) 34西南科技大學(xué)本科生畢業(yè)論文PAGE34第1章緒論1.1課題研究背景現(xiàn)代社會已經(jīng)進(jìn)入信息時(shí)代,計(jì)算機(jī)技術(shù)、通信技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,自動化信息處理能力的不斷提高,在人們社會活動和生活的各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,在這種情況下,作為信息來源的自動檢測、圖像識別技術(shù)越來越受到人們的重視。隨著汽車數(shù)量的急劇增加,車牌自動識別(licenseplaterecognition,LPR)技術(shù)日益成為交通管理自動化的重要手段[1]。車牌自動識別技術(shù)是計(jì)算機(jī)視覺、圖像處理技術(shù)與模式識別等技術(shù)的融合,是智能交通系統(tǒng)中一項(xiàng)非常重要的技術(shù)。通過車輛牌照自動識別,就可以對運(yùn)動車輛查詢相關(guān)的數(shù)據(jù)庫,根據(jù)提取的車輛信息,實(shí)現(xiàn)有針對性的車輛檢查,極大的提高工作人員的效率,降低工作強(qiáng)度,同時(shí)也減少了國家財(cái)政收入的流失,減少交通事故的發(fā)生以及加強(qiáng)社會治安。因此對車牌識別技術(shù)研究有巨大的經(jīng)濟(jì)價(jià)值和現(xiàn)實(shí)意義。由于車牌自動識別技術(shù)在智能化交通控制管理中發(fā)揮的重要作用,吸引了各國的科研工作者對其進(jìn)行廣泛的研究,目前已有眾多的算法,有些已應(yīng)用于交叉路口、車庫管理、路口收費(fèi)、高速公路等場合。由于需適應(yīng)各種復(fù)雜背景,加之要識別的車輛種類繁多,顏色變化多端,以及檢測時(shí)要適應(yīng)不同天氣變化導(dǎo)致的不同光照條件,因此,目前的系統(tǒng)都或多或少地存在一些問題。但隨著計(jì)算機(jī)性能的提高和計(jì)算機(jī)視覺理論及技術(shù)的發(fā)展,這種技術(shù)必將日趨成熟。車牌的定位與識別技術(shù),總體來說是圖像處理技術(shù)與車牌本身特點(diǎn)的有機(jī)結(jié)合,當(dāng)然也包括小波分析、神經(jīng)網(wǎng)絡(luò)、數(shù)學(xué)形態(tài)學(xué)、模糊理論等數(shù)學(xué)知識的有效運(yùn)用[2]。本課題是對汽車圖像進(jìn)行分析,從算法角度來研究車牌的定位與識別。1.2車輛牌照識別系統(tǒng)原理一個(gè)典型的車輛牌照識別系統(tǒng)(LPR)是由圖像采集系統(tǒng)和圖像識別系統(tǒng)組成的,如圖1-1[3]。當(dāng)系統(tǒng)發(fā)現(xiàn)有車時(shí),圖像采集系統(tǒng)便開始采集車輛牌照信息,得到的信息是圖像識別系統(tǒng)的輸入。通過識別系統(tǒng)的預(yù)處理,為目標(biāo)搜索提供一個(gè)良好的定位環(huán)境。在預(yù)處理的基礎(chǔ)上把圖像中的車牌從背景中分割出來。對車牌中的字符做字符分割,最后把分割后的字符進(jìn)行識別,便得到了汽車牌照的號碼。整套系統(tǒng)實(shí)際是一種硬件和軟件的集成。在硬件上,它需要集成可控照明燈、鏡頭、圖像采集模塊、數(shù)字信號處理器、存儲器、通信模塊、溫控模塊、單片機(jī)等;在軟件上,它包括車牌定位、車牌字符切割、車牌字符識別等算法。這樣一體化的結(jié)構(gòu)形式能在現(xiàn)實(shí)中降低對環(huán)境的要求。圖1-1車輛牌照識別系統(tǒng)原理框圖1.3車輛牌照識別在國內(nèi)外研究現(xiàn)狀自1988年以來,人們就對車輛牌照識別系統(tǒng)進(jìn)行了廣泛的研究,目前國內(nèi)外已經(jīng)有眾多的算法,一些實(shí)用的LPR技術(shù)也開始用于車流監(jiān)控、出入控制、電子收費(fèi)等場合。然而無論是LPR算法還是LPR產(chǎn)品都存在一定的局限性,都需要適應(yīng)新的要求而不斷完善。如以色列Hi-Tech公司的See/CarSystem系列,它需要多種變形的產(chǎn)品來分別適應(yīng)某一個(gè)國家的車牌;新加坡Optasia公司的VLPRS系列,只適合于新加坡的車牌;See/CarChinese系統(tǒng)可以對中國大陸的車牌進(jìn)行識別,但都存在一定的缺陷,而且不能識別車牌中的漢字。我國在90年代初期開始了車輛牌照識別技術(shù)的研究。但由于以下幾個(gè)原因使我國的車輛牌照識別技術(shù)在研究和應(yīng)用方面都有一定難度,且落后于其它國家:①我國的標(biāo)準(zhǔn)汽車牌照是由漢字、英文字母和阿拉伯?dāng)?shù)字組成,漢字的識別與字母和數(shù)字的識別有很大的不同,從而增加了識別的難度。②國外許多國家汽車牌照的底色和字符顏色通常只有對比度較強(qiáng)的兩種顏色,而我國汽車牌照僅底色就有藍(lán)、黃、黑、白等多種顏色,字符顏色也有黑、紅、白等幾種顏色。③其他國家的汽車牌照格式通常只有一種,而我國則根據(jù)不同車輛、車型、用途,規(guī)定了多種牌照格式。④我國汽車牌照的規(guī)范懸掛位置并不唯一,而且由于環(huán)境、道路或人為因素造成汽車牌照污染的情況比較嚴(yán)重,這都給車牌識別造成了一定的難度。因此,我國車輛牌照識別技術(shù)的提高和廣泛應(yīng)用還需廣大科研工作者和相關(guān)交通部門的共同努力。1.4本文主要工作及內(nèi)容安排本文主要研究車輛牌照識別系統(tǒng)中的數(shù)字識別技術(shù),將數(shù)字圖像處理技術(shù)與模式識別技術(shù)緊密結(jié)合,針對汽車牌照字符識別的特點(diǎn),分析了車牌定位與分割、字符分割、特征提取、BP神經(jīng)網(wǎng)絡(luò)等算法。在車牌定位、字符分割和特征提取的基礎(chǔ)上,詳細(xì)研究了車牌數(shù)字字符的識別。文章在接下來的第二章介紹了車輛牌照的定位方法;第三章介紹了車輛牌照的字符分割算法;第四章介紹了車輛牌照數(shù)字字符的識別。其中車輛牌照數(shù)字字符的識別是本課題的重點(diǎn)。文章在每一步處理后給出了實(shí)驗(yàn)結(jié)果,并給出了最后的識別結(jié)果。第2章車輛牌照的定位方法車輛牌照的定位方法是基于圖像處理的基礎(chǔ)上,對圖像進(jìn)行分析、總結(jié)并經(jīng)過大量的試驗(yàn)所獲得的。定位方法的研究與車牌特征和圖像處理技術(shù)是分不開的。從自然背景中準(zhǔn)確可靠地分割出車牌區(qū)域是提高系統(tǒng)識別率的關(guān)鍵,但是由于車牌圖像攝于背景復(fù)雜且光照不均勻的自然場景,因而會出現(xiàn)顏色失真或低對比度的圖像,這給車輛牌照的定位帶來了很大的困難。為此人們進(jìn)行了大量的研究,并取得了一定的成果。本課題中,根據(jù)車牌的二值圖像在水平和垂直方向的投影特性提出了基于二值化圖像投影法和數(shù)學(xué)形態(tài)學(xué)相結(jié)合的車牌定位算法,該算法具有快速、簡潔實(shí)用和與背景相關(guān)性小的特點(diǎn)。車牌的定位算法分為預(yù)處理、水平定位、垂直定位。其流程圖如圖2-1所示。圖2-1車輛牌照定位原理2.1車輛牌照圖像的預(yù)處理為了使車牌能夠被精確定位,在定位搜索以前,要對車牌圖像進(jìn)行預(yù)處理。為了能夠方便的進(jìn)行后期的數(shù)字圖像處理,需要將彩色圖像轉(zhuǎn)化成256色的灰度圖后進(jìn)行處理,然后對圖像做二值化處理,削弱背景干擾,消除噪聲。經(jīng)過以上的預(yù)處理,就可以對車牌進(jìn)行定位和分割處理。2.1.1256色位圖灰度化由于256色的位圖的調(diào)色板內(nèi)容比較復(fù)雜,使得圖像處理的許多算法都沒有辦法展開,因此有必要對它進(jìn)行灰度處理。所謂灰度圖像就是圖像的每一個(gè)象素的RGB分量的值是相等的。彩色圖像的每個(gè)象素的RGB值是不同的,所以顯示出紅綠藍(lán)等各種顏色?;叶葓D像沒有這些顏色差異,有的只是亮度上的不同。灰度值大的象素比較亮,反之比較暗。圖像灰度化有各種不同的算法,比較直接的一種是給象素的RGB值各自一個(gè)加權(quán)系數(shù),然后求和。經(jīng)常用到的灰度化公式由式(2-1)完成:(2-1)式(2-1)中為灰度值。加權(quán)系數(shù)的取值是建立在人眼的視覺模型之上的,對于人眼較為敏感的綠色取較大的權(quán)值,對人眼較為不敏感的藍(lán)色則取較小的權(quán)值。這樣可以使得到的灰度圖像在視覺上更接近人的主觀感覺。應(yīng)該注意的是最后得到結(jié)果一定要?dú)w一到0~255之內(nèi)。2.1.2灰度圖像二值化在進(jìn)行了灰度化處理以后,圖像中的每個(gè)象素只有一個(gè)值,即象素的灰度值。它的大小決定了象素的亮暗程度。為了更加便利的開展下面的圖像處理操作,還需要對已經(jīng)得到的灰度圖像做一個(gè)二值化處理。圖像的二值化就是把圖像中的象素的灰度值根據(jù)一定的標(biāo)準(zhǔn)分化成兩種顏色。在系統(tǒng)中是根據(jù)象素的灰度值將圖像處理成黑白兩種顏色。圖像的二值化有很多成熟的方法:可以采用閾值分割法,也可以采用給定閾值法。閾值分割法可以分為全局閾值法和局部閾值分割法。所謂局部閾值分割法是將原始圖像劃分成較小的圖像,并對每個(gè)子圖像選取相應(yīng)的閾值。在閾值分割后,相鄰子圖像之間的邊界處可能產(chǎn)生灰度級的不連續(xù),因此需用平滑技術(shù)進(jìn)行排除。局部閾值法常用的方法有灰度差直方圖法、微分直方圖法。全局閾值分割方法在圖像處理中應(yīng)用比較多,它在整幅圖像內(nèi)采用固定的閾值分割圖像。根據(jù)閾值選擇方法的不同,可以分為模態(tài)方法、迭代式閾值選擇等方法。這些方法都是以圖像的灰度直方圖為研究對象來確定閾值的。另外還有類間方差閾值分割法、二維最大熵分割法、模糊閾值分割法、共生矩陣分割法、區(qū)域生長法等等。在本系統(tǒng)中考慮到所要進(jìn)行處理的圖像大多是噪聲比較少的灰度車牌,系統(tǒng)中采用全局閾值分割的方法進(jìn)行處理,初始閾值的確定方法是由式(2-2)完成:(2-2)和分別是最高和最低灰度值。該閾值對不同牌照有一定的適應(yīng)性,能夠保證背景基本被置為0,以突出牌照區(qū)域。經(jīng)過二值化,可以進(jìn)行下一步處理。2.1.3消除背景干擾去除噪聲對二值化后的圖像進(jìn)行相鄰象素灰度值相減,得到新的圖像,左邊緣可以直接賦值,不會影響整體效果??紤]到圖像中的文字是由短的橫豎線組成,而背景噪聲有一大部分是孤立噪聲,所以用模板(1,1,1,1)T對圖像進(jìn)行中值濾波,得到去除大部分干擾的圖像。2.2車輛牌照的定位方法簡介經(jīng)過以上的預(yù)處理,我們就可以對圖像進(jìn)行車牌的定位和分割。為了快速、準(zhǔn)確地定位車牌,目前已有很多學(xué)者提出許多定位算法。其中,眾多算法都是利用了車牌自身異于背景區(qū)域的特征來進(jìn)行車牌定位的。這些特征包括車牌的顏色特征、幾何特征、紋理特征和經(jīng)過處理運(yùn)算后得到的車牌區(qū)域固有的特征(異于背景區(qū)域特征)等。車牌定位的算法基本上可以分為兩大類:第1類是通過一個(gè)步驟將車牌定位出來;第2類是通過兩個(gè)步驟將車牌定位出來[4]。第1類:這類算法的主要特點(diǎn)是通過一個(gè)步驟就可以將車牌區(qū)域定位出來。其主要的算法介紹如下:(1)基于神經(jīng)網(wǎng)絡(luò)的車牌定位方法:該方法首先是用神經(jīng)網(wǎng)絡(luò)對大量的樣本圖像進(jìn)行訓(xùn)練,然后再進(jìn)行圖像預(yù)處理,最后用訓(xùn)練的神經(jīng)網(wǎng)絡(luò)提取真正的車牌區(qū)域。該算法要求把圖像中每一個(gè)像素所提取特征輸入神經(jīng)網(wǎng)絡(luò)來進(jìn)行學(xué)習(xí),計(jì)算量很大,同時(shí)需處理好網(wǎng)絡(luò)局部收斂的問題,且車牌定位時(shí)間長[5]。(2)基于模板匹配的車牌定位方法:該算法主要是設(shè)立一個(gè)滑動窗口,該窗口有若干向量值,利用該窗口在汽車圖像上滑動,并計(jì)算該窗口所覆蓋的那塊車牌圖像的向量值,找出最佳的向量值,認(rèn)為是車牌區(qū)域。(3)直線邊緣檢測:這種方法主要利用Hough變化檢測車牌周圍邊框直線。這種方法的缺點(diǎn)是Hough變換計(jì)算量大,對于邊框不連續(xù)的實(shí)際車牌,需附加大量的運(yùn)算[6]。(4)統(tǒng)計(jì)直方圖及投影方法:該方法通過對圖像的水平和垂直兩個(gè)方向灰度投影直方圖來分析推斷出牌照的位置。該方法的缺點(diǎn)是對噪聲敏感,且牌照圖像存在傾斜時(shí),不能達(dá)到預(yù)期的效果。第2類:即先對車輛圖像進(jìn)行車牌的粗定位,然后再進(jìn)行精定位。所謂粗定位有兩種含義:第1種粗定位的含義就是從車輛圖像中找出車牌的大致位置,它并不要求非常精確的定位出車牌的位置,只需要給出包含車牌的相對較小或較大的一塊區(qū)域就達(dá)到目的;第2種粗定位的含義就是利用粗分割,即給出包含車牌區(qū)域在內(nèi)的若干候選區(qū)域,再從這些區(qū)域中提取車牌區(qū)域[7]。這里不再作詳細(xì)的論述。2.3系統(tǒng)采用的定位方法在系統(tǒng)中,采用投影法來實(shí)現(xiàn)車輛牌照的定位。利用水平投影來檢測車牌的水平位置,利用垂直投影和形態(tài)學(xué)的方法檢測車牌的垂直位置[8]。2.3.1車輛牌照的水平定位得到二值化圖像以后,首先把二值圖像投影到y(tǒng)軸。根據(jù)車牌特征,車牌區(qū)域中的垂直邊緣較密集,而且車牌一般懸掛在車身較低的位置其下方?jīng)]有很多的邊緣密集區(qū)域。因此在車牌對應(yīng)的水平位置上會出現(xiàn)一個(gè)峰值,如圖2-2所示。峰值的兩個(gè)低谷點(diǎn)就是車牌的垂直位置,這樣就得到了包含了車牌的帶狀區(qū)域。所以問題轉(zhuǎn)成確定低谷點(diǎn)的位置。但是從圖中可以發(fā)現(xiàn)投影圖不是十分的光滑,會給精確定位帶來一些困難,所以對投影圖進(jìn)行平滑。窗口尺寸比較關(guān)鍵,選小了不足以平滑,選大了則會改變投影圖原有的基本變化特性。對于實(shí)際的投影曲線可以通過找差分曲線的過零點(diǎn)來確定低谷點(diǎn),所以對平滑以后的投影圖求一階差分:(2-3)找出其由正至負(fù)的點(diǎn),也就是局部最小值。但是并不是所有的局部最小值之間都能稱為峰的,它可能附屬鄰近的一個(gè)峰,因而要確定哪一個(gè)局部最小值是峰谷,哪一個(gè)是毛刺。如何判決峰的獨(dú)立性呢?本文采取了3個(gè)判決依據(jù):1.獨(dú)立峰具有一定峰頂和峰谷的落差,當(dāng)局部最大值和鄰近的局部最小值的差大于閾值,則該局部最小值為谷底,反之則為毛刺。2.獨(dú)立峰具有一定的寬度,這是由車牌的寬度信息決定的。3.獨(dú)立峰具有一定的面積,這是因?yàn)樵诮?jīng)過邊緣提取,二值化后,在車牌區(qū)域具有明顯的紋理特征。在光照均勻和背景不是很復(fù)雜的圖像中,車牌的峰值特性十分明顯,很容易就可以定位出車牌區(qū)域的水平位置。但在光照不均勻或背景復(fù)雜的圖像中峰值特性就不是很明顯了。如何準(zhǔn)確地確定局部最小值是否為谷底,關(guān)鍵在于閾值的選取。2.3.2車輛牌照的垂直定位根據(jù)車牌的特征可以知道,車牌在垂直方向的投影呈現(xiàn)有規(guī)律的“峰、谷、峰”的分布。字符與字符之間的間隔是近似相等的,而且字符的寬度是近似相等的,而車(a)二值化圖像(b)水平投影圖圖2-2水平投影牌具有7個(gè)字符,所以車牌區(qū)域在垂直方向上的投影應(yīng)該存在6個(gè)低谷點(diǎn),而且相鄰低谷點(diǎn)之間的距離是近似相等的,第二和第三字符之間的距離略大于其他字符間的距離。但在現(xiàn)實(shí)中得到二值圖像的“峰、谷、峰”的特點(diǎn)并不十分明顯,采用這種方法對車牌的垂直位置進(jìn)行定位效果不是很好,本文考慮使用形態(tài)學(xué)與投影法相結(jié)合的方法來對車牌進(jìn)行垂直定位,下面簡單介紹圖像形態(tài)學(xué)[9]。最初形態(tài)學(xué)是生物學(xué)中研究動物和植物的一個(gè)分支,后來也用數(shù)學(xué)形態(tài)學(xué)來表示以形態(tài)學(xué)為基礎(chǔ)的圖像分析數(shù)學(xué)工具。形態(tài)學(xué)的基本思想是使用具有一定形態(tài)的結(jié)構(gòu)元素來度量和提取圖像中的對應(yīng)形狀,從而達(dá)到對圖像進(jìn)行分析和識別的目的。數(shù)學(xué)形態(tài)學(xué)可以用來簡化圖像數(shù)據(jù),保持圖像的基本形狀特性,同時(shí)去掉圖像中與研究目的無關(guān)的部分。使用形態(tài)學(xué)操作可以實(shí)現(xiàn)增強(qiáng)對比度、消除噪聲、細(xì)化、填充和分割等常用的圖像處理任務(wù)。數(shù)學(xué)形態(tài)學(xué)的數(shù)學(xué)基礎(chǔ)和使用的語言是集合論,其基本運(yùn)算有四種:膨脹(Dilation)、腐蝕(Erosion)、開啟(Open)和閉合(Close)?;谶@些基本運(yùn)算還可以推導(dǎo)和組成各種數(shù)學(xué)形態(tài)學(xué)運(yùn)算方法。其運(yùn)算對象是集合,通常給出一個(gè)圖像集合和一個(gè)結(jié)構(gòu)元素集合,利用結(jié)構(gòu)元素對圖像進(jìn)行操作。結(jié)構(gòu)元素是一個(gè)用來定義形態(tài)操作中所用到的鄰域的形狀和大小的矩陣,可以具有任意的大小和維數(shù)。下面簡單介紹一下以上4種運(yùn)算。1、膨脹膨脹的運(yùn)算符為“”,圖像集合用結(jié)構(gòu)元素來膨脹,記作,其定義見式(2-4),其中表示的映像,即與關(guān)于原點(diǎn)對稱的集合。式(2-4)表明,用對進(jìn)行膨脹的過程是這樣的:首先對作關(guān)于原點(diǎn)的映射,再將其映像平移,當(dāng)與映像的交集不為空集時(shí),的原點(diǎn)就是膨脹集合的像素。也就是說,用來膨脹得到的集合是的位移與至少有一個(gè)非零元素相交時(shí)的原點(diǎn)的位置的集合。(2-4)膨脹的作用效果如圖2-3所示。其中白色表示目標(biāo),背景為黑色,結(jié)構(gòu)元素為一3×3正方形對象。(a)膨脹前(b)膨脹后圖2-3圖像膨脹前后的顯示效果對比2、腐蝕腐蝕的運(yùn)算符是,圖像集合用結(jié)構(gòu)元素來腐蝕記作,其定義為:(2-5)式(2-5)表明,用來腐蝕的結(jié)果是所有滿足將平移后,仍全部包含在中的的集合,從直觀上看就是經(jīng)過平移后全部包含在中的原點(diǎn)組成的集合。腐蝕的操作效果如圖2-4所示,其中白色為目標(biāo),黑色為背景,結(jié)構(gòu)元素為一3×3正方形對象。(a)腐蝕前(b)腐蝕后圖2-4圖像腐蝕前后的顯示效果對比3、開啟開啟的運(yùn)算符為“”,用來開啟記為,其定義如下:(2-6)4、閉合閉合的運(yùn)算符為“”,用來閉合記為,其定義見式(2-7):(2-7)開啟和閉合運(yùn)算不受原點(diǎn)位置的影響,無論原點(diǎn)是否包含在結(jié)構(gòu)元素中,開啟和閉合的結(jié)果都是一樣的。開啟和閉合操作的效果如圖2-5所示,其中白色為目標(biāo),黑色為背景。對形態(tài)學(xué)了解后,我們用形態(tài)學(xué)來進(jìn)行定位,具體算法為:1、對得到的帶狀區(qū)域用結(jié)構(gòu)算子先進(jìn)行一次腐蝕運(yùn)算,消除一些獨(dú)立的亮點(diǎn),但使用的結(jié)構(gòu)算子不能太大,否則會失去一部分車牌的信息。(a)原圖(b)對原圖開啟操作后(c)對原圖閉合操作后圖2-5圖像的開啟、閉合操作的顯示效果2、再進(jìn)行二次膨脹運(yùn)算,由于膨脹的目的是要把車牌區(qū)域連通,因此使用的結(jié)構(gòu)算子和腐蝕的結(jié)構(gòu)算子不一樣,要略大一些。3、最后進(jìn)行一次開運(yùn)算,將車牌區(qū)域平滑一下??梢园l(fā)現(xiàn)車牌在圖像中形成了一個(gè)塊狀區(qū)域。如圖2-6所示。將得到的圖像再投影到垂直方向,再根據(jù)車牌的寬度信息,設(shè)定一個(gè)范圍,可以把這個(gè)范圍設(shè)置大些,這是因?yàn)榻?jīng)過形態(tài)學(xué)變化后,車牌的長度會變大,而且有可能把附近的一些雜點(diǎn)連在一起了,從而增大了車牌連通區(qū)域的長度,如果范圍定的太小,就有可能檢測不到車牌區(qū)域[10]。2.3.3定位的算法實(shí)現(xiàn)利用投影法,在VisualC++中用C++語言對以上算法進(jìn)行編程,對車輛牌照進(jìn)行定位。實(shí)驗(yàn)中水平方向上的定位函數(shù)為HprojectDIB();垂直方向上的定位函數(shù)為VprojectDIB();定位以后分割過程所用的函數(shù)為TempSubert();iTop和iBottom分別是車牌的上下邊緣,iLeft和iRight為車牌的左右邊緣。定出車牌的四個(gè)邊緣以后,就可以通過分割函數(shù)TempSubert()將車牌從源圖像中裁減出來,為了使裁減的準(zhǔn)確,可以設(shè)置邊緣的微量調(diào)整。圖像定位算法流程圖如圖2-7所示。(a)水平投影分割得到的圖像(b)腐蝕運(yùn)算得到的圖像(c)第一次膨脹運(yùn)算得到的圖像(d)第二次膨脹運(yùn)算得到的圖像圖2-6形態(tài)學(xué)變化得到的圖像圖2-7定位流程圖2.4實(shí)驗(yàn)結(jié)果分析經(jīng)實(shí)驗(yàn),大部分圖片中的牌照能夠被正確的定位出來如圖2-8,極少部分牌照不能正確定位。實(shí)驗(yàn)表明,投影法基本上實(shí)現(xiàn)了車輛牌照的定位,但同時(shí)不難看出被定位的車牌還包括車牌邊框,與理想要求還有很大差距,如果在這些車牌上進(jìn)行字符分割,將會有很大的困難。另外在實(shí)驗(yàn)中還發(fā)現(xiàn)該算法對車牌背景環(huán)境要求比較嚴(yán)格,車牌如果比較傾斜或者車牌顏色與汽車顏色相近或者車牌背景中的噪聲較大,則定位起來比較困難,不能實(shí)現(xiàn)車牌的精確定位,以后需要進(jìn)一步改進(jìn)。圖2-8定位前后的圖像第3章車輛牌照的字符分割在做字符分割以前,必須對定位出來的圖像做進(jìn)一步的處理,要對車牌做去邊框處理、去噪聲處理、梯度銳化、傾斜度調(diào)整等預(yù)處理才能進(jìn)行字符分割。3.1車牌預(yù)處理3.1.1去邊框處理一般藍(lán)底白字的車牌都有白色邊框,與字符的顏色相同,它的存在將對后繼的字符識別造成影響,因此它的濾除十分必要。1、濾除上下邊框?qū)z測到的二值牌照圖像進(jìn)行水平投影,在0<I<Height的范圍內(nèi),計(jì)算各sum[I],(sum[I]為從0到Width的范圍內(nèi),二值化牌照圖像的白像素點(diǎn)數(shù))然后,將所有的sum[I]累加起來,記為一值,然后將該值除以2*Height-(2/3)*Height,如果sum[I]小于該商,就令該sum[I]為0。這樣直方圖中必有連零塊和非連零塊,測試每個(gè)非連零塊的寬度,如果它不在車牌高度的范圍內(nèi),就置其為零,那么就將邊框?yàn)V除了(其中Height,Width為牌照圖像的高度和寬度)。2、濾除左右邊框?yàn)V除左右邊框的方法與濾除上下邊框的方法類似,只是閾值有些不同,不再贅述。3.1.2去噪聲處理圖像在掃描或者傳輸過程中夾帶了噪聲,去噪聲是圖像處理中常用的手法。通常去噪聲用濾波的方法,比如空間域?yàn)V波和同態(tài)濾波。采用合適的濾波方法不但可以濾除噪聲還可以對圖像進(jìn)行銳化,增強(qiáng)圖像的邊緣信息。下面介紹幾種常用的濾波方法。1、鄰域平均法為了消除圖像中的噪聲,可以直接在空間域上對圖像進(jìn)行平滑濾波。它的作用有兩種:一種是模糊;另一種是消除噪聲??臻g域的平滑濾波一般采用簡單平均法進(jìn)行,就是求鄰近像素點(diǎn)的平均亮度值,稱為鄰域平均法。鄰域的大小與平滑的效果直接相關(guān),鄰域越大平滑的效果越好,但鄰域過大,平滑會使邊緣信息損失的越大,從而使輸出的圖像變得模糊,因此需要合理選擇鄰域的大小。典型的鄰域有兩種:四鄰域和八鄰域,其模板見式(3-1)。如果圖像中的噪聲是隨機(jī)不相關(guān)的加性噪聲,窗口內(nèi)各點(diǎn)噪聲是獨(dú)立分布的,經(jīng)過上述模板平滑后,信號與噪聲的方差比可提高許多倍。這種算法簡單,處理速度快,但它的主要缺點(diǎn)是在降低噪聲的同時(shí)使圖像產(chǎn)生模糊,特別在邊緣和細(xì)節(jié)處。而且,(3-1)隨著鄰域的增大,雖然增強(qiáng)了去噪聲的能力,但同時(shí)模糊程度也更嚴(yán)重。2、高通濾波在進(jìn)行圖像處理時(shí),我們經(jīng)常要對圖像進(jìn)行銳化以便突出圖像的邊緣。同樣的,可以采用在空間域?qū)D像進(jìn)行濾波的方法,只不過這時(shí)采用的沖激響應(yīng)陣列與空間域低通濾波時(shí)所采用的完全不同。采用高通濾波器讓高頻分量順利通過,而對低頻分量則充分限制,使圖像的邊緣變得清晰,實(shí)現(xiàn)圖像的銳化。但是,對圖像進(jìn)行空間域的高通濾波,在增強(qiáng)圖像邊緣的同時(shí),孤立的噪聲點(diǎn)也得到了增強(qiáng)。常用于空間域高通濾波的沖激響應(yīng)陣列有以下幾種:(3-2)3、中值濾波中值濾波是一種非線性濾波,它也是一種鄰域運(yùn)算,類似于卷積。但中值濾波的計(jì)算不是加權(quán)求和,而是把它鄰域內(nèi)的所有像素按灰度值進(jìn)行排序,然后取該組的中間值作為鄰域中心像素點(diǎn)的輸出值。中值濾波的突出優(yōu)點(diǎn)是在消除噪聲的同時(shí),還能防止邊緣模糊。如果圖像的噪聲多是孤立的點(diǎn),這些點(diǎn)對應(yīng)的像素又很少,而圖像則是由像素較多、面積較大的塊構(gòu)成,中值濾波效果很好。4、同態(tài)濾波同態(tài)濾波器的思想就是用一系列方法把乘性信號變換成加性組合信號,經(jīng)過處理后再反變換回乘性信號。同態(tài)濾波以圖像的照明反射模型作為頻域處理的基礎(chǔ),它在數(shù)字圖像處理中有著十分重要的應(yīng)用。這里不再詳細(xì)論述。去除噪聲處理要根據(jù)不同的噪聲特點(diǎn)選取合適的方法。本系統(tǒng)采用的是去除雜點(diǎn)的方法來進(jìn)行去噪聲處理。具體的算法如下:掃描整個(gè)圖像,當(dāng)發(fā)現(xiàn)一個(gè)黑色點(diǎn)的時(shí)候就考察和該點(diǎn)直接或間接相連接的黑色點(diǎn)的個(gè)數(shù)有多少,如果大于一定的值,就說明該點(diǎn)不是離散點(diǎn),否則就是離散點(diǎn),把它去除掉。在考察相連的黑色點(diǎn)的時(shí)候用的是遞歸的方法。3.1.3梯度銳化我們所得到的二值化圖像的字體一般是比較模糊的,對識別造成了一定的困難,所以有時(shí)要對圖像進(jìn)行銳化處理使模糊的圖像變得清晰,同時(shí)可以對噪聲起到一定的抑制和去除作用。圖像的銳化有很多方法,一種是微分法,一種是高通濾波法,梯度銳化的方法就是微分法的一種。梯度對應(yīng)一階導(dǎo)數(shù),梯度算子是一階導(dǎo)數(shù)算子。對一個(gè)連續(xù)函數(shù)它在位置的梯度可以表示為一個(gè)矢量:(3-3)這個(gè)矢量的幅度(也常直接簡稱為梯度)和方向角分別為:(3-4)(3-5)以上三式中的偏導(dǎo)數(shù)需要對每個(gè)象素位置計(jì)算。在實(shí)際中常用小區(qū)域模板卷積來近似計(jì)算。對和各用一個(gè)模板,所以需要兩個(gè)模板組合起來構(gòu)成一個(gè)梯度算子。根據(jù)模板的大小,其中元素值的不同,人們提出了許多種不同的算子如圖3-1。在這三個(gè)算子中,最簡單的算子是Roberts算子,Roberts算子是效果比較好的一種,我們采用的就是這個(gè)算子,效果如圖3-2所示。算子運(yùn)算時(shí)是采用類似卷積的方式,將模板在圖像上移動并在每個(gè)位置計(jì)算中心象素的梯度值。在邊緣灰度值過渡比較尖銳且圖像中噪聲比較小時(shí),梯度算子的工作效果較好。(a)Roberts(b)Prewitt(c)Sobel圖3-1幾種常見的梯度模板算子通過圖3-2可以看出梯度銳化可以讓模糊的邊緣變的清楚,同時(shí)選擇合適的閾值還可以減弱和消除一些細(xì)小的噪聲。實(shí)驗(yàn)證明梯度銳化具備一定的去噪聲能力,但同時(shí)也會對字符的邊緣有所損傷。從處理結(jié)果可以看出圖像的邊緣變得清晰而且少了很多細(xì)小的雜點(diǎn),但梯度銳化有其自身的缺陷,當(dāng)處理的圖像邊緣很細(xì)的時(shí)候可能造成邊緣信息的損失。在實(shí)驗(yàn)中,如果圖像中的字符較為細(xì)小,則不使用梯度銳化。(a)原始圖像(b)利用Roberts算子檢測到的邊緣(c)利用Prewitt算子檢測到的邊緣(d)利用Sobel算子檢測到的邊緣圖3-2梯度算子的檢測效果比較3.1.4傾斜調(diào)整雖然在拍攝車輛車牌時(shí),可以調(diào)整CCD攝像機(jī)的俯仰角度、攝取方向和水平度,以保持車牌的橫向邊緣的傾斜度盡可能小,并且讓車牌在整幅圖像中處于相對居中的位置,即圖像的視覺中心上。但是,實(shí)際上CCD攝像機(jī)通常安裝在路邊或頂部,這將造成車輛車牌與CCD攝像頭成像平面不平行,產(chǎn)生不同程度的車牌圖像的傾斜與變形,影響車牌的檢測和分割。就圖像的旋轉(zhuǎn)傾斜的問題,更多的情況下,圖像的水平校正是放在車牌的二值化和分割,甚至是在車牌字符切分之后再進(jìn)行,這樣圖像的運(yùn)算量大大減少。然而,傾斜的車牌圖像本身就極不利于車牌字符的切分,因此,將圖像水平校正放在圖像預(yù)處理過程中是切實(shí)可行的[11]。一般情況下,可將傾斜的車牌圖像近似看成一個(gè)平行四邊形,它有三種傾斜模式:水平傾斜見圖3-3,垂直傾斜見圖3-4和水平垂直傾斜見圖3-5,分別如下所示。水平傾斜時(shí),字符基本上無傾斜,車牌的水平軸與圖像坐標(biāo)系的水平軸有一個(gè)傾斜角度,只要求取,將圖像繞軸旋轉(zhuǎn)即可。垂直傾斜時(shí),傾斜實(shí)際上是同一行間像素的錯(cuò)位偏移,只要檢測到垂直傾斜角度進(jìn)行錯(cuò)位偏移校正即可。水平垂直傾斜時(shí),既存在水平傾斜又存在垂直傾斜,是最一般的情況。可先檢測水平傾斜角度,進(jìn)行水平傾斜校正,然后再求取垂直傾斜角度進(jìn)行垂直傾斜校正。對車輛牌照做預(yù)處理以后就可以進(jìn)行字符分割的步驟。(a)水平傾斜()(b)水平傾斜()(a)水平傾斜()(b)水平傾斜()圖3-3水平傾斜(a)(a)垂直傾斜()(b)垂直傾斜()圖3-4垂直傾斜(a)水平垂直傾斜()(b)水平垂直傾斜()(a)水平垂直傾斜()(b)水平垂直傾斜()圖3-5水平垂直傾斜3.2字符分割方法簡介圖像分割是一種基本的計(jì)算機(jī)視覺技術(shù),是由圖像處理進(jìn)行到圖像分析的關(guān)鍵步驟,這是因?yàn)閳D像的分割、目標(biāo)的分離、特征的提取和參數(shù)的測量將原始圖像轉(zhuǎn)化為更抽象更緊湊的形式,使得更高層的分析和理解成為可能。圖像分割多年來一直得到人們的高度重視,至今已提出各種類型的分割算法[12]。字符分割的算法很多,通常根據(jù)處理對象的不同有許多相應(yīng)的方法。為了實(shí)現(xiàn)更好的分割,有關(guān)景物的總體知識和先驗(yàn)信息是很有用的,根據(jù)包含在圖像中的信息,可以定制相應(yīng)的判決準(zhǔn)則和控制策略,使其完成自動分割,比如對多行文本的處理,郵政部門對郵政編碼和地址的識別,金融等部門對支票簽名手寫字跡的分割識別等等,都是針對具體的不同研究對象而采用不同的算法。傳統(tǒng)的字符分割算法可以歸納為以下三類:直接的分割法,基于識別基礎(chǔ)上的分割法,自適應(yīng)分割線聚類法[13]。直接的分割法簡單,但它的局限是分割點(diǎn)的確定需要較高的準(zhǔn)確性;基于識別結(jié)果的分割是把識別和分割結(jié)合起來,但是需要識別的高準(zhǔn)確性,它根據(jù)分割和識別的耦合程度又有不同的劃分;自適應(yīng)分割線聚類法是要建立一個(gè)分類器,用它來判斷圖像的每一列是否是分割線,但是對于粘連的字符是很難訓(xùn)練的。因?yàn)榉指畈豢赡茏龅酵耆_,現(xiàn)在有的算法已經(jīng)把字符的分割作為不必要的步驟,而是直接把字符組成的單詞當(dāng)作一個(gè)整體來識別。利用諸如馬爾可夫數(shù)學(xué)模型等方法進(jìn)行處理,這主要是應(yīng)用于文本識別。以上的字符分割算法均是基于二值圖像進(jìn)行的??紤]到二值圖像丟失掉了很多信息,而且可能會造成字符粘連、模糊或斷裂的缺陷,對灰度圖像的直接處理已經(jīng)有人開始研究。在一般的字符識別系統(tǒng)中,字符識別之前要經(jīng)過閾值化過程和行字切分過程,以分割出一個(gè)具體的二值表示的字符圖像點(diǎn)陣,作為單字符識別的輸入數(shù)據(jù)。其中,識別字符過程中的第一步就是要將獲得的數(shù)字灰度圖像轉(zhuǎn)變?yōu)閿?shù)字二值圖像,這個(gè)過程稱為二值化過程,采用的技術(shù),通常稱為閾值化技術(shù)。由于獲得的文本圖像不但包含了組成文本的一個(gè)個(gè)字符,而且包含了字符行間與字間的空白,甚至還會帶有各種標(biāo)點(diǎn)符號,這就需要采用一定的處理技術(shù),將文本中的一個(gè)個(gè)字符切分出來,形成單個(gè)字符的圖像陣列,以進(jìn)行單字識別處理。這就是字符文本的行字切分問題,分為行切分和字切分兩個(gè)主要步驟,首先由行切分得到一行行文本字行,然后在文本字行中進(jìn)行列切分得到一個(gè)個(gè)單獨(dú)的字符點(diǎn)陣。車牌的字符切分是在車牌定位的基礎(chǔ)上,對取出的牌照圖像區(qū)域進(jìn)行下一步處理,定出牌照上每一個(gè)字符的上下左右邊界,從而將牌照上的字符完整準(zhǔn)確地切割下來,作為下一步字符識別的數(shù)據(jù)源。牌照切分是在二值圖上進(jìn)行的。字符切分分為兩步進(jìn)行,先進(jìn)行字符的垂直切分,定出每個(gè)字符的左右邊界,然后進(jìn)行字符的水平切分,定出每個(gè)字符的上下邊界。字符切割過程往往容易被人忽視,但是它對于字符識別的重要性是不言而喻的,因?yàn)榍懈铄e(cuò)誤的字符被正確識別的概率基本上等于零。3.3系統(tǒng)采用的分割方法根據(jù)以上介紹的算法,本文采用了一種比較實(shí)用的方法,通過對圖像的掃描,得到分割的字符。3.3.1算法介紹經(jīng)過處理后的車牌可以進(jìn)行字符分割,本文的分割算法如下:1、先自上而下對圖像進(jìn)行逐行掃描直至遇到第一個(gè)黑色象素點(diǎn)。記錄下來。然后在自下而上對圖像進(jìn)行逐行掃描直至找到第一個(gè)黑色象素,記錄下來。這樣就可以找到圖像的大致高度范圍。2、在上面得到的高度范圍內(nèi)對圖像進(jìn)行自左向右逐列進(jìn)行掃描,遇到第一個(gè)黑色象素時(shí)認(rèn)為是字符分割的起始位置,然后繼續(xù)掃描,直至遇到有一列中沒有黑色象素,則認(rèn)為是第一個(gè)字符分割結(jié)束,然后繼續(xù)掃描,按照上面的方法一直掃描到圖像的最右端。這樣就得到了每個(gè)字符比較精確的寬度范圍。3、在已知的每個(gè)字符的比較精確的寬度范圍內(nèi),按照第一步的方法,分別進(jìn)行自上而下和自下而上的逐行掃描來獲取每個(gè)字符精確的高度范圍。經(jīng)過以上3個(gè)步驟的循環(huán),就可以實(shí)現(xiàn)字符的分割。字符分割以后要做歸一化和緊縮排列,以便做特征提取[14]。因?yàn)閽呙柽M(jìn)來的圖像字符大小存在差異,而相對來說,統(tǒng)一尺寸的字符識別的標(biāo)準(zhǔn)性更強(qiáng)準(zhǔn)確率自然也更高,標(biāo)準(zhǔn)化圖像就是要把原來各不相同的字符統(tǒng)一到同一尺寸,在本系統(tǒng)中是統(tǒng)一到同一高度然后根據(jù)高度來調(diào)整字符的寬度。具體算法為:先得到原來字符的高度,并與系統(tǒng)要求的高度作比較,得出要變換的系數(shù),然后根據(jù)得到的系數(shù)求變換后應(yīng)有的寬度。在得到寬度高度之后,把新圖像里面的點(diǎn)按照插值的方法映射到原圖像中。圖像標(biāo)準(zhǔn)歸一化的高度和寬度信息可以通過一個(gè)對話框輸入,但為了以后特征提取的時(shí)候處理方便。建議歸一化的寬度為8,高度為16。經(jīng)過標(biāo)準(zhǔn)歸一化處理后的各字符在圖像中的位置不定,要對它進(jìn)行特征提取處理起來比較麻煩,所以要把歸一化處理后的字符進(jìn)行緊縮排列,以形成新的位圖句柄,以方便下一步的提取工作至此已經(jīng)基本上完成圖像中字符的分割工作。此外還可以采用其他方法以達(dá)到更好的效果。3.3.2算法的實(shí)現(xiàn)根據(jù)以上算法在VC++中用C++語言編程,可以實(shí)現(xiàn)字符分割,并實(shí)現(xiàn)字符的歸一化和緊縮排列。實(shí)驗(yàn)中的字符分割函數(shù)為CharSegment();DrawFrame()函數(shù)用來給分割后的字符周圍畫邊框;StdDIBbyRec()函數(shù)用來實(shí)現(xiàn)歸一化處理;緊縮排列由函數(shù)AutoAlign()完成。下面圖3-6顯示了分割算法實(shí)現(xiàn)流程:圖3-6分割算法的實(shí)現(xiàn)流程3.4字符分割實(shí)驗(yàn)結(jié)果實(shí)驗(yàn)結(jié)果如下面幾幅圖所示,為了便于觀察分割結(jié)果,每個(gè)被分割后的字符都用方框分割開來。從實(shí)驗(yàn)可以得出,該字符分割模塊基本上可以完成大部分的數(shù)字字符分割。圖3-12中“川”字被分割成了三份,這說明分割算法的正確性,但它對漢字的分割卻是錯(cuò)誤的。圖3-13中為了可以清楚的觀察字符的緊縮排列,歸一化的字符寬度為12,高度為24(圖3-11中的字符寬度為8,高度為16)。由于漢字結(jié)構(gòu)比較復(fù)雜,所以該算法不能對漢字作字符的分割。在實(shí)驗(yàn)時(shí),圖中如果含有漢字,則系統(tǒng)就會出現(xiàn)錯(cuò)誤而拒絕作字符分割,實(shí)現(xiàn)漢字分割還需要作進(jìn)一步改進(jìn)。圖3-7字符分割的結(jié)果圖3-8緊縮排列的結(jié)果圖3-9車牌的字符分割結(jié)果圖3-10車牌的字符緊縮排列結(jié)果第4章特征提取與字符識別經(jīng)過上面的一系列變換,車牌中的字符被分割提取出來。下面就要從被分割歸一化處理完畢的字符中提取最能體現(xiàn)這個(gè)字符特點(diǎn)的特征向量。將提取出的訓(xùn)練樣本中的特征向量代入BP網(wǎng)絡(luò)之中就可以對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提取出待識別樣本的特征向量代入到訓(xùn)練好的BP網(wǎng)絡(luò)中,就可以對字符進(jìn)行識別。4.1字符的特征提取特征提取的方法多種多樣,有逐象素特征提取法,骨架特征提取法,垂直方向數(shù)據(jù)統(tǒng)計(jì)特征提取法,13點(diǎn)特征點(diǎn)提取法,弧度梯度特征提取法等很多種方法,根據(jù)具體情況的不同我們可以選擇不同的方法。1、逐象素特征提取法這是一種最簡單的特征提取方法,對圖像進(jìn)行逐行逐列的掃描,當(dāng)遇到黑色象素時(shí)取其特征值為1,遇到白色象素時(shí)取其特征值為0,這樣當(dāng)掃描結(jié)束以后就形成了一個(gè)維數(shù)與圖像中象素點(diǎn)的個(gè)數(shù)相同的特征向量矩陣。2、骨架特征提取法兩幅圖像由于它們的線條的粗細(xì)不同,使得兩幅圖像的差別很大,但將它們的線條細(xì)化后,統(tǒng)一到相同的高度,這時(shí)兩幅圖像的差距就不那么明顯。利用圖形的骨架作為特征來進(jìn)行數(shù)碼識別,就使得識別有了一定的適應(yīng)性。一般使用細(xì)化的方法來提取骨架,細(xì)化的算法很多如Hilditch算法、Rosenfeld算法等。對經(jīng)過細(xì)化的圖像利用EveryPixel函數(shù)進(jìn)行處理就可以得到細(xì)化后圖像的特征向量矩陣。骨架特征提取的方法對于線條粗細(xì)不同的圖像有一定的適應(yīng)性,但圖像一旦出現(xiàn)偏移就難以識別。3、垂直方向數(shù)據(jù)統(tǒng)計(jì)特征提取法這種算法就是自左向右對圖像進(jìn)行逐列的掃描,統(tǒng)計(jì)每列黑色象素的個(gè)數(shù),然后自上向下逐行進(jìn)行掃描,統(tǒng)計(jì)每行的黑色象素的個(gè)數(shù),將統(tǒng)計(jì)結(jié)果作為字符的特征向量,如果字符的寬度w,長度為h,則特征向量的維數(shù)是w+h。該提取方法的缺點(diǎn)是適應(yīng)性不強(qiáng),當(dāng)字符存在傾斜和偏移時(shí)都會對識別產(chǎn)生誤差。4、13點(diǎn)特征點(diǎn)提取法首先把字符平均分成8份,統(tǒng)計(jì)每一份內(nèi)黑色象素點(diǎn)的個(gè)數(shù)作為8個(gè)特征,分別統(tǒng)計(jì)這8個(gè)區(qū)域黑色象素的數(shù)目,可以得到8個(gè)特征。然后統(tǒng)計(jì)水平方向中間兩列和豎直方向中間兩列的黑色象素點(diǎn)的個(gè)數(shù)作為4個(gè)特征,最后統(tǒng)計(jì)所有黑色象素點(diǎn)的個(gè)數(shù)作為第13個(gè)特征。也就是說,畫4道線,統(tǒng)計(jì)線穿過的黑色象素的數(shù)目??梢缘玫?個(gè)特征示意圖,最后將字符圖像的全部黑色象素的數(shù)目的總和作為一個(gè)特征總共即得到13個(gè)特征。13特征提取法有著極好的適應(yīng)性,但是由于特征點(diǎn)的數(shù)目太少所以樣本訓(xùn)練的時(shí)候比較難收斂。系統(tǒng)采用了第一種方法即逐象素特征提取法做特征提取。因?yàn)檫@種方法算法簡單,運(yùn)算速度快,可以用BP網(wǎng)絡(luò)很快的收斂,訓(xùn)練效果好。4.2字符的識別方法簡介同模式識別中的其它問題一樣,字符識別方法基本上也分成統(tǒng)計(jì)決策識別和句法結(jié)構(gòu)識別兩大類,而每一類中又包含有許多具體的方法。然而無論采取何種識別方法,其中的關(guān)鍵都是特征的選取與提取以及相應(yīng)的分類算法。與兩種識別方法相對應(yīng),特征也大體上分為統(tǒng)計(jì)特征和結(jié)構(gòu)特征兩類。結(jié)構(gòu)法結(jié)構(gòu)方法是發(fā)展最早的一種方法,它的基本思想是把字符圖像分割化為若干的基元,例如筆劃、拓?fù)潼c(diǎn)、結(jié)構(gòu)突變點(diǎn)等,然后和模板比較進(jìn)行判別。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對字符加以描述。主要的方法有基于輪廓、骨架和字符鏈碼的方法。其主要優(yōu)點(diǎn)在于對字符變化的適應(yīng)性強(qiáng),區(qū)分相似字符能力強(qiáng)。但是在實(shí)際應(yīng)用中,面臨的主要問題是抗干擾能力差,因?yàn)樵趯?shí)際得到的字符圖像中存在著各種干擾如傾斜、扭曲、斷裂、粘連和對比度差等。這些因素直接影響到結(jié)構(gòu)基元的提取,此外結(jié)構(gòu)方法的描述比較復(fù)雜,匹配過程的復(fù)雜度因而也較高。統(tǒng)計(jì)法統(tǒng)計(jì)法依賴于大量的原始樣本和數(shù)值計(jì)算,它是從車牌字符原始數(shù)據(jù)中提取與分類最相關(guān)的信息,使得類內(nèi)差距極小化,類間差距極大化,特征對同一個(gè)字符類的形變應(yīng)該盡量保持不變。統(tǒng)計(jì)特征又可以分為全局特征和局部特征。全局特征主要是對整個(gè)字符圖像進(jìn)行變換,利用變換系數(shù)作為特征,常用的變換包括K-L變換、Fourier變換、Gabor變換、Hadamard變換、DCT變換、Walsh變換、Rapid變換、小波變換和矩陣特征變換等多種方法。局部特征是將字符點(diǎn)陣圖像分割成不同區(qū)域或網(wǎng)格,在各個(gè)小區(qū)域內(nèi)分別抽取統(tǒng)計(jì)特征,在特定位置對特定大小的窗口內(nèi)的圖像進(jìn)行變換,如投影特征、細(xì)胞特征、計(jì)算方向線素特征等。統(tǒng)計(jì)特征的特點(diǎn)是抗干擾性強(qiáng),匹配與分類的算法簡單,易于實(shí)現(xiàn)。不足之處在于細(xì)分能力較弱,區(qū)分相似字符的能力差一些。字符的結(jié)構(gòu)特征直接反映了字符的屬性,利用了字符自身直觀的特點(diǎn);用字符的統(tǒng)計(jì)特征進(jìn)行識別則是充分利用了計(jì)算機(jī)處理數(shù)字特征能力強(qiáng)的特點(diǎn)。兩種特征各有利弊,一般需要結(jié)合使用。另外,雖然神經(jīng)網(wǎng)絡(luò)方法中主要采用局部特征,其分類機(jī)理也與傳統(tǒng)的統(tǒng)計(jì)方法相同,但是由于它具有很大的靈活性,我們下面將它單獨(dú)作為一類進(jìn)行詳細(xì)討論。4.3系統(tǒng)采用的識別方法目前,隨著計(jì)算機(jī)的迅速發(fā)展,模式識別技術(shù)己經(jīng)從理論探討為主發(fā)展到大量的實(shí)際應(yīng)用,人們將更多的注意力開始轉(zhuǎn)向那些用于語音、圖像、機(jī)器人以及人工智能等的模式識別實(shí)際問題。解決這些問題的關(guān)鍵是需要進(jìn)行復(fù)雜而龐大的實(shí)時(shí)數(shù)據(jù)處理,而現(xiàn)有計(jì)算機(jī)的存貯容量及計(jì)算復(fù)雜性的局限,使得實(shí)時(shí)化的應(yīng)用受阻。這種面向?qū)崟r(shí)應(yīng)用的模式識別問題促使人們開始將并行處理的神經(jīng)網(wǎng)絡(luò)應(yīng)用到模式識別中。4.3.1人工神經(jīng)網(wǎng)絡(luò)簡介人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork)簡稱神經(jīng)網(wǎng)絡(luò)是基于目前人們對自然神經(jīng)系統(tǒng)的認(rèn)識而提出的一些神經(jīng)系統(tǒng)的模型,一般是由一系列被稱為神經(jīng)元的具有某種簡單計(jì)算功能的節(jié)點(diǎn)經(jīng)過廣泛連接構(gòu)成的一定網(wǎng)絡(luò)結(jié)構(gòu),而其網(wǎng)絡(luò)連接的權(quán)值根據(jù)某種學(xué)習(xí)規(guī)則在外界輸入的作用下不斷調(diào)節(jié),最后使網(wǎng)絡(luò)具有某種期望的輸出特性。神經(jīng)網(wǎng)絡(luò)的這種可以根據(jù)輸入樣本學(xué)習(xí)的功能,使得它非常適合于用來解決模式識別問題,這也是神經(jīng)網(wǎng)絡(luò)目前最成功的應(yīng)用領(lǐng)域之一[15]。人工神經(jīng)網(wǎng)絡(luò)模式識別與傳統(tǒng)模式識別方法相比有以下的特點(diǎn):a)對復(fù)雜的不確定性問題具有適應(yīng)和自學(xué)習(xí)能力;b)具有表示任意非線性關(guān)系的能力;c)具有網(wǎng)絡(luò)的非線性動力學(xué)帶來的快速優(yōu)化計(jì)算能力;d)對大量定型或定量信息的分布存儲能力,并行處理能力與合成能力;e)由并行分布處理結(jié)構(gòu)帶來的容錯(cuò)能力。神經(jīng)網(wǎng)絡(luò)模式識別的基本方法是:首先用已知樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),使之對不同類別的已知樣本給出所希望的不同輸出,然后用該網(wǎng)絡(luò)識別未知的樣本,根據(jù)各樣本所對應(yīng)的網(wǎng)絡(luò)輸出情況來劃分未知樣本的類別。神經(jīng)網(wǎng)絡(luò)可以處理一些環(huán)境信息十分復(fù)雜,背景知識不清楚,推理規(guī)則不明確的問題,允許樣品有較大的缺損、畸變,其運(yùn)行速度快,自適應(yīng)性能好。系統(tǒng)中采用BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)車牌字符的識別。因?yàn)锽P算法己經(jīng)比較成熟,其實(shí)現(xiàn)相對來講比較簡單。并且如果能適當(dāng)改進(jìn)BP網(wǎng)絡(luò)的學(xué)習(xí)算法,則不會需要太長訓(xùn)練時(shí)間。4.3.2BP神經(jīng)網(wǎng)絡(luò)識別車牌三層的BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖4-1所示:為輸入層節(jié)點(diǎn);為隱層節(jié)點(diǎn);為輸出層節(jié)點(diǎn)。層與層之間采用全互連的方式。同一層神經(jīng)元之間不存在相互連接。網(wǎng)絡(luò)的每一個(gè)輸入節(jié)點(diǎn)表示字符圖像提取特征后特征向量的一個(gè)分量數(shù)據(jù),輸出節(jié)點(diǎn)表示分類序號,分類判決可以采用輸出最大值法。BP算法由兩部分組成:信息的正向傳遞與誤差的反向傳輸。在正向傳輸中,輸入信息從輸入經(jīng)隱含層逐層計(jì)算傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果在輸出層沒有得到期望的輸出,則計(jì)算輸出層的誤差變化值,然后轉(zhuǎn)向反向傳播,通過網(wǎng)絡(luò)將誤差信號沿原來的連接通路反傳回來修改各層神經(jīng)元的權(quán)值,直至達(dá)到期望目標(biāo)。BP網(wǎng)絡(luò)的實(shí)現(xiàn)分為兩個(gè)階段的,即學(xué)習(xí)(訓(xùn)練)階段和識別階段。在學(xué)習(xí)階段輸入要學(xué)習(xí)的樣本,按照網(wǎng)絡(luò)初始設(shè)定的權(quán)重、閾值以及傳輸函數(shù)進(jìn)行計(jì)算,得出每一層神經(jīng)元的輸出,這是從底層向上進(jìn)行的。通過理想輸出與輸出層之間的誤差來決定是否對權(quán)重、閾值進(jìn)行修改,這個(gè)修改是從高層向下進(jìn)行的。兩個(gè)過程反復(fù)進(jìn)行,直到網(wǎng)絡(luò)收斂為止,此為學(xué)習(xí)階段。權(quán)重的學(xué)習(xí)就是不斷的調(diào)整各個(gè)神經(jīng)元的連接強(qiáng)度,使其能在最小二乘的意義上逼近所對應(yīng)的輸出。設(shè)訓(xùn)練集包含個(gè)樣本,對第個(gè)訓(xùn)練樣本(),單元的實(shí)際輸出為,它的第個(gè)輸入(也即第個(gè)神經(jīng)元的輸出)為,則:(4-1)BP算法中大多選用Sigmoid型函數(shù)作為輸出函數(shù),即:(4-2)定義網(wǎng)絡(luò)誤差函數(shù)為:(4-3)式(4-3)中,表示對個(gè)訓(xùn)練樣本,單元的期望輸出。訓(xùn)練網(wǎng)絡(luò)的目的是找到一組權(quán)重,使誤差函數(shù)極小化。圖4-1三層BP網(wǎng)絡(luò)結(jié)構(gòu)利用梯度最速下降法,使權(quán)值沿函數(shù)的負(fù)梯度方向改變。若權(quán)值的變化量記為,即:(4-4)令式(4-4)中:(4-5)則:(4-6)得到:(4-7)式(4-7)中,為學(xué)習(xí)速率。一般地,BP網(wǎng)絡(luò)學(xué)習(xí)步驟描述如下:1、設(shè)置變量和參數(shù),其中包括訓(xùn)練樣本,權(quán)值矩陣,學(xué)習(xí)速率。2、初始化,給各個(gè)權(quán)值矩陣一個(gè)較小的隨機(jī)非零向量。3、輸入隨機(jī)樣本。4、對輸入樣本,前向計(jì)算BP網(wǎng)絡(luò)每層神經(jīng)元的輸入信號和輸出信號。5、由實(shí)際輸出和期望輸出求得誤差。判斷是否滿足要求,若滿足轉(zhuǎn)第8步;不滿足轉(zhuǎn)第6步。6、判斷是否達(dá)到了最大迭代次數(shù),若到,轉(zhuǎn)第8步,否則反向計(jì)算每層神經(jīng)元的局部梯度。7、根據(jù)局部梯度修正各個(gè)矩陣得權(quán)值。8、判斷是否學(xué)習(xí)完所有的樣本,是則結(jié)束,否則轉(zhuǎn)第3步。在BP網(wǎng)絡(luò)學(xué)習(xí)中要注意的問題:1、權(quán)值的初始化:權(quán)值的初始值應(yīng)該選擇均勻分布的小數(shù)經(jīng)驗(yàn)值。初始值過大或者過小都會影響學(xué)習(xí)速率。為了避免權(quán)值的調(diào)整是同向的,應(yīng)該將初始值設(shè)為隨機(jī)數(shù)。2、初始權(quán)值不要太大:否則可能會處于誤差平面較平坦的區(qū)域,從而導(dǎo)致算法無法收斂,訓(xùn)練失敗。3、神經(jīng)元的激勵(lì)函數(shù)是S型函數(shù),所以如果函數(shù)的漸近值是0、1的話,期望輸出只能是大于0小于1的數(shù),而不能是1或者0,否則可能會導(dǎo)致算法不收斂,所以在程序中用0.1來代表0,用0.9來代表1。雖然BP網(wǎng)絡(luò)是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò),但它在實(shí)際應(yīng)用中也存在自身的不足,其主要表現(xiàn)在以下幾個(gè)方面:1、局部極小值問題BP算法采用的是梯度下降法,它是一種非線性優(yōu)化算法,這就不可避免地存在局部極小值問題。即BP算法可以使網(wǎng)絡(luò)權(quán)值收斂到一個(gè)解,但它并不能保證所求的解為誤差超平面的全局最小解,很可能是一個(gè)局部極小解。在解決稍復(fù)雜問題時(shí),誤差函數(shù)可能陷入一個(gè)局部極小區(qū)域,使網(wǎng)絡(luò)訓(xùn)練無法跳出這一局部極小值,致使學(xué)習(xí)過程失敗。2、學(xué)習(xí)算法的收斂速度慢究其原因有三個(gè):一是網(wǎng)絡(luò)的學(xué)習(xí)速率太小所造成的;二是網(wǎng)絡(luò)容易陷入“癱瘓”狀態(tài)。標(biāo)準(zhǔn)算法均選用Sigmoid非線性函數(shù)作為神經(jīng)元的轉(zhuǎn)移函數(shù),我們把S型函數(shù)的值接近0或1定義域兩端定義為飽和區(qū),中間為非飽和區(qū),在飽和區(qū),函數(shù)值對自變量的變化不敏感。某個(gè)神經(jīng)元處于飽和區(qū)時(shí),如果神經(jīng)元的輸出不是期望的輸出值,而權(quán)值調(diào)節(jié)量又很小,就很難將該神經(jīng)元的狀態(tài)調(diào)整過來,因而影響了網(wǎng)絡(luò)的收斂速度;三是標(biāo)準(zhǔn)BP算法采用式(4-8)。為誤差函數(shù),隨著學(xué)習(xí)次數(shù)的增加,越來越小,使函數(shù)逼近速度減慢。(4-8)3、隱層節(jié)點(diǎn)數(shù)目及初始權(quán)值的選取的問題網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)及初始權(quán)值的選取對網(wǎng)絡(luò)的收斂有較大的影響,但它們的確定僅憑經(jīng)驗(yàn)而缺乏足夠的理論指導(dǎo)。經(jīng)過圖像的預(yù)處理以后,可以將最終提取到的字符特征送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練及識別了,這里,假定的字符標(biāo)準(zhǔn)規(guī)一化的寬度為8,高度為16,那么對于每一個(gè)字符就有128維的特征。設(shè)計(jì)的BP網(wǎng)絡(luò)關(guān)鍵在于高效的特征提取方法,大量有代表性的訓(xùn)練樣本、高效穩(wěn)定收斂的學(xué)習(xí)方法。BP網(wǎng)絡(luò)應(yīng)用過程如圖4-2:圖4-2BP網(wǎng)絡(luò)應(yīng)用流程4.3.3BP神經(jīng)網(wǎng)絡(luò)識別算法實(shí)現(xiàn)以上算法是針對車牌圖像中數(shù)字字符進(jìn)行識別。對漢字和字母不能進(jìn)行識別,所以輸入的車牌已經(jīng)將漢字和字母除去,只是對其中的數(shù)字部分做識別。在進(jìn)行網(wǎng)絡(luò)訓(xùn)練時(shí)將訓(xùn)練樣本的特征向量矩陣帶入網(wǎng)絡(luò),經(jīng)過多次訓(xùn)練使實(shí)際輸出與期望輸出的誤差值盡量的小,提高識別準(zhǔn)確率。數(shù)字字符識別函數(shù)為CodeRecognize。函數(shù)的實(shí)現(xiàn)流程如圖4-3所示。圖4-3字符識別流程圖4.4實(shí)驗(yàn)結(jié)果分析實(shí)驗(yàn)結(jié)果如下面的圖所示。在實(shí)驗(yàn)的過程中發(fā)現(xiàn)該算法的識別率不是特別的高,經(jīng)常出現(xiàn)誤識和拒識,而導(dǎo)致錯(cuò)誤的出現(xiàn)。只有在比較理想的情況下才能做出正確的識別。通過以上實(shí)驗(yàn)結(jié)果,不難看出,噪聲較小的理想數(shù)字圖片可以比較容易的做出正確的識別。但是在識別車輛牌照中的數(shù)字字符時(shí)還是有比較大的錯(cuò)誤,識別的不準(zhǔn)確。這是由以下4點(diǎn)原因造成的:1、訓(xùn)練樣本:該實(shí)驗(yàn)中的訓(xùn)練樣本的字體與車牌數(shù)字字符的字體并不是同一種字體,所以由于訓(xùn)練樣本的原因,使得識別車牌中的數(shù)字時(shí)不太準(zhǔn)確。圖4-4訓(xùn)練樣本圖4-5訓(xùn)練樣本的識別結(jié)果圖4-6正確識別的數(shù)字圖片圖4-7車牌數(shù)字字符的識別結(jié)果圖4-8車牌數(shù)字字符識的別結(jié)果2、特征提?。涸搶?shí)驗(yàn)中采用的特征提取方法是逐象素特征提取法,該算法具有算法簡單、計(jì)算速度快等優(yōu)點(diǎn),但是它也有缺點(diǎn)即適應(yīng)性不強(qiáng),在實(shí)驗(yàn)中必須將樣本的特征向量維數(shù)以倍數(shù)加大,這樣才能進(jìn)一步將車牌的數(shù)字字符特征顯示,提高識別率,但是這會大大增加識別所用的時(shí)間,從而失去實(shí)際意義。3、隱層節(jié)點(diǎn)數(shù)目:在實(shí)驗(yàn)中,理想的數(shù)字圖片在識別時(shí)所用的隱層節(jié)點(diǎn)數(shù)為10,但是在識別車牌中的數(shù)字字符時(shí),必須適當(dāng)增加隱層節(jié)點(diǎn)數(shù)的數(shù)目。但是隱層節(jié)點(diǎn)數(shù)太大不僅會增加識別所用的計(jì)算時(shí)間,還會使識別率下降,所以要綜合考慮。4、最小均方誤差:在實(shí)驗(yàn)時(shí)應(yīng)該讓最小均方誤差盡量小,這樣才能使實(shí)際輸出與期望輸出更加接近,提高識別率??偨Y(jié)通過對車輛牌照識別算法的研究,在對車輛牌照識別系統(tǒng)有了初步的了解和認(rèn)識的同時(shí),也鞏固了以前所學(xué)過的諸如數(shù)字圖像處理、模式識別等課程。總的來說,本文所做的車輛牌照圖像識別算法的研究與實(shí)現(xiàn)只是整個(gè)智能交通管理系統(tǒng)和車輛識別系統(tǒng)中的一個(gè)很小的部分,但同時(shí)也是比較重要的部分。只有將算法優(yōu)化,才能在實(shí)際的應(yīng)用過程中減少誤識、拒識,提高識別的正確率,使整個(gè)系統(tǒng)正常工作。整個(gè)識別系統(tǒng)中還有許多不足之處和需要進(jìn)一步的改進(jìn)的地方,主要體現(xiàn)在以下幾個(gè)方面:1、牌照定位方面:由于二值化閾值選取的問題,只有在牌照底色與周圍的背景顏色有較大區(qū)別時(shí),才能做出正確分割,并不適合所有的車輛牌照,所以二值化方法即閾值的選取還有很大的改進(jìn)余地。另外定位算法還需要作進(jìn)一步的改進(jìn),由于車輛識別系統(tǒng)大多數(shù)都是在車輛行進(jìn)時(shí)進(jìn)行圖像拍攝,且都存在一定的拍攝角度,所以要求定位算法具有較強(qiáng)的適應(yīng)性,而在實(shí)驗(yàn)的過程中發(fā)現(xiàn),如果車牌存在較大的傾斜,則系統(tǒng)會出現(xiàn)錯(cuò)誤,這是另一點(diǎn)需要改進(jìn)的地方。2、神經(jīng)網(wǎng)絡(luò)識別中的特征提?。涸谏窠?jīng)網(wǎng)絡(luò)識別中存在有特征提取和無特征提取兩種方法。有特征提?。哼@一類系統(tǒng)實(shí)際上是傳統(tǒng)方法與神經(jīng)網(wǎng)絡(luò)方法技術(shù)的結(jié)合,這種方法可以充分利用人的經(jīng)驗(yàn)來獲取模式特征以及神經(jīng)網(wǎng)絡(luò)分類能力來識別字符。但它的抗干擾能力不如無特征提??;無特征提取:省去特征抽取,整個(gè)字符直接作為神經(jīng)網(wǎng)絡(luò)的輸入,這種方式下,系統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度大大增加了,輸入模式維數(shù)的增加導(dǎo)致了網(wǎng)絡(luò)規(guī)模的龐大。具體選擇哪種方法進(jìn)行識別值得研究。3、由于能力所限,漢字和字母的識別沒有實(shí)現(xiàn),這是整個(gè)軟件系統(tǒng)的巨大缺陷,沒有漢字和字母的識別,整個(gè)系統(tǒng)就不能實(shí)現(xiàn)對車牌的識別。實(shí)現(xiàn)對漢字和字母的識別是以后的工作重點(diǎn)。致謝畢業(yè)設(shè)計(jì)的結(jié)束,也意味著四年大學(xué)生活走到了終點(diǎn)?;厥姿哪甑拇髮W(xué)生活,往事歷歷在目。即將畢業(yè),有激動更帶傷感。首先,我要借此機(jī)會向指導(dǎo)老師方艷紅表示衷心的感謝。在實(shí)驗(yàn)和撰寫論文的過程中,方老師都給與了我極大的幫助,給出了許多很好的建議和要求,使我在做畢業(yè)設(shè)計(jì)的過程中受益匪淺。其次,要感謝許多幫助過我的同學(xué),是他們在我遇到困難時(shí)幫助了我,并提供了許多很好的資料。我的畢業(yè)設(shè)計(jì)的完成離不開他們的幫助。最后,感謝西南科技大學(xué)四年以來對我的辛勤培育,使我完成了大學(xué)學(xué)業(yè)。感謝教過我的老師和我的同班同學(xué),使我度過了愉快的大學(xué)時(shí)光。參考文獻(xiàn)[1]王科.汽車牌照識別算法研究[D].重慶:重慶大學(xué),2004.[2]戴青云,余英林.一種基于小波和形態(tài)學(xué)的車牌圖像分割方法[J].中國圖象圖形學(xué)報(bào),2000(5):411-415[3]胡小峰,趙輝.VisualC++/MATLAB圖像處理與識別實(shí)用案例精選[M].北京:人民郵電出版社,2004:144-179,264-420.[4]張引,潘云鶴.彩色汽車圖像牌照定位新方法[J].中國圖象圖形學(xué)報(bào).2001(4):374-377.[5]姚德宏.基于神經(jīng)網(wǎng)絡(luò)的汽車牌照提取研究[J].計(jì)算機(jī)應(yīng)用,2001(6):40-42.[6]郭捷,施鵬飛.基于顏色和紋理的車牌定位方法[J].中國圖象圖形學(xué)報(bào),2002(5):472-476.[7]DanianZheng,YannanZhao,JiaxinWang.Anefficientmethodoflicenseplatelocation[J].Beijing:TsinghuaUniversity,2004[8]SherinM.Youssef,ShazaB.AbdelRahman.Asmartaccesscontrolusinganefficientlicenseplatelocationandrecognitionapproach[M].DepartmentofComputerEngineering,Collegeof[9]岡薩雷斯.數(shù)字圖像處理(第二版)[M].北京:電子工業(yè)出版社,2003:59-170,460-514.[10]WenjingJia,HuaifengZhang,XiangjianHe.Region-basedlicenseplatedetection[M]UniversityofTechnology,Sydney,P.O.Box123[11]周景超,陳鋒.車牌字符分割的研究和實(shí)現(xiàn)[J].合肥:中國科學(xué)技術(shù)大學(xué)自動化系,2006,32(5):238-243.[12]陶軍.車牌識別技術(shù)研究與實(shí)現(xiàn)[D].南京:南京理工大學(xué),2004.[13]江煒亮.車牌圖像自動定位與識別算法的研究[D].長沙:國防科學(xué)技術(shù)大學(xué)研究生院,2003.[14]張引.面向車輛牌照字符識別的預(yù)處理算法[J].計(jì)算機(jī)應(yīng)用研究,1999(7):85-87.[15]王智文.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的車牌字符識別研究[J].廣西工學(xué)院學(xué)報(bào),2006,17(3):86-88.[16]張思遠(yuǎn),樊志遠(yuǎn),吳仁彪.車牌識別預(yù)處理中的二值化及傾斜矯正算法[J].中國民用航空學(xué)院學(xué)報(bào),2006(2)[17]朱浩悅,耿國華,周明全.車牌識別中二值化方法的研究[J].計(jì)算機(jī)應(yīng)用與軟件,2007(2)[18

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論