車牌識別科研實訓報告_第1頁
車牌識別科研實訓報告_第2頁
車牌識別科研實訓報告_第3頁
車牌識別科研實訓報告_第4頁
車牌識別科研實訓報告_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 科研實訓報告題 目: 汽車牌照識別技術研究與實現(xiàn) 院 系: 數(shù)學與計算機科學學院 專 業(yè): _ 信息與計算科學_ 年 級: _ 2011級_ 學 號: 031101217 _ _ 姓 名: 陳 龍_ _ _ 指導教師: 李劍敏_ _ _ 實習地點: 福州大學_ _ 2015年 04月 30日17目 錄摘 要ABSTRACT第一章 緒 論1第二章 相關工作22.1下載MATLAB,并對其進行初步的了解22.2通過MATLAB實現(xiàn)數(shù)字圖像的幾何變換,進一步熟悉MATLAB22.3學習數(shù)字圖像處理中的圖像獲取62.4圖像增強72.5圖像復原7第三章 車牌定位與字符分割73.1車牌定位83.2字符分

2、割8第四章 字符識別114.1 人工神經(jīng)網(wǎng)絡模式識別方法的優(yōu)點及其組成114.2 BP算法11結(jié)論11謝辭13參考文獻14摘 要 車牌識別是現(xiàn)代智能交通系統(tǒng)中的重要組成部分之一,應用十分廣泛。它以數(shù)字圖像處理、模式識別、計算機視覺等技術基礎,對攝像機所拍攝的車輛圖像或者視頻序列進行分析,得到每一輛汽車唯一的車牌號碼,從而完成識別過程。通過一些后續(xù)處理的手段可以實現(xiàn)停車場收費管理、交通流量控制指標測量,車牌定位,汽車防盜,高速公路超速自動化監(jiān)管等等。對于維護交通安全和城市治安,防止交通堵塞,實現(xiàn)交通自動化管理有著現(xiàn)實的意義。本技術是一門多學科的綜合技術,涉及數(shù)字圖形處理和神經(jīng)網(wǎng)絡技術。車牌自動識

3、別系統(tǒng)能將輸入的汽車圖像通過識別過程,輸出為幾個字節(jié)的字符串,無論在存儲空間的占用上還是在管理數(shù)據(jù)庫上都有無可比擬的優(yōu)越性,在停車場、交通部門的違章監(jiān)測、路橋收費上有廣闊的應用前景。在所攝的含有車牌的汽車照片中,先獲取車牌位置,再把車牌的各個字符分割,即指將一幅圖像分解為若干互不交疊的、有意義的、具有相同性質(zhì)的區(qū)域。指將反應物體真實情況的、占據(jù)不同區(qū)域的、具有不同特性的目標區(qū)分開來,并形成數(shù)字特征。提取出各個字符的特征,再利用BP神經(jīng)網(wǎng)絡進行識別,從而獲取車牌號碼。關鍵詞:車牌識別;Hough變換;字符識別;BP神經(jīng)網(wǎng)絡第一章 緒 論汽車牌照識別技術研究與實現(xiàn)一直是現(xiàn)代化交通發(fā)展中倍受關注的問

4、題,也是制約交通系統(tǒng)智能化、現(xiàn)代化的重要因素。車牌自動識別系統(tǒng)能將輸入的汽車圖像通過識別過程,輸出為幾個字節(jié)的字符串,無論在存儲空間的占用上還是 在管理數(shù)據(jù)庫上都有無可比擬的優(yōu)越性,在停車場、交通部門的違章監(jiān)測、 路橋收費上有廣闊的應用前景。整個車牌識別系統(tǒng)可分為以下的環(huán)節(jié)(如圖1-1)圖1-1車牌識別系統(tǒng)環(huán)節(jié)在車牌識別的問題上,人們提出了多種方法。包括在車牌定位上使用基于彩 色分割或區(qū)域生長法等技術;在字符識別上使用基于模板的匹配算法或基于統(tǒng)計 的匹配算法等技術。但這些技術往往由于圖像的噪聲或車牌位置的傾斜等原因 造成了圖像提取的模糊不清或者定位不準確等問題,使系統(tǒng)的識別率并不很 高 。所以

5、提出以下的方法設計車牌自動識別系統(tǒng):對于輸入的二值圖像采用Ho ugh變換的方法確定出車牌在照片中的位置,然后利用垂直投影法分割出各個不 同字符,再通過Fourier變換進行特征提取以及B P神經(jīng)網(wǎng)絡進行訓練、匹配, 從而得到輸出結(jié)果。第二章 相關工作2.1下載MATLAB,并對其進行初步的了解 在MATLAB官網(wǎng)上下載,并按其步驟進行安裝,記得改變環(huán)境變量。熟悉MATLAB7.0的工作界面,掌握MATLAB基本功能。 任意構造數(shù)組、構造矩陣;或取矩陣元素。 構造數(shù)組>> x=3 4 7 2 1X = 3 4 7 2 1>>a=4:8a= 4 5 6 7 8 構造矩陣&

6、gt;>A=1 3 42 4 ;2 5 7 8 A= 1 2 42 4 2 5 7 8 取矩陣元素A= 1 3 42 4 2 5 7 8>>A(2,4)ans = 8 實現(xiàn)矩陣運算B=2 56 7>>C=3 5; 7 5C=3 57 5>>B+Cans =5 10 13 12>>B-Cans =-1 0 -1 22.1.3方程求解與多項式運算 如求A(X)=X3+3X2+4X+5用向量表示為A=1 3 4 5>>A=1 3 4 5 A= 1 3 4 5 如下表示當X=4時多項式的解:>>Polyvalm(A,4)an

7、s=133如下表示求根:>>roots(A)ans=-2.2134-0.3933+1.4506i-0.3933-1.4506i2.1.4利用MATLAB讀取圖像、顯示圖像和保存圖像。 I=imread('image1.jpg')表示將圖像讀入數(shù)組I中。 imview(I)表示查看圖像。Imshow(I)表示顯示圖像。2.2通過MATLAB實現(xiàn)數(shù)字圖像的幾何變換,進一步熟悉MATLAB2.2.1 設計一個圖像的灰度線性變換,并編程實現(xiàn)變換效果,如圖2-1所示。 I=imread('C:UserspcDesktop2.jpg');imshow(I);I=

8、double(I);title('原始圖'); I=uint8(I); M,N=size(I);for i=1:M for j=1:N if I(i,j)<=30 I(i,j)=I(i,j); Else if I(i,j)<=150 I(i,j)=(200-30)/(150-30)*(I(i,j)-30)+30; else I(i,j)=(255-200)/(255-150)*(I(i,j)-150)+200; end endendimshow(I);title('線性變換');圖2-1灰度性線變換效果圖2.2.2旋轉(zhuǎn)30度:效果圖如圖2-2所示。I

9、=imread('C:UserspcDesktop2.jpg');C=imrotate(I,30,'bicubic'); imshow(C);title('旋轉(zhuǎn)30度');圖2-2旋轉(zhuǎn)30度效果圖2.2.3縮小13:效果圖如圖2-3所示。I=imread('C:UserspcDesktop2.jpg');A=imresize(I,13,'nearest'); imshow(A);title('縮小13');圖2-3縮小13效果圖2.3學習數(shù)字圖像處理中的圖像獲取 通過書本了解圖像獲取的大致過程:連續(xù)

10、的模擬圖像先經(jīng)過成像系統(tǒng)變成連續(xù)圖像,再經(jīng)過采樣系統(tǒng)產(chǎn)生采樣圖像,最后經(jīng)過量化器生成數(shù)字圖像。將連續(xù)函數(shù)變成離散函數(shù)最常用的采樣方法是等間隔采樣,即在x軸上等間隔地抽取函數(shù)f(x)的樣值。采樣后的圖像還不是數(shù)字圖像,必須將離散圖像的值表示為以其幅度成比例的整數(shù),即進行量化處理。掌握數(shù)字圖像的表示,圖像經(jīng)過采樣和量化后變成一幅數(shù)字圖像,為了方便表示,可用M*N階矩陣來表示,矩陣中的每個單元表示圖像單元,簡稱像素。坐標(x,y)處的值f(x,y)為離散的灰度值級,0<=f(x,y)<=L-1,其中L為圖像中不同灰度值的個數(shù)。學習了二進制圖像是將像素取成0或1的離散數(shù)值。索引圖像是一種把

11、像素直接作為RGB調(diào)色板下標的圖像。灰度圖像是由一個數(shù)據(jù)矩陣來描述,矩陣中的數(shù)據(jù)代表一定范圍的灰度級,通常用0表示黑色,1或255表示白色。RGB圖像是利用R、G、B三個分量表示一個像素的顏色,每個像素的三個顏色分量都存儲在矩陣的第三維中。2.4圖像增強圖像增強是對圖像進行加工,以得到對具體應用來說視覺效果更好的圖像。圖像增強技術主要分成:空域方法和頻域方法??沼蚴侵苯釉趫D像所在的像素空間進行處理,而根據(jù)處理的區(qū)域是單個像素還是子圖像塊又分成:點處理和空域濾波(后者基于模板)。頻域法是通過對圖像進行傅里葉變換后在頻域上間接進行圖像增強。主要是學習空域方法中的點處理:圖像求反、線性灰度變換、灰度

12、切割、直方圖均衡化與規(guī)定化等。基于一階導數(shù)的邊緣檢測算子包括Roberts算子、Sobel算子、Prewitt算子,在算法實現(xiàn)過程中,通過2×2(Roberts算子)或者3×3模板作為核與圖像中的每個像素點做卷積和運算,然后選取合適的閾值以提取邊緣。拉普拉斯邊緣檢測算子是基于二階導數(shù)的邊緣檢測算子,該算子對噪聲敏感。一種改進方式是先對圖像進行平滑處理,然后再應用二階導數(shù)的邊緣檢測算子,其代表是LOG算子。2.5圖像復原 圖像復原是認為圖像在某中情況下退化了,需要針對圖像的退化原因?qū)ζ溥M行補償,這需要對圖像的退化過程有一定的先驗知識,將圖像退化的過程模型化,并采用相反的過程盡

13、可能實現(xiàn)圖像的復原。將圖像退化原因作為線性系統(tǒng)退化的一個因素對待,建立系統(tǒng)退化模型來近似描述圖像函數(shù)的退化。通用的退化模型可以如下式所示:g(x,y)=H【f(x,y)】+n(x,y),其中f(x,y)為原始圖像,H為退化系統(tǒng)或退化算子,n(x,y)為外來加性噪聲,g(x,y)為退化后的圖像。圖像超分辨率重建是由多幀低分辨率圖像來估計出一幅較高分辨率的非變形圖像同時還能夠消除加性噪聲。對于一段場景變化不大的圖像序列來說這一組圖像具有相似但不完全相同的信息。其主要變化在于圖像中運動物體產(chǎn)生了空間位移。這些圖像之間的信息是冗余的,又是互補的因此可以認為這一組圖像從整體上記錄了更高分辨率圖像的信息。

14、超分辨率重構技術就是利用多幀低分辨率圖像中所帶有的不同的空域和時域信息再引入圖像的先驗約束以軟件的方法重建出更接近于原始圖像的重建圖像。2.6圖像檢測與分割 圖像分割是指將一幅圖像分解為若干互不交疊的、有意義的、具有相同性質(zhì)的區(qū)域。指將反應物體真實情況的、占據(jù)不同區(qū)域的、具有不同特性的目標區(qū)分開來,并形成數(shù)字特征。它是處于圖像預處理和圖像識別之間,起到關鍵作用。好的圖像分割應具備如下性質(zhì):(1)分割出來的各區(qū)域?qū)δ撤N性質(zhì)具有相似性,區(qū)域內(nèi)部是連通的且沒有過多小孔。(2)相鄰區(qū)域?qū)Ψ指钏罁?jù)的性質(zhì)具有明顯的差異。(3)區(qū)域邊界是明確的。邊緣是一個區(qū)域的開始,同時也是一個區(qū)域的結(jié)束,利用這個性質(zhì)可

15、以用來分割圖像。沿邊緣方向像素變化平緩,垂直于邊緣方向像素變化劇烈,邊緣上這種變化可以用微分算子檢測出來,通常用一階或二階導數(shù)來檢測邊緣。注意區(qū)分各個微分算子的優(yōu)缺點,算子的選擇直接影響到邊緣定位能力和噪聲抑制能力。閾值分割是基于灰度閾值的分割方法,通過設置閾值,把像素點按灰度級分若干類,從而實現(xiàn)圖像分割。把一幅灰度圖像變換成二值圖像是閾值分割的最簡單形式,以一定準則在f(x,y)中找出一個灰度值t作為閾值,將圖像分割成兩部分,大于該閾值的像素點的值設為1,小于該閾值的像素點的值設為0,其他閾值分割也是基于以上思想。第三章 車牌定位與字符分割3.1 車牌定位作為圖像的特征, 圖像的邊緣和區(qū)域有

16、重要的意義,因此對邊緣的檢測對于 圖像的分析和識別也是至關重要的。在車牌的圖像當中,車牌是一個具有一定長 寬比的矩形,可以采用已知形狀的曲線檢測( H o u g h變換 )的方法來確定車 牌的位置。Hough變換是把圖像平面中的點按照待求曲線的函數(shù)關系映射到參數(shù)空間,然后尋找最大凝聚點,由此最大點確定曲線位置 。車牌由四條直線組成 ,上下平行,左右平行,在此,先把它簡化為一條直線的位置檢測,再根據(jù)平行特 性找出四條相關的直線,從而找出車牌的位置 。直 線 Y = kx+b可 以 映 射 為 參 數(shù) 空 間 b=-kx+Y ,但是這情況下不 能檢測X :c的曲線。 3.2 字符分割字符分割可采

17、用垂直投影法。由于字符塊在豎直方向上 的投影必然在字符 間或字符內(nèi)的間隙處取得局部最小值,因此字符的正確分割位置應該在上述局部最小值的附近,并且這個位置應滿足車牌的字符書寫格式、字符尺寸限制和一些 其他條件。利用垂直投影法 ,對復雜環(huán)境下的汽車圖像中的字符分割有較好的效果。對已切割出來的車牌圖像在水平方向上從左到右檢測各坐標的投影數(shù)值 。檢測到第一個投影值不為0的坐標可視為首字符的左邊界,從該坐標向右檢測到第一個投影值為0 的坐標可視為首字符的右邊界, 其余字符的邊界坐標同理可得。通過字符的平均字寬和兩字符左邊界之間的平均距離去除可能存在的誤分。對于字寬小于平均字寬一定比例(如03)的字符則視

18、為無效字符;前后兩字符距離小于平均距離且此距離與字寬之和不大于平均距離則可以合并為一個字符。第四章 字符識別4.1人工神經(jīng)網(wǎng)絡模式識別方法的優(yōu)點及其組成人工神經(jīng)網(wǎng)絡模式識別方法是近些年提出的新方法,為字符識別研究提供 了一種新手段,它具有一些傳統(tǒng)技術所沒有的優(yōu)點:良好的容錯能力、分類能力 強、并行處理能力和 自學 習能 力 。 因而 , 采 用 神 經(jīng) 網(wǎng)絡 識 別 方 式 是一種很好的選擇。使用人工神經(jīng)網(wǎng)絡方法實現(xiàn)模式識別 ,其運行速度快,自適應性能好,具有較高的分辨率,可處理一些環(huán)境信息十分復雜,背景知識不清楚,推理規(guī)則不明確的問題,允許樣品有較大的缺損、畸變 ;該方法的缺點是其模型在不斷

19、豐富完善過程中,目前能識別的模式類還不夠多 。一般神經(jīng)網(wǎng)絡字符識別系統(tǒng)由預處理,特征提取和神經(jīng)網(wǎng)絡分類器組成 。預處理就是將原始 數(shù)據(jù)中的無用信息刪除,平滑等;特征提取必須能反應整個字符的特征;神經(jīng)網(wǎng) 絡分類器的輸入就是數(shù)字字符的特征向量 ;神經(jīng)網(wǎng)絡分類器的輸出節(jié)點應該是 字符數(shù) 。4.2 BP算法可采用BP神經(jīng)網(wǎng)絡來進行車輛字符的識別。BP網(wǎng)絡是采用非線性可微轉(zhuǎn)移 函數(shù)的多層網(wǎng)絡以及W i c k o wH o f提出的最小均方( Leastmean Square ) 學習算法 ,即LMS 算法。在該算法中,希望通過訓練網(wǎng)絡能找到一組權重,使 得函數(shù)的值最小。其中E為總誤差,為一種輸入模式

20、;括號內(nèi)第一項表示輸入模式為P 時輸出結(jié)點i 的期望值 ;第二項表示輸入模式為時輸出結(jié)點i 的實際值 。LMS 算法用到了梯度下降法,即權重的增量正比于誤差的負導數(shù) ,故每修改 一次權值,均向誤差減少的方向移動,從而整個系統(tǒng)表現(xiàn)出在權重空間中向誤差極小下移的特性。在字符識別中,實現(xiàn)的算法如下 :步驟 1 :將全部權值和結(jié)點的閾值預置為一個小的隨機值 。步驟 2 :加載輸入和輸出。在,n個輸入結(jié)點上加載,n 維輸入向量X ,并 指定每一輸出結(jié)點的期望值。步驟 3 :計算實際輸出結(jié)果值 Yl。步驟 4 :修正權值。其過程是由輸出結(jié)點開始,反向地向第一隱含層傳播由總誤差誘發(fā)的權值修正,即反向傳播(

21、B a c kP r o p a g a t i o n ) 。下一 時刻的互聯(lián)權值 ( +1 ) 在GDSS中的多Agent 系統(tǒng)的交互包括兩個處 理流程:對的分析,生成系統(tǒng)的內(nèi)部應用數(shù)據(jù) ;對要傳輸?shù)膽脭?shù)據(jù)進行封裝,生成符合XACL規(guī)范的字符流 。因為XACI符合XML的語法規(guī)則,因此對它的解析和封裝比較簡單、可靠。XML 作為通信語言使得GDSS中的多Agent系統(tǒng)處理信息得到簡化而且效率更高。從上面這段DTD來看,對于L的語法規(guī) 范定義非常簡單,Agent間每一次傳輸?shù)男畔⊿ender ,Receiver,In e n t和 Content等幾部分內(nèi)容。Sender是源Agent

22、 ;Re c e i v e r 是 目標 Agent ;Intent 表示這段語言所表達的行為,其中I n t e n t 的主要幾種類型是從 KQML借鑒而來,包括propose ,accept , reject 等 。Content 代表具體的通信內(nèi)容,它與具體的應用相關。除了各 A g e n t 之間的通信,還需要與本機其他軟件通信,例如:瀏覽器,電子會議系統(tǒng)中的NetMeeting 軟件等。結(jié)論車牌識別是一門多學科的綜合技術,涉及數(shù)字圖形處理和神經(jīng)網(wǎng)絡技術 , 采用以上的方法將取得良好的識別結(jié)果。下一步的研究將是在算法上考慮進一步的改良,在實現(xiàn)上可采 取可視化編程語言制作成軟件,投

23、入實際使用。多A g e n t 具有主動性、協(xié)作性 、智能性,表現(xiàn)出非常強的協(xié)調(diào)能力和合作能力,而分布環(huán)境下的群體決策活動需要強有力的協(xié)調(diào) 、 控制工具來支持。因此,在GDS中引入多A g e n t 技術是完全可行的。該系統(tǒng)在分布式環(huán) 境下利用多A g e n t 技術來構建G D S ,可以為企業(yè)全面、快速、有效的決策進行強有力的支持,從而全面提升企業(yè)的綜合競爭力。謝辭時光飛逝,歲月如梭,科研實訓工作即將畫上句點?;叵肫疬@科研實訓,短暫而又美好,開啟了我未來的職業(yè)生涯,這段時光將是我人生中最寶貴的財富。感謝在工作中給予過我?guī)椭娜藗?,為我未來職業(yè)生涯打開了大門。感謝我的導師李劍敏老師對我

24、的指導,從選題到程序設計,到科研實訓報告寫作都離不開老師的指導。有了她的細心的指導,我的這篇論文才能順利完成。在此,特別感謝李老師!感謝我們的論文小組的同學以及2011級數(shù)學專業(yè)的所有同學對我的幫助,還有我的舍友們對我的支持。還有感謝我的父母在這期間對我的支持,你們的鼓勵和期待增強了我克服困難的信心!參考文獻1 姚敏.字圖像處理M.北京:機械工業(yè)出版社,2006。2 劉勇奎,周曉敏,顏葉.的圖像處理算法的研究.計算機工程與設計,2001,22(5):71-75.3 劉勇奎,鄒善舉.圖像算法及幾何量定義.4 顏葉,王兆銳,劉勇奎.圖像處理算法.5 劉永奎.計算機圖形學的基礎算法.北京:科學出版社

25、,2007.6 Tian Yan1 Liu,Bin 2 Li Tao3.A Local Image Interpolation Method Based On-Gradient Analysis.7 Xiangjian He, Tom Hintz, Qiang Wu, Huaqing Wang and Wenjing Jia.A New Simulation. of Spiral Architecture.International Conference on Image Processing, Computer Vision. and Pattern Recognition,2006, pp.570-575.8 Atsushi Yabushita, Koichi Ogawa.Image Reconstruction With a Hexagonal Grid.Nuclear Science Symposium Conference Rec

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論