基于神經(jīng)網(wǎng)絡(luò)的車(chē)牌照字符識(shí)別_第1頁(yè)
基于神經(jīng)網(wǎng)絡(luò)的車(chē)牌照字符識(shí)別_第2頁(yè)
基于神經(jīng)網(wǎng)絡(luò)的車(chē)牌照字符識(shí)別_第3頁(yè)
基于神經(jīng)網(wǎng)絡(luò)的車(chē)牌照字符識(shí)別_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于神經(jīng)網(wǎng)絡(luò)的車(chē)牌照字符識(shí)別文章摘要:本文介紹了字符識(shí)別的各種方法,重點(diǎn)討論了用神經(jīng)網(wǎng)絡(luò)方法對(duì)車(chē)牌照字符的識(shí)別,用matlab完成了對(duì)車(chē)牌照數(shù)字識(shí)別的模擬,最后給出實(shí)驗(yàn)結(jié)果。關(guān)鍵詞:bp神經(jīng)網(wǎng)絡(luò)模式識(shí)別matlab引言字符識(shí)別是模式識(shí)別領(lǐng)域的一項(xiàng)傳統(tǒng)的課題,這是因?yàn)樽址R(shí)別不是一個(gè)孤立的問(wèn)題,而是模式識(shí)別領(lǐng)域中大多數(shù)課題都會(huì)遇到的基本問(wèn)題,并且在不同的課題中,由于具體的條件不同,解決的方法也不盡相同,因而字符識(shí)別的研究仍具有理論和實(shí)踐意義。這里討論的是用神經(jīng)網(wǎng)絡(luò)識(shí)別數(shù)字的問(wèn)題. 人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別方法是近些年提出的新方法,為字符識(shí)別研究提供了一種新手段,它具有一些傳統(tǒng)技術(shù)所沒(méi)有的優(yōu)點(diǎn):良好的

2、容錯(cuò)能力、分類(lèi)能力強(qiáng)、并行處理能力和自學(xué)習(xí)能力。因而,采用神經(jīng)網(wǎng)絡(luò)識(shí)別方式是一種很好的選擇。一、模式識(shí)別方法的比較針對(duì)模式特征的不同選擇及其判別決策方法的不同,可將模式識(shí)別方法大致分為5大類(lèi)。這5種識(shí)別方法均可實(shí)現(xiàn)字符識(shí)別,但它們特點(diǎn)不同,必須根據(jù)條件進(jìn)行選擇。1 統(tǒng)計(jì)模式法:對(duì)已知類(lèi)別的模式樣本進(jìn)行各種特征的提取和分析,選取對(duì)分類(lèi)有利的特征,并對(duì)其統(tǒng)計(jì)均值等按已知類(lèi)別分別進(jìn)行學(xué)習(xí),按貝葉斯最小誤差準(zhǔn)則,根據(jù)以上統(tǒng)計(jì)特征設(shè)計(jì)出一個(gè)分類(lèi)誤差最小的決策超平面,識(shí)別過(guò)程就是對(duì)未知模式進(jìn)行相同的特征提取和分類(lèi),通過(guò)決策平面方程決定該特征相應(yīng)的模式所屬的類(lèi)別。此方法比較成熟,能考慮干擾、噪聲等的影響,識(shí)

3、別模式基元能力強(qiáng)。但對(duì)結(jié)構(gòu)復(fù)雜的模式抽取特征困難;不能反映模式的結(jié)構(gòu)特征,難以描述模式的性質(zhì);難以從整體角度考慮識(shí)別問(wèn)題。2 句法結(jié)構(gòu)方法:分為訓(xùn)練過(guò)程和識(shí)別過(guò)程:訓(xùn)練過(guò)程就是用已知結(jié)構(gòu)信息的模式作為訓(xùn)練樣本,先識(shí)別出基元和它們之間的連接關(guān)系,并用字母符號(hào)表示它們,然后用構(gòu)造句子的方法來(lái)描述生成這些場(chǎng)景的過(guò)程,并由此推斷出生成該場(chǎng)景的一種文法規(guī)則;識(shí)別過(guò)程就是對(duì)未知結(jié)構(gòu)的模式進(jìn)行基元識(shí)別及其相互關(guān)系分析,然后用訓(xùn)練過(guò)程中獲得的文法對(duì)其作句法分析,如果它能被已知結(jié)構(gòu)信息的文法分析出來(lái),則該模式具有與該文法相同的結(jié)構(gòu),否則就可判定不是這種結(jié)構(gòu)。此方法識(shí)別方便,可從簡(jiǎn)單的基元開(kāi)始,由簡(jiǎn)至繁;能反映模

4、式的結(jié)構(gòu)特征,能描述模式的性質(zhì),對(duì)圖像畸變的抗干擾能力較強(qiáng),但當(dāng)存在干擾及噪聲時(shí),抽取基元困難,且易失誤。3 邏輯特征法:就是其特征的選擇對(duì)一類(lèi)模式識(shí)別問(wèn)題來(lái)說(shuō)是獨(dú)一無(wú)二的,即在一類(lèi)問(wèn)題中只有1個(gè)模式具有某1種(或某1組合的)邏輯特征,此方法建立了關(guān)于知識(shí)表示及組織,目標(biāo)搜索及匹配的完整體系;對(duì)需通過(guò)眾多規(guī)則的推理達(dá)到識(shí)別目標(biāo)的問(wèn)題,有很好的效果,但當(dāng)樣品有缺損,背景不清晰,規(guī)則不明確甚至有歧義時(shí),效果不好。4 模糊模式方法:就是在模式識(shí)別過(guò)程中引入了模糊集的概念,由于隸屬度函數(shù)作為樣品與模板相似程度的量度,故能反映整體的、主要的特性,模糊模式有相當(dāng)程度的抗干擾與畸變,從而允許樣品有相當(dāng)程度的

5、干擾與畸變,但準(zhǔn)確合理的隸屬度函數(shù)往往難以建立。目前有學(xué)者在研究,并將其引入神經(jīng)網(wǎng)絡(luò)方法形成模糊神經(jīng)網(wǎng)絡(luò)識(shí)別系統(tǒng)。5 神經(jīng)網(wǎng)絡(luò)方法:就是使用人工神經(jīng)網(wǎng)絡(luò)方法實(shí)現(xiàn)模式識(shí)別??商幚硪恍┉h(huán)境信息十分復(fù)雜,背景知識(shí)不清楚,推理規(guī)則不明確的問(wèn)題,允許樣品有較大的缺損、畸變,神經(jīng)網(wǎng)絡(luò)方法的缺點(diǎn)是其模型在不斷豐富完善中,目前能識(shí)別的模式類(lèi)還不夠多,神經(jīng)網(wǎng)絡(luò)方法允許樣品有較大的缺損和畸變,其運(yùn)行速度快,自適應(yīng)性能好,具有較高的分辨率。二、神經(jīng)網(wǎng)絡(luò)字符識(shí)別系統(tǒng)神經(jīng)網(wǎng)絡(luò)的字符識(shí)別系統(tǒng)是神經(jīng)網(wǎng)絡(luò)模式識(shí)別系統(tǒng)的一種,原理是一致的。一般神經(jīng)網(wǎng)絡(luò)字符識(shí)別系統(tǒng)由預(yù)處理,特征提取和神經(jīng)網(wǎng)絡(luò)分類(lèi)器組成。預(yù)處理就是將原始數(shù)據(jù)中的

6、無(wú)用信息刪除,平滑,二值化和進(jìn)行幅度歸一化等。神經(jīng)網(wǎng)絡(luò)字符識(shí)別系統(tǒng)中的特征提取部分不一定存在,這樣就分為兩大類(lèi):(1)有特征提取部分的:這一類(lèi)系統(tǒng)實(shí)際上是傳統(tǒng)方法與神經(jīng)網(wǎng)絡(luò)方法技術(shù)的結(jié)合,這種方法可以充分利用人的經(jīng)驗(yàn)來(lái)獲取模式特征以及神經(jīng)網(wǎng)絡(luò)分類(lèi)能力來(lái)識(shí)別字符。特征提取必須能反應(yīng)整個(gè)字符的特征。但它的抗干擾能力不如第2類(lèi)。(2)無(wú)特征提取部分的:省去特征抽取,整個(gè)字符直接作為神經(jīng)網(wǎng)絡(luò)的輸入(有人稱此種方式是使用字符網(wǎng)格特征),這種方式下,系統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度大大增加了,輸入模式維數(shù)的增加導(dǎo)致了網(wǎng)絡(luò)規(guī)模的龐大。此外,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)需要完全自己消除模式變形的影響。但是網(wǎng)絡(luò)的抗干擾性能好,識(shí)別率

7、高。構(gòu)造神經(jīng)網(wǎng)絡(luò)分類(lèi)器首先要選擇適當(dāng)?shù)木W(wǎng)絡(luò)結(jié)構(gòu):神經(jīng)網(wǎng)絡(luò)分類(lèi)器的輸入就是數(shù)字字符的特征向量;神經(jīng)網(wǎng)絡(luò)分類(lèi)器的輸出節(jié)點(diǎn)應(yīng)該是字符數(shù)。10個(gè)數(shù)字輸出層就有個(gè)10個(gè)神經(jīng)元,每個(gè)神經(jīng)元代表一個(gè)數(shù)字;隱層數(shù)要選好,每層神經(jīng)元數(shù)要合適,目前有很多采用一層隱層的網(wǎng)絡(luò)結(jié)構(gòu)。然后要選擇適當(dāng)?shù)膶W(xué)習(xí)算法,這樣才會(huì)有很好的識(shí)別效果。在學(xué)習(xí)階段應(yīng)該用大量的樣本進(jìn)行訓(xùn)練學(xué)習(xí),通過(guò)樣本的大量學(xué)習(xí)對(duì)神經(jīng)網(wǎng)絡(luò)的各層網(wǎng)絡(luò)的連接權(quán)值進(jìn)行修正,使其對(duì)樣本有正確的識(shí)別結(jié)果,這就像人記數(shù)字一樣,網(wǎng)絡(luò)中的神經(jīng)元就像是人腦細(xì)胞,權(quán)值的改變就像是人腦細(xì)胞的相互作用的改變,神經(jīng)網(wǎng)絡(luò)在樣本學(xué)習(xí)中就像人記數(shù)字一樣,學(xué)習(xí)樣本時(shí)的網(wǎng)絡(luò)權(quán)值調(diào)整就相當(dāng)于人

8、記住各個(gè)數(shù)字的形象,網(wǎng)絡(luò)權(quán)值就是網(wǎng)絡(luò)記住的內(nèi)容,網(wǎng)絡(luò)學(xué)習(xí)階段就像人由不認(rèn)識(shí)數(shù)字到認(rèn)識(shí)數(shù)字反復(fù)學(xué)習(xí)過(guò)程是一樣的。神經(jīng)網(wǎng)絡(luò)是按整個(gè)特征向量的整體來(lái)記憶數(shù)字的,只要大多數(shù)特征符合曾學(xué)習(xí)過(guò)的樣本就可識(shí)別為同一字符,所以當(dāng)樣本存在較大噪聲時(shí)神經(jīng)網(wǎng)絡(luò)分類(lèi)器仍可正確識(shí)別。在字符識(shí)別階段,只要將輸入進(jìn)行預(yù)處理,特征提取后的特征向量作為神經(jīng)網(wǎng)絡(luò)分類(lèi)器的輸入,經(jīng)過(guò)網(wǎng)絡(luò)的計(jì)算,分類(lèi)器的輸出就是識(shí)別結(jié)果。三、bp神經(jīng)網(wǎng)絡(luò)這里我們采用bp神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行車(chē)輛字符的識(shí)別。bp網(wǎng)絡(luò)是采用widrow-hoff學(xué)習(xí)算法和非線性可微轉(zhuǎn)移函數(shù)的多層網(wǎng)絡(luò)。一個(gè)典型的bp網(wǎng)絡(luò)采用的是梯度下降算法,也就是widrow-hoff算法所規(guī)定

9、的。backpropagation就是指的為非線性多層網(wǎng)絡(luò)計(jì)算梯度的方法。一個(gè)典型的bp網(wǎng)絡(luò)結(jié)構(gòu)如圖所示:我們將它用向量圖表示如下: 其中:對(duì)于第k個(gè)模式對(duì),輸出層單元的j的加權(quán)輸入為 ,該單元的實(shí)際輸出為 ,而隱含層單元i的加權(quán)輸入為 ,該單元的實(shí)際輸出為 ,函數(shù)f為可微分遞減函數(shù) 。其算法描述如下:(1)初始化網(wǎng)絡(luò)及學(xué)習(xí)參數(shù),如設(shè)置網(wǎng)絡(luò)初始權(quán)矩陣、學(xué)習(xí)因子等。(2)提供訓(xùn)練模式,訓(xùn)練網(wǎng)絡(luò),直到滿足學(xué)習(xí)要求。(3)前向傳播過(guò)程:對(duì)給定訓(xùn)練模式輸入,計(jì)算網(wǎng)絡(luò)的輸出模式,并與期望模式比較,若有誤差,則執(zhí)行(4);否則,返回(2)。(4)后向傳播過(guò)程:a.計(jì)算同一層單元的誤差;b.修正權(quán)值和閾值;

10、c.返回(2)四、車(chē)牌數(shù)字識(shí)別我采用matlab來(lái)模擬用神經(jīng)網(wǎng)絡(luò)進(jìn)行車(chē)牌照數(shù)字識(shí)別這一過(guò)程。作為對(duì)比,一種采用提取特征部分的方法,一組采用無(wú)特征部分提取的方法。提取特征法采用投影-變換系數(shù)法進(jìn)行特征提取。設(shè)為圖形尺寸,()和()分別是圖形在軸和軸上的投影,對(duì)它們進(jìn)行fourier變換得到k個(gè)變換系數(shù),從k個(gè)變換系數(shù)gk(k0,1,2,k-1)中選出m個(gè)有代表性的特征,使它滿足類(lèi)間距離要大、類(lèi)內(nèi)距離要小,這里選出16個(gè)作為有代表性的特征作為網(wǎng)絡(luò)輸入。由于神經(jīng)網(wǎng)絡(luò)對(duì)圖形的旋轉(zhuǎn)、平移敏感,車(chē)牌照數(shù)字的獲取中不可避免的存在這一類(lèi)問(wèn)題,所以即使是采用無(wú)特征部分提取的時(shí)候,也要對(duì)圖形進(jìn)行處理,這里對(duì)圖形矩

11、陣進(jìn)行二維fft變換,分別得到矩陣的幅值和相值,通過(guò)實(shí)驗(yàn)可知網(wǎng)絡(luò)對(duì)變換矩陣的相值收斂性好,因此這里取矩陣的相值作為網(wǎng)絡(luò)輸入。我取了0-9共十個(gè)數(shù)字作為待識(shí)別數(shù),每個(gè)數(shù)字取6個(gè)樣本進(jìn)行訓(xùn)練,共有60個(gè)訓(xùn)練樣本,另取10個(gè)樣本作為識(shí)別樣本。神經(jīng)網(wǎng)絡(luò)采用三層結(jié)構(gòu),提取特征法有16個(gè)輸入,隱含層取24個(gè)神經(jīng)元,輸出為十個(gè),無(wú)特征提取法有16x16個(gè)輸入,隱含層取24個(gè)神經(jīng)元,輸出也為10個(gè),取最大輸出端對(duì)應(yīng)的數(shù)字作為識(shí)別結(jié)果,如果所有輸出端的結(jié)果都小于0.5,則認(rèn)為系統(tǒng)無(wú)法識(shí)別。其收斂波形如下圖所示:有特征提取法的收斂圖像 無(wú)特征提取法的收斂圖像由圖可知,兩種不同方法的收斂速度,采用無(wú)特征提取法要快的多,但是由于其網(wǎng)絡(luò)規(guī)模要比特整體取法大,每一次訓(xùn)練所耗時(shí)間要長(zhǎng),所以總的訓(xùn)練時(shí)間兩者相差不多。識(shí)別樣本和識(shí)別結(jié)果示例如附錄所示。根據(jù)結(jié)果來(lái)看,采用無(wú)特征提取得到字符識(shí)別率為84.3%,采用有特征提取得到的字符識(shí)別率為92.9%,后者明顯高于前者。如要進(jìn)提高識(shí)別率,可以考慮改良

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論