自由手寫體數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第1頁
自由手寫體數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第2頁
自由手寫體數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第3頁
自由手寫體數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第4頁
自由手寫體數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

自由手寫體字識(shí)別系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)摘要:本文論述并設(shè)計(jì)實(shí)現(xiàn)了一個(gè)脫機(jī)自由手寫體數(shù)字識(shí)別系統(tǒng)。文中首先對(duì)待識(shí)別數(shù)字的預(yù)處理進(jìn)行了介紹,包括二值化、平滑濾波、規(guī)范化、細(xì)化等圖像處理方法;其次,探討了如何提取數(shù)字字符的結(jié)構(gòu)特征和筆劃特征并詳細(xì)地描述了知識(shí)庫的構(gòu)造方法最后采用了以知識(shí)庫為基礎(chǔ)的模板匹配識(shí)別方法并以MATLAB作編程工具實(shí)現(xiàn)了具有友好的圖形用戶界面的自由手寫體數(shù)字識(shí)別系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,本方法具有較高的識(shí)別率,并具有較好的抗噪性能。關(guān)鍵詞:手寫體數(shù)字;預(yù)處理;模式識(shí)別;特征提取Abstrct:Thisanddesignsahandwrittenrecognitionthepretreatmentofthecharactertoberecognizedisintroduced,includingbinarization,smoothing,normalizationandtoextractstructuralfeaturesofnumbersisdiscussed,andwedescribetheconstructingmethodofrepository.Finally,weusethemethodoftemplatematching,basedonrepository,torecognizethedigitalnumber.Matlabisusedasatothishandwrittendigitalrecognitionsystemfriendlygraphicaluserinterface.Theexperimentalresultsshowthattherateoftherecognitionsystemishigh,andtheproposedmethodisrobusttonoise.Keywords:handwrittennumber;pretreatment;patternrecognition;featureextraction向成熟,并推出了很多使用系統(tǒng);另1

引OCR(OpticalCharacter

一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號(hào)組成的各種編號(hào)和統(tǒng)計(jì)數(shù)據(jù),如:郵政編碼、統(tǒng)計(jì)報(bào)表、Recognition)即光學(xué)字符識(shí)別技術(shù),是通過掃描儀把印刷體或手寫體文稿掃描成圖像,然后識(shí)別成相應(yīng)的計(jì)算機(jī)可直接處理的字符是模式識(shí)別的一個(gè)分支,按字體分類主要分為印刷體識(shí)別和手寫體識(shí)別兩大類。對(duì)于印刷體識(shí)別又可以分成單一字體單一字號(hào)和多種字體多種字號(hào)幾類。而手寫體識(shí)別又可分為受限手寫體和不受限手寫體兩類;按識(shí)別方式可分為在線識(shí)別和脫機(jī)識(shí)別兩類。字符識(shí)別處理的信息可分為兩大類:一類是文字信息,處理的主要是用各國(guó)家、各民族的文字(如:漢字,英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機(jī)手寫方面技術(shù)已趨

財(cái)務(wù)報(bào)表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識(shí)別。因此,手寫數(shù)字的識(shí)別研究有著重大的現(xiàn)實(shí)意義,一旦研究成功并投入使用,將產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)效益。在整個(gè)域中,最為困難的就是脫機(jī)自由手寫字符的識(shí)別。到目前為止,盡管人們?cè)诿摍C(jī)手寫英文、漢字識(shí)別的研究中已取得很多可喜成就,但距離實(shí)用還有一定距離。而在手寫數(shù)字識(shí)別這個(gè)方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實(shí)際使用推廣,為手寫數(shù)據(jù)的高速自動(dòng)輸入提供了一種解決方案。本文首先介紹了自由手寫體數(shù)字識(shí)別的基本原理,包括數(shù)字圖像預(yù)處預(yù)處理主要由二值化預(yù)處理主要由二值化,平滑去噪,法過最人即OTSU方法,大預(yù)圖擇,圖像改進(jìn)分類識(shí)別測(cè)試?yán)?、特征提取和模式識(shí)別的基本原理和方法;其次介紹了;最后通過基于MATLAB的實(shí)驗(yàn)結(jié)果,對(duì)本系的性能進(jìn)行了分析。

本系統(tǒng)主要由手寫體數(shù)字識(shí)別的訓(xùn)練過程和識(shí)別過程組成,訓(xùn)練過程和識(shí)別過程均包括預(yù)處理、特征提取和模式識(shí)別三部分統(tǒng)構(gòu)成如圖所示。2

手體字別基原待識(shí)對(duì)象數(shù)據(jù)采集,圖2.1分類識(shí)別下面分別介紹各部分工和消除,否則保留。以上每理過

一步都是一個(gè)鄰域運(yùn)算。細(xì)化是2.1

預(yù)處理訓(xùn)練過程

將一個(gè)曲線性數(shù)字細(xì)化為一條單像素訓(xùn)練樣本數(shù)據(jù)采集,特圖形化地顯示出其拓?fù)浞诸愖R(shí)別預(yù)處理和規(guī)范化,細(xì)化等組成。數(shù)字圖像預(yù)處理前后效果比較如本文采用了基于閾值的二值化算改進(jìn)數(shù)據(jù)采集,改進(jìn)為數(shù)字5預(yù)處理2.3為對(duì)圖.2預(yù)處理后的統(tǒng)計(jì)圖像的灰度直方圖選取全局閾結(jié)果圖。類似地,圖24數(shù)字“6”值,然后進(jìn)行二值化處理。的原始圖像,圖25為對(duì)圖.4預(yù)處其次,在二值化后利用均值濾波理后的結(jié)果圖。的方法消除孤立點(diǎn)、線的噪聲,這樣圖中就只剩下手寫體數(shù)字。在濾波中本文采用的是3*3大小的模板。平滑去噪后,對(duì)圖像進(jìn)行規(guī)范化處理。找出圖像中數(shù)字的邊界,然后提取出數(shù)字把它居中放置在正方形方框中,再對(duì)此正方形圖像進(jìn)行線性插值縮放,使它變?yōu)榻y(tǒng)一規(guī)格大小的圖像,文中一化圖像的大是36*36。在提取特征之前,要對(duì)手寫體數(shù)字進(jìn)行細(xì)化。本文是采用的基于數(shù)學(xué)形態(tài)學(xué)的細(xì)化算法。細(xì)化可用兩步腐蝕來實(shí)現(xiàn):第一步是正常的腐蝕,但它是有條件的,也就是說,那些被標(biāo)為可除去的像素點(diǎn)并不立即消去;在第二步中,只將那些消除后并不破壞

圖2.2

原圖圖2.3處后像

了節(jié)約資源,節(jié)省計(jì)算機(jī)存儲(chǔ)空間、處理時(shí)間、特征提取的費(fèi)用,有時(shí)更是為了可行性,在保證滿足分類識(shí)別正確率要求的條件下,按某種準(zhǔn)則盡量選用對(duì)正確分類識(shí)別作用較大的特征,使得用較少的特征就能完成分類識(shí)別任務(wù)。這項(xiàng)工作表現(xiàn)為減少特征矢量的維數(shù)或符號(hào)字符數(shù)。在本系統(tǒng)中采用對(duì)待識(shí)別數(shù)字圖像進(jìn)行行列掃描和數(shù)字起點(diǎn)結(jié)合的方法提取特征。2.2.1結(jié)構(gòu)特征提取首先對(duì)經(jīng)預(yù)處理后的圖像進(jìn)行分割,如圖2.6所示。圖2.4始像圖2.5

預(yù)理圖

圖2.6圖分對(duì)圖像分割后,結(jié)構(gòu)特征提取的算法如下:(1)對(duì)細(xì)化后的數(shù)字圖像取豎直的三條直線,分別取在5/12,1/2,7/12,下這三條豎直直線和數(shù)字筆段的交點(diǎn)數(shù)。2.2

特征提

(2),在特征提取的目的是從原始數(shù)據(jù)中抽取出用于區(qū)分不同類型的本質(zhì)特征。無論是識(shí)別過程還是學(xué)習(xí)過程,都要對(duì)研究對(duì)象固有的、本質(zhì)的重要特征或?qū)傩赃M(jìn)行量測(cè)并將結(jié)果數(shù)值化,形成特征矢量。通常能描述對(duì)象的元素很多,為

1/3,1/2,2/3處分別記下這三條水平直線和數(shù)字筆段的交點(diǎn)數(shù)。(3)再取對(duì)角兩條直線,分別記下這兩條對(duì)角直線和數(shù)字筆段的交點(diǎn)數(shù)。2.2.2筆劃特征提取經(jīng)細(xì)化后的數(shù)字圖像其特征較為穩(wěn),且筆劃簡(jiǎn),因此對(duì)其抽取的基本結(jié)構(gòu)組件能反映數(shù)字的本質(zhì)特征,從而可快速有效地識(shí)別數(shù)字符,達(dá)到較好的分類效果字端點(diǎn)如圖所示。提取筆劃特征的算法如下:(1)按從上到下,左到右的順序掃描預(yù)處理后圖像并選擇黑像素點(diǎn)P;(2)計(jì)算像素P的8-鄰域之和N;(3)若N=1,則像素P為端點(diǎn)端點(diǎn)計(jì)數(shù)器加一;(4)重復(fù)步驟1)-(3),到遍歷整個(gè)圖像。

2.2.3數(shù)字的特向量說依據(jù)上述特征提取方,系統(tǒng)中的特征矢量由9個(gè)分量組成,其排列如下所示:DATA=[豎直中線交點(diǎn)數(shù),豎直5/12處,豎直7/12處,水平中線交點(diǎn),水平1/3處交點(diǎn)數(shù),水平2/3處交點(diǎn)數(shù),左對(duì)角線交點(diǎn)數(shù),右對(duì)角線交點(diǎn)數(shù),端點(diǎn)數(shù)];2.3

知識(shí)庫建立由于本文采用的是基于模式知識(shí)庫的識(shí)別方法,所以對(duì)字符的結(jié)構(gòu)特征的分析以及字符模型的構(gòu)造是一個(gè)十分重要的環(huán)節(jié),圖就是對(duì)識(shí)別數(shù)字的標(biāo)準(zhǔn)形態(tài)進(jìn)行具體分析而構(gòu)造的模板。圖2.7字點(diǎn)圖2.8

規(guī)手體字態(tài)DATA0=[2,2,2,2,2,2,2,2,0]1DATA1=[1,0,0,1,1,1,1,1,2]1DATA2=[3,3,3,1,1,1,1,1,3]1DATA3=[3,2,3,1,1,1,2,2,3]1DATA4=[1,1,1,2,2,1,3,2,4]1DATA5=[3,3,3,1,1,1,2,2,4]1DATA6=[3,3,2,1,1,2,3,2,1]1

DATA7=[2,2,2,1,1,1,1,1,2]1DATA8=[4,4,4,2,2,2,2,2,0]1DATA9=[3,3,3,1,2,1,3,1,1]1由于本系統(tǒng)是對(duì)自由手寫體進(jìn)行識(shí)因而要考慮數(shù)字書寫體的多變性。通過對(duì)圖.9示數(shù)字變體的分析來對(duì)知識(shí)庫進(jìn)行補(bǔ)充。11221122圖手寫數(shù)變DATA0=[1,1,2,2,2,2,1,2,2]2DATA2=[3,2,2,1,1,1,1,3,2]2DATA3=[3,1,4,2,1,1,2,2,3]2DATA4=[1,2,2,3,3,1,2,2,2]2DATA5=[3,3,3,1,1,1,2,2,4]2DATA6=[3,1,3,1,1,2,2,2,2]2DATA8=[4,4,4,2,1,2,1,2,2]2DATA9=[3,2,3,2,1,1,3,1,3]2最后得到知識(shí)庫由上述兩套模板所組成。

點(diǎn)。其缺點(diǎn)是在建立知識(shí)庫時(shí)需要進(jìn)行大量的訓(xùn)練,當(dāng)知識(shí)庫中的模板增多時(shí),特征矢量間的距離會(huì)減小。3序計(jì)本次設(shè)計(jì)使用MATLAB語言實(shí)現(xiàn)該系統(tǒng),其用戶界面分別介紹如下。(1)讀入圖像:2.4本系統(tǒng)模式識(shí)別方在本次設(shè)計(jì)過程中我們選擇了模板匹配的識(shí)別方法過計(jì)算歐氏距離來衡量匹配程度。本系統(tǒng)中的特征矢量有9個(gè)分量,其計(jì)算距離公式如下:

所示。

讀入圖像的用戶界面如圖3.1xii

2

公(2.1)但在本次設(shè)計(jì)中我們計(jì)算距離時(shí)對(duì)上述公式進(jìn)行了改進(jìn),對(duì)于可靠性較高的端點(diǎn)數(shù)即最后一維特征值加大了權(quán)重,改進(jìn)后的距離計(jì)算公式如下:dxii99i公(2.2)在識(shí)別過程,分別計(jì)算待識(shí)別圖像的特征值和知識(shí)庫中兩個(gè)模板的距離,和10個(gè)數(shù)字逐個(gè)比較,距離最小的對(duì)應(yīng)的數(shù)字就是最后識(shí)別結(jié)果。該算法具有特征提取和模板建立都比較直觀,時(shí)間復(fù)雜度低,易于實(shí)現(xiàn)等優(yōu)

圖3.1讀圖(2)對(duì)圖像進(jìn)行各種處理:選擇對(duì)圖像的各種操作的用戶界面如圖示,對(duì)圖像取反的用戶界面如圖示,對(duì)圖像平滑去噪的用戶界面如圖示,對(duì)圖像進(jìn)行二值化操作的用戶界面如圖3.5所示,對(duì)圖像進(jìn)行規(guī)范化處理的用戶界面如圖示,對(duì)圖像進(jìn)行細(xì)化操作的用戶界面如圖3.7所示,圖選擇圖的種作

圖規(guī)化圖3.3像反

圖細(xì)(3)數(shù)字圖像的識(shí)別手寫數(shù)字進(jìn)行識(shí)別的結(jié)果顯示界面如圖38所示。圖平滑噪圖識(shí)別果示在上述界面中,系統(tǒng)可根據(jù)用戶對(duì)識(shí)別結(jié)果正誤的選擇,自動(dòng)計(jì)算識(shí)別識(shí)別率結(jié)果顯示在圖像界面上方。圖3..5二化4

實(shí)結(jié)及析在實(shí)驗(yàn)過程中我們以兩組樣本作為訓(xùn)練樣本對(duì)知識(shí)庫的參數(shù)進(jìn)行調(diào)

9合計(jì)

993

17

90%93%整,這兩組訓(xùn)練樣本分別為個(gè)規(guī)范手寫體樣本和個(gè)自由手寫體樣本范手寫體樣本訓(xùn)練結(jié)果如表41所示,自由手寫體樣本訓(xùn)練結(jié)果如表42示。

在測(cè)試實(shí)驗(yàn)中,我們以個(gè)規(guī)范手寫體和個(gè)自由手寫體共兩組樣本作為測(cè)試樣,識(shí)別實(shí)驗(yàn)結(jié)果分別如表.3,44示。表4.3規(guī)范寫識(shí)實(shí)結(jié)表4.1規(guī)范寫訓(xùn)結(jié)

數(shù)字類別

正識(shí)樣本數(shù)

誤識(shí)樣本數(shù)

識(shí)別率數(shù)字類別0

正識(shí)樣本數(shù)10109991010

誤識(shí)樣本數(shù)001111000

識(shí)別率100%100%90%90%90%90%100%100%100%

0合計(jì)

202018201918185

00322015

100%100%85%90%90%85%90%100%95%90%92.5%9合計(jì)

995

15

90%95%

由上表可以看,本系統(tǒng)對(duì)規(guī)范的手寫體有較好的識(shí)別效果,識(shí)別率達(dá)表4.2自由寫訓(xùn)結(jié)

到。數(shù)字類別0

正識(shí)樣本數(shù)10

誤識(shí)樣本數(shù)0

識(shí)別率100%

表4.4自由寫識(shí)結(jié)數(shù)字正識(shí)樣誤識(shí)別率類別本樣數(shù)

1098101010

021000

100%80%90%90%80%100%100%100%

0

16181820

104220

95%100%80%90%90%85%90%100%合計(jì)

1917182

1318

95%85%91

[4]

清華大學(xué)出版社[M],2003.蔡炯.于旋轉(zhuǎn)不變性的印刷體數(shù)識(shí)別[J].,由上表所示,字符2和的誤識(shí)率較高,常誤識(shí)別為對(duì)方數(shù)字,對(duì)待識(shí)別數(shù)字要求嚴(yán)格,這是由于它們的標(biāo)準(zhǔn)特征向量距離較小,需要通過增添標(biāo)準(zhǔn)庫或參數(shù)調(diào)整對(duì)此情況進(jìn)行改進(jìn)。

[5][6]

no.3,2002.郝紅衛(wèi).手寫體字符的識(shí)別和集[北:中國(guó)科學(xué)院聲學(xué)研究所,1998.馬向辰.字符識(shí)別系統(tǒng)中圖像預(yù)處理方法的研究北:北京5

結(jié)

科技大學(xué),2002.本文對(duì)自由手寫體數(shù)字識(shí)別的基本及方法了介,MATLAB具實(shí)現(xiàn)了自由手寫體數(shù)字識(shí)別系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,基于所用結(jié)構(gòu)模型和知識(shí)庫的識(shí)別方法對(duì)規(guī)范手寫體數(shù)字是可行的,具有較高的識(shí)別率及較好的抗噪性能,也可以識(shí)別一定條件下的自由手寫體數(shù)字。為了提高識(shí)別率和可靠性,除了要增強(qiáng)對(duì)噪聲的濾除能力外,還要增大知識(shí)庫,以解決細(xì)化中出現(xiàn)的結(jié)構(gòu)畸變問題,這些都有待我們進(jìn)一步的研究。參文

[7][8][9]

林曉帆,丁曉青,吳佑壽.手寫數(shù)字識(shí)別的原理及使用/number_descript.htm鄒.精

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論