手寫數(shù)字識別的過程_第1頁
手寫數(shù)字識別的過程_第2頁
手寫數(shù)字識別的過程_第3頁
手寫數(shù)字識別的過程_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、手寫數(shù)字識別的流程:1對所給出的圖像進行預(yù)處理使得方面后面的數(shù)字識別操作,包括圖像的二值化等2對圖像進行圖像的形態(tài)學(xué)操作,讓數(shù)字變得閉合,方便進行數(shù)學(xué)形態(tài)學(xué)的計算3用鼠標(biāo)提取每個數(shù)字的圖像,并對每個數(shù)字圖像作出包含連通區(qū)域的矩陣4根據(jù)數(shù)字的歐拉數(shù)和每個數(shù)字的其他不同特征識別數(shù)字5最后把識別的數(shù)字保存起來下面分別進行論述:1數(shù)字圖像的二值化原圖如下:2圖像的形態(tài)學(xué)操作,讓數(shù)字中未閉合的數(shù)字6、8、9閉合處理后的圖像如下:3用鼠標(biāo)提取每個數(shù)字的圖像,并對每個數(shù)字圖像作出包含連通區(qū)域的矩陣在提取圖像時要注意,盡量用最小的矩形包括這個數(shù)字,并且不要遺漏數(shù)字的任何部分在外面,這一步對后面的識別至關(guān)重要,

2、會非常影響數(shù)字的識別。提取出來二值圖像后,并把它變換成一個數(shù)字矩陣,這個矩陣會對圖像中不同的連通區(qū)域作出不同的標(biāo)記,這樣方便下面進行數(shù)字矩陣的特征提取。4根據(jù)數(shù)字的歐拉數(shù)和每個數(shù)字的其他不同特征識別數(shù)字識別數(shù)字8,只有8的歐拉數(shù)為2識別數(shù)字1,其離心率最大(0.9),并且它的最小外包矩形的長度大于寬度的兩倍對數(shù)字6,其歐拉數(shù)為1,用一條水平掃描線從上半部分進行掃描,有兩個交點對數(shù)字4,其歐拉數(shù)為1,用距離右邊框幾個象素的垂直線與它相交,有兩個象素,即可識別對數(shù)字0,其歐拉數(shù)為1,用一條水平掃描線從中間與它相交,有兩個交點,用一條垂直掃描線從中間與它相交,也有兩個交點,即可識別對數(shù)字9,其歐拉數(shù)

3、為1,用一條水平掃描線從下半部分進行掃描,有兩個交點,與6相反對數(shù)字2,其歐拉數(shù)為0,用距上邊框十幾個象素的水平線與它相交,有4個交點對3,用距中間位置的垂直線與它相交,有3個交點,且歐拉數(shù)為0對數(shù)字7,其歐拉數(shù)為0,從中間位置垂直掃描,有兩個交點剩下的就是數(shù)字5了試驗結(jié)果分析:總共進行了五組的試驗,試驗結(jié)果如下:b=1234567895b=1534567890b=5534567855b=1535557895b=1555565895從以上的試驗結(jié)果可以看出:如果用鼠標(biāo)提取圖像時,仔細小心的提取,會取得不錯的試驗效果,但是對于數(shù)字2和數(shù)字0,往往會有一定的誤差。后三組試驗,在提取數(shù)字時有意的將數(shù)

4、字區(qū)域擴大或者縮小,可以看出這樣對試驗結(jié)果的影響很大,會造成很大的誤差,這種識別方法的識別率大大降低。手寫數(shù)字識別的原理及應(yīng)用一、引言手寫數(shù)字識別是“光學(xué)字符識別技術(shù)”(簡稱OCR)的一個分支,它研究的對象是:如何利用電子計算機自動辨認人手寫在紙張上的阿拉伯?dāng)?shù)字。在整個OCR領(lǐng)域中,最為困難的就是脫機手寫字符的識別。到目前為止,盡管人們在脫機手寫英文、漢字識別的研究中已取得很多可喜成就,但距實用還有一定距離。而在手寫數(shù)字識別這個方向上,經(jīng)過多年研究,研究工作者已經(jīng)開始把它向各種實際應(yīng)用推廣,為手寫數(shù)據(jù)的高速自動輸入提供了一種解決方案。二、研究的實際背景字符識別處理的信息可分為兩大類:一類是文字

5、信息,處理的主要是用各國家、各民族的文字(如:漢字、英文等)書寫或印刷的文本信息,目前在印刷體和聯(lián)機手寫方面技術(shù)已趨向成熟,并推出了很多應(yīng)用系統(tǒng);另一類是數(shù)據(jù)信息,主要是由阿拉伯?dāng)?shù)字及少量特殊符號組成的各種編號和統(tǒng)計數(shù)據(jù),如:郵政編碼、統(tǒng)計報表、財務(wù)報表、銀行票據(jù)等等,處理這類信息的核心技術(shù)是手寫數(shù)字識別。這幾年來我國開始大力推廣的“三金”工程在很大程度上要依賴數(shù)據(jù)信息的輸入,如果能通過手寫數(shù)字識別技術(shù)實現(xiàn)信息的自動錄入,無疑會促進這一事業(yè)的進展。因此,手寫數(shù)字的識別研究有著重大的現(xiàn)實意義,一旦研究成功并投入應(yīng)用,將產(chǎn)生巨大的社會和經(jīng)濟效益。三、研究的理論意義手寫數(shù)字識別作為模式識別領(lǐng)域的一個

6、重要問題,也有著重要的理論價值:1、阿拉伯?dāng)?shù)字是唯一的被世界各國通用的符號,對手寫數(shù)字識別的研究基本上與文化背景無關(guān),這樣就為各國、各地區(qū)的研究工作者提供了一個施展才智的大舞臺。在這一領(lǐng)域大家可以探討,比較各種研究方法。2、由于數(shù)字識別的類別數(shù)較小,有助于做深入分析及驗證一些新的理論。這方面最明顯的例子就是人工神經(jīng)網(wǎng)絡(luò),相當(dāng)一部分的人工神經(jīng)網(wǎng)絡(luò)模型都以手寫數(shù)字識別作為具體的實驗平臺,驗證理論的有效性,評價各種方法的優(yōu)缺點。3、盡管人們對手寫數(shù)字的識別已從事了很長時間的研究,并已取得了很多成果,但到目前為止機器的識別本領(lǐng)還無法與人的認知能力相比,這仍是一個有難度的開放問題。4、手寫數(shù)字的識別方法

7、很容易推廣到其它一些相關(guān)問題,一個直接的應(yīng)用是對英文這樣的拼音文字的識別。事實上,很多學(xué)者就是把數(shù)字和英文字母的識別放在一塊兒研究的。四、基于手寫數(shù)字識別的典型應(yīng)用手寫數(shù)字識別有著極為廣泛的應(yīng)用前景,這也正是它受到世界各國的研究工作者重視的一個主要原因。下面我們將介紹基于手寫數(shù)字識別的應(yīng)用系統(tǒng)的特殊要求,以及一些以手寫數(shù)字識別技術(shù)為基礎(chǔ)的典型應(yīng)用。(一)手寫數(shù)字識別在大規(guī)模數(shù)據(jù)統(tǒng)計中的應(yīng)用在大規(guī)模的數(shù)據(jù)統(tǒng)計(如:行業(yè)年鑒、人口普查等)中,需要輸入大量的數(shù)據(jù),以前完全要手工輸入則需要耗費大量的人力和物力。近年來在這類工作中采用OCR技術(shù)已成為一種趨勢。因為在這種應(yīng)用中,數(shù)據(jù)的錄入是集中組織的,所

8、以往往可以通過專門設(shè)計表格和對書寫施加限制以便于機器的自動識別。目前國內(nèi)的大多數(shù)實用系統(tǒng)都要求用戶按指定規(guī)范在方格內(nèi)填寫。另外,這些系統(tǒng)往往采用合適的用戶界面對識別結(jié)果做全面的檢查,最終保證結(jié)果正確無誤??梢钥闯觯@是一類相對容易的應(yīng)用,對識別核心算法的要求比較低,是目前國內(nèi)很多單位應(yīng)用開發(fā)的熱點。(二)手寫數(shù)字識別在財務(wù)、稅務(wù)、金融領(lǐng)域中的應(yīng)用財務(wù)、稅務(wù)、金融是手寫數(shù)字識別大有可為的又一領(lǐng)域。隨著我國經(jīng)濟的迅速發(fā)展,每天等待處理的財務(wù)、稅務(wù)報表、支票、付款單等越來越多。如果能把它們用計算機自動處理,無疑可以節(jié)約大量的時間金錢和勞力。與上面提到的統(tǒng)計報表處理相比,在這個領(lǐng)域的應(yīng)用難度更大,原因

9、有:1、對識別的精度要求更高;2、處理的表格往往不止一種,一個系統(tǒng)應(yīng)能智能地同時處理若干種表格;3、由于處理貫穿于整個日常工作之中,書寫應(yīng)盡量按一般習(xí)慣(如:不對書寫者的寫法做限定,書寫時允許寫連續(xù)的字串,而不是在固定的方格內(nèi)書寫),這樣對識別及預(yù)處理的核心算法要求也提高了。(三)手寫數(shù)字識別在郵件分揀中的應(yīng)用隨著人們生活水平的提高,經(jīng)濟活動的發(fā)展,通信聯(lián)系的需求使信函的互換量大幅度增加,我國函件業(yè)務(wù)量也在不斷增長,預(yù)計到2000年,一些大城市的中心郵局每天處理量將高達幾百萬件,業(yè)務(wù)量的急劇上升使得郵件的分揀自動化成為大勢所趨。在郵件的自動分揀中,手寫數(shù)字識別(OCR)往往與光學(xué)條碼識別、人工輔助識別等手段相結(jié)合,完成郵政編碼的閱讀。目前使用量最大的OVCS分揀機的性能指標(biāo):OCR拒分率30%,OCR分揀差錯率1.1%.五、手寫數(shù)字識別技術(shù)展望隨

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論