基于人工神經(jīng)網(wǎng)絡(luò)的字符識(shí)別課件_第1頁
基于人工神經(jīng)網(wǎng)絡(luò)的字符識(shí)別課件_第2頁
基于人工神經(jīng)網(wǎng)絡(luò)的字符識(shí)別課件_第3頁
基于人工神經(jīng)網(wǎng)絡(luò)的字符識(shí)別課件_第4頁
基于人工神經(jīng)網(wǎng)絡(luò)的字符識(shí)別課件_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析與挖掘SHUJUFENXIYUWAJUE基于人工神經(jīng)網(wǎng)絡(luò)的手寫字符識(shí)別信息工程系單東晶Outline人工神經(jīng)網(wǎng)絡(luò)概況手寫字符識(shí)別3研究背景12小結(jié)4研究背景1背景人工神經(jīng)網(wǎng)絡(luò)目前已經(jīng)廣泛地用來解決模式識(shí)別和人工智能領(lǐng)域的一些復(fù)雜問題。由于人工神經(jīng)網(wǎng)絡(luò)的非線性以及并行性和魯棒性等特點(diǎn),在上述領(lǐng)域,其取得了以往傳統(tǒng)算法無法獲得的成功。

由于人工神經(jīng)網(wǎng)絡(luò)等新技術(shù)的引入,從上世紀(jì)70年代以來,光學(xué)字符識(shí)別技術(shù)逐漸走向成熟。對(duì)于脫機(jī)印刷體字符的識(shí)別,目前已經(jīng)有了很高的識(shí)別率;對(duì)于小規(guī)模的手寫體字符識(shí)別,也已經(jīng)走向?qū)嵱谩?/p>

小規(guī)模光學(xué)字符識(shí)別系統(tǒng)應(yīng)用廣泛,有著巨大的商業(yè)前景。如:郵政編碼識(shí)別、汽車照牌識(shí)別、交通標(biāo)示識(shí)別、產(chǎn)品編碼識(shí)別等。

能夠處理視頻的嵌入式設(shè)備也有著廣泛的應(yīng)用前景。如視頻監(jiān)控、視頻通訊、機(jī)器視覺系統(tǒng)等。

1234背景手寫數(shù)字識(shí)別是光學(xué)字符識(shí)別技術(shù)(OCR)的一個(gè)分支,研究如何利用計(jì)算機(jī)自動(dòng)辨認(rèn)手寫在紙張上的數(shù)字。手寫體數(shù)字的隨意性很大,字體大小、傾斜、筆畫的粗細(xì)等都會(huì)對(duì)識(shí)別結(jié)果造成影響。下面是一些樣例:人工神經(jīng)網(wǎng)絡(luò)及BP網(wǎng)絡(luò)2人工神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)領(lǐng)域研究的背景工作始于19世紀(jì)末和20世紀(jì)初。它源于物理學(xué)、心理學(xué)和神經(jīng)生物學(xué)的跨學(xué)科研究。人工神經(jīng)網(wǎng)絡(luò)的第一個(gè)實(shí)際應(yīng)用出現(xiàn)在20世紀(jì)50年代后期,F(xiàn)rankRosenblatt提出了感知機(jī)網(wǎng)絡(luò)和學(xué)習(xí)規(guī)則

。

神經(jīng)網(wǎng)絡(luò)的基本組成單元是神經(jīng)元,在數(shù)學(xué)上的神經(jīng)元模型是和在生物學(xué)上的神經(jīng)細(xì)胞對(duì)應(yīng)的?;蛘哒f,人工神經(jīng)網(wǎng)絡(luò)理論是用神經(jīng)元這種抽象的數(shù)學(xué)模型來描述客觀世界的生物細(xì)胞的。12人工神經(jīng)元人工神經(jīng)元:生物神經(jīng)元的簡化模擬。人工神經(jīng)元間的互連:信息傳遞路徑軸突-突觸-樹突的簡化;連接的權(quán)值:兩個(gè)互連的神經(jīng)元之間相互作用的強(qiáng)弱。人工神經(jīng)元模型接收的信息(其它神經(jīng)元的輸出)

互連強(qiáng)度作比較的閾值n維輸入向量X

輸出激活函數(shù)神經(jīng)元的動(dòng)作:激活函數(shù)f:

閾值型S型分段線性型輸出值:設(shè),點(diǎn)積形式:式中,BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu):1、BP神經(jīng)網(wǎng)絡(luò)具有三層或三層以上的多層神經(jīng)網(wǎng)絡(luò)2、每一層都由若干個(gè)神經(jīng)元組成3、左右各層之間神經(jīng)元實(shí)現(xiàn)全連接,同層神經(jīng)元無連接BP網(wǎng)絡(luò)的標(biāo)準(zhǔn)學(xué)習(xí)算法學(xué)習(xí)的過程:神經(jīng)網(wǎng)絡(luò)在外界輸入樣本的刺激下不斷改變網(wǎng)絡(luò)的連接權(quán)值,以使網(wǎng)絡(luò)的輸出不斷地接近期望的輸出。學(xué)習(xí)的本質(zhì):對(duì)各連接權(quán)值的動(dòng)態(tài)調(diào)整學(xué)習(xí)規(guī)則:權(quán)值調(diào)整規(guī)則,即在學(xué)習(xí)過程中網(wǎng)絡(luò)中各神經(jīng)元的連接權(quán)變化所依據(jù)的一定的調(diào)整規(guī)則。BP網(wǎng)絡(luò)的標(biāo)準(zhǔn)學(xué)習(xí)算法-學(xué)習(xí)過程正向傳播:輸入樣本---輸入層---各隱層---輸出層判斷是否轉(zhuǎn)入反向傳播階段:若輸出層的實(shí)際輸出與期望的輸出(監(jiān)督信號(hào))不符誤差反傳誤差以某種形式在各層表示----修正各層單元的權(quán)值網(wǎng)絡(luò)輸出的誤差減少到可接受的程度進(jìn)行到預(yù)先設(shè)定的學(xué)習(xí)次數(shù)為止手寫字符識(shí)別315準(zhǔn)備樣本針對(duì)特定的應(yīng)用,準(zhǔn)備樣本集。并利用圖像處理技術(shù),將樣本標(biāo)準(zhǔn)化。例:美國郵政服務(wù)(USPS)數(shù)據(jù)庫抽取樣本的特征全局統(tǒng)計(jì)特征是將整個(gè)字符點(diǎn)陣作為研究對(duì)象,從整體上抽取特征。常用的是全局變換特征:對(duì)字符圖象進(jìn)行各種變換,利用變換系數(shù)作為特征,常用的變換有Fourier變換、Hadamard變換、DCT變換、Walsh變換、Rapid變換、K-L變換等。另外還有:不變矩(Moment)特征、筆畫穿透數(shù)目特征、全局筆畫方向特征、背景特征。局部統(tǒng)計(jì)特征是將字符點(diǎn)陣圖象分割成不同區(qū)域或網(wǎng)格,在各個(gè)小區(qū)域內(nèi)分別抽取統(tǒng)計(jì)特征,主要包括局部筆畫方向特征、細(xì)胞特征、相補(bǔ)特征、方向線素特征、Gabor特征、四角特征。根據(jù)抽取特征的不同,可以選用不同的匹配方法,常用的統(tǒng)計(jì)匹配方法有模板匹配、相關(guān)匹配、樹分類器等。常用的距離度量有歐氏距離、城市塊距離、馬氏距離等。12317訓(xùn)練BP網(wǎng)絡(luò)分類器利用樣本集對(duì)應(yīng)的特征向量集,設(shè)計(jì)、訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)例:手寫數(shù)字識(shí)別研究中,構(gòu)造了10個(gè)、輸出層使用purelin函數(shù),其他層使用logsig函數(shù)的BP神經(jīng)網(wǎng)絡(luò)。圖像采集利用攝像頭采集大小適中、亮度適中的信封圖像19郵政編碼的定位利用郵政編碼邊框的顏色信息,分割出郵政編碼邊框圖像20郵政編碼的定位輪廓提取,并使用Hough變換,檢測(cè)出郵政編碼的具體位置21郵政編碼圖像的提取提取出郵政編碼圖像,并根據(jù)圖像傾角,進(jìn)行姿勢(shì)校正22灰度化將圖像灰度化23二值化將圖像二值化24筆畫粗細(xì)調(diào)整將圖像中的文字筆畫粗細(xì)做調(diào)整25圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論