小波在文字識別中的應(yīng)用_第1頁
小波在文字識別中的應(yīng)用_第2頁
小波在文字識別中的應(yīng)用_第3頁
小波在文字識別中的應(yīng)用_第4頁
小波在文字識別中的應(yīng)用_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、小波分析在文字種類小波分析在文字種類 識別中的應(yīng)用識別中的應(yīng)用 摘要 本文依據(jù)前人研究的方法 使用基于多尺度非冗余小波紋理分析的 技術(shù)進行了文字種類自動識別, 并嘗試加入了小波分析方法進行圖像去噪。 之后利用matlab編程 實現(xiàn)文字種類的自動識別,并檢測結(jié)果。 背景背景 實驗與結(jié)果實驗與結(jié)果 實驗流程及相關(guān)知識實驗流程及相關(guān)知識 結(jié)論結(jié)論 目錄 背景背景 為了高效處理大量信息,人們設(shè)計了視覺字符識別(OCR) 技術(shù)。 已知的OCR技術(shù)使用的前提是被識別的文本語言是已知的, 以此選擇需要的識別模式。之前文本文字種類的識別需要人工 干預(yù),但是如今人工識別變的不可能。所以,語言或文字種類 的自動識

2、別是必需的。 將文本圖像看成一種紋理,同種文字種類具有相似紋理。 小波分析方法一種多分辨表示的簡易方式, 使圖像的紋 理特征更加容易提取. 實驗流程及相關(guān)知識 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 實驗設(shè)計核心:小波分解圖像,獲得小波能量分布特征和小波實驗設(shè)計核心:小波分解圖像,獲得小波能量分布特征和小波 能量比例特征作為文字識別的小波特征,運用距離函數(shù)區(qū)分不能量比例特征作為文字識別的小波特征,運用距離函數(shù)區(qū)分不 同的文字種類,從而達到自動識別文字種類的目的同的文字種類,從而達到自動識別文字種類的目的 文字種類的識別需要四部分: 數(shù)據(jù)獲取,數(shù)據(jù)處理,

3、特征提取,識別分類。數(shù)據(jù)獲取,數(shù)據(jù)處理,特征提取,識別分類。 去噪 本次實驗對每個圖像采用db1小波基進行小波去噪處理。 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 去噪前去噪后 clear all;clc; A=imread(c11.jpg); %subplot(121),imshow(A);title(original imge); m,n=size(A); A=double(A); B=imread(c11s.jpg); B=double(B); %計算信噪比 t=0; for i=1:m for j=1:n t=t+(abs(B(i,j)-A(i,

4、j)2; end end mse=t/(m*n); %圖像均方誤差 psnr=10*log10(2552)/mse); %峰值信噪比 display(mse:); mse display(psnr:); psnr 小波分解 小波分解小波分解 運用小波分解,將圖像分解。一次分解后形成四個子圖: LL,LH,HL和HH LL 圖像低頻部分, 稱為平滑子圖; HL 圖像水平高頻部分; LH 圖像垂直高頻部分; HH 圖像對角高頻部分。 子圖的面積之和等于輸入原圖像的面積。 在LL子圖上再次小波分解,等價于尺度加倍。 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 一

5、次分解 二次分解 小波分解 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 原始圖像原始圖像 小波一次分解小波一次分解 小波二次分解小波二次分解 小波能量分布特征向量 細節(jié)子圖像LH,HH和HL, 第k階小波分解的平均能量分 布定義為: 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 1 ( )222 ( ) 2 1 (2 ) 1 ( , ) (/2 ) kk k kNN k k n mN LHm n ELH N k=1,lbN 11 ( )222 ( ) 2 (2 ) 1(2 ) 1 ( , ) (/ 2 ) kk kk k

6、NN k k mNnN HLm n EHL N k=1,lbN k=1,lbN 11 ( )222 ( ) 2 (2 ) 1(2 ) 1 ( , ) (/2 ) kk kk kNN k k mNnN HHm n EHH N ( ) ( ) ( ) k k d k EHL FEHH ELH 小波能量比例特征向量 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 分別代表了子圖HL,HH,LH在第k階小波分 解時的能量比重,由以下公式得出 ( ) () ( )( )( ) k K kkk EHL EPHL EHLEHHELH ( ) () ( )( )( ) k K

7、 kkk EHH EPHH EHLEHHELH ( ) () ( )( )( ) k K kkk ELH EPLH EHLEHHELH k=1,lbN ()K EPHL ()K EPHH ()K EPLH , , k=1,lbN k=1,lbN () () () K K dp K EPHL FEPHH EPLH 距離函數(shù) 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 距離函數(shù) 距離函數(shù)識別距離函數(shù)識別提取特征向量提取特征向量小波分解小波分解小波去噪小波去噪 3 22 1 min( )min( )( )( ) ) d jj dpdpdp j ij i m DP

8、MWV jFmE FmVar Fm 設(shè)第j種文字的訓(xùn)練樣本圖像的小波能量分布特征向量和小 波能量比例特征向量的第m個元素的方差分別為 和 .當(dāng)測試樣本被歸為第i種文字當(dāng)且僅當(dāng)下述距 離函數(shù)在j=i時達到最小: d=lbN,j=1,c d=lbN,j=1,c ( ) j d Var Fm ( ) j dp Var Fm 實驗流程 小波分解尺度:二尺度小波分解。 樣本語言選擇:中文,英文,韓文 樣本選?。好糠N語言文字各取5個,作為訓(xùn)練樣本 進行人工識別。并提取每個樣本的小波紋理特征, 算得各自的均值和方差。 樣本示例: 中文樣本中文樣本英文樣本英文樣本韓文樣本韓文樣本 程序流程 讀入文字圖像 圖像

9、處理 小波分解 計算小波特征 對比樣本 得到結(jié)果 程序流程圖 function main(fname,way) clc f=imread(k51.jpg); %讀取圖像 f=rgb2gray(f); %轉(zhuǎn)換成灰度圖 f=im2double(f); %轉(zhuǎn)換成雙精度 f=energy(f); %能量歸一化 ll,lh,hl,hh=dwt2(f,db1); y1=fd(lh,hl,hh); ll2,lh2,hl2,hh2=dwt2(ll,db1); y2=fd(lh2,hl,hh); %小波分解 yp=y1/sum(y1),y2/sum(y2); DPMW(yp);DPMWV(yp); y=y1,y

10、2; DEMW(y);DEMWV(y); end 實驗各選取5幅中文圖 像、英文圖像和韓文 圖像共15幅。 測試樣本與訓(xùn)練樣本 應(yīng)具有相似格式, 如相 似的尺寸,格式,字間距 等. 分別用DEMW、 DPMW、DEMWV和 DPMWV指標(biāo)檢驗,結(jié) 果如表13 分類精度 距離函數(shù) 中文圖像 1 中文圖像 2 中文圖像 3 中文圖像 4 中文圖像 5 DEMW成功識別成功識別成功識別未識別成功識別 DPMW成功識別成功識別成功識別成功識別成功識別 DEMWV成功識別成功識別成功識別未識別成功識別 DPMWV成功識別成功識別成功識別成功識別成功識別 DEMW和和DEMWV識別中文圖像平均成功率為識別

11、中文圖像平均成功率為80%. DPMW和和DPMWV識別中文圖像平均成功率為識別中文圖像平均成功率為100% (表1: 具有相似格式測試樣本的中文圖像檢測結(jié)果) 實驗實驗 1 1 分類精度 距離 函數(shù) 韓文 圖像 1 韓文 圖像 2 韓文 圖像 3 韓文 圖像 4 韓文 圖像 5 DEMW 成功 識別 成功 識別 成功 識別 成功 識別 未識別 DPMW 成功 識別 未識別 成功 識別 成功 識別 成功 識別 DEMWV 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 DPMWV 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 分類精度 距離 函數(shù) 英文 圖像 1 英文

12、 圖像 2 英文 圖像 3 英文 圖像 4 英文 圖像 5 DEMW 成功 識別 成功 識別 未識別 成功 識別 成功 識別 DPMW 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 DEMWV 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 DPMWV 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 DEMW識別英文圖像平均成功率為識別英文圖像平均成功率為80%. DPMW、DPMWV和和DEMWV識別英文圖像識別英文圖像 平均成功率為平均成功率為100% (表2: 具有相似格式測試樣本的英文圖像檢測結(jié)果)(表3: 具有相似格式測試樣本的韓文圖像檢測結(jié)果)

13、 DEMW和和DPMW識別韓文圖像平均成功識別韓文圖像平均成功 率為率為80%. DPMWV和和DEMWV識別韓文圖像平均成識別韓文圖像平均成 功率為功率為100% 實驗實驗 1 1 分類精度 距離函數(shù)中文圖像英文圖像韓文圖像 DEMW80%80%80% DPMW100%100%80% DEMWV80%100%100% DPMWV100%100%100% (表4: 具有相似格式測試樣本的文字種類檢測成功率) 實驗顯示實驗顯示: 每種文字的測試樣本的多尺度小波能量分布每種文字的測試樣本的多尺度小波能量分布( 比例比例) 紋理特征向量紋理特征向量, 是與同種文是與同種文 字的訓(xùn)練樣本的多尺度小波能

14、量分布字的訓(xùn)練樣本的多尺度小波能量分布( 比例比例) 紋理特征向量的均值相似的紋理特征向量的均值相似的. 實驗實驗 1 1 實驗中,同樣各選取5 幅中文圖像、英文圖 像和韓文圖像共15幅。 測試樣本與訓(xùn)練樣本 具有不同的格式,如 間隔、字大小等。 分別用DEMW、 DPMW、DEMWV和 DPMWV指標(biāo)檢驗,結(jié) 果如表57 分類精度 距離函數(shù) 中文圖像 1 中文圖像 2 中文圖像 3 中文圖像 4 中文圖像 5 DEMW未識別未識別未識別成功識別成功識別 DPMW成功識別未識別成功識別未識別成功識別 DEMWV成功識別成功識別未識別成功識別成功識別 DPMWV成功識別未識別成功識別成功識別成功

15、識別 DEMW識別中文圖像平均成功率為識別中文圖像平均成功率為40%. DPMW識別中文圖像平均成功率為識別中文圖像平均成功率為60%. DEMWV和和DPMWV識別中文圖像平均成功率為識別中文圖像平均成功率為80% (表5: 具有不同格式測試樣本的中文圖像檢測結(jié)果) 實驗實驗 2 2 分類精度 距離 函數(shù) 英文 圖像 1 英文 圖像 2 英文 圖像 3 英文 圖像 4 英文 圖像 5 DEMW 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 DPMW 成功 識別 未識別 成功 識別 成功 識別 未識別 DEMWV 成功 識別 未識別未識別未識別 成功 識別 DPMWV未識別 成功

16、 識別 未識別 成功 識別 未識別 分類精度 距離 函數(shù) 韓文 圖像 1 韓文 圖像 2 韓文 圖像 3 韓文 圖像 4 韓文 圖像 5 DEMW 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 DPMW 成功 識別 成功 識別 成功 識別 未識別 成功 識別 DEMWV 成功 識別 成功 識別 成功 識別 未識別 成功 識別 DPMWV 成功 識別 成功 識別 成功 識別 成功 識別 成功 識別 (表6: 具有不同格式測試樣本的英文圖像檢測結(jié)果)(表7: 具有不同格式測試樣本的韓文圖像檢測結(jié)果) DEMWDEMW識別英文圖像平均成功率為識別英文圖像平均成功率為100%. 100%

17、. DPMWVDPMWV和和DEMWVDEMWV識別英文圖像識別英文圖像 平均成功率為平均成功率為40%40% DPMWDPMW識別英文圖像平均成功率為識別英文圖像平均成功率為60%.60%. DEMWDEMW和和DEMWVDEMWV識別韓文圖像識別韓文圖像 平均成功率為平均成功率為100%. 100%. DPMWDPMW和和DPMWVDPMWV識別韓文圖像平均成功率為識別韓文圖像平均成功率為80%80% 實驗實驗 2 2 分類精度 距離函數(shù)中文圖像英文圖像韓文圖像 DEMW40%100%100% DPMW60%60%80% DEMWV80%40%100% DPMWV80%40%80% (表8: 具有不同格式測試樣本的文字種類檢測成功率) 上述實驗初步

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論