




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
漢字識別技術的分類
漢字識別技術可分為印刷體漢字識別和手寫體漢字識別兩大類,后者又可分為聯機手寫漢字識別和脫機手寫漢字識別。
聯機手寫漢字識別是指將字符書寫在與計算機相連的書寫板上,由計算機根據字符的書寫軌跡進行實時識別;脫機手寫漢字識別是指將字符書寫或打印在紙張上,用掃描儀或其他光電轉換裝置將其轉換成電信號輸入到計算機中,再由機器進行識別。從識別的角度來看,手寫體識別難于印刷體識別,而脫機手寫識別又難于聯機手寫體識別。漢字識別技術的分類漢字識別技術可分為1基于模板匹配法
-----聯機手寫數字識別基于模板匹配法
-----聯機手寫數字識別2模式識別系統的基本構成:信息獲取預處理特征提取和選擇分類器設計分類決策模式識別系統的基本構成:信息獲取預處理特征提取和選擇分類器設3信息獲?。何覀冎饕捎靡粋€模擬的手寫板,通過用戶書寫數字,動態(tài)地獲取該數字從起始點到終止點的所有點的信息及其所有我們需要的關于該數字的信息。信息獲?。何覀冎饕捎靡粋€模擬的手寫板,通過用戶4難點及特征選?。簣D中,三個2的寫法各不相同,但是我們都能一下子識別出來為2,其原因在于這3個數字都依次包括了向右、向左下、向右的書寫習慣。同理,這3個4也都依次包括了向下、向右、最后向下的書寫習慣。因此,需要提取一個重要的基本特征就是書寫順序。首先,我們來看幾組圖片:難點及特征選?。簣D中,三個2的寫法各不相同,但是我們都能一下5難點及特征選取:我們再來看看這組圖片:雖然第二個2寫得有點不倫不類,但是我們還是能看出來是2,原因就在于首點和末點的距離相距明顯較大。第四組的兩個數字4和9很容易混淆,但是可以看出4的尾巴會比9的短得多。從上,我們可以看出首點到末點的距離以及末點到交點的距離也是一個重要特征。難點及特征選取:我們再來看看這組圖片:雖然第二個2寫得有點不6難點及特征選?。和瑫r,我們可以發(fā)現數字4,5書寫時,都是存在斷點的,數字0和8的終點和起點是連接在一起的,還有每個數字的節(jié)點的分支數,首點到交點的距離,尾點到交點的距離,首尾的距離......在每個數字之間都是存在差異的,這些都可以作為選取的特征。難點及特征選?。和瑫r,我們可以發(fā)現數字4,5書7預處理及模板建立:在方向上,為了量化特征,于是我們規(guī)定了如下四個方向:向上向下向左向右預處理及模板建立:在方向上,為了量化特征,于是我們規(guī)定了如下8預處理及模板建立:之所以每個方向包三個范圍,是為了避免一些小的擾動改變方向。但是,從上面的四個圖中,我們可以看到,在斜線上的4個方向,每一個都包含在兩個方向中,那么怎么來確定方向呢?于是,我們定義如下的規(guī)則:(1)考慮到我們書寫數字的習慣,對于每一個起點,選擇方向的順序依次是向右,向下,向左,向上(2)如果已經處在一個方向,那么對于緊接著的一個方向,應盡量保持和原來的方向一致,這樣方向在一個小的范圍內就不會受到影響,除非已經跳離了這個方向所在的范圍。然而,我們會遇到如下的問題。。。。預處理及模板建立:之所以每個方向包三個范圍9預處理及模板建立:如果滿足以上條件,則剔除點紅色線條為筆跡經過的點,本來途中畫黑點的位置都應該在路徑里,但考慮到為了不使方向變來變去,對于該圖處在這種拐角上的點,我們都給剔除,剔除的條件是:如圖:預處理及模板建立:如果滿足以上條件,則剔除點10特征選?。航涍^討論,我們選取了幾個比較典型的特征(1)數字的書寫順序(2)第一個筆畫的長度(3)最后一個方向的長度(4)是否存在斷點(5)起點到交點的距離(6)尾點到交點的距離而在程序中,用一個結構體來描述特征:typedefstructtezheng{ signedcharvalue;//數字值 signedcharVHDerection[15];//水平垂直特征 //向右-1向下--2向左--3向上-4 signedcharlenth1;//第一個筆劃長度 signedcharlenth;//最后一個方向的長度 signedchardecon;//有無斷點等于1有斷點 signedcharlenfirst;//起點到交點的距離 signedcharlenend;//尾點到交點的距離}TEZHENG;特征選?。航涍^討論,我們選取了幾個比較典型的特征而在程序中,11學習和判別過程:
學習過程:我們可以輸入很多的訓練樣本,保存這些樣本的特征成一個個的模板,同時對于模板中存在的樣本模板,我們將給出提示而不再存儲,從而減少了存儲空間。
判別過程:
采用模板匹配法。當輸入一個測試樣本時,我們先提取它的特征,然后從模板中查詢相同的特征,如果有,給出判斷結果;如果沒有,則提示無法判斷。從而我們可以得到較高判別結果。學習和判別過程:學習過程:12用戶學習判別判斷模板庫里是否有相同的模板模板庫已存在,反饋給用戶不存在,用戶輸入數字后存入該模板存在,識別該數字不存在,提示無法識別用戶學習判別判斷模板庫里是模板庫已存在,反饋給用戶不存在,用13Thanksforlistening!!!Thanksforlistening!!!14漢字識別技術的分類
漢字識別技術可分為印刷體漢字識別和手寫體漢字識別兩大類,后者又可分為聯機手寫漢字識別和脫機手寫漢字識別。
聯機手寫漢字識別是指將字符書寫在與計算機相連的書寫板上,由計算機根據字符的書寫軌跡進行實時識別;脫機手寫漢字識別是指將字符書寫或打印在紙張上,用掃描儀或其他光電轉換裝置將其轉換成電信號輸入到計算機中,再由機器進行識別。從識別的角度來看,手寫體識別難于印刷體識別,而脫機手寫識別又難于聯機手寫體識別。漢字識別技術的分類漢字識別技術可分為15基于模板匹配法
-----聯機手寫數字識別基于模板匹配法
-----聯機手寫數字識別16模式識別系統的基本構成:信息獲取預處理特征提取和選擇分類器設計分類決策模式識別系統的基本構成:信息獲取預處理特征提取和選擇分類器設17信息獲?。何覀冎饕捎靡粋€模擬的手寫板,通過用戶書寫數字,動態(tài)地獲取該數字從起始點到終止點的所有點的信息及其所有我們需要的關于該數字的信息。信息獲取:我們主要采用一個模擬的手寫板,通過用戶18難點及特征選?。簣D中,三個2的寫法各不相同,但是我們都能一下子識別出來為2,其原因在于這3個數字都依次包括了向右、向左下、向右的書寫習慣。同理,這3個4也都依次包括了向下、向右、最后向下的書寫習慣。因此,需要提取一個重要的基本特征就是書寫順序。首先,我們來看幾組圖片:難點及特征選取:圖中,三個2的寫法各不相同,但是我們都能一下19難點及特征選取:我們再來看看這組圖片:雖然第二個2寫得有點不倫不類,但是我們還是能看出來是2,原因就在于首點和末點的距離相距明顯較大。第四組的兩個數字4和9很容易混淆,但是可以看出4的尾巴會比9的短得多。從上,我們可以看出首點到末點的距離以及末點到交點的距離也是一個重要特征。難點及特征選?。何覀冊賮砜纯催@組圖片:雖然第二個2寫得有點不20難點及特征選?。和瑫r,我們可以發(fā)現數字4,5書寫時,都是存在斷點的,數字0和8的終點和起點是連接在一起的,還有每個數字的節(jié)點的分支數,首點到交點的距離,尾點到交點的距離,首尾的距離......在每個數字之間都是存在差異的,這些都可以作為選取的特征。難點及特征選?。和瑫r,我們可以發(fā)現數字4,5書21預處理及模板建立:在方向上,為了量化特征,于是我們規(guī)定了如下四個方向:向上向下向左向右預處理及模板建立:在方向上,為了量化特征,于是我們規(guī)定了如下22預處理及模板建立:之所以每個方向包三個范圍,是為了避免一些小的擾動改變方向。但是,從上面的四個圖中,我們可以看到,在斜線上的4個方向,每一個都包含在兩個方向中,那么怎么來確定方向呢?于是,我們定義如下的規(guī)則:(1)考慮到我們書寫數字的習慣,對于每一個起點,選擇方向的順序依次是向右,向下,向左,向上(2)如果已經處在一個方向,那么對于緊接著的一個方向,應盡量保持和原來的方向一致,這樣方向在一個小的范圍內就不會受到影響,除非已經跳離了這個方向所在的范圍。然而,我們會遇到如下的問題。。。。預處理及模板建立:之所以每個方向包三個范圍23預處理及模板建立:如果滿足以上條件,則剔除點紅色線條為筆跡經過的點,本來途中畫黑點的位置都應該在路徑里,但考慮到為了不使方向變來變去,對于該圖處在這種拐角上的點,我們都給剔除,剔除的條件是:如圖:預處理及模板建立:如果滿足以上條件,則剔除點24特征選?。航涍^討論,我們選取了幾個比較典型的特征(1)數字的書寫順序(2)第一個筆畫的長度(3)最后一個方向的長度(4)是否存在斷點(5)起點到交點的距離(6)尾點到交點的距離而在程序中,用一個結構體來描述特征:typedefstructtezheng{ signedcharvalue;//數字值 signedcharVHDerection[15];//水平垂直特征 //向右-1向下--2向左--3向上-4 signedcharlenth1;//第一個筆劃長度 signedcharlenth;//最后一個方向的長度 signedchardecon;//有無斷點等于1有斷點 signedcharlenfirst;//起點到交點的距離 signedcharlenend;//尾點到交點的距離}TEZHENG;特征選?。航涍^討論,我們選取了幾個比較典型的特征而在程序中,25學習和判別過程:
學習過程:我們可以輸入很多的訓練樣本,保存這些樣本的特征成一個個的模板,同時對于模板中存在的樣本模板,我們將給出提示而不再存儲,從而減少了存儲空間。
判別過程:
采用模板匹配法。當輸入一個測試樣本時,我們先提取
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 項目流動黨員管理制度
- 阿里企業(yè)加班管理制度
- 項目儀器設備管理制度
- 臨床輸血安管理制度
- 關于年度物業(yè)工作計劃(33篇)
- 零碳數據算力中心項目發(fā)展前景分析報告
- 甲醇行業(yè)發(fā)展趨勢與未來市場展望分析
- 低空經濟發(fā)展中的空域管理政策優(yōu)化探索
- 初中美術與其他學科融合教學的創(chuàng)新策略與實踐路徑
- 社區(qū)自治何以可能-一個隴東鄉(xiāng)村紅白理事會自組織的個案觀察
- XX項目陽光分包試點工作方案參考方案
- (完整版)數字電子技術基礎教案
- 附九江學院第四屆教工男子乒乓球單打賽程表
- 積極心理學-完整版教學課件
- 物資倉庫防洪防汛應急預案
- .三坐標測量員技能考核考試題答案
- 大學語文課程建設與改革實施方案
- 【上海市靜安區(qū)寶山路街道社區(qū)養(yǎng)老問題調查報告】
- 公文筐測驗(案例題解示范)
- 大學森林生態(tài)教案
- 蛙泳教學教案
評論
0/150
提交評論