關(guān)于模擬手寫漢字輸入方法的研究 - 瀏覽網(wǎng)_第1頁
關(guān)于模擬手寫漢字輸入方法的研究 - 瀏覽網(wǎng)_第2頁
關(guān)于模擬手寫漢字輸入方法的研究 - 瀏覽網(wǎng)_第3頁
關(guān)于模擬手寫漢字輸入方法的研究 - 瀏覽網(wǎng)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于模擬手寫輸入與漢字編碼的研究 河南信息工程學(xué)校 曹湖海 孫玉華摘要:在信息社會、數(shù)字時代的今天,用手機(jī)、計算機(jī)輸入漢字已成為人們每天不可缺少的一項工作,據(jù)統(tǒng)計,我國每年通過手機(jī)發(fā)送的短信達(dá)2000多億條,如果能提供一種優(yōu)秀的漢字輸入的方法或技術(shù),將會產(chǎn)生巨大的社會效益。和漢語拼音一樣,人們對漢字的書寫也是相當(dāng)?shù)闹匾暫褪炀毜?,從學(xué)習(xí)漢語開始人們幾乎天天都要寫字,利用這一資源進(jìn)行漢字輸入無疑也是一個很好的途徑。本文就一種新的手機(jī)漢字輸入的方法-模擬手寫輸入法的基本思路和基本方法作一簡要論述。關(guān)鍵詞:手機(jī) 中文輸入 模擬手寫一、手機(jī)短信市場對高效率輸入漢字方法的呼喚在手機(jī)上收發(fā)短信,成為中國人獨(dú)

2、有的時尚!每年幾千億條短信,每個字都得用手工輸入!為此,有哪個手機(jī)持有者不關(guān)心手機(jī)的中文輸入法?然而,在我國,手機(jī)上的中文輸入法至今仍依賴“進(jìn)口”!手機(jī)只有10個數(shù)字鍵!早已熟練在標(biāo)準(zhǔn)鍵盤的26個字母鍵上輸入漢字的數(shù)以千萬計的中國人,用現(xiàn)行的手機(jī)中文輸入法在手機(jī)上輸入漢字費(fèi)力、費(fèi)時、事倍功半。根據(jù)調(diào)查發(fā)現(xiàn),現(xiàn)在,大多數(shù)人在用計算機(jī)輸入漢字時都使用拼音輸入法,包括在手機(jī)上人們常用的也是拼音輸入法,這就說明人們對輸入法的要求基本上還是易學(xué)性,因為漢語拼音人們都比較熟悉,不經(jīng)特別學(xué)習(xí)就能使用,盡管輸入速度比較慢,但人們還是喜歡用。但從根本上講拼音輸入法是最原始的輸入法,有人不把拼音輸入法叫做輸入法,

3、而是將其稱為“選字法”或“找字法”,因為由于漢語拼音的同音字的緣故,用漢語拼音輸入法輸入時重碼特別多,少則十幾個,多則上百個,如果用在手機(jī)上,由于一個數(shù)字鍵上安放了34個字母,更是難以逾越“漢字同音字多”的障礙!“輸入漢字”時,必然要不斷翻屏、查找,從數(shù)十個同音字中來回找字!同時隨著拼音輸入法的大量使用,不僅使越來越多的中小學(xué)生漢字書寫水平出現(xiàn)衰退,就連受過基礎(chǔ)教育的成年人也經(jīng)常會有提筆忘字的現(xiàn)象。手機(jī)輸入漢字的技術(shù)現(xiàn)狀,已難以滿足數(shù)以億計的手機(jī)用戶越來越迫切、越來越量大、越來越“愛在手機(jī)上寫文章”的需求。市場呼喚著新產(chǎn)品,人們期待著簡單易用,快速高效的手機(jī)中文輸入法的面世。二、模擬手寫輸入法

4、的基本思路要做到即易學(xué)又易用,似乎是漢字輸入編碼領(lǐng)域的一個老大難問題,易學(xué)的則不易用,易用的則不易學(xué),拼音輸入法實際上是有效地利用了人們對漢語拼音非常熟悉這一有利資源,使得人們覺得用漢語拼音輸入漢字比較容易,如果一個人不懂漢語拼音,而為了學(xué)習(xí)拼音輸入法從頭開始學(xué)習(xí)漢語拼音,那么可以說學(xué)習(xí)拼音輸入法也并不容易。人們感知和應(yīng)用文字的途徑不外乎有讀、寫、看、聽四種,其中讀、寫是主動的、看、聽是被動的,讀就要發(fā)音,漢語的發(fā)音標(biāo)準(zhǔn)就是國家一九五八年公布的漢語拼音方案,會讀就要會漢語拼音,因此,學(xué)習(xí)語文就是從學(xué)習(xí)漢語拼音開始的,在我國從小學(xué)一年級甚至幼兒園就開始學(xué)習(xí)漢語拼音,所以中國人對漢語拼音的熟悉程度

5、還是很高的,利用漢語拼音輸入漢字也是一個很好的選擇。然而,和漢語拼音一樣,人們對漢字的書寫也是相當(dāng)?shù)闹匾暫褪炀毜?,從學(xué)習(xí)漢語開始人們幾乎天天都要寫字,利用這一資源進(jìn)行漢字輸入無疑也是一個很好的途徑。漢字是方塊字,手機(jī)鍵盤、計算機(jī)上的數(shù)字鍵盤的布局也是一個方塊,這種巧妙的吻合正是本文作者發(fā)現(xiàn)的一個秘籍,模擬手寫輸入法正是以此為基礎(chǔ)上,根據(jù)人們的書寫習(xí)慣制定漢字輸入方案,實現(xiàn)會寫就會打。用這種方法打字就像我們初學(xué)寫毛筆字時,在“米字格”或“井字格”里面按照漢字的筆畫及其布局進(jìn)行寫字那樣。這種方法形象直觀、簡單易學(xué)、快速方便,單手操作,盲打輸入,不受方言限制,不用記字根,不用記筆畫,不用記鍵位,不用

6、練指法(即:五不輸入法),且上手快,重碼少。特別是現(xiàn)在有許多數(shù)字產(chǎn)品,如:手機(jī)、電話機(jī)、收款機(jī)等其面板上只有十個數(shù)字鍵盤,這就為模擬手寫輸入法提供了用武之地。一旦掌握了這種方法,即可在計算機(jī)上使用,又可在手機(jī)、電話機(jī)、稅控機(jī)、收款機(jī)、機(jī)頂盒、各式PDA等數(shù)字產(chǎn)品上使用,一舉幾得。同時對小學(xué)生學(xué)習(xí)寫字也有一定的好處,把學(xué)寫字和打字結(jié)合起來,互相促進(jìn),起到事半功倍地效能,更可以有效地防止因為長期使用電腦而“提筆忘字”的現(xiàn)象發(fā)生。 三、模擬手寫輸入法的基本方法1、 基本筆畫筆畫是組成漢字的基本單元,在模擬手寫輸入法中也毫不例外地離不開筆畫,但在模擬手寫輸入法中既要考慮漢字的規(guī)范性,又要考慮

7、用數(shù)字鍵盤輸入漢字的特殊性,因此,在模擬手寫輸入法中規(guī)定了六個基本筆畫,即:用點(diǎn)(丶)、豎(丨)、撇(丿)、橫(一)、捺(乀)、提(右提 、上提 、左提 )六個筆畫作為漢字的基本筆畫。 常用的筆畫“折”視為幾個基本筆畫的組合,例如:筆畫“”視為由基本筆畫橫“一”、豎“丨”和“左提 ”構(gòu)成。之所以這樣規(guī)定,就是這樣可以使碼長更規(guī)范,否則會使碼長長短不齊。2、 基本操作 上述的每一個筆畫又分為首部和尾部,其中點(diǎn)(丶)的首部和尾部在一個鍵上,豎(丨)、撇(丿)、橫(一)、捺(乀)、提(右提 、上提 、左提 )的首部和尾部分別在不同的鍵上。 假想將同樣大小的漢字貼在數(shù)字鍵盤上 模仿在數(shù)字鍵盤上寫字,點(diǎn)

8、擊每一個筆畫的首部和尾部下面的數(shù)字鍵就可輸入相應(yīng)的漢字。示例: 上字的編碼為:82561300天字的編碼為:79468153么字的編碼為:84511333山字的編碼為:824113633、 基本規(guī)則 漢字的分類漢字的結(jié)構(gòu)復(fù)雜,規(guī)律性差是漢字編碼所面臨的一大難題,一個規(guī)則難以覆蓋所有漢字,因此通常需要將漢字分為幾類,一類漢字制定一個規(guī)則,這也是通常的作法,本文所述的模擬手寫輸入法將漢字分為兩類,即獨(dú)體字和組合字。所謂獨(dú)體字是:一個漢字的若干筆劃交叉在一起,使其不能分開或分開后的其中一部分只能是一個筆畫,這類字稱為獨(dú)體字。如上面所舉的幾個例子。所謂組合字是:由兩個或兩個以上的獨(dú)立單元組成的漢字,這

9、類字稱為組合字。組合字又包括左右型、上下型、半包圍型。示例: 獨(dú)體字的取碼規(guī)則獨(dú)體型按照漢字的書寫順序取漢字的前三個筆畫和末筆畫。也就是說,一個字不管有多少筆畫,我們只取四個筆畫,其他一概不管。示例: 編碼為: 77 95 46 53 組合字的取碼規(guī)則首先要將組合字分為兩部分(如下圖所示),然后取前一部分的前兩個筆畫和后一部分的第一筆畫及末筆畫。同獨(dú)體字一樣,一個字不管有多少筆畫,我們只取四個筆畫,其他一概不管。這就決定了本文所述的模擬手寫輸入法的簡單性和快捷性。示例: 由示例可以看出,前一部分的前兩個筆畫在鍵盤上的位置容易確定,但后一部分第一筆畫在鍵盤上的位置不容易確定,往往會造成錯誤,因此

10、特確定如下規(guī)則:取后一部分第一筆畫及末筆畫時,應(yīng)將后一部分放大至滿鍵盤,再視其第一筆畫及末筆畫在鍵盤上的對應(yīng)位置取碼。這一規(guī)則正是本文所述的模擬手寫輸入法的一個亮點(diǎn),它一通百通,使許多問題都迎刃而解。示例: 編碼為: 45 82 45 624、 組合字的劃分原則前已敘述,要將組合字分為兩部分,因為漢字的結(jié)構(gòu)比較復(fù)雜,有時一個漢字有幾部分組成,那么如何進(jìn)行劃分,必須作出一些規(guī)定,否則的話,容易造成混亂,因此本方案特作出以下規(guī)定: 劃分為兩部分后、每一部分以都能并且必須成為一個合理的漢字。示例: 分成兩部分后,兩部分不能同時各自成為一個漢字,但一部分能成為一個漢字,那么從能組成為一個漢字處分開。示

11、例: 如果分成兩部分后,兩部分都不能成一個漢字,應(yīng)從第一明顯的分界處分開。同時,一些偏旁部首如:艸、亠、饣、礻等此時可以作為一個字來看待,他們作為一部分,其余的作為一部分。示例: 5、 詞組的輸入方法作為一個中文輸入方案,必須具有詞組輸入功能,這樣就可大大提高輸入速度,模擬手寫輸入方案為:詞組中前面每個字的第一碼 +最后一個字的前幾碼(總共補(bǔ)夠8碼)。注:中文數(shù)字“一、二、九、十”的編碼分別為八個他們各自對應(yīng)的阿拉伯?dāng)?shù)字“1、2、9、0”,如:中文數(shù)字“三”的編碼為33333333。四、結(jié)束語由于種種原因,目前我國的計算機(jī)輸入軟件基本被西方國家產(chǎn)品所壟斷,手機(jī)的中文輸入上也是如此,比如T9輸入法等。據(jù)悉,目前億萬中國人使用的手機(jī)中文輸入技術(shù)的專利都被國外企業(yè)所占有,僅此一項,我國每年都要花費(fèi)數(shù)元的中文輸入技術(shù)專利費(fèi)。外國公司的這一壟斷地位,使國內(nèi)的手機(jī)生產(chǎn)商每年都要付出高額的使用費(fèi),影響了國產(chǎn)手機(jī)的產(chǎn)品本地化進(jìn)程,也影響了國內(nèi)嵌入式中文輸入技術(shù)的發(fā)展。而目前新興起的手寫輸入技術(shù),需要在系統(tǒng)中嵌入一塊小型的手寫芯片,添加一個接口、一個手寫屏(或手寫板)、一支手寫筆,這無疑會增加手機(jī)的成本,同時在手寫時需要一只手拿手機(jī),一只手拿手寫筆,這又會給人們帶來不便。模擬手寫技術(shù)不需要給手機(jī)增加

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論