成品庫編碼知識2011年版_第1頁
成品庫編碼知識2011年版_第2頁
成品庫編碼知識2011年版_第3頁
成品庫編碼知識2011年版_第4頁
成品庫編碼知識2011年版_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

編碼知識(2011年版)什么是編碼?以固定的順序排列字符,并以此做為記錄、存貯、傳遞、交換的統(tǒng)一內(nèi)部特征,這個字符排列順序被稱為“編碼”。字庫的編碼是字庫組織的依據(jù),也是文字處理的基礎(chǔ)。不同國家和地區(qū)有不同的編碼標準。和中文字庫有關(guān)的常見編碼有:單字節(jié)編碼、GB2312-80、GB12345-90、GBK、Unicode編碼、ISO10646/Unicode字符集、GB18030-2000、BIG5編碼、方正748編碼工作中應(yīng)用頻率最高的編碼?GB2312-80編碼;(大陸簡體)GB12345-90編碼;(大陸繁體)GBK編碼;Big5編碼;(港澳臺繁體)GB2312-80編碼?全稱是《信息交換用漢字編碼字符集基本集》,1980年發(fā)布,是中文信息處理的國家標準,在大陸及海外使用簡體中文的地區(qū)(如新加坡等)是強制使用的唯一中文編碼。GB2312-80標準每個字體含字符7539個,詳細內(nèi)容如下:

7539=94(單字節(jié)ASCII字符)

+6763(雙字節(jié)漢字)+682(雙字節(jié)符號)可以簡單的理解為:在大陸應(yīng)用的最基本的簡體編碼標準;GB12345-90編碼?全稱是《信息交換用漢字編碼字符集輔助集》,是一個關(guān)于繁體漢字的編碼標準。所謂“輔助集”是與“基本集”(GB2312-80)相對應(yīng)而言的。原則上是將GB2312中的簡化字用相應(yīng)的繁體字替換而成。GB12345標準每個字體含字符7642個,詳細內(nèi)容如下:

7642=94(單字節(jié)ASCII字符)

+6866(雙字節(jié)漢字)+682(雙字節(jié)符號)可以簡單的理解為:在大陸應(yīng)用的繁體編碼標準;GBK編碼?全稱是《漢字內(nèi)碼擴展規(guī)范》,1995年發(fā)布,該編碼標準兼容GB2312,簡、繁體字融于一庫。GBK標準每個字體含字符21980個,詳細內(nèi)容如下:

21980=94(單字節(jié)ASCII字符)

+21003(雙字節(jié)漢字)+883(雙字節(jié)符號)

可以簡單的理解為:在大陸應(yīng)用的字數(shù)較多的編碼標準;GB2312編碼屬于GBK編碼的子集;Big5編碼?是目前臺灣、香港地區(qū)普遍使用的一種繁體漢字的編碼標準,俗稱“大五碼”。BIG5標準每個字體含字符13554,詳細內(nèi)容如下:

13554=94(單字節(jié)ASCII字符)+407(標準符號區(qū)<A140-A3E1,含歐元>)

+5401(常用字區(qū)<A440-C67E>)

+7652(次常用字區(qū)<C940-F9D5>)可以簡單的理解為:在港澳臺地區(qū)應(yīng)用的最基本的繁體編碼標準;四個編碼體系的關(guān)系1、若在大陸地區(qū)應(yīng)用,主要應(yīng)用到GB2312-80編碼、GB12345-90編碼、GBK編碼;若在港澳臺地區(qū)應(yīng)用,主要應(yīng)用Big5編碼;2、GBK編碼可簡單理解為大字符集,包括GB2312-80編碼、GB12345-90編碼中的所有字符,并有所增加;兩種繁體字型比較GB12345-90編碼的繁體與Big5編碼的繁體字型不同,不可混用。同一個編碼體系,不同字體時寫法也不同;GBK編碼有漢字21003個,而GB2312編碼只有漢字6763個。

一些生僻字都包含進了GBK編碼,比如:喆镕犇堃瞭暸旻皕彧屾玕珺愔赟篯玨玨珮等;通常戶籍管理、辭書出版、古籍整理、地理信息系統(tǒng)中涉及的文字較多,建議使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論