字符數(shù)據(jù)的編碼_第1頁(yè)
字符數(shù)據(jù)的編碼_第2頁(yè)
字符數(shù)據(jù)的編碼_第3頁(yè)
字符數(shù)據(jù)的編碼_第4頁(yè)
字符數(shù)據(jù)的編碼_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.西文字符的編碼

ACSII碼(AmericanStandardCodeforInformationInterchange)

128個(gè)常用字符,用有一個(gè)字節(jié)表示,其中用低7位二進(jìn)制編碼,最高位置0。例如:“a”字符的編碼為1100001,對(duì)應(yīng)的十進(jìn)制數(shù)是97;換行0AH10

回車(chē)0DH13

空格 20H 32‘0’~‘9’30H~39H 48~57‘A’~‘Z’41H~5AH 65~90‘a(chǎn)’~‘z’ 61H~7AH 97~1221.6.4字符數(shù)據(jù)的編碼

2.漢字編碼(1)漢字輸入碼音碼:以漢語(yǔ)拼音為基礎(chǔ)的編碼方案,如全拼、雙拼等。優(yōu)點(diǎn)是容易掌握,但重碼率高。形碼:以漢字字形結(jié)構(gòu)為基礎(chǔ)的編碼方案,如五筆字型輸入法、鄭碼輸入法等。優(yōu)點(diǎn)是重碼少,但不容易掌握。音形碼:將音碼和形碼結(jié)合起來(lái)的編碼方案,如智能ABC輸入法、自然碼輸入法等。優(yōu)點(diǎn)是能減少重碼率,并提高漢字輸入速度。(2)漢字國(guó)標(biāo)碼(GB2312-80)

我國(guó)國(guó)家標(biāo)準(zhǔn)總局于81年5月公布《信息交換用漢字編碼字符集》(GB2312-80),給出了漢字編碼的國(guó)家標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)給出的漢字編碼簡(jiǎn)稱國(guó)標(biāo)碼,共7445個(gè)字符。

(3)機(jī)內(nèi)碼

一個(gè)國(guó)標(biāo)碼

占兩個(gè)字節(jié),每個(gè)字節(jié)最高位為0,將國(guó)標(biāo)碼的每個(gè)字節(jié)的最高位由0變?yōu)?,變換后的國(guó)標(biāo)碼稱為漢字機(jī)內(nèi)碼。漢字國(guó)標(biāo)碼漢字機(jī)內(nèi)碼

(0101011001010000)B(1101011011010000)B

(0011101100101010)B(1011101110101010)B機(jī)內(nèi)碼是計(jì)算機(jī)處理漢字信息時(shí)使用的編碼。(4)漢字字形碼漢字字形碼又稱為漢字字模,用于漢字的輸出,漢字輸出有顯示和打印兩種方式。目前,漢字信息處理系統(tǒng)中大多數(shù)以點(diǎn)陣方式形成漢字字形。點(diǎn)陣:漢字字形點(diǎn)陣的代碼。有16×16、24×24、32×32、48×48等。上圖為“慶”字的16×16點(diǎn)陣字形示意圖。(5)漢字地址碼

漢字地址碼是指漢字庫(kù)(主要指字形的點(diǎn)陣字模庫(kù))中存儲(chǔ)漢字字形信息的邏輯地址碼。

地址碼和機(jī)內(nèi)碼要有簡(jiǎn)明的對(duì)應(yīng)轉(zhuǎn)換關(guān)系。(6)各種漢字代碼之間的關(guān)系

漢字的輸入、處理和輸出的過(guò)程實(shí)際上是漢字的各種代碼之間的轉(zhuǎn)換過(guò)程。下圖為漢字信息處理系統(tǒng)的模型。

(7)其他內(nèi)碼

漢字內(nèi)碼內(nèi)容簡(jiǎn)介GBK碼GBK編碼是中文編碼擴(kuò)展國(guó)家標(biāo)準(zhǔn)(GB即“國(guó)標(biāo)”,K是“擴(kuò)展”的漢語(yǔ)拼音第一個(gè)字母),全稱為《漢字內(nèi)碼擴(kuò)展規(guī)范》,是對(duì)GB2312國(guó)標(biāo)碼的擴(kuò)充,共收錄21003個(gè)漢字和883個(gè)符號(hào),并提供1894個(gè)造字碼位,簡(jiǎn)體字和繁體字融為一庫(kù)GB18030碼GB18030是在國(guó)標(biāo)碼和漢字內(nèi)碼擴(kuò)展規(guī)范GBK1.0規(guī)范基礎(chǔ)上的擴(kuò)充。它采用單字節(jié)、雙字節(jié)、四字節(jié)混合編碼,共收錄了27000多個(gè)漢字,且在統(tǒng)一的編碼框架下,為未來(lái)的擴(kuò)充提供了充足的空間。該標(biāo)準(zhǔn)的實(shí)施將為制定統(tǒng)一的應(yīng)用軟件中文接口標(biāo)準(zhǔn)規(guī)范創(chuàng)造條件BIG5碼BIG5碼是一個(gè)繁體字編碼方案,它廣泛地應(yīng)用于計(jì)算機(jī)和網(wǎng)絡(luò)中。它是一個(gè)雙字節(jié)編碼方案,包括440個(gè)符號(hào),一級(jí)常用漢字5401個(gè),二級(jí)次常用漢字7652個(gè),共計(jì)13000多個(gè)漢字UCS碼UCS碼(universalmultiple-octetcodedcharacterset,通用多八位編碼字符集)是國(guó)際標(biāo)準(zhǔn)化組織(ISO)為各種語(yǔ)言字符制定的編碼標(biāo)準(zhǔn)。所謂“八位”就是一個(gè)字節(jié),“多八位”就是多個(gè)字節(jié)Unicode碼Unicode碼是可以容納世界上所有文字和符號(hào)的字符編碼方案。它為每種語(yǔ)言中的每個(gè)字符設(shè)定了統(tǒng)一并且唯一的二進(jìn)制編碼,以滿足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換和處理的要求。在創(chuàng)造Unicode之前,沒(méi)有一種編碼可以包含足夠的字符。即使是一種語(yǔ)言,例如,英語(yǔ),也沒(méi)有哪一個(gè)編碼可以適用于所有的字母、標(biāo)點(diǎn)符號(hào)和常用的技術(shù)符號(hào)。目前許多操作系統(tǒng)和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論