漢字字形概述課件_第1頁(yè)
漢字字形概述課件_第2頁(yè)
漢字字形概述課件_第3頁(yè)
漢字字形概述課件_第4頁(yè)
漢字字形概述課件_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章 中文信息處理漢字字形和字形庫(kù)管理技術(shù)內(nèi)容漢字字形概述字形描述技術(shù)字形的壓縮和還原字形的放大和縮小TTF字形技術(shù)字庫(kù)的設(shè)計(jì)和管理技術(shù)漢字字庫(kù)的應(yīng)用 5.1 漢字字形概述 漢字字形及其特點(diǎn)字形、字型和字形庫(kù)字形描述技術(shù)及其種類(lèi)5.1.1 漢字字形及其特點(diǎn)漢字字形指的是漢字形體結(jié)構(gòu)的圖像。 漢字字形的特點(diǎn):漢字的字形呈方塊形漢字從字形上可以分成各種結(jié)構(gòu)漢字字形的分解方法和分解標(biāo)準(zhǔn)尚未統(tǒng)一,常用的字形分解方法一般從單字、字根、筆畫(huà)(或筆形)和形素這四個(gè)層次入手。5.1.2 字形、字型和字形庫(kù)字形:字符的一個(gè)實(shí)例。有的時(shí)候,幾個(gè)字符可以合成一個(gè)字形,例如美元符號(hào):一個(gè)“S”形狀加上一根豎線:一個(gè)

2、“S”形狀加上一根割斷的豎線:一個(gè)“S”形狀加上兩根豎線:一個(gè)“S”形狀加上兩根割斷的豎線:漢字的字形更加復(fù)雜,我國(guó)制定了一系列的國(guó)家標(biāo)準(zhǔn)來(lái)嚴(yán)格定義各種字符集中字符的字形。5.1.2 字形、字型和字形庫(kù)(續(xù))字型:某一個(gè)字體的實(shí)例,如某個(gè)特定的磅值。西文的印刷字型有:serifsans serifscript中文使用的主要字型有:宋體仿宋體楷體黑體5.1.2 字形、字型和字形庫(kù)(續(xù))西文字型和中文字型的對(duì)應(yīng)關(guān)系 西文字型中文字型SerifSong(宋體)Sans serifHei(黑體)ScriptKai(楷體)OtherFangsong(仿宋體)5.1.2 字形、字型和字形庫(kù)(續(xù))字形庫(kù)中存

3、儲(chǔ)的是某個(gè)集合所有字符的字形信息。實(shí)際上,字形庫(kù)是一個(gè)計(jì)算機(jī)的存儲(chǔ)器系統(tǒng),它的設(shè)計(jì)、管理和使用原則上與計(jì)算機(jī)存儲(chǔ)器系統(tǒng)是一致的。5.1.3 字形描述技術(shù)及其種類(lèi)字形描述技術(shù)是以數(shù)字代碼描述字的形狀,在輸出版面的時(shí)候,由計(jì)算機(jī)將代碼還原,恢復(fù)字原來(lái)的形狀,由輸出設(shè)備輸出。字形描述技術(shù)也被稱為字形壓縮還原技術(shù)。字形描述技術(shù)的水平高低,不僅決定了輸出字的速度、字形美觀和輸出效果,同時(shí)也影響到:字庫(kù)存儲(chǔ)空間字形還原的計(jì)算量5.1.3 字形描述技術(shù)及其種類(lèi)(續(xù))字形描述技術(shù)描述一般可分為:點(diǎn)陣字形描述技術(shù)輪廓矢量字形描述技術(shù)曲線輪廓字形描述技術(shù)5.2 字形描述技術(shù)點(diǎn)陣字形描述技術(shù)輪廓矢量字形描述技術(shù)曲線

4、輪廓字形描述技術(shù)其他字形描述技術(shù)5.2.1 點(diǎn)陣字形描述技術(shù)漢字點(diǎn)陣的規(guī)模一般是:m2n m2n在一般情況下,16 16點(diǎn)陣和24 24點(diǎn)陣使用的比較多。隨著激光印字機(jī)、激光照排機(jī)、圖文記錄機(jī)等輸出設(shè)備分辨力的提高,又有了48 48、96 96、128 128、256 256、512 512、1024 1024的點(diǎn)陣字庫(kù)。下面以16 16點(diǎn)陣介紹點(diǎn)陣字形描述的方法。5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))把一個(gè)方塊橫向分成16格,縱向也分成16格,形成256個(gè)小方格,即該矩陣有256個(gè)“點(diǎn)”。每一個(gè)點(diǎn)可以有黑、白兩種顏色。用這樣的點(diǎn)陣覆蓋到漢字上,凡是與筆畫(huà)重疊的點(diǎn),規(guī)定它是黑色;凡是不與筆畫(huà)重疊的

5、點(diǎn),規(guī)定它是白色。5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))漢字“啊”的點(diǎn)陣字形 漢字“啊”點(diǎn)陣字形數(shù)字化表示 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))一個(gè)漢字點(diǎn)陣字形的存儲(chǔ)量:16 16:256位,即32個(gè)字節(jié)24 24:72個(gè)字節(jié)32 32:128個(gè)字節(jié)5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))橫向點(diǎn)陣:每個(gè)點(diǎn)陣數(shù)字代碼均描述漢字橫向點(diǎn)的情況。數(shù)字代碼是順序從左到右、自上而下掃描點(diǎn)陣各點(diǎn)狀態(tài)而形成的。一般適用于顯示器 。縱向點(diǎn)陣:每個(gè)點(diǎn)陣數(shù)字代碼均描述漢字縱向點(diǎn)的情況。數(shù)字代碼是順序從上到下、自左至右掃描點(diǎn)陣各點(diǎn)狀態(tài)而形成的。一般適用于打印機(jī) 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))16 16橫向點(diǎn)陣的情況 5.2.

6、1 點(diǎn)陣字形描述技術(shù)(續(xù))漢字“啊” 用橫向點(diǎn)陣來(lái)表示,其數(shù)字代碼是:00H、04H、2FH、7EH、F9H、04H、A9H、04H、AAH、14H、AAH、7CH、ACH、54H、AAH、54H、AAH、54H、A9H、54H、E9H、74H、ADH、54H、0AH、04H、08H、04H、08H、14H、08H、0CH5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))16 16縱向點(diǎn)陣的情況 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))漢字“啊”用縱向點(diǎn)陣來(lái)表示,其數(shù)字代碼是:3FH、F0H、20H、20H、7FH、F0H、20H、00H、7FH、FFH、42H、10H、4DH、88H、70H、70H、00H、00

7、H、47H、F0H、44H、20H、4FH、F2H、44H、01H、FFH、FFH、40H、00H、00H、00H 5.2.1 點(diǎn)陣字形描述技術(shù)(續(xù))各種精度的點(diǎn)陣字形其特點(diǎn)和用途 :16 16(簡(jiǎn)易型)24 24(普通型)32 32(提高型)其他更高精度的點(diǎn)陣字形5.2.2 輪廓矢量字形描述技術(shù)輪廓矢量字庫(kù)的出現(xiàn)是為了改進(jìn)點(diǎn)陣字庫(kù)鋸齒狀輪廓,同時(shí)也是因?yàn)槔L圖機(jī)用筆輸出的需要而發(fā)展起來(lái)的一種字形描述技術(shù)。 輪廓矢量的字形描述技術(shù)的核心是用多條直線逼近字形,并進(jìn)行封閉處理,字形效果明顯改觀。5.2.2 輪廓矢量字形描述技術(shù)(續(xù))輪廓矢量字形描述技術(shù)的直角坐標(biāo)系 5.2.2 輪廓矢量字形描述技術(shù)(

8、續(xù))5.2.2 輪廓矢量字形描述技術(shù)(續(xù))輪廓字庫(kù)解決了點(diǎn)陣字庫(kù)縮放后失真的問(wèn)題。這種字形描述技術(shù)對(duì)漢字橫平豎直的字形有很好的描述效果,但對(duì)于撇、捺、點(diǎn),以及圓弧裝飾效果的字體,仍然不能十分逼近字形,而且字體放大之后,輪廓仍然具有折線感。在大的點(diǎn)陣做成的矢量輪廓字庫(kù)縮小到很小或小的點(diǎn)陣做成的矢量字放大得很大時(shí),都會(huì)帶 來(lái)失真。因此大號(hào)字用256256點(diǎn)陣為基礎(chǔ)的矢量輪廓,而小號(hào) 字仍用9696或128128點(diǎn)陣為基礎(chǔ)的矢量輪廓。 5.2.3 曲線輪廓字形描述技術(shù)曲線輪廓字庫(kù)是以二次曲線和三次曲線逼近字形輪廓的字形描述方法。其中以PostScript字形描述技術(shù)為代表。PostScript字形描

9、述技術(shù)是用美國(guó)Adobe公司的PostScript頁(yè)面描述語(yǔ)言來(lái)描述字形的一種技術(shù)。其特點(diǎn)是以貝塞爾曲線(Bezier curve)擬合文字形狀,比較完整地保留了文字原有的字形信息。5.2.3 曲線輪廓字形描述技術(shù)(續(xù))解決字形質(zhì)量的失真問(wèn)題:特征參數(shù):對(duì)用直線、二次曲線或三次曲線描述字形輪廓的字形描述技術(shù)的一種補(bǔ)充。智能復(fù)原:依靠字形復(fù)原軟件的判斷和處理來(lái)保證字形復(fù)原的質(zhì)量,而字形描述本身不包含很多的特征信息。5.2.3 曲線輪廓字形描述技術(shù)(續(xù))PostScript Type 1語(yǔ)言中的特征參數(shù):字符級(jí)特征參數(shù):hstem/vstem:給出水平/垂直筆段的位置和寬度。hstem 3/vst

10、em 3:給出等距等寬的三個(gè)平行筆段的位置和寬度。字庫(kù)級(jí)特征參數(shù):StdHW, StdVW, StemSnapH, StemSnapV:給出字庫(kù)中字符的標(biāo)準(zhǔn)筆畫(huà)寬帶,或者筆畫(huà)寬度的跳躍變化,參數(shù)為寬度值的數(shù)組。BlueValues:給出西文字形的準(zhǔn)線位置,參數(shù)為準(zhǔn)線位置的數(shù)組。 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))部分筆畫(huà)水平段的情況 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))筆鋒高度的測(cè)量 5.2.3 曲線輪廓字形描述技術(shù)(續(xù))字庫(kù)中每個(gè)漢字的特征參數(shù)生成完畢以后,還要添加合適的字庫(kù)級(jí)特征參數(shù),主要包括:筆畫(huà)標(biāo)準(zhǔn)寬度StdHW/StdVW筆畫(huà)寬度的跳躍變化StemSnapH/StemSnapV

11、5.2.3 曲線輪廓字形描述技術(shù)(續(xù))比較有影響的PostScript西文字庫(kù)有:Type 1Type 3Type 5國(guó)內(nèi)用PostScript語(yǔ)言描述的輪廓字體只有以Type 1 和Type 3的格式做出的字庫(kù)。5.2.3 曲線輪廓字形描述技術(shù)(續(xù))用PostScript技術(shù)描述漢字時(shí),在字符筆畫(huà)過(guò)大、字又太細(xì)長(zhǎng)時(shí),軟件為了要顯示所有黑色筆畫(huà)就會(huì)忽略筆畫(huà)間的空白,造成筆畫(huà)重疊、比例變形等問(wèn)題。對(duì)于低分辨力的輸出設(shè)備(如顯示器和針式打印機(jī)),這種字庫(kù)的輸出效果反倒不如點(diǎn)陣字庫(kù)優(yōu)越,即使增加大量的特征參數(shù)描述也得不到較大的改善。因此也采用字庫(kù)中包含點(diǎn)陣字庫(kù)用于輸出小字號(hào)文字的變通方法。5.2.4

12、 其他字形描述技術(shù) TrueType字庫(kù)。微軟公司協(xié)助蘋(píng)果公司開(kāi)發(fā)并于1990年底推出TrueType字庫(kù)。這種字庫(kù)放棄以三次曲線逼近字形輪廓的優(yōu)點(diǎn),而采用二次曲線逼近字形輪廓。TrueType字庫(kù)有精心設(shè)計(jì)的特征參數(shù)處理。Folio字庫(kù)。在Unix作站的領(lǐng)域中,有Sun公司的Folio字庫(kù)技術(shù)。由于Sun工作站在美國(guó)廣泛用于社團(tuán)和專業(yè)用的出版系統(tǒng),因此Folio F3字形描述格式也是值得一提的字形描述技術(shù)。智能字庫(kù)(Intellifont)。由愛(ài)克發(fā)計(jì)算機(jī)國(guó)際公司開(kāi)發(fā),用于惠普系列激光印字機(jī)。5.3 字形的壓縮和還原 什么是字形的壓縮和還原字形點(diǎn)陣的壓縮和還原輪廓矢量字形的壓縮方法其他字形壓

13、縮技術(shù)5.3.1 什么是字形的壓縮和還原 對(duì)于正式出版物來(lái)說(shuō),文字分辨率需29.2線/毫米以上。因此,最常用的五號(hào)漢字點(diǎn)陣為108 108,特大號(hào)字則為576 576。不同精度的點(diǎn)陣表示一個(gè)漢字需要的字節(jié)數(shù):48482889696115212812820482K25625681928K5125123276832K1024 1024131072128K5.3.1 什么是字形的壓縮和還原(續(xù))512512點(diǎn)陣字庫(kù)GB2312字符集宋體、楷體、黑體、仿宋體4種字體字庫(kù)容量是845.375M10241024點(diǎn)陣字庫(kù)GB2312字符集宋體、楷體、黑體、仿宋體4種字體字庫(kù)容量是3381.5M5.3.1 什

14、么是字形的壓縮和還原(續(xù))字形信息壓縮技術(shù)應(yīng)滿足以下幾方面要求:字形信息壓縮技術(shù)不允許信息壓縮后丟失或發(fā)生錯(cuò)誤,也就是說(shuō)壓縮信息能正確再現(xiàn)原字形信息,否則在文字復(fù)原時(shí)將會(huì)引起字形畸變。字形信息壓縮過(guò)程應(yīng)當(dāng)簡(jiǎn)便易行,并且可用專門(mén)的軟件和硬件自動(dòng)完成,便于用戶獨(dú)立進(jìn)行缺字補(bǔ)充的操作。由文字字形壓縮信息向最終輸出的點(diǎn)陣字形信息的轉(zhuǎn)換應(yīng)當(dāng)迅速可靠。壓縮效果顯著。5.3.1 什么是字形的壓縮和還原(續(xù))追求壓縮效果和文字復(fù)原速度這兩個(gè)指標(biāo)是相互沖突的,因?yàn)閴嚎s倍率越高,字形復(fù)原過(guò)程就越復(fù)雜,復(fù)原工作量也越大,文字還原速度也就越慢。事實(shí)上,任何字形信息的壓縮方法都是以損失文字復(fù)原速度和輸出速度為代價(jià)而換來(lái)

15、存貯空間的節(jié)約的。評(píng)價(jià)一種字形壓縮技術(shù)的優(yōu)劣,不僅要看信息壓縮倍率的高低,而且還要看是否能做到快速?gòu)?fù)原。不能進(jìn)行快速文字復(fù)原的字形壓縮方法是不實(shí)用的。5.3.2 字形點(diǎn)陣的壓縮和還原黑白段表示法黑白段表示法是考慮到漢字筆畫(huà)中黑白連續(xù)變化的特點(diǎn)而產(chǎn)生的壓縮方法。壓縮時(shí)計(jì)算機(jī)逐行地?cái)?shù)取點(diǎn)陣中的空白點(diǎn)數(shù)(白段)和非空白點(diǎn)數(shù)(黑段), 按一定格式相間地記錄下一串?dāng)?shù)字構(gòu)成行點(diǎn)陣信息。同樣也可用重復(fù)行數(shù)來(lái)壓縮相鄰的重復(fù)行信息。行標(biāo)志重復(fù)行數(shù)白段黑段白段黑段 *N W1 B1 Wn Bn5.3.2 字形點(diǎn)陣的壓縮和還原(續(xù))線性增量表示法采用黑、白段信息格式,保留上述的豎直壓縮,增加一種新的壓縮格式。線性增

16、量表示法用以處理漢字筆畫(huà)中大量存在的斜線。在一行黑、白段記錄信息的后面再注明線段的增量,這樣下一行的黑、白段長(zhǎng)度在上一行的基礎(chǔ)上按增量的大小作相應(yīng)的變化。5.3.2 字形點(diǎn)陣的壓縮和還原(續(xù))行標(biāo)志重復(fù)行數(shù)白段白段增量黑段黑段增量 *N W1 W1 B1 B1白段白段增量黑段黑段增量 Wn Wn Bn Bn用增量記錄的行數(shù)要超過(guò)兩行(n大于2),壓縮才有意義。第1行是不考慮增量值的黑、白段信息,最后一行是加上相應(yīng)增量后的黑、白段信息,中間的n-2行的黑白段長(zhǎng)段均在上一行的長(zhǎng)度基礎(chǔ)上,加上線性增量來(lái)補(bǔ)齊的。 5.3.2 字形點(diǎn)陣的壓縮和還原(續(xù))考慮10241024點(diǎn)陣字庫(kù),如采用黑白段表示法得

17、到一行信息:“* 2 1024 0”,則表示?如果相鄰行不相同的概率為50%,平均每行有5個(gè)黑段,則一個(gè)漢字的字形信息有:(1+1+10*2)*1024*(100%-50%)=11K國(guó)內(nèi)早期在蒙納激光照排系統(tǒng)中使用一種13801380點(diǎn)陣的字庫(kù),1種字體就要約2000MB的存儲(chǔ)量。采用這兩種壓縮方法以后,這個(gè)系統(tǒng)的黑體、宋體、仿宋體、楷體4種字體的字庫(kù)總存儲(chǔ)量約為65MB。5.3.3 輪廓矢量字形的壓縮方法規(guī)則筆畫(huà):橫、豎、折。規(guī)則筆畫(huà)主要由直線段、起筆筆鋒、收筆筆鋒和轉(zhuǎn)折筆鋒等構(gòu)成。筆鋒總共可以分成7種,因此在宋體橫這一筆畫(huà)的壓縮表示中,用3位表示收筆筆鋒的號(hào)碼(06),其余的信息將指示橫的

18、起始點(diǎn)的x、y坐標(biāo),橫的長(zhǎng)度、寬度以及有無(wú)起筆筆鋒等。這樣宋體的一筆橫需34字節(jié)便可精確描述而絲毫不失真。筆畫(huà)豎也是如此,起筆筆鋒用3位信息來(lái)表示,收起筆鋒用2位信息來(lái)表示,其余的信息則表示起點(diǎn)坐標(biāo)、豎的長(zhǎng)度和寬度,此外還用1個(gè)字節(jié)來(lái)詳細(xì)描述筆畫(huà)左、右傾斜的情況,這樣描述宋體的豎需要5個(gè)字節(jié)。 5.3.3 輪廓矢量字形的壓縮方法(續(xù))不規(guī)則筆畫(huà):點(diǎn)、撇、捺、鉤對(duì)不規(guī)則筆畫(huà),用向量折線對(duì)輪廓曲線作一般性的描述。為了減少數(shù)位的浪費(fèi),使壓縮信息更加緊湊,采用增設(shè)控制字節(jié)的方法,按下述規(guī)則對(duì)之進(jìn)行裝配:5.3.3 輪廓矢量字形的壓縮方法(續(xù))若控制字節(jié)的頭兩位為11,則該字節(jié)其余6位與下一節(jié)合起來(lái),指

19、示不規(guī)則筆畫(huà)起始點(diǎn)的x、y坐標(biāo)。7654321011筆畫(huà)起始點(diǎn)的x坐標(biāo)x7筆畫(huà)起始點(diǎn)的y坐標(biāo)5.3.3 輪廓矢量字形的壓縮方法(續(xù))若控制字節(jié)的頭兩位為10,表示所指示的向量的x、y的絕對(duì)值中至少有一個(gè)大于等于16,此時(shí)控制字節(jié)的末6位與下一字節(jié)合起來(lái)表示該向量的x、y的數(shù)值,數(shù)值以原碼表示。7654321010向量的xx7向量的y5.3.3 輪廓矢量字形的壓縮方法(續(xù))N7654321001向量的個(gè)數(shù)N象限| x | y |象限| x | y |若控制字節(jié)的頭兩位為01,表示后面N個(gè)向量的x、y絕對(duì)值均小于8,N由控制字節(jié)的最末5位指示。后面N個(gè)向量中的每個(gè)向量用一個(gè)字節(jié)表示,其中2位指示該

20、向量所處的象限,3 位指示x的絕對(duì)值,3位指示y的絕對(duì)值。5.3.3 輪廓矢量字形的壓縮方法(續(xù))N7654321000象限向量的個(gè)數(shù)N| x | y | x | y |若控制字節(jié)的頭兩位為00,表示后面N個(gè)向量處于同一象限,且x、y的絕對(duì)值均小于16。N由控制字節(jié)的最末4位表示,控制字節(jié)的中間2位指明象限,后面N個(gè)向量都由一個(gè)字節(jié)表示,其中4位指示x的絕對(duì)值,4位指示y的絕對(duì)值。5.3.3 輪廓矢量字形的壓縮方法(續(xù))在采用了上述的進(jìn)一步壓縮的措施之后,1個(gè)五號(hào)漢字字形信息平均需要120字節(jié)來(lái)記錄,而記錄1個(gè)五號(hào)漢字字形點(diǎn)陣信息大約需用1400多個(gè)字節(jié),因此單字的平均壓縮倍率大約為12倍。由

21、于五號(hào)字最常用,且非變倍字形的恢復(fù)速度也最快,故系統(tǒng)字庫(kù)中只存入五號(hào)字的字形壓縮信息,而其余字號(hào)均由計(jì)算機(jī)通過(guò)五號(hào)字字模變倍得到。目前的計(jì)算機(jī)漢字出版系統(tǒng)上中宋體、黑體、仿宋體、楷體、報(bào)宋體、小標(biāo)題宋體幾種字模的壓縮信息,存儲(chǔ)量約為5MB,字??傮w壓縮倍率在500倍左右。5.3.3 輪廓矢量字形的壓縮方法(續(xù))字形壓縮信息與最終輸出的點(diǎn)陣字形信息,這兩種數(shù)據(jù)之間存在著“結(jié)構(gòu)沖突”?!按涡驔_突”:字模壓縮信息以筆畫(huà)為序,規(guī)則筆畫(huà)在前,不規(guī)則筆畫(huà)在后,一筆信息完畢再有另一筆信息;而輸出點(diǎn)陣信息則是從左至右,一行完了再開(kāi)始新的一行,二者的次序關(guān)系完全不同。“邊界沖突”:字模壓縮信息以筆畫(huà)劃分內(nèi)部信息

22、的邊界,而最終要輸出的點(diǎn)陣信息以行劃分邊界,二者的邊界完全不同。5.3.4 其他字形壓縮技術(shù)骨架向量法:又稱筆畫(huà)骨架法。用能夠表示漢字筆畫(huà)特征的線段,作為組成漢字字形的最基本元素的字形表示法??捎孟铝袛?shù)據(jù)來(lái)表示:(15,1E)、(80,8D)(F5,F(xiàn)E)、(1D,F(xiàn)D)5.3.4 其他字形壓縮技術(shù)(續(xù))部件組字法:抽取漢字的共性,以最少量的部件和筆畫(huà)作為基本字元來(lái)組織出盡可能多的漢字字形,這就是所謂的組字技術(shù)。組字技術(shù)并非信息壓縮技術(shù)。漢字字形壓縮法還有:無(wú)失真向量擬合法、曲線參數(shù)擬合法、筆畫(huà)函數(shù)疊加法、輪廓特征分析法、復(fù)合壓縮法、遞推偏差擬合法、折線法、疊加法字形壓縮、哈夫曼綜合處理法等。

23、5.4 字形的放大和縮小 漢字的字號(hào)字形放大和縮小的基本原理防止字形放大和縮小失真的措施字形放大縮小的應(yīng)用5.4.1 漢字的字號(hào)書(shū)版宋體、報(bào)版宋體、標(biāo)題宋體、仿宋體、黑體和楷體這六種字體,均以五號(hào)字為基本字號(hào)。字模存儲(chǔ)器中只存放五號(hào)字的壓縮信息,其余字號(hào)都由五號(hào)字變倍而得?;咀煮w還可以通過(guò)拉長(zhǎng)和壓扁的變倍方法變化出各種長(zhǎng)字體和扁字體。5.4.2 字形放大和縮小的基本原理字形在放大和縮小時(shí),也分為規(guī)則筆畫(huà)和不規(guī)則筆畫(huà)這兩種情況來(lái)處理。無(wú)論使規(guī)則筆畫(huà)還是不規(guī)則筆畫(huà),都是用輪廓折線表示的,它們很容易被放大縮小。例如,要使得圖形放大r倍(這里r不一定是整數(shù)),只需把對(duì)應(yīng)的每段輪廓折線放大r倍,也即對(duì)

24、每條折線的x、y值都乘以r。要得到高質(zhì)量的放大或縮小的字形,需要采取一系列的措施來(lái)防止在變倍過(guò)程中的失真。5.4.3 防止字形放大和縮小失真的措施1. 防止字形變倍時(shí)的舍入誤差積累。變倍時(shí)舍入誤差的積累 5.4.3 防止字形放大和縮小失真的措施(續(xù))結(jié)點(diǎn)變倍方法,用下面的公式獲得變倍后的x、y(變倍率=r):AB折線的x = B點(diǎn)的x坐標(biāo) A點(diǎn)的x坐標(biāo)= (B點(diǎn)x坐標(biāo) r)(舍入) - (A點(diǎn)x坐標(biāo) r)(舍入)AB折線的y = B點(diǎn)的y坐標(biāo) A點(diǎn)的y坐標(biāo)= (B點(diǎn)y坐標(biāo) r)(舍入) - (A點(diǎn)y坐標(biāo) r)(舍入)* 這里(p)(舍入)表示p經(jīng)過(guò)四舍五入后取整數(shù)值。5.4.3 防止字形放大和

25、縮小失真的措施(續(xù))2. 保證規(guī)則筆畫(huà)寬度的一致性。對(duì)于規(guī)則筆畫(huà)橫、豎、折的寬度部分,不采用結(jié)點(diǎn)變倍法,而按下述公式計(jì)算:變倍后的寬度 = (變倍前寬度 r)(舍入) 5.4.3 防止字形放大和縮小失真的措施(續(xù))3. 規(guī)則筆畫(huà)與不規(guī)則筆畫(huà)銜接部分的處理筆畫(huà)勾的下延伸 A點(diǎn)的A點(diǎn)由直線變倍得到,而對(duì)應(yīng)B點(diǎn)的B點(diǎn)由結(jié)點(diǎn)變倍得到。這樣,AB直線本來(lái)是直的,但變倍后的AB折線可能變成向左或向右傾斜一格的斜線??刹扇∫韵麓胧┛朔耸д妫寒?dāng)延伸的第一筆原x = 0,則變倍后永遠(yuǎn)使這一筆的x = 0。5.4.3 防止字形放大和縮小失真的措施(續(xù))4. 小號(hào)字橫的寬度的控制和筆鋒的細(xì)致描述。字號(hào)縮小很小時(shí),

26、在變倍過(guò)程中會(huì)引起某些部分變得過(guò)分密集,尤其當(dāng)一個(gè)字內(nèi)橫的數(shù)量很多時(shí)。在橫的壓縮信息中,用兩位二進(jìn)制數(shù)細(xì)致刻畫(huà)橫寬。5.4.4 字形放大縮小的應(yīng)用點(diǎn)陣方法描述的字形在縮放時(shí)采用插值加線或抽線的方法,會(huì)產(chǎn)生嚴(yán)重變形或以質(zhì)量損失為代價(jià)。可以采用平滑技術(shù)使鋸齒邊的臺(tái)階縮小或用斜邊代替鋸齒。但是無(wú)論平滑技術(shù)如何好,所產(chǎn)生的字形因鋸齒或折線而產(chǎn)生的不平滑感只能縮小而不能排除。 5.4.4 字形放大縮小的應(yīng)用(續(xù))輪廓矢量方法是為了改進(jìn)點(diǎn)陣字形在縮放時(shí)會(huì)出現(xiàn)鋸齒狀輪廓而產(chǎn)生。在文字復(fù)原時(shí),通過(guò)對(duì)向量的長(zhǎng)度進(jìn)行變倍放大或縮小,便可獲得不同的字號(hào)。如果在變倍時(shí)對(duì)x方向和y方向分別選不同的倍率,還可以獲得變形長(zhǎng)

27、體字或扁體字。輪廓字庫(kù)在還原時(shí)需經(jīng)特定的運(yùn)算將這些用輪廓描述的字形轉(zhuǎn)化成點(diǎn)陣方式,再由輸出設(shè)備輸出。這個(gè)運(yùn)算可以在輸出設(shè)備內(nèi)進(jìn)行,也可在計(jì)算機(jī)上先轉(zhuǎn)換成位圖再輸出。5.4.4 字形放大縮小的應(yīng)用(續(xù))輪廓字庫(kù)解決了點(diǎn)陣字庫(kù)縮放后失真的問(wèn)題。這種字形描述技術(shù)對(duì)漢字橫平豎直的字形有很好的描述效果,但對(duì)于撇、捺、點(diǎn),以及圓弧裝飾效果的字體,即使是縮小直線距,仍然不能十分逼近字形,而且字體放大之后,輪廓仍然具有折線感。由于近年來(lái)硬件的迅速發(fā)展,有能力用二次曲線或三次曲線代替直線描述字形輪廓的字庫(kù)。5.5 TTF字形技術(shù)什么是TrueTypeTrueType的基本原理TrueType字體文件結(jié)構(gòu)True

28、Type的特點(diǎn)和優(yōu)勢(shì)TrueType的應(yīng)用OpenType的出現(xiàn)5.5.1 什么是TrueTypeTrueType是Apple公司和Microsoft公司合作開(kāi)發(fā)的PDL(Page Description Language)語(yǔ)言TrueImage中的字形描述部分。TrueType有一套專門(mén)的指令集,用于完成字形的描述、特征參數(shù)的描述及其他一些描述。它用的輪廓描述曲線是二次B-樣條(Bezier-spline)函數(shù)。 5.5.2 TrueType的基本原理TrueType字體對(duì)字形的描述是輪廓描述,在輪廓上有一串結(jié)點(diǎn)組成,這些結(jié)點(diǎn)有on-line和off-line兩種屬性來(lái)描述一個(gè)封閉的輪廓線。

29、TrueType對(duì)字形輪廓上的結(jié)點(diǎn)都給出一個(gè)編號(hào),其順序是按順時(shí)針?lè)较蜃咭蝗Γ刺詈诘牟糠钟肋h(yuǎn)在其右邊。5.5.2 TrueType的基本原理(續(xù))TrueType字庫(kù)中的主要特征參數(shù)在X方向上有5個(gè)關(guān)鍵距離值:字身最左邊的起始點(diǎn)到字母主干的空間;字母主體部分的寬度;字身的寬度(西文字母字身不等寬);字母主干(stem)的寬度;字母襯線(serif)的大小。在Y方向上:字母橫干(crossbar)的厚度;字母襯線的厚度;字母主體的高度;字母橫干的高度。5.5.2 TrueType的基本原理(續(xù))在變倍時(shí)用數(shù)學(xué)方法將相同的特征參數(shù)值同等定義,在任何字號(hào)下都同等還原,這時(shí)考慮的是字體各特征點(diǎn)的形狀

30、,而不考慮坐標(biāo)格的修整。TrueType的字形文件不單單由輪廓數(shù)據(jù)而且還有用TrueType指令寫(xiě)的程序,TrueType的字形包括指令和數(shù)據(jù)及TrueType字形發(fā)生器。5.5.3 TrueType字體文件結(jié)構(gòu)TrueType字體文件總體結(jié)構(gòu):文件頭(12 Bytes)描述表目錄(每個(gè)16 Bytes)描述表數(shù)據(jù)5.5.3 TrueType字體文件結(jié)構(gòu)(續(xù))文件頭共12B:Fixedsfnt_version/TTF文件版本號(hào)碼(0 x00010000)USHORTnumTables/描述表數(shù)目USHORTsearchRange/描述表快速查找范圍USHORTentrySelector/描述表

31、入口選擇USHORTrangeShift/范圍調(diào)整5.5.3 TrueType字體文件結(jié)構(gòu)(續(xù))描述表目錄。其目錄個(gè)數(shù)由numTables決定,每個(gè)目錄項(xiàng)16B:ULONGtag/描述表名稱(4 Bytes)ULONGcheckSum/描述表內(nèi)容的校驗(yàn)和ULONGoffset/此描述表的位置偏移(從文件頭開(kāi)始)ULONGlength/描述表字節(jié)長(zhǎng)度5.5.3 TrueType字體文件結(jié)構(gòu)(續(xù))常用的TTF文件描述表共有19個(gè),其中有10個(gè)為每個(gè)TTF文件所必須包含的,其他的9個(gè)可根據(jù)需要任選。10個(gè)必須的描述表:cmap字符代碼到文字序號(hào)的映射表glyf文字輪廓數(shù)據(jù) head文件頭信息hhea

32、水平度量頭信息 hmtx水平度量信息loca字符輪廓數(shù)據(jù)位置索引maxp最大值描述name名字表postPostScript打印機(jī)控制OS/2OS/2和Windows度量信息5.5.3 TrueType字體文件結(jié)構(gòu)(續(xù))9個(gè)可選的描述表:cvt 控制值表fpgm定義程序區(qū)hdmx水平設(shè)備度量kern緊排控制LTSH線性門(mén)限 prepCVT程序區(qū)WIN 保留VDMX垂直設(shè)備度量FOCA保留5.5.4 TrueType的特點(diǎn)和優(yōu)勢(shì)TrueType的特點(diǎn)是:TrueType既可作打印字體,又可以用作屏幕顯示。由于它是由指定字形進(jìn)行描述,因此它與分辨率無(wú)關(guān),輸出時(shí)總是按照打印機(jī)的分辨率輸出。無(wú)論放大或

33、縮小,字符總是光滑的,不會(huì)有鋸齒出現(xiàn)。相對(duì)PostScript字體來(lái)說(shuō),其質(zhì)量要差一些。特別是在文字太小時(shí),表現(xiàn)得不是很清楚。5.5.4 TrueType的特點(diǎn)和優(yōu)勢(shì)由于TrueType技術(shù)本身的特點(diǎn)而使它具有以下優(yōu)勢(shì):真正的所見(jiàn)即所得效果支持字體嵌入技術(shù),保證文件的跨系統(tǒng)傳遞性操作系統(tǒng)平臺(tái)的兼容性ABC字寬值精確的字體輪廓描述品種繁多的字體家族5.5.5 TrueType的應(yīng)用TTF字體的創(chuàng)建:使用已有的TTF字體編輯軟件。TTF字體在面向?qū)ο蟪绦蛑械囊茫篧indows使用LOGFONT結(jié)構(gòu)定義字體文件的屬性。此結(jié)構(gòu)可以在程序中直接引用。程序片斷。5.5.6 OpenType的出現(xiàn)為了解決 “前后端不一致”的問(wèn)題,微軟和Adobe公司聯(lián)合推出了一種新的通用字體格式OpenType(簡(jiǎn)稱OTF)。OpenType集中了TrueType和Type 1兩種字形描述技術(shù)的特點(diǎn),是一個(gè)開(kāi)放、無(wú)版權(quán)的字形描述技術(shù)。5.5.6 OpenType的出現(xiàn)(續(xù))OpenType字體格式能達(dá)到以下目的:更寬的多平臺(tái)支持;更好的支持國(guó)際字符集;更強(qiáng)的字體數(shù)據(jù)保護(hù);字體文件更小,有利于提高發(fā)送效率;為先進(jìn)的字體印刷控制提供更多的支持。5.6 字庫(kù)的設(shè)計(jì)和管理技術(shù)漢字字庫(kù)的基本要求漢字庫(kù)性能的評(píng)測(cè)漢字庫(kù)結(jié)構(gòu)的設(shè)計(jì)點(diǎn)陣字庫(kù)的制作5.6.1 漢字字庫(kù)的基本要求漢字庫(kù)的設(shè)計(jì)應(yīng)該追求三項(xiàng)目標(biāo):字形質(zhì)量高讀取

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論