DB31∕T 1066-2017 四值圖像電子文檔壓縮算法_第1頁
DB31∕T 1066-2017 四值圖像電子文檔壓縮算法_第2頁
DB31∕T 1066-2017 四值圖像電子文檔壓縮算法_第3頁
DB31∕T 1066-2017 四值圖像電子文檔壓縮算法_第4頁
DB31∕T 1066-2017 四值圖像電子文檔壓縮算法_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

四值圖像電子文檔壓縮算法上海市質(zhì)量技術(shù)監(jiān)督局發(fā)布I Ⅲ V 1 13四值圖像電子文檔壓縮的標(biāo)準(zhǔn)流程 24四值壓縮算法技術(shù)要求 25四值壓縮算法的應(yīng)用 3Ⅲ本標(biāo)準(zhǔn)按照GB/T1.1—2009給出的規(guī)則起草。本標(biāo)準(zhǔn)由上海市政府辦公廳電子政務(wù)辦公室提出并歸口。本標(biāo)準(zhǔn)由上海市政府辦公廳電子政務(wù)辦公室、上海金剛石數(shù)碼研究中心負責(zé)起草。為了滿足四值圖像電子文檔壓縮算法標(biāo)準(zhǔn)化需求,根據(jù)當(dāng)前使用的電子文檔(包括文本文件、電子表單、數(shù)字憑證),存在的體量較大、針對性壓縮算法少、且已有的電子文檔壓縮算法的知識產(chǎn)權(quán),可能存在“巨額使用費”陷阱的現(xiàn)狀,針對中國文檔只有四種顏色(四值)的特點,有必要提出一種需要針對電子文件的標(biāo)準(zhǔn)化的高效壓縮算法。采用本標(biāo)準(zhǔn)的TIFF圖像文件,作為電子政務(wù)與電子商務(wù)的電子文檔,可以繞過國外軟件企業(yè)知識1四值圖像電子文檔壓縮算法本標(biāo)準(zhǔn)規(guī)定了四值圖像電子文檔(以下簡稱四值圖像)壓縮的標(biāo)準(zhǔn)流程、技術(shù)要求和應(yīng)用等。本標(biāo)準(zhǔn)適用于上海市電子政務(wù)與電子商務(wù)的四值電子文檔的產(chǎn)生與存檔。2術(shù)語和定義下列術(shù)語和定義適用于本文件。無損壓縮losslesscompres一個比特位都不能丟失、修改與添加的壓縮技術(shù)。文本文件textdocuments一種由若干行字符構(gòu)成的計算機文件作為一種容器存儲特定編碼格式的字符串。數(shù)字憑證digitaldocument張尺寸不等的圖片組成的電子文檔。電子文檔Electronicdocument人們在社會活動中形成的,以計算機盤片、磁盤和光盤等化學(xué)磁性材料為載體的電子文檔與檔案。四值圖像Quaternaryimage24Bit位圖24-Bitmap由RGB3個字節(jié)的位圖圖像(Bitmap),可以表達為2的24次方,約1600萬種顏色。通過兩種及其兩種以上的壓縮算法,復(fù)合實施電子文檔壓縮處理的方法。四值預(yù)壓縮quaternaryprecompression將采用位圖技術(shù)且其顏色不超過四種的電子文檔,對其位圖像素點用2個Bit數(shù)字表示(預(yù)處理)的壓縮過程。注:反之,解壓縮過程也稱之為四值解壓縮。2電子文檔壓縮前后的體量大小之比。等(圖像文件描述的表格和文字特殊應(yīng)用)四種顏色的文本文件、電子表單和數(shù)字憑證都轉(zhuǎn)為TIFF(24)圖像文件格式。選用TIFF(24)圖像文件格式,是因為它沒有版權(quán)障礙。而且,可以選用本標(biāo)準(zhǔn)的四值壓縮算法進行基于操作系統(tǒng)自動壓縮與解壓縮。轉(zhuǎn)換后的電子文檔具有以下特色:c)確保電子文檔創(chuàng)建安全機制的可能性(TIFF文件中創(chuàng)建安全機制和加載安全信息的方法與流程另行描述),使得電子文檔使用更加安全;d)使得電子文檔(運用痕跡處理技術(shù)實現(xiàn),另行描述)既能讓人“看”得懂,又能讓計算機“讀”得懂;e)選擇TIFF圖像格式的位圖顏色深度為24Bit,位圖像素分別為R(紅色)、G(藍色)、B(綠色)各一個字節(jié)(8Bit)。這種位圖深度支持圖像的全真彩顯示。滿足電子文檔的各種應(yīng)用需要。本壓縮算法僅用于TIFF格式文件的位圖,文件頭部和文件屬性不實施數(shù)據(jù)壓縮。24Bit的像素可以表達22種顏色,而我們的電子文檔最多只有4種顏色,因此,就可能設(shè)計出有針對性、高壓縮比的壓縮算法(具體壓縮算法下一節(jié)詳細描述)。壓縮比高于其他壓縮算法。安裝一個小程序,它通過從微軟Windows操作系統(tǒng)的編譯器regedit,對系統(tǒng)注冊表中HKEY_CurrentVersion\Explorer\FileExts\TIFF子鍵中添加引導(dǎo)使用四值壓縮算法函數(shù)(壓縮與解壓縮函數(shù)),使得操作系統(tǒng)打開和關(guān)閉TIFF文檔時,就自動實施文件的壓縮與解壓縮。四值壓縮算法其實是一種復(fù)合壓縮算法,首先它對TIFF位圖進行“四值預(yù)壓縮”;然后,值預(yù)壓縮后的數(shù)據(jù)進行字典壓縮(LZW),以取得較高的壓縮比。因為四值預(yù)壓縮與字典壓縮(LZW)都3需要。24Bit的像素可以表達2種顏色,而電子文檔中位圖(也就是壓縮對象)只有不超過四種顏色(任意四種顏色)。因此,將位圖像素中四種顏色分別用00、01、10、11表示,也就是將一個像素RGB的24Bit用2Bit來表示。四值預(yù)壓縮的壓縮比為1/12,就是電子文檔體量OFF91.67%,縮小到原來的四值預(yù)壓縮算法是一種無損壓縮。字典壓縮算法通過建立字典,通過創(chuàng)建一個串表(串由一個前綴值與后綴值所組成。前綴是原始數(shù)成一個串,然后與串表中匹配,當(dāng)這個串不存在時,就將這個串存儲進串表,生成這個串表的前綴值,并將這個串表的后綴變更為前綴;如果這個串已經(jīng)存在串表,就舍棄這個串的后綴,并將前綴變更為那個用來表示這個串的數(shù)字。之后,再接著讀取數(shù)據(jù),與之前留下的前綴組成一個串,并繼續(xù)進行上面的過程。這個串表會在壓縮后刪除,解壓時重建。然后,將解壓縮結(jié)果再進行四值預(yù)解壓縮,最終獲得“無損”的原始位圖。4.5.1位圖的四種顏色(RGB值)存放在TIFF圖像文件50020屬性中。4.5.2壓縮算法選擇,存放在文件259屬性的值為0x0300010010,最后兩位“10”表示采用四值壓縮算法。寫文字(一般接近黑色,0x000000,數(shù)量次之);紅章,或者紅頭文字(一般接近紅色,0xFF0000,較少);紅章蓋在填寫文字上(一般接近紅色,0xFF0000,最少)。這四種顏色是默認值,工具軟件支持用戶修改。5.1.1.2壓縮算法選擇。默認值為01表示未壓縮;02表示采用CCITTGroup3壓縮;03表示CCITT45.1.2.1圖像四值數(shù)據(jù)結(jié)構(gòu):底色(0xFFFFFF)+填寫文字(0x000000)+紅章,或者紅頭文字(0xFF0000)+紅章蓋在填寫文字上(0xFF0000)。它們存放在50020屬性中。5.1.2.2文件壓縮(編號259)屬性的值為0x03000100xx。其中xx值為=05,選擇LZW壓縮算法;其中xx值為=10,選擇四值壓縮算法。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論