版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、電子文件長(zhǎng)期保存格式探析電子文件格式是指將信息以某種格式進(jìn)行編碼,而且只 有依靠特定組合的軟硬件方能對(duì)文件實(shí)施讀寫操作。隨著信息化建設(shè) 的發(fā)展,已有的電子文件格式很多,新的格式也不斷產(chǎn)生。因此,為了 確保電子文件的長(zhǎng)期存取,檔案部門作為永久保存電子文件的基地,應(yīng) 采取各種措施積極應(yīng)對(duì)這種挑戰(zhàn)。一、電子文件內(nèi)容、形式及常見(jiàn)的格式電子文件是指在數(shù)字設(shè)備及環(huán)境中生成,以數(shù)碼形式存儲(chǔ)于 磁帶、磁盤、光盤等載體,依賴計(jì)算機(jī)等數(shù)字設(shè)備閱讀、處理,并可在 通信網(wǎng)絡(luò)上傳送的文件。它主要包括電子文書、電子信件、電子報(bào) 表、電子圖紙等等。按載體劃分,可以把電子文件分為光盤文件、破 盤文件、軟盤文件和磁帶文件;以數(shù)
2、據(jù)的表現(xiàn)形式為劃分標(biāo)準(zhǔn),有字符 文件、表格文件、圖文混排文件、數(shù)據(jù)庫(kù)文件、圖形文件、動(dòng)態(tài)影像 文件與聲音文件等;以屬性為劃分標(biāo)準(zhǔn),數(shù)據(jù)庫(kù)文件又有foxbase(動(dòng) 態(tài)數(shù)據(jù)基地)數(shù)據(jù)庫(kù)、foxpro( “京通”軟件應(yīng)用的)數(shù)據(jù)庫(kù)、 access (通路)數(shù)據(jù)庫(kù)、orcal( “靈通”軟件應(yīng)用的)數(shù)據(jù)庫(kù)等。按電子文件的格式劃分,有數(shù)字文本文件、數(shù)字影像文件、 數(shù)字圖形文件、數(shù)字語(yǔ)音文件、數(shù)字視頻文件。文本文件常見(jiàn)格式有 xml、txt、uof、rtf、wps、pdf/a、ceb、sep;圖像文件常見(jiàn)格式有 tiff、jpeg2000、jpeg、gif、png、djvu;音頻文件常見(jiàn)格式有wav、m
3、p3、wma、ogg vorbis、flac;視頻文件常見(jiàn)格式有 avi、 mov、mpeg 等。二、電子文件長(zhǎng)期保存格式選擇存在的問(wèn)題選擇專用媒體或是專用存儲(chǔ)格式將來(lái)會(huì)導(dǎo)致數(shù)字存儲(chǔ)問(wèn)題, 例如媒體格式。選擇專用媒體格式存儲(chǔ)電子文件,必須考慮將來(lái)該格 式的過(guò)時(shí)問(wèn)題。再例如文件格式。為了確保電子文件的長(zhǎng)期存取,如 果采用專用的文件格式,會(huì)由此增添更大的復(fù)雜性。專用軟件的應(yīng)用 常常升級(jí)至最新版本,然而軟件的功能卻沒(méi)有像版本變化那么明顯。 隨著吋間的過(guò)去,文件格式累積的變化更為顯著,甚至危及格式逆兼 容。對(duì)遺產(chǎn)軟件的維護(hù)顯得很急迫,但是存在的問(wèn)題頗多。就像應(yīng)用 軟件一樣,操作系統(tǒng)也得定期升級(jí),隨著系
4、統(tǒng)基本體系結(jié)構(gòu)的發(fā)展,將 來(lái)不再支持遺產(chǎn)軟件,不對(duì)遺產(chǎn)軟件支持就意味著產(chǎn)生新的安全問(wèn)題 的風(fēng)險(xiǎn)也在增加。三、電子文件長(zhǎng)期保存格式的選擇標(biāo)準(zhǔn)1、按格式種類分析要作為文本型電子文件的歸檔格式,馬春茂認(rèn)為應(yīng)該符合 下列條件:(1)應(yīng)該是公開的格式,不依賴特定的系統(tǒng)和軟件存在,能夠 在可以預(yù)見(jiàn)的時(shí)間內(nèi)被正常讀??;(2)應(yīng)該保持文件生成時(shí)的排版格式, 即使經(jīng)過(guò)辦公軟件的不斷升級(jí),也能輸出同紙質(zhì)文件一樣的格式;(3) 應(yīng)該便于數(shù)據(jù)交換、便于查找和檢索;(4)應(yīng)能保證電子文件在處理過(guò) 程中不被篡改和竊取。為了對(duì)數(shù)字資源實(shí)施長(zhǎng)期保存,對(duì)保存圖像格式的選擇尤其 重要。葉新民認(rèn)為應(yīng)滿足格式使用的標(biāo)準(zhǔn)化和廣泛性;格
5、式應(yīng)是公 開的,而非私有的,而且應(yīng)公開已出版的技術(shù)資料;格式應(yīng)支持元數(shù)據(jù); 格式應(yīng)對(duì)存儲(chǔ)介質(zhì)無(wú)依賴性等耍求。對(duì)于數(shù)碼錄音的電子文件長(zhǎng)期保存格式,張文浩認(rèn)為應(yīng)支 持真實(shí)性驗(yàn)證技術(shù)、數(shù)碼音質(zhì)無(wú)損、文件格式開放透明、不綁定軟硬 件、格式自描述、格式自包含、易于存儲(chǔ)、格式緊湊、信息安全、代 價(jià)最小等要求。數(shù)字?jǐn)z像(dv)、數(shù)字電視(dtv)和網(wǎng)絡(luò)視頻系統(tǒng)的廣泛應(yīng) 用以及對(duì)現(xiàn)有模擬視頻的數(shù)字化,視頻電子文件的數(shù)量和類型不斷豐 富。項(xiàng)文新等提出從保證視頻文件的原真性和檔案保管利用的便捷 性出發(fā)選擇合適的視頻電子文件歸檔格式,認(rèn)為視頻電子文件應(yīng)盡可 能保證視頻文件的原真性。2、綜合性分析對(duì)于長(zhǎng)期保存人類文化
6、遺產(chǎn)的檔案館、圖書館,最關(guān)心的是 數(shù)字信息的內(nèi)容不得丟失。劉家真針對(duì)電子文件保存格式的選擇問(wèn) 題,認(rèn)為該格式能在不同的環(huán)境下使用;應(yīng)是通用的、非專用的格式; 支持?jǐn)?shù)據(jù)從專用格式的環(huán)境中移出;最好是標(biāo)準(zhǔn)格式;被業(yè)界或用戶廣 泛支持;具有可擴(kuò)展性;可真實(shí)完整地被用戶讀出并理解,無(wú)論何時(shí)何 地,用戶所查到的該文件信息都與該文件最初情況完全一致;具有自 身的可證明性;具有可評(píng)價(jià)性。檔案是歷史的真實(shí)記錄,具有憑證價(jià)值與情報(bào)價(jià)值。李澤鋒 認(rèn)為檔案數(shù)字化過(guò)程屮選用電子文件格式應(yīng)考慮:保持檔案原貌,利 于網(wǎng)絡(luò)平臺(tái)下的傳輸交流,具有一定的標(biāo)準(zhǔn)性,具有較好的通用性和可 移植性,選用電子格式的支持軟件應(yīng)支持?jǐn)?shù)據(jù)從專
7、用格式中方便地移 出。為了應(yīng)對(duì)電子文件長(zhǎng)期保存的需求,adrian brown對(duì)電子 文件長(zhǎng)期保存格式的選擇標(biāo)準(zhǔn)進(jìn)行了積極的探討,認(rèn)為應(yīng)具備開放標(biāo) 準(zhǔn)、普遍性、穩(wěn)定性、對(duì)元數(shù)據(jù)支持、互操作性、可生存性、真實(shí) 性、可處理性、固定顯示等9個(gè)條件。3、筆者的理解電子文件的格式選擇是由電子文件創(chuàng)建過(guò)程的操作要求和電 子文件長(zhǎng)期存取的要求所決定的。綜合各位學(xué)者的觀點(diǎn)后,筆者認(rèn)為 電子文件長(zhǎng)期保存格式的選擇標(biāo)準(zhǔn)應(yīng)具有以下幾點(diǎn):(1)開放性。格式 開放,有公開發(fā)表的相應(yīng)標(biāo)準(zhǔn)和技術(shù)規(guī)范,有與產(chǎn)品無(wú)關(guān)的技術(shù)專家組 和標(biāo)準(zhǔn)化組織支持該格式。(2)標(biāo)準(zhǔn)性。該格式被廣泛使用,具有自由 使用的技術(shù)規(guī)范,可轉(zhuǎn)換性高,支持
8、保存元數(shù)據(jù)。(3)穩(wěn)定性。不會(huì)隨 著時(shí)間的推移而作重大的變更,而且新版本的格式也應(yīng)該能夠做到逆 兼容。(4)廣采性。數(shù)字格式的廣釆性包括個(gè)人電腦隨機(jī)軟件包、web 瀏覽器的本地化支持、數(shù)字產(chǎn)品格式易轉(zhuǎn)換等。軟件廠商對(duì)創(chuàng)建良好 和廣泛使用的格式往往要比僅僅瞄準(zhǔn)新市場(chǎng)的格式具有更寬泛和更長(zhǎng) 久的支持。流行格式會(huì)盡可能多地受到軟件廠商的支持,人們可能更 喜歡采用。(5)軟硬件平臺(tái)的獨(dú)立性。被多種操作系統(tǒng)和應(yīng)用軟件支 持。支持多種存儲(chǔ)技術(shù),或與存儲(chǔ)技術(shù)無(wú)關(guān)。當(dāng)用戶不能使用指定產(chǎn) 品軟件時(shí),可使用已有的插件讀取。使用與設(shè)備無(wú)關(guān)的顏色規(guī)范實(shí)現(xiàn) 準(zhǔn)確打印和再現(xiàn),不必考慮軟硬件平臺(tái)。(6)真實(shí)性。電子文件的真
9、實(shí) 性要求保留“原貌”(例如字體、顏色和外觀),數(shù)據(jù)遷移要求選取的 文件格式能夠保留文件“原貌”。(7)可利用性。要確保電子文件可 讀、可利用。四、幾種適于長(zhǎng)期保存的電子文件格式1、pdf/a 格式pdf格式規(guī)范已經(jīng)公開,并可免費(fèi)獲取,具有廣泛的支持性。 該格式具有與平臺(tái)、字體無(wú)關(guān)的特點(diǎn),解除了電子文件與操作系統(tǒng)的 依賴關(guān)系,用戶可以通過(guò)它的通用瀏覽器adobe reader在windows、 unix、mac等任一系統(tǒng)平臺(tái)上原版原式地讀取pdf文檔,不受操作系 統(tǒng)、網(wǎng)絡(luò)環(huán)境、應(yīng)用程序的版本、字體的限制,從而從電子文件自身 的角度保證了電子文件的可讀性。pdf格式所具有的高度兼容性使用 戶可以
10、輕松地將任何文檔原版原式地轉(zhuǎn)換成pdf文檔,進(jìn)而固化信息, 使之不易更改,保持了原文檔信息內(nèi)容和結(jié)構(gòu)的完整、真實(shí),為不同軟 件生成的電子文件提供了一個(gè)可完整遷移其信息內(nèi)容的統(tǒng)一文件格 式。pdf/a-la實(shí)現(xiàn)了對(duì)文檔邏輯結(jié)構(gòu)的保存和以自然閱讀順序保存 文木。pdf/a-lb可實(shí)現(xiàn)對(duì)文木和附加內(nèi)容的正確顯示。在各國(guó)政府 機(jī)構(gòu)包括美國(guó)、英國(guó)、德國(guó)、新加坡、印度、澳大利亞等的電子政務(wù) 領(lǐng)域中,pdf格式也被廣泛應(yīng)用。綜合來(lái)說(shuō),pdf/a格式的特點(diǎn)是支持 數(shù)字簽名、格式開放、不綁定軟硬件、格式自包含、格式自描述、固 定顯示、不包含加密、可向其他文本格式轉(zhuǎn)換等。2、tiff格式tiff(標(biāo)記圖像文件格式
11、)是由aldus和microsoft公司為桌 面出版系統(tǒng)研制開發(fā)的一種靈活的位圖圖像格式,用于應(yīng)用程序之間 和計(jì)算機(jī)平臺(tái)之間交換文件。實(shí)際上已被所有繪畫、圖像編輯和頁(yè)面 排版應(yīng)用程序所支持,而且?guī)缀跛凶烂鎾呙鑳x都可以生成ttff圖 像。tiff支持多種編碼方法,其中包括rgb無(wú)壓縮、rle壓縮、lzw壓 縮、zip壓縮、ccitt壓縮等,6.0版本又增加了 jpeg壓縮選項(xiàng)。tiff 格式由于存儲(chǔ)圖像質(zhì)量高非常有利于原稿的復(fù)制。另外,所有繪畫、 圖像編輯和頁(yè)面排版應(yīng)用程序以及大多數(shù)掃描儀對(duì)tiff格式都提供 良好的支持,這使得ttff格式成為數(shù)字圖像處理的最好選擇。3、jpeg2000 格式
12、jpeg2000于2001年正式成為國(guó)際標(biāo)準(zhǔn)。jpeg2000完全采用 小波變換代替余弦變換,與jpeg相比,具備了更高的壓縮比以及更多 新功能。在文件大小相同的情況下,jpeg2000壓縮的圖像比jpeg質(zhì)量 更高,其壓縮率比jpeg高30%左右,精度損失更小。jpeg2000的特點(diǎn)是:(1)同時(shí)支持有損和無(wú)損壓縮,而jpeg只能支持有損壓縮。(2)能實(shí)現(xiàn)漸進(jìn)傳輸,先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提 高圖像質(zhì)量,訃圖像由朦朧到清晰顯示。(3)支持對(duì)圖像中細(xì)節(jié)較多或 較為感興趣的區(qū)域進(jìn)行高精度的無(wú)損編碼、很強(qiáng)的容錯(cuò)性、支持水印 等。(4)jpeg2000的許多優(yōu)點(diǎn)和新的功能都是建立在復(fù)
13、雜的計(jì)算與較 犬的緩存基礎(chǔ)上,因此其速度與jpeg相比要慢許多。4、flac格式flac屬于無(wú)損音頻壓縮文件格式(文件名為.flac) oflac 格式文件較小,便于播放。ogg計(jì)劃支持flac,也可將flac音頻數(shù)據(jù) 封裝在ogg傳輸層屮,生成ogg flac格式文件(文件名為.ogg) o ogg flac格式文件較人(比ogg vorbis格式文件人得多),便于傳輸、編 輯、播放。該格式的特點(diǎn)是支持真實(shí)性驗(yàn)證技術(shù)、數(shù)碼音質(zhì)無(wú)損、文 件格式開放透明、不綁定軟硬件、文件格式自描述、格式自包、易于 存儲(chǔ)、信息安全。5、mpeg格式mpeg 即 moving picture expert gro
14、up(運(yùn)動(dòng)圖像專家組), 用該編碼器編碼的影音文件擴(kuò)展名可以是mpg、mpe、mp4、m1v、m2v 等,其中m1v和m2v都表示該影音文件中不包含音頻部分,只有視頻部 分。這種格式也流行了很長(zhǎng)時(shí)間。未壓縮的avi格式文件經(jīng)mpegt、 mpeg-2和meg-4等編碼壓縮后,圖像容量大幅度縮小,也質(zhì)則降低不大, 而且圖像質(zhì)量視編碼參數(shù)而定。該格式具有壓縮算法公開、不綁定軟 碩件、易于轉(zhuǎn)換等特點(diǎn)。五、電子文件永久可讀性問(wèn)題文件格式種類繁多,打開方式多種多樣,產(chǎn)生它們的軟硬件環(huán) 境也多種多樣。對(duì)于一代又一代不同系統(tǒng)中生成的各種格式的電子文 件,必須確保人類能夠閱讀,否則保存就失去了應(yīng)有的意義。解決
15、該問(wèn) 題的辦法有:(1)不斷地將文件轉(zhuǎn)換成當(dāng)前通行的新文件格式,使之不 至于因?yàn)檐浻布脚_(tái)的過(guò)時(shí)而無(wú)法閱讀。(2)采用一定的獨(dú)立于任何 計(jì)算機(jī)系統(tǒng)的統(tǒng)一格式存儲(chǔ)文件。(3)將電子文件連同生成該文件的 軟件及其運(yùn)行該軟件的操作系統(tǒng)和硬件一道保存起來(lái)。當(dāng)然這些方法 都還不是解決電子文件永久可讀性問(wèn)題的萬(wàn)全之策。我們?cè)趯?shí)踐中只 能在以上方法中選擇損失信息較少,可行性較大的方法來(lái)作為現(xiàn)階段 的對(duì)策。目前,大多數(shù)人選擇了第二種方法,他們舍棄了對(duì)原文件結(jié) 構(gòu)、格式的追求,而重點(diǎn)強(qiáng)調(diào)對(duì)原文件內(nèi)容的忠實(shí)再現(xiàn),在可能的范圍 內(nèi)使用較為通用的編碼格式。而對(duì)于那些特殊的,沒(méi)有標(biāo)準(zhǔn)格式的電 子文件采用第三種方法,暫時(shí)
16、將其支持系統(tǒng)一并保存下來(lái),等待有關(guān)標(biāo) 準(zhǔn)的出臺(tái)。另外,在目前電子文件數(shù)量較少的情況下,采用第一種方法 也是可行的。六、結(jié)語(yǔ)如今數(shù)字技術(shù)飛速發(fā)展,數(shù)字信息的可存取性卻變得非常脆 弱。電子文件采用可長(zhǎng)久存取的文件格式的優(yōu)越性惠及數(shù)據(jù)創(chuàng)建者、 數(shù)據(jù)管理者和電子檔案工作者。因此,對(duì)于電子文件的格式問(wèn)題,不僅 需耍電子文件制作者,還需要負(fù)責(zé)電子文件管理和長(zhǎng)久存取的所有人員都特別重視,積極采取措施確保電了文件的長(zhǎng)期存取。注釋:%1 馬春茂:電子文件歸檔格式思考,北京檔案,2007 年第7期:28-30o%1 葉新民:數(shù)字資源長(zhǎng)期保存中的圖像格式選擇分析,圖 書情報(bào)工作,2006年第5期:115-117o%1 張文浩:數(shù)碼錄音電子文件長(zhǎng)期保存格式研究,黑龍 江檔案,2009年第2期:6-7o項(xiàng)文新、張照余:視頻電子文件的歸檔格式研究,檔 案學(xué)研究,2006年第4期:52-56o%1 劉家真:文件保存格式與pd
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024預(yù)制板購(gòu)銷合同
- 2025年度瓷磚研發(fā)中心實(shí)驗(yàn)室建設(shè)與運(yùn)營(yíng)合同3篇
- 2025年度危險(xiǎn)化學(xué)品儲(chǔ)存安全管理承包合同4篇
- 2025年度智能物流中心建設(shè)與運(yùn)營(yíng)管理合同4篇
- 2025年度商業(yè)地產(chǎn)租賃代理服務(wù)合同模板4篇
- 2024物業(yè)項(xiàng)目策劃2024委托代理合同
- 2025年度醫(yī)療器械代生產(chǎn)加工合同范本4篇
- 2025年度特殊用途車牌租賃與押金管理協(xié)議4篇
- 2025年度展會(huì)現(xiàn)場(chǎng)安保及應(yīng)急預(yù)案服務(wù)合同3篇
- 2024鐵路鋼軌鋪設(shè)及維護(hù)工程協(xié)議細(xì)則
- 勞動(dòng)合同續(xù)簽意見(jiàn)單
- 大學(xué)生國(guó)家安全教育意義
- 2024年保育員(初級(jí))培訓(xùn)計(jì)劃和教學(xué)大綱-(目錄版)
- 河北省石家莊市2023-2024學(xué)年高二上學(xué)期期末考試 語(yǔ)文 Word版含答案
- 企業(yè)正確認(rèn)識(shí)和運(yùn)用矩陣式管理
- 分布式光伏高處作業(yè)專項(xiàng)施工方案
- 陳閱增普通生物學(xué)全部課件
- 檢驗(yàn)科主任就職演講稿范文
- 人防工程主體監(jiān)理質(zhì)量評(píng)估報(bào)告
- 20225GRedCap通信技術(shù)白皮書
- 燃?xì)庥邢薰究蛻舴?wù)規(guī)范制度
評(píng)論
0/150
提交評(píng)論