版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)字圖書館史料數(shù)字化
編者按:本文主要從緣起;歷史文獻(xiàn)的數(shù)字化;文物史料的數(shù)字化;文物史料的數(shù)字化,迎接史料數(shù)字化時代,對數(shù)字圖書館史料數(shù)字化進(jìn)行講述。其中,主要包括:數(shù)字化是史料處理的必由之路,歷史文獻(xiàn)作為人類精神產(chǎn)品,具有可復(fù)制性和可移植性,并且必須依托載體而存在,建立數(shù)字圖書館的關(guān)鍵在于以統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范為基礎(chǔ),表現(xiàn)為同一類型文件格式的統(tǒng)一,文物為人類有形的史跡遺存,它具有不可復(fù)制性和唯一性,文物數(shù)字化的終極形式為數(shù)字化博物館,最新技術(shù)為虛擬現(xiàn)實(shí),無論文獻(xiàn)數(shù)字化和文物數(shù)字化,歸根結(jié)底,就是把史料統(tǒng)一為計算機(jī)數(shù)據(jù),這些數(shù)據(jù)經(jīng)互聯(lián)網(wǎng)而整合成為一個大的史料數(shù)據(jù)庫,新史料學(xué)有四個基本特點(diǎn):
一、文獻(xiàn)多媒體化;
二、文物虛擬現(xiàn)實(shí)化;
三、史料極大豐富;
四、計算機(jī)網(wǎng)絡(luò)檢索技術(shù)成為史料學(xué)的命脈,等。具體材料請?jiān)斠姡?/p>
提要:隨著信息技術(shù)的進(jìn)步,史料數(shù)字化已成潮流。把史料分為歷史文獻(xiàn)和史跡遺存兩類進(jìn)行研究,提出了建立對應(yīng)的數(shù)字圖書館和數(shù)字博物館的解決方案,并對實(shí)現(xiàn)這一方案的具體技術(shù)從理論到實(shí)踐作了歸納和總結(jié)。
關(guān)鍵詞:史料;數(shù)字化;數(shù)字博物館;虛擬現(xiàn)實(shí)
緣起
史料包括歷史文獻(xiàn)與史跡遺存,是史學(xué)研究的基礎(chǔ)。中國歷史悠久,歷代文獻(xiàn)遺物浩如煙海,近現(xiàn)代又有大批新史料發(fā)現(xiàn)與累積。史學(xué)界對史料的整理和研究歷來非常重視。王國維使用兩重證據(jù)法,“取地下之實(shí)物與紙上之遺書辨證,取異族之故書與吾國之故籍互相補(bǔ)證,取外來之觀念與固有之材料互相參證”,進(jìn)行古史新證,解決了許多重大史學(xué)問題。顧頡剛等“古史辨”派以疑古辨?zhèn)螢樽谥?,進(jìn)行了系統(tǒng)的古史辨?zhèn)?,“古史辨”作為對“古書”與“古事”的—種史料考訂工作,頗有意義。[1]以傅斯年為代表的史料學(xué)派提出了“史學(xué)即是史料學(xué)”的觀點(diǎn),傅氏認(rèn)為:“只要把材料整理好,則事實(shí)自然顯明了。一分材料出一分貨,十分材料出十分貨,沒有材料便不出貨”,他們徹底從故紙堆中脫身而出,宣稱不讀書只找材料,“上窮碧落下黃泉,動手動腳找東西”,[2]在考古等領(lǐng)域很快取得舉世矚目的成績,一舉超越前人的成就。陳寅恪和陳垣等諸先生也都十分重視史料,把考實(shí)作為治史方法的前提。郭沫若、呂振羽、翦伯贊、侯外廬、范文瀾等先生高舉馬克思主義史學(xué)觀之利器,“將歷來為封建學(xué)者所湮沒、改造、曲解的古代史料,加以重新辨別、整理和闡發(fā)”,開辟了中國歷史研究的新途徑。
人類已經(jīng)進(jìn)入信息時代,我們現(xiàn)在不僅面臨著用新技術(shù)來整理舊史料的問題,而且隨著考古新發(fā)現(xiàn)的不斷涌現(xiàn)和科技的發(fā)展,史料的容量和形式急劇膨脹。以何種方法處理、存儲史料,并且能夠讓學(xué)者從中方便迅速地檢索和得到所需的信息,是當(dāng)前史料學(xué)的一個大問題。
數(shù)字化是史料處理的必由之路。第一,把各種史料統(tǒng)一為計算機(jī)數(shù)據(jù),方便存儲和檢索;第二,使史料的物理體積大大縮小,方便攜帶;第三,可以低成本無差錯拷貝,方便傳播和普及。目前,不論是印刷文檔、手寫稿,還是電子文檔、音像文件、甚至于遺址與文物,越來越多的史料逐漸被數(shù)字化,出現(xiàn)了數(shù)據(jù)倉庫、數(shù)據(jù)集市、數(shù)據(jù)采集等新概念和信息數(shù)字化處理方法,逐步形成了大數(shù)據(jù)量存儲和管理模式。全球范圍內(nèi),建立史料數(shù)據(jù)庫逐步成為潮流。聯(lián)合國推動MemoryoftheWorld計劃以挽救某些瀕臨滅絕的人類文明,西方各國也無不積極推動數(shù)字圖書館、數(shù)字博物館或數(shù)字典藏建設(shè),如:美國有國會圖書館的AmericanMemory計劃和六所大學(xué)所主導(dǎo)的數(shù)字圖書館計劃等;加拿大有國家數(shù)字典藏計劃;日本和IBM合作的數(shù)字博物館計劃;大英圖書館的敦煌數(shù)據(jù)數(shù)字化計劃等,不勝枚舉。自上世紀(jì)90年代中期以來,因特網(wǎng)技術(shù)對整個社會的影響程度全面加深,信息科技已然啟開了社會全面急速變遷的序幕。借助網(wǎng)絡(luò)之一利器,分散在世界各地的史料數(shù)據(jù)資源得以有效整合,因特網(wǎng)已經(jīng)成為一個超大型的史料數(shù)據(jù)庫。但是,從總體來看,史料數(shù)字化的研究和實(shí)踐才剛剛起步,還處于探索階段,因此,對史料數(shù)字化進(jìn)行整體的研究是很有必要的。
下面,把史料按照其性質(zhì)分為兩類進(jìn)行討論,其一為人類精神產(chǎn)品類史料——文獻(xiàn);其二為物質(zhì)產(chǎn)品類史料——文物。
歷史文獻(xiàn)的數(shù)字化
歷史文獻(xiàn)作為人類精神產(chǎn)品,具有可復(fù)制性和可移植性,并且必須依托載體而存在。國家標(biāo)準(zhǔn)局批準(zhǔn)公布的GB4894—85《情報與文獻(xiàn)工作詞匯——基本術(shù)語》定義道:“文獻(xiàn)是記錄有知識的一切載體”。根據(jù)這一標(biāo)準(zhǔn)定義,歷史文獻(xiàn)就是以文本、圖形、符號、音像、軟件等各種形式固化在一定物質(zhì)載體上的歷史資料,其物質(zhì)載體為:紙、膠片、磁帶、光盤等。歷史文獻(xiàn)數(shù)字化的目標(biāo)是將原來在各種物理載體上存儲的信息,統(tǒng)一轉(zhuǎn)變?yōu)樽罨镜谋忍?,?和1來表示,成為計算機(jī)可以識別的數(shù)據(jù)。
歷史文獻(xiàn)數(shù)字化的終極形式為數(shù)字圖書館的出現(xiàn)。所謂數(shù)字圖書館,就是利用現(xiàn)代信息技術(shù)對有價值的圖像、文本、語音、音響、影像、影視、軟件和科學(xué)數(shù)據(jù)庫等多媒體信息進(jìn)行收集,組織規(guī)范性的加工和壓縮處理,使其轉(zhuǎn)化為數(shù)字信息,然后通過計算機(jī)技術(shù)進(jìn)行高質(zhì)量保存和管理,實(shí)施知識增值,并通過網(wǎng)絡(luò)通訊技術(shù)進(jìn)行高效、經(jīng)濟(jì)地傳播、接收,使用戶可以在任何時間、任何地點(diǎn),都能從網(wǎng)上得到各種服務(wù),為公民的終身學(xué)習(xí)機(jī)會做出貢獻(xiàn),成為國家的知識基礎(chǔ)設(shè)施。[3]
建立數(shù)字圖書館的關(guān)鍵在于以統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范為基礎(chǔ),表現(xiàn)為同一類型文件格式的統(tǒng)一。當(dāng)前,數(shù)字圖片格式主要有BMP、GIF、JPG、PCX、TGA、TIF等;數(shù)字音頻格式有WAV、MP3、MIDI等;數(shù)字視頻格式有mpg、mov、avi、rm等;網(wǎng)頁格式有html,vrml,xml,sgml等;數(shù)據(jù)庫有Oracle,SQLServer,Sybase,DB2,Informix,Access等。文獻(xiàn)數(shù)字化的過程中一般采取最通用的文件格式,這樣既便于為最多的人服務(wù),又便于數(shù)據(jù)的升級。數(shù)字圖書實(shí)現(xiàn)形式主要有兩種:一是采用掃描錄入方式將書籍資料按原貌逐頁存儲為圖象文件;二是以文本方式存儲文獻(xiàn)內(nèi)容,輔之以全文檢索系統(tǒng)構(gòu)成全文檢索數(shù)據(jù)庫。前一種方式適合古籍善本和以往出版圖書的數(shù)字化,后一種適合新出版圖書的數(shù)字化。
建立數(shù)字圖書館的設(shè)想首先由美國人提出,1994年6月,美國召開了“第一屆數(shù)字圖書館理論與實(shí)踐年會”。同年9月,美國國家科學(xué)基金會、國家宇航局和國防部高級研究署聯(lián)合公布了一項(xiàng)為期4年、投入2440萬美元的《數(shù)字圖書館啟動計劃》,在斯坦福大學(xué)、密西根大學(xué)、伊利諾斯大學(xué)、卡耐基-梅隆大學(xué)、加州大學(xué)伯克利分校和圣·巴巴拉分校等6所高校進(jìn)行數(shù)字圖書館的分項(xiàng)研究。同年10月,美國國會圖書館推出數(shù)字化項(xiàng)目,領(lǐng)導(dǎo)與協(xié)調(diào)全國的公共圖書館、研究圖書館,將其收藏的圖書、繪畫、手稿、照片等轉(zhuǎn)換成高清晰度的數(shù)字化圖像并存儲起來,通過互聯(lián)網(wǎng)供公眾利用。繼美國之后,英國、法國、日本、德國等西方發(fā)達(dá)國家以及亞洲的新加坡、韓國也先后提出各自的數(shù)字圖書館計劃,投入巨額實(shí)施資金。
我國數(shù)字圖書館建設(shè)開始于1997年,北京圖書館作為國家圖書館,經(jīng)國家計委批準(zhǔn)建立了“中國試驗(yàn)型數(shù)字圖書館”項(xiàng)目,并開展了與此有關(guān)的專題科研。同年12月,我國民營計算機(jī)高科技企業(yè)北京世紀(jì)超星信息技術(shù)有限公司將其遠(yuǎn)程圖書瀏覽器安裝到瑞得在線網(wǎng)站上,創(chuàng)建了國內(nèi)首家以圖像存儲為主的數(shù)字圖書館——超星數(shù)字圖書館,此后,國家連續(xù)實(shí)施了“中國數(shù)字圖書館工程”和“中國數(shù)字圖書館示范工程”,國內(nèi)各大圖書館和高校紛紛跟進(jìn),掀起了一股數(shù)字化潮流。據(jù)不完全統(tǒng)計,目前國內(nèi)的中文數(shù)字圖書館已達(dá)數(shù)百家之多,以學(xué)術(shù)專業(yè)書籍為主要內(nèi)容的超星數(shù)字圖書館的數(shù)字圖書已超過到40萬種,中國數(shù)字圖書館也已達(dá)20萬種以上。此外,書生之家“中國圖書網(wǎng)”和方正apabi數(shù)字圖書館也都非常有實(shí)力。
目前,我國科技期刊的全文數(shù)據(jù)庫主要有“中國期刊網(wǎng)”、“萬方數(shù)字化期刊網(wǎng)”和“維普中文科技期刊全文數(shù)據(jù)庫”等,以中國期刊網(wǎng)為例,收有幾年來5300種期刊的全部文章,重要期刊幾乎被網(wǎng)羅殆盡。
除此之外,因特網(wǎng)上一些小型的數(shù)字書庫更是數(shù)不勝數(shù),如:香港中文大學(xué)中國文化研究所“華夏文庫”及“古文獻(xiàn)資料庫”;臺灣的漢學(xué)研究中心典藏目錄及數(shù)據(jù)庫,包括典藏國際漢學(xué)博士論文摘要資料庫、明人文集聯(lián)合目錄及篇目索引資料庫、兩漢諸子研究論著目錄資料庫、經(jīng)學(xué)研究論著目錄資料庫、敦煌學(xué)研究論著目錄資料庫、外文期刊漢學(xué)論著目次資料庫、國際漢學(xué)資源機(jī)構(gòu)錄資料庫,可進(jìn)行資料庫整合查詢;北京書同文數(shù)字化技術(shù)有限公司的《四庫全書》、《四部叢刊》、《康熙字典》的電子版等等。[4]千萬不要小看這些局部的文獻(xiàn)數(shù)字化工作,集腋成裘,聚沙成塔,這些數(shù)據(jù)經(jīng)因特網(wǎng)而整合為一體,完全不受其物理距離的影響,從長遠(yuǎn)看,分散的學(xué)術(shù)單位與個學(xué)者是文獻(xiàn)數(shù)字化的真正主力軍,整個因特網(wǎng),就是一個大的數(shù)字圖書館集合。
文物史料的數(shù)字化
文物為人類有形的史跡遺存,它具有不可復(fù)制性和唯一性。根據(jù)中華人民共和國文物保護(hù)法第二條之規(guī)定,文物包括以下內(nèi)容:具有歷史、藝術(shù)、科學(xué)價值的古文化遺址、古墓葬、古建筑、石窟寺和石刻;與重大歷史事件、革命運(yùn)動和著名人物有關(guān)的,具有重要紀(jì)念意義、教育意義和史料價值的建筑物、遺址、紀(jì)念物;歷史上各時代珍貴的藝術(shù)品、工藝美術(shù)品;重要的革命文獻(xiàn)資料以及具有歷史、藝術(shù)、科學(xué)價值的手稿、古舊圖書資料等;反映歷史上各時代、各民族社會制度、社會生產(chǎn)、社會生活的代表性實(shí)物。具有科學(xué)價值的古脊椎動物化石和古人類化石同文物一樣受國家的保護(hù)。需要注意的是第四款規(guī)定的革命文獻(xiàn)資料以及手稿、古舊圖書資料等為文物與對史料的分類并不矛盾,這類文物其內(nèi)容為文獻(xiàn),其物質(zhì)載體為文物。
文物作為史料的價值,在于其中包含的歷史信息。所以對文物信息的擷取與整理一直受到人們的重視。如對甲骨文的墨拓、整理而成的《甲骨文合集》,如對青銅器進(jìn)行整理而成的《兩周金文辭大系圖錄考釋》,這些信息擷取成果目前大多以文獻(xiàn)的形式而存在。現(xiàn)代以來,經(jīng)科學(xué)考古而發(fā)現(xiàn)的遺址和遺物都有詳細(xì)的考古報告。報告中的繪圖形式有平面圖、剖面圖、結(jié)構(gòu)圖、局部圖、分解圖、透視圖以及器物繪畫等;照相有地貌全景、發(fā)掘區(qū)全景、不同角度和感光的遺物特寫,其他如專業(yè)技術(shù)鑒定報告、文物修復(fù)與模型制作、拓印圖片等等,有的還附有航拍圖片和電影、錄像??脊艌蟾媸菍ξ奈锃h(huán)境、外觀、結(jié)構(gòu)、尺寸、顏色、紋理、成份、氣味等信息的全面擷取。文物的數(shù)字化即為文物信息的數(shù)字化。
文物數(shù)字化的終極形式為數(shù)字化博物館,最新技術(shù)為虛擬現(xiàn)實(shí)。
虛擬現(xiàn)實(shí)技術(shù)是上世紀(jì)90年代以來為科學(xué)界和工程界所廣泛關(guān)注的技術(shù)。它利用計算機(jī)生成一種模擬的實(shí)物與環(huán)境,通過多種傳感設(shè)備使用戶“投入”到該環(huán)境中,實(shí)現(xiàn)用戶與該環(huán)境直接自然交互。虛擬現(xiàn)實(shí)技術(shù)的產(chǎn)生首先源于軍事訓(xùn)練的需要,現(xiàn)在已經(jīng)廣泛應(yīng)用于航空、航海、醫(yī)學(xué)訓(xùn)練,建筑和環(huán)境規(guī)劃,影視制作,甚至于核試驗(yàn)的虛擬。對大眾來說,最切身的感受是虛擬現(xiàn)實(shí)技術(shù)使我們在電影侏羅紀(jì)公園中看到了栩栩如生的恐龍?,F(xiàn)在虛擬現(xiàn)實(shí)技術(shù)已經(jīng)做到了網(wǎng)絡(luò)的分布式互動,支持多人實(shí)時通過網(wǎng)絡(luò)進(jìn)行交互活動,每個用戶在一個虛擬現(xiàn)實(shí)環(huán)境中,通過計算機(jī)與其它用戶進(jìn)行交互動作,并共享信息。我們可以在許多網(wǎng)吧中看到玩“大地勇士”游戲的青年,他們同分布在世界各地的人們在虛擬的“埃及金字塔”中進(jìn)行激烈槍戰(zhàn)。
文物的虛擬現(xiàn)實(shí)只是靜態(tài)實(shí)物的虛擬,因此,在技術(shù)實(shí)現(xiàn)上要容易得多,我們把所有依據(jù)科學(xué)考古而得到的文物信息輸入計算機(jī),就能借助虛擬現(xiàn)實(shí)生成程序來“制造”出三維的虛擬現(xiàn)實(shí)文物,借助這一技術(shù),許多不易接觸、難得一見的歷史文物可以被普通學(xué)者摩挲于股掌之間。另外,使用360度全景攝影技術(shù)拍攝的高質(zhì)量圖像也可以生成逼真的虛擬情景,從而使得用戶可以使用普遍微機(jī)通過鼠標(biāo)和鍵盤真實(shí)的感受到和虛擬現(xiàn)實(shí)一樣效果,不過它的人機(jī)交互性能要差許多。在日本早稻田大學(xué)網(wǎng)站,我們可以看到該校建筑學(xué)系編纂的從1996年到2002年對埃及PyramidsofDahshur的8次考古發(fā)掘報告,其中包括了用vrml技術(shù)制作的虛擬現(xiàn)實(shí)墓室結(jié)構(gòu)和用QuickTimeVRPanorama全景攝影技術(shù)制作的金字塔外部環(huán)境。
我國的數(shù)字博物館建設(shè)和文物數(shù)字化工作已經(jīng)開始起步,故宮博物院是具有600年歷史、8000座殿宇樓閣、百萬件文物的我國最大博物館,其網(wǎng)站于2001年7月16日開通,最初只收錄了各類圖片4000余張,實(shí)現(xiàn)了文物影像的細(xì)節(jié)瀏覽和虛擬展廳的360度旋轉(zhuǎn)展示[5]。到了2002年7月30日,由中國故宮博物院和日本凸版印刷公司共同建立的故宮文化遺產(chǎn)數(shù)字化應(yīng)用研究所召開記者招待會,宣布以故宮太和殿為中心的紫禁城虛擬現(xiàn)實(shí)工程目前進(jìn)展順利[6]。這說明故宮文物的數(shù)字化工作已經(jīng)進(jìn)入了虛擬現(xiàn)實(shí)的實(shí)質(zhì)性階段。北京四方臺數(shù)字技術(shù)有限公司使用360度全景攝影技術(shù),已經(jīng)制作了所有中國世界遺產(chǎn)的虛擬實(shí)景,此外他們還制作了中國古城鎮(zhèn)民居、中國歷史文化名城、寺廟及宗教建筑等虛擬實(shí)景專題。臺灣今年啟動了“數(shù)位典藏國家型科技計劃”,其專題內(nèi)容包括:“臺灣建筑史”、“不朽的殿堂—漢代的墓葬與文化”、“玄奘西域行”、“商王大墓重現(xiàn)”、“火器與明清戰(zhàn)爭”等等,在實(shí)施過程中,虛擬現(xiàn)實(shí)就是其中的一種重要技術(shù)手段[7]。使用虛擬現(xiàn)實(shí)技術(shù)還可以重現(xiàn)已經(jīng)不存在的歷史人物、建筑、地理環(huán)境等。今年1月,中國刑警學(xué)院法醫(yī)系教授趙成文,依據(jù)古長沙國丞相夫人辛追顱骨的X光片、出土?xí)r拍攝的面部照片,以及長沙市馬王堆漢墓帛畫和相關(guān)歷史文獻(xiàn)資料,使用自己研制的警星CCK-3型人像模擬系統(tǒng)成功地復(fù)原了這一2000多年前的人物相貌,雖然這一技術(shù)還有待完善,但是不能否認(rèn)它很好的發(fā)展前景??傮w看來,數(shù)字博物館的建設(shè)正在受到人們的重視,而虛擬現(xiàn)實(shí)技術(shù)也處于發(fā)展與普及過程之中。
迎接史料數(shù)字化時代
要之,無論文獻(xiàn)數(shù)字化和文物數(shù)字化,歸根結(jié)底,就是把史料統(tǒng)一為計算機(jī)數(shù)據(jù),這
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高空建筑涂料施工安全合同
- 風(fēng)力發(fā)電樁基夯擴(kuò)樁施工合同
- 砂石采購合同范本樣本
- 深圳電力施工合同:公共安全篇
- 文化娛樂供電合同管理
- 沙河頂租房合同范例
- 鐵路線路建設(shè)合同三篇
- 高尚住宅開發(fā)權(quán)轉(zhuǎn)讓合同三篇
- 團(tuán)體保險合同受益人管轄條款
- 集體經(jīng)濟(jì)合同整改報告范文
- 2023-2024學(xué)年廣東省廣州市番禺區(qū)高二(上)期末地理試卷
- 廣東省江門市2023-2024學(xué)年高一上學(xué)期物理期末試卷(含答案)
- 2024年安徽省公務(wù)員錄用考試《行測》真題及答案解析
- 專題04二元一次方程組的應(yīng)用解答120題(12種解題模型)專項(xiàng)訓(xùn)練(解析版)
- 2024-2030年中國智慧港口行業(yè)深度調(diào)研及投資前景預(yù)測報告
- 2024年貴州省公務(wù)員考試《行測》真題及答案解析
- 賀州房地產(chǎn)市場月報2024年08月
- 健康減肥課件英語
- 考點(diǎn) 23 溶解度及溶解度曲線(解析版)
- 湘教版九年級上冊數(shù)學(xué)期末考試試卷附答案
- 中學(xué)輿情處理登記表
評論
0/150
提交評論