版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第12章 數(shù)字圖書(shū)館信息組織數(shù)字圖書(shū)館是以數(shù)字方式去存儲(chǔ)大量的信息,并能對(duì)存儲(chǔ)的信息資源進(jìn)展高效的操作,如搜集、選擇、組織、檢索提供訪(fǎng)問(wèn)接口、信息維護(hù)等。12.1數(shù)字圖書(shū)館概述12.1.1數(shù)字圖書(shū)館的概念數(shù)字圖書(shū)館(Digital Library)的概念,最早可以上溯到1975年R. W. Christian在一書(shū)中提出電子圖書(shū)館,普通以為電子圖書(shū)館是數(shù)字圖書(shū)館的早期提法。12.1數(shù)字圖書(shū)館概述12.1.1數(shù)字圖書(shū)館的概念數(shù)字圖書(shū)館是由現(xiàn)代高新技術(shù)所支持的數(shù)字信息資源系統(tǒng),以數(shù)字方式去存儲(chǔ)大量的信息并能對(duì)存儲(chǔ)的信息資源進(jìn)展高效的操作,如搜集、選擇、組織、檢索、提供訪(fǎng)問(wèn)接口、信息維護(hù)等。信息載體
2、的數(shù)字化、信息傳播的網(wǎng)絡(luò)化、信息資源共享化、效力工程的用戶(hù)化是數(shù)字圖書(shū)館的重要特征,12.1數(shù)字圖書(shū)館概述12.1.2數(shù)字圖書(shū)館的特征1數(shù)字圖書(shū)館信息資源特點(diǎn)從信息組織的角度來(lái)看,數(shù)字圖書(shū)館的信息資源具有以下一些特征:(1)經(jīng)過(guò)選擇的數(shù)字化信息資源(2)多媒體的信息資源(3)海量的信息資源(4)分布式的信息資源(5)按需提供的信息資源12.1數(shù)字圖書(shū)館概述12.1.2數(shù)字圖書(shū)館的特征2數(shù)字圖書(shū)館信息組織的特點(diǎn)(1)以用戶(hù)為中心(2)采用自動(dòng)化手段對(duì)信息資源進(jìn)展加工(3)提供對(duì)信息內(nèi)容的智能檢索效力12.1數(shù)字圖書(shū)館概述12.1.3國(guó)外數(shù)字圖書(shū)館的開(kāi)展概略1992年美國(guó)在制定“高性能計(jì)算機(jī)與通訊
3、(HPCC)國(guó)家攻關(guān)工程中,將開(kāi)展數(shù)字圖書(shū)館列入“國(guó)家級(jí)挑戰(zhàn)。除了美國(guó),英、法、日、德、加等國(guó)也都非常注重?cái)?shù)字圖書(shū)館的研制與開(kāi)發(fā),紛紛制定了本國(guó)的信息社會(huì)開(kāi)展方案,展開(kāi)了對(duì)數(shù)字圖書(shū)館的研討。 從國(guó)外開(kāi)展看、數(shù)字圖書(shū)館建立必需以高新技術(shù)作支撐。12.1數(shù)字圖書(shū)館概述12.1.4我國(guó)數(shù)字圖書(shū)館的進(jìn)展概略我國(guó)從20 世紀(jì)90 年代后期開(kāi)場(chǎng)了數(shù)字圖書(shū)館的本質(zhì)性研制開(kāi)發(fā)。1997 年8 月,國(guó)家圖書(shū)館、上海圖書(shū)館等7個(gè)圖書(shū)館結(jié)合承當(dāng)了國(guó)家重點(diǎn)科技工程中國(guó)實(shí)驗(yàn)型數(shù)字式圖書(shū)館,在我國(guó)創(chuàng)建了一個(gè)分布式、可擴(kuò)展、可互操作的、內(nèi)容資源橫跨全國(guó)7個(gè)省市3 0個(gè)以上的數(shù)字資源庫(kù)群的實(shí)驗(yàn)型數(shù)字圖書(shū)館,并在因特網(wǎng)上實(shí)現(xiàn)了
4、良好的運(yùn)轉(zhuǎn)。2000年6月30日,中國(guó)數(shù)字圖書(shū)館網(wǎng)站正式開(kāi)通。12.1數(shù)字圖書(shū)館概述12.1.4我國(guó)數(shù)字圖書(shū)館的進(jìn)展概略 (1)數(shù)字式圖書(shū)館實(shí)驗(yàn)工程 (2)基于特征的多媒體信息檢索系統(tǒng)的研討開(kāi)發(fā)工程 (3)SGML的圖書(shū)館運(yùn)用 (4)中國(guó)實(shí)驗(yàn)型數(shù)字式圖書(shū)館工程(5)知識(shí)網(wǎng)絡(luò)數(shù)字圖書(shū)館系統(tǒng)工程工程12.2數(shù)字圖書(shū)館構(gòu)造12.2.1數(shù)字圖書(shū)館系統(tǒng)的根本構(gòu)造數(shù)字圖書(shū)館系統(tǒng)從邏輯構(gòu)造來(lái)看主要由對(duì)象數(shù)據(jù)庫(kù)、元數(shù)據(jù)庫(kù)、數(shù)據(jù)加工子系統(tǒng)、查詢(xún)效力子系統(tǒng)、調(diào)度子系統(tǒng)等組成。(如圖12-1) 12.2數(shù)字圖書(shū)館構(gòu)造12.2.1數(shù)字圖書(shū)館系統(tǒng)的根本構(gòu)造其中,元數(shù)據(jù)庫(kù)和對(duì)象數(shù)據(jù)庫(kù)是數(shù)字圖書(shū)館的資源庫(kù),存儲(chǔ)和管理數(shù)字對(duì)
5、象的數(shù)據(jù)體、元數(shù)據(jù)及其他信息。資源庫(kù)經(jīng)常分布于不同地點(diǎn)。12.2數(shù)字圖書(shū)館構(gòu)造12.2.1數(shù)字圖書(shū)館系統(tǒng)的根本構(gòu)造數(shù)據(jù)加工子系統(tǒng)擔(dān)任對(duì)數(shù)字信息(數(shù)字化的文本、圖片、聲音、影像等)進(jìn)展加工整理,并將描畫(huà)數(shù)字信息的元數(shù)據(jù)(即數(shù)字對(duì)象的元數(shù)據(jù))歸人元數(shù)據(jù)庫(kù),12.2數(shù)字圖書(shū)館構(gòu)造12.2.1數(shù)字圖書(shū)館系統(tǒng)的根本構(gòu)造查詢(xún)效力子系統(tǒng)擔(dān)任為用戶(hù)提供查詢(xún)效力。調(diào)度子系統(tǒng)是一個(gè)為數(shù)字圖書(shū)館資源提供分布式目錄效力的計(jì)算機(jī)系統(tǒng)。12.2數(shù)字圖書(shū)館構(gòu)造12.2.2數(shù)字圖書(shū)館的信息體系構(gòu)造CSTR最重要的奉獻(xiàn)是提出了數(shù)字圖書(shū)館體系構(gòu)造建立的八條原那么性問(wèn)題:(1)一致對(duì)數(shù)字圖書(shū)館有關(guān)概念的規(guī)范(2)作為根底的體系構(gòu)造
6、應(yīng)和保管在數(shù)字圖書(shū)館中的信息內(nèi)容相分別 (3)名字和標(biāo)識(shí)符是數(shù)字圖書(shū)館的根底建構(gòu)塊 12.2數(shù)字圖書(shū)館構(gòu)造12.2.2數(shù)字圖書(shū)館的信息體系構(gòu)造 (4)數(shù)字圖書(shū)館數(shù)字對(duì)象的構(gòu)成 (5)數(shù)字圖書(shū)館對(duì)象運(yùn)用時(shí)和存儲(chǔ)時(shí)的形狀能夠完全不同 (6)倉(cāng)儲(chǔ)必需保管好所特有的信息 (7)用戶(hù)需求的是供人利用的知識(shí)作品,而非供機(jī)器處置的數(shù)字對(duì)象 (8)數(shù)字圖書(shū)館的技術(shù)框架存在于法律和社會(huì)的框架之內(nèi)12.2數(shù)字圖書(shū)館構(gòu)造12.2.3數(shù)字圖書(shū)館體系構(gòu)造的評(píng)價(jià)規(guī)范數(shù)字圖書(shū)館體系構(gòu)造的評(píng)價(jià)規(guī)范有很多,但應(yīng)該包含以下的內(nèi)容:(1)開(kāi)放性(2)互操作性(3)擴(kuò)展性(4)可伸縮性12.3數(shù)字圖書(shū)館信息組織的根本原理與方法12.
7、3.1數(shù)字圖書(shū)館信息組織的根本原那么 信息資源是數(shù)字圖書(shū)館建立的根底,對(duì)數(shù)字圖書(shū)館信息資源組織時(shí)應(yīng)遵照以下幾個(gè)原那么:(1)科學(xué)性原那么。(2)系統(tǒng)性原那么。(3)規(guī)范化原那么。(4)多維提示與非線(xiàn)性組織原那么。12.3數(shù)字圖書(shū)館信息組織的根本原理與方法12.3.1數(shù)字圖書(shū)館信息組織的根本原那么 (5)選擇性與完備性原那么。(6)共享性原那么。(7)平安性原那么。(8)知識(shí)組織的原那么。12.3數(shù)字圖書(shū)館信息組織的根本原理與方法12.3.2數(shù)字圖書(shū)館信息組織過(guò)程與框架數(shù)字圖書(shū)館資源組織主要要經(jīng)過(guò)以下幾個(gè)步驟:(1)規(guī)劃(2)搜集、整理(3)描畫(huà)(4)標(biāo)引(5)歸檔12.3數(shù)字圖書(shū)館信息組織的根
8、本原理與方法12.3.3數(shù)字圖書(shū)館的信息組織方法1分類(lèi)標(biāo)引法數(shù)字圖書(shū)館在分類(lèi)體系的構(gòu)造及類(lèi)目的展開(kāi)上有很大的改良,主要表如今:注重以事物為中心設(shè)置類(lèi)目,根據(jù)用戶(hù)的需求,按問(wèn)題組織相應(yīng)的資源;多維展開(kāi)類(lèi)目,對(duì)于具有從屬于多個(gè)上位類(lèi)的類(lèi)目,分別在相應(yīng)的類(lèi)目下予以展開(kāi);利用超文本技術(shù)銜接類(lèi)目,有效反映知識(shí)之間的聯(lián)絡(luò),以利于對(duì)資源的選擇查找;及時(shí)調(diào)整類(lèi)目的設(shè)置,動(dòng)態(tài)維護(hù)分類(lèi)體系。12.3數(shù)字圖書(shū)館信息組織的根本原理與方法12.3.3數(shù)字圖書(shū)館的信息組織方法2主題標(biāo)引法12.4數(shù)字圖書(shū)館的信息檢索12.4.1數(shù)字圖書(shū)館數(shù)字信息的檢索文本信息的檢索,就是將文本中的每個(gè)字、詞都進(jìn)展標(biāo)引,提供檢索。目前有兩種
9、方式1文本信息的檢索12.4數(shù)字圖書(shū)館的信息檢索12.4.1數(shù)字圖書(shū)館數(shù)字信息的檢索2圖像檢索方法(1)基于圖像可視特征的檢索方法:利用計(jì)算機(jī)分析圖像在顏色、紋理、外形等方面的特征,作為圖像的內(nèi)容進(jìn)展匹配、查找。(2)基于對(duì)象和區(qū)域的檢索方法:利用圖像的全局和部分特征,如總的顏色、所包含的對(duì)象的數(shù)目、圖像的總體視覺(jué)構(gòu)造等特征進(jìn)展檢索。12.4數(shù)字圖書(shū)館的信息檢索12.4.1數(shù)字圖書(shū)館數(shù)字信息的檢索 (3)基于綜合特征及其關(guān)系的檢索方法:將上述兩種基于內(nèi)容特征的檢索和語(yǔ)義檢索的方法結(jié)合起來(lái)進(jìn)展復(fù)雜的檢索,實(shí)現(xiàn)圖像的全內(nèi)容檢索。12.4數(shù)字圖書(shū)館的信息檢索12.4.1數(shù)字圖書(shū)館數(shù)字信息的檢索3視頻
10、檢索方法(1)視頻分割。(2)視頻聚類(lèi)。(3)關(guān)鍵幀抽取。(4)運(yùn)動(dòng)特性抽取。(5)視頻檢索。12.4數(shù)字圖書(shū)館的信息檢索12.4.1數(shù)字圖書(shū)館數(shù)字信息的檢索4音頻檢索方法(1)語(yǔ)音檢索方法。語(yǔ)音檢索是以語(yǔ)音為中心的檢索,采用語(yǔ)音識(shí)別等處置技術(shù)。利用語(yǔ)音識(shí)別技術(shù)進(jìn)展檢索利用子詞單元進(jìn)展檢索。利用識(shí)別關(guān)鍵詞進(jìn)展檢索。12.4數(shù)字圖書(shū)館的信息檢索12.4.1數(shù)字圖書(shū)館數(shù)字信息的檢索 (2)音樂(lè)檢索。在檢索系統(tǒng)中,音樂(lè)分為兩種類(lèi)型:構(gòu)造化的音樂(lè)和基于樣本的音樂(lè)。構(gòu)造化音樂(lè)的檢索?;跇颖镜囊魳?lè)檢索。12.4數(shù)字圖書(shū)館的信息檢索12.4.2數(shù)字圖書(shū)館用戶(hù)獲取信息的方式用戶(hù)閱讀信息的方式主要有三種:(1
11、)平坦閱讀(2)構(gòu)造導(dǎo)游閱讀(3)超文本閱讀12.5數(shù)字圖書(shū)館實(shí)例:美國(guó)國(guó)會(huì)圖書(shū)館的數(shù)字圖書(shū)館20 世紀(jì)80 年代后期,美國(guó)就率先開(kāi)場(chǎng)了數(shù)字圖書(shū)館的研討和建立,“美國(guó)記憶( American Memory )是美國(guó)國(guó)會(huì)圖書(shū)館的數(shù)字圖書(shū)館實(shí)驗(yàn)方案,從1989 1994 年,它選擇并復(fù)制了一部分收藏,以數(shù)字化的方式在美國(guó)國(guó)內(nèi)發(fā)布,向用戶(hù)提供取自100 多個(gè)歷史收藏的700 多萬(wàn)份數(shù)字化資料,這些資料包括數(shù)字化的歷史文本、照片、地圖、視頻、音頻等各種媒體方式。美國(guó)國(guó)家數(shù)字圖書(shū)館方案建立在“美國(guó)記憶勝利的根底上,將上百萬(wàn)收藏品轉(zhuǎn)換為數(shù)字方式并經(jīng)過(guò)因特網(wǎng)訪(fǎng)問(wèn)。12.5數(shù)字圖書(shū)館實(shí)例:美國(guó)國(guó)會(huì)圖書(shū)館的數(shù)字
12、圖書(shū)館12.5.1“美國(guó)記憶采用的文件格式對(duì)文本采用通用標(biāo)志言語(yǔ)規(guī)范(Standard for General Markup Language,SGML ) 編碼或采用可移植文檔格式(Portable Document Format,PDF)。對(duì)圖像照片采用標(biāo)簽圖像文件格式( Tag Image File Format,TIFF) 存儲(chǔ)或采用結(jié)合圖像專(zhuān)家組(Joint Photo-graphic Experts Group,J PEG) 編碼緊縮存儲(chǔ)。12.5數(shù)字圖書(shū)館實(shí)例:美國(guó)國(guó)會(huì)圖書(shū)館的數(shù)字圖書(shū)館12.5.1“美國(guó)記憶采用的文件格式對(duì)于沒(méi)有行業(yè)規(guī)范的地圖數(shù)字文件,那么采用新開(kāi)發(fā)的高明晰圖像
13、庫(kù)(Multiresolution seamless image database,Mrsid) 格式技術(shù)。對(duì)聲音文件,采用供下載后運(yùn)用的微軟公司聲音格式WAVE 和供在線(xiàn)實(shí)時(shí)傳輸?shù)腞ealAudio 兩種格式存儲(chǔ)。12.5數(shù)字圖書(shū)館實(shí)例:美國(guó)國(guó)會(huì)圖書(shū)館的數(shù)字圖書(shū)館12.5.1“美國(guó)記憶采用的文件格式對(duì)于高明晰度視頻動(dòng)畫(huà)資源采用運(yùn)動(dòng)圖像專(zhuān)家組(Motion Pictures Experts Group,MPEG) 格式存儲(chǔ),對(duì)于明晰度低的動(dòng)畫(huà)那么采用動(dòng)態(tài)影像的QuickTime 格式。12.5數(shù)字圖書(shū)館實(shí)例:美國(guó)國(guó)會(huì)圖書(shū)館的數(shù)字圖書(shū)館12.5.2“美國(guó)記憶的信息檢索和閱讀“美國(guó)記憶采用了多種信息組織方法,提供多種檢索、閱讀方式?!颈菊铝?xí)題】1.什么是數(shù)字圖書(shū)館?它有哪些特征?2.結(jié)合其它資料,談?wù)勎覈?guó)數(shù)字圖書(shū)館的進(jìn)展如何?如何開(kāi)展我國(guó)的數(shù)字圖書(shū)館事業(yè)?3.試述數(shù)字圖書(shū)館的根本構(gòu)造和信息體系構(gòu)造。4
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)五年級(jí)混合運(yùn)算練習(xí)題
- 小學(xué)四年級(jí)數(shù)學(xué)乘除法豎式計(jì)算題
- 小學(xué)數(shù)學(xué)二年級(jí)100以?xún)?nèi)連加連減口算題
- 高考語(yǔ)文模擬試題(二十)
- 2025年中考語(yǔ)文文言文總復(fù)習(xí)-學(xué)生版-專(zhuān)題01:文言文閱讀之理解實(shí)詞含義(講義)
- 北京市豐臺(tái)區(qū)2022-2023學(xué)年高三上學(xué)期期末練習(xí)英語(yǔ)學(xué)科試卷
- 房屋裝修行業(yè)顧問(wèn)工作總結(jié)
- 制藥業(yè)行政后勤工作總結(jié)
- 《公司團(tuán)隊(duì)培訓(xùn)游戲》課件
- 演出票務(wù)公司營(yíng)業(yè)員服務(wù)總結(jié)
- 普外科醫(yī)療組長(zhǎng)競(jìng)聘演講
- 【企業(yè)盈利能力探析的國(guó)內(nèi)外文獻(xiàn)綜述2400字】
- 醫(yī)學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)智慧樹(shù)知到期末考試答案2024年
- 大學(xué)生國(guó)家安全教育智慧樹(shù)知到期末考試答案2024年
- 油墨組成和分類(lèi)
- DB37T 5175-2021 建筑與市政工程綠色施工技術(shù)標(biāo)準(zhǔn)
- 自動(dòng)噴漆線(xiàn)使用說(shuō)明書(shū)
- 科研項(xiàng)目評(píng)審評(píng)分表
- 國(guó)家開(kāi)放大學(xué)《土木工程力學(xué)(本)》章節(jié)測(cè)試參考答案
- 醫(yī)療器械數(shù)據(jù)分析控制程序
- 稻盛和夫經(jīng)營(yíng)哲學(xué).ppt
評(píng)論
0/150
提交評(píng)論