版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、網(wǎng)絡(luò)信息資源的組織原那么研究-對DC元數(shù)據(jù)的討論引言如今人們已經(jīng)進入網(wǎng)絡(luò)時代,人們查詢信息的手段越來越趨向于網(wǎng)絡(luò)化,然而網(wǎng)絡(luò)信息的提供者只注重信息的內(nèi)容,而無視了網(wǎng)絡(luò)信息資源的描繪問題。這使得搜索引擎無法提取網(wǎng)絡(luò)信息資源的核心內(nèi)容,從而導(dǎo)致查全率和查準(zhǔn)率低。一種現(xiàn)象隨之產(chǎn)生,即在互聯(lián)網(wǎng)上總能找到甚至只能找到不需要的東西。網(wǎng)絡(luò)信息資源被準(zhǔn)確而合理的描繪是其被有效利用的前提和根底,尤其對龐大的網(wǎng)上資源而言。因此,只有對網(wǎng)上的信息資源進展整體上的有效組織、管理和個體上的充分提醒和描繪,才能從根本上解決查找、利用上的困難,進步查全率和查準(zhǔn)率。但是,網(wǎng)上的信息資源不同于傳統(tǒng)的文獻資源的各種特點,要求創(chuàng)立
2、有別于傳統(tǒng)書目著錄組織方式的新工具元數(shù)據(jù),就在這一背景下產(chǎn)生了。元數(shù)據(jù),即關(guān)于數(shù)據(jù)的數(shù)據(jù),用來描繪網(wǎng)絡(luò)信息資源、加強對網(wǎng)上信息資源的組織和利用的網(wǎng)絡(luò)數(shù)據(jù)集合。而都柏林核心元數(shù)據(jù)集Dublin Core Element Set,簡稱DC是其中開展比擬成熟而又比擬成功的一種元數(shù)據(jù)。DC 元數(shù)據(jù)方案的創(chuàng)立,是通過網(wǎng)絡(luò)信息資源的提供者對資源屬性信息的描繪,并對其內(nèi)容進展編目、定位,來幫助人們盡快地在網(wǎng)上發(fā)現(xiàn)所需要的有效信息資源。因此,DC 元數(shù)據(jù)資源描繪方案又稱為網(wǎng)上資源的編目。1 DC 元數(shù)據(jù)的開展和標(biāo)準(zhǔn)DC 是在網(wǎng)絡(luò)環(huán)境中描繪文件類對象所需要的最小元素集。其中15 個元數(shù)據(jù)項可以分為【2】:1Ti
3、tle:標(biāo)題項,由資源作者或出版者給出的被描繪資源的名稱。2Subject:主題詞或關(guān)鍵詞項,一般是描繪資源的主題和內(nèi)容的關(guān)鍵詞或短語。3Description:描繪項,資源的文本描繪,包括文獻類對象的文摘或視頻的內(nèi)容描繪。4Source:來源項,用來唯一標(biāo)識被描繪資源的來源。假設(shè)當(dāng)前的資源為其原始形式,來源項元素可以不用。5Language:語言項,被描繪資源內(nèi)容的描繪語言。6Relation:關(guān)聯(lián)項,被描繪資源與其他資源之間的關(guān)系。7Coverage:時空范圍項,被描繪資源空間或時間特性。空間范圍物理區(qū)域,來自標(biāo)準(zhǔn)詞表的地名或全稱。時間范圍指資源內(nèi)容,而不是資源產(chǎn)生的時間由日期Date 元
4、素表示。時間描繪采用與日期Date 一樣的格式或者采用標(biāo)準(zhǔn)列表中的時間范圍描繪。8Creator:作者或者創(chuàng)立者項,對創(chuàng)造資源知識內(nèi)容負(fù)主要責(zé)任的個人或機構(gòu)。9Publisher:出版者項,負(fù)責(zé)發(fā)行被描繪資源的組織。10Contributor:其他參與者項,指沒有在Creator 元素中列出的對被描繪資源的創(chuàng)作做出了共獻的其別人或組織,其奉獻次于創(chuàng)立者。11Rights:版權(quán)管理項,被描繪資源的版權(quán)聲明和使用范圍。(12) Date:發(fā)布日期項,被描繪資源公開發(fā)布的日期。13Type:類型項,被描繪資源屬性的范疇或類型,通常從資源類型列表中選取。14Format:格式項,被描繪資源的數(shù)據(jù)格式,
5、用于注明需要什么軟件或硬件來顯示和執(zhí)行這一資源。為了進步互操作性,格式值應(yīng)該從格式列表中選取。15Identifier:標(biāo)識項,可以唯一標(biāo)識描繪資源的字符或數(shù)字。這簡單的 15 個元素由于具有可延伸性、可選擇性和可重復(fù)性等特點,可根據(jù)不同行業(yè)的需求對其進展改編,到達描繪信息的完好性、可靠性和檢索效率高的目的。從DC 元數(shù)據(jù)的元素構(gòu)造及著錄規(guī)那么可以看出有如下特點:1構(gòu)造簡單。只有15 個根本元素,且根據(jù)DC 的可選擇原那么,還可進一步簡化著錄工程。2通俗易懂。非編目人員根據(jù)元素的含義易學(xué)易會。制作者可根據(jù)DC 的標(biāo)準(zhǔn)標(biāo)引自己的網(wǎng)頁、出版物等,進步標(biāo)引的質(zhì)量和效率。3可擴展性??梢耘c其他元數(shù)據(jù)如
6、RDFResource Description Framework,USMARC等連接使用,以彌補自身的缺乏,進步DC 在不同元數(shù)據(jù)系統(tǒng)中的互操作性。4可選擇性。根據(jù)行業(yè)不同,選擇不同的元素進展描繪,如對地圖、天體、藝術(shù)品、多媒體等的描繪,由于它們各有其特點,在描繪時可選擇Description(內(nèi)容描繪)、Relation(關(guān)聯(lián))項來解決。5可重復(fù)性。解決了多創(chuàng)造者、多版本、多語種等的著錄問題。如一個主頁是由多部門協(xié)作完成和維護,或由幾個語種提醒,DC 通過它的可重復(fù)性即可解決。6可修飾性。根據(jù)對不同資源信息描繪的需求,對元素可修飾。如對動態(tài)的網(wǎng)頁進展描繪時,DC 可通過創(chuàng)作時間、修改時間、
7、有效時間等修飾性來解決。7信息描繪的靈敏性。既可用標(biāo)準(zhǔn)化中的標(biāo)準(zhǔn)化詞標(biāo)引,也可用關(guān)鍵詞標(biāo)引。在實際應(yīng)用中,僅僅依靠這15 個根本元素的描繪才能是有限的,因此必須加以限定和進展假設(shè)干子元素的標(biāo)準(zhǔn)描繪。有關(guān)DC 限定詞及子元素的定義目前正在開展之中,在1997年3 月的第四次DC 研討會上確定了DC 附加的三個限定詞:形式體系Scheme、語種描繪Lang、屬性類Type。1Scheme 形式體系:用來指明元素值得選取遵從已有的或正在討論中的某個體系構(gòu)造中的合法值,如分類發(fā)表、主題詞或各類代碼值。如一個Subject 字段應(yīng)從LCSHLibraryof Congress Subject Headi
8、ng中取值。Scheme 限定詞對應(yīng)用軟件或應(yīng)用人員能提供一個處理線索,以使被限定元素能更好的使用。2Lang 語種描繪:指明元素值描繪字段所使用的語種,而不是資源本身的語言。由于網(wǎng)絡(luò)上的多語種問題越來越突出,這個限定詞變得越來越重要。迄今為止,英語被假定為網(wǎng)上的語言,但這一現(xiàn)象正在改變,確定資源本身和資源描繪的語言問題變得極為重要。3Type 屬性類型:指明目前元素的值是元素何種類型的值,一般以子元素限定的方式來描繪。2 DC 元數(shù)據(jù)的描繪對象和描繪原那么DC 元數(shù)據(jù)把它描繪的對象稱為“資源,這種資源既可能是物質(zhì)的實體也可能是抽象的實體,比方:當(dāng)描繪創(chuàng)立者時,DC 就是一個人、或者一個團體、
9、或者一個效勞機構(gòu)這就是物質(zhì)實體;當(dāng)描繪日期時,DC 就是時間上的一個點或一個段這就使一個抽象的實體;當(dāng)描繪覆蓋范圍時,DC 就是一個地區(qū)或國家這就使一個物質(zhì)實體。當(dāng)描繪主題時,DC 可能是一個抽象實體的抽象概念,也可能是對一個物質(zhì)實體的主題或人等等,所有這些描繪對象都稱作“資源。可見,DC 元數(shù)據(jù)描繪的對象資源指任何可以標(biāo)識的東西【3】。一條元數(shù)據(jù)可以由一個或多個關(guān)于一個或多個資源的元數(shù)據(jù)描繪組成,這個原那么超越了以前的簡單DC 紀(jì)錄只能有一條描繪的限定,一條DC 元數(shù)據(jù)就是一個元數(shù)據(jù)描繪集合,并可以采用任何一種編碼語言來陳述,比方XHTML meta tags, XML, rdf/XML 等
10、。這個原那么同時規(guī)定每一個DC 元數(shù)據(jù)描繪只能描繪一個資源,也就是所謂“1:1原那么one-to-oneprinciple。3 從 MARC 到DC3.1 MARC 的產(chǎn)生MARC 是圖書館為適應(yīng)計算機技術(shù)在圖書館編目的運用而產(chǎn)生的,圖書館歷來依賴目錄提供館藏信息效勞,圖書館目錄與圖書館是分不開的,最早的圖書館目錄是書本式的目錄,這些目錄只能提供簡單的少量檢索點,而且因為是手工操作,出版時間長,更新不容易,有很大的局限性。因此,當(dāng)計算機開場應(yīng)用后,MARC 格式應(yīng)運而生。MARC 是MachineReadable Catalogue,稱為機讀目錄,可以把人們可以識別的書目信息,使計算機也能識別
11、,計算機同時將信息反應(yīng)給人類,成為人類所需要的各種書目產(chǎn)品【4】。3.2 MARC 的局限性1這種方式只是用于圖書館,而且工作很繁瑣。MARC 字段非常復(fù)雜,即使如今大局部圖書館都是進展聯(lián)機編目工作,也要花費很多時間來添加本館自定義字段。2編目人員需要經(jīng)過專門的訓(xùn)練及長期的理論,對編目人員的素質(zhì)要求很高,不僅要懂得一兩門外語,而且要對計算機操作非常熟悉,編目工作是一項繁重又耗腦力的工作,必須是嚴(yán)謹(jǐn)?shù)娜藛T才能勝任這項工作。3MARC 的著錄需要在專門的軟件系統(tǒng)環(huán)境中使用,不適應(yīng)如今的互聯(lián)網(wǎng)環(huán)境。它適用于完好的、靜止的信息內(nèi)容的處理。但是,如今的信息資源不僅僅限于書本式的信息,網(wǎng)絡(luò)資源開展迅速,動
12、態(tài)的多媒體信息資源日益增加,假如這些資源沒有很好的進展組織和整理,它就會泛濫成災(zāi),形成信息污染【5】。4MARC 的修訂程序相當(dāng)復(fù)雜,而且修改的進程非常緩慢。3.3 DC 元數(shù)據(jù)雖然 MARC 正在不斷地開展,它進展的網(wǎng)絡(luò)信息資源編目是受控編目,編目數(shù)據(jù)質(zhì)量較高,但是編目速度慢,本錢高。面對這個問題,許多信息技術(shù)界的研究者設(shè)計了元數(shù)據(jù)格式來描繪電子信息資源。盡管MARC 也是元數(shù)據(jù)的一種格式,但是目前人們研究的較多的是側(cè)重于電子資源和網(wǎng)絡(luò)資源的應(yīng)用。DC 元數(shù)據(jù)就是針對網(wǎng)絡(luò)信息資源組織與整理問題而由圖書館和信息界提出來的解決方案之一【6】。4 DC 元數(shù)據(jù)的開展趨勢4.1 對網(wǎng)絡(luò)信息資源的影響
13、4.1.1 網(wǎng)絡(luò)信息資源的特點由 DC 元數(shù)據(jù)的描繪原那么可以分析得出網(wǎng)絡(luò)信息資源的特點:包羅萬象,分布廣泛,數(shù)量大,類型多,動態(tài)快速增加,可利用性和可靠性不斷地變化,信息源分散無序。這些特點也決定了網(wǎng)絡(luò)信息資源更迭和消亡都無法預(yù)測,同時,由于網(wǎng)絡(luò)上存在的大量信息垃圾、信息病毒、信息孤島,使得很多網(wǎng)絡(luò)信息資源本身并不具備利用的環(huán)境和價值。這種種特點使得傳統(tǒng)的文獻組織方式和檢索手段幾乎無能為力。 網(wǎng)絡(luò)的出現(xiàn)改變了人們交流的方式,也改變了傳統(tǒng)的文獻類型,網(wǎng)絡(luò)信息資源以一種迅猛開展的態(tài)勢沖擊著我們組織、描繪文獻資源的方式和方法,成為了一種無法無視和回避,又難以解決的問題。在網(wǎng)絡(luò)時代,要解決檢索網(wǎng)絡(luò)信
14、息資源的種種障礙,除了在技術(shù)上不斷開展以外,還應(yīng)從源頭上去標(biāo)準(zhǔn)網(wǎng)絡(luò)信息,由信息提供者和信息機構(gòu)對網(wǎng)絡(luò)信息資源做深層次的加工與開發(fā)工作,使一般的網(wǎng)絡(luò)信息檢索者可以在這種重新開發(fā)的階梯上找到自己真正想要的信息,到達檢索的目的。因此,在組織網(wǎng)絡(luò)信息資源時應(yīng)堅持以下原那么:1信息共享網(wǎng)絡(luò)世界沒有了時空的間隔,假如還按照傳統(tǒng)的工作形式,各自為陣、各自搜集、加工、處理、提供檢索,那樣既不利于搜集也不利于利用。因為沒有任何一個信息機構(gòu)有實力可以搜集完好所有的信息資源。多個信息機構(gòu)結(jié)合不失為一個實現(xiàn)信息共享的好方法。2提供遠程效勞目前,各個學(xué)科的開展都非常迅速,信息資源及信息資源的創(chuàng)立者和使用者構(gòu)成了一個龐大
15、的、不斷開展變化且極具活力的群體,信息機構(gòu)要更好地?fù)?dān)負(fù)起資源組織者的角色,就必須及時吸收這些專業(yè)的成果,才可以使經(jīng)過整合后的信息資源具有更高的使用價值,否那么即使擁有再先進的技術(shù)和手段,也無助于進步信息機構(gòu)在網(wǎng)絡(luò)信息資源流動鏈中的作用。而組織信息的目的在于提供效勞,網(wǎng)絡(luò)的開展已成為不可阻擋的趨勢,因此將來信息機構(gòu)在效勞上更多的以提供遠程效勞為目的,提供盡可能完備的檢索途徑,方便人們通過各種計算機終端進展檢索。3合適用戶的檢索習(xí)慣信息資源的組織是為了更好的利用,然而DC 元數(shù)據(jù)系統(tǒng)還不很完善,人們還習(xí)慣于使用MARC 格式進展標(biāo)引的情況下,應(yīng)充分挖掘MARC 標(biāo)引系統(tǒng)的潛力以適應(yīng)網(wǎng)絡(luò)信息資源檢索
16、的需要。近年來,MARC 格式一直處于不斷的晉級過程中,特別增設(shè)字段為電子文檔建立超鏈接,并對相關(guān)字段進展了個別調(diào)整,擴大了原有字段的內(nèi)涵。MARC 還特別增加了856 字段,即電子地址檢索方式字段,856 字段著錄網(wǎng)絡(luò)信息資源的獲取方式及獲取的必要信息,通過它可實現(xiàn)書目紀(jì)錄與網(wǎng)絡(luò)信息資源的鏈接。增加了856 字段后,使編目工作進入了一個新的階段,其超文本的鏈接方式,擴展了機讀目錄的功能,為讀者檢索信息資源提供了更為快捷、高效的途徑。4.2 MARC 與DC 并存是圖書館信息資源組織的開展趨勢4.2.1 復(fù)合圖書館是將來圖書館的新形式目前大多數(shù)圖書館都存有數(shù)以萬計的MARC 格式的書目數(shù)據(jù),在
17、當(dāng)前以及可以遇見的將來,傳統(tǒng)的印刷型文獻仍然是圖書館信息資源的重要組成局部和讀者效勞的重要物質(zhì)根底。紙質(zhì)文獻出版業(yè)將在相當(dāng)長的時期內(nèi)與數(shù)字化信息的出版發(fā)布共同繁榮。DC 元數(shù)據(jù)格式雖然開展迅速,但尚未形成國際公認(rèn)的標(biāo)準(zhǔn),不同的元數(shù)據(jù)有其發(fā)揮作用的不同領(lǐng)域。MARC 與 DC 的并存將是今后一段時期內(nèi)圖書館信息資源組織的開展趨勢。4.2.2 實現(xiàn) MARC 與DC 的互相轉(zhuǎn)換對 MARC 和 DC 兩種元數(shù)據(jù)格式的討論,目的是通過研究,找出一個在應(yīng)用上最能發(fā)揮效益的資源處理方法。目前有關(guān)DC 元數(shù)據(jù)格式向標(biāo)準(zhǔn) MARC 格式轉(zhuǎn)化的理論已獲得很大的打破,這使得 MARC 與DC 間互相轉(zhuǎn)換成為可能
18、。從理論上講,從DC 到 MARC的格式轉(zhuǎn)換并不是件難事,任何一種構(gòu)造化的數(shù)據(jù)都能轉(zhuǎn)換成另一種數(shù)據(jù)構(gòu)造,但是這種轉(zhuǎn)換不可防止地會造成一定程度的數(shù)據(jù)損失。目前許多學(xué)者在研究 DC 格式與 USMARC 格式的轉(zhuǎn)換,編制了一些詞表反映二者之間的關(guān)系,U N I M A R C 和 U S M A R C 與 D C間映射已有成果面世,并有系統(tǒng)投入實際運作之中【7】。5 結(jié)語隨著 Internet 的開展以及網(wǎng)絡(luò)資源和技術(shù)越來越廣泛的應(yīng)用,數(shù)字圖書館的數(shù)量在網(wǎng)上不斷增多正如紙介質(zhì)圖書館中的圖書、等收藏需要編目一樣,數(shù)字圖書館的數(shù)字收藏(digital collection)同樣需要著錄和標(biāo)引,以便用
19、戶可以準(zhǔn)確快速地找到自己所需的信息。DC元數(shù)據(jù)是解決網(wǎng)絡(luò)信息資源無序化問題的一次有效的嘗試和研究,特別是由OCLC 牽頭組織那么意義更是重大而深遠。網(wǎng)絡(luò)信息資源的組織與整理工作已不是單由圖書館界就能完成的,更不是單純地利用圖書館傳統(tǒng)的編目理論就能勝任的。DC 元數(shù)據(jù)是在充分吸收了圖書館界所具有的編目、分類、文摘等經(jīng)歷的根底上,同時積極利用了計算機、網(wǎng)絡(luò)界的自動搜索、編目、索引、檢索等研究理論與成果所開展起來的,是當(dāng)今國際圖書館界和網(wǎng)絡(luò)界的研究熱點之一。中國碩士提供大量免費工商管理碩士論文,如有業(yè)務(wù)需求請咨詢網(wǎng)站客服人員! (References) 【2】 郝亞玲DC 元數(shù)據(jù)與網(wǎng)絡(luò)信息資源的描繪情報科學(xué)2002,20 (10):1069-1074 【4】 董紅霞從URMARC 到DC 元數(shù)據(jù)圖書館學(xué)研
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 科研機構(gòu)電氣設(shè)備安裝協(xié)議
- 萬能工品牌推廣合同
- 【初中道法】增強安全意識 課件-2024-2025學(xué)年統(tǒng)編版道德與法治七年級上冊
- 《個人獨資企業(yè)法》課件
- 《業(yè)務(wù)流程重組》課件
- 做一個文明的人國旗下講話稿范文(9篇)
- 2024年式委托車輛整修合同
- 2024年手機云存儲服務(wù)協(xié)議
- 《品牌網(wǎng)絡(luò)營銷規(guī)劃》課件
- 高三學(xué)年主任工作計劃5篇
- 口腔科醫(yī)療污水處置登記表
- 習(xí)近平總書記教育重要論述講義智慧樹知到期末考試答案章節(jié)答案2024年西南大學(xué)
- 9.3一元一次不等式組解法市公開課一等獎省賽課微課金獎?wù)n件
- 2024中國南水北調(diào)集團新能源投資有限公司招聘筆試參考題庫含答案解析
- (正式版)JBT 106-2024 閥門的標(biāo)志和涂裝
- 依據(jù)新課標(biāo)人教部編歷史九年級下冊默寫填空
- 《鳥的生殖和發(fā)育》名師導(dǎo)學(xué)1
- 2024世界糖尿病日
- 好書推薦《安徒生童話》
- 駐外員工管理制度
- 中藥學(xué)職業(yè)規(guī)劃
評論
0/150
提交評論