網(wǎng)絡(luò)信息資源管理_第1頁
網(wǎng)絡(luò)信息資源管理_第2頁
網(wǎng)絡(luò)信息資源管理_第3頁
網(wǎng)絡(luò)信息資源管理_第4頁
網(wǎng)絡(luò)信息資源管理_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)信息資源管理第一頁,共五十六頁,2022年,8月28日1網(wǎng)絡(luò)信息資源有哪些?網(wǎng)站,社區(qū),微博網(wǎng)絡(luò)信息資源的獲取網(wǎng)絡(luò)信息資源的傳輸網(wǎng)絡(luò)信息資源的存儲網(wǎng)絡(luò)信息資源的分析網(wǎng)絡(luò)信息資源的使用網(wǎng)絡(luò)信息資源的維護(hù)第二頁,共五十六頁,2022年,8月28日29.1網(wǎng)絡(luò)信息資源概述目前關(guān)于信息資源的含義有很多不同的解釋,但歸納起來主要有兩種:一是俠義的理解,認(rèn)為信息資源就是指文獻(xiàn)資源或者數(shù)據(jù)資源,或者各種媒介和形式的信息的集合,包括文字,聲像,印刷品,電子信息,數(shù)據(jù)庫等,這都是限于信息本身。二是廣義的理解,認(rèn)為信息資源是信息活動中各種要素的總稱,包含了信息相關(guān)的人員,設(shè)備,技術(shù)和資金等各種資源。第三頁,共五十六頁,2022年,8月28日3網(wǎng)絡(luò)信息資源可以理解為“通過計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和”。作為知識經(jīng)濟(jì)時(shí)代的產(chǎn)物,網(wǎng)絡(luò)信息資源也稱虛擬信息資源,它是以數(shù)字化形式記錄的、以多媒體形式表達(dá)的、存儲在網(wǎng)絡(luò)計(jì)算機(jī)的磁介質(zhì),光介質(zhì)以及各類通訊介質(zhì)上,并通過計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行傳遞信息內(nèi)容的集合。簡言之,網(wǎng)絡(luò)信息資源就是通過計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和。第四頁,共五十六頁,2022年,8月28日49.1網(wǎng)絡(luò)信息資源概述網(wǎng)絡(luò)信息資源有狹義與廣義之分。狹義的網(wǎng)絡(luò)信息資源通常指在各種網(wǎng)絡(luò)(包括互聯(lián)網(wǎng)、局域網(wǎng))上可以利用的、能滿足廣大用戶科研與工作需求的各種信息資源的總和。廣義的網(wǎng)絡(luò)信息資源指所有互聯(lián)網(wǎng)上的信息資源,包括技術(shù),各種設(shè)備、標(biāo)準(zhǔn)規(guī)范等,第五頁,共五十六頁,2022年,8月28日59.1.1網(wǎng)絡(luò)信息資源的分類與組織網(wǎng)絡(luò)信息資源的特點(diǎn)網(wǎng)絡(luò)信息資源作為一種新型的信息源,有不同于傳統(tǒng)信息資源的特點(diǎn),主要表現(xiàn)在數(shù)量、結(jié)構(gòu)、分布、類型、傳播范圍、載體形態(tài)、控制方式等方面。第六頁,共五十六頁,2022年,8月28日6以網(wǎng)絡(luò)為傳播媒體傳播迅速,數(shù)量大,增長快內(nèi)容豐富、形式多樣信息組織的局部有序性與整體無序性并存信息質(zhì)量良莠不齊結(jié)構(gòu)復(fù)雜、分布廣泛信息資源組織方式非線性化分布式存儲、但關(guān)聯(lián)程度強(qiáng)9.1.1網(wǎng)絡(luò)信息資源的分類與組織第七頁,共五十六頁,2022年,8月28日79.1.1網(wǎng)絡(luò)信息資源的分類與組織網(wǎng)絡(luò)信息資源的分類網(wǎng)上信息資源浩如煙海,可以從不同的角度進(jìn)行劃分和歸類。依據(jù)不同的標(biāo)準(zhǔn),網(wǎng)絡(luò)信息資源可分成不同的類型,較典型的有如下幾種。按信息資源的媒體形式,分為:文本信息圖片信息。音頻信息視頻信息三維虛擬影像第八頁,共五十六頁,2022年,8月28日89.1.1網(wǎng)絡(luò)信息資源的分類與組織按照人類信息交流方式,可將網(wǎng)絡(luò)信息資源分為:非正式出版信息半正式出版信息正式出版信息。按信息內(nèi)容的表現(xiàn)形式和用途,可分為:全文型的事實(shí)型的數(shù)值型實(shí)時(shí)活動型其他類型:如圖形、音樂、影視、廣告等各種媒體

第九頁,共五十六頁,2022年,8月28日99.1.1網(wǎng)絡(luò)信息資源的分類與組織按信息來源劃分,可分為政府信息資源公眾信息資源商用信息資源按信息時(shí)效劃分,可分為電子郵件型信息資源圖書館目錄資源書目與索引資源全文資料及電子出版物資源數(shù)據(jù)庫信息資源第十頁,共五十六頁,2022年,8月28日109.1.1網(wǎng)絡(luò)信息資源的分類與組織按網(wǎng)絡(luò)傳輸協(xié)議劃分,可分為www信息資源Telnet信息資源FTP信息資源用戶服務(wù)組信息資源Gopher信息資源其他分類方法IDGBookWorldWide1996年出版的《WWW指南》就將網(wǎng)絡(luò)信息資源進(jìn)行混合分類,它以學(xué)科領(lǐng)域?yàn)橐罁?jù)將網(wǎng)絡(luò)信息資源分為57類日本的戶田慎一把網(wǎng)絡(luò)信息資源分成7類網(wǎng)絡(luò)信息資源按信息源提供信息的加工深度分,可分為一次信息源、二次信息源、三次信息源等

第十一頁,共五十六頁,2022年,8月28日11網(wǎng)絡(luò)信息資源的組織是指人們根據(jù)網(wǎng)絡(luò)信息本身的特征,運(yùn)用各種工具和方法,對網(wǎng)絡(luò)信息資源進(jìn)行加工、整理、排列、組合,使之有序化、系統(tǒng)化、規(guī)律化,從而利于網(wǎng)絡(luò)信息的存儲、傳播、檢索、利用,以滿足人們的網(wǎng)絡(luò)信息需求的活動過程。網(wǎng)絡(luò)是網(wǎng)絡(luò)信息資源的載體,由于載體的特殊性而呈現(xiàn)出獨(dú)特的組織形式。有學(xué)者結(jié)合網(wǎng)絡(luò)信息資源組織開發(fā)形式的現(xiàn)狀,將網(wǎng)絡(luò)信息資源組織與開發(fā)形式歸納為超文本方式、搜索引擎方式、指引庫方式、元數(shù)據(jù)方式、圖書館編目方式等。網(wǎng)絡(luò)信息資源的組織方式

第十二頁,共五十六頁,2022年,8月28日129.1.2網(wǎng)絡(luò)信息資源的組織方式文件方式文件方式是網(wǎng)上數(shù)字化信息資源的一種主要存儲形式。以文件方式組織網(wǎng)絡(luò)信息資源有如下優(yōu)勢簡單易操作文件是存儲非結(jié)構(gòu)化信息的單位第十三頁,共五十六頁,2022年,8月28日139.1.2網(wǎng)絡(luò)信息資源的組織方式文件方式是網(wǎng)絡(luò)信息資源組織的簡單方式。隨著網(wǎng)絡(luò)信息、資源利用的不斷普及和信息量的不斷增多,以文件為單位共享和傳輸信息的不足逐步顯現(xiàn)。隨著網(wǎng)絡(luò)信息資源利用的普及和信息量的增加,以文件來傳遞信息會使得網(wǎng)絡(luò)的負(fù)載量越來越大。對結(jié)構(gòu)化信息組織與管理顯得不足。隨著以文件形式保存和管理的信息資源的增多,文件本身也需要作為對象來管理。第十四頁,共五十六頁,2022年,8月28日149.1.2網(wǎng)絡(luò)信息資源的組織方式超文本方式超文本是一種將網(wǎng)上相關(guān)文本的信息有機(jī)地組織在一起,以節(jié)點(diǎn)為基本單位,節(jié)點(diǎn)間以鏈路相連,將信息組織為網(wǎng)狀結(jié)構(gòu)的組織方式。人們可以通過高度鏈接的網(wǎng)絡(luò)在各種信息庫中自由航行,找到所需要的各種媒體形式的信息。超媒體的優(yōu)勢在于:非線性編排,符合人們思維聯(lián)想和跳躍的習(xí)慣;節(jié)點(diǎn)中的內(nèi)容可多可少,結(jié)構(gòu)可以任意伸縮,具有良好的包容性和擴(kuò)充性;可組織各類媒體的信息,方便地描述和建立各媒體信息之間的語義聯(lián)系,超越了媒體類型對信息組織的限制;通過鏈路瀏覽的方式搜索信息,將信息控制機(jī)制融合進(jìn)系統(tǒng)數(shù)據(jù)中,避免了檢索語言的復(fù)雜性。

第十五頁,共五十六頁,2022年,8月28日159.1.2網(wǎng)絡(luò)信息資源的組織方式超文本方式同樣有它的局限性:它在文本之間的來回跳躍鏈接,很容易打斷讀者的思路,分散讀者的注意力,甚至可能使讀者被五花八門的鏈接牽著鼻子走而偏離了信息瀏覽查詢的初衷。由于超文本方式本身的特點(diǎn),一組邏輯與聯(lián)系較強(qiáng)的信息往往由各個(gè)節(jié)點(diǎn),多個(gè)web頁組成,從而導(dǎo)致用戶在瀏覽和查詢時(shí),難以從整體上把握節(jié)點(diǎn)和頁面的完整的邏輯關(guān)系,檢索結(jié)果往往失去整體性和全局性。很難保存遍歷過程中所有的歷史記錄,故無法在需要時(shí)立即返回到曾經(jīng)瀏覽過的某一節(jié)點(diǎn),即出現(xiàn)“迷航”現(xiàn)象。第十六頁,共五十六頁,2022年,8月28日169.1.2網(wǎng)絡(luò)信息資源的組織方式數(shù)據(jù)庫方式所謂數(shù)據(jù)庫方式,就是將網(wǎng)絡(luò)信息資源以固定的記錄格式存儲,并提供一些檢索入口,用戶通過檢索入口,就可以找到所需要的信息線索,并利用超級鏈接功能直接鏈接到相關(guān)站點(diǎn)或一次信息本身的方式。利用數(shù)據(jù)庫技術(shù)組織網(wǎng)絡(luò)信息資源具有如下優(yōu)勢對大量的結(jié)構(gòu)化數(shù)據(jù)的處理效率有了很大的提高數(shù)據(jù)的最小存取單位是信息項(xiàng)(字段),可以根據(jù)用戶需求靈活地改變查詢結(jié)果集合的大小,從而大大降低了網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)呢?fù)載以數(shù)據(jù)庫技術(shù)為基礎(chǔ)已建立了大量的信息系統(tǒng),形成了一整套系統(tǒng)分析、設(shè)計(jì)與實(shí)施的方法,為人們建立網(wǎng)絡(luò)信息系統(tǒng)提供了現(xiàn)成的經(jīng)驗(yàn)和模式

第十七頁,共五十六頁,2022年,8月28日179.1.2網(wǎng)絡(luò)信息資源的組織方式以數(shù)據(jù)庫方式組織網(wǎng)絡(luò)信息資源,其不足之處在于:對非結(jié)構(gòu)化信息的處理困難較大,對網(wǎng)絡(luò)環(huán)境中日益增加的多媒體信息及表格程序、大文本等非結(jié)構(gòu)化信息的組織處理能力較差無法有效處理結(jié)構(gòu)日益復(fù)雜的信息單元缺乏直觀性和人機(jī)交互性

為了滿足利用數(shù)據(jù)庫技術(shù)處理非結(jié)構(gòu)化文本信息的需要,人們試圖對全文文本進(jìn)行結(jié)構(gòu)化處理,并用數(shù)據(jù)庫技術(shù)對經(jīng)過處理的文本信息進(jìn)行管理,稱之為“全文數(shù)據(jù)庫”。

第十八頁,共五十六頁,2022年,8月28日189.1.2網(wǎng)絡(luò)信息資源的組織方式搜索引擎方式

自動搜尋工具主要有自動搜尋網(wǎng)絡(luò)資源、自動索引、自動摘要、提供檢索方法和用戶界面等功能。由于是自動搜尋,故這種方式的不足之處是收錄的信息良莠不齊耗費(fèi)大量的計(jì)算機(jī)資源查全率高但查準(zhǔn)率低搜索引擎“命中”的網(wǎng)上一次信息動輒上百成千,因此越來越多的搜索引擎提供二次檢索功能,以及對檢索結(jié)構(gòu)進(jìn)行再處理的功能。

第十九頁,共五十六頁,2022年,8月28日199.1.2網(wǎng)絡(luò)信息資源的組織方式目錄指南方式

目錄指南方式,又可稱為主題樹方式,組織信息資源的方法是將信息資源按照某種事先確定的主題分門別類地加以組織,用戶通過瀏覽的方式層層遍歷,直到找到所需的信息的線索,再鏈接到相應(yīng)的網(wǎng)頁。目錄指南方式的優(yōu)點(diǎn)是信息的專題性較強(qiáng),信息質(zhì)量高,且能較好地滿足族性檢索的要求用戶按照規(guī)定的范圍和分類體系,逐級查看,按圖索驥,目的性強(qiáng),查準(zhǔn)率高屏蔽了網(wǎng)絡(luò)資源系統(tǒng)相對于用戶的復(fù)雜性,提供了一個(gè)基于樹瀏覽的簡單易用的網(wǎng)絡(luò)信息檢索與利用界面,并且具有嚴(yán)密的系統(tǒng)性和良好的可擴(kuò)充性

第二十頁,共五十六頁,2022年,8月28日209.1.2網(wǎng)絡(luò)信息資源的組織方式目錄指南方式的不足主要體現(xiàn)在:很難確定一個(gè)全面的范疇體系作為目錄指南結(jié)構(gòu)的基礎(chǔ)來涵蓋所有的網(wǎng)絡(luò)信息資源。用戶為了迅速地找到所需信息還須對相應(yīng)的體系有較全面的了解,這就增加了用戶的智力負(fù)擔(dān)。要保證目錄結(jié)構(gòu)的清晰性,每一類目下的條目也不宜過多,這就大大限制了所能容納網(wǎng)絡(luò)信息資源的數(shù)量。因此,目錄指南結(jié)構(gòu)不適合建立大型的綜合性的網(wǎng)絡(luò)資源系統(tǒng)。但在建立專業(yè)性或示范性的網(wǎng)絡(luò)信息資源體系時(shí),就顯示出其結(jié)構(gòu)清晰、使用方便的優(yōu)點(diǎn)。第二十一頁,共五十六頁,2022年,8月28日219.1.2網(wǎng)絡(luò)信息資源的組織方式圖書館編目方式目前,圖書館編目已成為一種組織網(wǎng)絡(luò)信息資源的重要方式,它用傳統(tǒng)的機(jī)讀目錄格式來組織整理網(wǎng)絡(luò)信息資源。網(wǎng)上資源編目需要精干的咨詢機(jī)構(gòu)、自動化系統(tǒng)的專門知識、館藏發(fā)展與參考部門的共同合作,才能為用戶提供最為有效的目錄產(chǎn)品。采用館內(nèi)合作的方式對網(wǎng)上資源進(jìn)行編目,分為三個(gè)步驟:①由負(fù)責(zé)館藏建設(shè)的館員選擇網(wǎng)上資源,填寫“網(wǎng)絡(luò)資源著錄申請表”;②由編目人員根據(jù)MARC/AACRII對網(wǎng)上資源進(jìn)行編目;③由自動化系統(tǒng)工作人員將確切的網(wǎng)址和檢索方式添加到856字段中。由于網(wǎng)上信息常常修改、變動,故人們要時(shí)刻關(guān)注856字段相關(guān)內(nèi)容的變化,這并不是一件容易的事。第二十二頁,共五十六頁,2022年,8月28日229.1.2網(wǎng)絡(luò)信息資源的組織方式數(shù)據(jù)庫與超媒體結(jié)合方式數(shù)據(jù)庫技術(shù)與超媒體技術(shù)的結(jié)合,是網(wǎng)絡(luò)信息資源組織與開發(fā)技術(shù)的發(fā)展趨勢兩者的結(jié)合途徑從當(dāng)前來看,通常是將數(shù)據(jù)庫作為超媒體系統(tǒng)的一個(gè)節(jié)點(diǎn)來進(jìn)行處理。在這種方式中,數(shù)據(jù)庫看成超媒體系統(tǒng)中一個(gè)獨(dú)立的特殊節(jié)點(diǎn),由特殊的鏈接將數(shù)據(jù)庫節(jié)點(diǎn)和其他的超媒體節(jié)點(diǎn)相連。其具體實(shí)現(xiàn)方法有:CGI(CommonGatewayInter-face)方法WebAPI(ApplicationProgramInterface)方式ActiveX技術(shù)

JDBC(JavaDatabaseConnectivity)技術(shù)第二十三頁,共五十六頁,2022年,8月28日239.1.2網(wǎng)絡(luò)信息資源的組織方式從網(wǎng)絡(luò)信息組織對象的范圍看,網(wǎng)絡(luò)信息組織的模式可以劃分為4個(gè)層次:

第一個(gè)層次為微觀的組織模式第二個(gè)層次為中觀的組織模式,第三個(gè)層次為宏觀的組織模式,第四個(gè)層次為對網(wǎng)絡(luò)信息進(jìn)行分布式組織的數(shù)字圖書館,其組織的資源己經(jīng)遠(yuǎn)遠(yuǎn)超出網(wǎng)上信息的范圍。第二十四頁,共五十六頁,2022年,8月28日249.1.3網(wǎng)絡(luò)信息資源組織的三個(gè)層次語法信息、語義信息和語用信息分別對應(yīng)著信息的形式、內(nèi)容和效用三個(gè)層次,與此相關(guān),語法信息組織、語義信息組織和語用信息組織也就形成了網(wǎng)絡(luò)信息組織方法的三個(gè)層次。語法信息組織是以信息的形式特征為依據(jù)序化信息的方法。語義信息組織是以信息的內(nèi)容或本質(zhì)特征為依據(jù)序化信息的方法。語用信息的組織是以信息的效用特征為依據(jù)序化信息的方法。第二十五頁,共五十六頁,2022年,8月28日25信息系統(tǒng)資源組織的發(fā)展趨勢理想的網(wǎng)絡(luò)信息組織模式應(yīng)是以用戶為中心,遵循系統(tǒng)性、實(shí)用性、易用性原則,綜合運(yùn)用自然語言和人工語言,充分利用新興技術(shù)和人們經(jīng)驗(yàn)的積累,朝著更符合用戶需要的方向發(fā)展。網(wǎng)絡(luò)信息資源組織模式的發(fā)展呈現(xiàn)在以下幾個(gè)方面。信息描述標(biāo)準(zhǔn)化組織技術(shù)智能化用戶界面可視化組織方法多樣化面向內(nèi)容的信息組織面向?qū)ο蟮男畔⒔M織

組織活動合作化第二十六頁,共五十六頁,2022年,8月28日269.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)超文本標(biāo)記語言(HTML)HTML是一個(gè)簡單的標(biāo)記語言,它主要用來描述Web文檔的結(jié)構(gòu),HTML文檔由兩部分組成:一種是HTML標(biāo)記(tag);另一種是普通文本。第二十七頁,共五十六頁,2022年,8月28日279.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)HTML的弊端主要表現(xiàn)在:難以擴(kuò)展交互性差語義性差是一種表示技術(shù),它包含了關(guān)于如何顯示信息的標(biāo)簽,但是標(biāo)簽和數(shù)據(jù)是結(jié)合在一起的,很難進(jìn)行分割不允許用戶對數(shù)據(jù)進(jìn)行變換以便進(jìn)一步進(jìn)行處理對數(shù)據(jù)只提供了一個(gè)“視圖’,如果你想要得到不同的視圖的話,你必須重新生成一個(gè)HTML網(wǎng)頁;格式既不適合機(jī)器分析也不適合人閱讀它的源碼,而且它的格式要求比較松散,HTML解釋器采用的是盡量解釋的機(jī)制。

第二十八頁,共五十六頁,2022年,8月28日289.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)可擴(kuò)展標(biāo)記語言(XML)XML的組成元素

模式(Schema)可擴(kuò)展樣式語言(XSL,ExtensiblestylesheetLanguage)可擴(kuò)展鏈接語言(XLL,ExtensibleLinkLanguage)

XML是建立在數(shù)據(jù)由它的創(chuàng)建者和維護(hù)者管理這一信念的基礎(chǔ)上的,對于那些準(zhǔn)備提供內(nèi)容的個(gè)人或團(tuán)體將可以從中得到最好的數(shù)據(jù)格式服務(wù)。因此,它被認(rèn)為是“21世紀(jì)Web領(lǐng)域的世界語”。第二十九頁,共五十六頁,2022年,8月28日299.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)XML的出現(xiàn)大大彌補(bǔ)了HTML和SGML的局限性,主要表現(xiàn)在:

XML可以用于本地計(jì)算的數(shù)據(jù)XML可以為用戶提供正確的結(jié)構(gòu)化數(shù)據(jù)視圖XML允許集成不同來源的結(jié)構(gòu)化數(shù)據(jù)XML描述來自多種應(yīng)用程序的數(shù)據(jù)XML通過粒度更新來提高性能

XML的特點(diǎn)

跨平臺性自描述性靈活性

第三十頁,共五十六頁,2022年,8月28日309.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)XML的優(yōu)勢

設(shè)計(jì)與特定領(lǐng)域有關(guān)的標(biāo)記語言異質(zhì)系統(tǒng)間的通信開發(fā)靈活的Web應(yīng)用軟件在Web上發(fā)布數(shù)據(jù)更有意義和更準(zhǔn)確的搜索提供多語種支持第三十一頁,共五十六頁,2022年,8月28日319.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)元數(shù)據(jù)(Metadata)

元數(shù)據(jù)的概念:元數(shù)據(jù)即英文的Metadata。是關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)。IFLA將Metadata定義為:“描述數(shù)據(jù)的數(shù)據(jù),可用來協(xié)助對網(wǎng)絡(luò)電子資源的辨識、描述、指示其位置的任何數(shù)據(jù)”。目前出現(xiàn)了很多種元數(shù)據(jù)規(guī)范,還有許許多多應(yīng)用于各個(gè)專業(yè)領(lǐng)域的Metadata標(biāo)準(zhǔn)。在眾多的元數(shù)據(jù)標(biāo)準(zhǔn)中,都柏林核心元數(shù)據(jù)已成為國際上最通用的元數(shù)據(jù),也是萬維網(wǎng)聯(lián)盟(W3C)推薦的元數(shù)據(jù)標(biāo)準(zhǔn)口。第三十二頁,共五十六頁,2022年,8月28日329.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)元數(shù)據(jù)在網(wǎng)絡(luò)信息資源整合方面的作用有:描述(Description)定位(Location)發(fā)現(xiàn)(Discovery)評估(Evaluation)選擇(Selection)從系統(tǒng)的角度審視元數(shù)據(jù),元數(shù)據(jù)的功能還包括提供瀏覽及檢索的功能、管理功能以及組合各個(gè)對象以及藏品的再呈現(xiàn)等。第三十三頁,共五十六頁,2022年,8月28日339.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)資源描述框架(RDF)

資源描述框架ResourceDescriptionFramework,簡稱RDF應(yīng)運(yùn)而生,為多種元數(shù)據(jù)的交互操作性提供平臺。資源描述框架使用XML作為交換和加工元數(shù)據(jù)的通用語法。RDF是由W3C組織開發(fā)的一種元數(shù)據(jù)格式,它的模型結(jié)構(gòu)包括資源(Resources)、屬性(Properties)和聲明(statement)三種對象,采用“資源一屬性一屬性值”的“主謂賓”結(jié)構(gòu)(或稱三元組),提供一種框架容器,并通過XML定義了一套形式化的方法,為機(jī)器語義理解的結(jié)構(gòu)基礎(chǔ)。第三十四頁,共五十六頁,2022年,8月28日349.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)目前RDF應(yīng)用于:資源發(fā)現(xiàn),以使搜索引擎功能更強(qiáng)定位(Location)智能軟件,實(shí)現(xiàn)知識的共享與互換描述站點(diǎn)及其相關(guān)的內(nèi)容,即站點(diǎn)編目等RDF有兩個(gè)重要特點(diǎn):獨(dú)立性,它可以嵌入DC元數(shù)據(jù),也可以嵌入別的類型的元數(shù)據(jù)。使用XML作為其描述語法,xML摒棄了SGML過于復(fù)雜及不利于在Web上傳送的選項(xiàng)功能,又彌補(bǔ)了HTML過于簡單的不足,是目前最具發(fā)展前景的標(biāo)記語言。第三十五頁,共五十六頁,2022年,8月28日359.2網(wǎng)絡(luò)信息資源管理的相關(guān)技術(shù)本體(Ontology)Studer等認(rèn)為ontology是共享概念模型的明確的形式化規(guī)范說明。這包含4層含義:概念模型(conceptualization)明確(explicit)形式化(formal)共享(share)Ontology的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯間相互關(guān)系的明確定義。第三十六頁,共五十六頁,2022年,8月28日369.3.1網(wǎng)絡(luò)信息資源的檢索網(wǎng)絡(luò)信息檢索自身的特點(diǎn)主要表現(xiàn)在:必須借助網(wǎng)絡(luò)檢索工具?;诔谋窘Y(jié)構(gòu)。檢索方法的多樣性。多媒體檢索。第三十七頁,共五十六頁,2022年,8月28日379.3.1網(wǎng)絡(luò)信息資源的檢索網(wǎng)絡(luò)信息檢索的一般步驟有七個(gè)主要過程:明確檢索需求。確定檢索范圍。確定有效的檢索詞。構(gòu)造合適的檢索表達(dá)式。選擇合適的檢索工具。正式檢索。評價(jià)檢索結(jié)果。第三十八頁,共五十六頁,2022年,8月28日389.3.1網(wǎng)絡(luò)信息資源的檢索網(wǎng)絡(luò)信息資源的一般查詢方法有:基于超文本的信息檢索基于目錄的信息檢索基于搜索引擎的信息檢索第三十九頁,共五十六頁,2022年,8月28日399.3.1網(wǎng)絡(luò)信息資源的檢索影響網(wǎng)絡(luò)信息檢索的因素:信息資源質(zhì)量檢索軟件用戶水平等第四十頁,共五十六頁,2022年,8月28日409.3.1網(wǎng)絡(luò)信息資源的檢索信息資源質(zhì)量對信息檢索的影響:信息資源收集不完整、不系統(tǒng)、不科學(xué),導(dǎo)致信息檢索必須多次進(jìn)行,造成人力、物力和時(shí)間上的浪費(fèi)。信息資源加工處理不規(guī)范、不標(biāo)準(zhǔn)、使信息檢索的查全率、查準(zhǔn)率下降。信息資源分散、無序、更換、消亡無法預(yù)測,因此用戶無法判斷網(wǎng)上有多少信息同自己需求有關(guān),檢索評價(jià)標(biāo)準(zhǔn)無法確定。第四十一頁,共五十六頁,2022年,8月28日419.3.1網(wǎng)絡(luò)信息資源的檢索信息資源由于版權(quán)和知識產(chǎn)權(quán)問題,也給信息檢索帶來麻煩。信息的語言障礙問題。第四十二頁,共五十六頁,2022年,8月28日429.3.1網(wǎng)絡(luò)信息資源的檢索檢索軟件對信息檢索的影響:互聯(lián)網(wǎng)上的信息存放地址轉(zhuǎn)換和更名頻繁,根據(jù)檢索工具檢索的結(jié)果并不一定就能獲得相應(yīng)的內(nèi)容。基于一個(gè)較廣定義的檢索項(xiàng),往往會獲得數(shù)以千萬計(jì)的檢索結(jié)果,而使用戶難于選擇真正所需的信息。每種檢索工具雖然僅收集各自范圍內(nèi)的信息資源,但也難免使各種檢索工具的信息資源出現(xiàn)交叉重復(fù)現(xiàn)象。第四十三頁,共五十六頁,2022年,8月28日439.3.1網(wǎng)絡(luò)信息資源的檢索用戶水平對信息檢索的影響:用戶對信息檢索需求的理解和檢索策略的制定關(guān)系到信息檢索的質(zhì)量。用戶的計(jì)算機(jī)操作能力及網(wǎng)絡(luò)相關(guān)知識的掌握程度影響著信息檢索的效率。用戶對網(wǎng)絡(luò)信息檢索工具的應(yīng)用熟練程度影響著信息檢索的效果。用戶的外語水平影響著信息檢索的廣度與深度。第四十四頁,共五十六頁,2022年,8月28日449.3.2網(wǎng)絡(luò)檢索工具搜索引擎是一種信息搜索的軟件。狹義理解,它是利用網(wǎng)絡(luò)自動搜索技術(shù)(Robot)對網(wǎng)絡(luò)資源進(jìn)行搜集、標(biāo)引、儲存和檢索的一種技術(shù)和系統(tǒng)。廣義上,搜索引擎可以看作是提供搜索和分類導(dǎo)航信息查詢服務(wù)的一系列網(wǎng)站。第四十五頁,共五十六頁,2022年,8月28日459.3.2網(wǎng)絡(luò)檢索工具搜索引擎的類型(按檢索機(jī)制劃分):檢索型搜索引擎:以信息查詢、檢索為主目錄型搜索引擎:以分類目錄導(dǎo)航為主混合型搜索引擎:分類目錄和關(guān)鍵詞檢索并重評價(jià)搜索引擎的優(yōu)劣查詢時(shí)間短、命中率高、重復(fù)率低第四十六頁,共五十六頁,2022年,8月28日469.3.2網(wǎng)絡(luò)檢索工具網(wǎng)絡(luò)信息檢索工具的核心是其檢索功能。從現(xiàn)有的檢索工具來看,它們都已具備諸如布爾檢索、截詞檢索和鄰近檢索這些基本檢索功能。第四十七頁,共五十六頁,2022年,8月28日479.3.2網(wǎng)絡(luò)檢索工具布爾檢索指通過標(biāo)準(zhǔn)的布爾邏輯關(guān)系詞來表達(dá)檢索詞與檢索詞間邏輯關(guān)系的檢索方法。截詞檢索指在檢索式中用專門符號(截詞符號)表示檢索詞的某一部分允許有一定的詞形變化,因此檢索詞的不變部分加上由截詞符號所代表的任何變化形式所構(gòu)成的詞匯都是合法檢索詞,結(jié)果中只要包含其中任意一個(gè)就滿足檢索要求。

第四十八頁,共五十六頁,2022年,8月28日489.3.2網(wǎng)絡(luò)檢索工具鄰近檢索(proximitysearch):通過檢索式中的專門符號來規(guī)定檢索詞在結(jié)果中的相對位置。準(zhǔn)字段檢索:雖然網(wǎng)絡(luò)信息實(shí)際上不分字段,但是以萬維網(wǎng)為用戶界面的網(wǎng)絡(luò)信息檢索工具設(shè)計(jì)了類似于字段檢索的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論