第2章 網(wǎng)絡(luò)信息資源檢索工具_(dá)第1頁
第2章 網(wǎng)絡(luò)信息資源檢索工具_(dá)第2頁
第2章 網(wǎng)絡(luò)信息資源檢索工具_(dá)第3頁
第2章 網(wǎng)絡(luò)信息資源檢索工具_(dá)第4頁
第2章 網(wǎng)絡(luò)信息資源檢索工具_(dá)第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第2章網(wǎng)絡(luò)信息資源檢索工具

學(xué)習(xí)目標(biāo):通過本章的學(xué)習(xí)可以掌握以下問題:(1)了解網(wǎng)絡(luò)信息檢索工具的基本概念;(2)掌握搜索引擎的基本概念、組成、工作原理及分類;(3)了解常用搜索引擎的應(yīng)用;(4)了解圖書館館藏目錄信息概念;(5)了解館藏聯(lián)合目錄信息的概念。

2.1網(wǎng)絡(luò)信息檢索工具

網(wǎng)絡(luò)信息檢索工具由自動索引程序、數(shù)據(jù)庫和檢索代理軟件組成的。自動索引程序?qū)⒉杉蜆?biāo)引的信息匯集成數(shù)據(jù)庫,作為該網(wǎng)絡(luò)檢索工具提供檢索服務(wù)的基礎(chǔ)。數(shù)據(jù)庫的內(nèi)容一般有網(wǎng)站的名稱、標(biāo)題、網(wǎng)址URL、網(wǎng)頁的長度、網(wǎng)頁的時(shí)間、相關(guān)的超文本鏈接點(diǎn)、內(nèi)容簡介或摘要等。檢索軟件可根據(jù)檢索機(jī)制構(gòu)造的檢索提問式來進(jìn)行分析、判斷形成檢索策略檢索。網(wǎng)絡(luò)信息檢索工具的類型主要有:目錄型檢索工具、網(wǎng)絡(luò)資源指南、搜索引擎2.1.1目錄型檢索工具概念:目錄型檢索工具由人工編制和維護(hù),因此在信息的收集、編排、HTML編碼以及信息注解等方面要花費(fèi)大量的人力和時(shí)間。優(yōu)點(diǎn):人工干預(yù)提高了主題指南返回結(jié)果的相關(guān)性缺點(diǎn):跟不上網(wǎng)絡(luò)信息的發(fā)展;數(shù)據(jù)庫的規(guī)模相對較小;檢索到的信息數(shù)量有限;新穎性不夠2.1.2網(wǎng)絡(luò)資源指南概念:是由人工采集網(wǎng)上信息,然后按照一定分類標(biāo)準(zhǔn),比如學(xué)科類型、主題等,建立網(wǎng)站分類目錄,并將篩選后的信息分門別類放入各類目中供用戶進(jìn)行瀏覽。優(yōu)點(diǎn):專題性較強(qiáng);于檢索不熟悉的領(lǐng)域或建議不熟悉網(wǎng)絡(luò)的用戶使用。缺點(diǎn):人工采集信息的收錄范圍小,更新慢;受主觀因素影響,類目設(shè)置不夠科學(xué),缺少規(guī)范。網(wǎng)絡(luò)資源指南目前主要有三種類型。一是學(xué)科信息門戶二是搜索引擎目錄三是開放目錄我們會在什么情況下使用網(wǎng)絡(luò)資源指南呢?當(dāng)檢索一個(gè)范圍較廣的題目,并希望了解與該題目相關(guān)的信息時(shí)。當(dāng)沒有明確的信息需求,僅僅想在網(wǎng)絡(luò)上“溜達(dá)”時(shí)。僅僅想瀏覽某一方面的消息和動態(tài)信息時(shí),并不嚴(yán)格限于某幾個(gè)檢索詞的。當(dāng)信息需求更專一時(shí)。2.2搜索引擎2.2.1搜索引擎(SearchEngine)是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序從互聯(lián)網(wǎng)上搜集信息,在對信息進(jìn)行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。2.2.2搜索引擎工作的基本原理(1)爬蟲程序深度優(yōu)先搜索策略

寬度優(yōu)先搜索策略(2)自動索引倒排索引是一種常用的索引技術(shù),是實(shí)現(xiàn)詞匯-網(wǎng)頁矩陣的一種具體的存儲方式。倒排索引通常由詞典和倒排文件兩部分組成。通過倒排索引,搜索引擎可以根據(jù)用戶輸入的關(guān)鍵詞快速查找包含關(guān)鍵詞的網(wǎng)頁集合。(3)檢索程序檢索程序是搜索引擎中直接面向用戶的重要組成部分,這部分很大程度上決定了搜索引擎的質(zhì)量好壞及用戶滿意度。常用的檢索模型有布爾模型、向量空間模型、概率統(tǒng)計(jì)模型、語言模型和機(jī)器學(xué)習(xí)模型。

2.2.3搜索引擎分類

(1)通用搜索引擎通用搜索引擎即通常人們所稱的搜索引擎,如谷歌、百度和Bing都屬于通用搜索引擎。這類搜索引擎追求大而廣,也是目前發(fā)展最好的一類。(2)垂直搜索引擎垂直搜索引擎是針對某一個(gè)行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對網(wǎng)頁庫中的某類專門的信息進(jìn)行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶,也可以說是專業(yè)或?qū)S盟阉饕?,它專門用來檢索某一主題范圍或某一類型信息。(3)元搜索引擎元搜索引擎稱為集合式搜索引擎、索引式搜索引擎,它將多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面,是為彌補(bǔ)搜索引擎費(fèi)事費(fèi)力之不足而出現(xiàn)的輔助檢索工具。(4)目錄搜索引擎目錄搜索引擎是以人工方式或半自動方式搜集網(wǎng)站信息,通過人工審核信息,人工編寫信息摘要,并將篩選后的信息置于事先確定的分類框架中的一種搜索引擎。(5)智能搜索引擎智能搜索引擎是結(jié)合了人工智能技術(shù)的新一代搜索引擎。由于它將信息檢索從目前基于關(guān)鍵詞層面提高到基于知識(或概念)層面,對知識有一定的理解與處理能力,能夠?qū)崿F(xiàn)分詞技術(shù)、同義詞技術(shù)、概念搜索、短語識別以及機(jī)器翻譯技術(shù)等。與傳統(tǒng)搜索引擎相比智能搜索引擎的特點(diǎn)主要有:(1)更高的搜索易用性(2)查準(zhǔn)率明顯提高(3)搜索范圍定位合適(4)搜索過程交互智能(5)搜索結(jié)果綜合性強(qiáng)

2.2.5常用搜索引擎

Google搜索引擎(Google學(xué)術(shù))Yandex搜索引擎百度搜索引擎Bing搜索引擎

2.3館藏信息檢索工具

2.3.1圖書館館藏目錄信息(1)圖書館館藏圖書館館藏是指圖書館收集的各種類型文獻(xiàn)資料的總和,簡稱館藏或藏書。(2)館藏目錄館藏目錄指的是圖書館各種類型文獻(xiàn)資料的一個(gè)總目,就是把這些文獻(xiàn)資料的基本信息列出來做成一個(gè)可以用來檢索文獻(xiàn)信息的系統(tǒng),為了文獻(xiàn)共建共享的方便,圖書館館藏目錄一般是聯(lián)合編目,有一個(gè)全國的標(biāo)準(zhǔn),從而規(guī)范全國圖書館的編目工作。

2.3.2國家圖書館

2.3.3中科院國家圖書館

2.4館藏聯(lián)合目錄信息2.4.1聯(lián)合目錄信息(1)聯(lián)合目錄概念聯(lián)合目錄是以綜合性或?qū)n}性的形式,揭示若干檔案館的全都或部分館藏的一種大型檢索工具。它是通過館際協(xié)作的方式編制而成的。(2)聯(lián)合目錄編制2.4.2中國高等教育文獻(xiàn)保障系統(tǒng)數(shù)據(jù)資源鏈接至CADAL2.4.3國家科技圖書文獻(xiàn)中心

2.4.4中國高校人文社會科學(xué)文獻(xiàn)中心

思考題1、什么是網(wǎng)絡(luò)信息檢索工具,由幾部分組成。2、網(wǎng)絡(luò)檢索工具的主要類型有哪些。3、什么是目錄式檢索工具。4、網(wǎng)絡(luò)資源指南如何理解,主要類型有哪些。5、搜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論