計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來的計算機課件_第1頁
計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來的計算機課件_第2頁
計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來的計算機課件_第3頁
計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來的計算機課件_第4頁
計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來的計算機課件_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來的。計算機檢索經(jīng)歷了脫機檢索、聯(lián)機檢索、光盤檢索及網(wǎng)絡(luò)信息檢索等階段。計算機檢索以其檢索效率高、檢索效果好而在文獻信息檢索中得到了廣泛的使用。重點掌握:計算機檢索的基本原理、數(shù)據(jù)庫的定義、類型和結(jié)構(gòu);計算機檢索的基本步驟與方法。

第七章計算機信息檢索

第一節(jié)計算機檢索概述第二節(jié)計算機檢索原理第三節(jié)計算機檢索技術(shù)第四節(jié)計算機檢索步驟

本章主要內(nèi)容

計算機信息檢索的特點計算機信息檢索的定義計算機信息檢索系統(tǒng)的類型計算機信息檢索系統(tǒng)的構(gòu)成數(shù)據(jù)庫第一節(jié)計算機檢索概述計算機信息檢索的定義

簡稱機檢狹義上是指人們根據(jù)特定的情報需求,利用計算機從相關(guān)的機讀數(shù)據(jù)庫中識別并獲取所需情報信息的過程。廣義上包括信息存儲和信息檢索兩個方面,即數(shù)據(jù)庫的建立與利用兩個方面。

項目手檢 機檢

總體特征 手翻、眼看、大腦判斷策略、查尋、機器匹配

標(biāo)引及索引特點檢索點較少 檢索點較多

檢索時間 較慢較快

檢索要求 專業(yè)知識、外語知識、專業(yè)知識、外語知識、機檢

檢索工具知識系統(tǒng)知識

查全查準(zhǔn)率 查準(zhǔn)率較高 查全率較高

綜合效率 較低 較高

手檢與機檢的比較文獻信息檢索經(jīng)歷了手工檢索、機械檢索、計算機檢索三個階段。計算機用于信息檢索的研究始于20世紀(jì)50年代初。從50年代開始,美國最先使用計算機進行信息檢索并解決了信息存貯和檢索速度等問題。60年代中期,計算機檢索逐步實用化,利用單臺計算機回溯檢索和新文獻的定題檢索,提供脫機檢索服務(wù)。70年代初,計算機檢索進入聯(lián)機檢索階段。80年代以后,計算機檢索進入國際聯(lián)機信息檢索階段。80年代末、90年代初,計算機檢索發(fā)展成計算機網(wǎng)絡(luò)信息檢索。同時,光盤誕生了進入光盤檢索階段。90年后,進入網(wǎng)絡(luò)檢索階段計算機信息檢索系統(tǒng)的類型數(shù)據(jù)庫類型(按內(nèi)容分型)書目數(shù)據(jù)庫(如圖書館書目數(shù)據(jù)庫)數(shù)值數(shù)據(jù)庫(如人口統(tǒng)計數(shù)據(jù)庫)事實數(shù)據(jù)庫(科研機構(gòu)數(shù)據(jù)庫)全文數(shù)據(jù)庫中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊全文數(shù)據(jù)庫等軟件數(shù)據(jù)庫書目型數(shù)據(jù)庫(BibliographicDatabase)

如:國外三大農(nóng)業(yè)數(shù)據(jù)庫、館藏書目數(shù)據(jù)庫全文型數(shù)據(jù)庫(FullTextDatabase)

如:中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊全文數(shù)據(jù)庫等。

數(shù)值型數(shù)據(jù)庫(NumericDatabase)

存貯有科學(xué)數(shù)據(jù),統(tǒng)計資料等數(shù)據(jù)。

事實型數(shù)據(jù)庫(FactDatabase)

存貯有企業(yè)名錄、百科全書、人名錄等有利用價值的信息。

超文本型數(shù)據(jù)庫(HypertextDatabase)數(shù)據(jù)庫

數(shù)據(jù)庫的定義美國著名信息檢索專家Martha,E.Williams給數(shù)據(jù)庫的定義是“包含書目及與文獻有關(guān)的數(shù)據(jù)的機讀記錄的有組織的集合。”按內(nèi)容性質(zhì)分:字段(Field)、記錄(Record)和文檔(File)數(shù)據(jù)庫的結(jié)構(gòu)計算機信息檢索是利用計算機對信息進行存儲與檢索的過程,即數(shù)據(jù)庫的建立與利用。示意圖數(shù)據(jù)庫的建立:按照既定的建庫方針、目的、標(biāo)準(zhǔn)等從信息源中選擇所需文獻,對需錄入的文獻進行加工,也就是對文獻的外表特征和內(nèi)容特征進行分析和標(biāo)引,形成文獻特征的標(biāo)識,把這些標(biāo)識輸入計算機,計算機再按事先設(shè)計好的規(guī)則自動把這些標(biāo)識排序形成多種索引,建成數(shù)據(jù)庫,為信息檢索提供有規(guī)可循的檢索途徑。數(shù)據(jù)庫的利用:計算機信息存儲的逆過程。將課題的主題概念按系統(tǒng)詞表進行規(guī)范化處理,轉(zhuǎn)換成系統(tǒng)語言,形成檢索提問特征標(biāo)識,根據(jù)需要使用布爾邏輯運算符制定檢索策略,將檢索提問式輸入計算機,在數(shù)據(jù)庫中查找所需信息。第二節(jié)計算機檢索的基本原理打開數(shù)據(jù)庫輸入檢索提問(檢索式)在索引詞典文檔中比較和匹配從記錄號倒排文檔中調(diào)取記錄號集合記錄號集合間的邏輯運算順排文檔中調(diào)取記錄輸出命中記錄結(jié)束檢索記錄內(nèi)容不合要求重新調(diào)整檢索策略篇數(shù)不合要求結(jié)果不匹配重新輸入檢索標(biāo)識另選數(shù)據(jù)庫計算機文獻信息數(shù)據(jù)庫的檢索原理示意圖第三節(jié)計算機檢索技術(shù)

1、布爾邏輯檢索功能2、詞間位置檢索功能3、截詞檢索功能4、字段限定檢索功能主要是三種簡例:邏輯運算AND計算機在圖書館中的應(yīng)用計算機圖書館簡例:邏輯運算OR微量元素與克山病的關(guān)系A(chǔ)CBAorBorC詞間位置檢索功能文獻記錄中詞語的相對次序不同,所表達(dá)的意思就可能不同。同樣在檢索式中,檢索詞的相對次序不同,表達(dá)的檢索意圖也不一樣,布爾邏輯運算符有時難以表達(dá)某些檢索課題的確切提問要求,用詞間位置算符來限定和組配檢索詞,可彌補布爾邏輯算符只是定性規(guī)定檢索詞的范圍,而沒有限定檢索詞位置關(guān)系,易造成誤檢的不足。

詞間位置檢索技術(shù)就是利用一些特定的位置算符來表達(dá)檢索詞之間的位置關(guān)系,并且可以不用敘詞表而直接使用自由詞進行檢索的方法。有的書上還把這種檢索稱為原文檢索。這種檢索在利用TI和AB途徑檢索時,對檢索質(zhì)量影響很大。

例:檢索“小麥中氨基酸的測定”(determinationofaminoacidsinwheat)檢索式:determinationwithaminoacidswithwheat

詞間位置算符在不同系統(tǒng)中的使用方法不同:L在Dialog系統(tǒng)中主要位置算符及其使用方法L在SPIRS系統(tǒng)中,位置算符只使用兩個:

with、near那么,位置算符的應(yīng)用,能縮小檢索范圍提高查準(zhǔn)率。

截詞檢索功能

截詞運算符號有兩個:“?、*”

L其在不同系統(tǒng)中表示的含義不同。見書111L在SPIRS系統(tǒng)中?為有限截斷、*為無限截斷;L在中刊庫中只有?表示無限截斷。例:1、teen*teen,teens,teenage,teenager等。2、teen???Teen,teens,teenage在詞尾加?號,以?號的個數(shù)表示詞后最多可跟字母的個數(shù)

字段限定檢索功能

將檢索詞限定在某一字段中,檢索時,計算機只對限定字段進行運算,以提高檢索效果。常用的檢索符號有:

in、=、<、>、≤、≥例:Englishinla;py≥1992

總結(jié):在一個復(fù)雜的檢索式中,不僅可以有多個運算符,也可以使用括號來指定運算的優(yōu)先順序、以及體現(xiàn)概念的完整性。

例3:查“玉米方面的英文”文獻

(maizeorzea-maysorcorn)indeand(Englishinla)

l

所以,計算機檢索就是使用這些檢索技術(shù)來實現(xiàn)文獻情報的有無、多少、異同的比較,以達(dá)到檢索的目的,在結(jié)合使用這些方法的時,一定要注意,每一個概念表達(dá)的完整性,注重括號的使用。

分析課題確定主題概念選擇檢索方式和數(shù)據(jù)庫確定檢索途徑

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論