計(jì)算機(jī)信息檢索技術(shù)_第1頁(yè)
計(jì)算機(jī)信息檢索技術(shù)_第2頁(yè)
計(jì)算機(jī)信息檢索技術(shù)_第3頁(yè)
計(jì)算機(jī)信息檢索技術(shù)_第4頁(yè)
計(jì)算機(jī)信息檢索技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩87頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

英文數(shù)據(jù)庫(kù)的松奈與原文的獲取

吳賢奇

?文獻(xiàn)是我們獲取信息的主要來(lái)源.

?信息的來(lái)源:實(shí)踐?人?文獻(xiàn)

?文獻(xiàn):知識(shí)的載體.

?文獻(xiàn):圖書(shū),期刊,報(bào)紙,專利(文獻(xiàn)).標(biāo)準(zhǔn)(文獻(xiàn)).

學(xué)位論文,科技報(bào)告.政府出版物,會(huì)議論文.

檔案,產(chǎn)品資料.

?數(shù)據(jù)庫(kù)是當(dāng)代管理文獻(xiàn)信息,開(kāi)發(fā)文獻(xiàn)信息

的最重要最主要的手段和技術(shù).

數(shù)據(jù)庫(kù)類型:

?1、文摘型數(shù)據(jù)庫(kù):有文摘

?2、題錄型數(shù)據(jù)庫(kù):通常稱之為索引型數(shù)據(jù)庫(kù)。無(wú)文摘c

?3、全文型數(shù)據(jù)庫(kù):摘要(題錄)+全文

?4、數(shù)據(jù)型數(shù)據(jù)庫(kù):數(shù)值、事實(shí)

?5、圖像(多媒體)數(shù)據(jù)庫(kù):圖像(多媒體等)

數(shù)據(jù)庫(kù)知識(shí)

■文摘數(shù)據(jù)庫(kù):

?收集范圍廣:語(yǔ)種多,文獻(xiàn)類型多,地理范圍廣。

?全文數(shù)據(jù)庫(kù):

?收集范圍有限,主要用于某個(gè)單位或某個(gè)主題的

資料存貯。

?文摘數(shù)據(jù)庫(kù)與全文數(shù)據(jù)庫(kù)可實(shí)現(xiàn)無(wú)余逢鏈接。

號(hào)【華南農(nóng)業(yè)大學(xué)圖書(shū)館電子資逮】-InternetExplorer-|glx|

文件(E)編輯(E)查看(9收藏(⑴工具(D幫助(由文摘索引數(shù)據(jù)庫(kù)

IC后退?十一回閶;|搜索收藏夾?|、,

地址(3|<!9/elect/index.htm£輸,\天速手直接搜索二]Q轉(zhuǎn)到鏈接?jì)撸?/p>

上百度搜索]

年月日星期四

2006323922M全文數(shù)據(jù)庫(kù)

首頁(yè)>電子費(fèi);好>

[文黃索引數(shù)據(jù)庫(kù)】[電子期刊數(shù)據(jù)庫(kù)]

介T

Agricola[光盤版][簡(jiǎn)介]AgricolaPlusTextJ

r簡(jiǎn)T

Agris【光盤版][簡(jiǎn)介]BlackwellLJ

r簡(jiǎn)T

BlosisPreviews(BA)[簡(jiǎn)介]CellPress]需出國(guó)帳號(hào)]LJ

r簡(jiǎn)T

CA(化學(xué)文摘)[簡(jiǎn)介]CESJLJ

r簡(jiǎn)1

CABI[光盤版][簡(jiǎn)介]CHSLLJ

tr簡(jiǎn)u

EiVillage(H)[簡(jiǎn)介]DOAJL

r簡(jiǎn)T

LJ

ERIC[簡(jiǎn)介]EBSCO-ASP

r簡(jiǎn)T

EBSCO-BSPLJ

FSTA(食品科技文摘)[光盤版1[簡(jiǎn)介]簡(jiǎn)

rT

ElsevierSDOS國(guó)內(nèi)[國(guó)外]LJ

ISIProceedings[簡(jiǎn)介]簡(jiǎn)

r]

EnvironmentalUniverseL

MathSciNet圖學(xué)評(píng)論網(wǎng)絡(luò)版1[簡(jiǎn)療]簡(jiǎn)

rT

ESAJournalsonlineLJ

PQDDB[簡(jiǎn)介]簡(jiǎn)

rT

LJ

維普新聞?lì)}錄文箍庫(kù)[簡(jiǎn)介]INFORMS

中文社會(huì)科學(xué)引文索引數(shù)據(jù)庫(kù)[簡(jiǎn)介]KluwerOnline

MAlffiY材料學(xué)系列期刊[簡(jiǎn)介]

全國(guó)報(bào)刊索引[簡(jiǎn)介]

NationalLibraryofMedicine

Mature(國(guó)內(nèi))(國(guó)外)

?專業(yè)性數(shù)據(jù)庫(kù):收集某個(gè)學(xué)科文獻(xiàn)資料的數(shù)據(jù)庫(kù)。

?綜合性數(shù)據(jù)庫(kù):收集多個(gè)學(xué)科文獻(xiàn)資料的數(shù)據(jù)庫(kù)。

?我們必須要知道自己的專業(yè)數(shù)據(jù)庫(kù)以及與我們學(xué)

科相關(guān)的其它的專業(yè)性數(shù)據(jù)庫(kù)和綜合性數(shù)據(jù)庫(kù)

(即相關(guān)性數(shù)據(jù)庫(kù))。可從國(guó)內(nèi)外各大學(xué)圖書(shū)館

的網(wǎng)站上獲取相關(guān)信息(資料)?;虻卿?/p>

/support/bluesheets

?三個(gè)主要中文數(shù)據(jù)庫(kù)提供商:

?清華同方(中國(guó)知識(shí)網(wǎng),中國(guó)期刊

網(wǎng)):WWW.CNKI.NET

?重慶維普數(shù)據(jù)有限公

司:WWW.CQVIP.COM

?萬(wàn)方數(shù)據(jù)有限公

司:WWW.WANFANG.COM.CN

?英文數(shù)據(jù)庫(kù)主要提供商:

?國(guó)外數(shù)據(jù)庫(kù)提供商很多,且專業(yè)化較強(qiáng),規(guī)模

大,信息管理水平高(主要體現(xiàn)在字段設(shè)置和

檢索技術(shù)上),數(shù)據(jù)量大,服務(wù)網(wǎng)絡(luò)化,更新快.

?WWW.THOMSOOCOM

?WWWQCLC.COM

?WWW.EL0RG

?WWW.ISINET.COM

?現(xiàn)階段,所有中英文數(shù)據(jù)庫(kù)的檢索

原理與技術(shù)基本上都是一樣的?!

?計(jì)算機(jī)檢索包含兩個(gè)過(guò)程:

先存貯,后檢索

?先存貯:信息管理專業(yè)人員將信息存貯在數(shù)據(jù)庫(kù)中。

即信息組織過(guò)程。

?后檢索:信息用戶利用數(shù)據(jù)庫(kù)進(jìn)行檢索。即信息

檢索過(guò)程。

?存貯過(guò)程:信息組織過(guò)程。

?(1)標(biāo)弓I:將文獻(xiàn)的各種信息(對(duì)檢索有用的信息,通常

稱之為特征信息)用自然語(yǔ)言的字、詞、句子、符號(hào)等按一定的

規(guī)則描述出來(lái)。

?文獻(xiàn)的特征信息:題名、作者、出版社、出版日期、頁(yè)數(shù)、

字?jǐn)?shù)、分類號(hào)、主題詞、關(guān)鍵詞等等

?標(biāo)引存在翻譯上的問(wèn)題。

?(2)設(shè)計(jì)字段:一個(gè)字段對(duì)應(yīng)文獻(xiàn)的一個(gè)特征信息。

?(3)將相應(yīng)的信息標(biāo)識(shí)輸入數(shù)據(jù)庫(kù)的相應(yīng)字段

中。

?存貯過(guò)程就是一個(gè)建庫(kù)過(guò)程。建庫(kù)有人工和自動(dòng)

兩種方式。

計(jì)算機(jī)信息組織過(guò)程

-一

段TIAUPBPYPDSBSSABLA

字段書(shū)名作者出版社出版年出版地主題詞分類文摘原文

名稱號(hào)語(yǔ)種

國(guó)

記錄三人民出2002北京中國(guó)古代I22三國(guó)演義chi

義羅貝

1中版社小說(shuō)是.??

記毛澤張三北京大2003北京毛澤東、G25毛澤東chi

錄2東屆

學(xué)出版政治人物是

錄3■■■■■■■■■■■■■■■■■■■■■■■■■■■

?數(shù)據(jù)庫(kù)的字段及其含義:

-字段名稱:

?字段含義:

-字段符:

?字段內(nèi)容的標(biāo)弓1(書(shū)寫)規(guī)則:

?對(duì)每一個(gè)數(shù)據(jù)庫(kù),我們要知道它的字段及字段的

含義以及字段符。

?一般英文數(shù)據(jù)庫(kù)在Help中有說(shuō)明。如無(wú),可查相

關(guān)文獻(xiàn)資料?;蛏?/p>

www.dialog,com/support/bluesheets

?數(shù)據(jù)庫(kù)的建庫(kù)語(yǔ)種:

?數(shù)據(jù)庫(kù)是用何種自然語(yǔ)言建庫(kù)的。

?數(shù)據(jù)庫(kù)檢索界面的語(yǔ)種是可變的。但數(shù)據(jù)

庫(kù)的建庫(kù)語(yǔ)種是不可變的。

計(jì)算機(jī)檢索原理

?計(jì)算機(jī)檢索過(guò)程:詞形匹配

?這是我們永遠(yuǎn)、時(shí)刻要記住的。

?實(shí)質(zhì)上,檢索的過(guò)程就是一個(gè)如何保

證檢索詞(或符號(hào)、句子)與數(shù)據(jù)庫(kù)

相應(yīng)字段中的詞(或符號(hào)、句子)保

持一致。

字形相同:檢索詞要

計(jì)算機(jī)描與數(shù)據(jù)庫(kù)的標(biāo)識(shí)詞一

致,或包含在句子中

標(biāo)

識(shí)

數(shù)

據(jù)

內(nèi)

庫(kù)

計(jì)算機(jī)檢索原理

?檢索內(nèi)容能用幾個(gè)關(guān)鍵詞來(lái)表達(dá)嗎?

數(shù)據(jù)庫(kù)與檢索系統(tǒng)

?數(shù)據(jù)庫(kù)與檢索系統(tǒng)是兩個(gè)不同的概念。

?數(shù)據(jù)庫(kù)是信息的集體體,是一種信息管理的方式。

?檢索系統(tǒng)是個(gè)軟件。檢索系統(tǒng)主要用于檢索數(shù)據(jù)

庫(kù)。

?一個(gè)檢索系統(tǒng)可以容納上百個(gè)數(shù)據(jù)庫(kù),可同時(shí)對(duì)

上百個(gè)數(shù)據(jù)庫(kù)進(jìn)行檢索。

?一個(gè)數(shù)據(jù)庫(kù)可依存于不同的檢索系統(tǒng)。

?檢索系統(tǒng):

?單機(jī)檢索系統(tǒng):通常說(shuō)的單機(jī)數(shù)據(jù)庫(kù)。

?聯(lián)機(jī)檢索系統(tǒng):通常說(shuō)的聯(lián)機(jī)數(shù)據(jù)庫(kù)。

?網(wǎng)絡(luò)檢索系統(tǒng):通常說(shuō)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)。通過(guò)

在網(wǎng)站中嵌入檢索系統(tǒng)對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索。

?網(wǎng)絡(luò)檢索系統(tǒng)也可以說(shuō)是聯(lián)機(jī)檢索系統(tǒng)的

一種。在現(xiàn)代是最常見(jiàn)的。

?現(xiàn)在說(shuō)的聯(lián)機(jī)檢索系統(tǒng)一般指使用專門的軟件實(shí)

現(xiàn)本地機(jī)與服務(wù)器連接的檢索系統(tǒng)。

?檢索系統(tǒng)按載體形式來(lái)分有:

?光盤檢索系統(tǒng):通常說(shuō)的光盤數(shù)據(jù)庫(kù)。

?非光盤檢索系統(tǒng):一般指的是存在于硬盤等

載體的檢索系統(tǒng),也是現(xiàn)代最常用的。

?光盤檢索系統(tǒng)有單機(jī)形式和聯(lián)機(jī)形式兩種。一般

說(shuō)的單機(jī)檢索系統(tǒng)就是指光盤單機(jī)檢索系統(tǒng)。

?光盤聯(lián)機(jī)檢索系統(tǒng):有專門的光盤服務(wù)器。

檢索方式

?檢索系統(tǒng)一般提供了三種檢索方式三種:

?裁次札超媒體檢索

,萊單式檢索

?命令式傳息檢索

■,什么要提偌三種給我們,都需要我們省握嗎7

超文本式、超媒體檢索

?在分類的基礎(chǔ)上,通過(guò)文字或多媒體與相

關(guān)知識(shí)產(chǎn)生鏈接,從而達(dá)到檢索目的的檢

索方式。

?操作非常簡(jiǎn)單,人們只需學(xué)會(huì)使用鼠標(biāo)和

認(rèn)識(shí)漢字即可使用。

?主要用于瀏覽某類文獻(xiàn)。

?但是檢索結(jié)果不夠精確。查精率不高。

?一般檢索系統(tǒng)都提供了這種檢索

菜單式檢索

?是一種操作方便,界面友好操作簡(jiǎn)便的檢

索方式。

?用戶只需輸入檢索詞,根據(jù)菜單的指引,

通過(guò)確定適當(dāng)?shù)倪x項(xiàng)和功能筵便能完成檢

索。

?菜單式檢索是現(xiàn)階段最受歡迎的檢索方式。

命令式檢索一一專業(yè)檢索方式

?需要輸入檢索式來(lái)進(jìn)行檢索。

?甚至還需要輸入一些操作命令(即系統(tǒng)不可能功

能按鈕)。

?命令式檢索的優(yōu)勢(shì):

?檢索式更能清晰地表達(dá)復(fù)雜的檢索內(nèi)容和要求。

?檢索過(guò)程明了,便與檢索者判斷檢索是否滿意O

有利于掌握檢索過(guò)程。

?對(duì)于進(jìn)行課題研究的文獻(xiàn)檢索,需要使用命令式

檢索方式。

些大型的檢索系統(tǒng)都使用命令檢索方式

計(jì)算機(jī)信息檢索技術(shù)

?在計(jì)算機(jī)檢索中,常用的檢索技術(shù)有:

?1、布爾邏輯檢索:

?2、字段限定檢索

?3、位置限定檢索

?4、啜吧艮定檢索:一般用于題名、文摘

全文等字段。

計(jì)算機(jī)信息檢索技術(shù)

?5、截詞檢索:

?6、詞表檢索:

?7、二次檢索:

?8、全文檢索:

布爾邏輯檢索

?當(dāng)需要用于多個(gè)檢索詞來(lái)表達(dá)檢索內(nèi)容時(shí),我們

需要處理這些檢索詞的邏輯關(guān)系。

?對(duì)檢索詞進(jìn)行布爾邏輯運(yùn)算

?布爾邏輯運(yùn)算共有三種:

?邏輯與:AND*

?邏輯或:OR+

?邏輯非:NOT-

?AND、OR、NOT、*、+、稱之為邏輯算符

布爾邏輯檢索

?邏輯與:

?AND—英文系統(tǒng)

?*—中文系統(tǒng)

?若AANDB:即表示被檢索的文獻(xiàn)記錄中必須

同時(shí)含有A和B才算命中,AND兩側(cè)的檢索詞必須同

時(shí)出現(xiàn)在同一篇文獻(xiàn)記錄中,該篇文獻(xiàn)才算命中。

?用于交叉要領(lǐng)和限定關(guān)系的組配,它可以縮少檢

索范圍,準(zhǔn)確表達(dá)檢索需求,有利于提高查準(zhǔn)率。

布爾邏輯檢索

?邏輯或:

?OR—英文系統(tǒng)

?+—中文系統(tǒng)

?若AorB,則表示在一篇文獻(xiàn)記錄中只

要含有A或者B中的任何一個(gè)即算命中。

?用于并列關(guān)系的組配,可以擴(kuò)大檢索范圍,防止

漏檢,有利于提高查全率。

布爾邏輯檢索

?邏輯非:

?NOT--英文系統(tǒng)

?---中文系統(tǒng)

?若ANOTB,則表示文獻(xiàn)記錄中包含A而不

包含B。

?這種組配用于從原來(lái)的檢索范圍中排除不需要的

和影響檢索結(jié)果的概念,使檢索結(jié)果更精確。

?如;查找有關(guān)能源方面的文獻(xiàn),但不包含包括核能。

A(ENERGY)——78230ENERGY

B(NUCLEAR)--14778NUCLEAR

AnotB--------------63452ENERGYnotEUCLEAR

布爾邏輯檢索

?三者運(yùn)算的優(yōu)先級(jí)一般如下:

?邏輯非>邏輯與>邏輯或

?在不同的系統(tǒng)中,三者的運(yùn)算優(yōu)先級(jí)可能不同。

布爾邏輯檢索

?邏輯運(yùn)算優(yōu)先級(jí)的限定:

?有時(shí)為了讓優(yōu)先級(jí)低的邏輯運(yùn)算先進(jìn)行,

使用括號(hào)來(lái)加以限定。

?如:AORBANDC

?(AORB)ANDC

布爾邏輯檢索

?邏輯運(yùn)算的組合:

?當(dāng)一個(gè)表達(dá)式中需要出現(xiàn)三種邏輯運(yùn)算的多個(gè)

組合時(shí),可使用括號(hào)來(lái)限定它們的運(yùn)算優(yōu)先順序。

如:(AORB)ANDC

?有的系統(tǒng)支持雙重括號(hào),有的系統(tǒng)只支持單重括。

?一個(gè)檢索系統(tǒng)對(duì)表達(dá)式中所包含的邏輯算符一般

是由限度的。如《BA》數(shù)據(jù)庫(kù)中,表達(dá)式中最多

只能含五十個(gè)邏輯算符,即五十個(gè)邏輯運(yùn)算。

字段限定檢索

?對(duì)檢索詞的檢索途徑(出現(xiàn)的檢索字段)

進(jìn)行限定

?即確定檢索詞在哪一個(gè)字段中進(jìn)行檢索。

子段限定檢索—字段符

寸:

來(lái)

統(tǒng)

會(huì)

使

對(duì)

。

達(dá)

統(tǒng)

。

用,

ALJN二限查特定刊名

LA

號(hào)PN二限查特定專利

CS二機(jī)構(gòu)名稱

字段限定檢索--字段符

?DE=限在敘詞標(biāo)引中查

?ID=限在自由標(biāo)引詞中查

?TI=限在題目中查

?AB=限在文摘中查找

?CT=限查受控詞

?PA=限查專利

字段限定檢索--字段限定表述

?字段限定檢索的表述:

?一般為以下幾種形式

?1、字段符=檢索詞(主要用于中文系統(tǒng))

?2、檢索詞in字段符(主要用于英文系

統(tǒng))

?3、檢索詞within字段符(主要用于英文系統(tǒng))

■4、檢索詞wn字段符(主要用于英文系

統(tǒng))

?5、字段符(檢索詞)(主要用于英文系

統(tǒng))

■表示檢索詞必須出現(xiàn)在指定的字段內(nèi)

位置限定檢索

?為了準(zhǔn)確表達(dá)檢索內(nèi)容,提高查準(zhǔn)率。系

統(tǒng)一般對(duì)檢索詞進(jìn)行詞位的限定。

?限定檢索詞的位置一般有兩種方式:

(1)使用位置算符,

(2)使用引號(hào)。

?位夫算符:檢索系統(tǒng)一般是采用位置算符

來(lái)實(shí)現(xiàn)位置檢索。

?常用的位置算符有:adjnearwith

withinwn

-不同的系統(tǒng)采用的位置算符不同.用法也不

位置限定檢索

?以DIALOG系統(tǒng)為例:

?DIALOG系統(tǒng)常用的位置算符共有四種:

?1、W或O—WKh表示算符兩側(cè)的檢索

詞(或檢索項(xiàng))之間不得有其它字詞,而

且順序不能顛倒。

位置限定檢索

?(2)(nW)-nWorld(位置順序隔詞)

?表示算符兩側(cè)的檢索詞(或檢索項(xiàng))之

間允許插入n個(gè)實(shí)詞或者虛詞,但順序不能

顛倒。

位置限定檢索

?(3)N(Near)(詞位置緊連)

?表示算符兩側(cè)的檢索詞必須緊密相連,中

間不插入其他字符。但兩詞次序可以顛倒。

位置限定檢索

?(4)(nN)一nNear(隔詞運(yùn)算)

?表示算符兩側(cè)的檢索詞(或檢索項(xiàng))之

間允許插入n個(gè)單詞,且兩側(cè)詞序可變。

位置限定檢索

?引號(hào)的用法:

?當(dāng)需要將兩個(gè)或兩個(gè)以上的單詞作一個(gè)

詞組執(zhí)行檢索時(shí),只需用引號(hào)將幾個(gè)詞引

起來(lái)即可。

?用于提高查準(zhǔn)率

詞頻限定檢索

?限定某個(gè)檢索詞在字段或原文中出現(xiàn)的頻

次。

?詞頻符:FREQ

?如:CELL/FREQ=20,將檢中那些CELL出現(xiàn)的

次數(shù)不少于20的文獻(xiàn)。

截詞檢索

計(jì)算機(jī)按照檢索詞的部分片斷同索引詞進(jìn)行對(duì)比,以提

供族性檢索的功能,提高查全率。

-一般有以下六種情況:

?1、右截?cái)啵呵胺揭恢?后截?cái)?/p>

?2、左截?cái)啵汉蠓揭恢?,前截?cái)?/p>

?3、左右同時(shí)截?cái)啵褐虚g一致

?4、完

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論