計(jì)算機(jī)檢索技術(shù)課件_第1頁(yè)
計(jì)算機(jī)檢索技術(shù)課件_第2頁(yè)
計(jì)算機(jī)檢索技術(shù)課件_第3頁(yè)
計(jì)算機(jī)檢索技術(shù)課件_第4頁(yè)
計(jì)算機(jī)檢索技術(shù)課件_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)檢索技術(shù)

及中文數(shù)據(jù)庫(kù)使用方法1精選課件

一、計(jì)算機(jī)信息檢索的基本技術(shù):

布爾邏輯算符、截詞算符、位置算符、字段限定檢索等等。

在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,如:“GPS在建筑中的應(yīng)用”,既涉及GPS,又涉及建筑,還有“應(yīng)用”,這時(shí)候就要編制出滿(mǎn)足要求的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。

2精選課件一、計(jì)算機(jī)信息檢索的基本技術(shù)

布爾邏輯算符、截詞算符、位置算符、字段限定檢索等等。在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,如:“GPS在建筑中的應(yīng)用”,既涉及GPS,又涉及建筑,還有“應(yīng)用”,這時(shí)候就要編制出滿(mǎn)足要求的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。

3精選課件1布爾邏輯檢索

(BooleanLogicRetrieval)

邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算中最常用的是布爾邏輯運(yùn)算符(BooleanLogicOperators),即與、或、非三種運(yùn)算符號(hào),用它們可以表示概念之間的邏輯關(guān)系。4精選課件檢索要求邏輯檢索課題表達(dá)式檢索結(jié)果概念相交、限定AND與*計(jì)算機(jī)用于制圖ABAANDB

A*B縮小檢索范圍

提高查準(zhǔn)率概念平行、并列OR或+土地管理與土地利用

ABAORBA+B

擴(kuò)大檢索范圍

提高查全率某一主題去掉一部分相關(guān)主題

NOT非-除光電測(cè)距以外的

A電磁波測(cè)距

BBNOTAB-A

提高查準(zhǔn)率5精選課件2位置算符(ProximityOperators)

位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)算符。由于英文對(duì)一句話(huà)有多種表達(dá)方法,寫(xiě)法可能不同。如:“GPS在鐵路橋研究中的應(yīng)用”這個(gè)課題,用英文表達(dá)可能是“UsingofGPSinRailwayBridge”,也可能是“UsingofGPSinBridgeofRailway”,因而可能編制出這樣的檢索式,GPSAND(Railway(2N)Bridge)

我們可以通過(guò)位置檢索提高檢索的準(zhǔn)確率6精選課件

(1)(W)算符與(nW)算符W是word與with的縮寫(xiě)。

特點(diǎn):W詞序不變,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。

nW詞序不變,中間可插入N個(gè)詞。

如:potential(w)energy可能檢出potentialenergyandfunction

又如:gone(2w)wind可能檢出gonewiththewind

7精選課件

(2)(N)與(nN)算符N是near的縮寫(xiě)

特點(diǎn):N詞序不限,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。

nN詞序不限,中間可插入N個(gè)詞。

如:econom??(2N)recovery可能檢出economicrecovery,recoveryoftheeconomy,

8精選課件

(3)同字段檢索A(F)B,F(xiàn)是field的縮寫(xiě)。

特點(diǎn):A、B兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限。

如:environment(F)impact/DE,表示兩個(gè)詞必須同時(shí)出現(xiàn)在敘詞字段內(nèi)。

9精選課件(4)同句檢索A(S)B,S是sentence的縮寫(xiě)。

特點(diǎn):A、B出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制。

如:electric(S)plant可檢出electricpowerplants

如:EI中的NEAR;PQDD中的W/n(兩詞間距小于n個(gè)單詞,且前后位置任意),Pre/n(兩詞間距小于n個(gè)單詞,且前后位置一定)

10精選課件

3截詞算符(Truncatingoperators)

在英語(yǔ)詞匯中,一個(gè)詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫(xiě)方法不同、詞性不同等。如果檢索時(shí)將這類(lèi)詞全部輸入進(jìn)去,會(huì)增加檢索時(shí)間和費(fèi)用,采用截詞法可解決這一問(wèn)題。

11精選課件所謂截詞檢索,是指在檢索標(biāo)識(shí)中保留相同的部分,用相應(yīng)的截詞符代替可變化部分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分標(biāo)識(shí)的記錄全部檢索出來(lái)。常用“?”、“*”符號(hào)表示。12精選課件

(1)有限截?cái)唷?/p>

是指在檢索詞后后截幾個(gè)有限的字母,如名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。

如輸入computer??表示有0-1個(gè)字母變化,可檢出computer和computers.

輸入stud???表示截?cái)嗵幱?-3個(gè)字母變化,可檢出study,studies,studied,studing.

13精選課件

(2)無(wú)限截?cái)啵?/p>

在檢索詞后加一個(gè)“?“,表示該詞后可加任意個(gè)字符。使用無(wú)限截詞,所截詞根不能太短,否則會(huì)輸出許多無(wú)關(guān)文獻(xiàn),造成誤檢。如:computer?可檢出computers,computering,computered,computerization.

14精選課件(3)中間截?cái)啵?/p>

在檢索詞中間加一個(gè)或幾個(gè)?號(hào),主要解決一些英美拼寫(xiě)不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡(jiǎn)化輸入。

如:輸入wom?n可檢出 woman,women15精選課件

各種算符在數(shù)據(jù)庫(kù)中的實(shí)際應(yīng)用

位置算符1)EINEARBridgeNEARPiling*表示這兩個(gè)詞要彼此接近,前后順序不限。W/nPig*W/2pine*表示兩個(gè)詞的距離不能超過(guò)n個(gè)單詞AdjChanneladjtunnel表示含有這兩個(gè)詞,兩個(gè)詞相鄰,位置一定2)ISIProceedings用同句算符(SAME):如Channelsametunnel,表示channel和tunnel出現(xiàn)在同一句子中才符合檢索條件。16精選課件

3)CSA:within“X”表示兩詞之間不得多于x個(gè)詞,前后位置任意

如“womenwithin8movement”(順序不定)4)Elsevier:ADJ表示兩詞相鄰,前后順序固定,與"詞檢索"的結(jié)果相同;NEAR或NEAR(N),表示兩詞相鄰,中間可插入少于或等于n個(gè)單詞,前后順序可以發(fā)生變化,如果不使用(N),系統(tǒng)默認(rèn)值為1017精選課件5)PQDD

W/n(兩詞間距小于n個(gè)單詞,且前后位置任意),Pre/n(兩詞間距小于n個(gè)單詞,且前后位置一定)18精選課件

6)ProQuest

W/n(表示連接兩個(gè)詞之間可以插入n個(gè)詞,前后位置可顛倒)

如:Educationw/5intenet表示education和internet之間可以插入5個(gè)詞,并且前后位置可以顛倒。

19精選課件Pre/n

表示前后兩詞之間最多插入n個(gè)詞,前后位置一定

如:U.Spre/neconomicpolicy可檢出U.Said

economicpolicy,orU.Swartimeeconomic

policy。20精選課件

截詞符或通配符

CSA\ISIProceedings\ProQuest\CA用通配符“?”和截詞符“*”輸入“patent*”,可以檢索到patent、patents、

patented等,(無(wú)限截?cái)啵┹斎?wom?n",可以檢索到woman和women。輸入“fib??”,可檢索到fiber和fibre。(有限截?cái)啵?/p>

21精選課件

EI用“*”和“$”(詞根算符)

如:Optic*檢索結(jié)果中包括以optic開(kāi)頭后面加任意

多個(gè)字母的詞例如optic,optics,optical等

$manager(強(qiáng)調(diào)語(yǔ)義)檢索出與該詞根具有同樣語(yǔ)意的詞如

$manage將檢出managers,managerial

和management等詞

※通配符不能用在檢索詞的最前面

22精選課件

4括號(hào)檢索(Parentheses)

用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)先運(yùn)算。

用“()”可以表示優(yōu)先級(jí)。如比較

(GPSORGIS)ANDChina

GPSORGISANDChina

EI中的表示方法:RelevanceAND

((AalbersbergWNAU)OR(coolWNAU))

23精選課件

5、字段限制檢索

組成數(shù)據(jù)庫(kù)的最小單位是記錄,一條完整記錄中的每一個(gè)著錄事項(xiàng)為字段。獻(xiàn)書(shū)目型數(shù)據(jù)庫(kù)的記錄基本包括下列字段:

(1)存取號(hào)字段(AN,AccessNumber)這是計(jì)算機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫(kù)的每篇記錄規(guī)定的能被計(jì)算機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫(kù)中,每篇文獻(xiàn)記錄只有一個(gè)存取號(hào);

(2)篇(題)名字段(TitleField,/TI)

(3)文摘字段(AbstractField,/AB)

24精選課件(4)敘詞字段或受控詞字段(DestriptorField,/DE;或ControlledtermField-SU)這一字段是標(biāo)引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些詞來(lái)自規(guī)范化的詞表。也稱(chēng)主題詞。

(5)自由詞字段或非受控詞字段(IdentifiedField,/ID;KeywordField,/KW;UncontrolledtermField)

這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引反映其主題概念的詞,但這些詞不是規(guī)范化詞表中的詞。25精選課件

(6)著者子段(Author,AU)

(7)著者機(jī)構(gòu)子段

(corporatesource,CS

或Affiliationsource,AF)

(8)刊名字段

(journal,JN或SourceTitle,ST)

26精選課件(9)出版年子段(publication,year,PY)(10)文獻(xiàn)類(lèi)型子段(ducumenttype,DT或Type,TY)(11)語(yǔ)種子段(language,LA)(12)分類(lèi)號(hào)子段(classification,CC)27精選課件使用作者檢索時(shí)應(yīng)注意姓名的書(shū)寫(xiě)形式:在ISTP中,姓前(全稱(chēng))名后(縮寫(xiě)):Gong,jy;EDC在SCI中,(1)姓(全稱(chēng))空格名(首字母并且連寫(xiě))如:TaitNG;LIDR(2)名前(全稱(chēng)),姓后如:Zequn,guan;Qingquan,Li在EI中,姓名就比較復(fù)雜,一般有以下幾種情況:姓名都用全稱(chēng)(姓前名后);姓全稱(chēng)名縮寫(xiě)(或名之間用連字符);名前姓后全稱(chēng)如kehengyu=keheng-yu=ke,hengyuke,h.y.=ke,h-y;e,d.c.hengyuke;dongchen,e

28精選課件6短語(yǔ)檢索(phrasesearch)即精確檢索

短語(yǔ)用“”表示,檢索出與“”內(nèi)形式完全相同的的短語(yǔ),以提高檢索的精確度和準(zhǔn)確度

29精選課件7自然語(yǔ)言檢索(naturallanguage)

直接采用自然語(yǔ)言中的字、詞、句進(jìn)行提問(wèn)式檢索,同一般口語(yǔ)一樣。這種基于自然語(yǔ)言的檢索方式又被稱(chēng)為“智能檢索”,適合不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支持自然語(yǔ)言檢索的有中文的悠游,英文的AltaVista,Excite,Infoseek,HotBot,AskJeeves等

30精選課件8多種語(yǔ)言檢索(multilingualsearch)

提供多種語(yǔ)言的檢索環(huán)境供用戶(hù)選擇,系統(tǒng)按用戶(hù)選定的語(yǔ)種進(jìn)行檢索并反饋結(jié)果,支持多語(yǔ)種檢索的如:中文天網(wǎng),英文AltaVista,Google等。31精選課件

9模糊檢索(fuzzysearch)

又稱(chēng)概念檢索。當(dāng)我們輸入一個(gè)檢索詞時(shí),搜索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)也發(fā)來(lái)與關(guān)鍵詞意義相近的內(nèi)容。比如:我們查找“查詢(xún)”一詞時(shí),模糊檢索會(huì)反饋來(lái)包含了“查詢(xún)”、“查找”“查一查”、“尋找”、“搜索”等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一般是完全符合關(guān)鍵詞的在最前邊,其次是相近的。現(xiàn)在大多數(shù)搜索引擎都有這種功能,只是模糊的程度不同。

32精選課件10字母大小寫(xiě)檢索

如果用戶(hù)的檢索式用小寫(xiě)字母表示,搜索工具既匹配大寫(xiě)又匹配小寫(xiě),如:china(瓷器),china(中國(guó));如果用大寫(xiě)字母表示,搜索工具認(rèn)為用戶(hù)指定了只要大寫(xiě),就只會(huì)查找那些與用戶(hù)鍵入的輸入形式完全相同的結(jié)果,如:china,只檢索出china。AltaVista等搜索引擎支持區(qū)分大小寫(xiě)的檢索

33精選課件實(shí)際檢索中,往往將多種檢索技術(shù)混合使用。如:

TI(WebORWWW)ANDmarket*

TS=(nanotub*SAMEcarbon)NOTAU=SmalleyRE

34精選課件例1:以汽車(chē)導(dǎo)航系統(tǒng)為研究課題,構(gòu)建計(jì)算機(jī)邏輯檢索式題名詞:汽車(chē)導(dǎo)航系統(tǒng)研究題名擴(kuò)展詞:機(jī)動(dòng)車(chē);全球定位技術(shù)(GPS);設(shè)計(jì)調(diào)查計(jì)算機(jī)邏輯檢索式:(汽車(chē)+機(jī)動(dòng)車(chē))*(導(dǎo)航系統(tǒng)+全球定位技術(shù)+GPS)*(研究+設(shè)計(jì)+調(diào)查)35精選課件示例:有關(guān)“企業(yè)知識(shí)產(chǎn)權(quán)研究”檢索式檢索結(jié)果(*表示AND,+表示OR,限定篇名字段)(2004-2006)1企業(yè)知識(shí)產(chǎn)權(quán)191篇(準(zhǔn)確度最高漏檢大)2企業(yè)*知識(shí)產(chǎn)權(quán)404(漏檢率較高)3(企業(yè)+集團(tuán)+公司)*知識(shí)產(chǎn)權(quán)466(適合綜述性文獻(xiàn))4(企業(yè)+集團(tuán)+公司)*(知識(shí)產(chǎn)權(quán)+專(zhuān)利權(quán)520(查全率查準(zhǔn)率較高)+商標(biāo)權(quán)+著作權(quán)+名稱(chēng)權(quán))5(企業(yè)+集團(tuán)+公司)*(知識(shí)產(chǎn)權(quán)+專(zhuān)利權(quán)137(縮小范圍效果最佳)+商標(biāo)權(quán)+著作權(quán)+名稱(chēng)權(quán))*保護(hù)36精選課件檢索結(jié)果表明: 檢索詞的選擇、邏輯算符的使用、同義詞近義詞的擴(kuò)展、檢索字段的選擇等變化,對(duì)檢索結(jié)果數(shù)量的多少、檢索的查全和查準(zhǔn)有很大影響37精選課件檢索結(jié)果過(guò)少,漏掉了相關(guān)文獻(xiàn)?放寬檢索要求,提高檢全率去掉某個(gè)方面的檢索要求;放寬檢索范圍:學(xué)科領(lǐng)域、時(shí)間、文章類(lèi)型,關(guān)鍵詞出現(xiàn)的字段等;將描述檢索主題的詞想全,包括同義詞及縮寫(xiě)形式;如:MRIORmagneticresonanceimaging使用單數(shù)單詞檢索,可以檢索到大多數(shù)單詞單數(shù)、復(fù)數(shù)和所有格,不規(guī)則單詞除外;如:city可以檢索出city,cities,city’s,cities’使用通配符;38精選課件檢索結(jié)果過(guò)多,很多文獻(xiàn)不相關(guān)?進(jìn)一步限定檢索,提高檢準(zhǔn)率更加準(zhǔn)確地描述檢索需求;嚴(yán)格限定檢索范圍:學(xué)科領(lǐng)域、時(shí)間、文章類(lèi)型,關(guān)鍵詞出現(xiàn)的字段等;選擇與檢索主題密切相關(guān)的詞和專(zhuān)業(yè)術(shù)語(yǔ),如:kidneydiseaseORrenalfailure,避免使用過(guò)于寬泛的詞匯,如:influence;使用詞組檢索或位置檢索;在檢索結(jié)果的基礎(chǔ)上進(jìn)行二次檢索;39精選課件二、數(shù)據(jù)庫(kù)的檢索方法

檢索界面瀏覽方式(Browse)檢索方式(Search)40精選課件瀏覽方式(

Browse)

一般包括作者、作者單位、出版物名稱(chēng)及出版社索引或者按學(xué)科劃分的分類(lèi)索引如:EIElsevierCSAPROQUESTIEEE\IEE重慶維普以及中國(guó)期刊網(wǎng)等等都提供了各種不同的瀏覽方式41精選課件檢索方式(Search)基本檢索(basic\quick\simple\easy) 屬于一般性的檢索,它是根據(jù)自己的檢索需要,輸入字、詞或簡(jiǎn)單的檢索式(不能使用位置檢索)來(lái)完成檢索的,是一種初級(jí)性的檢索方式。 高級(jí)檢索(advance\expend\full\expert)

屬于專(zhuān)家性的檢索,可以根據(jù)自己的檢索需要,構(gòu)件比較復(fù)雜的檢索式(可以使用邏輯、括號(hào)、截詞以及位置算符)來(lái)完成高層次、高質(zhì)量的檢索,檢索結(jié)果快速、準(zhǔn)確。高級(jí)檢索分為菜單式檢索和命令式檢索兩種

42精選課件43精選課件44精選課件45精選課件46精選課件47精選課件48精選課件49精選課件50精選課件51精選課件三中文數(shù)據(jù)庫(kù)的使用方法中國(guó)期刊網(wǎng)重慶維普數(shù)據(jù)庫(kù)萬(wàn)方數(shù)據(jù)庫(kù)全國(guó)期刊聯(lián)合目錄高校期刊聯(lián)合目錄書(shū)生之家52精選課件(一)收錄特點(diǎn)中國(guó)期刊網(wǎng)目前世界上最大的連續(xù)動(dòng)態(tài)更新的中國(guó)期刊全文數(shù)據(jù)庫(kù)。收錄1979年至今約7200種期刊全文。至2005年4月止,累積全文文獻(xiàn)1370多萬(wàn)篇。分為九大專(zhuān)輯:理工A、理工B、理工C、農(nóng)業(yè)、醫(yī)藥衛(wèi)生、文史哲、經(jīng)濟(jì)政治與法律、教育與社會(huì)科學(xué)、電子技術(shù)與信息科學(xué);126個(gè)專(zhuān)題文獻(xiàn)數(shù)據(jù)庫(kù)。知識(shí)來(lái)源:中國(guó)國(guó)內(nèi)約7200種核心期刊與專(zhuān)業(yè)特色期刊的全文以及優(yōu)秀博碩士學(xué)位論文和重要報(bào)紙53精選課件重慶維普資訊有限公司是科學(xué)技術(shù)部西南信息中心下屬的一家大型專(zhuān)業(yè)化數(shù)據(jù)公司,是中文期刊數(shù)據(jù)庫(kù)建設(shè)事業(yè)的奠基人。自1989年以來(lái),一直致力于報(bào)刊等信息資源的深層次開(kāi)發(fā)和推廣應(yīng)用,業(yè)務(wù)集數(shù)據(jù)采集、數(shù)據(jù)加工、光盤(pán)制作發(fā)行和網(wǎng)上信息服務(wù)于一體。目前,已成為中國(guó)最有影響力的數(shù)據(jù)庫(kù)建設(shè)者之一。維普公司收錄有中文報(bào)紙400種、中文期刊8000種、外文期刊5000種;已標(biāo)引加工的數(shù)據(jù)總量達(dá)1300萬(wàn)篇、3000萬(wàn)頁(yè)次、擁有固定客戶(hù)2000余家,在國(guó)內(nèi)同行中處領(lǐng)先地位。維普數(shù)據(jù)庫(kù)已成為我國(guó)圖書(shū)情報(bào)、教育機(jī)構(gòu)、科研院所等系統(tǒng)必不可少的基本工具和獲取資料的重要來(lái)源。數(shù)據(jù)主要來(lái)源于期刊

54精選課件萬(wàn)方數(shù)據(jù)資源系統(tǒng)是建立在因特網(wǎng)上的大型科技、商務(wù)信息平臺(tái)。自1997年8月面向社會(huì)各界開(kāi)放以來(lái),在國(guó)內(nèi)外產(chǎn)生了較大的影響,同時(shí)在全國(guó)各省市建有幾百個(gè)服務(wù)中心,直接用戶(hù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論