版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
孝計算機文獻檢索是隨著計算機的出現(xiàn)而發(fā)展起來
的。計算機檢索經(jīng)歷了脫機檢索、聯(lián)機檢索、光盤檢
索及網(wǎng)絡(luò)信息檢索等階段。計算機檢索以其檢索效率
高、檢索效果好而在文獻信息檢索中得到了廣泛的使
用。
?:?重點掌握:計算機檢索的基本原理、數(shù)據(jù)庫的定義、
類型和結(jié)構(gòu);計算機檢索的基本步驟與方法。
本章主要內(nèi)容
£第一節(jié)計算機檢索概述
第二節(jié)計算機檢索原理
第三節(jié)計算機檢索技術(shù)
第四節(jié)計算機檢索步驟
第一節(jié)計算機檢索概述
?:?計算機信息檢索的特點
?:?計算機信息檢索的定義
?:?計算機信息檢索系統(tǒng)的類型
?:?計算機信息檢索系統(tǒng)的構(gòu)成
?:?數(shù)據(jù)庫
?:?計算機檢索的特點
>信息量大
>信息及時
>檢索功能強
>檢索效率高
計算機信息檢索的定義
簡稱機檢
A狹義上是指人們根據(jù)特定的情報需求,利用計
算機從相關(guān)的機讀數(shù)據(jù)庫中識別并獲取所需情報
信息的過程。
A廣義上包括信息存儲和信息檢索兩個方面,即
數(shù)據(jù)庫的建立與利用兩個方面。
手檢與機檢的比較
項目手檢機檢
總體特征手翻、眼看、大腦判斷策略、查尋、機器匹配
標(biāo)引及索引特點檢索點較少檢索點較多
檢索時間較慢較快
檢索要求專業(yè)知識、外語知識、專業(yè)知識、外語知識、機檢
檢索工具知識系統(tǒng)知識
查全查準(zhǔn)率查準(zhǔn)率較高查全率較高
綜合效率較低較高
計算機信息檢索系統(tǒng)的類型
A文獻信息檢索經(jīng)歷了手工檢索、機械檢索、計算機檢索
三個階段。
?計算機用于信息檢索的研究始于20世紀(jì)50年代初。
A從50年代開始,美國最先使用計算機進行信息檢索并解
決了信息存貯和檢索速度等問題。
A60年代中期,計算機檢索逐步實用化,利用單臺計算機
回溯檢索和新文獻的定題檢索,提供脫機檢索服務(wù)。
A70年代初,計算機檢索進入聯(lián)機檢索階段。
A80年代以后,計算機檢索進入國際聯(lián)機信息檢索階段。
A80年代末、90年代初,計算機檢索發(fā)展成計算機網(wǎng)絡(luò)信
息檢索。同時,光盤誕生了進入光盤檢索階段。
A90年后,進入網(wǎng)絡(luò)檢索階段
計算機信息檢索系統(tǒng)的構(gòu)成
?計算機硬件部分:
?主機:由控制器、運算器、存貯器等組成。
?外圍設(shè)備:終端機、打印機、鍵盤、磁盤、光盤、
驅(qū)動器、通信設(shè)備等。
?計算機軟件:包括系統(tǒng)軟件和應(yīng)用(檢索)軟件。
?數(shù)據(jù)庫
數(shù)據(jù)庫類型(按內(nèi)容分型)
?書目數(shù)據(jù)庫(如圖書館書目數(shù)據(jù)庫)
?數(shù)值數(shù)據(jù)庫(如人口統(tǒng)計數(shù)據(jù)庫)
?事實數(shù)據(jù)庫(科研機構(gòu)數(shù)據(jù)庫)
?全文數(shù)據(jù)庫中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊全文數(shù)
據(jù)庫等
?軟件數(shù)據(jù)庫
數(shù)據(jù)庫
>數(shù)據(jù)庫的定義美國著名信息檢索專家Martha,E.Williams給數(shù)
據(jù)庫的定義是“包含書目及與文獻有關(guān)的數(shù)據(jù)的機讀記錄的有組織
的集合?!卑磧?nèi)容性質(zhì)分:
A書目型數(shù)據(jù)庫(BibliographicDatabase)
如:國外三大農(nóng)業(yè)數(shù)據(jù)庫、館藏書目數(shù)據(jù)庫
A全文型數(shù)據(jù)庫(FullTextDatabase)
如:中國學(xué)術(shù)期刊全文數(shù)據(jù)庫、中文科技期刊全文數(shù)據(jù)庫等。
?數(shù)值型數(shù)據(jù)庫(NumericDatabase)
存貯有科學(xué)數(shù)據(jù),統(tǒng)計資料等數(shù)據(jù)。
?事實型數(shù)據(jù)庫(FactDatabase)
存貯有企業(yè)名錄、百科全書、人名錄等有利用價值的信息。
?超文本型數(shù)據(jù)庫(HypertextDatabase)
>數(shù)據(jù)庫的結(jié)構(gòu)
字段(Field)、記錄(Record)和文檔(File)
字段代碼字段名表示方法
TITitleapple?inti
ABAbstractmachineinab
DEDescriptorsbuildinginde
AUAuthorau=liu
BNISBNbn=0-5635-0144-4
CCCALClassification(分類號)cc=921
CDConferenceDatecd=19960501
CLConferenceLocation(會址)cl=hangzhou
CTConferenceTitlect=roboticsandautomation
CYConferenceYearcy=1996
DTDocumentTypedt=book
LALanguagela=english
PYPublicationYearpy>=1990
SNISSNsn=1060=9857
SOSourcePublicationso=power
第二節(jié)計算機檢索的基本原理
計算機信息檢索是利用計算機對信息進行存儲與檢索
的過程,即數(shù)據(jù)庫的建立與利用。示意圖
。數(shù)據(jù)庫的建立:按照既定的建庫方針、目的、標(biāo)準(zhǔn)等
從信息源中選擇所需文獻,對需錄入的文獻進行加工,也
就是對文獻的外表特征和內(nèi)容特征進行分析和標(biāo)引,形成
文獻特征的標(biāo)識,把這些標(biāo)識輸入計算機,計算機再按事
先設(shè)計好的規(guī)則自動把這些標(biāo)識排序形成多種索引,建成
數(shù)據(jù)庫,為信息檢索提供有規(guī)可循的檢索途徑。
。數(shù)據(jù)庫的利用:計算機信息存儲的逆過程。將課題的
主題概念按系統(tǒng)詞表進行規(guī)范化處理,轉(zhuǎn)換成系統(tǒng)語言,
形成檢索提問特征標(biāo)識,根據(jù)需要使用布爾邏輯運算符制
定檢索策略,將檢索提問式輸入計算機,在數(shù)據(jù)庫中查找
所需信息。
計
算
機
文
獻
信
息
數(shù)
據(jù)
庫
的
檢
索
原
理
示
意
圖
第三節(jié)計算機檢索技術(shù)
0
1、布爾邏輯檢索功能
2、詞間位置檢索功能
3、截詞檢索功能
4、字段限定檢索功能
?:?布爾邏輯檢索功能:用布爾邏輯算符來組配
檢索詞以確定文獻的命中與否。其算符的相互匹
配方式一共有8種。
廠邏輯與(邏輯乘)
邏輯或
異或關(guān)系
<“邏輯非”的“邏輯或”關(guān)系
“邏輯或”的“邏輯非”
邏輯非
J被標(biāo)引在該詞下的
種
ABANOTB
簡例:邏輯運算AND
計算機在圖書館中的應(yīng)用
計算機圖書館
簡例:邏輯運算OR
?微量元素與克山病的關(guān)系
AorBorC
簡例:邏輯運算NOT
查玉米方面的文獻,但除甜玉米方面的文
獻
A:玉米
B:甜玉米
?:?詞間位置檢索功能
文獻記錄中詞語的相對次序不同,所表達的意
思就可能不同。同樣在檢索式中,檢索詞的相
對次序不同,表達的檢索意圖也不一樣,布爾
邏輯運算符有時難以表達某些檢索課題的確切
提問要求,用詞間位置算符來限定和組配檢索
詞,可彌補布爾邏輯算符只是定性規(guī)定檢索詞
的范圍,而沒有限定檢索詞位置關(guān)系,易造成
誤檢的不足。
詞間位置檢索技術(shù)就是利用一些特定的位
置算符來表達檢索詞之間的位置關(guān)系,并
且可以不用敘詞表而直接使用自由詞進
行檢索的方法。有的書上還把這種檢索稱
為原文檢索。這種檢索在利用TI和AB途徑
檢索時,對檢索質(zhì)量影響很大。
例:檢索“小麥中氨基酸的測定”
(determinationofaminoacidsinwheat)
檢索式:determinationwithaminoacidswithwheat
詞間位置算符在不同系統(tǒng)中的使用方法不同:
@)在》1知08系統(tǒng)中主要位置算符及其使用方法
③在SPIRS系統(tǒng)中,位置算符只使用兩個:
with、near
那么,位置算符的應(yīng)用,能縮小檢索范圍
提高查準(zhǔn)率。
l.W-With
?w算符是With的縮寫,表示在此算符兩側(cè)的檢索詞必須按輸入時的前后
順序排列,不能顛倒。所連接的詞之間除可以有一個空格、標(biāo)點或連接號外不得
夾有任何其他單詞或字母。
例:intelligent(W)robot?(EiCompendexPlus)
?Wn(或nW)表示在此算符兩側(cè)的檢索詞必須按輸入時的前后順序排列,
不能顛倒。但允許在連接的兩個詞之間最多插入n個單元詞。
傷I:intelligentwlrobot*(OCLCFirstSearch)
2.N-Near
?N算符是Near的縮寫,表示此算符兩側(cè)的檢索詞必須緊密相連,所連接的
詞之間不允許插入任何其他單詞或字母。但詞序可以顛倒。
例:intelligentNEARrobot*(EiCPXWeb)
?Nn(或nN)表示在兩個檢索詞之間最多可插入n個單詞,且兩詞的詞序任意。
例:intelligentN1robot*(OCLCFirstSearch)
3.Adj-adjacency
鄰接算符,表示在此算符兩側(cè)的檢索詞必須按所列詞序排列,不能顛倒,兩
詞之間不允許有其他的詞或字母。相當(dāng)于短語檢索。
例:intelligentadjrobot*(ElsevierScienceSDOS)
算符功能表達式檢索結(jié)果
W、W/N、WITH、兩詞相鄰,按輸入時順Education(W)school或Educationschool
WITfflN序排列EducationWITHschoolEducationschools
Educationschool
同上,兩詞中間允許插
nWEducation(1W)schoolEducationschools
入n個詞
Educationandmusicschool
Educationschool
兩詞相鄰,順序可以顛Education(N)school或
N、NEAR、ADJEducationschools
倒EducationNEARschool
Schoolofeducation
Educationschool
Schoolofeducation
同上,兩詞中間可以插Educationandmusicschool
nNEducation(IN)school
入n個詞Schoolofmusicand
education
兩個詞同在一個標(biāo)引例如同時出現(xiàn)在題名或文
FEducation(F)school
字段中摘字段中
?截詞檢索功能
截詞運算符號有兩個:“?、*”
③其在不同系統(tǒng)中表示的含義不同。見書111
③在SPIRS系統(tǒng)中?為有限截斷、*為無限截斷;
?在中刊庫中只有?表示無限截斷。
例:1、teen*teen,teens,teenage,
teenager等。
2、teen???>Teen,teens,teenage
在詞尾加?號,以?號的個數(shù)表示詞后最多可
跟字母的個數(shù)
③截詞方式有很多,按截詞位置可以分為:
?前截斷(后方一直檢索)
?Chemistry,chemistry>biochemistry>electrochemistry
physicochemistry(物理化學(xué))等。
注:在SPIRS系統(tǒng)和中刊庫中無
(8)后截斷(前方一直檢索)chem-£_chemical(化學(xué)制品)
chemism(化學(xué)機理)、chemomorphosis(化學(xué)誘變)、
chemosynthesis(化學(xué)合成)等。
?中間截斷:wom?n分別檢出了woman,women兩詞
fib?board分別檢出了fiberboard,,fibreboard兩詞。
?截詞檢索在中文數(shù)據(jù)庫中截的是詞意.
例:西北?分別檢出了:西北農(nóng)林科技大學(xué)學(xué)報、西北園藝、
西北紡織學(xué)院學(xué)報等。
③在外文數(shù)據(jù)庫中截的是詞的后綴,截斷派生出的詞匯和原來的詞
義基本一致.
例"金屬"metal*,metal>metals>metaled>metalist等。
③利用截詞檢索時,注意截詞的部位,一定不能截的太深,否則誤
檢率會很大.“西北農(nóng)林?”就比“西北?”效果好
?字段限定檢索功能
將檢索詞限定在某一字段中,檢索時,計算機只對限定字
段進行運算,以提高檢索效果。常用的檢索符號有:
in、=、v、>、二、>
例:Englishinla;py>1992
總結(jié):在一個復(fù)雜的檢索式中,不僅可以有多個運算符,
也可以使用括號來指定運算的優(yōu)先順序、以及體
現(xiàn)概念的完整性。
:查“玉米方面的英文”文獻
(maizeorzea-maysorcorn)inde^nd)(Englishinla)
西文數(shù)據(jù)庫常用字段
中文數(shù)據(jù)庫常用字段
字段名稱字段
AbstractsAB文摘
AuthorAU作者
CoiporateSource、Organization.CompanyCS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年電子借條協(xié)議格式
- 2024年水稻種植與農(nóng)村電商購買合作協(xié)議3篇
- 一次性給予女方補償?shù)碾x婚協(xié)議書
- 2024年生態(tài)農(nóng)業(yè)園區(qū)經(jīng)營權(quán)轉(zhuǎn)讓協(xié)議版B版
- 2024年版:壓力罐在核電站的應(yīng)用與維護合同
- 科技創(chuàng)新驅(qū)動新質(zhì)生產(chǎn)力發(fā)展的核心機制
- 70后養(yǎng)老前景與展望
- 2024年度委托舉辦國際學(xué)術(shù)交流會議合同3篇
- 數(shù)字化賦能文化建設(shè)實施方案
- 2024年度人民幣匯率風(fēng)險管理外匯保函交易擔(dān)保合同3篇
- 學(xué)會正當(dāng)防衛(wèi)課件
- 溫室大棚改造施工方案及日光大棚設(shè)計方案
- 木質(zhì)吸音板施工工藝
- 文華財經(jīng)-半自動程序化交易使用指南101212
- 全國優(yōu)質(zhì)課大賽一等獎人教版高中地理必修一《土壤》精美賽課課件
- 2023北京市第一次高中學(xué)業(yè)水平合格性考試數(shù)學(xué)試卷真題(含答案詳解)
- 產(chǎn)品合格證標(biāo)簽出廠合格證模板
- GA/T 2007-2022法庭科學(xué)氣槍彈檢驗技術(shù)規(guī)范
- 《孔乙己》改編劇本
- 化工自動化控制儀表作業(yè)安全操作資格培訓(xùn)教材課件
- 繪畫心理治療專家講座
評論
0/150
提交評論