版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
文獻檢索技術一、布爾邏輯檢索技術
在檢索實際中,檢索提問涉及的概念往往不止一個,而同一個概念又往往涉及多個同義詞或相關詞。為了正確地表達檢索提問,系統(tǒng)中采用布爾邏輯運算符將不同的檢索詞組配起來,使一些具有簡單概念的檢索單元通過組配成為一個具有復雜概念的檢索式,用以表達用戶的信息檢索要求。2文獻檢索技術
1邏輯“與”
含義:檢出的記錄必須同時含有所有的檢索詞?;咀饔茫阂环N用于交叉概念或限定關系的組配,可以縮小檢索范圍,有利于提高檢索的專指性。用and或*表示例如:查找同時含有概念A和概念B的文獻,可表示為:“AandB”或“A*B”3文獻檢索技術
2邏輯“或”
含義:檢出的記錄中,至少含有兩個檢索詞中的一個。基本作用:用于具有并列概念關系的組配。這種組配可以擴大檢索范圍,提高查全率??梢员苊饬嗣形墨I的重復出現(xiàn)。用OR或“+”表示例如:檢索含有檢索項A或檢索項B的文獻,可表示為:“AORB”或“A+B”4文獻檢索技術
3邏輯“非”
含義:排除含有某些詞的記錄的,即檢出的記錄中只能含有NOT算符前的檢索詞,但不能同時含有其后的詞?;咀饔茫河糜趶哪骋粰z索范圍中排除不需要的概念。這種組配可以縮小檢索范圍。用“NOT”或“-”表示,但在檢索時建議使用NOT,以避免與詞間的分隔符“-”混淆。例如:在含有概念A的文獻集合中,排除同時含有概念B的文獻,可表示為:“ANOTB”或“A-B”。5文獻檢索技術4運算優(yōu)先級運算優(yōu)選級順序為(),NOT,OR,AND;可以用括號改變它們之間的運算順序。通常在有括號的情況下,括號內的邏輯運算先執(zhí)行,有多層括號時,先執(zhí)行最內層的括號。例如:(AORD)ANDB,表示先執(zhí)行“AORD”的檢索,再與B進行AND運算。6文獻檢索技術5注意事項1)有的檢索工具以符號形象地表達布爾檢索的功能,如“+”表示邏輯與,“-”表示邏輯非。有的檢索工具直接把布爾邏輯隱含在菜單中,例如,Lycos以“matchallterms”表示邏輯與,以“matchanyterm”表示邏輯或。絕大多數檢索工具的高級檢索完全用表格和文字來表達布爾關系,如,Excite以“必須包括(MUSTcontain)”表示邏輯與,用“一定不含”(MUSTNOTcontain)表示邏輯非。有的檢索工具部分支持布爾關系,如Yahoo!尚不支持邏輯非。7文獻檢索技術2)用布爾邏輯表達檢索要求,除要掌握檢索課題的相關因素外,還應在布爾算符對檢索結果的影響方面引起注意。布爾算符使用正確但卻不能達到應有檢索效果的例子很多。OR邏輯有些檢索詞表達的概念,存在整體與部分的關系。在檢索中,這類關系如果處理不好,就不能得到滿意的檢索效果。對此,一般原則是,如果檢索詞涉及到表達整體的概念,就要針對具體情況分別列出每一個表達部分概念的檢索詞,否則將出現(xiàn)漏檢。NOT邏輯在檢索邏輯中使用NOT,能排除含有由NOT指定的檢索詞的文獻,協(xié)助檢索出更準確的文獻。但是,使用NOT必須慎重。因為,如果兩個關系緊密的檢索詞同在一個檢索邏輯中,對其中一個使用NOT邏輯會導致含另一個詞的文獻也被排除。8文獻檢索技術6小結檢索中邏輯算符使用是最頻繁的,對邏輯算符使用的技巧決定檢索結果的滿意程度。用布爾邏輯表達檢索要求,除要掌握檢索課題的相關因素外,還應在布爾算符對檢索結果的影響方面引起注意。另外,對同一個布爾邏輯提問式來說,不同的運算次序會有不同的檢索結果。布爾算符使用正確但不能達到應有檢索效果的事情是很多的。9文獻檢索技術示例:使用布爾邏輯運算符表明查詢結果中必須同時包含intelligentrobot和control表明查詢結果中至少包含兩個檢索詞中的任意一個,intelligentrobot或control表明檢索結果包含intelligentrobot,但同時必須去掉和control相關的內容Intelligentrobotandcontrol(intelligentrobot*control)Intelligentrobotorcontrol(intelligentrobot+control)Intelligentrobotnotcontrol(intelligentrobot-control)注:英文數據庫通常用字母,中文數據庫要用符號。10文獻檢索技術二、位置檢索(鄰近檢索)技術表明兩或多個檢索詞之間關系的符號。適用于兩個檢索詞以指定間隔距離或者指定的順序出現(xiàn)的場合??梢钥闯商厥夤δ艿腁ND算符。AND算符不限制兩個檢索詞的位置和出現(xiàn)順序。例如:communicationANDsatellite命中的文獻可能有
communicationsatellite;
satellitecommunication;communicaticndevicesforsatellites;communicaticnlinkswithoutsatellites;
位置算符可以改進AND算符的這種不足,它是特殊功能的AND算符。按照兩個檢索詞出現(xiàn)的順序和距離,可以有多種位置算符,而且對同一位置算符,檢索系統(tǒng)不同,規(guī)定的位置算符也不同。11文獻檢索技術1)“(W)”
含義:“(W)”算符中的W含義為“With”。表示其兩側的檢索詞必須緊密相連,除開空格和標點號外,不得插入其他詞或字母,兩詞的詞序不可顛倒。其簡略形式為()。例如:
communication(W)satellitecommunication()satellite兩者相同
12文獻檢索技術2)“(nw)”
“(nW)”中的“W”的含義為“Word”,它允許兩詞間插入最多為n個其他詞,包括實詞和系統(tǒng)禁用詞,詞序不變。例如:
communication(2W)satellite則會檢出
communicationsatellitecommunicationthoughsatellitecommunicationonthesatellite13文獻檢索技術3)“(N)”
含義:“(N)”中的N含義為“Near”。表示其兩側的檢索詞必須緊密相連,除開空格和標點符號外,不得插入其他詞或字母,兩詞的詞序可以顛倒。14文獻檢索技術4)“(nN)”含義:“(nN)”是“(N)”算符的變形,不同之處為允許兩詞間插入最多為n個其他詞,包括實詞和系統(tǒng)禁用詞。例如:
COTTON(2N)PROCESSING則命中:
Cottonprocessing;processingofcotton;processingofEgyptiancotton15文獻檢索技術5)“(F)”——同字段檢索含義:“(F)”算符中F的含義為“Field”。這個算符表示其兩側的檢索詞必須在同一個詞段中出現(xiàn),(例如;同在題目字段或文摘字段)詞序不限,中間可插任意檢索詞項。例如:
POLLUTION(F)CONTRON可命中
Contronandmanagementofindustrialpollution同在題目中(F)鄰近算符與AND布爾邏輯主要區(qū)別在于:(F)使兩個檢索項在同一字段,AND布爾邏輯中兩個檢索詞會發(fā)生在不同字段中。16文獻檢索技術6)“(s)”——同句檢索含義:“(s)”算符中的S含義為“Sentence”。這個算符表示其兩側的檢索詞必須在同一自然句子(子字段)中出現(xiàn),兩詞的詞序可以顛倒。放寬了詞位置檢索的要求,使表達同一概念但不滿足詞位置條件的文獻也可以被檢索出來,從而提高了查全率。
17文獻檢索技術
以上介紹的各種位置算符,按照限制程度的大小,(W)、(nW)最強,(N)、(nN)次之,(S)再次之。當(nN)的n≥10時,其作用已經相當于(S)。18文獻檢索技術19文獻檢索技術
三、截詞檢索技術
含義:用截斷的詞(詞的片段)的一個局部進行的檢索,并認為凡滿足這個詞局部中的所有字符(串)的文獻,都為命中的文獻。檢索者將檢索詞在合適的地方截斷,然后截出的片斷進行檢索。20文獻檢索技術截詞的方式
(1)按截斷的字符數量來分:有限截斷和無限截斷有限截斷:有具體截去的字符數。無限截斷:不指明具體截去的字符數。(2)按截斷的位置區(qū)分:后截斷、前截斷以及中間截斷。(3)截斷常使用截斷符號,各檢索系統(tǒng)所使用的截斷符號有所不同,常用的符號有“?”,“$”,“?!币约啊?”。以下舉例中用“?”來表示有限截斷,用“*”表示無限截斷。注意:不同的數據庫所用的截詞符不一樣,使用應先查一下各數據庫的幫助加以確認。22文獻檢索技術
1后方截詞(前方一致或右截斷)
含義:將截詞符放在一串字符的后面,用以表示以相同字符串開頭,而結尾不同的所有詞。(1)詞尾的有限截斷相同字符串后可能變化一個字符時,則在其后使用一個“?”、空格、再加一個“?”,常用來表示檢索詞的單復數變化。例如:用system??可以查出sytem和systems的文獻。相同字符串后可能變化兩個以上字符時,則在其后連續(xù)使用若干個“?”代替可能變化的字符。例如:??表示兩個字符,???表示三個字符,以此類推。23文獻檢索技術
(2)詞尾的無限截斷
相同字符串后可能變化任何字符串時,則在其后使用一個“?”。這種方法可以查找出含有相同字符串的所有檢索詞。例如:
comput?可查出compute,computer,computing,computation,computerisation等。24文獻檢索技術(3)后截詞主要使用在如下4個方面詞的單復數,如book?,potato??;年代,如198?(80年代),19??(20世紀);作者,如用Lancaster*可檢出所有姓Lancaster的作者;同根詞,如用biolog*,可檢出biological、biologist、biology等同根詞。25文獻檢索技術注意(1)有限截斷比較精確,只檢索出用戶需要的詞匯;(2)使用時無限截斷必須注意:詞干不要太短,否則會檢出許多無關的文獻;(3)應盡量選用不會引起誤檢的截斷詞。26文獻檢索技術
2中間截詞(中間屏蔽)
將提問字符串中間的字符用符號代替,主要用于英式美式不同拼法的英文單詞,或單復數不同的單詞。截詞符具有“OR”運算符的功能,能夠擴大檢索范圍,而且減少了輸入檢索詞的時間,節(jié)約了機時。例如:“
woman”
和“
women”
,可用“
wom?n”
代替;
“
defence”
和“
defense”
可用“defen?e”代替。檢索時為防止漏檢可用中間屏蔽的檢索方法:
m?nwom?norgani?ationdefen?e
當然使用中間屏蔽的方法也要注意是否可能誤檢其它詞匯的文獻。27文獻檢索技術3
前截斷(后方一致或左截斷)前截斷檢索常用于復合詞。例如:?computer表示minicomputer,microcomputers等。前截斷與后截斷也可以組合起來使用。例如:*chemi*可以檢出下列詞匯
chemical、chemistry、chemist、
eletrochemical、electrochemistry、
physicochemistry、thermochemistry等。28文獻檢索技術
四、字段限定檢索
含義:限定檢索詞在數據庫記錄中的一個或幾個字段范圍內查找的一種檢索方法。(規(guī)定的字段范圍內出現(xiàn)的信息方為命中信息的一種檢索方法。)適用于在已有一定數量輸出記錄的基礎上,通過指定字段的方法,減少輸出篇數,提高檢索結果的查準率。由于字段限制采用前綴和后綴的形式,又可稱為前綴限制和后綴限制。29文獻檢索技術限制檢索主要有兩種方式:字段檢索——利用字段進行限制,如題名、摘要、全文等通常的字段限制范圍的大小順序是:題名<關鍵詞<摘要<全文二次檢索——在前一次檢索的結果中進行另一概念的檢索30文獻檢索技術通常數據庫中可供檢索的字段分為主題字段和非主題字段。主題字段:題名(Title)、敘詞(Descriptor)、標識詞(Identifier)、文摘(Abstract)等;非主題字段:作者(Author)、文獻類型(DocumentType)、語種(Language)、出版年份(PublicationYear)等。注意:各個檢索系統(tǒng)所設立的字段是互不相同的,即使使用同一字段,也可能采用不同的字段代碼,在進行字段檢索時,應事先參閱系統(tǒng)及有關數據庫的說明。31文獻檢索技術實例:字段限定在DIALOG聯(lián)機檢索系統(tǒng)中應用1)基本字段限制含義:基本字段主要是指題目、敘詞、識別詞和文摘四個字段?;咀侄蜗拗频挠梅ㄊ窃谛枰付ㄗ侄蔚臋z索詞后加上后綴運算符“/”和段碼。例如:
OPTICAL/TIANDFIBER/TI指在題目字段中含這兩個詞的記錄。字段段碼可以多個連用,中間加“,”例如:
FIB?/TI,DE指在題目和敘詞中查找“fib”為詞干的所有記錄。32文獻檢索技術2)輔助字段限制
除基本字段以外的可檢索字段都可成為輔助字段。輔助字段運算符的用法是在需要指定字段的檢索詞(有時檢索詞須放在雙引號內)之前加上段碼和前綴運算符“=”。例如:
AU=“Robert,S”在作者字段中含人名為Robert,S的記錄。
CS=作者單位字段;
LA=語言字段,例如LA=ENGLISH英語字段
JN=刊物名稱字段;
PY=年份字段例如PY=199933文獻檢索技術字段限定符in對某一指定數據項進行檢索如:computerin
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國石油大學(北京)《法律職業(yè)能力入門》2023-2024學年第一學期期末試卷
- 鄭州商學院《形式基礎2》2023-2024學年第一學期期末試卷
- 小學學校勞動教育實施方案
- 長春工程學院《生物技術特色創(chuàng)新》2023-2024學年第一學期期末試卷
- 生態(tài)大數據平臺建設構想
- 碩士答辯實務指導模板
- 專業(yè)基礎-房地產經紀人《專業(yè)基礎》押題密卷2
- 房地產交易制度政策-《房地產基本制度與政策》全真模擬試卷3
- 二零二五年餐飲企業(yè)市場信息保密協(xié)議模板下載2篇
- 二零二五年綠色建筑標準住宅買賣契約合同樣本3篇
- 遼寧省2024年高中生物學業(yè)水平等級性考試試題
- 2024年河南省商丘市第十一中學中考數學第一次模擬試卷
- DZ∕T 0285-2015 礦山帷幕注漿規(guī)范(正式版)
- 2024年全國初中數學競賽試題含答案
- JBT 4730.10承壓設備無損檢測-第10部分:衍射時差法超聲檢測
- 蝦皮shopee新手賣家考試題庫及答案
- 對乙酰氨基酚泡騰顆粒的藥代動力學研究
- 沖壓車間主管年終總結
- 2024年中建五局招聘筆試參考題庫附帶答案詳解
- 商業(yè)計劃書農場
- 海南省2023年中考英語科試題及答案
評論
0/150
提交評論