第四章計(jì)算機(jī)信息檢索技術(shù)_第1頁(yè)
第四章計(jì)算機(jī)信息檢索技術(shù)_第2頁(yè)
第四章計(jì)算機(jī)信息檢索技術(shù)_第3頁(yè)
第四章計(jì)算機(jī)信息檢索技術(shù)_第4頁(yè)
第四章計(jì)算機(jī)信息檢索技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章第四章 計(jì)算機(jī)信息檢索技術(shù)計(jì)算機(jī)信息檢索技術(shù) 布爾邏輯檢索技術(shù)布爾邏輯檢索技術(shù) 截詞檢索技術(shù)截詞檢索技術(shù) 限制檢索技術(shù)限制檢索技術(shù) 詞位檢索技術(shù)詞位檢索技術(shù) 1 布爾邏輯檢索技術(shù)布爾邏輯檢索技術(shù) 布爾邏輯檢索布爾邏輯檢索是當(dāng)今檢索理論中最成熟的理論之一,是當(dāng)今檢索理論中最成熟的理論之一,也是構(gòu)也是構(gòu) 造檢索表達(dá)式最基本、最簡(jiǎn)單的匹配模式。造檢索表達(dá)式最基本、最簡(jiǎn)單的匹配模式。布爾邏輯檢索是通過布爾邏輯檢索是通過 布爾邏輯算符來實(shí)現(xiàn)的,這些布爾邏輯算符來實(shí)現(xiàn)的,這些算符能把具有簡(jiǎn)單概念的檢索詞算符能把具有簡(jiǎn)單概念的檢索詞(或檢索項(xiàng)或檢索項(xiàng))組配成為組配成為一個(gè)具有復(fù)雜概念的檢索式,用以表達(dá)

2、一個(gè)具有復(fù)雜概念的檢索式,用以表達(dá) 用戶的檢索用戶的檢索需求。需求。 布爾邏輯算符布爾邏輯算符有三種:邏輯或(有三種:邏輯或(OR)、邏輯與)、邏輯與 (AND) 和邏輯非(和邏輯非(NOT),這三種算符表達(dá)不同),這三種算符表達(dá)不同的邏輯思想。的邏輯思想。 用布爾邏輯進(jìn)行檢索,就是用用布爾邏輯進(jìn)行檢索,就是用OR、 AND、 NOT三三種邏輯算符在數(shù)據(jù)庫(kù)中對(duì)相關(guān)文獻(xiàn)的定性篩選,這種邏輯算符在數(shù)據(jù)庫(kù)中對(duì)相關(guān)文獻(xiàn)的定性篩選,這是最基本、最常用的一種檢索技術(shù)。是最基本、最常用的一種檢索技術(shù)。B布爾邏輯檢索技術(shù)布爾邏輯檢索技術(shù) 邏輯或(邏輯或(OR): 擴(kuò)大檢索范圍,有利于提高查全率。擴(kuò)大檢索范圍,

3、有利于提高查全率。 邏輯與(邏輯與(AND):縮小檢索范圍,有利于提高查準(zhǔn)率。:縮小檢索范圍,有利于提高查準(zhǔn)率。 邏輯非(邏輯非(NOT):縮小檢索范圍,有利于提高查準(zhǔn)率。:縮小檢索范圍,有利于提高查準(zhǔn)率。 布爾邏輯布爾邏輯 算符的算符的運(yùn)算次序運(yùn)算次序: (1)優(yōu)先順序:)優(yōu)先順序: NOT 、 AND 、 OR (1)自然順序)自然順序 使用布爾邏輯算符使用布爾邏輯算符注意的問題注意的問題:(1)邏輯或)邏輯或(1)邏輯非)邏輯非ABAABA+BA*BAB2 截詞檢索技術(shù)截詞檢索技術(shù)(1)截詞方式截詞方式:按截?cái)嗟奈恢梅譃楹蠼財(cái)唷⑶敖財(cái)唷ⅲ喊唇財(cái)嗟奈恢梅譃楹蠼財(cái)?、前截?cái)唷⒅薪財(cái)?;按截?cái)嗟淖?/p>

4、符數(shù)量分為有限截?cái)嗪蜔o限截?cái)唷V薪財(cái)啵话唇財(cái)嗟淖址麛?shù)量分為有限截?cái)嗪蜔o限截?cái)?。? )截?cái)喾?hào)截?cái)喾?hào):# (ORBIT )、)、$ (BRS )、)、 ?( DIALOG) 截詞檢索的邏輯含義截詞檢索的邏輯含義: physic* physic + physical + physician + physicist + physics (3 )后截?cái)嗪蠼財(cái)啵菏乔胺揭恢碌臋z索。:是前方一致的檢索。 詞的單復(fù)數(shù)詞的單復(fù)數(shù) 年代年代 作者作者 同根詞同根詞(4 )前截?cái)嗲敖財(cái)啵菏呛蠓揭恢碌臋z索。:是后方一致的檢索。(5 )中截?cái)嘀薪財(cái)啵河址Q內(nèi)嵌字符截?cái)?、屏蔽、通用字符法。:又稱內(nèi)嵌字符截?cái)唷⑵帘?、通?/p>

5、字符法。(6 )優(yōu)點(diǎn)優(yōu)點(diǎn): 可以擴(kuò)大檢索可以擴(kuò)大檢索 范圍,提高查全率;范圍,提高查全率; 減少檢索詞的輸入量,簡(jiǎn)化檢索步驟。減少檢索詞的輸入量,簡(jiǎn)化檢索步驟。3 限制檢索技術(shù)限制檢索技術(shù) 在檢索系統(tǒng)中,用來縮小或約束檢索結(jié)在檢索系統(tǒng)中,用來縮小或約束檢索結(jié)果的方法,稱之為限制檢索。果的方法,稱之為限制檢索。 限制檢索方式:限制檢索方式: 利用前后綴符進(jìn)行的字段檢索利用前后綴符進(jìn)行的字段檢索 利用系統(tǒng)規(guī)定的限制符利用系統(tǒng)規(guī)定的限制符 限制檢索命令進(jìn)行的限制檢索限制檢索命令進(jìn)行的限制檢索3 1 字段檢索字段檢索 字段檢索字段檢索:限定檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的字段:限定檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的

6、字段范圍的一種檢索方式。范圍的一種檢索方式。 字段的類型字段的類型 : 主題字段主題字段 又稱基本檢索字段,它表示文獻(xiàn)的內(nèi)容特征,用又稱基本檢索字段,它表示文獻(xiàn)的內(nèi)容特征,用后綴符表示,例后綴符表示,例/TI、/DE、/ID、/AB; 非主題字段非主題字段 又稱輔助檢索字段,表示文獻(xiàn)的外部特征,用前又稱輔助檢索字段,表示文獻(xiàn)的外部特征,用前綴符表示,例綴符表示,例AU= 、CS=、LA=、JN=、PY=。3 2 使用限制符的限制檢索使用限制符的限制檢索 在一般聯(lián)機(jī)檢索系統(tǒng)中,還提供一類限在一般聯(lián)機(jī)檢索系統(tǒng)中,還提供一類限制符,使用這類符號(hào)進(jìn)行檢索,可以從制符,使用這類符號(hào)進(jìn)行檢索,可以從文獻(xiàn)的

7、外部特征限制檢索結(jié)果,如命中文獻(xiàn)的外部特征限制檢索結(jié)果,如命中文獻(xiàn)的文種、文獻(xiàn)類型、出版時(shí)間等。文獻(xiàn)的文種、文獻(xiàn)類型、出版時(shí)間等。限制符的作用與前綴符一樣,用法與后限制符的作用與前綴符一樣,用法與后綴符相同。例綴符相同。例chess/PAT。限制符可以與。限制符可以與前后綴符同時(shí)使用。前后綴符同時(shí)使用。3 3 使用限制檢索命令的限制檢索使用限制檢索命令的限制檢索 限制檢索還可以利用各檢索系統(tǒng)提供的限制檢索還可以利用各檢索系統(tǒng)提供的限制檢索命令進(jìn)行。如限制檢索命令進(jìn)行。如DIALOG系統(tǒng)的系統(tǒng)的 limit和和limitall 兩條檢索命令。兩條檢索命令。4 原文檢索技術(shù)原文檢索技術(shù) 原文檢索技

8、術(shù)是以原始記錄中詞與詞之間的特定位原文檢索技術(shù)是以原始記錄中詞與詞之間的特定位置關(guān)系為檢索對(duì)象的運(yùn)算。置關(guān)系為檢索對(duì)象的運(yùn)算。 原文檢索技術(shù)分三種情況原文檢索技術(shù)分三種情況: 詞位檢索詞位檢索 同句檢索同句檢索 同字段檢索同字段檢索4 1 詞位檢索詞位檢索 詞位檢索詞位檢索又稱鄰接檢索,詞位檢索常用的算又稱鄰接檢索,詞位檢索常用的算符有:符有: (W)、(nW)算符:利用)算符:利用(W)算符連接后的多元算符連接后的多元詞成為一個(gè)固定詞組,詞成為一個(gè)固定詞組, (W)算符的嚴(yán)密性較強(qiáng)。算符的嚴(yán)密性較強(qiáng)。 (N)、(nN): (X)、(nX):4。2 同句檢索同句檢索 同句檢索同句檢索要求參加檢

9、索運(yùn)算的兩個(gè)詞必須在要求參加檢索運(yùn)算的兩個(gè)詞必須在自然句中出現(xiàn),其先后順序不變。同句檢索自然句中出現(xiàn),其先后順序不變。同句檢索的位置算符為的位置算符為 (S)。例:例: (BASIC OR COBOL OR PASCAL) (S) (PROGRAM* OR COMPIL*) 上述檢索式等價(jià)于以下六個(gè)同句檢索式:上述檢索式等價(jià)于以下六個(gè)同句檢索式:BASIC (S) PROGRAM* BASIC (S) COMPIL*COBOL (S) PROGRAM* COBOL (S) COMPIL*PASCAL(S) PROGRAM* PASCAL (S) COMPIL* 滿足以上六種情況之一的,即為命中

10、文獻(xiàn)。滿足以上六種情況之一的,即為命中文獻(xiàn)。4。3 同字段檢索同字段檢索 同字段檢索算符同字段檢索算符 (F)、(L) 。 F是是Field的縮寫,它表示此算符兩側(cè)的檢索詞的縮寫,它表示此算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在數(shù)據(jù)庫(kù)記錄的同一字段中,次必須同時(shí)出現(xiàn)在數(shù)據(jù)庫(kù)記錄的同一字段中,次序可變,字段的類型可用后綴符限定。序可變,字段的類型可用后綴符限定。 L是是Link 的縮寫,它要求檢索詞同在敘詞字段的縮寫,它要求檢索詞同在敘詞字段中出現(xiàn),且具有詞表規(guī)定的等級(jí)關(guān)系。所以該中出現(xiàn),且具有詞表規(guī)定的等級(jí)關(guān)系。所以該算符只適用于有正式詞表,且詞表中具有從屬算符只適用于有正式詞表,且詞表中具有從屬關(guān)系的數(shù)據(jù)庫(kù)。關(guān)系的數(shù)據(jù)庫(kù)。加權(quán)檢索加權(quán)檢索 加權(quán)檢索加權(quán)檢索是某些檢索系統(tǒng)中提供的一種定量是某些檢索系統(tǒng)中提供的一種定量檢索技術(shù),作用是縮小檢索范圍、提高查準(zhǔn)檢索技術(shù),作用是縮小檢索范圍、提高查準(zhǔn)率。加權(quán)是指根據(jù)檢索詞對(duì)檢索課題的重要率。加權(quán)是指根據(jù)檢索詞對(duì)檢索課題的重要程度,事先指定不同的權(quán)值。運(yùn)用加權(quán)檢索程度,事先指定不同的權(quán)值。運(yùn)用加權(quán)檢索可以命中核心概念文獻(xiàn),例如有的檢索系統(tǒng)可以命中核心概念文獻(xiàn),例如有的檢索系統(tǒng)的加權(quán)檢索是限定在主要主題詞,還有的是的加權(quán)檢索是限定在主要主題詞,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論