信息檢索一般技術(shù)_第1頁(yè)
信息檢索一般技術(shù)_第2頁(yè)
信息檢索一般技術(shù)_第3頁(yè)
信息檢索一般技術(shù)_第4頁(yè)
信息檢索一般技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1信息檢索一般技術(shù)信息檢索一般技術(shù)第四講:第四講:王建濤QQ200821.導(dǎo)論導(dǎo)論u機(jī)檢u回憶“信息檢索原理圖”u信息檢索系統(tǒng)=硬件+軟件+數(shù)據(jù)庫(kù)u計(jì)算機(jī)信息檢索的實(shí)質(zhì)就是由計(jì)算機(jī)將輸入的檢索策略與系統(tǒng)中存儲(chǔ)的文獻(xiàn)特征標(biāo)識(shí)及其邏輯組配關(guān)系進(jìn)行、的過(guò)程,需要人機(jī)協(xié)同作用來(lái)完成。200831.1 計(jì)算機(jī)信息檢索的類(lèi)型計(jì)算機(jī)信息檢索的類(lèi)型檢索系統(tǒng)存儲(chǔ)的內(nèi)容文獻(xiàn)信息檢索系統(tǒng)事實(shí)信息檢索系統(tǒng)數(shù)值信息檢索系統(tǒng)圖像信息檢索系統(tǒng)多媒體信息檢索系統(tǒng)檢索系統(tǒng)工作方式脫機(jī)信息檢索系統(tǒng)(20世紀(jì)5060年代)聯(lián)機(jī)信息檢索系統(tǒng)(20世紀(jì)70年代光盤(pán)信息檢索系統(tǒng)(20世紀(jì)80年代網(wǎng)絡(luò)信息檢索系統(tǒng)(20世紀(jì)90年代2008

2、42 計(jì)算機(jī)信息檢索技術(shù)計(jì)算機(jī)信息檢索技術(shù)u計(jì)算機(jī)信息檢索技術(shù)是用戶(hù)信息需求和文獻(xiàn)信息集合之間的匹配比較技術(shù)。u由于信息檢索提問(wèn)式是用戶(hù)需求與信息集合之間匹配的依據(jù),u目前,計(jì)算機(jī)信息檢索技術(shù)已經(jīng)從基本的、發(fā)展為高級(jí)的加權(quán)檢索、自然語(yǔ)言檢索、模糊檢索、概念檢索和相關(guān)檢索等多種技術(shù)并存。 200852.1 布爾邏輯檢索布爾邏輯檢索u布爾邏輯組配是現(xiàn)行計(jì)算機(jī)檢索的基本技術(shù),主要通過(guò)“與(and,*)”、“或(or,+)”、 “非(not,-)”將檢索詞聯(lián)絡(luò)起來(lái)。 A and B 邏輯與。A和B都為真時(shí),結(jié)果才為真 ,即:A*B,邏輯含義用圖表示是:20086 A or B 邏輯或。A或B中只要有一

3、個(gè)為真時(shí),結(jié)果就為真,即:A+B A not B 邏輯非。A為真、B為假時(shí),結(jié)果才為真,即:A-B20087布爾邏輯運(yùn)算符的運(yùn)算次序布爾邏輯運(yùn)算符的運(yùn)算次序u括號(hào)優(yōu)先與計(jì)算機(jī)編程中一樣(A OR B) AND C NOT Du不同的系統(tǒng)次序有差別,但總的來(lái)說(shuō)一般次序?yàn)椋篘OT AND ORu例A:查找有關(guān)信息檢索的非英文文獻(xiàn)信息information 檢索retrieval 英文english(信息 and 檢索 ) not 英文(information and retriever) not english20088分析實(shí)例:分析實(shí)例:上海零售業(yè)的現(xiàn)狀與發(fā)展趨勢(shì)上海零售業(yè)的現(xiàn)狀與發(fā)展趨勢(shì)上海上

4、海 零售業(yè)零售業(yè) 現(xiàn)狀現(xiàn)狀 發(fā)展趨勢(shì)發(fā)展趨勢(shì)上海上海 and 零售業(yè)零售業(yè) and (現(xiàn)狀現(xiàn)狀 or 發(fā)展趨勢(shì)發(fā)展趨勢(shì))200892.2 截詞檢索截詞檢索u截詞包括后截、中截、前截等。用?作為截詞符截詞包括后截、中截、前截等。用?作為截詞符(有些有些系統(tǒng)用系統(tǒng)用*),主要包括下列情形:,主要包括下列情形: u如 wom?n 可以檢索出: woman, women u如 coumput?可以檢索出Compute, Computer, Computing, computable200810 如:transplant?可以檢索出:transplant、transplanted、transplante

5、r 如: comput? 可以檢索出:compute;computer;computing200811通配符,無(wú)限截?cái)?% ?*“%國(guó)慶” 將檢索出所有字段為張國(guó)慶、歐陽(yáng)國(guó)慶、國(guó)慶等的記錄。 如:“熱電材料% ”將檢索出熱電材料梯度化、熱電材料及其梯度化等的記錄。2008122.3 鄰近檢索鄰近檢索u (W) with,(nW)n with 表示檢索算符兩側(cè)的詞顛倒順序,n表示兩個(gè)詞中間可以插入=n個(gè)的詞(如:an in by of the) 如:control(1w)system可以檢索出“control system” “control in system”等的信息。200813(N) n

6、ear ,(nN)n near 表示檢索算符兩側(cè)的詞顛倒順序,n表示兩個(gè)詞中間可以插入=n個(gè)的詞(如:an in by of the) 如:control system可以檢索出“control system” “system control”等的信息。200814(F) (L)(F)- in the same field 表示檢索算符兩側(cè)的詞必須同時(shí)出現(xiàn)在記錄的同一字段內(nèi)。(L)- link 表示檢索算符兩側(cè)的詞必須在數(shù)據(jù)庫(kù)界定的統(tǒng)一規(guī)范字段內(nèi)。且有一定的從屬關(guān)系,可以用來(lái)鏈接主標(biāo)題詞和副標(biāo)題詞。200815(S)-in the same subfield or same paragraph

7、 表示檢索算符兩側(cè)的詞只要在同一個(gè)子字段(文摘中的句子)或全文數(shù)據(jù)庫(kù)的一個(gè)段落中出現(xiàn)就是匹配。2008162.4 限制檢索限制檢索u針對(duì)特定年代、特定類(lèi)別、特定檢索點(diǎn)等作限制,包括前綴限制符和后綴限制符。后綴限制符例如:后綴限制符例如:/TI 限在題目中查限在題目中查/AB 限在文摘中查限在文摘中查/DE 限在敘詞標(biāo)引中查限在敘詞標(biāo)引中查前綴限制符例如:前綴限制符例如:AU= 限查特定作者限查特定作者JN= 限查特定刊名限查特定刊名 LA= 限查特定語(yǔ)種限查特定語(yǔ)種PN= 限查特定專(zhuān)利號(hào)限查特定專(zhuān)利號(hào)PY= 限查特定年代限查特定年代200817u如在谷歌和百度搜索引擎中的檢索特定的文獻(xiàn)類(lèi)型:

8、“報(bào)告 filetype:pdf ”檢索指定網(wǎng)址內(nèi)的信息: “報(bào)告 site:” 2008182.5 網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索u短語(yǔ)檢索(半角雙引號(hào))u自動(dòng)糾錯(cuò)檢索(如:李熬,你是不是要檢索李敖)u自動(dòng)轉(zhuǎn)換檢索(如:漢語(yǔ)拼音轉(zhuǎn)換成文字)u自然語(yǔ)言檢索u概念檢索(同義詞/近義詞/狹義詞,如搜索引擎Excite)u相關(guān)檢索2008192.6 其它檢索的表述其它檢索的表述u二次檢索/在結(jié)果內(nèi)檢索u精確檢索u模糊檢索u跨庫(kù)檢索/一站式檢索u擴(kuò)展檢索(類(lèi)似搜索引擎的概念檢索)u一般檢索/高級(jí)檢索/專(zhuān)家檢索/命令檢索u還有什么檢索?200820小結(jié)小結(jié)NO4-1u計(jì)算機(jī)信息檢索技術(shù)是用戶(hù)信息需求和文獻(xiàn)信息集合之間的匹配比較技術(shù)。、u幾乎所有的檢索系統(tǒng)都有布爾邏輯檢索、截詞檢索(模糊檢索)和限制檢索,而不同的檢索系統(tǒng)又會(huì)有一些特殊的檢索技術(shù)和功能。2008

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論