




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第一章信息檢索基礎(chǔ)知識第三節(jié)信息檢索系統(tǒng)案例:某研究生看到一篇文獻報道:1990年,一些科學(xué)家想將紫色的矮牽?;ㄗ兂缮钭仙麄儗⑸鼗蜣D(zhuǎn)入后,結(jié)果大出意料,許多花沒有變的更紫,而是變成了雜色,甚至白色,科學(xué)界對此感到極度困惑。指導(dǎo)1998年2月,安德魯·法爾和克雷格·梅洛發(fā)現(xiàn),在矮牽?;▽嶒炛兴^察到的現(xiàn)象,是因為生物體某些特定基因被抑制,出現(xiàn)了“基因沉默”,導(dǎo)致基因“沉默”機制的就是“RNA干擾”。隨后的研究中發(fā)現(xiàn),RNA干擾現(xiàn)象不僅在植物、動物體內(nèi)存在,在人體內(nèi)也存在。這種技術(shù)被認(rèn)為是未來直接從源頭上讓致病基因“沉默”,以治療癌癥甚至艾滋病等疾病的新療法。該研究生想進一步了解目前RNA干擾技術(shù)在艾滋病研究中的應(yīng)用,并將其作為自己的研究課題。問題:1.該研究生應(yīng)該使用那些檢索詞檢索這方面的文獻?2.該研究生應(yīng)如何構(gòu)建檢索表達式?分析:1.該研究課題主要涉及的概念含有“RNA干擾”和“艾滋病”,可使用這兩個檢索詞進行檢索,同時考慮其同義詞及英文形式的表述。檢索“RNA干擾”的概念可用:RNA干擾、RNAInterference、RNAi等;檢索“艾滋病”的概念可用愛滋病、獲得性免疫缺陷綜合征(癥)、acquiredimmunodeficiencysyndrome、AIDS等。2.根據(jù)不同數(shù)據(jù)庫提供的檢索功能,采用布爾邏輯檢索、截詞檢索、限定字段檢索、加權(quán)檢索等檢索技術(shù)進行檢索表達式的構(gòu)建(正文中案例的體現(xiàn)僅是常用檢索規(guī)則下的檢索表達式,具體應(yīng)用時還應(yīng)考慮不同數(shù)據(jù)庫對檢索規(guī)則的具體要求)。信息檢索技術(shù)是指在計算機檢索過程中為提高檢索提問詞與文獻記錄標(biāo)引詞的匹配效果而采用的相關(guān)技術(shù)。信息檢索時使用檢索技術(shù),有助于更為準(zhǔn)確、靈活的表達檢索需求,提高檢索效率。在計算機檢索環(huán)境下,信息可以是文本、圖像、視頻、音頻等形式,因此,信息檢索技術(shù)主要包括文本信息檢索技術(shù)、多媒體信息檢索技術(shù)和可視化信息檢索技術(shù)。一、文本信息檢索技術(shù)文本信息檢索是一種較為檢索的匹配模式。用戶在檢索時,有時一個檢索詞不能全面、準(zhǔn)確地反映檢索需求,這時就必須采用一定的檢索技術(shù)和方法來表達或規(guī)定各個檢索詞之間的邏輯關(guān)系。常用的文本信息檢索技術(shù)有;布爾邏輯檢索、截詞檢索、限定字段檢索、加權(quán)檢索、位置檢索以及其他常用的檢索技術(shù)。(一)布爾邏輯檢索布爾邏輯檢索是一種常用的檢索技術(shù)。在檢索過程中,檢索提問式涉及的概念往往不止一個,而同一個概念又往往涉及多個同義詞或相關(guān)詞。為了正確的表達檢索提問,系統(tǒng)中采用布爾邏輯運算符將多個簡單概念的檢索單元組配起來,成為一個具有復(fù)雜概念的檢索表達式,用以表達用戶的信息檢索要求。常用的邏輯算符主要有一下三種,其含義和用法如下圖,其中A圈代表含有A概念的文獻集合,B圈代表含有B概念的文獻集合,圖中陰影部分標(biāo)識邏輯運算后的檢索結(jié)果。1.邏輯“與”邏輯與,用“and”表示,檢索表達式為:AandB。檢出同時含有A和B的文獻記錄??s小檢索范圍,提高查準(zhǔn)率。
如:查找“胰島素治療糖尿病”的檢索式為insulin(胰島素)anddiabetes(糖尿?。?/p>
2.邏輯“或”邏輯或,用“or”表示,檢索式為AorB。檢出含有A,或含有B,或同時含有A和B的文獻記錄。擴大檢索范圍,提高查全率。
如:廣東藥學(xué)院OR廣東醫(yī)藥學(xué)院查找“腫瘤”的檢索式為cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)。3.邏輯“非”邏輯非,用“not”表示,檢索式為AnotB。檢出含有A的文獻記錄,并且去掉其中含有B的部分??s小檢索范圍
如:肝炎NOT病毒性肝炎查“動物的乙肝病毒(不要人的)”的文獻的檢索式為hepatitisBvirus(乙肝病毒)nothuman(人類)。欲檢索“除鋅以外其它微量元素分析”的有關(guān)文獻檢索提問式:
traceelements/analysisnotzinc/analysis
優(yōu)先級運算檢索式可以同時使用多個布爾算符,它們之間的優(yōu)先級是:“()>NOT>AND>OR”如(廣東藥學(xué)院OR廣東醫(yī)藥學(xué)院)AND藥學(xué)系
本案例中,依據(jù)課題要求,“RNA干擾”和“艾滋病”之間的邏輯運算關(guān)系為and,同時為保證檢索結(jié)果的查全率,加入其同義詞,最終表達式為(RNA干擾orRNAi)and(艾滋病or愛滋病or獲得性免疫缺陷綜合征or獲得性免疫缺陷綜合癥orAIDS);對應(yīng)的英文表達式為:(RNAInterferenceorRNAi)and(acquiredimmunodeficiencysyndromeorAIDS)布爾邏輯檢索不能體現(xiàn)概念之間的語義關(guān)系。同時,它把概念之間的關(guān)系簡單化,不能反映某個概念在檢索要求中的重要程度,造成誤檢;此外,“邏輯非”運算尤其要慎重,當(dāng)從含A概念的文獻集合中排出含有B概念的文獻時,會同時排出還有A概念的那部分文獻,造成漏檢。(二)截詞檢索
截詞檢索,就是把檢索詞截斷,取其中的一部分片斷,再加上截詞符號一起輸入檢索,計算機按照詞的片斷與數(shù)據(jù)庫里的索引詞對比匹配,凡包含有這些詞的片斷的文獻均被檢出。截詞檢索可以減少單詞的輸入量,擴大檢索結(jié)果。常用的截詞符號有*、?等,各種檢索系統(tǒng)可能采用不同的符號。①前截斷,后方一致:用于后綴相同的一類詞。如*computer,可檢出minicomputer,microcomputer等詞。②中截斷,前后一致:也稱“屏蔽”。常用于處理英美不同拼法及不規(guī)則單復(fù)數(shù)變化的檢索詞,如e*ology表示ecology,embryology,epidemiology,etiology等③后截斷,前方一致:在詞干后加一個截詞符,可檢出含有該詞干的所有檢索詞的文獻。如:cardi*表示cardiac,cardiomyocytes,cardiography,cardiologists等截詞檢索能自動對同一概念檢索詞的不同詞尾變化、檢索詞的單復(fù)數(shù)、詞根相同的一類詞以及同一詞的拼法變異等進行檢索,并用布爾邏輯運算符or組合檢索結(jié)果,減少檢索詞的輸入量,簡化檢索步驟,防止漏檢,提高了檢索結(jié)果的查全率。截詞檢索作為擴大檢索范圍的手段,一定要合理使用,否則會造成誤檢。本案例中“艾滋病(愛滋?。焙汀矮@得性免疫缺陷綜合征(癥)”可采用截詞檢索,檢索表達式可為(RNA干擾orRNAi)and(*滋病or獲得性免疫缺陷綜合*orAIDS)(三)限定字段檢索限定字段檢索是指限定檢索詞在數(shù)據(jù)庫記錄中的一個或幾個字段范圍內(nèi)查找文獻信息的一種檢索方法。使用限定字段檢索通常有兩種方式:①利用數(shù)據(jù)庫提供的限定字段的選項,選擇字段后,直接輸入檢索詞或布爾邏輯表達式進行檢索;②利用字段限定符和字段標(biāo)識符組合編輯檢索表達式檢索,不同數(shù)據(jù)庫規(guī)定使用的字段限定符不盡相同。如,在中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫中檢索本案例,可選擇“中文標(biāo)題”字段,輸入檢索表達式(RNA干擾orRNAi)and(艾滋病or愛滋病or獲得性免疫缺陷綜合征or獲得性免疫缺陷綜合癥orAIDS)來提高檢索結(jié)果的相關(guān)性;相對應(yīng)的,如果在Pubmed數(shù)據(jù)庫中,其表示為(RNAinterference[ti]orRNAi[ti])and(acquiredimmunodeficiencysyndrome[ti]orAIDS[ti]),其中[]為Pubmed數(shù)據(jù)庫中的字段限定。(四)位置檢索位置檢索也稱鄰近檢索,是一種利用記錄中的自然語言進行檢索的檢索技術(shù)。詞與詞之間通過用位置算符組配,限定運算符兩側(cè)的檢索詞必須同時出現(xiàn)在同一記錄(或指定某一字段)中。位置算符首先包括邏輯運算符and的含義,同時進一步限定由它連接的兩個檢索詞之間的位置關(guān)系。不同檢索系統(tǒng)在是否設(shè)有位置算符及位置算符的種類和形式等方面不盡相同。此處簡要列舉主要的位置算符及其含義:1.(W)-with,(W)表示該算符兩側(cè)的檢索詞必須按照輸入順序排列,且兩者之間只允許有一個空格或標(biāo)點符號,不允許有任何字母或詞,(W)也可以簡寫為()2.(nW)-nwith,(nW)表示在此算符兩側(cè)的檢索詞之間最多允許間隔n個詞(實詞或虛詞),且兩者的相對位置不能顛倒。3.(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 畜牧產(chǎn)品購銷合同書
- 股東內(nèi)部股權(quán)轉(zhuǎn)讓合同書
- 農(nóng)業(yè)機具采購合同范本
- 服裝漂染加工合同范本
- 童話風(fēng)創(chuàng)意幼兒教育趣味模板
- 購買磁性磨料合同范本
- 2025餐廳裝修合同模板2
- 2025廢料交易合同模板
- 第21講 平行四邊形與多邊形 2025年中考數(shù)學(xué)一輪復(fù)習(xí)講練測(廣東專用)
- 2025合伙經(jīng)營合同協(xié)議范本
- 2024年義務(wù)教育階段國家質(zhì)量監(jiān)測模擬測試
- 高一數(shù)學(xué)下學(xué)期考點精講+精練(人教A版2019必修第二冊)第六章平面向量及其應(yīng)用章末檢測卷(一)(原卷版+解析)
- 道法國測題附有答案
- 異地就醫(yī)備案的個人承諾書
- 航空航天概論智慧樹知到期末考試答案章節(jié)答案2024年西安航空學(xué)院
- 人教版七年級下冊生物重點知識提綱(填空版)
- 2024年河南水利與環(huán)境職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫審定版
- MOOC 宋詞經(jīng)典-浙江大學(xué) 中國大學(xué)慕課答案
- 個體診所備案信息表
- MOOC 工程材料學(xué)-華中科技大學(xué) 中國大學(xué)慕課答案
- 基于自由現(xiàn)金流折現(xiàn)模型的江中藥業(yè)估值分析
評論
0/150
提交評論