如何提高文獻(xiàn)檢索的查全率和查準(zhǔn)率_第1頁
如何提高文獻(xiàn)檢索的查全率和查準(zhǔn)率_第2頁
如何提高文獻(xiàn)檢索的查全率和查準(zhǔn)率_第3頁
如何提高文獻(xiàn)檢索的查全率和查準(zhǔn)率_第4頁
如何提高文獻(xiàn)檢索的查全率和查準(zhǔn)率_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、For personal use only in study and research; notfor commercial use如何提高文獻(xiàn)檢索的查全率和查準(zhǔn)率文獻(xiàn)檢索是科研的基本功,閱讀文獻(xiàn)是科研人員獲取科研信息的重要途徑。評(píng)價(jià)文獻(xiàn) 檢索質(zhì)量的兩個(gè)最重要的指標(biāo)是查全率和查準(zhǔn)率。查全率指的是檢出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫中相關(guān)文獻(xiàn)總量的比率,它反映該系統(tǒng)文獻(xiàn)庫中實(shí)有的相關(guān)文獻(xiàn)量在多大程度上被 檢索出來。查全率=檢出相關(guān)文獻(xiàn)量 /文獻(xiàn)庫內(nèi)相關(guān)文獻(xiàn)總量 X100%。查準(zhǔn)率指的是是指檢出 的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,是衡量信息檢索系統(tǒng)檢出文獻(xiàn)準(zhǔn)確度的尺度。查全 率=檢出的相關(guān)文獻(xiàn)篇數(shù)/檢出的

2、全部文獻(xiàn)篇數(shù) X 100%。查全率與查準(zhǔn)率在一定程度上是 成反比關(guān)系的,為了提高查全率就要以犧牲部分查準(zhǔn)率為代價(jià),反之亦然。在不同的情況 下,對(duì)二者的要求也不同,有時(shí)文獻(xiàn)的全面更為重要,這時(shí)就要以提高查全率為重點(diǎn),有時(shí)希望找到的文獻(xiàn)準(zhǔn)確率更高,就以提高查準(zhǔn)率為重點(diǎn)。本文討論的是怎樣提高文獻(xiàn)的查 全率。1檢索詞的轉(zhuǎn)換。常見的轉(zhuǎn)換是同義詞、近義詞、相關(guān)詞、單復(fù)數(shù)及縮寫形式,如果是動(dòng)詞還有可能有不同的時(shí)態(tài)。每一個(gè)檢索詞都有可能有多種表達(dá)形式,如果是由英文翻譯過來的還有可能有多種翻譯方法,所以應(yīng)該盡可能找全檢索詞的所有同義詞、近義詞。相關(guān)詞指的是與檢索詞不是同一個(gè)意思但是有關(guān)聯(lián)的詞。女口,META分析

3、的同義詞包括元分析、薈萃分析、meta-analysis,近義詞包括系統(tǒng)綜述,相關(guān)詞為循證醫(yī)學(xué)。前列腺癌的縮 寫可能是Pea等等。 值得注意的是,在檢索中文文獻(xiàn)的時(shí)候,有必要把英文的全稱和縮寫 也作為檢索詞,因?yàn)橛行┲形奈恼轮惺侵苯佑糜⑽脑~匯表示的。2使用截詞符。雖然從理論上來說我們找到所有的同義詞和近義詞可以擴(kuò)大檢索結(jié)果,但是要想做到這一點(diǎn)是相當(dāng)困難的。這時(shí)可以利用截詞符來幫忙。一般用的截詞符是? ”和“叮在不同的數(shù)據(jù)庫中表示的意思有所不同,常見的意思是? ”表示0-1個(gè)字符,而“* 表示多個(gè)字符。3使用上位詞,即指代范圍更廣的詞。有些檢索系統(tǒng)有主題詞途徑,則可以選用上位主題詞。例如水果是蘋

4、果的上位詞,prostatic neoplasm的上位主題詞是 prostatic disease4改變布爾運(yùn)算符,即將連接兩個(gè)或多個(gè)檢索詞的AND改為OR,即可提高檢出數(shù)量。5改變檢索項(xiàng)。如要求檢索詞位于標(biāo)題中或?yàn)殛P(guān)鍵詞或主題,檢出記錄數(shù)太少,則可改為 要求位于摘要或全文中,檢出記錄數(shù)即可增加。6減少限制條件,增加副主題詞。如果前面的檢索中有限制條件,放寬或去掉限制條件;如果采用的是主題詞和副主題詞搭配的形式,看是否漏掉可能的副主題詞。以上說的是在同一個(gè)數(shù)據(jù)庫中進(jìn)行檢索。但是,每一個(gè)數(shù)據(jù)庫所收錄的文獻(xiàn)都是有限的,而不同的數(shù)據(jù)庫可能存在一定的互補(bǔ)關(guān)系。所以為了提高查全率, 應(yīng)該多檢 索幾個(gè)數(shù)據(jù)

5、庫,將結(jié)果綜合起來。當(dāng)然前提條件是要了解每一個(gè)數(shù)據(jù)庫收錄期刊的范圍、起止年代等,因 為不排除有些小的數(shù)據(jù)庫完全是另外一個(gè)大數(shù)據(jù)庫的子集的情況,這時(shí)當(dāng)然完全沒有必要再檢索那個(gè)小的數(shù)據(jù)庫了。即使是將目前所有的數(shù)據(jù)庫加起來,也不能囊括所有的文獻(xiàn)。例如,有一些年代比較久遠(yuǎn)的,或者是期刊知名度不高的。所以,除了在數(shù)據(jù)庫中進(jìn)行檢索,還要輔以手工檢索。包括對(duì)一些重要的而數(shù)據(jù)庫中沒有收錄的期刊進(jìn)行手工檢索,在已經(jīng)查到的文獻(xiàn)的參考文獻(xiàn)”中或有些數(shù)據(jù)庫提供的相關(guān)文獻(xiàn)”中進(jìn)行查找,看有無漏網(wǎng)之魚”,還有,可以請(qǐng)教相關(guān)領(lǐng)域的專家,看看是否有重要的文獻(xiàn)沒有檢索到。一般我們檢索文獻(xiàn)不是英文的就是中文的,對(duì)于其它語種的則不

6、做要求。如果是要求查全 率很高,則可以檢索一些不常用的語種的文獻(xiàn),如日文、法文、德文等等。當(dāng)然如果自己 不會(huì)那門語言,即使查到了,閱讀也是一個(gè)問題。如果真是非常重要,不妨請(qǐng)人翻譯過來。、選擇檢索工具選擇恰當(dāng)?shù)臋z索工具,是成功實(shí)施檢索的關(guān)鍵。選擇檢索工具一定要根據(jù)檢索課題的內(nèi)容、性質(zhì)來確定。主要應(yīng)從以下幾個(gè)方面來考慮:(1) 從內(nèi)容上考慮檢索工具的報(bào)道文獻(xiàn)的學(xué)科專業(yè)范圍。對(duì)此可利用三次文獻(xiàn)如 國 外工具書指南、工具書指南、數(shù)據(jù)庫目錄等來了解各檢索工具(二次文獻(xiàn))的特點(diǎn)、所報(bào)道的學(xué)科專業(yè)范圍、所包括的語種及其所收錄的文獻(xiàn)類型等。(2)選擇檢索工具時(shí),應(yīng)以專業(yè)性檢索工具為主,綜合型檢索工具進(jìn)行配合、

7、補(bǔ)充。(3)在技術(shù)和手段上,由于計(jì)算機(jī)檢索系統(tǒng)適應(yīng)多點(diǎn)檢索、多屬性的檢索,檢索精度高,應(yīng)首選機(jī)檢工具,而且應(yīng)選擇合適的數(shù)據(jù)庫,目前許多檢索系統(tǒng)如DIALOG OCLC等都提供有從學(xué)科范疇選擇檢索工具的功能,可供用戶利用。如果只有手工檢索工具,應(yīng)選擇專業(yè)對(duì)口,文種熟悉、收錄文獻(xiàn)光,索引體系完善、報(bào)道及時(shí),揭示文獻(xiàn)信息準(zhǔn)確,有一定深度的手工檢索工具;如果一種檢索工具同時(shí)具有 機(jī)讀數(shù)據(jù)庫和印刷型文獻(xiàn)兩種形式,應(yīng)以檢索數(shù)據(jù)庫為主,這樣不僅可以提高檢索效率, 而且還能提高查準(zhǔn)率和查全率。(4)為避免檢索工具在編輯出版過程中的滯后性,在必要時(shí)則應(yīng)補(bǔ)充查找若干主要相 關(guān)期刊的現(xiàn)刊,以防漏檢。二、將分類途徑和

8、主題途徑結(jié)合提高查全率和查準(zhǔn)率1 分類途徑和主題途徑同時(shí)使用,提高查全和查準(zhǔn)率。在確定查新點(diǎn)后,查新員必須對(duì)照查新點(diǎn)進(jìn)行初查,即根據(jù)用戶提供的關(guān)鍵詞進(jìn)行檢 索,如一旦檢索結(jié)果為零,查新員需對(duì)相應(yīng)的主題詞進(jìn)行替換或通過擴(kuò)檢(檢索其上位類 詞),以期獲得相關(guān)文獻(xiàn),擴(kuò)檢的結(jié)果一定程度上會(huì)提高查全率,但其查準(zhǔn)率必然會(huì)下降, 為了兼顧查全率和查準(zhǔn)率,可通過檢索系統(tǒng)初步確定課題所屬的類目,然后在該類目下進(jìn) 行所選主題詞的檢索,這樣既可覆蓋課題類目,又可切準(zhǔn)課題主題。即在保證查全率的基 礎(chǔ)上提高查準(zhǔn)率。如“即食、熟食蓮藕軟罐頭工業(yè)化生產(chǎn)技術(shù)研究”這一課題,通過分析初步確定的檢 索策略為:"(即食+

9、熟食)* (藕+蓮藕)”,檢索后發(fā)現(xiàn)檢索結(jié)果為零,為此檢索策略擴(kuò)大到“藕+蓮藕”。檢索后雖有相關(guān)文獻(xiàn),但檢索結(jié)果過于泛濫,為了提高查準(zhǔn)度,通 過分析,本課題涉及的專業(yè)類目為“食品工業(yè)”,可在“食品工業(yè)”類目下,輸入主題詞“藕”,結(jié)果查到相關(guān)文獻(xiàn) 26篇,通過閱讀“即食藕”可用“方便藕”替代進(jìn)行檢索。2 從主題途徑入手,結(jié)合分類途徑對(duì)檢索策略進(jìn)行修正,提高查全和查準(zhǔn)率 在確定查新點(diǎn)后,為了提高查全率,查新員需對(duì)用戶提供的主題詞及相關(guān)詞進(jìn)行檢索, 其中相關(guān)詞的確定需要通過廣泛地閱讀相關(guān)文獻(xiàn)獲得,這不僅需要花費(fèi)大量的時(shí)間和精力, 而且由于閱讀量的不足還會(huì)造成一定程度的漏檢,為了提高查新效率和查全率,

10、可通過初 檢獲取相關(guān)主題的大類號(hào),然后在此類號(hào)下進(jìn)一步檢索以切準(zhǔn)主題。例如課題“差別化纖維氣流免漿加工法”,用戶提供的關(guān)鍵詞為差別化纖維、氣流、免漿等,經(jīng)初查發(fā)現(xiàn)差別化纖維是一類纖維,泛指對(duì)常規(guī)化纖有所創(chuàng)新或具有某一特性的 化學(xué)纖維,如陽離子改性聚酯POY低彈混纖網(wǎng)絡(luò)絲就屬差別化纖維,為了查全其多種組合形式的名稱,可先在差別化纖維所屬大類 TQ340(化學(xué)纖維,一般性問題)、TS342(合成纖維) 和TS102 (紡織纖維)下檢索,然后再進(jìn)行“氣流”的二次檢索,這樣既能顧及查全率,又 能提高查準(zhǔn)率。另外,檢索前對(duì)檢索策略進(jìn)行周密考慮,有助于檢索按合乎邏輯的方式進(jìn)行。但是在 檢索過程中,檢索者隨

11、時(shí)可能被引向新的檢索詞或新的檢索途徑。因此,隨時(shí)調(diào)整檢索策 略也是影響檢索成敗的關(guān)鍵環(huán)節(jié)。根據(jù)檢出文獻(xiàn)數(shù)量調(diào)整檢索策略,往往可使檢出結(jié)果達(dá) 到較理想的查全率和查準(zhǔn)率。僅供個(gè)人用于學(xué)習(xí)、研究;不得用于商業(yè)用途For personal use only in study and research; not for commercial use.Nur f u r den pers?nlichen f u r Studien, Forschung, zu kommerziellen Zwecken verwendet werden.Pour l ' e tude et la recherch

12、e uniquementa des fins personnelles; pasa des fins commerciales.to員bko gA.nrogeHKO TOpMenob3ymrnflCH6yHeHuac egoB u HHuefigoHMUCnO 員 B30BaTbCEb KOMMepqeckuxue 貝 ex.以下無正文僅供個(gè)人用于學(xué)習(xí)、研究;不得用于商業(yè)用途For personal use only in study and research; not for commercial use.Nur f u r den pers?nlichen f u r Studien, Forschung, zu kommerziellen Zwecken verwendet werden.Pour l '

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論