第一節(jié)信息檢索及其類型第二節(jié)信息檢索語言第三節(jié)信息檢_第1頁
第一節(jié)信息檢索及其類型第二節(jié)信息檢索語言第三節(jié)信息檢_第2頁
第一節(jié)信息檢索及其類型第二節(jié)信息檢索語言第三節(jié)信息檢_第3頁
第一節(jié)信息檢索及其類型第二節(jié)信息檢索語言第三節(jié)信息檢_第4頁
第一節(jié)信息檢索及其類型第二節(jié)信息檢索語言第三節(jié)信息檢_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一節(jié)第一節(jié) 信息檢索及其類型信息檢索及其類型第二節(jié)第二節(jié) 信息檢索語言信息檢索語言第三節(jié)第三節(jié) 信息檢索技術(shù)信息檢索技術(shù)第四節(jié)第四節(jié) 檢索工具檢索工具第二章第二章 信息檢索基礎(chǔ)知識信息檢索基礎(chǔ)知識第一節(jié)第一節(jié) 信息檢索及其類型信息檢索及其類型一、一、信息檢索的概念信息檢索的概念二、二、信息檢索的類型信息檢索的類型三、三、信息檢索的意義信息檢索的意義一、信息檢索一、信息檢索 信息檢索:是指將信息信息檢索:是指將信息(主要指文獻信息)按一定(主要指文獻信息)按一定的方式組織和存儲起來,并的方式組織和存儲起來,并根據(jù)用戶的需要找出相關(guān)信根據(jù)用戶的需要找出相關(guān)信息的過程。息的過程。 信息檢索信息檢索

2、存儲存儲檢索檢索存儲:是對信息進行著錄、存儲:是對信息進行著錄、標引、整序,編制檢索工標引、整序,編制檢索工具和建立檢索系統(tǒng)的過程。具和建立檢索系統(tǒng)的過程。檢索:是指面向信息需求檢索:是指面向信息需求而進行高度選擇性的查找而進行高度選擇性的查找過程。過程。原始文獻原始文獻加工整理加工整理數(shù)據(jù)庫數(shù)據(jù)庫提提 問問檢檢 索索輸輸 出出存存 儲儲檢檢 索索二、信息檢索的類型二、信息檢索的類型(一)按檢索內(nèi)容劃分(一)按檢索內(nèi)容劃分2、數(shù)據(jù)檢索數(shù)據(jù)檢索 是以數(shù)據(jù)為檢索內(nèi)容的信息檢索,要求從檢是以數(shù)據(jù)為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲的大量原始調(diào)查數(shù)據(jù)和其它統(tǒng)計數(shù)據(jù)中索系統(tǒng)存儲的大量原始調(diào)查數(shù)據(jù)和其

3、它統(tǒng)計數(shù)據(jù)中查出所需的數(shù)字資料查出所需的數(shù)字資料。1 1、書目檢索、書目檢索 是以文獻線索為檢索內(nèi)容的信息檢索。是以文獻線索為檢索內(nèi)容的信息檢索。3 3、事實檢索、事實檢索 是以具體事項為檢索內(nèi)容的信息檢索,要求從檢索是以具體事項為檢索內(nèi)容的信息檢索,要求從檢索系統(tǒng)存儲的各種原始信息資源中查出專門的事實材料。系統(tǒng)存儲的各種原始信息資源中查出專門的事實材料。4 4、全文檢索、全文檢索 即檢索系統(tǒng)存儲的是整篇文章或整本圖書。即檢索系統(tǒng)存儲的是整篇文章或整本圖書。5 5、圖像檢索、圖像檢索 即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。6 6、多媒體檢索

4、、多媒體檢索 是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的信息檢索。信息檢索。 (二)按是否使用檢索工具劃分(二)按是否使用檢索工具劃分 1 1、直接檢索、直接檢索 就是指利用一次文獻進行檢索,這是以前比較常用的就是指利用一次文獻進行檢索,這是以前比較常用的一種查找方法。所花時間多和精力大,檢出文獻少。一種查找方法。所花時間多和精力大,檢出文獻少。 2 2、間接檢索、間接檢索 就是指利用各種檢索工具獲得文獻線索,再根據(jù)線索就是指利用各種檢索工具獲得文獻線索,再根據(jù)線索去查找原始文獻線索的方法。去查找原始文獻線索的方法。 (三)按信息檢索手段劃分(三)

5、按信息檢索手段劃分 1 1、傳統(tǒng)信息檢索、傳統(tǒng)信息檢索 就是手工信息檢索,是利用各種印刷型檢索工具來就是手工信息檢索,是利用各種印刷型檢索工具來查找文獻的一種方法。查找文獻的一種方法。 2 2、現(xiàn)代信息檢索、現(xiàn)代信息檢索 現(xiàn)代信息檢索即計算機信息檢索,是指利用計算機現(xiàn)代信息檢索即計算機信息檢索,是指利用計算機和網(wǎng)絡(luò)來處理和查找文獻信息的檢索方式。和網(wǎng)絡(luò)來處理和查找文獻信息的檢索方式。1、信息檢索是現(xiàn)代人才的基本生存技能、信息檢索是現(xiàn)代人才的基本生存技能2、信息檢索是現(xiàn)代人才信息素質(zhì)的重要方面、信息檢索是現(xiàn)代人才信息素質(zhì)的重要方面3、信息檢索是科學(xué)交流的重要途徑、信息檢索是科學(xué)交流的重要途徑4、

6、信息檢索是開發(fā)信息資源的工具、信息檢索是開發(fā)信息資源的工具5、信息檢索是管理決策的基礎(chǔ)、信息檢索是管理決策的基礎(chǔ)6、信息檢索是繼承和借鑒前人成果,避免重、信息檢索是繼承和借鑒前人成果,避免重 復(fù)研究的必由之路復(fù)研究的必由之路7、信息檢索是治學(xué)之道、信息檢索是治學(xué)之道三、信息檢索的意義三、信息檢索的意義第二節(jié)第二節(jié) 信息檢索語言信息檢索語言一、一、檢索語言的含義及作用檢索語言的含義及作用二、二、檢索語言的類型檢索語言的類型一、檢索語言的含義及作用一、檢索語言的含義及作用檢索語言:檢索語言:是根據(jù)檢索需要而創(chuàng)造的一種人工語言。是根據(jù)檢索需要而創(chuàng)造的一種人工語言。作用:作用:1、保證不同標引人員表征

7、文獻信息的一致性。、保證不同標引人員表征文獻信息的一致性。 2、使內(nèi)容相同及相關(guān)的文獻集中化。、使內(nèi)容相同及相關(guān)的文獻集中化。 3、保證檢索提問與文獻信息標引的一致性。、保證檢索提問與文獻信息標引的一致性。 4、保證檢索者按不同需求檢索文獻信息時,、保證檢索者按不同需求檢索文獻信息時, 都能獲得最高的查全率和查準率。都能獲得最高的查全率和查準率。二、檢索語言的類型二、檢索語言的類型檢索語言的類型檢索語言的類型表述文獻外表表述文獻外表特征的語言特征的語言表述文獻內(nèi)容表述文獻內(nèi)容特征的語言特征的語言題名題名責任者責任者號碼號碼引文引文分類法分類法主題法主題法標題詞法標題詞法敘詞法敘詞法關(guān)鍵詞法關(guān)鍵

8、詞法分類語言分類語言 按知識門類的邏輯次序?qū)⑿畔⑾到y(tǒng)地組織和按知識門類的邏輯次序?qū)⑿畔⑾到y(tǒng)地組織和劃分的語言,具體體現(xiàn)為用分類號和類名來表達劃分的語言,具體體現(xiàn)為用分類號和類名來表達信息的主題概念。信息的主題概念。 中國圖書館圖書分類法中國圖書館圖書分類法 美國國會圖書館分類法美國國會圖書館分類法 杜威十進位分類法杜威十進位分類法 IPCIPC國際專利分類法國際專利分類法 標題詞語言標題詞語言 是從文獻的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范是從文獻的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范化處理的主題語言?;幚淼闹黝}語言。關(guān)鍵詞語言關(guān)鍵詞語言 直接從文獻信息的標題、摘要或內(nèi)容本身抽直接從文獻信息的標題、摘要或內(nèi)

9、容本身抽取出來的用于揭示信息主題內(nèi)容的自由詞。取出來的用于揭示信息主題內(nèi)容的自由詞。敘詞語言敘詞語言 是以表達文獻主題內(nèi)容的概念單元為基礎(chǔ),是以表達文獻主題內(nèi)容的概念單元為基礎(chǔ),經(jīng)過規(guī)范化處理,可以進行邏輯組配的一種主語經(jīng)過規(guī)范化處理,可以進行邏輯組配的一種主語語言。語言。第三節(jié)第三節(jié) 檢索技術(shù)檢索技術(shù)一、一、概念檢索概念檢索二、二、布爾邏輯運算符組配檢索布爾邏輯運算符組配檢索三、三、截詞檢索截詞檢索四、四、字段限制檢索字段限制檢索五、五、位置運算符位置運算符六、六、檢索技巧和方法檢索技巧和方法一、概念檢索一、概念檢索 檢索標識是具體的檢索詞或詞組,每檢索標識是具體的檢索詞或詞組,每個檢索詞表

10、達一個概念,具體檢索時,將個檢索詞表達一個概念,具體檢索時,將檢索詞與數(shù)據(jù)庫中的文獻特征標識進行類檢索詞與數(shù)據(jù)庫中的文獻特征標識進行類比,兩者相同,則該記錄為命中文獻。比,兩者相同,則該記錄為命中文獻。二、二、 布爾邏輯算符組配檢索布爾邏輯算符組配檢索 布爾邏輯組配運算是采用布爾代數(shù)中的布爾邏輯組配運算是采用布爾代數(shù)中的邏輯邏輯“與與”邏輯邏輯“或或”、邏輯、邏輯“非非”等算符,等算符,將檢索提問式轉(zhuǎn)換成邏輯表達式,限定檢索將檢索提問式轉(zhuǎn)換成邏輯表達式,限定檢索詞在記錄中必須存在的條件或不能出現(xiàn)的條詞在記錄中必須存在的條件或不能出現(xiàn)的條件。凡符合布爾邏輯所規(guī)定的條件的文獻,件。凡符合布爾邏輯所

11、規(guī)定的條件的文獻,既為命中文獻。既為命中文獻。 布爾邏輯運算符布爾邏輯運算符1、邏輯、邏輯“或或”2、邏輯、邏輯“與與”3、邏輯、邏輯“非非” 1、邏輯、邏輯“或或”(和)(和)AB用符號用符號“or”或或“+”表示,其邏輯表達式為:表示,其邏輯表達式為: A or B 或或 A+B 其意義為檢索記錄中凡含有檢索詞其意義為檢索記錄中凡含有檢索詞A或檢索詞或檢索詞B,或同時含有檢索詞或同時含有檢索詞A和和B的,均為命中文獻。的,均為命中文獻。 2、邏輯、邏輯“與與”AB用符號用符號“and”或或“*”表示,其邏輯表達式為:表示,其邏輯表達式為: A * B 或或 A and B 其意義為檢索記錄

12、中必須同時含有檢索詞其意義為檢索記錄中必須同時含有檢索詞A和和B的文獻,才算命中文獻。的文獻,才算命中文獻。 3、邏輯邏輯“非非” AB用符號用符號“not”或或“-”,其邏輯表達式為:,其邏輯表達式為: A not B 或或 A-B 其意義為:檢索記錄中含有檢索詞其意義為:檢索記錄中含有檢索詞A,但不能,但不能含有檢索詞含有檢索詞B的文獻,才算命中文獻。的文獻,才算命中文獻。三、截詞檢索三、截詞檢索 截詞檢索主要是利用檢索詞的詞干或不完整的詞形進截詞檢索主要是利用檢索詞的詞干或不完整的詞形進行檢索。行檢索。 截詞符一般用截詞符一般用“?”、“ :”、“#”表示表示1、后方截詞、后方截詞:用于

13、前方一致的派生詞檢索。:用于前方一致的派生詞檢索。 如:信息如:信息? 則表示在數(shù)據(jù)庫中含有信息、信息技術(shù)、信息檢索等則表示在數(shù)據(jù)庫中含有信息、信息技術(shù)、信息檢索等方面的文獻記錄均為命中文獻。方面的文獻記錄均為命中文獻。2、前方截詞、前方截詞:用于后方一致的派生詞檢索。:用于后方一致的派生詞檢索。 如:?經(jīng)濟如:?經(jīng)濟 則數(shù)據(jù)庫中含有經(jīng)濟、工業(yè)經(jīng)濟、農(nóng)業(yè)經(jīng)濟等方面的則數(shù)據(jù)庫中含有經(jīng)濟、工業(yè)經(jīng)濟、農(nóng)業(yè)經(jīng)濟等方面的文獻均為命中文獻。文獻均為命中文獻。 3、有限截詞、有限截詞 在檢索詞后面加上一個或一個以上(最多在檢索詞后面加上一個或一個以上(最多4個)的個)的“?”,空一格,再加一個,空一格,再加

14、一個“?”。如:。如: Comput? ? 可檢索出:可檢索出: Computer,Computers,Computing 截詞檢索在不同的計算機檢索系統(tǒng)中規(guī)截詞檢索在不同的計算機檢索系統(tǒng)中規(guī)定不同,請使用時注意。定不同,請使用時注意。四、字段限制檢索四、字段限制檢索 為了縮小檢索范圍,可利用字段代碼來限制為了縮小檢索范圍,可利用字段代碼來限制檢索詞出現(xiàn)的字段,以提高檢索速度和命中率。檢索詞出現(xiàn)的字段,以提高檢索速度和命中率。 如:如:rice in ti(表示只在題目字段中查找文獻)(表示只在題目字段中查找文獻) rice in de(只在主題詞中查找)(只在主題詞中查找) rice in

15、ab(只在文摘中查找)(只在文摘中查找) au = Smith,J.C (查作者為查作者為Smith,J.C 的的 文章文章) py = 1998(只查只查1998年的文章年的文章) la =Chinese (只查語種為中文的文獻只查語種為中文的文獻) 五、位置運算符五、位置運算符WithWith:設(shè)定需檢索的兩個詞或詞組在同一字段中,但設(shè)定需檢索的兩個詞或詞組在同一字段中,但不限制位置的先后。不限制位置的先后。NearNear:設(shè)定需檢索的兩個詞或詞組在同一語句中,相設(shè)定需檢索的兩個詞或詞組在同一語句中,相對于對于“with”with”更接近。此外,在使用更接近。此外,在使用“near”ne

16、ar”運算符運算符時,還可以在該運算符后添加一個數(shù)字以便進一步限時,還可以在該運算符后添加一個數(shù)字以便進一步限定兩個詞之間的鄰近程度,如定兩個詞之間的鄰近程度,如“near3” near3” 設(shè)定需檢索設(shè)定需檢索的兩個詞或詞組在同一句子中且相隔不超過的兩個詞或詞組在同一句子中且相隔不超過3 3個單詞。個單詞。 1 1、檢索策略、檢索策略 計算機檢索,實際上是由計算機將用戶輸入的檢計算機檢索,實際上是由計算機將用戶輸入的檢索策略與系統(tǒng)中存儲的文獻特征標識及邏輯組配關(guān)系索策略與系統(tǒng)中存儲的文獻特征標識及邏輯組配關(guān)系進行類比、匹配,并把完全匹配的文獻輸出的過程。進行類比、匹配,并把完全匹配的文獻輸出

17、的過程。 檢索策略檢索策略是科學(xué)地運用檢索詞和邏輯運算符正確是科學(xué)地運用檢索詞和邏輯運算符正確地構(gòu)造邏輯提問式的原則和方法。其核心內(nèi)容在于檢地構(gòu)造邏輯提問式的原則和方法。其核心內(nèi)容在于檢索策略的構(gòu)造與檢索的步驟。索策略的構(gòu)造與檢索的步驟。 六、檢索的技巧和方法六、檢索的技巧和方法 A A、弄清用戶的提問要求,并確定要查找的文獻、弄清用戶的提問要求,并確定要查找的文獻 學(xué)科范圍、類型、文種、時間等。學(xué)科范圍、類型、文種、時間等。 B B、選擇相關(guān)的數(shù)據(jù)庫并確定在待檢數(shù)據(jù)庫中的、選擇相關(guān)的數(shù)據(jù)庫并確定在待檢數(shù)據(jù)庫中的 檢檢索途徑,以便制定適合所選擇數(shù)據(jù)庫的檢索策略。索途徑,以便制定適合所選擇數(shù)據(jù)庫

18、的檢索策略。 C C、對情報提問進行概念分析、對情報提問進行概念分析 D D、擬定檢索邏輯式、擬定檢索邏輯式 E E、對數(shù)據(jù)庫文檔進行查找,檢出相關(guān)文獻并分析、對數(shù)據(jù)庫文檔進行查找,檢出相關(guān)文獻并分析檢索結(jié)果。檢索結(jié)果。 F F、如有必要,對提問式進行反饋、修改,重復(fù)第、如有必要,對提問式進行反饋、修改,重復(fù)第五步,直到用戶滿意為止。五步,直到用戶滿意為止。制定檢索策略的步驟:制定檢索策略的步驟:A A、擴大檢索范圍、擴大檢索范圍2、檢索技巧和方法、檢索技巧和方法* * 概念的擴大。概念的擴大。* * 范圍的擴大。范圍的擴大。* * 增加同義詞、近義詞、相關(guān)詞和縮略詞。增加同義詞、近義詞、相關(guān)

19、詞和縮略詞。* * 用用“or”or”、”?”?”、敘詞表、敘詞表* * 年代的擴大。年代的擴大。* * 去掉連字符可擴大檢索范圍。去掉連字符可擴大檢索范圍。* * 換另外的數(shù)據(jù)庫或是另外的光盤繼續(xù)進行檢索。換另外的數(shù)據(jù)庫或是另外的光盤繼續(xù)進行檢索。B B、縮小檢索范圍的方法、縮小檢索范圍的方法* * 核心概念的限定。核心概念的限定。* * 核心期刊的限定。核心期刊的限定。* * 語種的限定。語種的限定。* * 用布爾邏輯算符用布爾邏輯算符“and”and”或者或者“not”not”組組配檢配檢 索詞。索詞。* * 使用位置算符使用位置算符“near”near”和字段算符和字段算符“in”in”提提 高查準率。高查準率。* * 使用使用“Index”Index”和敘詞表和敘詞表, ,選擇確切的檢選擇確切的檢索索 詞縮小檢索范圍詞縮小檢索范圍第四節(jié)第四節(jié) 檢索工具檢索工具 檢索工具:檢索工具:是在不同學(xué)科范圍內(nèi)對是在不同學(xué)科范圍內(nèi)對某階段出版的有關(guān)文獻進行收集、整理某階段出版的有關(guān)文獻進行收集、整理或?qū)π挛墨I加以及時報道的二次文獻。或?qū)π挛墨I加以及時報

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論