信息檢索技術(shù)_第1頁(yè)
信息檢索技術(shù)_第2頁(yè)
信息檢索技術(shù)_第3頁(yè)
信息檢索技術(shù)_第4頁(yè)
信息檢索技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二講 信息檢索技術(shù)課程主講內(nèi)容:課程主講內(nèi)容: 檢索語(yǔ)言檢索語(yǔ)言 檢索技術(shù)檢索技術(shù) 圖書(shū)館圖書(shū)館OPAC 中圖法介紹中圖法介紹信息檢索基本原理信息檢索基本原理 2.1 2.1 檢索語(yǔ)言檢索語(yǔ)言檢索語(yǔ)言:檢索語(yǔ)言:是描述是描述文獻(xiàn)特征、用于標(biāo)引和檢索的人工語(yǔ)言。文獻(xiàn)特征、用于標(biāo)引和檢索的人工語(yǔ)言。創(chuàng)建檢索語(yǔ)言的目的,是建立溝通標(biāo)引與檢索的橋梁,也是創(chuàng)建檢索語(yǔ)言的目的,是建立溝通標(biāo)引與檢索的橋梁,也是連接信息存儲(chǔ)和檢索兩個(gè)過(guò)程中標(biāo)引人員與檢索人員雙方思連接信息存儲(chǔ)和檢索兩個(gè)過(guò)程中標(biāo)引人員與檢索人員雙方思路的渠道。路的渠道。在存儲(chǔ)的過(guò)程中用于標(biāo)引信息稱為標(biāo)引語(yǔ)言;在存儲(chǔ)的過(guò)程中用于標(biāo)引信息稱為標(biāo)引

2、語(yǔ)言;用于編制索引就稱為索引語(yǔ)言;用于編制索引就稱為索引語(yǔ)言;用于信息檢索則稱為檢索語(yǔ)言。用于信息檢索則稱為檢索語(yǔ)言。檢索語(yǔ)言種類分類語(yǔ)言分類語(yǔ)言(classification languageclassification language)是用分類號(hào)表達(dá)各種概念的檢索標(biāo))是用分類號(hào)表達(dá)各種概念的檢索標(biāo)識(shí),將各種概念按學(xué)科性質(zhì)進(jìn)行系統(tǒng)排列,反映科學(xué)知識(shí)分類體系的檢索語(yǔ)識(shí),將各種概念按學(xué)科性質(zhì)進(jìn)行系統(tǒng)排列,反映科學(xué)知識(shí)分類體系的檢索語(yǔ)言。言。主題語(yǔ)言主題語(yǔ)言(subject languagesubject language)是直接以表達(dá)文獻(xiàn)主題的語(yǔ)詞作為檢索標(biāo))是直接以表達(dá)文獻(xiàn)主題的語(yǔ)詞作為檢索

3、標(biāo)識(shí),按字順編排并通過(guò)參照系統(tǒng)等方法提示詞間關(guān)系的檢索語(yǔ)言。識(shí),按字順編排并通過(guò)參照系統(tǒng)等方法提示詞間關(guān)系的檢索語(yǔ)言。代碼語(yǔ)言代碼語(yǔ)言(code languagecode language)是對(duì)事物的某一方面特征用某種代碼系統(tǒng)來(lái)加)是對(duì)事物的某一方面特征用某種代碼系統(tǒng)來(lái)加以標(biāo)引和排列的檢索語(yǔ)言。例如,根據(jù)化合物的分子式這種代碼語(yǔ)言,可以以標(biāo)引和排列的檢索語(yǔ)言。例如,根據(jù)化合物的分子式這種代碼語(yǔ)言,可以構(gòu)成分子式索引系統(tǒng),允許用戶從分子式出發(fā),檢索相應(yīng)的化合物及其相關(guān)構(gòu)成分子式索引系統(tǒng),允許用戶從分子式出發(fā),檢索相應(yīng)的化合物及其相關(guān)的文獻(xiàn)信息。的文獻(xiàn)信息。自然語(yǔ)言自然語(yǔ)言是直接從原始信息中抽取出

4、來(lái)的未經(jīng)規(guī)范化處理,用以揭示信息是直接從原始信息中抽取出來(lái)的未經(jīng)規(guī)范化處理,用以揭示信息主題概念的檢索語(yǔ)言主題概念的檢索語(yǔ)言。檢索語(yǔ)言檢索語(yǔ)言的類型的類型描述內(nèi)容描述內(nèi)容特征語(yǔ)言特征語(yǔ)言描述外表描述外表特征語(yǔ)言特征語(yǔ)言主題語(yǔ)言分類語(yǔ)言代碼語(yǔ)言責(zé)任者題名其他自然語(yǔ)言受控語(yǔ)言n關(guān)鍵詞語(yǔ)言(keyword) n標(biāo)題詞語(yǔ)言(heading) n單元詞語(yǔ)言(uniterm) n敘詞語(yǔ)言(descriptor)檢索語(yǔ)言種類檢索語(yǔ)言種類2.1.1 2.1.1 分類語(yǔ)言分類語(yǔ)言一種用分類號(hào)表達(dá)文獻(xiàn)中的各種概念,并以學(xué)科性質(zhì)為主一種用分類號(hào)表達(dá)文獻(xiàn)中的各種概念,并以學(xué)科性質(zhì)為主對(duì)各種概念加以分類和系統(tǒng)排列的文獻(xiàn)

5、信息檢索語(yǔ)言。對(duì)各種概念加以分類和系統(tǒng)排列的文獻(xiàn)信息檢索語(yǔ)言。通常以數(shù)字、字母或字母與數(shù)字相結(jié)合作為基本字符,通常以數(shù)字、字母或字母與數(shù)字相結(jié)合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號(hào))作為分隔符的書(shū)寫法,采用字符直接連接并以圓點(diǎn)(或其他符號(hào))作為分隔符的書(shū)寫法,以基本類目作為基本詞匯,以類目的從屬關(guān)系來(lái)表達(dá)復(fù)雜概念。以基本類目作為基本詞匯,以類目的從屬關(guān)系來(lái)表達(dá)復(fù)雜概念。優(yōu)點(diǎn):清楚反映類目之間的內(nèi)在聯(lián)系,包括從屬、并列、交替、優(yōu)點(diǎn):清楚反映類目之間的內(nèi)在聯(lián)系,包括從屬、并列、交替、相關(guān)等。相關(guān)等。 體系分類法體系分類法 將分類表中的全部類目列舉出來(lái),并按照將分類表中的全部類目列舉出

6、來(lái),并按照特定的等級(jí)系統(tǒng)將信息組織起來(lái)的一特定的等級(jí)系統(tǒng)將信息組織起來(lái)的一 種種分類方式。分類方式。如:中國(guó)圖書(shū)館分類法中國(guó)圖書(shū)館分類法 杜威十進(jìn)制圖書(shū)分類法杜威十進(jìn)制圖書(shū)分類法(Dewey Decimal Classification,DC或DDC) 組面分類法組面分類法 整個(gè)分類表全部由復(fù)分表組成,只給出一些基本概念(有關(guān)時(shí)代、地域、民族、語(yǔ)種、著作類型、體裁以及學(xué)科的總論性問(wèn)題等具有共性的子目)的劃分標(biāo)準(zhǔn),不給出實(shí)際使用的概念子項(xiàng)。 2.1.1 2.1.1 分類語(yǔ)言分類語(yǔ)言中圖法中圖法等級(jí)分明的科學(xué)系統(tǒng)等級(jí)分明的科學(xué)系統(tǒng) O 一級(jí)類目一級(jí)類目 數(shù)數(shù)、理、化、理、化 O1 O3 O4 O6

7、 O7 二級(jí)類目二級(jí)類目 數(shù)學(xué)數(shù)學(xué) 力學(xué)力學(xué) 物理化學(xué)物理化學(xué) 晶體晶體 O11O12 O13 三級(jí)類目三級(jí)類目古典數(shù)學(xué)古典數(shù)學(xué) 初等數(shù)學(xué)初等數(shù)學(xué) 高等數(shù)學(xué)高等數(shù)學(xué) O121 O122 O123 O124 四級(jí)類目四級(jí)類目 算術(shù)算術(shù) 初等代數(shù)初等代數(shù) 初等幾何初等幾何 三角三角2.1.1 2.1.1 分類語(yǔ)言分類語(yǔ)言國(guó)內(nèi)外常用的分類法有:國(guó)內(nèi): (1).中國(guó)圖書(shū)館分類法 (2).人民大學(xué)圖書(shū)館圖書(shū)分類法(人大法) 該分類法從1953起陸續(xù)在全國(guó)各圖書(shū)館試用,后經(jīng)過(guò)多次修訂再版,目前仍有許多圖書(shū)館采用該分類法。 (3).中國(guó)科學(xué)院圖書(shū)館圖書(shū)分類法(科圖 法) 該分類法主要用于中國(guó)科學(xué)院圖書(shū)館及其

8、所屬各科研單位的圖書(shū)館(室)。國(guó)外: (1).杜威十進(jìn)制分類法(Decimal Classification)簡(jiǎn)稱為杜威法,DDC 或DC 目前世界上使用最廣泛、影響最大的圖書(shū)分類法,已用于130多個(gè)國(guó)家的圖書(shū)館,許多分類法均是借鑒于杜威分類法產(chǎn)生的。 (2).美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法(Library of Congress classification)簡(jiǎn)稱為。 (3).國(guó)際十進(jìn)分類法(Universal Decimal Classification)簡(jiǎn)稱。 (4).國(guó)際專利分類法(International Patent Classification )簡(jiǎn)稱 IPC。2.1.2 2.1.2

9、 主題語(yǔ)言主題語(yǔ)言主題:一組具有共性事物的總稱,用以表達(dá)文獻(xiàn)所論述主題:一組具有共性事物的總稱,用以表達(dá)文獻(xiàn)所論述和研究的具體對(duì)象和問(wèn)題,即文獻(xiàn)的中心內(nèi)容。和研究的具體對(duì)象和問(wèn)題,即文獻(xiàn)的中心內(nèi)容。主題詞:表達(dá)主題概念的詞匯主題詞:表達(dá)主題概念的詞匯主題語(yǔ)言:以主題詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的語(yǔ)言,主題語(yǔ)言:以主題詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的語(yǔ)言,以自然語(yǔ)言的字符為字符,用一組名詞術(shù)語(yǔ)作為檢索標(biāo)識(shí)以自然語(yǔ)言的字符為字符,用一組名詞術(shù)語(yǔ)作為檢索標(biāo)識(shí)2.1.2 2.1.2 主題語(yǔ)言主題語(yǔ)言從形式上分從形式上分 正式主題詞正式主題詞非正式主題詞非正式主題詞 按照選詞方式的不同劃分按照選詞方式的不

10、同劃分 按照選詞方式的不同劃分按照選詞方式的不同劃分 標(biāo)題詞標(biāo)題詞單元詞單元詞敘詞敘詞關(guān)鍵詞關(guān)鍵詞2.1.2 2.1.2 主題語(yǔ)言主題語(yǔ)言最早使用的主題語(yǔ)言之一,以規(guī)范化的自然語(yǔ)義作為標(biāo)識(shí)最早使用的主題語(yǔ)言之一,以規(guī)范化的自然語(yǔ)義作為標(biāo)識(shí)來(lái)表示文獻(xiàn)涉及的主題概念。其中表達(dá)主題的詞語(yǔ)稱為標(biāo)題詞來(lái)表示文獻(xiàn)涉及的主題概念。其中表達(dá)主題的詞語(yǔ)稱為標(biāo)題詞從文獻(xiàn)內(nèi)容中抽選出來(lái)的最基本的詞匯,將代表最一般、從文獻(xiàn)內(nèi)容中抽選出來(lái)的最基本的詞匯,將代表最一般、最基本的、不可再分割的概念的詞作為單獨(dú)標(biāo)引文獻(xiàn)的單位最基本的、不可再分割的概念的詞作為單獨(dú)標(biāo)引文獻(xiàn)的單位單元詞是構(gòu)成標(biāo)題詞的組件,絕大部分單元詞都不是具體

11、的標(biāo)題。單元詞是構(gòu)成標(biāo)題詞的組件,絕大部分單元詞都不是具體的標(biāo)題。從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)。從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)。采用表示單元概念的規(guī)范化語(yǔ)詞的組配,對(duì)文獻(xiàn)內(nèi)容特征進(jìn)行描述。采用表示單元概念的規(guī)范化語(yǔ)詞的組配,對(duì)文獻(xiàn)內(nèi)容特征進(jìn)行描述。目前使用最廣泛的主題語(yǔ)言目前使用最廣泛的主題語(yǔ)言標(biāo)題詞語(yǔ)言標(biāo)題詞語(yǔ)言單元詞語(yǔ)言單元詞語(yǔ)言敘詞語(yǔ)言敘詞語(yǔ)言關(guān)鍵詞語(yǔ)言關(guān)鍵詞語(yǔ)言以關(guān)鍵詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的一種主題語(yǔ)言。以關(guān)鍵詞作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的一種主題語(yǔ)言。關(guān)鍵詞:關(guān)鍵詞:從信息單元的標(biāo)題、層次標(biāo)題、正文或摘要的內(nèi)容中抽出的、從信息單元的標(biāo)題、層次標(biāo)

12、題、正文或摘要的內(nèi)容中抽出的、能夠表征信息主題內(nèi)容的、具有實(shí)質(zhì)意義的詞語(yǔ)。能夠表征信息主題內(nèi)容的、具有實(shí)質(zhì)意義的詞語(yǔ)。關(guān)鍵詞法不受詞表控制,快捷簡(jiǎn)便。關(guān)鍵詞法不受詞表控制,快捷簡(jiǎn)便。關(guān)鍵詞基本不經(jīng)過(guò)規(guī)范處理,有時(shí)會(huì)影響文獻(xiàn)信息的查全率和查準(zhǔn)率關(guān)鍵詞基本不經(jīng)過(guò)規(guī)范處理,有時(shí)會(huì)影響文獻(xiàn)信息的查全率和查準(zhǔn)率。2.1.3 2.1.3 代碼語(yǔ)言、自然語(yǔ)言代碼語(yǔ)言、自然語(yǔ)言是指對(duì)事物的某方面特征,用某種代碼系統(tǒng)來(lái)表示和排列事物是指對(duì)事物的某方面特征,用某種代碼系統(tǒng)來(lái)表示和排列事物概念,從而提供檢索的檢索語(yǔ)言。概念,從而提供檢索的檢索語(yǔ)言。通常用數(shù)字、字母或用它們結(jié)合的形式或以分段的方式來(lái)表示通常用數(shù)字、字

13、母或用它們結(jié)合的形式或以分段的方式來(lái)表示其各部分的含義。其各部分的含義。適用:適用:科技報(bào)告、專利文獻(xiàn)科技報(bào)告、專利文獻(xiàn)代碼語(yǔ)言代碼語(yǔ)言自然語(yǔ)言自然語(yǔ)言直接從原始信息中抽取出來(lái)的未經(jīng)規(guī)范化處理,用以揭示信息直接從原始信息中抽取出來(lái)的未經(jīng)規(guī)范化處理,用以揭示信息主題概念的檢索語(yǔ)言。主題概念的檢索語(yǔ)言。抽取出來(lái)的詞包括抽取出來(lái)的詞包括自由詞、關(guān)鍵詞、事物名稱、科學(xué)術(shù)語(yǔ)、俗名、自由詞、關(guān)鍵詞、事物名稱、科學(xué)術(shù)語(yǔ)、俗名、商品型號(hào)和縮寫商品型號(hào)和縮寫等,等,具有不用編制詞表,及時(shí)跟上事物發(fā)展,準(zhǔn)確表達(dá)事物新概念,具有不用編制詞表,及時(shí)跟上事物發(fā)展,準(zhǔn)確表達(dá)事物新概念,選詞靈活方便,專指性強(qiáng),標(biāo)引和檢索速

14、度快等優(yōu)點(diǎn)。選詞靈活方便,專指性強(qiáng),標(biāo)引和檢索速度快等優(yōu)點(diǎn)。信息檢索語(yǔ)言的未來(lái)信息檢索語(yǔ)言的未來(lái) 圖書(shū)館學(xué)和情報(bào)學(xué)專家在對(duì)分類類目概念和主題詞概念的詞匯對(duì)應(yīng)研圖書(shū)館學(xué)和情報(bào)學(xué)專家在對(duì)分類類目概念和主題詞概念的詞匯對(duì)應(yīng)研究后證實(shí),類目與主題詞是可以完全對(duì)應(yīng)、基本對(duì)應(yīng)或組配對(duì)應(yīng)的,為究后證實(shí),類目與主題詞是可以完全對(duì)應(yīng)、基本對(duì)應(yīng)或組配對(duì)應(yīng)的,為編制類目與主題詞對(duì)照表提供了可靠依據(jù)。分類法與主題法在原理的一編制類目與主題詞對(duì)照表提供了可靠依據(jù)。分類法與主題法在原理的一致性,為實(shí)現(xiàn)分類主題一體化提供了基礎(chǔ)致性,為實(shí)現(xiàn)分類主題一體化提供了基礎(chǔ)。 分類法和主題法兩種方法各有所長(zhǎng),分類語(yǔ)言與主題語(yǔ)言有機(jī)結(jié)合

15、,分類法和主題法兩種方法各有所長(zhǎng),分類語(yǔ)言與主題語(yǔ)言有機(jī)結(jié)合,形成了分類主題一體化語(yǔ)言形成了分類主題一體化語(yǔ)言。 分類主題一體化的檢索功能,就是用戶除了可以獨(dú)立進(jìn)行分類檢索和分類主題一體化的檢索功能,就是用戶除了可以獨(dú)立進(jìn)行分類檢索和字順檢索并隨意轉(zhuǎn)換檢索方式外,還能通過(guò)分類與主題的相互限定改變字順檢索并隨意轉(zhuǎn)換檢索方式外,還能通過(guò)分類與主題的相互限定改變檢索范圍,達(dá)到最佳的搜索效果檢索范圍,達(dá)到最佳的搜索效果。分類主題一體化分類主題一體化2.2 2.2 常用檢索途徑常用檢索途徑 “檢索途徑檢索途徑”(approach)(approach)又稱為檢索點(diǎn)(又稱為檢索點(diǎn)(access pointa

16、ccess point), ,是檢索的入口點(diǎn)和出發(fā)點(diǎn)是檢索的入口點(diǎn)和出發(fā)點(diǎn) 利用信息的外部特征利用信息的外部特征( (題名、責(zé)任者、著者和出版者等題名、責(zé)任者、著者和出版者等) )和內(nèi)容特征和內(nèi)容特征( (分類號(hào)、主題詞分類號(hào)、主題詞和關(guān)鍵詞等和關(guān)鍵詞等) )來(lái)查詢相關(guān)的信息來(lái)查詢相關(guān)的信息 從文獻(xiàn)的特征出發(fā),將其特征值與檢索系統(tǒng)中標(biāo)目數(shù)據(jù)進(jìn)行計(jì)算比較,通過(guò)匹配達(dá)到從文獻(xiàn)的特征出發(fā),將其特征值與檢索系統(tǒng)中標(biāo)目數(shù)據(jù)進(jìn)行計(jì)算比較,通過(guò)匹配達(dá)到檢索目的。檢索目的。 反映文獻(xiàn)信息內(nèi)容特征:分類檢索和主題檢索;反映文獻(xiàn)信息內(nèi)容特征:分類檢索和主題檢索; 反映文獻(xiàn)外部特征:作者、名稱和號(hào)碼檢索等。反映文獻(xiàn)

17、外部特征:作者、名稱和號(hào)碼檢索等。 檢索語(yǔ)言與檢索途徑的關(guān)系檢索語(yǔ)言與檢索途徑的關(guān)系 2.3 2.3 常用檢索技術(shù)常用檢索技術(shù)檢索技術(shù)檢索技術(shù)利用光盤數(shù)據(jù)庫(kù)、聯(lián)機(jī)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、搜索引擎等利用光盤數(shù)據(jù)庫(kù)、聯(lián)機(jī)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、搜索引擎等進(jìn)行信息檢索時(shí)采用的相關(guān)技術(shù)。進(jìn)行信息檢索時(shí)采用的相關(guān)技術(shù)。常常 用用布爾邏輯檢索布爾邏輯檢索截詞檢索截詞檢索字段檢索字段檢索詞位置檢索詞位置檢索特殊檢索特殊檢索短語(yǔ)檢索短語(yǔ)檢索大小寫檢索大小寫檢索后幾種檢索技術(shù),使用運(yùn)算符連接,組合成檢索式2.3.1 2.3.1 布爾邏輯檢索布爾邏輯檢索用布爾邏輯算符用布爾邏輯算符(Boolean Logic opera

18、tor)(Boolean Logic operator)將檢索詞、短語(yǔ)或代碼進(jìn)將檢索詞、短語(yǔ)或代碼進(jìn)行邏輯組配來(lái)指定文獻(xiàn)的命中條件和組配次序,用以檢索出符合邏輯行邏輯組配來(lái)指定文獻(xiàn)的命中條件和組配次序,用以檢索出符合邏輯組配所規(guī)定條件的記錄。也是目前最常用的一種檢索技術(shù)。組配所規(guī)定條件的記錄。也是目前最常用的一種檢索技術(shù)。 邏輯與邏輯與AND AND * * 與與 并且并且并含并含 空格空格邏輯非邏輯非NOT, - NOT, - 非非不含不含排除無(wú)關(guān)排除無(wú)關(guān)結(jié)果結(jié)果提高查準(zhǔn)率提高查準(zhǔn)率邏輯或邏輯或OR + OR + 或者或者 擴(kuò)大搜索范圍,擴(kuò)大搜索范圍,提高查全率提高查全率2.3.1 2.3.

19、1 布爾邏輯檢索布爾邏輯檢索邏輯“與” 具有具有概念交叉或概念限定關(guān)系概念交叉或概念限定關(guān)系的組配,用的組配,用“* *”或或“AND”AND”算符表示(搜索引擎常用算符表示(搜索引擎常用“空格空格”表示)。表示)。 檢索詞檢索詞A A和檢索詞和檢索詞B B用用“與與”組配,檢索式為:組配,檢索式為:A AND BA AND B,或者,或者 A A * * B B 它表示檢出它表示檢出同時(shí)含有同時(shí)含有A A、B B兩個(gè)檢索詞兩個(gè)檢索詞的的記錄。記錄。 例:圖書(shū)館教育 library AND educationlibrary AND education2.3.1 2.3.1 布爾邏輯檢索布爾邏輯

20、檢索邏輯“或”一種具有一種具有概念并列關(guān)系概念并列關(guān)系的組配,用的組配,用“OR” OR” 或或“+”+”或或“|”“|”算符表示算符表示檢索詞檢索詞A和檢索詞和檢索詞B用用“或或”組配,檢索式為:組配,檢索式為:A OR BA OR B,或者,或者 A AB B 它表示檢出它表示檢出所有含有所有含有A詞或者詞或者B詞詞的記錄的記錄。 例:例: 會(huì)計(jì)會(huì)計(jì)準(zhǔn)則準(zhǔn)則 OR OR 會(huì)計(jì)核算會(huì)計(jì)核算 2.3.1 2.3.1 布爾邏輯檢索布爾邏輯檢索邏輯“非”邏輯邏輯“非非”是一種是一種具有概念排除關(guān)系具有概念排除關(guān)系的組配,用的組配,用“NOT” NOT” 或或“”算符表示。算符表示。檢索詞檢索詞A

21、A和檢索詞和檢索詞B B用用“非非”組配,檢索式為:組配,檢索式為:A Not BA Not B,或者,或者 A-BA-B它表示檢出它表示檢出含有含有A A詞,但同時(shí)不能含有詞,但同時(shí)不能含有B B詞詞的記錄。的記錄。例:例:能源-太陽(yáng)能 2.3.2 2.3.2 截詞檢索截詞檢索定義:用給定的詞干做檢索詞,用以檢索出含有該詞干的全部檢索詞的記錄。作用:擴(kuò)大檢索范圍、提高查全率、減少檢索詞的輸入量、節(jié)省檢索時(shí)間等作用。擴(kuò)大檢索范圍、提高查全率、減少檢索詞的輸入量、節(jié)省檢索時(shí)間等作用。用法:遇到名詞的單復(fù)數(shù)形式、詞的不同拼寫法、詞的前綴或后綴變化時(shí)遇到名詞的單復(fù)數(shù)形式、詞的不同拼寫法、詞的前綴或后

22、綴變化時(shí) 均可采用此方法。均可采用此方法。2.3.2 2.3.2 截詞檢索截詞檢索n后截?cái)嗪蠼財(cái)鄋中截?cái)嘀薪財(cái)鄋前截?cái)嗲敖財(cái)酂o(wú)限截?cái)嗳? economic? ?有限截?cái)鄀conomiceconomicseconomicsteconomiceconomicseconomicst如: economic*如:wom?nwomanwomen如: ?lish sul*ur sulfur sulphur 無(wú)限截?cái)嘤邢藿財(cái)鄋前后截?cái)嗲昂蠼財(cái)嗳? ?computer?可檢出: computer、computers、 computerize、computerized、minicomputer、minicompu

23、ters、microcomputer、microcomputers economicalism2.3.3 2.3.3 字段檢索字段檢索將檢索詞限定(將檢索詞限定( WithinWithin )在某個(gè)或某些字段中,用以檢索某個(gè)或某些字段含有)在某個(gè)或某些字段中,用以檢索某個(gè)或某些字段含有該檢索詞的記錄。該檢索詞的記錄。方式方式1 1、通過(guò)下拉菜單選擇檢索字段。此時(shí),字段名一般用全稱表示。、通過(guò)下拉菜單選擇檢索字段。此時(shí),字段名一般用全稱表示。 2.3.3 2.3.3 字段檢索字段檢索方式方式2 2、輸入檢索字段符限定檢索字段。、輸入檢索字段符限定檢索字段。 注意:注意:相同的字段在不同的數(shù)據(jù)庫(kù),

24、代碼可能不同,相同的字段在不同的數(shù)據(jù)庫(kù),代碼可能不同, 檢索時(shí)需要參閱數(shù)據(jù)庫(kù)代碼表。檢索時(shí)需要參閱數(shù)據(jù)庫(kù)代碼表。 2.3.4 2.3.4 詞位置檢索詞位置檢索又稱為又稱為“臨近檢索臨近檢索”,在檢索詞之間使用位置算符來(lái)規(guī)定,在檢索詞之間使用位置算符來(lái)規(guī)定算符兩邊算符兩邊的檢索詞的檢索詞出現(xiàn)在記錄中的位置,用以檢索出含有檢索詞且檢索詞之間的位置也符合特定出現(xiàn)在記錄中的位置,用以檢索出含有檢索詞且檢索詞之間的位置也符合特定要求的記錄。要求的記錄。類類 型型詞級(jí)位置算符詞級(jí)位置算符子字段級(jí)算符子字段級(jí)算符字段級(jí)算符字段級(jí)算符W、(nW)N、(nN)SF2.3.4 2.3.4 詞位置檢索詞位置檢索W算

25、符算符“With”With”的縮寫,表示此算符兩側(cè)的檢索詞必須按此前后鄰接的順序的縮寫,表示此算符兩側(cè)的檢索詞必須按此前后鄰接的順序排列,排列,順序不可顛倒順序不可顛倒,而且檢索詞之間,而且檢索詞之間不允許有其他的詞或字母不允許有其他的詞或字母,但允許有空格、標(biāo)點(diǎn)或連字符號(hào)。但允許有空格、標(biāo)點(diǎn)或連字符號(hào)。例例: : economic(W)recovery可檢出含可檢出含economic recovery和和economic-recovery的記錄。的記錄。 Wuhan(W)university :Wuhan University, Wuhan - University , 或Wuhan, Un

26、iversity(nW)此算符兩側(cè)的檢索詞之間此算符兩側(cè)的檢索詞之間允許插入允許插入n n個(gè)實(shí)詞或虛詞個(gè)實(shí)詞或虛詞,但兩個(gè)檢索詞的,但兩個(gè)檢索詞的次序還是不能顛倒。次序還是不能顛倒。例:economic(nW)recovery 通過(guò)Google檢出結(jié)果網(wǎng)頁(yè):https:/.hk/?gws_rd=ssl#q=economic(neW)+recoveryhttps:/.hk/?gws_rd=ssl#q=economic(neW)+recovery& &newwindownewwindow=1&safe=1&safe=strict&startstrict&start=10=102.3.4 2.3.4

27、 詞位置檢索詞位置檢索N算符算符例例: : Wuhan (N) universityWuhan University, Wuhan - University ,或Wuhan, UniversityUniversity, Wuhan ; University - Wuhan; University WuhannN此算符兩邊的此算符兩邊的檢索詞之間插入詞的最多數(shù)目是檢索詞之間插入詞的最多數(shù)目是 n n 個(gè)個(gè),且兩個(gè)檢索詞的,且兩個(gè)檢索詞的次序可以任意顛倒次序可以任意顛倒。例:economic(nN)recovery 通過(guò)Google檢出結(jié)果網(wǎng)頁(yè):https:/.hk/?gws_rd=ssl#q=e

28、conomic(nN)recovery&newwindow=1&safe=strict&nfpr=1&start=20“Near”Near”的縮寫,表示此算符兩側(cè)的檢索詞彼此的縮寫,表示此算符兩側(cè)的檢索詞彼此必須相鄰接必須相鄰接,但兩個(gè)檢索詞的但兩個(gè)檢索詞的前后關(guān)系可以顛倒前后關(guān)系可以顛倒, , 即查找兩個(gè)連在一起的單詞,即查找兩個(gè)連在一起的單詞,但但兩詞之間不能插入任何詞,可以有兩詞之間不能插入任何詞,可以有空格、標(biāo)點(diǎn)或連字符號(hào)。空格、標(biāo)點(diǎn)或連字符號(hào)。2.3.4 2.3.4 詞位置檢索詞位置檢索S算符算符F算符算符“Field”的縮寫,表示在此運(yùn)算符兩側(cè)的檢索詞必須的縮寫,表示在此運(yùn)算符兩側(cè)

29、的檢索詞必須同時(shí)出現(xiàn)在文獻(xiàn)記錄同時(shí)出現(xiàn)在文獻(xiàn)記錄的同一字段內(nèi)的同一字段內(nèi),如出現(xiàn)在篇名字段、文摘字段、敘詞字段、自由詞字段,如出現(xiàn)在篇名字段、文摘字段、敘詞字段、自由詞字段,但兩個(gè)詞的但兩個(gè)詞的前后順序不限前后順序不限,夾在兩個(gè)詞之間的,夾在兩個(gè)詞之間的詞的個(gè)數(shù)也不限詞的個(gè)數(shù)也不限。要求被連接的檢索詞出現(xiàn)在要求被連接的檢索詞出現(xiàn)在同一的字段中同一的字段中,字段類型和詞序均不限。,字段類型和詞序均不限。例:例: environmental(F) impact/DE,TIenvironmental(F) impact/DE,TI表示這兩個(gè)詞必須同時(shí)出現(xiàn)在敘詞表示這兩個(gè)詞必須同時(shí)出現(xiàn)在敘詞 字段和篇

30、名字段中。字段和篇名字段中。是是“Sub-field/Sentence”的縮寫,表示在此的縮寫,表示在此運(yùn)算符兩側(cè)運(yùn)算符兩側(cè)的檢索詞的檢索詞只要出現(xiàn)在記錄的只要出現(xiàn)在記錄的同一個(gè)子字段內(nèi)(例如在文摘中的一個(gè)短語(yǔ)、句子同一個(gè)子字段內(nèi)(例如在文摘中的一個(gè)短語(yǔ)、句子就是一個(gè)子字段)就是一個(gè)子字段),此信息即被命中。要求被連接的檢索詞必須同時(shí),此信息即被命中。要求被連接的檢索詞必須同時(shí)出現(xiàn)在記錄的同一句子(同一子字段)中,出現(xiàn)在記錄的同一句子(同一子字段)中,不限制它們?cè)诖俗幼侄沃胁幌拗扑鼈冊(cè)诖俗幼侄沃械南鄬?duì)次序的相對(duì)次序,中間插入詞的數(shù)量也不限中間插入詞的數(shù)量也不限。例:例: “high(W)str

31、ength(S)steel”表示只要在同一句子中檢索出含有“high strength ”和“steel”形式的均為命中記錄。2.3.5 2.3.5 特殊檢索技術(shù)特殊檢索技術(shù)短語(yǔ)檢索短語(yǔ)檢索大小寫檢索大小寫檢索在某些檢索系統(tǒng)中,還使用在某些檢索系統(tǒng)中,還使用雙引號(hào)雙引號(hào)“ ” 標(biāo)示不可分割的詞組或短語(yǔ)標(biāo)示不可分割的詞組或短語(yǔ),例:例:“tax accounting”,在檢索結(jié)果中,在檢索結(jié)果中tax accounting必須是必須是連在一起的詞組,才能專指稅務(wù)會(huì)計(jì)連在一起的詞組,才能專指稅務(wù)會(huì)計(jì)。針對(duì)大小寫具有不同含義的單詞或詞組,在檢索時(shí)需要注意其大小寫針對(duì)大小寫具有不同含義的單詞或詞組,在檢索時(shí)需要注意其大小寫格式,才能保證檢索結(jié)果的準(zhǔn)確性。格式,才能保證檢索結(jié)果的準(zhǔn)確性。例:例:CHINA CHINA 中國(guó)中國(guó) china china 瓷器;瓷器;APPLE APPLE 蘋果手機(jī)蘋果手機(jī) apple apple 蘋果蘋果 Windows AND design 視窗設(shè)計(jì) windows AND design 窗戶設(shè)計(jì)2.3.6 2.3.6 檢索式檢索式

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論