第二章 信息檢索基礎(chǔ)知識(shí)_第1頁
第二章 信息檢索基礎(chǔ)知識(shí)_第2頁
第二章 信息檢索基礎(chǔ)知識(shí)_第3頁
第二章 信息檢索基礎(chǔ)知識(shí)_第4頁
第二章 信息檢索基礎(chǔ)知識(shí)_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

秦明玉信息檢索信息檢索第二章信息檢索基礎(chǔ)知識(shí)引言科學(xué)研究需要“站在巨人的肩膀上”,在前人研究的終點(diǎn)上發(fā)現(xiàn)新的起點(diǎn),學(xué)會(huì)高效率地檢索和發(fā)現(xiàn)相關(guān)學(xué)術(shù)資源是幫助你站在巨人肩膀上的捷徑。根據(jù)美國科學(xué)基金會(huì)的統(tǒng)計(jì)——科研人員花費(fèi)在文獻(xiàn)檢索上的時(shí)間提高信息檢索的效率勢在必行第二章信息檢索基礎(chǔ)知識(shí)

第一節(jié)信息檢索原理第二節(jié)信息檢索分類第三節(jié)信息檢索語言第四節(jié)信息檢索的方法和途徑第五節(jié)信息檢索常用技術(shù)第六節(jié)信息檢索的步驟第一節(jié)信息檢索原理一、信息檢索的概念廣義的信息檢索是指將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)用戶的需要找出有關(guān)信息的過程,所以它的全稱又叫“信息的存儲(chǔ)與檢索”。狹義的信息檢索則僅指該過程的后半部分,即從信息集合中找出所需要信息的過程,也就是我們常說的信息查詢。(1)信息標(biāo)引和存儲(chǔ)過程。(2)信息的需求分析和檢索過程

二、信息檢索原理概述

信息標(biāo)引和存儲(chǔ)

原始信息

信息主題

數(shù)據(jù)庫記錄及信息特征標(biāo)識(shí)

信息需求分析與檢索

信息需求

檢索主題

檢索提問式及提問標(biāo)識(shí)信息檢索工具(系統(tǒng))

檢索結(jié)果

主題概念分析抽出主題詞,分類號,及其他特征著錄標(biāo)引比較、匹配輸出主題概念分析選定編制檢索標(biāo)識(shí)和檢索策略檢索語言(主題詞表)存儲(chǔ)起來輸入信息檢索原理圖信息檢索的實(shí)質(zhì)是將描述用戶所需信息的提問特征與信息存儲(chǔ)的檢索標(biāo)識(shí)進(jìn)行比較,從中找出與提問特征一致或基本一致的信息。所謂提問特征就是對信息的需求分析后,從中選出能代表信息需求的主題詞、分類號或其它符號。檢索標(biāo)識(shí)是信息存儲(chǔ)時(shí),對信息內(nèi)容進(jìn)行分析提出能代表信息內(nèi)容實(shí)質(zhì)的主題詞、分類號或其它符號。三、信息檢索系統(tǒng)1、信息檢索系統(tǒng)的概念信息檢索系統(tǒng)是指根據(jù)一定的需要,為進(jìn)行信息傳遞而建立的一種有序化的信息集合體,并能向用戶提供信息服務(wù)的多功能開放系統(tǒng)。任何具有信息存貯與檢索功能的系統(tǒng),均可以稱為信息檢索系統(tǒng)。檢索系統(tǒng)應(yīng)具備下述三個(gè)條件:(1)詳細(xì)記錄所著錄文獻(xiàn)線索,讀者可根據(jù)這些線索查找所需文獻(xiàn)。(2)根據(jù)檢索標(biāo)識(shí),如分類號、主題詞、文獻(xiàn)號、代碼等尋找所需文獻(xiàn)。(3)提供檢索的必要手段,如分類索引、主題索引等,便于讀者檢索。2、信息檢索系統(tǒng)的功能:

報(bào)道文獻(xiàn)信息、存儲(chǔ)文獻(xiàn)信息、檢索文獻(xiàn)信息3、信息檢索系統(tǒng)的類型(1)按照信息檢索所采用的設(shè)備和手段劃分手工信息檢索系統(tǒng):手工檢索系統(tǒng)是以手工方式存貯和檢索信息的系統(tǒng)。檢索時(shí)使用各種紙質(zhì)工具,檢索入口少、速度慢、效率較低。手工信息檢索系統(tǒng)又可分為:書本式檢索系統(tǒng)和卡片式檢索系統(tǒng)。計(jì)算機(jī)信息檢索系統(tǒng):計(jì)算機(jī)檢索系統(tǒng)是用計(jì)算機(jī)進(jìn)行信息存貯和檢索的系統(tǒng)。檢索時(shí)使用各種數(shù)據(jù)庫,檢索靈活、檢索入口多、速度快、效率高。計(jì)算機(jī)信息檢索系統(tǒng)又可分為:光盤檢索系統(tǒng)、聯(lián)機(jī)檢索系統(tǒng)和網(wǎng)絡(luò)檢索系統(tǒng)。書本式卡片式(2)按揭示信息內(nèi)容的程度劃分按揭示信息內(nèi)容的程度劃分目錄檢索系統(tǒng)文摘索引型檢索系統(tǒng)全文檢索系統(tǒng)目錄文摘、索引全文參考數(shù)據(jù)庫全文數(shù)據(jù)庫參考數(shù)據(jù)庫英文為referencedatabase,指包含各種數(shù)據(jù)、信息或知識(shí)的原始來源和屬性的數(shù)據(jù)庫。數(shù)據(jù)庫中的內(nèi)容是通過對數(shù)據(jù)、信息或知識(shí)的再加工和過濾——如編目、索引、摘要、分類等——后形成的。目的是指引用戶能夠快速、全面地鑒別和找到相關(guān)信息。主要包括書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和索引數(shù)據(jù)庫。書目數(shù)據(jù)庫主要是針對圖書進(jìn)行內(nèi)容的報(bào)道與揭示的,如各圖書館的館藏機(jī)讀目錄數(shù)據(jù)庫。文摘和索引數(shù)據(jù)庫則相對期刊論文、會(huì)議論文、專利文獻(xiàn)、學(xué)位論文等進(jìn)行內(nèi)容和屬性的認(rèn)識(shí)與描述,每一個(gè)具體的資源都有相應(yīng)的描述元數(shù)據(jù)記錄。目錄:目錄是以一件或一種完整的出版物(如一種圖書、一種期刊)為單位,按照一定次序編排的對文獻(xiàn)信息進(jìn)行描述和報(bào)道的工具,也稱書目。目錄對文獻(xiàn)的描述比較簡單,每條記錄的字段主要包括:文獻(xiàn)題名、責(zé)任者、出版事項(xiàng)、分類號、主題詞等。一種出版物經(jīng)過如此描述后形成一條記錄,將所有的記錄組織起來就形成了目錄。

目錄是對出版物按其外表特征進(jìn)行著錄而成,以書或刊作為目錄的基本單位。目錄類型

:①按目錄反映的藏書范圍區(qū)分為:館藏目錄:反映一個(gè)圖書館全部館藏的目錄。如中國國家圖書館館藏目錄聯(lián)合目錄:反映一個(gè)地區(qū)或一個(gè)系統(tǒng)甚至全國或世界范圍的圖書館、信息服務(wù)機(jī)構(gòu)文獻(xiàn)收藏情況的一種統(tǒng)一目錄。如CALIS聯(lián)合目錄②按目錄的組織方法區(qū)分為字順目錄和分類目錄。字順目錄又分題名目錄、責(zé)任者(著者)目錄、主題目錄等。③按目錄的使用對象區(qū)分為讀者目錄和公務(wù)目錄。④按目錄反映的文獻(xiàn)類型區(qū)分為圖書目錄、期刊目錄、報(bào)紙目錄、地圖目錄、視聽資料目錄等。⑤按目錄的語言文字區(qū)分為中文目錄、西文目錄、俄文目錄、日文目錄等。⑥按目錄的物質(zhì)載體區(qū)分為卡片式目錄、書本式目錄、機(jī)讀目錄(MARC)、聯(lián)機(jī)公共檢索目錄(OPAC,OnlinePublicAccessCatalog)等。OPAC:是指以計(jì)算機(jī)編碼形式存貯在計(jì)算機(jī)系統(tǒng)內(nèi),供讀者通過終端設(shè)備進(jìn)行聯(lián)機(jī)檢索的圖書館目錄,即書目數(shù)據(jù)庫的一種形式。文摘(Abstract)是描述文獻(xiàn)各種特征的一條記錄,通常由文獻(xiàn)的分類號、文獻(xiàn)篇名、著者及其單位、文獻(xiàn)來源、主題詞、摘要等項(xiàng)組成。以單篇文獻(xiàn)(如一篇論文、書中的一章)為報(bào)道單位。索引(Index)是將某種信息集合(如目錄、文摘)中的一組相關(guān)信息,按照某種順序組織并指引給用戶的一種指南。它具有便于檢索,揭示文獻(xiàn)信息深入、詳細(xì)的優(yōu)點(diǎn)。索引條目一般由檢索標(biāo)識(shí)和存貯地址組成。標(biāo)識(shí)是索引條目所指示的文獻(xiàn)信息某方面的特征,如主題詞、著者姓名、分類號等;存貯地址是指明標(biāo)識(shí)所表達(dá)的特定信息在信息集合中的地址,它通常是文獻(xiàn)存取號(文摘號)。常見索引種類(1)分類索引:是以分類號或類目名稱作為索引標(biāo)識(shí),按照分類號排列形成的索引。(2)主題索引:是以主題詞(敘詞或關(guān)鍵詞)作為索引標(biāo)識(shí),按其字順排列形成的索引。(3)著者索引:是以文獻(xiàn)上署名的著者、譯者、編者等責(zé)任者的姓名或機(jī)關(guān)團(tuán)體名稱作為索引標(biāo)識(shí),按其字順排列形成的索引。(4)專用索引:是以某些領(lǐng)域?qū)S玫拿~術(shù)語或符號作為索引標(biāo)識(shí)編排形成的索引。(5)引文索引:是以引文著者和引文的其余題錄部分作為標(biāo)識(shí)編制成的索引。

參考數(shù)據(jù)庫全文數(shù)據(jù)庫英文為full-textdatabase,即收錄有原始文獻(xiàn)全文的數(shù)據(jù)庫,以期刊論文、會(huì)議論文、政府出版物、研究報(bào)告、法律條文和案例、商業(yè)信息等為主。全文數(shù)據(jù)庫4、檢索系統(tǒng)的結(jié)構(gòu)A、編輯使用說明:介紹檢索工具的編輯方針、收錄范圍、總體結(jié)構(gòu)、各部分的功能、體例以及使用方法等。它是使用檢索工具的指南。B、正文(主文檔):是文獻(xiàn)條目(也稱記錄)的有序集合,是檢索工具的主體。條目(記錄)通常由文獻(xiàn)的順序號、篇名、著者、來源等著錄項(xiàng)目(也稱字段)組成。常見字段標(biāo)識(shí)符字段名標(biāo)識(shí)符全稱字段名標(biāo)識(shí)符全稱字段名標(biāo)識(shí)符全稱文獻(xiàn)題名TITitle著者AUAuthor著者單位AFAuthoraffiliation摘要ABAbstract出版者PBPublisher出版國CPCountryofpublication敘詞DEDescriptor文獻(xiàn)來源SOSource出版年P(guān)YPublicationyear關(guān)鍵詞IDIdentifier語種LALanguage分類號CCClassificationcode文獻(xiàn)類型DTDocumenttype國際標(biāo)準(zhǔn)刊號ISISSN記錄存貯號ANAccessionnumberC、索引:由各種不同的索引組成,數(shù)據(jù)庫中稱索引文檔或倒排檔。它提供多種檢索途徑(檢索入口),滿足用戶不同的檢索需要,提高檢索的速度與準(zhǔn)確性。常見的輔助索引有著者索引、主題索引、文獻(xiàn)號碼索引等。D、附錄:由來源期刊一覽表、縮略語與全稱對照表、不同語種音譯對照表等組成。它是正文的必要補(bǔ)充,有利于用戶進(jìn)一步理解正文的著錄內(nèi)容,了解文獻(xiàn)來源情況,根據(jù)縮寫查找全稱等。E、詞表:是檢索系統(tǒng)中文獻(xiàn)信息整序的依據(jù),如分類表、主題詞表等。它通常獨(dú)立存在,是準(zhǔn)確選擇檢索的分類號和主題詞的依據(jù)。第二節(jié)信息檢索分類一、按檢索對象劃分,信息檢索可以分為:1、文獻(xiàn)檢索:從一個(gè)文獻(xiàn)集合中查找出專門包含所需信息內(nèi)容的文獻(xiàn),是以文獻(xiàn)為檢索對象的信息檢索類型。2、數(shù)據(jù)檢索:是從文件、數(shù)據(jù)庫或存儲(chǔ)裝置中查找和選取所需數(shù)據(jù)的操作或過程。3、事實(shí)檢索:是獲取以事物的實(shí)際情況為基礎(chǔ)而集合生成新的分析結(jié)果的一類信息檢索。廣義的事實(shí)檢索既包括數(shù)值數(shù)據(jù)的檢索、算術(shù)運(yùn)算、比較和數(shù)學(xué)推導(dǎo),也包括非數(shù)值數(shù)據(jù)(如事實(shí)、概念、思想、知識(shí)等)的檢索、比較、演繹和邏輯推理。它要求檢索系統(tǒng)不僅能夠從數(shù)據(jù)(事實(shí))集合中查出原來存入的數(shù)據(jù)或事實(shí),還能夠從已有的基本數(shù)據(jù)或事實(shí)中推導(dǎo)、演繹出新的數(shù)據(jù)或事實(shí)。舉例檢索1檢索2請問:以上1、2、3項(xiàng)檢索,哪個(gè)是文獻(xiàn)檢索?哪個(gè)是數(shù)據(jù)檢索?哪個(gè)是事實(shí)檢索?檢索3以上三種信息檢索類型的主要區(qū)別在于:數(shù)據(jù)檢索和事實(shí)檢索是要檢索出包含在文獻(xiàn)中的信息本身,是一種確定性檢索,而文獻(xiàn)檢索則檢索出包含所需要信息的文獻(xiàn)即可,是一種不確定性檢索。二、按檢索手段劃分:1、手工檢索:是一種傳統(tǒng)的檢索方法,即以手工翻檢的方式,利用工具(包括圖書、期刊、目錄卡片等)來檢索信息的一種檢索手段。2、機(jī)械檢索:即利用探針或檢索器件,對代表檢索標(biāo)識(shí)的穿孔卡片進(jìn)行選取。這種機(jī)械的掃描大大提高了檢索效率。3、光電檢索:即把檢索標(biāo)識(shí)變成黑白點(diǎn)矩陣或條形碼,存儲(chǔ)在縮微膠片(卷)上,利用光電效應(yīng),通過檢索機(jī)械進(jìn)行查找。4、計(jì)算機(jī)檢索:即把情報(bào)及其檢索標(biāo)識(shí)轉(zhuǎn)換成電子計(jì)算機(jī)可以閱讀的二進(jìn)制編碼,存儲(chǔ)在磁性載體上,由計(jì)算機(jī)根據(jù)程序進(jìn)行查找與輸出。根據(jù)檢索者同計(jì)算機(jī)進(jìn)行的不同通信方式,計(jì)算機(jī)檢索又可以分為脫機(jī)檢索、聯(lián)機(jī)檢索及網(wǎng)絡(luò)信息檢索等。

第三節(jié)信息檢索語言一、信息檢索語言及其作用1、檢索語言的概念:檢索語言是應(yīng)文獻(xiàn)信息的加工、存儲(chǔ)和檢索的共同需要而編制的專門語言,是表達(dá)一系列概括文獻(xiàn)信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識(shí)系統(tǒng)。簡言之,檢索語言是用來描述信息資源特征和進(jìn)行檢索的語言。2、檢索語言的作用(1)標(biāo)引文獻(xiàn)信息內(nèi)容及其外部特征,保證不同標(biāo)引人員標(biāo)引文獻(xiàn)的一致性。(2)對內(nèi)容相同及相關(guān)的文獻(xiàn)信息加以集中或揭示其相關(guān)性。(3)使文獻(xiàn)信息的存儲(chǔ)集中化、系統(tǒng)化、組織化,便于檢索者按照一定的排列次序進(jìn)行有序化檢索。(4)便于將標(biāo)引用語和檢索用語進(jìn)行相符性比較,保證不同檢索人員表述相同文獻(xiàn)內(nèi)容的一致性,以及檢索人員與標(biāo)引人員對相同文獻(xiàn)內(nèi)容表述的一致性。(5)保證檢索者按不同需要檢索文獻(xiàn)時(shí)都能獲得最高查全率和查準(zhǔn)率。二、檢索語言的類型1、人工語言

人工語言是根據(jù)信息檢索的需要由人工創(chuàng)制的,采用規(guī)范詞,用來專指或網(wǎng)羅相應(yīng)的概念,可以將同義詞、近義詞、相關(guān)詞、多義詞及縮略詞規(guī)范在一起,由人工控制,包括分類檢索語言、主題檢索語言和代碼檢索語言。2、自然語言

自然語言檢索用詞是從信息內(nèi)容本身抽取的,主要依賴于計(jì)算機(jī)自動(dòng)抽詞技術(shù)完成,輔以人工自由標(biāo)引(非根據(jù)詞表的標(biāo)引方法),是非規(guī)范詞。1、人工語言

(1)分類語言按知識(shí)門類的邏輯次序?qū)⑿畔⑾到y(tǒng)地組織和劃分的語言,具體體現(xiàn)為用分類號和類名來表達(dá)信息的主題概念。

①分類語言的特點(diǎn):能較好地體現(xiàn)學(xué)科的系統(tǒng)性,反映事物的平行、隸屬和派生關(guān)系,適合人們認(rèn)識(shí)事物的習(xí)慣,有利于從學(xué)科或?qū)I(yè)的角度進(jìn)行族性檢索,能達(dá)到較高的查全率。采用拉丁字母和阿拉伯?dāng)?shù)字做概念標(biāo)識(shí)的分類號,比較簡明,便于組織目錄系統(tǒng)。是《中國圖書館圖書分類法》的簡稱,是我國目前通用的類分圖書的工具。我校圖書館就是采用《中圖法》來類分文獻(xiàn)資料?!吨袌D法》基本結(jié)構(gòu):

《中圖法》的標(biāo)記符號采用英文字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號碼。即用一個(gè)字母表示一個(gè)大類,以字母的順序反映大類的序列。字母后用數(shù)字表示大類以下類目的劃分。數(shù)字的編號使用小數(shù)制。②

《中圖法》TB一般工業(yè)技術(shù)TD礦業(yè)工程TE石油、天然氣工程TF冶金工程TG金屬學(xué)、金屬工藝TH機(jī)械儀表工業(yè)TJ武器工業(yè)TK動(dòng)力工業(yè)TL原子能技術(shù)TM電工技術(shù)TN無線電電子學(xué)、電訊技術(shù)TP自動(dòng)化技術(shù)、計(jì)算技術(shù)TQ化學(xué)工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學(xué)TV水利工程3級類目TU建筑基礎(chǔ)科學(xué)TU19建筑勘測TU2建筑設(shè)計(jì)TU3建筑結(jié)構(gòu)TU4工力學(xué)、地基基礎(chǔ)工程TU5建筑材料TU6建筑施工機(jī)械和設(shè)備TU7建筑施工TU8房屋建筑設(shè)備TU9地下建筑TU97高層建筑TU98區(qū)域規(guī)劃、城市規(guī)劃TU99市政工程A馬列主義、毛澤東思想、鄧小平理論22大類B

哲學(xué)C

社會(huì)科學(xué)總論D

政治、法律E

軍事F

經(jīng)濟(jì)G

文化、科學(xué)、教育體育H

語言、文字

I

文學(xué)

J藝術(shù)K歷史、地理N自然科學(xué)總論O數(shù)理科學(xué)和化學(xué)P天文學(xué)、地球科學(xué)Q生物科學(xué)R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學(xué)T工業(yè)技術(shù)U交通運(yùn)輸V航空、航天X環(huán)境科學(xué)Z綜合性圖書馬列主義、毛澤東思想5大部哲學(xué)社會(huì)科學(xué)綜合性圖書自然科學(xué)2級類目F經(jīng)濟(jì)F0政治經(jīng)濟(jì)學(xué)F1世界各國經(jīng)濟(jì)概況、經(jīng)濟(jì)史、經(jīng)濟(jì)地理F2經(jīng)濟(jì)計(jì)劃與管理F3農(nóng)業(yè)經(jīng)濟(jì)F4工業(yè)經(jīng)濟(jì)F5交通運(yùn)輸經(jīng)濟(jì)F6郵電經(jīng)濟(jì)F7貿(mào)易經(jīng)濟(jì)F8財(cái)政、金融H語言、文字

H0語言學(xué)

H1漢語

H2中國少數(shù)民族語言

H3常用外國語

H31英語

H310.1非標(biāo)準(zhǔn)英語

H310.4英語水平考試

H310.41世界

H310.42中國

H310.43/.47各國(依世界地區(qū)表分)

H32/37各種常用外國語(均可仿H31分)H32法語

H33德語

H34西班牙語

H35俄語……分類號的變化體現(xiàn)了各學(xué)科體系的從屬關(guān)系,分類號位數(shù)每增加一位,則分類級別便低一級。索書號G252.7/H68、TP311.5/H226

HeadFirst設(shè)計(jì)模式(中文版)網(wǎng)絡(luò)信息檢索與利用TP311.5H226G252.7H68主題語言是由主題詞匯構(gòu)成,即將自然語言中的名詞術(shù)語經(jīng)過規(guī)范化后直接作為信息標(biāo)識(shí),按字母順序排列標(biāo)識(shí),通過參照系統(tǒng)揭示主題概念之間的關(guān)系,也稱主題法。包括先組式的標(biāo)題詞語言、后組式的單元詞語言和敘詞語言。①標(biāo)題詞語言:是一種先組式的規(guī)范詞語言,在檢索前已經(jīng)將概念之間的關(guān)系組配好。從文獻(xiàn)的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范化處理的主題語言。(2)主題語言②單元詞語言單元詞語言:是一種最基本的、不能再分的單位詞語,亦稱元詞,從文獻(xiàn)內(nèi)容中抽出,再經(jīng)規(guī)范,能表達(dá)一個(gè)獨(dú)立的概念。③敘詞語言敘詞語言是指從文獻(xiàn)內(nèi)容中抽出來,以表達(dá)文獻(xiàn)主題內(nèi)容的概念為基礎(chǔ),經(jīng)過嚴(yán)格優(yōu)選和規(guī)范化處理,可以進(jìn)行邏輯組配的一種主題語言。一般來講,選擇的敘詞具有概念性、描述性、組配性,經(jīng)過規(guī)范化處理后,還具有語義的關(guān)聯(lián)性、動(dòng)態(tài)性、直觀性。是目前應(yīng)用較廣的一種語言。CA(化學(xué)文摘)、EI(工程索引)等都采用敘詞語言進(jìn)行編排。(3)代碼語言代碼語言:指對事物某方面的特征,用某種代碼系統(tǒng)來表示事物概念,從而提供檢索的檢索語言。目前主要應(yīng)用于化學(xué)領(lǐng)域,例如,化合物的分子式分子式索引系統(tǒng),環(huán)狀化合物的環(huán)系索引系統(tǒng)等。2、自然語言

(1)關(guān)鍵詞:是從文獻(xiàn)的標(biāo)題、文摘和正文中直接抽取的,能夠揭示和表達(dá)文獻(xiàn)主題內(nèi)容并具有實(shí)質(zhì)意義的未經(jīng)規(guī)范化處理的自然語言。

除了禁用詞,如一些冠詞、介詞、副詞或連詞外,凡在概念上有意義的詞都可用作關(guān)鍵詞,它確保檢索用詞與文獻(xiàn)記錄中的詞匯完全一致。漏檢同義詞:發(fā)動(dòng)機(jī)引擎;白果銀杏;西紅柿洋柿子番茄;電腦計(jì)算機(jī)PC機(jī)使用其中一個(gè)詞做關(guān)鍵詞進(jìn)行檢索時(shí),往往會(huì)漏掉部分相關(guān)文獻(xiàn)。使用關(guān)鍵詞做檢索入口時(shí)需注意:誤檢

多義詞cell電池

細(xì)胞用關(guān)鍵詞“cell”查找細(xì)胞方面的文獻(xiàn)結(jié)果:電池、細(xì)胞兩方面的文獻(xiàn)同時(shí)被檢出2、自然語言(2)題名:利用文獻(xiàn)或文章的名稱進(jìn)行檢索。(3)著者:利用作者或團(tuán)體作者的姓名進(jìn)行檢索。(4)全文:從資源的全部內(nèi)容中自動(dòng)抽取、查找,是目前網(wǎng)上各類搜索引擎使用最多的方法。(5)其他:利用摘要、引文等3、人工語言和自然語言的關(guān)系人工語言和自然語言并不是互相對立的,比較成熟的檢索系統(tǒng),通常是兩種檢索語言并用,互為補(bǔ)充,以保證較高的檢索效率。一、信息檢索的方法1、追溯法(引文法):又稱回溯法,是從已有的文獻(xiàn)后面所附的參考文獻(xiàn)入手,逐一查找全文,再從這些原文后面所列的參考文獻(xiàn)逐一追查,不斷擴(kuò)大檢索線索,從而獲得一批相關(guān)文獻(xiàn)信息的查找方法。2、常用法(工具法):利用目錄、索引、題錄或文摘等檢索工具來查找文獻(xiàn)的方法。按所查文獻(xiàn)的順序,可分為順查法、倒查法和抽查法三種。第四節(jié)信息檢索的方法和途徑(1)順查法——由遠(yuǎn)而近,從問題發(fā)生的年代開始逐年往近查,適用于無綜述性文獻(xiàn)可參考時(shí)使用。查的文獻(xiàn)較完整,查全率較高,但工作量大,效率不高。(2)倒查法——由近到遠(yuǎn),重點(diǎn)放在近期的文獻(xiàn),多用于新課題,或老技術(shù)的新發(fā)展,從新情況開始查到一定的基本資料時(shí)為止。(3)抽查法——根據(jù)課題的特點(diǎn)和需要,選查發(fā)展旺盛時(shí)期的文獻(xiàn),可節(jié)約時(shí)間,但可能會(huì)漏檢。2、常用法(工具法)3、綜合法:結(jié)合追溯法和常用法,先利用檢索工具查出一定時(shí)期內(nèi)的一批有用文獻(xiàn),在利用這些文獻(xiàn)后面的參考文獻(xiàn),追溯查出前一時(shí)期內(nèi)的文獻(xiàn),如此循環(huán)交替的使用兩種方法直到滿足要求為止。也稱交替法。二、選擇檢索方法的原則

1、如果檢索工具不全或根本沒有,檢索課題涉及面又不大,對查全率不做較高要求,可采用由近及遠(yuǎn)的追溯法?;厮莸钠瘘c(diǎn)最好是所附參考文獻(xiàn)較多的論文及論著,還有一些信息研究成果,如“綜述”、“評述”等。2、如果檢索工具齊備,研究課題涉及的范圍大,則應(yīng)采用常用法或綜合法進(jìn)行檢索。3、如果檢索課題屬于新興學(xué)科或知識(shí)更新快的學(xué)科,可采用倒查法。4、如果研究課題對查全率做特別要求,如開展查新,一般采用順查法。5、如果已經(jīng)掌握了檢索課題發(fā)展的規(guī)律、特點(diǎn),一般采用抽查法。1、題名:注意題名關(guān)鍵詞的排序特征2、作者:通常按姓在前名在后方式檢索3、分類:我國高校與公共圖書館的文獻(xiàn)資料,一般采用《中國圖書館圖書分類法》進(jìn)行分類。4、主題詞:主題是指表征文獻(xiàn)內(nèi)容特征、經(jīng)過規(guī)范化的名詞術(shù)語。檢索者通過檢索這些規(guī)范的詞語來找到所要的文獻(xiàn)和情報(bào)。三、信息檢索的常用途徑5、關(guān)鍵詞:直接從文獻(xiàn)的篇名或文摘或全文中抽取出來的非規(guī)范化檢索詞。6、順序號檢索:專利號,標(biāo)準(zhǔn)號,研究報(bào)告號。7、引文檢索:利用被引文獻(xiàn)來查找原文獻(xiàn)的檢索方法。如:CNKI中國期刊網(wǎng)被引用字段,維普中文期刊數(shù)據(jù)庫引文檢索途徑。8、其它:超文本檢索,基于概念的自然語言檢索,圖象等。信息檢索的常用途徑1、布爾邏輯檢索2、截詞檢索與詞根檢索3、位置運(yùn)算檢索4、限定檢索第五節(jié)信息檢索常用技術(shù)1、布爾邏輯檢索布爾邏輯(組配)算符:系統(tǒng)中采用的邏輯組配算符是布爾代數(shù)中的邏輯運(yùn)算符AND/*(與)、OR/+(或)、NOT/—(非)。布爾邏輯檢索:

即運(yùn)用布爾邏輯算符對檢索詞進(jìn)行邏輯組配,表達(dá)兩個(gè)概念之間的邏輯關(guān)系。(1)AND或*算符實(shí)現(xiàn)邏輯“與”組配

也可用“*”表示,用來組配不同的概念的檢索詞。是一種概念相交和限定關(guān)系的組配。例如:“AANDB”或“A*B”

其含義是:檢出的信息中必須同時(shí)含有“A”和“B”兩個(gè)檢索詞(如圖中陰影部分所示)。其基本作用是對檢索范圍加以限定,逐步縮小檢索范圍,提高檢索結(jié)果的查準(zhǔn)率。例如,檢索“計(jì)算機(jī)在圖書館中的應(yīng)用”方面的文獻(xiàn),其提問式可寫成:計(jì)算機(jī)and圖書館或計(jì)算機(jī)*圖書館(2)OR或+算符實(shí)現(xiàn)邏輯“或”組配

邏輯“或”,是用來組配具有同義或同族概念的檢索詞。如:檢索提問式:“AORB”或“A+B”其含義是數(shù)據(jù)庫記錄中任何一條記錄,只要含有“A”或“B”中任何一個(gè)檢索詞即為命中的文獻(xiàn)(如下圖陰影部分)。其基本作用是擴(kuò)大檢索范圍,增加命中文獻(xiàn)量,提高文獻(xiàn)的查全率。如:“微機(jī)+電腦+PC機(jī)”、“微機(jī)or電腦orPC機(jī)”(3)NOT或–算符實(shí)現(xiàn)邏輯“非”組配邏輯“非”,“NOT”算符是排除含有某些詞的記錄,其邏輯提問表達(dá)式為“ANOTB”或

“A-B”,即檢出的記錄中只能含有“NOT”算符前的檢索詞A,但不能同時(shí)含有“NOT”后的檢索詞B(如圖中陰影部分)。

其基本作用是縮小檢索范圍,但并不一定能提高文獻(xiàn)命中的準(zhǔn)確性,一般只起到減少文獻(xiàn)輸出量的作用。在聯(lián)機(jī)檢索中可降低檢索費(fèi)用。

例如:“計(jì)算機(jī)NOT微機(jī)”應(yīng)注意,由于“NOT”算符有排除掉相關(guān)文獻(xiàn)的可能,因此,在實(shí)際檢索中應(yīng)慎重使用。(4)XOR算符實(shí)現(xiàn)邏輯“異或”組配邏輯“異或”(XOR):命中信息包含邏輯A,也包含邏輯B,但不包含同時(shí)含有A和B的信息。優(yōu)先級運(yùn)算()>NOT>AND>OR、XOR2、截詞檢索與詞根檢索定義:用截詞符號“?”、“*”或“$”加在檢索詞的前后或中間,以檢索一組概念相關(guān)或同一詞根的詞。這種檢索方式可以擴(kuò)大檢索范圍,提高查全率,主要用于西文數(shù)據(jù)庫檢索。中文數(shù)據(jù)庫通常不使用這種技術(shù)。截詞檢索類型:截詞方式根據(jù)截詞的位置不同,分為前截?cái)唷⒑蠼財(cái)?、中截?cái)?;根?jù)截?cái)嗟臄?shù)量不同,分為有限截?cái)嗪蜔o限截?cái)唷G敖財(cái)啵航卦~符放在被截詞的左邊,可與后截?cái)嘁煌褂谩D壳斑@種檢索技術(shù)應(yīng)用已經(jīng)極少。后截?cái)啵菏乔胺揭恢聶z索,又稱右截?cái)?,截詞符放在被截詞的右邊,是最常用的截詞檢索技術(shù)。后截?cái)嘀饕糜谙铝袡z索:詞的單復(fù)數(shù)檢索;中截?cái)啵喊呀卦~符放在詞的中間。這種方式查找英美不同拼法的概念最有效。算符含義實(shí)例*利用它可以只輸入檢索詞的起始部分,而實(shí)現(xiàn)以族詞的檢索也可以替代詞中的任意字符。Alter*

可命中Alter、Alteration、Altercate

、Alternant、Alternate、Alternator等sul*ate可命中sulphate、sulfate?可以替代單個(gè)字符wom?n可表示woman、women$自動(dòng)取詞根運(yùn)算符$management可命中manage、managed、manager、managers、managing、management截詞舉例符號:*,?,$前截?cái)啵?magneticmagnetic,electro-magnetic,electromagnetic,thermo-magnetic,…后截?cái)啵簂ibrar*library,libraries,librarian,…中截?cái)啵簅rgani?ationorganization,organisation無限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量,例如輸入educat*,可以檢索educator,educators,educated,educating,education,educational,等等。有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,例如輸入educat??,表示被截?cái)嗟淖址挥袃蓚€(gè),可以檢索educator,educated兩個(gè)詞。3、位置算符檢索定義:運(yùn)用位置算符表示兩個(gè)檢索詞間的位置鄰近關(guān)系,又叫鄰接檢索。這種檢索技術(shù)通常只出現(xiàn)在西文數(shù)據(jù)庫中,在全文檢索中應(yīng)用較多。如果說布爾邏輯算符是表示兩個(gè)概念之間的邏輯關(guān)系的話,位置算符表示的是兩個(gè)概念在信息中的實(shí)際物理位置關(guān)系。常用位置算符算符

功能

表達(dá)式

檢索結(jié)果

W,with兩詞相鄰,按輸入時(shí)順序排列(也有數(shù)據(jù)庫允許順序顛倒)

Education(W)school,或EducationwithschoolEducationschoolEducationschools(schoolofeducationschoolsofeducation)

nW同上,兩詞中間允許插入n個(gè)詞Education(1W)schoolEducationschoolEducationschoolsEducationandmusicschoolSchoolofcontinuededucationPre兩詞相鄰,按輸入順序排列

EducationPreschoolEducationschoolEducationschools常用位置算符N,near兩詞緊密相鄰,中間不能插入其他詞,順序可以顛倒

Education(N)school,或EducationnearschoolEducationschoolEducationschoolsSchoolofeducationnN同上,兩詞中間可以插入n個(gè)詞

Education(1N)schoolEducationschoolSchoolofeducationEducationandmusicschoolF兩個(gè)詞同在一個(gè)標(biāo)引字段中Education(F)school例如同時(shí)出現(xiàn)在題名或文摘字段中Same兩個(gè)詞同在一個(gè)段落中EducationSameschool同時(shí)出現(xiàn)在一個(gè)段落中4、限定檢索

為了縮小檢索范圍,可利用字段代碼來限制檢索詞出現(xiàn)的字段,以提高檢索速度和命中率。如:riceinti(表示只在題目字段中查找文獻(xiàn))

riceinde(只在主題詞中查找)

riceinab(只在文摘中查找)

au=Smith,J.C(查作者為Smith,J.C的文章)py=1998(只查1998年的文章)la=Chinese(只查語種為中文的文獻(xiàn))第六節(jié)信息檢索的步驟使用數(shù)字資源開展研究的目的(1)尋找針對具體問題的準(zhǔn)確答案:解決問題,或作為論據(jù)引證。(2)查找特定文獻(xiàn):根據(jù)文獻(xiàn)線索查找原文,或查找作者的文章。(3)對某一問題做大致的了解,并就問題的一個(gè)方面,撰寫小型論文。(4)查閱某一專題的前沿和最新資料,了解動(dòng)態(tài)和趨勢。(5)對某一課題做全面的調(diào)查研究,了解該課題的全面資料和整體發(fā)展,撰寫綜述或者研究報(bào)告。(6)對某一課題做深入的專題研究,提出創(chuàng)新觀點(diǎn),撰寫研究報(bào)告或?qū)W術(shù)論文。信息檢索的步驟1、課題分析與研究2、選擇檢索資源,確定檢索范圍3、制定檢索策略,選擇檢索方法4、評估檢索結(jié)果,優(yōu)化檢索策略5、搜集、整理、評價(jià)和獲取文獻(xiàn)明確檢索目的全面的?最新的?片段的?明確主題或主要內(nèi)容明確課題涉及的學(xué)科范圍所需信息的數(shù)量、語種、年代范圍、類型、作者等城市中心區(qū)的空間結(jié)構(gòu)與空間組織步驟一:分析研究課題針對具體問題查找準(zhǔn)確答案、特定的文獻(xiàn)或事實(shí)……步驟一:分析研究課題查找特定事實(shí)開題/選題資料搜集/調(diào)研論文/報(bào)告撰寫課題/學(xué)術(shù)論文選題、學(xué)位論文開題、課堂討論、辯論、小論文……專業(yè)資料調(diào)研、為論文/課題而做的資料搜集、項(xiàng)目立項(xiàng)調(diào)研……了解最新動(dòng)態(tài)趨勢,學(xué)術(shù)論文寫作/調(diào)查報(bào)告撰寫/制作發(fā)明實(shí)踐……步驟二:選擇檢索資源/工具查找特定事實(shí);開題/選題資料搜集/調(diào)研學(xué)術(shù)論文寫作/調(diào)研報(bào)告撰寫/制作發(fā)明實(shí)踐課題事實(shí)/數(shù)值型數(shù)據(jù)庫、搜索引擎、電子參考工具等;數(shù)據(jù)庫(參考和全文型);數(shù)據(jù)庫、電子期刊、學(xué)位論文、會(huì)議論文、專著和其他文獻(xiàn)如專利、事實(shí)數(shù)據(jù)庫等

全文文獻(xiàn)、專著、學(xué)術(shù)報(bào)告、學(xué)位論文和其他文獻(xiàn)工具檢索工具選擇標(biāo)準(zhǔn)和方法保證所選擇的資源與檢索課題的學(xué)科一致,盡量使用權(quán)威性的專業(yè)數(shù)據(jù)庫學(xué)科屬性了解參考資源收藏的范圍和特色收藏收藏范圍了解參考資源的檢索方法和系統(tǒng)功能系統(tǒng)功能了解并有效利用檢索系統(tǒng)的助檢手段和輔助工具,如檢索幫助、培訓(xùn)課程等幫助和培訓(xùn)步驟三:制定檢索策略/方法查找特定事實(shí);開題/選題資料搜集/調(diào)研學(xué)術(shù)論文寫作/調(diào)研報(bào)告撰寫/制作發(fā)明實(shí)踐課題檢索詞檢索技術(shù)檢索策略調(diào)整

檢索經(jīng)驗(yàn)的積累策略檢索詞使用舉例“專業(yè)”:采用專業(yè)術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論