信息檢索與利用課件 第2章 信息檢索_第1頁(yè)
信息檢索與利用課件 第2章 信息檢索_第2頁(yè)
信息檢索與利用課件 第2章 信息檢索_第3頁(yè)
信息檢索與利用課件 第2章 信息檢索_第4頁(yè)
信息檢索與利用課件 第2章 信息檢索_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章信息檢索信息檢索與利用檢索語(yǔ)言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術(shù)信息檢索的實(shí)施2.1.1信息檢索的概念從廣義的角度看,信息檢索是將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)用戶的需要找出有關(guān)信息的過(guò)程。從狹義的角度看,信息檢索就是根據(jù)用戶的要求,按照一定的途徑和方法,借助一定的檢索工具對(duì)信息進(jìn)行查找和調(diào)取的過(guò)程,是查找信息的方法和手段。廣義的信息檢索這一過(guò)程分為兩個(gè)部分,即“存”和“取”。1.存儲(chǔ)的發(fā)展和技術(shù)演進(jìn)“存”即信息標(biāo)引和存儲(chǔ)的過(guò)程,在這個(gè)過(guò)程中,首先需要將大量雜亂無(wú)序的信息集中起來(lái),然后按照其外部特征和內(nèi)容特征進(jìn)行著錄、標(biāo)引和組織,使其有序化、系統(tǒng)化。2.1.1信息檢索的概念信息著錄信息著錄是在編制文獻(xiàn)目錄時(shí),按照一定規(guī)則,對(duì)文獻(xiàn)的外部特征和內(nèi)容特征進(jìn)行分析、選擇和記錄的過(guò)程,也就是對(duì)信息的題名、著者、出處等外部特征和內(nèi)容特征進(jìn)行描述。不同的信息資源類型及不同檢索系統(tǒng)的描述項(xiàng)目不完全相同。圖書(shū)著錄示例(部分)期刊著錄示例(部分)信息整序信息整序即把著錄信息按照信息特征的標(biāo)記進(jìn)行排列,也就是對(duì)信息進(jìn)行標(biāo)引,給出信息標(biāo)識(shí),并編制各種類型的索引。信息整序是根據(jù)著者姓名、題名、序號(hào)等信息外在屬性標(biāo)識(shí)和分類號(hào)、主題詞等信息內(nèi)在屬性標(biāo)識(shí)來(lái)排列信息的。2.1.1信息檢索的概念2.“取”“取”即信息分析和檢索的過(guò)程。在編制好的數(shù)據(jù)庫(kù)或檢索系統(tǒng)中,利用檢索工具或相關(guān)方法找到滿足用戶特定需求的信息,實(shí)現(xiàn)信息的檢索和利用。也就是用戶借助檢索工具或檢索系統(tǒng),采用一定的檢索策略、方法,從信息資源集合中查找所需信息的過(guò)程。2.1.2信息檢索的目的和意義學(xué)生通過(guò)信息檢索打開(kāi)知識(shí)的寶庫(kù),科學(xué)研究者通過(guò)信息檢索站在前人的肩膀上,創(chuàng)造出更多新的發(fā)明和成果。因此,信息檢索在當(dāng)代具有十分重要的意義。②提高學(xué)習(xí)能力知識(shí)處于不斷更新和完善之中,通過(guò)信息檢索,人們可以不斷學(xué)習(xí)新的知識(shí),更新舊的知識(shí),不斷提升自己的自學(xué)能力、研究能力、思維能力、組織能力等,實(shí)現(xiàn)終身學(xué)習(xí)。①養(yǎng)成創(chuàng)造性思維如今的信息資源是一代一代人共同積累和創(chuàng)造的,其中蘊(yùn)含大量的知識(shí)、方法、技巧、思想等,廣泛檢索并利用這些知識(shí),有利于人們從中獲取靈感,開(kāi)發(fā)智慧、開(kāi)拓創(chuàng)新,創(chuàng)造新的成就。④提高自身競(jìng)爭(zhēng)力當(dāng)前時(shí)代是一個(gè)信息化的時(shí)代,信息的開(kāi)發(fā)與利用是反映一個(gè)國(guó)家綜合國(guó)力的重要標(biāo)志,無(wú)論是對(duì)個(gè)人、企業(yè),還是國(guó)家而言,充分掌握各種信息、善于利用各種信息,都可以提升其決策能力和決策正確性,從而獲得更強(qiáng)大的競(jìng)爭(zhēng)力。③提高學(xué)習(xí)和工作效率無(wú)論是學(xué)習(xí)知識(shí),還是科技研發(fā)等,都可以通過(guò)信息檢索學(xué)習(xí)他人的優(yōu)秀方法,了解他人新取得的成果,總結(jié)失敗的經(jīng)驗(yàn)教訓(xùn),從而改進(jìn)自己學(xué)習(xí)、研究的方向和內(nèi)容,縮短學(xué)習(xí)和研究周期,提高學(xué)習(xí)和工作效率。2.1.3信息檢索的發(fā)展歷程手動(dòng)檢索階段A聯(lián)機(jī)檢索階段C網(wǎng)絡(luò)化檢索階段EBD脫機(jī)檢索階段光盤(pán)檢索階段如今,信息檢索繼續(xù)向著數(shù)字化、便捷化的方向發(fā)展,特別是隨著計(jì)算機(jī)集成技術(shù)的成熟和數(shù)字技術(shù)的發(fā)展應(yīng)用,信息的采集、加工、標(biāo)引、著錄、校對(duì)、審核、入庫(kù)、存儲(chǔ),以及檢索與利用,都實(shí)現(xiàn)了簡(jiǎn)單、快捷的數(shù)字化,將信息檢索擴(kuò)展到了更為廣闊的領(lǐng)域。2.1.4信息檢索的原理信息檢索的本質(zhì)是將用戶信息需求和文獻(xiàn)信息集合進(jìn)行匹配的過(guò)程。從系統(tǒng)的角度看,系統(tǒng)需要將用戶需求特征與信息資源系統(tǒng)中的檢索語(yǔ)言進(jìn)行匹配,并顯示匹配成功的結(jié)果;從用戶的角度看,用戶需要基于特定的信息需求,采用一定的方法、技術(shù)和手段,根據(jù)一定的線索與規(guī)則,從系統(tǒng)中找到相關(guān)信息。信息檢索原理與過(guò)程2.1.5信息檢索的類型1.按檢索內(nèi)容劃分事實(shí)檢索事實(shí)檢索主要以特定的事件或事實(shí)作為檢索對(duì)象,如字、詞、詩(shī)、時(shí)間、地點(diǎn)、人名、事件、法規(guī)、制度、圖像、參數(shù)、公式等內(nèi)容的查找都屬于事實(shí)檢索。數(shù)據(jù)檢索數(shù)據(jù)檢索主要以數(shù)據(jù)、圖表等作為檢索對(duì)象。數(shù)據(jù)檢索數(shù)據(jù)庫(kù)中往往存儲(chǔ)了大量數(shù)據(jù),如統(tǒng)計(jì)數(shù)據(jù)、觀測(cè)數(shù)據(jù)、各種參數(shù),以及圖表、圖譜等。文獻(xiàn)信息檢索文獻(xiàn)信息檢索主要以文獻(xiàn)為檢索對(duì)象,是從一個(gè)文獻(xiàn)集合中檢索特定文獻(xiàn)的活動(dòng)、方法和程序,其檢索內(nèi)容包括文獻(xiàn)的題目、著者、來(lái)源或出處、文摘、全文等。0102032.1.5信息檢索的類型2.按信息組織方式劃分ACB全文檢索是很常用且便捷的一種檢索方式,用戶可以根據(jù)需要獲取檢索系統(tǒng)中的整本書(shū)、整篇文章或任意內(nèi)容。超文本檢索是采用計(jì)算機(jī)技術(shù)、通信技術(shù)和人工智能知識(shí)表示技術(shù),將文字、圖像、聲音、動(dòng)畫(huà)等多種形式的信息按它們相互之間的關(guān)聯(lián)和可能出現(xiàn)的連續(xù)性進(jìn)行非線性編排后構(gòu)成網(wǎng)絡(luò),并對(duì)這個(gè)網(wǎng)絡(luò)中的信息進(jìn)行檢索。超媒體檢索是對(duì)檢索系統(tǒng)中的多媒體信息進(jìn)行檢索,包括文本、圖像、聲音、視頻等,同樣可以提供瀏覽式查詢和跨庫(kù)檢索。全文檢索超文本檢索超媒體檢索2.1.5信息檢索的類型3.按檢索方式劃分綜合檢索即手動(dòng)檢索和計(jì)算機(jī)檢索綜合進(jìn)行。預(yù)設(shè)標(biāo)題計(jì)算機(jī)檢索是利用計(jì)算機(jī)和網(wǎng)絡(luò)來(lái)查找信息的檢索方法,即利用數(shù)據(jù)庫(kù)、計(jì)算機(jī)軟件技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)及通信系統(tǒng)進(jìn)行的信息檢索。計(jì)算機(jī)檢索手動(dòng)檢索就是利用各種印刷型檢索工具來(lái)查找信息的檢索方法,是比較傳統(tǒng)的檢索方式。手動(dòng)檢索檢索語(yǔ)言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術(shù)信息檢索的實(shí)施2.2.1檢索語(yǔ)言的概念檢索語(yǔ)言是信息存儲(chǔ)與檢索過(guò)程中用于描述信息特征和用戶提問(wèn)的人工語(yǔ)言,是為了滿足文獻(xiàn)信息加工、存儲(chǔ)和檢索時(shí)的共同需要而編制的專門(mén)語(yǔ)言,其實(shí)質(zhì)是檢索和標(biāo)引之間的約定語(yǔ)言和統(tǒng)一標(biāo)識(shí)。檢索語(yǔ)言主要用于描述文獻(xiàn)特征,不管是文章、圖書(shū),還是報(bào)告,往往都具有兩個(gè)比較明顯的特征,即外部特征和內(nèi)容特征。2.2.2分類檢索語(yǔ)言1.體系分類法體系分類法是以學(xué)科分類為基礎(chǔ),依據(jù)概念的劃分與概括原理,把概括文獻(xiàn)內(nèi)容與事物的各種類目組成一個(gè)層層隸屬、詳細(xì)列舉的等級(jí)結(jié)構(gòu)體系的一種文獻(xiàn)分類法,也稱為等級(jí)體系分類法。該分類法可以體現(xiàn)學(xué)科知識(shí)的系統(tǒng)性,便于人們從學(xué)科分類的角度檢索文獻(xiàn)。體系分類法是我國(guó)圖書(shū)情報(bào)機(jī)構(gòu)常用的分類法,是圖書(shū)館組織和檢索藏書(shū)的主要依據(jù)?!吨袌D法》是國(guó)內(nèi)使用最為廣泛的分類法,無(wú)論是大型圖書(shū)館圖書(shū)資料分類,還是網(wǎng)上的各類數(shù)據(jù)庫(kù),都大量應(yīng)用了該分類法。分類檢索語(yǔ)言是很常用的一種檢索語(yǔ)言,是將表示各種知識(shí)領(lǐng)域的類目按知識(shí)分類原理進(jìn)行系統(tǒng)排列,并以代表類目的數(shù)字或字母符號(hào)作為文獻(xiàn)主題標(biāo)識(shí)的一類檢索語(yǔ)言?!吨袌D法》大部類和基本大類2.2.2分類檢索語(yǔ)言2.組配分類法組配分類法是在分類表中分別列出不同范疇的單獨(dú)概念,再用組配方式來(lái)表達(dá)具體類目的文獻(xiàn)分類法。組配分類法的基本特征是“分面”,即依據(jù)某種分類標(biāo)準(zhǔn)劃分一個(gè)主題所產(chǎn)生的一組類目,可以分為分面組配分類法、組配—體系分類法和體系—組配分類法等類型?!秶?guó)際十進(jìn)分類法》分類體系3.混合分類法混合分類法介于體系分類法和組配分類法之間,是在等級(jí)分類體系的基礎(chǔ)上采用分面組配分類的方法,可以細(xì)分主題,新浪、網(wǎng)易等網(wǎng)站大多采用這種分類方法。2.2.3主題檢索語(yǔ)言1.關(guān)鍵詞檢索語(yǔ)言主題檢索語(yǔ)言是直接以表達(dá)主題內(nèi)容的詞語(yǔ)為檢索標(biāo)識(shí),以字順為主要排列方式,并通過(guò)參照系統(tǒng)等方法,揭示詞間關(guān)系的標(biāo)引和檢索信息資源的方法。萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)中的關(guān)鍵詞檢索語(yǔ)關(guān)鍵詞檢索語(yǔ)言是指從文獻(xiàn)的標(biāo)題、摘要、正文等抽取的能表達(dá)、揭示和描述文獻(xiàn)主題內(nèi)容的重要性語(yǔ)詞。關(guān)鍵詞檢索語(yǔ)言以關(guān)鍵詞為標(biāo)識(shí),關(guān)鍵詞屬于自然語(yǔ)言,未對(duì)拼寫(xiě)形式和詞語(yǔ)含義等進(jìn)行規(guī)范化處理,不受詞表控制,因而可以自由組合使用。2.2.3主題檢索語(yǔ)言2.單元詞檢索語(yǔ)言單元詞是經(jīng)過(guò)規(guī)范化處理的、具有獨(dú)立概念的基本詞匯單位,且從字面上不能再分解,否則將不能表達(dá)完整的概念或含義發(fā)生改變。單元詞檢索語(yǔ)言就是以單元詞為文獻(xiàn)內(nèi)容的標(biāo)識(shí)和檢索依據(jù)的主題語(yǔ)言,通過(guò)從文獻(xiàn)標(biāo)題、摘要、正文中抽取單元詞來(lái)實(shí)現(xiàn)信息檢索。3.標(biāo)題詞檢索語(yǔ)言標(biāo)題詞檢索語(yǔ)言是規(guī)范化的自然語(yǔ)言,即以經(jīng)過(guò)標(biāo)準(zhǔn)化處理的名詞術(shù)語(yǔ)為標(biāo)識(shí)來(lái)直接表達(dá)文獻(xiàn)主題的文獻(xiàn)標(biāo)引與檢索方法。標(biāo)題詞由主標(biāo)題詞和副標(biāo)題詞組成,它們?cè)跇?biāo)題詞表中按固定的方式組合排列,比較直觀明確,但缺乏靈活性,難以滿足多途徑、多因素的信息檢索。2.2.3主題檢索語(yǔ)言4.?dāng)⒃~檢索語(yǔ)言敘詞檢索語(yǔ)言又稱主題詞檢索語(yǔ)言,是以自然語(yǔ)言詞匯為基礎(chǔ)、以規(guī)范化的敘詞(主題詞)為檢索標(biāo)識(shí)的文獻(xiàn)標(biāo)引與檢索方法。敘詞是以基本概念為基礎(chǔ)的表達(dá)文獻(xiàn)內(nèi)容的詞語(yǔ),是從自然語(yǔ)言中優(yōu)選出來(lái)并經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ),也稱為主題詞。敘詞檢索語(yǔ)言是目前廣泛使用的主題檢索語(yǔ)言,適用于計(jì)算機(jī)檢索系統(tǒng)和手動(dòng)檢索系統(tǒng)。用敘詞語(yǔ)言編制的敘詞表是概括某一學(xué)科或若干學(xué)科領(lǐng)域,并由語(yǔ)義相關(guān)、族性相關(guān)的名詞術(shù)語(yǔ)組成的規(guī)范化的動(dòng)態(tài)詞匯表。敘詞表是提供現(xiàn)行的、與事物概念唯一對(duì)應(yīng)的、標(biāo)準(zhǔn)的標(biāo)引和檢索用詞的權(quán)威性詞表,便于文獻(xiàn)標(biāo)引人員和情報(bào)檢索人員查找所需敘詞。美國(guó)的《工程與科學(xué)主題詞表》就是一種綜合性敘詞表,而《美國(guó)國(guó)家航空航天局?jǐn)⒃~表》《國(guó)際核信息系統(tǒng)主題詞表》則屬于專業(yè)性敘詞表。我國(guó)的綜合性敘詞表有《漢語(yǔ)主題詞表》,專業(yè)性敘詞表有《航空科技資料主題表》《電子技術(shù)漢語(yǔ)主題詞表》《化學(xué)工業(yè)主題詞表》等。2.2.4代碼檢索語(yǔ)言代碼檢索語(yǔ)言是將文獻(xiàn)中的一些特殊字符組織排列以表達(dá)文獻(xiàn)主題概念的一種人工語(yǔ)言,通常以數(shù)字、字母、數(shù)字與字母的組合或分段的方式來(lái)表示各部分含義。例如,科技報(bào)告有報(bào)告號(hào)、合同號(hào)等,專利文獻(xiàn)有專利號(hào)、入藏號(hào)、公司代碼等。SciFinder(在線版數(shù)據(jù)庫(kù)學(xué)術(shù)版)中的分子式檢索就屬于代碼檢索語(yǔ)言,是利用文獻(xiàn)涉及的化合物分子式或環(huán)狀化合物的環(huán)分析數(shù)據(jù)組成的索引,用戶可以從分子式出發(fā),檢索相應(yīng)的化合物及其相關(guān)的文獻(xiàn)信息。檢索語(yǔ)言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術(shù)信息檢索的實(shí)施2.3.1外部特征檢索途徑文獻(xiàn)的外部特征和內(nèi)容特征不同,其檢索途徑也不同。外部特征檢索途徑以題名、著者、代碼、引文等為主,當(dāng)檢索人員已知文獻(xiàn)的外部特征時(shí),便可使用該方式進(jìn)行檢索。外部特征檢索途徑2.3.2內(nèi)容特征檢索途徑如果在未知文獻(xiàn)信息的情況下進(jìn)行檢索,則可以使用內(nèi)容特征檢索途徑,基于文獻(xiàn)潛在的特征(如分類、主題等)完成信息的檢索。內(nèi)容特征檢索途徑檢索語(yǔ)言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術(shù)信息檢索的實(shí)施2.4.1檢索系統(tǒng)的內(nèi)容組成檢索系統(tǒng)是對(duì)結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)資源進(jìn)行存儲(chǔ)、索引、查詢和管理的系統(tǒng)或體系,是與檢索相關(guān)的工具、設(shè)備和人的總稱,其目的是滿足人們的信息存儲(chǔ)和檢索需要。按照檢索工具和方式的不同,檢索系統(tǒng)可以分為計(jì)算機(jī)檢索系統(tǒng)和手動(dòng)檢索系統(tǒng)。手動(dòng)檢索系統(tǒng)又稱印刷型檢索工具,主要由正文、輔助索引、分類目錄、編輯說(shuō)明及樣例、資料來(lái)源索引等部分構(gòu)成;而計(jì)算機(jī)檢索系統(tǒng)則由硬件、軟件、網(wǎng)絡(luò)通信和數(shù)據(jù)庫(kù)等部分構(gòu)成。2.4.2檢索系統(tǒng)的類型1.目錄型檢索系統(tǒng)目錄型檢索系統(tǒng)以目錄檢索工具為主,主要檢索文獻(xiàn)目錄線索,通常以一個(gè)出版單位或收藏單位為基本著錄單位,其著錄大多為書(shū)(刊)名、著者、出版年月、出版地及收藏情況等。目錄按揭示信息內(nèi)容范圍的不同,可分為館藏目錄、聯(lián)合目錄、出版發(fā)行目錄等類型。2.題錄型檢索系統(tǒng)題錄型檢索系統(tǒng)是將圖書(shū)、期刊、專利等文獻(xiàn)中的題名按一定的排檢方式編排而成的檢索系統(tǒng),以單篇文獻(xiàn)為基本著錄單位來(lái)描述文獻(xiàn)外部特征,從而快速提供文獻(xiàn)線索,其著錄內(nèi)容大多為篇名、著者、著者單位、出版年,以及卷、期、頁(yè)等。2.4.2檢索系統(tǒng)的類型3.文摘型檢索系統(tǒng)文摘型檢索系統(tǒng)是揭示信息外部特征和內(nèi)容特征的檢索系統(tǒng),其著錄項(xiàng)是在題錄的基礎(chǔ)上加上文摘內(nèi)容。使用文摘型檢索系統(tǒng)的用戶可以通過(guò)輸入關(guān)鍵詞、著者、標(biāo)題、主題等檢索條件來(lái)查找特定的文獻(xiàn),從而快速了解文獻(xiàn)的核心內(nèi)容、研究方法、結(jié)果和結(jié)論等關(guān)鍵信息。4.全文型檢索系統(tǒng)全文型檢索系統(tǒng)是一種用于檢索并提供文本全文內(nèi)容的檢索系統(tǒng),以一次文獻(xiàn)為存儲(chǔ)對(duì)象,其著錄項(xiàng)包括文摘和全文。當(dāng)用戶輸入檢索條件后,系統(tǒng)會(huì)根據(jù)索引快速定位并查詢相關(guān)的文檔,然后將完整的原始資料或具體數(shù)據(jù)返回給用戶。2.4.3常用的檢索方法檢索系統(tǒng)是用于存儲(chǔ)、查找各類信息的工具,各種印刷版工具書(shū)、計(jì)算機(jī)數(shù)據(jù)庫(kù),以及網(wǎng)絡(luò)搜索常用的搜索引擎等都可以歸納為檢索系統(tǒng)。從學(xué)術(shù)檢索的角度來(lái)看,要想在使用檢索系。順查法順查法是按照時(shí)間順序,由遠(yuǎn)及近地利用檢索系統(tǒng)進(jìn)行信息查找的方法。倒查法倒查法和順查法類似,不同之處是倒查法按照時(shí)間順序由近及遠(yuǎn)地查找,先查找最近的、最新的信息,且重點(diǎn)查找最新的信息,如果有需要,再查找時(shí)間較遠(yuǎn)的信息。抽查法抽查法是指針對(duì)檢索需求,抽取學(xué)科或領(lǐng)域發(fā)展迅速、信息全面的一段時(shí)間進(jìn)行逐年檢索,這一段時(shí)間往往是該學(xué)科或領(lǐng)域信息產(chǎn)生的高峰期,信息較多,因而檢索起來(lái)比較便捷、高效。追溯法追溯法是指利用文獻(xiàn)后面的參考文獻(xiàn)來(lái)檢索信息的方法,這些參考文獻(xiàn)與檢索文獻(xiàn)往往具有較大的相關(guān)性,一定程度上可以為檢索人員提供關(guān)鍵信息。循環(huán)法循環(huán)法即綜合利用以上方法來(lái)檢索信息,如先使用順查法、倒查法、抽查法等方法檢索相關(guān)文獻(xiàn),再根據(jù)文獻(xiàn)后面的參考文獻(xiàn)繼續(xù)檢索,擴(kuò)大檢索范圍。檢索語(yǔ)言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術(shù)信息檢索的實(shí)施2.5.1布爾邏輯檢索檢索系統(tǒng)是用于存儲(chǔ)、查找各類信息的工具,各種印刷版工具書(shū)、計(jì)算機(jī)數(shù)據(jù)庫(kù),以及網(wǎng)絡(luò)搜索常用的搜索引擎等都可以歸納為檢索系統(tǒng)。從學(xué)術(shù)檢索的角度來(lái)看,要想在使用檢索系。邏輯“與”邏輯“或”邏輯“非”2.5.1布爾邏輯檢索在中國(guó)知網(wǎng)中運(yùn)用邏輯“與”、邏輯“或”、邏輯“非”檢索檢索式是指將各個(gè)檢索單元之間的邏輯關(guān)系、位置關(guān)系等用檢索系統(tǒng)規(guī)定的各種運(yùn)算符連接起來(lái),計(jì)算機(jī)通過(guò)識(shí)別和執(zhí)行檢索式完成檢索。檢索式控制著檢索的過(guò)程和結(jié)果,因此其合理性直接關(guān)系到檢索的有效性。不同檢索式的不同檢索結(jié)果2.5.2截詞檢索截詞檢索是指在檢索詞的合適位置進(jìn)行截?cái)?,然后使用截詞符進(jìn)行處理,即利用檢索詞的詞干或局部進(jìn)行檢索,只要含有檢索詞局部的所有字符,對(duì)應(yīng)的信息都可以被檢索出來(lái)。前截?cái)嘁卜Q左截?cái)?,是指將截詞符置于字符串的前面。后截?cái)嘁卜Q右截?cái)?,是指將截詞符置于字符串后面。中間截?cái)嗍侵笇⒔卦~符置于字符串的中間,表示任意字符。前后截?cái)嗍侵附厝ツ硞€(gè)詞語(yǔ)的前部和后部,保持中間一致。12342.5.3字段檢索通過(guò)外部特征和內(nèi)容特征進(jìn)行檢索的方法,即通過(guò)刊名、作者、關(guān)鍵詞等信息進(jìn)行檢索,這些信息在數(shù)據(jù)庫(kù)中也稱為檢索字段,即指定檢索詞出現(xiàn)的字段。中國(guó)知網(wǎng)與萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)的檢索字段萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)中期刊和科技報(bào)告的檢索字段2.5.4位置檢索位置檢索即在檢索詞之間使用位置算符限制兩邊的檢索詞出現(xiàn)在檢索結(jié)果中的位置。由于文獻(xiàn)中詞語(yǔ)的位置和相對(duì)次序不同,所表達(dá)的意思也不同,因而通過(guò)限制詞語(yǔ)的位置來(lái)表達(dá)檢索詞之間的鄰近關(guān)系,可以更清晰地表達(dá)檢索意圖,提高檢索的查全率和查準(zhǔn)率。(F)算符(S)算符(N)算符(W)算符W是with的縮寫(xiě),(W)算符兩側(cè)的檢索詞必須保持前后位置不變,且其中不可插入其他詞,只能插入一個(gè)空格或一個(gè)標(biāo)點(diǎn)符號(hào)。S是subfield的縮寫(xiě),(S)算符兩側(cè)的檢索詞必須出現(xiàn)在同一子字段或自然句中,即一個(gè)句子或一個(gè)短句中,且檢索詞的次序可以顛倒,檢索詞之間可以添加任意詞。N是near的縮寫(xiě),(N)算符兩側(cè)的檢索詞位置可以顛倒,但兩詞之間不可插入其他詞;擴(kuò)展為(nN),表示可以在兩個(gè)檢索詞中插入n個(gè)詞。F是field的縮寫(xiě),(F)算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在同一字段中,如出現(xiàn)在題名字段、文摘字段中,檢索詞的次序可以顛倒,檢索詞之間可以添加任意詞。2.5.5加權(quán)檢索加權(quán)檢索是一種利用不同權(quán)值對(duì)檢索詞進(jìn)行排序的方法,使用加權(quán)檢索需要根據(jù)檢索詞對(duì)檢索課題的重要程度指定不同的權(quán)值,其檢索重點(diǎn)不僅是檢索信息及其關(guān)系,還要在此基礎(chǔ)上判定檢索詞對(duì)文獻(xiàn)命中與否的影響程度。中國(guó)知網(wǎng)中的加權(quán)檢索檢索語(yǔ)言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術(shù)信息檢索的實(shí)施2.6.1信息檢索策略與檢索步驟1.分析檢索課題在檢索開(kāi)始之前,一定要先明確檢索課題的研究目的、課題類型、主要內(nèi)容、背景知識(shí)、概念術(shù)語(yǔ)、學(xué)科范圍、文獻(xiàn)類型、檢索范圍等需求。2.選擇檢索詞檢索詞是能表達(dá)檢索課題主要內(nèi)容的提問(wèn)標(biāo)識(shí),是在檢索時(shí)使用的表示提問(wèn)主題的詞、詞組、數(shù)值或符號(hào),包括題名、著者等外部特征標(biāo)識(shí)和主題詞、分類號(hào)等內(nèi)容特征標(biāo)識(shí)。(1)檢索詞的選取方法主題分析法AC借鑒法B切分法2.6.1信息檢索策略與檢索步驟(2)檢索詞的選取技巧為了盡量提高檢索的查準(zhǔn)率與查全率,在檢索時(shí),要靈活使用近義詞、同義詞,且善用上位詞、下位詞??偟膩?lái)說(shuō),要基于規(guī)范詞進(jìn)行查詢,兼顧自由詞、全稱、簡(jiǎn)稱和縮寫(xiě)字母,如果是外來(lái)詞,還要注意譯寫(xiě)變化,某些時(shí)候也可嘗試以英文作為檢索詞。構(gòu)建檢索式即合理利用選取的檢索詞,基于各個(gè)檢索系統(tǒng)的檢索技術(shù)構(gòu)建完整的檢索式。3.構(gòu)建檢索式檢索人員最好根據(jù)學(xué)科特點(diǎn)和檢索課題,選擇與之相符的權(quán)威檢索系統(tǒng),尤其是在課題鑒定、論文開(kāi)題、科技查新、申請(qǐng)專利等方面,必須選擇專業(yè)、權(quán)威的檢索系統(tǒng)。4.選擇檢索系統(tǒng)2.6.2信息檢索效果評(píng)估與策略調(diào)整1.檢索效果評(píng)價(jià)所謂檢索效果,即利用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論