科技信息檢索與利用一_第1頁
科技信息檢索與利用一_第2頁
科技信息檢索與利用一_第3頁
科技信息檢索與利用一_第4頁
科技信息檢索與利用一_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 科技信息檢索與利用 圖書館采編部 江山1 科技信息檢索與利用一.教學目標及意義 科技信息檢索課程是根據(jù)國家教育部有關文件精神開設的高等學校公共基礎課,也是高等院校唯一的以培養(yǎng)學生情報意識,提高學生信息素養(yǎng)的一門科學方法課。 了解文獻與信息 檢索的基本知識和基本理論。提高情報意識與掌握和利用知識情報的能力,對今后學習,工作的意義和作用。掌握若干種綜合性和專業(yè)性中外文參考工具和檢索工具的使用方法,會利用它們檢索出與自己專業(yè)相關的事實,數(shù)據(jù)和文獻信息?;菊莆沼嬎銠C檢索的知識和一些中外文數(shù)據(jù)庫以及電子圖書,電子期刊,電子報紙等數(shù)字資源的檢索方法和技能。二.教學方法與手段 本課程以課堂講授和檢索實習

2、為主要教學形式。課堂講授側(cè)重介紹信息檢索的基礎理論和基礎知識、重要數(shù)據(jù)庫和檢索工具的使用方法,檢索實習則通過做作業(yè)的形式,使學生熟悉和掌握課堂講授的內(nèi)容以及各種文獻信息資源的使用方法,并力求結(jié)合學生畢業(yè)設計或?qū)W位論文的需要,以加強實習的針對性,提高實習效果。 2 科技信息檢索與利用三.要求 作業(yè):課后復習題(書面形式) 成績(考試與考核相結(jié)合):平時(30)+實習(20)+考試(50)=100 教材:科技信息檢索與利用.宋如憶主編.上海:同濟大學出版社,2003年7月。3 科技信息檢索教學計劃 教學班級:電子信息與電氣工程系05 自動化教學時間:2007-2008學年第二學期8-13周,周三7

3、-8節(jié)(教室南2-107)提綱及課時安排:第一章 信息檢索基礎知識(2學時)(4月16日) 第一節(jié) 信息、知識和文獻 第二節(jié) 信息檢索概述第二章 電子信息資源檢索概述(2學時)(4月23日) 第一節(jié) 電子信息資源概述 第二節(jié) 數(shù)據(jù)庫及其類型 第三節(jié) 電子信息檢索的技術 第四節(jié) 電子信息資源檢索 第五節(jié) 網(wǎng)絡信息資源與服務 第六節(jié) 網(wǎng)絡檢索工具搜索引擎4 科技信息檢索教學計劃 第三章 國內(nèi)主要計算機檢索系統(tǒng)(4學時)(4月30日,5月7日) 第一節(jié) 中文科技期刊數(shù)據(jù)庫(維普資訊) 第二節(jié) 中國期刊網(wǎng)數(shù)據(jù)庫(CNKI) 第三節(jié) 萬方數(shù)據(jù)庫資源系統(tǒng) 第四節(jié) 超星數(shù)字圖書館 第五節(jié) 中國高等教育文獻保

4、障系統(tǒng)(CALIS) 第六節(jié) 中國資訊行第四章 國外主要檢索系統(tǒng)(2學時)(5月14) 第一節(jié) 美國工程索引 第二節(jié) 英國科學文摘 第三節(jié) 美國 EBSCO 第四節(jié) 德國施普林格數(shù)據(jù)庫 Springer LINK5 科技信息檢索教學計劃 第五章 特種文獻檢索(2學時)(5月21日) 第一節(jié) 專利文獻檢索 第二節(jié) 標準文獻及其檢索 第三節(jié) 會議論文文獻及其檢索 第四節(jié) 學位論文及其檢索 實習一 中文文獻計算機檢索(2學時)(5月13、15日) 實習二 外文文獻及特種文獻計算機檢索(2學時)(5月20、22日)第六章 科技文獻的利用和科技論文的寫作(簡介)6 第一章 信息檢索基礎知識 第一節(jié) 信息

5、、知識和文獻 一.信息、知識和文獻的概念 信息是由事物發(fā)出的、體現(xiàn)它存在和運動狀態(tài)的信號和消息 。 廣義的信息是物質(zhì)、能量存在和運動狀態(tài)的表征。狹義的信息是人類社會共享的一切知識、學問以及從客觀現(xiàn)象中提煉出來的各種消息的總和,即現(xiàn)代信息。 知識是人類在改造客觀世界實踐中所取得的認識和經(jīng)驗的總和,是信息的一部分。 文獻是記錄有知識的一切載體。即用文字、圖形、符號或聲頻等技術手段記錄知識信息的物質(zhì)載體,或稱固化在載體上的的知識信息。 二.三者關系 7 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻 圖示如下:8 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻三.信息的類型1.按信息表現(xiàn)形式

6、劃分 (1)文字信息 (2)圖像信息(3)數(shù)值數(shù)據(jù)信息 (4)語言信息 2.按信息的出版類型劃分 (1)科技圖書 科技圖書大多是指對已發(fā)表的科技成果、科技知識的概括和 總結(jié) 。一般包括科技專著教科書、字典、詞典、年鑒、手冊和百科全書等??萍紙D書由于其出版周期較長,知識的新穎性不夠。但如果要對范圍較廣的問題獲得一般的知識,或?qū)δ吧念I域獲得初步的了解,參考科技圖書是有效的辦法。 特征:有著者、出版社、出版地、出版時間、國際標準書號等,國際標準書號:ISBN(International Standard Book Number),由語區(qū)+出版社+出書序號+計算機檢驗碼四部分數(shù)字組成。 9 第一章

7、信息檢索基礎知識 第一節(jié) 信息、知識和文獻 (2)科技期刊 產(chǎn)生于19世紀60年代,是在學術通信和學術會議的基礎上誕生的。是指一種有固定名稱、定期或不定期出版的連續(xù)出版物,具有出版周期短、報道文獻速度快、內(nèi)容新穎等特點。它是人們傳遞科技情報、交流學術思想最基本、最簡便的手段。期刊發(fā)表的論文大多是原始文獻,許多新的成果、新的觀點和新的方法往往首先在期刊上發(fā)表。期刊的論文是科技文獻的主要類型,是檢索工具報道的主要對象。 特征:有統(tǒng)一的刊名,有連續(xù)的年、卷、期次編號,有國際標準刊號:ISSN(International Standard Serial Number),我國出版的正規(guī)科技期刊的版權頁除

8、了有ISSN,還有統(tǒng)一的刊號CN。而期刊論文,一般具有論文的題名、作者、所載期刊的刊名,年、卷、期次等信息,其中,最明顯的識別標記是:卷(Vol.)期(iss.或no.)信息。10 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻 (3)科技報告 科技報告是科技人員國圍繞某一專題從事研究取得成果以后撰寫的正式報告,或者是在研究過程中每個階段的進展情況的實際記錄。其特點是內(nèi)容詳盡專深,有具體的篇名、機構名稱和統(tǒng)一的連續(xù)編號(報告號),一般單獨成冊??萍紙蟾娴姆N類有:技術報告(Technical)、札記(Notes)、論文(Papers)、備忘錄(Memorandum Book)、通報(Bull

9、etin)等??萍紙蟾媸嵌未髴?zhàn)期間及戰(zhàn)后迅速發(fā)展起來的,目前全世界每年都有大量的科技報告產(chǎn)生估計約有10萬件,其中以美國政府研究報告(PB、AD、NASA、DOE)為主。 特征:一般除了文獻的題名、作者等外,還有明顯的標志是具有報告號。 11 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻 (4)會議文獻 會議文獻指由國內(nèi)外重要學術會議上發(fā)表的論文和報告,也包括一些非學術性會議的報告會議文獻的特點是: 文獻針對性強。每個會議都有其特寫的主題,因而會議文獻所涉及的專業(yè)領域集中,內(nèi)容專深。 信息傳遞速度快。一些重要的研究成果或新的發(fā)現(xiàn),通常首先會議文獻向社會公布。 能反映具有代表性的各種觀點

10、。學術會議通常帶有研討爭鳴的性質(zhì),要求論文具有獨到的見解,這有助于了解有關領域的并報發(fā)現(xiàn),新動向和新成就。因此,會議文獻是了解國際和國內(nèi)的科研水平、動態(tài)和發(fā)展趨勢的重要信息來源。 特征:如Colloquium, congress, convertion, forum, meeting, symposium, workshop等。一般有論文題名、作者等,特別有會議召開的時間、地點、會議名稱、主辦單位等。常有:Proceeding of (或proc.),Conference on (或conf.),Symposium等詞的出現(xiàn)。 12 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻 (5)專

11、利文獻(Patents) 專利文獻指由專利局公布出版或歸檔的所有與專利申請案有關的文件和資料。專利文獻的類型有一次專利信息(各種形式的專利說明書)、二次專利信息(主要批專利公報或?qū)@饕┖蛯@诸愘Y料(專利分類表及分類表索引等)。 特征:所有專利文獻都會標注有專利號、國別代碼,甚至國際專利分類號(IPC)等信息。 13 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻(6)學位論文 學位論文是高等學校、科研機構的畢業(yè)生、研究生為獲得學位所撰寫的論文學位論文探討的問題往往比較專深,一般具有一定的創(chuàng)造性。根據(jù)學位的不同分為學士、碩士和博士三種學位論文。 特征:一般標注有thesis或disse

12、rtation等字樣,另外,還常標注有學位、頒發(fā)單位、地址、授予學位的時間等信息。 14 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻(7)標準文獻 標準文獻是一種規(guī)范性的技術文件。按使用范圍可分為國際標準、區(qū)域性標準、國家標準、行業(yè)標準和企業(yè)標準。科技檔案(Science and Technology Record)科技檔案是指單位在技術活動中所形成的技術文件、圖紙、圖片、原始技術記錄等資料,包括任務書、協(xié)議書、技術指標、審批文件、研究計劃、方案、大綱、技術措施、調(diào)研報告等,它是生產(chǎn)建設和科研活動中用以積累經(jīng)驗、吸取教訓和提高質(zhì)量的重要文獻??萍紮n案具有保密和內(nèi)部使用的特點,一般不公開

13、。 特征:注意其標準號 15 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻 (8)政府出版物(Goverement Publication) 政府出版物是由政府機構,包括:國際組織(諸如:聯(lián)合國、國際聯(lián)盟、歐洲共同體、世貿(mào)組織等)和各國中央政府及省、或州、市、鄉(xiāng)等級地方政府組織,以及它們所擁有的官方和半官方機構及其所屬的專門機構所發(fā)表、出版的各種文獻資料。其內(nèi)容可分為行政性文件(如政治法律文件、政府決議報告等)和科技文獻(如統(tǒng)計資料、科技報告科普資料等)兩大類,其中科技文獻占3040%.16 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻(9)產(chǎn)品樣本 產(chǎn)品樣本是國內(nèi)外生產(chǎn)廠商或經(jīng)銷

14、商為推銷產(chǎn)品而印發(fā)的企業(yè)出版物,是用來介紹產(chǎn)品的品種、特點、性能、結(jié)構、原理、用途和維修方法價格等。全世界每年的產(chǎn)品樣本據(jù)不完全統(tǒng)計約有7080萬種。 17 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻3按信息被加工程度劃分 (1)一次信息 凡是著者在科學研究、生產(chǎn)實踐中根據(jù)科研成果、發(fā)明創(chuàng)造撰寫的諸如專著、報刊論文、會議文獻、學位論文、專利說明書、科技檔案、技術標準、科技報告等。一次信息是最基本的情報源,是信息檢索的對象。只要是原始的著述,無論是何種文獻類型或載體形式,都是一次信息。一次信息零碎、分散、無序,有的很難獲取。 (2)二次信息 它是將分散、無序的一次信息,按照一定的原則進行

15、加工整理提煉、組織、使之成為便于存貯、檢索的系統(tǒng),它們具有按信息特征來報道揭示和檢索一次信息的功能,能系統(tǒng)的反映一次信息,為讀者提供檢索所需信息線索,是查找一次信息的工具。如目錄、題錄、文摘、索引等檢索工具。二次信息的形成是從分散、無序到集中、有序化的控制過程。 18 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻(3)三次信息 它是在利用二次信息的基礎上選用一次信息的內(nèi)容進行分析、概括、綜合研究和評價而編寫出來的文獻。它又可分為綜述研究類和參考工具類兩種類型。前者如動態(tài)綜述、學科總結(jié)、專題述評、進展報告等;后者如年鑒、手冊、大全、詞典、百科全書等。三次文獻源于一次文獻又高于一次文獻,屬于

16、一種再創(chuàng)性文獻。三次文獻一般來說系統(tǒng)性好,綜合性強、內(nèi)容比較成熟,常常附有大量的參考文獻,有時可作為查閱文獻的起點。(4)零次信息 所謂“零次信息”是指非正式出版物或非正式渠道交流的文獻,未公開于社會只為個人或某一團體所用。如文章草稿、私人筆記、會議記錄、未經(jīng)發(fā)表的名人手跡、甚至包括口頭言論和無形的思想意識。 以上四級信息的關系是,零次信息是一次信息的素材,一次信息是二次、三次信息的來源和基礎,二次、三次信息是對一次信息進行組織、加工、綜合后形成的,它們編寫的目的明確,專指性強。所謂“信息檢索”主要是對二次、三次信息的檢索。19 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻4按信息存儲載

17、體劃分 根據(jù)對科信息的不同記錄形式和記錄手段,以及記載信息的不同物質(zhì)形式和存儲介質(zhì),信息可以劃分為:(1)印刷型 以紙張為媒體,以手寫、石印、油印、膠印、影印等為手段來記錄知識、信息這是傳統(tǒng)文獻的基本形式也是目前文獻的主要形式。最典型的代表是我們常用的書等。其優(yōu)點是讀取方便,流傳廣泛、價格便宜、不受時空的局限;其不足是存儲信息密度低,占據(jù)空間大、笨重,尤其在當今信息爆炸的時代,其缺點顯得尤為突出。(2)縮微型 以感光材料為媒體,以縮微照相為記錄手段的文獻,實際是紙質(zhì)印刷型號的變體,也稱縮微復制品,包括縮微膠卷、縮微膠片(或縮微平片)、縮微卡片等。其優(yōu)點上信息存貯密度高,文獻體積小、可節(jié)省95%

18、以上的貯存空間,便于收藏、保存和傳遞,能安全貯存珍貴資料、方便管理,并比印刷型文獻經(jīng)濟實惠,在某種程度上能彌補印刷型的不足。但縮微型號文獻的閱讀必須借助于縮微閱讀機或其他輔助設備,不便攜帶,保存條件要求嚴格,難于普及。 20 第一章 信息檢索基礎知識 第一節(jié) 信息、知識和文獻(3)視聽型又稱聲像型 以磁性材料或感光材料為存貯介質(zhì),借助特殊的機械設備,直接記錄聲音和圖像,并通過視聽設備存貯與播放信息知識的形式,如唱片、錄音帶等。依感官接受功能劃分,視聽型又可分為視覺資料、聽覺資料和視聽合一的多媒體資料三種類型。其優(yōu)點是聲情并茂,形象逼真,直觀性強,動靜交替,易于接受,在其傳遞信息知識方面有著其他

19、形式不可替代的優(yōu)勢;缺點是必須借助一定的設備才能使用。(4)機讀型 這是一種通過編碼和程序設計,把文字、資料等信息轉(zhuǎn)換成數(shù)字語言和機器語言,以磁性材料為介質(zhì)以打字、穿孔或光學玻璃字符識別裝置為記錄手段,輸入計算機,存貯的磁盤、磁帶、光盤上閱讀時再由要求輸出的信息。機讀型近年來有了新的發(fā)展,特別是今天廣泛使用的網(wǎng)絡型的文獻。機讀型的優(yōu)點是信息豐富量大,查找方便快捷,不足是相應設備的投入較大。 21 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述一.科技信息檢索概述 1.科技信息檢索的定義 科技信息檢索是從大量的科技信息集合中找出所需信息的活動、過程與方法。這是一種針對廣大科技信息用戶來說的狹義說

20、法。從廣義上來說,科技信息檢索包括信息的存儲(Storage)和檢索(Retrieval)兩方面,即包括將科技信息按一定的方式組織存儲起來和按信息用戶需求來查找出相關科技信息兩方面??萍夹畔z索本質(zhì)是信息用戶將自身的需求和信息集合進行比較和選擇的過程。 22 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 2.科技信息檢索的意義 當今世界是一個信息的世界,開放的世界,掌握的知識信息多,掌握知識信息少的人就是一種挑戰(zhàn);獲得的知識信息快,獲得知識信息慢的人就將會是一種沖擊,一種壓力。因為知識信息,于人的智能開發(fā)具有決定性的作用。一個大學生要施展其才智,僅僅依靠教師課堂傳授的知識遠遠不夠的。必須在接

21、受課堂傳授的知識的基礎上,在學習的過程中培育出獨立自學和研究的能力。這種能力的培養(yǎng),是建立在充分占有信息的基礎之上的。如何去占有信息,了解、熟悉信息檢索的途徑和方法,合理地利用檢索信息將是一條必由之路。因為通過檢索信息,它會向人們提供打開信息寶庫的鑰匙,指引信息所在的方向23 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述3科技信息檢索的類型 根據(jù)檢索對象可分為文獻檢索、數(shù)據(jù)檢索、事實檢索。 (1)文獻檢索 文獻檢索是指以文獻為檢索對象的信息檢索,是指利用相應的方式與手段,在檢索系統(tǒng)存儲的信息中查找用戶所需文獻的過程。文獻檢索的目的通常是檢索相關文獻的出處和收藏地。這些文獻可以是涉及某一主題、

22、學科、著作、年代的文獻,收藏地可以是一館、一地甚至全世界。用戶通過檢索獲取的是文獻或者是文獻原文。文獻檢索根據(jù)檢索內(nèi)容的不同又分為書目檢索和全文檢索。書目檢索是指用戶通過檢索獲得的與課題相關的一系列文獻線索。這種方式產(chǎn)生較早,發(fā)展也比較完善。全文檢索是以文獻包含的全部信息作為檢索內(nèi)容,檢索時可從獲取全文以及相關的句、段、章等文字。全文檢索是當前計算機信息檢索的發(fā)展方向之一。24 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述(2)數(shù)據(jù)檢索 數(shù)據(jù)檢索是指以數(shù)值或圖表為檢索對象,如各種統(tǒng)計數(shù)據(jù)、人口數(shù)據(jù)、氣象數(shù)據(jù)、企業(yè)財政數(shù)據(jù)等,并提供一定的運算推導能力。數(shù)據(jù)檢索是一種確定性檢索,用戶檢索到的數(shù)據(jù)

23、可以直接進行定量分析。(3)事實檢索 事實檢索是指以原始文獻中抽取的關于某一事物(事件、事實)發(fā)生的時間、地點和情況等方面的信息,事實檢索也是一種確定性的檢索,用戶獲得的是有關某一事物的具體答案。 25 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述二信息檢索系統(tǒng) 1信息檢索系統(tǒng)的概念 信息檢索系統(tǒng)是根據(jù)一定社會信息需求和達到特定的信息交流目的而建立的一種有序化的,具有收集、組織、存儲和查詢等功能的信息資源集合體和相關設備設施的總稱。 檢索系統(tǒng)的主體部分是文獻信息資源庫,它是附有檢索標識的某一范圍的文獻信息條目(手工)、記錄(計算機)的集合。在文獻信息資源庫中,每條文獻信息條目、記錄都包含多個

24、有檢索意義的特征標識,且全部條目、記錄按照一定的規(guī)則編排組織成一個有機整體,并且附有多種索引。要熟練地利用一個檢索系統(tǒng),必須了解其收錄范圍、收錄對象、特征標識系統(tǒng)以及它提供的各種檢索途徑、檢索方法。26 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述2信息檢索系統(tǒng)的類型 目前信息檢索系統(tǒng)的類型很多,不同種類的檢索系統(tǒng)有不同的特點,人們可以根據(jù)自己的信息需求加以選擇。(1)按信息存儲的載體和實現(xiàn)的查找技術手段,可將信息檢索系統(tǒng)分為:手工檢索系統(tǒng)(包括書本式、卡片式檢索系統(tǒng))、機械檢索系統(tǒng)(穿孔卡片等)、計算機檢索系統(tǒng)(包括單機、光盤、聯(lián)機和網(wǎng)絡檢索系統(tǒng))。(2)按著錄格式不同,可將檢索系統(tǒng)分為目

25、錄、題錄、索引、文摘、全文檢索系統(tǒng)。27 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 目錄檢索系統(tǒng) 目錄(catalog)是對一批相關單獨出版物特征的揭示和報道,是有序的文獻清單目錄。目錄通常以一個完整的出版單位或收藏單位為著錄對象,即以文獻的“本”或“件”為報道,對文獻描述較簡單,條目的著錄有:著者(author)/編者(editor)、書、文獻名(title)和出版事項等,目錄主要用于檢索出版物的名稱、著者及其出版、收藏單位。常用目錄有國家書目、館藏目錄、專題目錄、聯(lián)合目錄等。 題錄型檢索系統(tǒng) 題錄(bibliography)是對單篇文獻單元特征的描述,由一組著錄項來構成一條文獻記錄。

26、題錄一般以內(nèi)容上獨立的文獻單元(如一篇文章或書中的某一部分,甚至整本出版物)作為著錄的基本單元。著錄項目一般有篇名、著者、文獻來源、文種等。由于著錄簡單,收錄范圍廣,報道速度快,題錄是用來查找最新文獻的主要工具。 28 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 文摘型檢索系統(tǒng) 文摘(abstracts)是除描述文獻外部特征之外,還用簡練的語言揭示文獻的主要內(nèi)容,向讀者報道最新研究成果的一種檢索工具。它是檢索工具的主體,二次文獻的核心。文摘種類很多,按文摘的目的、用途劃分,主要有三種類型:報道性文摘、指示性文摘和評論性文摘。 報道性文摘是用來概述原文的內(nèi)容要點(尤其是創(chuàng)新點),向讀者提供原

27、文中的定量信息和定性信息的一種文摘。報道性文摘是原文內(nèi)容的濃縮,基本上能反映原文的技術內(nèi)容,信息量大,參考價值高。讀者通過閱讀這種文摘,一般可以代替原文。報道性文摘的長度一般在200-300字左右,更長的可達500字以上。大多數(shù)文摘屬于此種類型,如美國化學文摘(CA)、生物學文摘(BA)等。 指示性文摘是把原文的主要范圍、目的和方法簡略地指示給讀者,一般不包括原始文獻的具體數(shù)據(jù)、方法、結(jié)論等內(nèi)容。它告訴讀者將在原文中發(fā)現(xiàn)什么,以使讀者不對文獻內(nèi)容產(chǎn)生誤解,幫助讀者判斷是否需要原文,但閱讀指示性文摘不能代替原文。它的長度一般在100字左右,也稱為“簡介”,如日本的科技文獻速報。 29 第一章 信

28、息檢索基礎知識 第二節(jié) 信息檢索概述 評論性文摘是帶有文摘員個人的看法或觀點的一種文摘類型,如美國的應用力學評論。 閱讀文摘大體上就掌握了文獻的主要內(nèi)容。國外有人進行調(diào)查,發(fā)現(xiàn)竟有48%的科學家通過閱讀文摘來代替對原文的閱讀,足見文摘在代替閱讀原文中所起的作用。 索引型檢索系統(tǒng) 索引(index)是把特定范圍內(nèi)的某些重要文獻中的有關各種事物的名稱,如書名、刊名、人名、地名、篇名、字、詞等摘錄,按照一定的方法編排,指明出處,為讀者提供文獻線索的檢索工具。它的應用非常廣泛,或附在書、刊之后作為輔助檢索系統(tǒng),或單獨編輯成冊,一般不提供信息和知識內(nèi)容本身,只提供一種指示系統(tǒng),使用戶能夠準確地找出文獻中

29、的特定信息。30 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 索引通常由索引款目和參照系統(tǒng)組成。索引款目包括標目、說明語和存儲地址。標目,也稱標識,是索引款目所指示的主題或事物;說明語用來解釋款目的含義;存儲地址是款目指示的主題或事物在特定信息集合中的地址,如頁碼、流水號等。索引的種類很多,常見的索引有分類索引、主題索引、著者索引、引文索引、關鍵詞索引等。與目錄相比,它有利于人們進行更深入的檢索。 全文檢索系統(tǒng) 是在題錄或文摘的基礎上,加以完整出版物的全部內(nèi)容,按一定的方法著錄、標引、組織起來的檢索系統(tǒng)。這種檢索系統(tǒng)往往對文獻全文中的詞、詞組及其位置等作更深入的加工、處理,一般采用自然語言

30、進行自動標引,不僅方便人們一次性獲取文獻全文,而且提供更多的檢索途徑,如可以用文中的句子、段落等進行檢索,另外還方便人們對文獻信息作更深層次的研究,如進行各種統(tǒng)計、分析等。 31 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述三檢索語言 1檢索語言概述 (1)檢索語言的概念與功能 檢索語言的概念 檢索語言(Retrieval language),又稱標引語言、索引語言、信息檢索語言等,是根據(jù)檢索需要而編制的一種人工語言。世界上的檢索語言有很多種,如中國圖書館分類法、杜威十進位分類法、中國科學院圖書館分類法、INSPEC 敘詞表等。 對于信息標引人員來說,它是表達文獻主題內(nèi)容、形成文獻標識并借以

31、組織文獻的依據(jù);對于信息檢索人員來說,它是表達檢索課題要求,并同檢索系統(tǒng)中已經(jīng)存儲的文獻標識進行比較從而獲得所需文獻的依據(jù),因此,檢索語言是信息標引人員和信息檢索人員溝通的橋梁。 32 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 檢索語言的功能 檢索語言的功能主要有: 簡單明了而又規(guī)范化地標引文獻的主題內(nèi)容及其外表特征; 對內(nèi)容相同及相關的文獻信息加以集中或揭示其相關性,使大量分散的文獻存儲系統(tǒng)化、組織化,便于進行有規(guī)律的檢索; 便于將標引用語與檢索用語進行相符性比較。(2)檢索語言的分類 各種檢索語言基本原理是一致的,但是,它們在表達各種概念及其相互關系時和在解決對它們提出的那些共同需求

32、時所采用的方法不同,因而形成了不同的類型。檢索語言的基本成分是檢索詞,如按檢索詞的規(guī)范化程度又可分為自然語言和受控語言。 33 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 自然語言 采用非規(guī)范化的詞(Uncontrolled Term),即在信息檢索系統(tǒng)中使用直接來自文獻或用戶提問的一類檢索語言。其檢索詞一般是直接從文獻片名、正文或文摘中抽取有實際意義的詞語,亦稱關鍵詞(Keyword)。關鍵詞是一種未經(jīng)優(yōu)選和規(guī)范化處理的自然語言。是從文獻的題名、文摘甚至正文中抽出具有檢索意義的詞,對揭示文獻內(nèi)容比較關鍵。 自然語言的優(yōu)點: 不受詞表控制,能及時檢索到最新概念的各類文獻。 可任意選取專指性

33、強的詞語,提高查準率。 非受控詞具有數(shù)量大的特點,一般比序詞表數(shù)大23個數(shù)量級。 避免在標引人員和用戶之間造成不必要的交流障礙。 自然語言的缺點有: 不規(guī)范,存在大量同義詞、多義詞現(xiàn)象。 沒有顯示詞語之間的關系。34 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 受控語言 受控語言是指索引詞來自文獻或用戶提問并受到信息檢索系統(tǒng)控制的一類索引語言的總稱,又稱規(guī)范化語言。 為克服使用自然語言而產(chǎn)生漏檢和誤檢的可能性,人們編制了人工語言,它采用經(jīng)過規(guī)范化的詞,規(guī)定一個詞表示一種事物,例如規(guī)定aircraft表示“飛機”而不用airplane,plane,aero plane ,以做到文獻存儲和檢索

34、的一致性。這些規(guī)范化詞的集合構成了詞表,引導檢索人員和標引人員理解一致,提高查全率和查準率。 受控語言按組配程序來劃分,可分為先組式語言和后組式語言。35 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 受控語言的優(yōu)點: 容易選擇寬廣的概念,因此,查全率較高。 因詞表已解決自然語言中的同義詞、近義詞等關系,而且在詞表中顯示詞與詞之間存在一定關系,因此檢索時相對容易,不致漏檢。 受控語言的缺點: 使用受控詞檢索需查表,對詞表不熟悉時檢索較困難。 由于受控語言被限制在預先制定的概念或類目內(nèi),不能表示新的概念,隨著科技的發(fā)展,許多新的專業(yè)術語等詞表難以立即收集,造成利用詞表很難檢索到含有新學科、新概

35、念文獻的問題。 36 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 2常用受控檢索語言 (1)分類語言 分類語言用分類號來表達各種概念,以學科體系為基礎,將各種概念按學科性質(zhì)進行分類和系統(tǒng)排列。它按照知識門類的邏輯次序,運用概念劃分和歸屬的方法,采用由總到分K由一般到個別,由抽象到具體,由低級到高級,由簡單到復雜這樣層層劃分,逐級展開,形成一個嚴格有序的等級制體系。 分類語言的優(yōu)點: 體系分類語言是以學科劃分類目,符合人們認識事物的規(guī)律和處理事物的習慣。分類語言強調(diào)知識的系統(tǒng)性,方便人們按學科、專業(yè)系統(tǒng)檢索有關文獻,能夠達到族性檢索,可以獲得較高查全率。 便于組織圖書資料排架。 37 第一章

36、 信息檢索基礎知識 第二節(jié) 信息檢索概述 分類語言的缺點: 檢索者檢索課題時首先必須了解課題的學科體系才能順利地查找到相應的類目,如果不熟悉學科體系,會帶來一定困難。 由于采用分類語言的分類表的結(jié)構是固定的,不便于隨時修訂和增設新的類目。它總是落后于科學技術的發(fā)展,難于及時反映新興學科、邊緣學科的內(nèi)容。 體系分類語言采用分類號作為標識,檢索文獻時,需要將檢索文獻的主題內(nèi)容轉(zhuǎn)換成分類號,轉(zhuǎn)換過程中,容易產(chǎn)生誤差,造成誤檢。 分類語言是一種先組式檢索語言,它是通過分類表來體現(xiàn)其功能,分類表也是標引和檢索的共同依據(jù)。世界上比較著名的分類法有:國際專利分類法、美國國會圖書館分類法、杜威十進分類法等。在

37、我國應用較廣的分類法有中國圖書館圖書分類法(簡稱中圖法)、中國科學院圖書館圖書分類法、人民大學圖書館圖書分類法等。38 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 中國圖書館圖書分類法(簡稱中圖法)是我國一部大型的綜合性的圖書分類法,它的主體是它的類目表,包括簡表、詳表、輔助表和編制說明,此外還有索引。 中圖法采用“五分法”形成五大部,在五大部類之下,層層細分,劃分出22個基本大類,分別為: 一、馬克思主義、列寧主義、毛澤東思想 A 馬克思主義、列寧主義、毛澤東思想、鄧小平理論 二、哲學 B 哲學、宗教 三、社會科學 C 社會科學總論 D 政治、法律 E 軍事 F 經(jīng)濟 G 文化、科學、教

38、育、體育 H 語言、文字 I 文學 J 藝術 K 歷史 39 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述 四、自然科學 O 自然科學總論 N 數(shù)理科學和化學 P 天文學、地球科學 Q 生物科學 R 醫(yī)藥衛(wèi)生 S 農(nóng)業(yè)科學 T 工業(yè)技術 U 交通運輸 V 航空!航天 X 環(huán)境科學、安全科學 五、綜合性圖書 Z 綜合性圖書 中圖法屬于等級列舉式分類法,特點是類目列舉詳盡,排列按等級體系,從總體到局部,由大類到小類層層細分,形成樹型結(jié)構,其中的等級體系一般根據(jù)學科屬性排列。類目格式一般包括分類號、類目名稱和注釋。 索書號:如 TM1-44/13電力電子技術典型題解析及自測試題 ,其中TM1-44就是該書的分類號,/13則是該書在同種書中的種次號。40 第一章 信息檢索基礎知識 第二節(jié) 信息檢索概述(2)標題詞語言 標題詞語言(Heading)是以標題詞作為文獻內(nèi)容標識和檢索依據(jù)的一種主題詞語言。標題詞通過對文獻的內(nèi)容分析,從中找出具有實質(zhì)意義,能表達文獻內(nèi)容特征,并經(jīng)過規(guī)范化處理的詞、詞組或短語。 標題詞是一種先組式檢索語言,在檢索前這些標題詞已經(jīng)固定組配。標題詞表是標題詞使用規(guī)則的匯編,是標引和檢索文獻的工具,是一部標題詞典。標

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論