版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2.1文獻(xiàn)信息概述
2.2文獻(xiàn)信息檢索2.1文獻(xiàn)信息概述2.1.1信息、知識(shí)、情報(bào)、文獻(xiàn)1.信息信息一詞來(lái)源于拉丁文informatio,原意是通知、報(bào)道或消息。作為一個(gè)科學(xué)概念,信息在19世紀(jì)末最早出現(xiàn)在通信領(lǐng)域,是指通信系統(tǒng)傳輸和處理的對(duì)象。信息奠基人香農(nóng)認(rèn)為“信息是用來(lái)消除不確定性的東西”??刂普搫?chuàng)始人維納認(rèn)為“信息是人們?cè)谶m應(yīng)外部世界,并使這種適應(yīng)反作用于外部世界的過(guò)程中,同外部世界進(jìn)行互相交換的內(nèi)容和名稱”。這兩個(gè)定義常被作為經(jīng)典定義加以引用。根據(jù)近年來(lái)人們對(duì)信息的研究成果,科學(xué)的信息概念可以概括為:信息是對(duì)客觀世界中各種事物的運(yùn)動(dòng)狀態(tài)和變化的反映,是客觀事物之間相互聯(lián)系和相互作用的表征,表現(xiàn)的是客觀事物運(yùn)動(dòng)狀態(tài)和變化的實(shí)質(zhì)內(nèi)容。利用文字、符號(hào)、聲音、圖形、圖像等形式,通過(guò)各種渠道傳播的信號(hào)、消息、情報(bào)或報(bào)道等內(nèi)容,都可以稱之為信息。一般認(rèn)為,信息具有如下特點(diǎn):(1)普遍性和客觀性。(2)存儲(chǔ)性、傳遞性與依附性。(3)共享性。(4)時(shí)效性。(5)價(jià)值相對(duì)性。2.知識(shí)知識(shí)是與信息相聯(lián)系又有區(qū)別的概念。信息反映了客觀事物存在及變化的情況,是對(duì)客觀事物存在及變化情況的反映、刻畫(huà)、描述、標(biāo)識(shí)和度量。知識(shí)是主體獲得的系統(tǒng)化、組織化了的信息。知識(shí)反映了主體對(duì)客觀事物存在及變化的內(nèi)在規(guī)定性的認(rèn)識(shí),是主體獲得的與事物存在及變化內(nèi)在規(guī)定性有關(guān)的結(jié)構(gòu)化、系統(tǒng)化的信息,是信息的高級(jí)表現(xiàn)形式。3.情報(bào)情報(bào)是指被傳遞的知識(shí)或事實(shí),是知識(shí)的激活,是通過(guò)一定的載體,越過(guò)空間和時(shí)間傳遞給特定用戶,解決科研和生產(chǎn)中的具體問(wèn)題所需要的特定知識(shí)和信息。情報(bào)既不等同于知識(shí)也不等同于信息,它是為實(shí)現(xiàn)主體某種特定目的,有意識(shí)地對(duì)有關(guān)的事實(shí)、數(shù)據(jù)、信息、知識(shí)等要素進(jìn)行勞動(dòng)加工的產(chǎn)物。目的性、傳遞性和效用性是情報(bào)最基本的屬性。4.文獻(xiàn)國(guó)際標(biāo)準(zhǔn)化組織制定的《文獻(xiàn)情報(bào)術(shù)語(yǔ)國(guó)際標(biāo)準(zhǔn)》(ISO/DIS5217)中對(duì)文獻(xiàn)的定義是:“文獻(xiàn)是在存儲(chǔ)、檢索、利用或傳遞記錄信息的過(guò)程中,可作為一個(gè)單元處理的,在載體內(nèi)、載體上或依附載體而存儲(chǔ)有信息或數(shù)據(jù)的載體”。中國(guó)國(guó)家標(biāo)準(zhǔn)《文獻(xiàn)著錄總則》(GB/T3792.1—2009)對(duì)文獻(xiàn)的定義是“記錄有知識(shí)的一切載體”。文獻(xiàn)由4個(gè)要素構(gòu)成:(1)信息內(nèi)容,即文獻(xiàn)所記錄的知識(shí)和信息,這是文獻(xiàn)的靈魂。(2)符號(hào)系統(tǒng),即記錄知識(shí)和信息的符號(hào)。(3)物質(zhì)載體,即用于記錄知識(shí)和信息的物質(zhì)載體,如紙張、膠卷等,它們是文獻(xiàn)的外在形式。(4)記錄方式,如鑄刻、書(shū)寫(xiě)、印刷、復(fù)制、錄音錄像等,它們是知識(shí)、信息與載體的聯(lián)系方式。知識(shí)和信息是文獻(xiàn)的內(nèi)容,符號(hào)系統(tǒng)是知識(shí)和信息的攜帶者,載體是符號(hào)賴以依附的“寄主”,而記錄方式則是代表知識(shí)和信息的符號(hào)進(jìn)入載體的方法和過(guò)程,這四個(gè)要素缺乏任何一項(xiàng)都不可能形成文獻(xiàn)。2.1.2文獻(xiàn)分類文獻(xiàn)信息的形式多種多樣,人們?yōu)榱吮阌趯W(xué)習(xí)和利用,根據(jù)不同的標(biāo)準(zhǔn)對(duì)文獻(xiàn)進(jìn)行了歸類和劃分。1.根據(jù)存儲(chǔ)載體和記錄形式劃分1)手寫(xiě)型
2)印刷型
3)縮微型:是以感光材料為載體,利用光學(xué)技術(shù)將文字、圖形、影像等信息符號(hào)按比例縮小的文獻(xiàn)形式,包括縮微膠卷等??s微型文獻(xiàn)閱讀時(shí)需要較復(fù)雜的設(shè)備來(lái)支持,它們具有體積小、信息密度高、便于收藏和保存、價(jià)格便宜等優(yōu)點(diǎn)。例如,微縮膠片在溫度21℃、濕度50%的條件下,至少可以保存500年。因此,縮微型文獻(xiàn)常用于保存一些珍貴資料。4)聲像型
5)數(shù)字型
2.根據(jù)內(nèi)容性質(zhì)和加工程度劃分1)零次文獻(xiàn)
零次文獻(xiàn)是指未經(jīng)出版發(fā)行的文獻(xiàn),主要包括手稿、個(gè)人通信和原始記錄等。零次文獻(xiàn)內(nèi)容比較客觀,但具有不成熟、零散、不公開(kāi)交流等缺點(diǎn)。2)一次文獻(xiàn)
一次文獻(xiàn)又稱為原始文獻(xiàn),是人們對(duì)研究或創(chuàng)造性活動(dòng)成果的直接記錄,一般指公開(kāi)出版的著作、期刊論文、科技報(bào)告、會(huì)議文獻(xiàn)、學(xué)位論文、發(fā)明專利等。一次文獻(xiàn)記載的信息零碎、分散、無(wú)序,但同時(shí)它們也具有新穎性、創(chuàng)造性和系統(tǒng)性等特征,參考和使用的價(jià)值較高。3)二次文獻(xiàn)
二次文獻(xiàn)是指通過(guò)科學(xué)的方法,將分散無(wú)序的一次文獻(xiàn)經(jīng)過(guò)篩選、分析、整理,按其內(nèi)容特征和外部特征進(jìn)行提煉、濃縮,編制而成的有系統(tǒng)的文獻(xiàn),主要包括目錄、文摘、索引等。二次文獻(xiàn)具有濃縮性、匯集性、有序性等特點(diǎn),它們的形成是從分散、無(wú)序到集中、有序化的書(shū)目控制過(guò)程。4)三次文獻(xiàn)
三次文獻(xiàn)是通過(guò)二次文獻(xiàn)提供的線索,對(duì)某一范圍的一次文獻(xiàn)進(jìn)行分析、綜合研究、歸納、整理等深加工所生成的文獻(xiàn),如述評(píng)、百科全書(shū)、專題報(bào)告、年鑒、手冊(cè)、字典等。三次文獻(xiàn)具有資料性和實(shí)用性等特點(diǎn),是對(duì)一次文獻(xiàn)進(jìn)行濃縮、提煉和重新組織的結(jié)果。
零次文獻(xiàn)是最原始的信息資源,雖未公開(kāi)交流,但它們是生成一次文獻(xiàn)信息的主要素材;一次文獻(xiàn)是最主要的信息資源,是人們檢索和利用的主要對(duì)象;二次文獻(xiàn)是對(duì)一次文獻(xiàn)信息的集中提煉和有序化,是檢索一次文獻(xiàn)信息的工具,故又稱檢索工具;三次文獻(xiàn)是按知識(shí)門類或?qū)n}將一次文獻(xiàn)信息重新組織、高度濃縮而成的,是人們查考數(shù)據(jù)信息和事實(shí)信息的主要信息源。一次、二次、三次文獻(xiàn)的關(guān)系如圖2-1所示。3.根據(jù)出版形式劃分根據(jù)出版形式,文獻(xiàn)通常劃分為圖書(shū)、連續(xù)出版物、特種文獻(xiàn)三大類,如圖2-2所示。1)圖書(shū)
圖書(shū)是對(duì)已有研究成果、生產(chǎn)技術(shù)知識(shí)、實(shí)踐經(jīng)驗(yàn)的論述和概括。圖書(shū)的內(nèi)容相對(duì)成熟、系統(tǒng)、全面,有目次表和索引,查閱方便,是傳播知識(shí)的重要工具。但是由于圖書(shū)的出版周期較長(zhǎng),其知識(shí)新穎性不夠。2)連續(xù)出版物
連續(xù)出版物一般是指定期或不定期連續(xù)出版的刊物,包括期刊、報(bào)紙、年度出版物(年鑒、指南等)以及成系列的報(bào)告、學(xué)會(huì)會(huì)刊和會(huì)議錄等。連續(xù)出版物內(nèi)容新穎,出版周期短、速度快,能及時(shí)反映最新知識(shí)、最新科研成果和最新時(shí)事。3)特種文獻(xiàn)
特種文獻(xiàn)通常指那些出版發(fā)行方式或獲取途徑比較特殊的文獻(xiàn)。特種文獻(xiàn)內(nèi)容新穎廣泛,涉及科學(xué)技術(shù)、生產(chǎn)生活的各個(gè)領(lǐng)域。其類型復(fù)雜多樣,主要包括專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、會(huì)議文獻(xiàn)、學(xué)位論文、科技報(bào)告、政府出版物、產(chǎn)品樣本資料和檔案文獻(xiàn)等。專利文獻(xiàn)蘊(yùn)含著大量的技術(shù)、法律和經(jīng)濟(jì)信息,是記錄有關(guān)發(fā)明創(chuàng)造信息的文獻(xiàn)。專利文獻(xiàn)通常包括專利說(shuō)明書(shū)、專利公告、專利檢索工具以及其他與專利有關(guān)的法律文件等,其中專利說(shuō)明書(shū)是主體。具有及時(shí)性、新穎性、詳盡性、系統(tǒng)性、實(shí)用性、可靠性等特征。標(biāo)準(zhǔn)文獻(xiàn)是對(duì)工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格、檢驗(yàn)方法及其技術(shù)要求等方面做出統(tǒng)一規(guī)定的規(guī)范性文獻(xiàn)。標(biāo)準(zhǔn)文獻(xiàn)須經(jīng)權(quán)威機(jī)構(gòu)批準(zhǔn),因而具有一定的法律約束力。對(duì)產(chǎn)品和工程設(shè)計(jì)人員來(lái)說(shuō),標(biāo)準(zhǔn)文獻(xiàn)是不可缺少的參考資料。會(huì)議文獻(xiàn)是在各種會(huì)議上宣讀和交流的論文、報(bào)告和其他有關(guān)資料,其特點(diǎn)是傳遞情報(bào)比較及時(shí),內(nèi)容新穎,專業(yè)性和針對(duì)性強(qiáng)。會(huì)議文獻(xiàn)質(zhì)量較高,能及時(shí)反映科學(xué)技術(shù)中的新發(fā)現(xiàn)、新成果、新成就以及學(xué)科發(fā)展趨勢(shì)。學(xué)位論文是高等院?;蜓芯繖C(jī)構(gòu)的學(xué)生為取得學(xué)位,在導(dǎo)師指導(dǎo)下完成的科學(xué)研究、科學(xué)試驗(yàn)的書(shū)面報(bào)告。學(xué)位論文所探討的問(wèn)題比較專門和系統(tǒng),具有一定的獨(dú)創(chuàng)性、新穎性、科學(xué)性和較強(qiáng)的專業(yè)性,其質(zhì)量要經(jīng)過(guò)學(xué)位或?qū)W術(shù)委員會(huì)的考核。此外,學(xué)位論文一般不公開(kāi)發(fā)行,需要通過(guò)專門的渠道才能獲取原文。根據(jù)學(xué)位的不同,學(xué)位論文分為學(xué)士論文、碩士論文、博士論文三種。科技報(bào)告是對(duì)科學(xué)、技術(shù)研究結(jié)果的報(bào)告或研究進(jìn)展的記錄。科技報(bào)告注重詳細(xì)記錄科研進(jìn)展的全過(guò)程,是科技人員交流其研究活動(dòng)及成果的重要手段,其種類有技術(shù)報(bào)告、札記、論文、備忘錄、通報(bào)等。特點(diǎn)是較快反映新技術(shù)、新學(xué)科,大部分屬于保密和控制發(fā)行的文獻(xiàn)。目前全球每年約有10萬(wàn)種科技報(bào)告產(chǎn)生,其中以美國(guó)商務(wù)出版局的PB報(bào)告、美國(guó)軍事國(guó)防部的AD報(bào)告、美國(guó)宇航部門的NASA報(bào)告、美國(guó)能源部的DOE報(bào)告最為著名??萍紙?bào)告在一定程度上反映了一個(gè)國(guó)家或某一個(gè)學(xué)科的科研水平,是不可多得的信息源。政府出版物是由政府部門及其設(shè)立的專門機(jī)構(gòu)發(fā)布出版的文獻(xiàn)信息資料,主要包括政府報(bào)告、政策法令、規(guī)章制度、會(huì)議紀(jì)要、調(diào)查統(tǒng)計(jì)資料等。政府出版物的主要特點(diǎn)是正式、權(quán)威、材料充實(shí)、數(shù)據(jù)可靠。它們是了解各國(guó)政治、經(jīng)濟(jì)、科學(xué)技術(shù)的方針政策及其發(fā)展?fàn)顩r的權(quán)威性信息來(lái)源。產(chǎn)品樣本資料是對(duì)定型產(chǎn)品的性能、構(gòu)造和原理、用途、使用方法及操作規(guī)程、產(chǎn)品規(guī)格等所做的具體說(shuō)明,是進(jìn)行技術(shù)革新、設(shè)備改造、試制新產(chǎn)品的重要技術(shù)參考資料。產(chǎn)品樣本一般圖文并茂、形象直觀、可靠性強(qiáng)、出版發(fā)行迅速,更新及時(shí)。產(chǎn)品樣本資料的產(chǎn)品和技術(shù)信息比較完整,但多不提供詳細(xì)數(shù)據(jù)和理論依據(jù)。檔案文獻(xiàn)是國(guó)家機(jī)構(gòu)、社會(huì)組織以及個(gè)人從事政治、軍事、經(jīng)濟(jì)、科學(xué)、技術(shù)、文化、宗教等活動(dòng)形成的具有保存價(jià)值的各種文字、圖表、聲像等不同形式的歷史記錄,是完成傳達(dá)、執(zhí)行、使用或記錄現(xiàn)行使命而備留查考的文件材料。按內(nèi)容,檔案可分為文書(shū)檔案、人事檔案、會(huì)計(jì)檔案、科研檔案、產(chǎn)品檔案、工程檔案等;從文獻(xiàn)形式上看,檔案包括了信函、日記、賬簿、報(bào)告、照片、地圖、圖樣、協(xié)議書(shū)、備忘錄、會(huì)議記錄、契約、布告、通知、履歷表等。4.根據(jù)獲得的難易程度劃分1)白色文獻(xiàn)白色文獻(xiàn)指一切正式出版并在社會(huì)上公開(kāi)流通的文獻(xiàn),包括圖書(shū)、報(bào)紙、期刊等。白色文獻(xiàn)通過(guò)出版社、書(shū)店、郵局等正規(guī)渠道公開(kāi)發(fā)行,向社會(huì)所有成員公開(kāi)。2)灰色文獻(xiàn)灰色文獻(xiàn)指非公開(kāi)發(fā)行的內(nèi)部文獻(xiàn)和限制流通的文獻(xiàn),包括社會(huì)公開(kāi)傳播的內(nèi)部刊物、內(nèi)部技術(shù)報(bào)告、內(nèi)部教材和會(huì)議資料等?;疑墨I(xiàn)出版量小,發(fā)行渠道復(fù)雜,流通范圍有一定限制,不易收集。3)黑色文獻(xiàn)黑色文獻(xiàn)包括兩方面的文獻(xiàn),一是未破譯和未辨識(shí)其中信息的文獻(xiàn),如考古發(fā)現(xiàn)的未經(jīng)分析厘定的古老文字;二是處于保密狀態(tài)和不宜公布其內(nèi)容的文獻(xiàn),如未解密的政府文件、內(nèi)部檔案、個(gè)人日記、私人信件等。黑色文獻(xiàn)除作者及特定人員外,一般社會(huì)成員極難獲得和利用。2.1.3文獻(xiàn)信息服務(wù)系統(tǒng)
文獻(xiàn)信息服務(wù)機(jī)構(gòu)是文獻(xiàn)信息資源的最大集散地,它們負(fù)責(zé)搜集、整理、存儲(chǔ)、傳遞各種文獻(xiàn)信息。在互聯(lián)網(wǎng)日益普及的今天,國(guó)內(nèi)外文獻(xiàn)信息服務(wù)機(jī)構(gòu)通過(guò)網(wǎng)絡(luò)提供各類數(shù)據(jù)庫(kù)信息服務(wù)和網(wǎng)上虛擬館藏信息服務(wù),促進(jìn)了信息資源的社會(huì)共享。我國(guó)的文獻(xiàn)信息服務(wù)機(jī)構(gòu)主要有圖書(shū)館系統(tǒng)、科技信息服務(wù)系統(tǒng)、專利文獻(xiàn)服務(wù)系統(tǒng)、標(biāo)準(zhǔn)文獻(xiàn)服務(wù)系統(tǒng)和檔案館系統(tǒng)。它們之間有著密切的聯(lián)系,又有各自不同的服務(wù)重點(diǎn)與服務(wù)對(duì)象。1.圖書(shū)館系統(tǒng)
圖書(shū)館是對(duì)文獻(xiàn)進(jìn)行搜集、整理、保管并提供服務(wù)的科學(xué)、教育、文化機(jī)構(gòu),其主要任務(wù)是整理和傳遞科學(xué)信息,進(jìn)行社會(huì)教育,搜集和保存人類文化遺產(chǎn)。圖書(shū)館入藏的文獻(xiàn)以的圖書(shū)和期刊為主,主要服務(wù)方式有文獻(xiàn)外借服務(wù)、文獻(xiàn)閱覽服務(wù)、文獻(xiàn)復(fù)制服務(wù)、信息咨詢與檢索服務(wù)、用戶教育與輔導(dǎo)、信息研究服務(wù)、網(wǎng)上信息服務(wù)等。隨著數(shù)字化信息的應(yīng)用深入到各個(gè)領(lǐng)域,數(shù)字圖書(shū)館正在成為社會(huì)的公共信息中心和樞紐。2.科技信息服務(wù)系統(tǒng)科技信息服務(wù)系統(tǒng)主要負(fù)責(zé)搜集、整理、研究和傳遞各種專業(yè)性學(xué)術(shù)信息,收藏各種類型的專業(yè)性文獻(xiàn),為各級(jí)領(lǐng)導(dǎo)提供調(diào)研及決策信息,為專利申請(qǐng)或科技成果申報(bào)進(jìn)行查新服務(wù),進(jìn)行科技成果轉(zhuǎn)讓及推廣服務(wù),編譯專題資料等。我國(guó)有一個(gè)龐大的科技信息服務(wù)系統(tǒng),它們分別隸屬于不同的部門。其中最高級(jí)別的是隸屬科技部的中國(guó)科技信息研究所,其次是隸屬于各省、市的科技信息研究所,以及隸屬國(guó)務(wù)院各部委的專業(yè)性科技信息研究所,如機(jī)械工業(yè)信息研究所、中國(guó)國(guó)防科技信息所、航天部航天信息中心等。3.專利文獻(xiàn)服務(wù)系統(tǒng)專利文獻(xiàn)系統(tǒng)是國(guó)家科技信息體系的重要組成部分。專利文獻(xiàn)中心是從事專利文獻(xiàn)的收集、存儲(chǔ)、加工、檢索和服務(wù)的專門機(jī)構(gòu)。我國(guó)專利文獻(xiàn)服務(wù)工作主要由中國(guó)專利文獻(xiàn)服務(wù)中心(國(guó)家知識(shí)產(chǎn)權(quán)局專利局文獻(xiàn)館)以及各地的專利代理機(jī)構(gòu)(通常掛靠在各省科技信息研究所)負(fù)責(zé)。中國(guó)專利文獻(xiàn)服務(wù)中心負(fù)責(zé)收集、管理專利文獻(xiàn),并向用戶提供專利文獻(xiàn)的檢索和復(fù)制服務(wù)等。另外,它還收藏世界各國(guó)和國(guó)際組織的專利說(shuō)明書(shū)及中國(guó)的專利說(shuō)明書(shū)。各地的專利代理機(jī)構(gòu)(專利事務(wù)所)主要承辦專利咨詢、專利申請(qǐng)、專利查新、專利文獻(xiàn)檢索、專利技術(shù)轉(zhuǎn)讓等工作。4.標(biāo)準(zhǔn)文獻(xiàn)服務(wù)系統(tǒng)標(biāo)準(zhǔn)文獻(xiàn)服務(wù)系統(tǒng)由中國(guó)標(biāo)準(zhǔn)化研究院國(guó)家標(biāo)準(zhǔn)館和各省、市標(biāo)準(zhǔn)化研究院(所)下設(shè)的標(biāo)準(zhǔn)館以及國(guó)內(nèi)相關(guān)標(biāo)準(zhǔn)文獻(xiàn)收藏機(jī)構(gòu)組成。國(guó)家標(biāo)準(zhǔn)館隸屬中國(guó)標(biāo)準(zhǔn)化研究院,是我國(guó)唯一的國(guó)家級(jí)標(biāo)準(zhǔn)文獻(xiàn)、圖書(shū)、情報(bào)的館藏、研究和服務(wù)機(jī)構(gòu),是國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)的基礎(chǔ)信息支撐機(jī)構(gòu)。國(guó)家標(biāo)準(zhǔn)館是國(guó)家標(biāo)準(zhǔn)文獻(xiàn)中心,負(fù)責(zé)全面收集、整理、存儲(chǔ)我國(guó)的國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn),收藏國(guó)際標(biāo)準(zhǔn)以及有選擇性地收藏世界各國(guó)的標(biāo)準(zhǔn)文獻(xiàn),并提供標(biāo)準(zhǔn)文獻(xiàn)的信息服務(wù)。各省、市的科技情報(bào)所、各種專業(yè)圖書(shū)館和標(biāo)準(zhǔn)頒布單位一般均收藏有部分標(biāo)準(zhǔn)文獻(xiàn)。5.檔案館系統(tǒng)檔案館是檔案史料的服務(wù)中心,負(fù)責(zé)檔案資料的收集、整理、保管并提供給社會(huì)使用。我國(guó)檔案館大致可分為國(guó)家檔案館、地方檔案館、專門性檔案館和基層單位檔案室等。通常情況下,各種類型文獻(xiàn)的主要收藏機(jī)構(gòu)如表2-1所示。隨著我國(guó)科學(xué)技術(shù)的發(fā)展,傳統(tǒng)的文獻(xiàn)信息收藏與服務(wù)體系已難以滿足社會(huì)需求,一批商業(yè)化的科技信息服務(wù)提供商應(yīng)運(yùn)而生,將大量商品化的科技文獻(xiàn)信息數(shù)據(jù)庫(kù)推向市場(chǎng),使用戶足不出戶就可輕松獲取所需的科技信息。2.2文獻(xiàn)信息檢索2.2.1文獻(xiàn)信息檢索的概念廣義的文獻(xiàn)信息檢索,包括信息的組織和查找兩個(gè)過(guò)程。文獻(xiàn)信息的組織過(guò)程包括信息的描述、標(biāo)引、整序等過(guò)程。信息描述就是對(duì)文獻(xiàn)信息的外部特征進(jìn)行分析提取,然后對(duì)這些特征加以規(guī)范化記錄。信息標(biāo)引就是對(duì)信息內(nèi)容進(jìn)行分析,并將其充分而有效地進(jìn)行提煉標(biāo)示的過(guò)程。信息整序就是把獲得的信息的外部特征和內(nèi)容特征按照一定的規(guī)則有順序地組織起來(lái)。文獻(xiàn)信息的查找過(guò)程包括:用戶對(duì)所需信息內(nèi)容進(jìn)行特征描述;構(gòu)成檢索式或檢索指令向信息檢索系統(tǒng)進(jìn)行提問(wèn);按照一定的檢索技術(shù)將檢索式與檢索系統(tǒng)信息源單元進(jìn)行比較匹配;以一定標(biāo)準(zhǔn)將匹配度較高者作為檢索結(jié)果輸出。文獻(xiàn)信息檢索原理如圖2-3所示。
由以上兩個(gè)過(guò)程可以看出,文獻(xiàn)信息的組織過(guò)程就是建立信息檢索系統(tǒng)的過(guò)程,而信息的查找過(guò)程就是從信息集合中找出所需信息的過(guò)程。
組織是檢索的前提,只有經(jīng)過(guò)組織的有序的信息集合才能被檢索利用,查找則是組織的反過(guò)程。組織與查找是相輔相成、相互依存的辯證關(guān)系。
文獻(xiàn)信息檢索是以文獻(xiàn)信息的存儲(chǔ)與查找所依據(jù)的規(guī)則基本一致為基礎(chǔ)的,為保證文獻(xiàn)檢索的順利進(jìn)行,必須使文獻(xiàn)信息存儲(chǔ)與查找所依據(jù)的規(guī)則一致。2.2.2文獻(xiàn)信息檢索的語(yǔ)言信息檢索語(yǔ)言又稱情報(bào)語(yǔ)言、情報(bào)存儲(chǔ)與檢索語(yǔ)言、標(biāo)引語(yǔ)言等,是根據(jù)檢索的需要而創(chuàng)制的人工語(yǔ)言,是用于描述信息系統(tǒng)中信息的內(nèi)部特征和外部特征及表達(dá)信息用戶提問(wèn)需求的一種專門語(yǔ)言。1.檢索語(yǔ)言的作用檢索語(yǔ)言用于信息檢索系統(tǒng)與檢索用戶的溝通。一定程度上規(guī)范用戶的檢索行為,使不同的檢索用戶遵循相同的檢索規(guī)范。有了統(tǒng)一的檢索語(yǔ)言的支持,所建立的信息檢索系統(tǒng)才具有可檢索性,才能理解用戶發(fā)出的檢索指令,并將符合用戶信息需求的那部分信息作為檢索結(jié)果遞交給用戶。檢索語(yǔ)言的作用體現(xiàn)在以下方面:對(duì)文獻(xiàn)、信息的特征進(jìn)行描述及規(guī)范化的標(biāo)引;集中特定信息檢索系統(tǒng)中的具有相關(guān)性的文獻(xiàn)、信息;實(shí)現(xiàn)對(duì)海量文獻(xiàn)與信息源的有序化處理;將檢索用語(yǔ)與標(biāo)引用語(yǔ)進(jìn)行相符性比較。2.檢索語(yǔ)言的類型
(1)根據(jù)檢索語(yǔ)詞的規(guī)范化程度,檢索語(yǔ)言可分為人工語(yǔ)言和自然語(yǔ)言。①
人工語(yǔ)言。人工語(yǔ)言又稱規(guī)范化語(yǔ)言,即把檢索語(yǔ)言中各種同義詞、多義詞、同形異義詞做規(guī)范化處理,使每個(gè)詞表達(dá)一個(gè)概念。②
自然語(yǔ)言。自然語(yǔ)言是直接從原始信息中抽取的未經(jīng)規(guī)范化處理的,用以揭示信息主題概念的自由詞。除一般的事物名稱、科學(xué)術(shù)語(yǔ)外,自然語(yǔ)言還包括俗名、商品型號(hào)和縮寫(xiě)等。自由詞具有較大的靈活性,專指性強(qiáng),能及時(shí)反映最新的概念和規(guī)范詞難以表達(dá)的特定概念。其不足是缺乏對(duì)詞匯的控制能力,也無(wú)法指示概念之間的關(guān)系,存在大量同義詞、多義詞現(xiàn)象和含義模糊現(xiàn)象,容易造成誤檢和漏檢。通常主題語(yǔ)言中的關(guān)鍵詞和單元詞屬于自然語(yǔ)言。(2)按組配方式,檢索語(yǔ)言可分為先組式語(yǔ)言和后組式語(yǔ)言。①
先組式語(yǔ)言。先組式語(yǔ)言指在文獻(xiàn)信息檢索之前,表達(dá)文獻(xiàn)信息內(nèi)容的標(biāo)識(shí)已經(jīng)事先組配好了的信息檢索語(yǔ)言,用戶只能用固定好的檢索詞組形式去完成檢索。先組式語(yǔ)言有較好的直接性和專指性,但靈活度差,如標(biāo)題詞語(yǔ)言。②
后組式語(yǔ)言。后組式語(yǔ)言指表達(dá)文獻(xiàn)主題概念的標(biāo)識(shí),在編制檢索語(yǔ)言詞表和標(biāo)引文獻(xiàn)時(shí),不曾預(yù)先規(guī)定組配關(guān)系,而是在進(jìn)行檢索時(shí),用戶根據(jù)檢索需要,按照組配規(guī)則臨時(shí)組配起來(lái)的信息檢索語(yǔ)言。(3)按描述文獻(xiàn)的特征,檢索語(yǔ)言可分為描述文獻(xiàn)外部特征的檢索語(yǔ)言和描述文獻(xiàn)內(nèi)容特征的檢索語(yǔ)言,如圖2-4所示。①
描述文獻(xiàn)外部特征的檢索語(yǔ)言。文獻(xiàn)外部特征主要是指文獻(xiàn)的題名、責(zé)任者(個(gè)人/團(tuán)體)、出版者和號(hào)碼(如報(bào)告號(hào)、專利號(hào))等。描述文獻(xiàn)外部特征的檢索語(yǔ)言將文獻(xiàn)的這些不同特征按一定的順序排列,形成文獻(xiàn)的不同檢索途徑,來(lái)滿足用戶的檢索需要。②
描述文獻(xiàn)內(nèi)容特征的檢索語(yǔ)言。該類檢索語(yǔ)言指描述文獻(xiàn)論述的主題、觀點(diǎn)、見(jiàn)解和結(jié)論等的檢索語(yǔ)言,如常用的分類語(yǔ)言、主題語(yǔ)言和引文語(yǔ)言都是描述文獻(xiàn)內(nèi)容特征的檢索語(yǔ)言。分類語(yǔ)言是按學(xué)科范疇劃分事物而構(gòu)成的一種檢索語(yǔ)言體系。分類語(yǔ)言集中反映學(xué)科的系統(tǒng)性,反映事物之間的相關(guān)、從屬、派生等關(guān)系,并從總體到局部分層、分面展開(kāi),最終形成分類體系。具體而言,分類語(yǔ)言以學(xué)科分類為基礎(chǔ),按照概念劃分的原理,將知識(shí)概念從總體到個(gè)體,從一般到特殊、從全部到局部逐級(jí)劃分,每劃分一次就形成一批并列的知識(shí)概念。分類語(yǔ)言以分類法的形式來(lái)體現(xiàn),其特點(diǎn)是用分類號(hào)來(lái)表達(dá)各種概念,把各種概念按學(xué)科分類進(jìn)行系統(tǒng)組織和排列。分類法有利于系統(tǒng)掌握某一學(xué)科或?qū)I(yè)范圍的信息。主題是指文獻(xiàn)具體論述的對(duì)象和研究的問(wèn)題。主題語(yǔ)言是以代表文獻(xiàn)內(nèi)容特征和科學(xué)概念的詞語(yǔ)作為檢索標(biāo)識(shí),并按字順排列組織起來(lái)的一種檢索語(yǔ)言。按選詞原則,主題語(yǔ)言又分為標(biāo)題詞語(yǔ)言、單元詞語(yǔ)言、敘詞語(yǔ)言和關(guān)鍵詞語(yǔ)言四種。標(biāo)題詞語(yǔ)言是用經(jīng)過(guò)規(guī)范化處理的名詞術(shù)語(yǔ)來(lái)表達(dá)文獻(xiàn)所論及的事物或主題,并將全部標(biāo)題詞按字順排列起來(lái)而形成的一種檢索語(yǔ)言。標(biāo)題詞語(yǔ)言是使用最早的一種主題語(yǔ)言,它的檢索標(biāo)志是在編制主題詞表時(shí)已組配好的,這種固定組配的主題語(yǔ)言通常被稱為“先組式”主題語(yǔ)言。單元詞又稱元詞,它是從信息中抽取出來(lái)的最基本的、在字面上不能再分的、具有獨(dú)立概念的各名詞術(shù)語(yǔ)。單元詞語(yǔ)言是通過(guò)若干單元詞的組配來(lái)表達(dá)復(fù)雜的主題概念的,其組配是靈活進(jìn)行的,不是預(yù)先規(guī)定好的,屬于后組式檢索語(yǔ)言。敘詞語(yǔ)言是以敘詞(即主題詞)作為文獻(xiàn)內(nèi)容標(biāo)識(shí)和檢索依據(jù)的主題語(yǔ)言。敘詞語(yǔ)言是采用表示單元概念的規(guī)范化語(yǔ)詞的組配來(lái)對(duì)文獻(xiàn)內(nèi)容主題進(jìn)行描述的檢索語(yǔ)言,也是目前使用最廣泛的主題語(yǔ)言。敘詞語(yǔ)言是多種語(yǔ)言的綜合應(yīng)用,它的基本功能是概念組配,因此敘詞語(yǔ)言屬于后組式檢索語(yǔ)言。關(guān)鍵詞語(yǔ)言是將文獻(xiàn)中原有的、能描述其主題概念的、具有檢索意義的詞匯抽出,并按字順排列起來(lái)的檢索語(yǔ)言。由于關(guān)鍵詞不加規(guī)范,所以容易標(biāo)引、快速、客觀,適用于目的性不強(qiáng)的瀏覽性查找。目前大多數(shù)搜索引擎使用的都是關(guān)鍵詞語(yǔ)言,而學(xué)科信息門戶使用的多為規(guī)范主題語(yǔ)言。引文索引法主要利用文獻(xiàn)與文獻(xiàn)之間的相互引證關(guān)系來(lái)組織信息,即以一些文獻(xiàn)作為標(biāo)引詞,來(lái)標(biāo)引和檢索另一些文獻(xiàn)。引文語(yǔ)言無(wú)詞表,標(biāo)引詞為文獻(xiàn)中的主要著錄項(xiàng)目,屬后組式檢索語(yǔ)言。代碼語(yǔ)言是指用某種代碼系統(tǒng)來(lái)表示和排列事物的某方面特征,并提供檢索的一種語(yǔ)言。例如,根據(jù)化合物的分子式這種代碼語(yǔ)言,可以構(gòu)成分子式索引系統(tǒng)。用戶可從分子式出發(fā),檢索相應(yīng)的化合物及與其相關(guān)的文獻(xiàn)信息。2.2.3文獻(xiàn)信息檢索的工具1.手工檢索工具手工檢索工具是傳統(tǒng)的檢索工具,主要是各種類型的工具書(shū)。根據(jù)體例和功能,工具書(shū)可分為檢索類工具書(shū)和參考工具書(shū)。1)檢索類工具書(shū)按著錄內(nèi)容,檢索類工具書(shū)可分為目錄、題錄、文摘和索引。目錄通常以文獻(xiàn)的“本”“種”“件”等為單位,是對(duì)一批相關(guān)文獻(xiàn)外表特征的揭示和報(bào)道,如《全國(guó)新書(shū)目》《全國(guó)總書(shū)目》等。題錄是報(bào)道和揭示單篇文獻(xiàn)的外表特征,在目錄的基礎(chǔ)上發(fā)展起來(lái)的一種檢索工具。它與目錄的主要不同點(diǎn)在于著錄的對(duì)象不同,目錄的著錄對(duì)象是整部文獻(xiàn),而題錄的著錄對(duì)象是文獻(xiàn)中的論文或部分內(nèi)容,如《化學(xué)題錄》《中文科技期刊題錄數(shù)據(jù)庫(kù)》等。文摘是系統(tǒng)著錄、報(bào)道、積累與揭示文獻(xiàn)信息外表特征和內(nèi)容特征的檢索工具。它是對(duì)文獻(xiàn)中的論文或內(nèi)容進(jìn)行濃縮,概括地描述其主要論點(diǎn)、數(shù)據(jù)、結(jié)論等要點(diǎn),并注明其出處,按一定的規(guī)則編排起來(lái)的一種檢索工具。文摘又可分為指示性文摘、報(bào)道性文摘和評(píng)論性文摘三種。索引是將文獻(xiàn)信息中的題名、人名、地名、字句及參考文獻(xiàn)等分別摘錄出來(lái),并注明出處,按一定的規(guī)則編排起來(lái)的一種檢索工具,如《經(jīng)濟(jì)科學(xué)論文索引》和《社會(huì)科學(xué)引文索引》等。2)參考工具書(shū)(1)詞語(yǔ)類工具書(shū)包括各類字典、詞典,主要提供字詞的形、音、義和使用方法,以及學(xué)科名詞術(shù)語(yǔ)的含義、演變和發(fā)展。(2)資料類工具書(shū)能夠?yàn)樽x者提供各種基本知識(shí)或某一課題的具體資料,主要包括百科全書(shū)、年鑒、手冊(cè)、名錄、類書(shū)、政書(shū)等。(3)表譜類工具書(shū)是以表格或其他較為整齊的形式,記錄史實(shí)、時(shí)間、地理等資料,并附以簡(jiǎn)略的文字說(shuō)明,以反映史實(shí)和時(shí)間的一種工具書(shū)。它主要包括年表、歷表和專門性歷史表譜三種類型。(4)圖錄類工具書(shū)是以圖形、圖像、符號(hào)等為主體,附以簡(jiǎn)略的文字說(shuō)明,以反映各種事物、人物的空間特征和形象特征的工具書(shū)。它包括地圖、歷史圖錄、文物圖錄、人物圖錄、藝術(shù)圖錄和科技圖像等。(5)邊緣類工具書(shū)主要指那些介于工具書(shū)與非工具書(shū)之間,既具有一般圖書(shū)的閱讀功能,又具有工具書(shū)的查檢功能的文獻(xiàn)。它主要包括資料匯編、史書(shū)、方志等。2.機(jī)械檢索工具機(jī)械檢索工具是手工檢索工具向計(jì)算機(jī)檢索系統(tǒng)過(guò)渡的中間檢索工具,主要包括機(jī)電檢索工具(如打孔機(jī))和光電檢索工具(如縮微機(jī))兩種類型。機(jī)械檢索工具利用機(jī)械裝置改進(jìn)了信息資源的存儲(chǔ)和檢索方式,但是它只能對(duì)某一固定存儲(chǔ)形式的信息資源進(jìn)行特定檢索。機(jī)械檢索工具過(guò)分依賴于設(shè)備,檢索操作復(fù)雜,成本很高,并且檢索質(zhì)量和效率也不理想,所以很快被計(jì)算機(jī)檢索系統(tǒng)所取代了。3.計(jì)算機(jī)檢索系統(tǒng)計(jì)算機(jī)檢索系統(tǒng)是借助計(jì)算機(jī)技術(shù)、通信技術(shù)、光盤技術(shù)、網(wǎng)絡(luò)技術(shù)等信息技術(shù)建立的存儲(chǔ)和檢索信息的檢索工具。檢索系統(tǒng)由硬件和軟件組成:硬件主要包括計(jì)算機(jī)主服務(wù)器、檢索終端、數(shù)據(jù)輸出設(shè)備等。軟件主要包括檢索程序和數(shù)據(jù)庫(kù)等。檢索軟件負(fù)責(zé)管理數(shù)據(jù)庫(kù)和處理檢索提問(wèn),決定著系統(tǒng)的檢索能力。數(shù)據(jù)庫(kù)是檢索系統(tǒng)的信息源和信息存儲(chǔ)倉(cāng)庫(kù),是檢索作業(yè)的對(duì)象。存儲(chǔ)時(shí),將大量的各種信息以一定的格式加工處理后輸入可供檢索的數(shù)據(jù)庫(kù)。檢索時(shí),將符合檢索需求的提問(wèn)通過(guò)檢索終端向檢索系統(tǒng)發(fā)出請(qǐng)求,檢索系統(tǒng)在選定的數(shù)據(jù)庫(kù)中執(zhí)行匹配運(yùn)算,然后將符合要求的檢索結(jié)果按一定的格式輸出。計(jì)算機(jī)檢索系統(tǒng)一般可分為光盤檢索系統(tǒng)、聯(lián)機(jī)檢索系統(tǒng)和網(wǎng)絡(luò)檢索系統(tǒng)等。1)光盤檢索系統(tǒng)光盤檢索系統(tǒng)是指利用計(jì)算機(jī)、光盤驅(qū)動(dòng)器和光盤數(shù)據(jù)庫(kù)以及檢索軟件建立起來(lái)的信息檢索系統(tǒng)。光盤最初是由荷蘭飛利浦公司和日本索尼公司共同研制的密集只讀光盤存儲(chǔ)器,20世紀(jì)80年代中期成功研制出光盤檢索系統(tǒng)。除了單機(jī)光盤檢索系統(tǒng),還有由光盤服務(wù)器、計(jì)算機(jī)局域網(wǎng)、光盤庫(kù)或光盤塔、檢索軟件等組成的光盤網(wǎng)絡(luò)檢索系統(tǒng)。根據(jù)光盤刻寫(xiě)次數(shù),光盤可分為只讀光盤、可寫(xiě)式光盤和可擦寫(xiě)磁光盤三大類。與手工檢索相比,光盤檢索的可檢信息量大。光盤檢索功能強(qiáng)大,檢索入口多,檢索速度快,檢索及輸出靈活方便。與聯(lián)機(jī)檢索相比,光盤檢索價(jià)格低廉,檢索方法簡(jiǎn)單容易,規(guī)格統(tǒng)一,容易復(fù)制,便于保存。其缺點(diǎn)是時(shí)效性不夠,檢索范圍受光盤數(shù)據(jù)庫(kù)的限制,更新不夠及時(shí)。2)聯(lián)機(jī)檢索系統(tǒng)
聯(lián)機(jī)檢索是20世紀(jì)60年代發(fā)展起來(lái)的一種提供人機(jī)對(duì)話的檢索技術(shù),是指用戶利用終端設(shè)備(包括檢索終端、調(diào)制解調(diào)器和打印機(jī)),通過(guò)國(guó)際(衛(wèi)星)通信網(wǎng)絡(luò),與本地計(jì)算機(jī)檢索系統(tǒng)或遠(yuǎn)程計(jì)算機(jī)檢索系統(tǒng)的主機(jī)連接,從而檢索世界各地存儲(chǔ)在計(jì)算機(jī)數(shù)據(jù)庫(kù)中的信息資料。
聯(lián)機(jī)檢索系統(tǒng)是一個(gè)典型的由聯(lián)機(jī)服務(wù)中心的主計(jì)算機(jī)、檢索終端、通信網(wǎng)絡(luò)、聯(lián)機(jī)數(shù)據(jù)庫(kù)、檢索軟件等組成的計(jì)算機(jī)檢索系統(tǒng),能完成數(shù)據(jù)收集、分析、加工處理、存儲(chǔ)、傳遞通信和檢索信息的全過(guò)程。
我國(guó)國(guó)內(nèi)用戶采用該方法查找國(guó)外計(jì)算機(jī)檢索系統(tǒng)中的信息被稱為國(guó)際聯(lián)機(jī)檢索。其中著名的國(guó)際聯(lián)機(jī)檢索系統(tǒng)有Dialog系統(tǒng)、STN系統(tǒng)、ORBIT系統(tǒng)、ESA系統(tǒng)等。聯(lián)機(jī)檢索系統(tǒng)主要有回溯檢索、定題檢索、聯(lián)機(jī)訂購(gòu)、電子郵件四種服務(wù)方式?;厮輽z索是用戶對(duì)檢索系統(tǒng)中積累多年的文獻(xiàn)信息數(shù)據(jù)庫(kù)進(jìn)行檢索,查找一定時(shí)間范圍內(nèi)或特定時(shí)間以前的文獻(xiàn)信息的一種聯(lián)機(jī)檢索方式。通過(guò)RS進(jìn)行專題檢索或情報(bào)調(diào)研,可全面系統(tǒng)地了解有關(guān)文獻(xiàn)信息的線索。定題檢索是指在回溯檢索的基礎(chǔ)上,定期從文獻(xiàn)數(shù)據(jù)庫(kù)中檢索出回溯檢索之后出現(xiàn)的新的文獻(xiàn)信息的一種聯(lián)機(jī)檢索方式。具體地說(shuō),它是由檢索人員將用戶的信息需求轉(zhuǎn)換成一定的檢索提問(wèn)式,存入計(jì)算機(jī)中,檢索系統(tǒng)定期從新的文獻(xiàn)信息中為用戶檢索,并按用戶指定的格式加以編排和打印的過(guò)程。利用SDI服務(wù),用戶可定期獲得所需要的最新信息,及時(shí)掌握同類專題的動(dòng)態(tài)和進(jìn)展。聯(lián)機(jī)檢索的結(jié)果通常是一些文摘或題錄形式的二次文獻(xiàn)。聯(lián)機(jī)檢索系統(tǒng)可以為用戶提供原始文獻(xiàn)的聯(lián)機(jī)訂購(gòu)服務(wù),還可為用戶提供E-mail和電子郵件的服務(wù)功能。優(yōu)點(diǎn)是數(shù)據(jù)庫(kù)容量大、檢索速度快、途徑多、可共享性好、安全性強(qiáng)。其缺點(diǎn)是檢索系統(tǒng)及文檔(數(shù)據(jù)庫(kù))的收錄、標(biāo)引等規(guī)則較為復(fù)雜,檢索技術(shù)和技巧不易掌握,設(shè)備要求高,檢索費(fèi)用昂貴等。3)網(wǎng)絡(luò)檢索系統(tǒng)
網(wǎng)絡(luò)檢索主要通過(guò)Internet檢索和獲取網(wǎng)上信息。網(wǎng)絡(luò)檢索系統(tǒng)一般由計(jì)算機(jī)服務(wù)器、用戶終端、通信網(wǎng)絡(luò)、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)等組成。
網(wǎng)絡(luò)檢索系統(tǒng)是目前計(jì)算機(jī)網(wǎng)絡(luò)運(yùn)行的主流支撐環(huán)境,其特點(diǎn)是方法簡(jiǎn)單、靈活、方便、時(shí)效性強(qiáng)、費(fèi)用低。網(wǎng)絡(luò)信息檢索與聯(lián)機(jī)檢索系統(tǒng)最根本的不同在于前者是基于客戶機(jī)/服務(wù)器的網(wǎng)絡(luò)支撐環(huán)境的。
早期的網(wǎng)絡(luò)檢索工具主要是基于傳輸和下載網(wǎng)上信息的,包括遠(yuǎn)程登錄(Telnet)、文件傳輸服務(wù)(FTP)、電子郵件(E-mail)、電子公告欄(BBS)、新聞組(USENET)等工具。
FTP獲取信息資源的最大問(wèn)題是查找需要的資料時(shí),必須預(yù)先知道這些資料存放在哪個(gè)文件服務(wù)器中,隨著FTP服務(wù)器的增多,這個(gè)問(wèn)題變得越來(lái)越嚴(yán)重,于是人們就開(kāi)發(fā)出Archie、WAIS、Gopher系統(tǒng),以解決尋找FTP資源的困難。
ArchieServer又稱為文檔查詢服務(wù)器,能夠幫助用戶在Internet的FTP服務(wù)器上尋找文件。用戶只要給出所要查找文件的全名或部分名字,ArchieServer就會(huì)查找在哪些FTP服務(wù)器上存放著這樣的文件,然后用戶可以使用FTP軟件下載該文件。
WAIS(廣域消息服務(wù))是一種數(shù)據(jù)庫(kù)索引查詢服務(wù)。Archie所處理的只是文件名,而WAIS則可以對(duì)文件內(nèi)容進(jìn)行查詢。Gopher是基于菜單驅(qū)動(dòng)的Internet文本信息檢索工具,提供的信息仍然有限。具有WWW檢索功能的檢索系統(tǒng)是隨著網(wǎng)上海量信息的出現(xiàn)而開(kāi)發(fā)的,常用的如網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索系統(tǒng)、搜索引擎、多媒體信息檢索系統(tǒng)等。
4)數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)(Database,DB)是長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)內(nèi),有組織的、可共享的數(shù)據(jù)集合。數(shù)據(jù)庫(kù)中的數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和存儲(chǔ),具有較小的冗余度、較高的數(shù)據(jù)獨(dú)立性和易擴(kuò)展性,并可在一定范圍內(nèi)為各種用戶所共享。
按照不同的標(biāo)準(zhǔn),數(shù)據(jù)庫(kù)的劃分有不同的結(jié)果。
按信息處理層次,數(shù)據(jù)庫(kù)可分為書(shū)目數(shù)據(jù)庫(kù)、文摘數(shù)據(jù)庫(kù)和全文數(shù)據(jù)庫(kù)。
書(shū)目數(shù)據(jù)庫(kù)用于存儲(chǔ)文獻(xiàn)信息加工后的書(shū)目數(shù)據(jù),提供文獻(xiàn)信息的查詢。圖書(shū)館聯(lián)機(jī)公共檢索目錄(OPAC)是實(shí)現(xiàn)圖書(shū)館書(shū)目信息資源共享的現(xiàn)代化檢索系統(tǒng)。
文摘數(shù)據(jù)庫(kù)用于存儲(chǔ)原文濃縮后所得的文摘、索引等信息,主要提供各種文獻(xiàn)信息的題名、責(zé)任者、原文出處、主題詞及文摘,一般不提供全文,如中國(guó)科學(xué)引文數(shù)據(jù)庫(kù)等。
全文數(shù)據(jù)庫(kù)是將文獻(xiàn)全文以機(jī)讀版的形式存儲(chǔ)起來(lái),并可與相應(yīng)的軟件配合提供文中檢索和全文輸出的數(shù)據(jù)庫(kù)。按收錄的文獻(xiàn)類型,數(shù)據(jù)庫(kù)可分為期刊論文數(shù)據(jù)庫(kù)、書(shū)目及圖書(shū)全文數(shù)據(jù)庫(kù)、專利數(shù)據(jù)庫(kù)、學(xué)位論文數(shù)據(jù)庫(kù)和產(chǎn)品數(shù)據(jù)庫(kù)等。根據(jù)收錄文獻(xiàn)信息的范圍,數(shù)據(jù)庫(kù)可分為綜合性數(shù)據(jù)庫(kù)和專業(yè)性數(shù)據(jù)庫(kù)。按承載信息的媒體形式,數(shù)據(jù)庫(kù)可分為文本數(shù)據(jù)庫(kù)、數(shù)值數(shù)據(jù)庫(kù)、聲音數(shù)據(jù)庫(kù)、圖像數(shù)據(jù)庫(kù)、視頻數(shù)據(jù)庫(kù)和多媒體數(shù)據(jù)庫(kù)。按服務(wù)模式,數(shù)據(jù)庫(kù)可分為單機(jī)數(shù)據(jù)庫(kù)、聯(lián)機(jī)數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)數(shù)據(jù)庫(kù)。2.2.4文獻(xiàn)信息檢索的過(guò)程
1.分析檢索課題
目的在于理清檢索的基本思路,明確檢索的目的、要求與檢索范圍,并從檢索需求中發(fā)掘檢索的已知條件。
分析檢索課題是正確選擇檢索工具、制定檢索策略、進(jìn)行檢索效果評(píng)價(jià)的基礎(chǔ)。
內(nèi)容包括:檢索課題的學(xué)科與主題屬性,課題所需文獻(xiàn)的類型,課題所需文獻(xiàn)生成的具體時(shí)間段,課題檢索的已知條件。2.選擇檢索工具或檢索系統(tǒng)
根據(jù)檢索課題的要求,選擇最能滿足檢索要求的檢索工具書(shū)或檢索系統(tǒng)。在選擇工具或檢索系統(tǒng)時(shí),要考慮的主要問(wèn)題有:
在內(nèi)容上和時(shí)間上,考慮檢索工具或檢索系統(tǒng)對(duì)課題的覆蓋程度和一致性;
在手段和技術(shù)上,有計(jì)算機(jī)檢索條件的一般不選擇手工檢索工具,因?yàn)橛?jì)算機(jī)檢索無(wú)疑有較高的效率;
在價(jià)格和可獲取性上,通常會(huì)選擇價(jià)格低廉、容易獲取的檢索系統(tǒng)和數(shù)據(jù)庫(kù)。
3.制定檢索策略
檢索策略的制定包括確定檢索途徑與擬定檢索式。
檢索途徑的選擇是以檢索課題的分析為基礎(chǔ)的。常用的檢索途徑包括分類、主題、題名和作者。此外還有號(hào)碼途徑,主要包括一些以號(hào)碼為特征的文獻(xiàn)、信息,如專利文獻(xiàn)、技術(shù)標(biāo)準(zhǔn)等。
一般來(lái)說(shuō),主題途徑是最常用的檢索途徑。選擇主題途徑檢索時(shí),需要分析所涉及的主要概念,并找出能代表這些概念的若干個(gè)詞或詞組,進(jìn)而分析各概念之間的上、下、左、右關(guān)系。
檢索詞選取時(shí)應(yīng)注意的幾個(gè)問(wèn)題有:
(1)檢索詞應(yīng)意義明確,具有專指性,涵蓋主要主題概念。
(2)盡可能考慮相關(guān)的同義詞、近義詞作為檢索詞。
(3)避免使用低頻詞或高頻詞。如“分析”“研究”“應(yīng)用”等。
(4)選用國(guó)外慣用的技術(shù)術(shù)語(yǔ)。
(5)盡量使用代碼,以提高檢全率。不少數(shù)據(jù)庫(kù)有自己的特定代碼,如《世界專利索引》(WPI)文檔的國(guó)際專利分類號(hào)代碼IC、《世界工業(yè)產(chǎn)品市場(chǎng)與技術(shù)概況》文檔中的產(chǎn)品代碼PC和事項(xiàng)代碼EC、《化學(xué)文摘》(CA)中的化學(xué)物質(zhì)登記號(hào)RN等。
在手工檢索時(shí),每次檢索只能從一個(gè)檢索點(diǎn)出發(fā),而且只能選擇其中的一個(gè)屬性值,檢索范圍比較窄。
機(jī)檢系統(tǒng)適應(yīng)多點(diǎn)、多屬性值檢索,對(duì)包含的多個(gè)概念或多種限定都可以做出相應(yīng)的處理。因此,用計(jì)算機(jī)進(jìn)行檢索時(shí)需要制訂一個(gè)可執(zhí)行的方案,這就是檢索式的構(gòu)造,它是檢索策略的具體表現(xiàn)。檢索式的擬定應(yīng)根據(jù)檢索課題的需要進(jìn)行。
如檢索課題涉及兩個(gè)或兩個(gè)以上的檢索條件,應(yīng)考慮使用邏輯組配;檢索需求需要由多個(gè)檢索詞進(jìn)行表達(dá),而在檢索詞出現(xiàn)的位置、相距的遠(yuǎn)近會(huì)影響檢準(zhǔn)率的情況下,可以考慮使用位置算符;檢索課題對(duì)文獻(xiàn)的類型與生成時(shí)間有具體要求時(shí),應(yīng)考慮使用限制檢索。
4.實(shí)施檢索操作
確定了具體的檢索式后,就要利用檢索工具在一定的范圍內(nèi)具體查找。手工檢索時(shí)可以一邊檢索一邊分析取舍,獲得符合要求的文獻(xiàn)。計(jì)算機(jī)檢索時(shí),在輸出最終結(jié)果之前,檢索可能要經(jīng)過(guò)多次反復(fù)的過(guò)程。用戶需要對(duì)每次的檢索結(jié)果做出判斷,并對(duì)檢索策略(檢索式)做出相應(yīng)的修改和調(diào)整,直到得到比較滿意的結(jié)果。
通常情況下,衡量檢索效果的好壞主要依靠“檢全率”和“檢準(zhǔn)率”兩個(gè)指標(biāo)。檢全率是對(duì)所需信息被檢出程度的量化,用來(lái)表示信息系統(tǒng)能滿足用戶需求的完備程度,可以用檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢索系統(tǒng)中存在的合乎需要的文獻(xiàn)總量的比率來(lái)表示;檢準(zhǔn)率是衡量信息系統(tǒng)拒絕非相關(guān)信息的能力的量度,可以用檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占被檢出文獻(xiàn)總量的比率來(lái)表示。檢全率的誤差是漏檢率;檢準(zhǔn)率的誤差是誤檢率。
檢全率與檢準(zhǔn)率的計(jì)算公式是:
檢全率和檢準(zhǔn)率既可以用來(lái)評(píng)價(jià)檢索系統(tǒng)的質(zhì)量,又可以用來(lái)衡量具體課題的檢索效果。
一般來(lái)說(shuō),檢全率和檢準(zhǔn)率之間存在互逆關(guān)系,而且,由于檢索系統(tǒng)中與檢索課題相關(guān)的文獻(xiàn)信息數(shù)量和檢出文獻(xiàn)的“相關(guān)性”判斷不可能十分準(zhǔn)確,因此,檢全率和檢準(zhǔn)率在很大程度上是一種有意義的理論性指標(biāo),在實(shí)際的檢索工作中,檢全率和檢準(zhǔn)率是不可能達(dá)到100%的。
對(duì)于信息檢索系統(tǒng)來(lái)說(shuō),系統(tǒng)內(nèi)信息存儲(chǔ)不全面,收錄遺漏嚴(yán)重,詞表結(jié)構(gòu)不完善等,都是影響檢全率和檢準(zhǔn)率的因素。對(duì)于信息用戶來(lái)說(shuō),檢索課題要求不明確,檢索系統(tǒng)選擇不恰當(dāng),檢索途徑和檢索方法單一,檢索詞使用不當(dāng)或者檢索詞缺乏專指性,組配關(guān)系錯(cuò)誤等也都會(huì)影響檢索效果。
從理論上講,提高檢索效果,可以從以下兩方面采取措施:(1)提高檢索系統(tǒng)的質(zhì)量。(2)提高用戶利用檢索系統(tǒng)的能力。
5.獲取原始文獻(xiàn)
文獻(xiàn)檢索的最終目的是獲取相關(guān)的原始文獻(xiàn)。傳統(tǒng)的原文獲取方式是根據(jù)檢索結(jié)果中提供的文獻(xiàn)來(lái)源,到圖書(shū)館借閱復(fù)印。現(xiàn)在,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和全文數(shù)據(jù)庫(kù)的興起,獲取原文的方式也越來(lái)越多,具體來(lái)講主要有以下幾種途徑:(1)通過(guò)全文數(shù)據(jù)庫(kù)直接獲取;(2)通過(guò)網(wǎng)絡(luò)信息檢索獲??;(3)通過(guò)館際互借獲?。?4)通過(guò)文獻(xiàn)傳遞系統(tǒng)獲??;(5)通過(guò)文獻(xiàn)著者獲??;(6)通過(guò)聯(lián)機(jī)檢索系統(tǒng)訂購(gòu)原文。2.2.5文獻(xiàn)信息檢索的方法與技術(shù)1.文獻(xiàn)信息檢索的方法1)常用法
常用法又稱工具法,就是直接利用書(shū)目、索引、文摘等檢索工具查找文獻(xiàn)信息的一種方法。具體操作又可分為順查法、倒查法和抽查法三種方式。(1)順查法,是一種依照時(shí)間順序,按照檢索課題涉及的起始年代,由遠(yuǎn)及近地查找信息的方法。順查法的優(yōu)點(diǎn)是所查得的文獻(xiàn)較為系統(tǒng)全面,適合于檢索范圍較大、時(shí)間較長(zhǎng)的復(fù)雜課題或?qū)n}文獻(xiàn)的普查工作;其缺點(diǎn)是涉及文獻(xiàn)年代久遠(yuǎn)、檢索工作量大、費(fèi)時(shí)費(fèi)力、效率不高。順查法適合于檢索理論性或?qū)W術(shù)性的課題。(2)倒查法,是一種依照時(shí)間順序由近及遠(yuǎn)地進(jìn)行查找,直到滿足信息檢索的需要為止的一種查找方法。此法多用于檢索新課題或有新內(nèi)容的老課題,其優(yōu)點(diǎn)在于可以最快地獲得新信息,而新信息中往往又包含著原有研究成果的精華,從而可同時(shí)了解檢索課題的發(fā)展?fàn)顩r和最新觀點(diǎn)。(3)抽查法,是針對(duì)檢索課題的特點(diǎn),選擇與該課題有關(guān)的文獻(xiàn)信息最可能出現(xiàn)或最多出現(xiàn)的時(shí)間段,進(jìn)行重點(diǎn)檢索的方法。它是一種花費(fèi)較少時(shí)間獲得較多文獻(xiàn)的檢索方法。2)引文法
引文法是利用文獻(xiàn)之間的引用關(guān)系查找相關(guān)文獻(xiàn)的方法,包括追溯法和引文索引法兩種。(1)追溯法。追溯法是利用現(xiàn)有文獻(xiàn)后附的參考文獻(xiàn)或引用文獻(xiàn)作為線索,由近及遠(yuǎn)地逐一追溯查找相關(guān)文獻(xiàn)的方法。追溯法往往在缺乏檢索工具,同時(shí)又擁有豐富的原始文獻(xiàn)的情況下使用。這種方法的缺點(diǎn)是,文獻(xiàn)有限,觀點(diǎn)相同,文獻(xiàn)陳舊,在缺乏檢索工具或系統(tǒng)時(shí),追溯法便成為常用的檢索方法。(2)引文索引法。引文索引法是從被引論文開(kāi)始查找引用它的全部論文的一種檢索方法。這種方法通過(guò)先期文獻(xiàn)被后來(lái)文獻(xiàn)的引用情況,來(lái)說(shuō)明文獻(xiàn)之間的相關(guān)性及先前文獻(xiàn)對(duì)當(dāng)前文獻(xiàn)的影響力。引文索引法則是向后追蹤進(jìn)行檢索的方法,查找后獲得的文獻(xiàn)越來(lái)越新。3)循環(huán)法
循環(huán)法又稱綜合法、交替法或分段法,是交替使用常用法和追溯法來(lái)查找文獻(xiàn)的一種檢索方法。
這種方法的好處是綜合了常用法和追溯法的優(yōu)點(diǎn),能夠彌補(bǔ)檢索工具不完善或收藏不全的缺陷,最大限度地獲得所需的文獻(xiàn)信息。4)瀏覽法
瀏覽法是通過(guò)瀏覽的方式查閱文獻(xiàn)原文而獲取所需文獻(xiàn)信息的方法,比較適合查找新近發(fā)表的還未被各檢索工具收錄的文獻(xiàn)。一般來(lái)說(shuō),瀏覽法只能瀏覽獲取本館館藏文獻(xiàn),資料的全面性和系統(tǒng)性受到很大的限制,因而具有很大的局限性,不能作為查閱文獻(xiàn)的主要方法。
以上四種檢索方法各具特色,在實(shí)際檢索中,可根據(jù)檢索的要求和所具備的條件靈活選用,以便達(dá)到更好的檢索效果。2.計(jì)算機(jī)文獻(xiàn)信息檢索技術(shù)
在計(jì)算機(jī)信息檢索系統(tǒng)中,雖然各數(shù)據(jù)庫(kù)提供給用戶的檢索功能各不相同,但比較通用的有瀏覽、簡(jiǎn)單檢索和高級(jí)檢索等功能。1)布爾邏輯檢索
在計(jì)算機(jī)信息檢索中,單獨(dú)的檢索詞一般不能滿足課題的檢索要求。19世紀(jì)由英國(guó)數(shù)學(xué)家喬治·布爾提出的布爾邏輯運(yùn)算符的運(yùn)用,在一定程度上滿足了用戶的檢索需求。布爾邏輯檢索是運(yùn)用布爾邏輯運(yùn)算符對(duì)檢索詞進(jìn)行邏輯組配,以表達(dá)兩個(gè)檢索詞之間的邏輯關(guān)系。常用的組配符有AND(與)、OR(或)、NOT(非)三種。布爾邏輯檢索是最常用的計(jì)算機(jī)檢索技術(shù),在一些檢索系統(tǒng)中AND、OR、NOT組配符可分別用﹡、+、-?代替。(1)邏輯“與”(AND,﹡)。邏輯“與”是具有概念交叉和限定關(guān)系的一種組配,用來(lái)組配不同的檢索概念,其含義是檢出的記錄必須同時(shí)含有所有的檢索詞。應(yīng)把出現(xiàn)頻率低的檢索詞放在“與”的左邊,節(jié)省計(jì)算機(jī)處理時(shí)間,適時(shí)中斷檢索。(2)邏輯“或”(OR,+)。邏輯“或”是具有概念并列關(guān)系的一種組配,其含義是檢出的結(jié)果只需滿足檢索項(xiàng)中的任何一個(gè)即可。用邏輯“或”組配檢索式時(shí),可將估計(jì)出現(xiàn)頻率高的詞放在“或”的左邊,以利于提高檢索速度,使選中的答案盡早出現(xiàn)。(3)邏輯“非”(NOT,-)。邏輯“非”是具有概念刪除關(guān)系的一種組配,可從原檢索范圍中剔除一部分不需要的內(nèi)容,即檢出的記錄中只能含有NOT算符前的檢索詞,不能同時(shí)含有其后的檢索詞。邏輯“非”縮小了檢索范圍,提高了檢索的專指度。邏輯“非”的缺點(diǎn)是取消部分往往會(huì)把切題的文獻(xiàn)也丟棄,故運(yùn)用時(shí)一定要慎重。
不同的檢索系統(tǒng),布爾邏輯運(yùn)算的次序可能不同,檢索結(jié)果也會(huì)大不一樣。一般檢索系統(tǒng)的“幫助”資料中會(huì)有說(shuō)明。2)截詞檢索
為了減少檢索詞的輸入,提高檢索效率,通常使用“?”“*”等截詞符加在檢索詞的前后或中間,以擴(kuò)大檢索范圍,提高檢全率。按截?cái)嗟淖址麛?shù)量來(lái)分,可分為有限截?cái)嗪蜔o(wú)限截?cái)?。有限截?cái)嗍侵刚f(shuō)明具體截去字符的數(shù)量,通常用“?”表示;而無(wú)限截?cái)嗍侵覆徽f(shuō)明具體截去字符的數(shù)量,通常用“*”表示。按截?cái)嗟奈恢脕?lái)分,可分為后截?cái)?、前截?cái)嗪椭薪財(cái)唷?1)后截?cái)?。后截?cái)嗍亲畛S玫慕卦~檢索技術(shù),又稱前方一致的檢索,是將截詞符號(hào)放置在一個(gè)字符串右方,以表示其右邊的有限或無(wú)限個(gè)字符將不影響該字符串的檢索。后截?cái)嗫梢允÷暂斎敫鞣N詞尾有變化的檢索詞的麻煩,有助于提高檢全率。(2)前截?cái)?。前截?cái)嗍且环N后方一致的檢索,是將截詞符號(hào)放置在一個(gè)字符串左方,以表示其左方的有限或無(wú)限個(gè)字符不影響該字符串檢索。前截?cái)嘣诟鞣N詞頭有變化的復(fù)合詞的檢索中應(yīng)用比較多。(3)中截?cái)唷V薪財(cái)嗍前呀財(cái)喾?hào)放置在一個(gè)檢索詞的中間。一般地,中截?cái)嘀辉试S有限截?cái)?。中截?cái)嘀饕鉀Q一些英文單詞拼寫(xiě)不同,單復(fù)數(shù)形式不同的詞的輸入。例如,輸入“m?n”,可以檢索出含有詞man、men等的文獻(xiàn);輸入“mod?????ation”可以檢索出含有詞moderation、modernization、m
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 歷史材料解析題(解題指導(dǎo)+專項(xiàng)練習(xí))(解析版)
- 紡織服裝業(yè)自購(gòu)料采購(gòu)管理辦法
- 教育培訓(xùn)機(jī)構(gòu)物業(yè)管理招標(biāo)
- 村集體資產(chǎn)評(píng)估招標(biāo)實(shí)施細(xì)則
- 高山道路擴(kuò)建爆破協(xié)議
- 養(yǎng)老院護(hù)理工作制度
- 租賃企業(yè)薪酬分配改革管理辦法
- 建筑工程租賃起重機(jī)協(xié)議
- 車牌互換合同范本模板
- 湖南2025年湖南機(jī)電職業(yè)技術(shù)學(xué)院合同制教師招聘31人歷年參考題庫(kù)(頻考版)含答案解析
- 2024年電子交易:電腦買賣合同
- 中國(guó)文化概論知識(shí)試題與答案版
- 期末復(fù)習(xí)提升測(cè)試(試題)(含答案)2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)人教版
- 生和碼頭港口設(shè)施維護(hù)管理制度(3篇)
- 黑龍江省哈爾濱市第六中學(xué)2025屆高考數(shù)學(xué)三模試卷含解析
- 【MOOC】數(shù)字邏輯設(shè)計(jì)及應(yīng)用-電子科技大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 傷口治療師進(jìn)修匯報(bào)
- 研學(xué)活動(dòng)協(xié)議書(shū)合同范本
- ISBAR輔助工具在交班中應(yīng)用
- 鑄牢中華民族共同體意識(shí)-形考任務(wù)3-國(guó)開(kāi)(NMG)-參考資料
評(píng)論
0/150
提交評(píng)論