版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章1.2信息檢索的原理就是將特定的信息需求與存儲(chǔ)在檢索系統(tǒng)的信息標(biāo)識(shí)進(jìn)行異同的比較與匹配,選取兩者相符或部分相符的信息予以輸出。無(wú)論是手工檢索還是計(jì)算機(jī)檢索,其基本原理都是一樣的。即檢索系統(tǒng)對(duì)所要存儲(chǔ)的信息,按照其外部特征和內(nèi)部特征進(jìn)行描述并賦予特征標(biāo)識(shí),然后進(jìn)入系統(tǒng);檢索時(shí),將所需信息特征標(biāo)識(shí)與所存信息的特征標(biāo)識(shí)進(jìn)行比較。凡是兩邊標(biāo)識(shí)一致的,就將具有這些標(biāo)識(shí)的信息從檢索系統(tǒng)中輸出。包含信息存儲(chǔ)和信息獲取兩個(gè)環(huán)節(jié)。(書本上的P14)1.3 信息檢索系統(tǒng)(手繪P17)1.3.2 邏輯構(gòu)成一個(gè)完整的信息檢索系統(tǒng)通常由以下幾個(gè)功能模塊組成:信息選擇子系統(tǒng)、標(biāo)引子系統(tǒng)、建庫(kù)子系統(tǒng)、詞表管理子系統(tǒng)、
2、用戶接口子系統(tǒng)、提問處理子系統(tǒng)。1.信息選擇子系統(tǒng) 根據(jù)系統(tǒng)的目標(biāo)和服務(wù)對(duì)象的需要,確定信息收集范圍,并廣泛地、定期地采集各種信息源,為系統(tǒng)提供充足而適用的信息。2.標(biāo)引子系統(tǒng) 將收錄的信息源利用檢索語(yǔ)言表達(dá)和組織,并賦予檢索標(biāo)識(shí)的過程。3.詞表管理子系統(tǒng)管理維護(hù)系統(tǒng)中已有的詞表,使它與標(biāo)引、建庫(kù)等子系統(tǒng)相連接,支持用戶查詢操作,從提、對(duì)話或其他文本中采集新的詞匯信息,并輸出各種形式的詞匯數(shù)據(jù)或詞表產(chǎn)品。4.提問處理子系統(tǒng) 專門負(fù)責(zé)處理用戶輸入的提問式,將提問式中的檢索元和算符區(qū)分,并轉(zhuǎn)換成系統(tǒng)內(nèi)部的可接受的命令方式。在對(duì)提問進(jìn)行轉(zhuǎn)換后,與數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)進(jìn)行比較運(yùn)算,然后,把運(yùn)算結(jié)果輸出給
3、用戶。5.用戶接口子系統(tǒng) 承擔(dān)用戶與系統(tǒng)之間的交流功能。通常由用戶模型、信息顯示、命令語(yǔ)言和反饋機(jī)制等部分構(gòu)成。6.建庫(kù)子系統(tǒng) 建立和維護(hù)可直接用于檢索的數(shù)據(jù)庫(kù),包括系統(tǒng)所用的各索引文檔。其工作流程主要包括數(shù)據(jù)錄入、錯(cuò)誤檢查與處理、數(shù)據(jù)格式轉(zhuǎn)換、生成并定期更新各種文檔。1.4 信息檢索方法1)順查法:是指按照時(shí)間的順序,由遠(yuǎn)及近地利用檢索系統(tǒng)進(jìn)行信息檢索的方法。這種方法能收集到某一課題的系統(tǒng)信息,適用于較大課題的檢索。(查全率高)2)倒查法:是由近及遠(yuǎn),從新到舊,逆著時(shí)間的順序利用檢索工具進(jìn)行檢索的方法。此法的重點(diǎn)是放在近期信息上。使用這種方法可以最快地獲得最新資料。(新)3)抽查法:是指針對(duì)
4、項(xiàng)目的特點(diǎn),選擇有關(guān)該項(xiàng)目的信息最可能出現(xiàn)或最多出現(xiàn)的時(shí)間段,利用檢索工具進(jìn)行重點(diǎn)檢索的方法。(準(zhǔn))3. 追溯法也稱為回溯檢索法、引文法、引證法,是跟蹤查找的方式,以信息后面所附的參考文獻(xiàn)為線索,逐一追溯查找相關(guān)信息的方法,此方法有助于對(duì)課題的主題背景和立論依據(jù)等內(nèi)容有更深的理解。獲得的信息的針對(duì)性強(qiáng),適合沒有檢索工具或檢索工具不齊備的情況。由于引證信息間關(guān)系的模糊性和非相關(guān)性所引起的“噪聲”,該方法的查全率不高。第二章(理解)2.1傳統(tǒng)的檢索語(yǔ)言:表達(dá)一系列概括文獻(xiàn)信息內(nèi)容的概念及其相關(guān)關(guān)系的概念標(biāo)識(shí)系統(tǒng)。檢索語(yǔ)言概念:由詞匯和語(yǔ)法組成。詞匯是登錄在類表、詞表中的全部標(biāo)識(shí),一個(gè)標(biāo)識(shí)就是它的語(yǔ)
5、詞,分類表、詞表是它的詞典。語(yǔ)法是如何創(chuàng)造和運(yùn)用那些登錄在類表、詞表中的標(biāo)識(shí)來正確地表達(dá)信息內(nèi)容和用戶信息需求,以有效地實(shí)現(xiàn)信息檢索的一整套規(guī)則。2.1.2 功能(1)對(duì)信息的內(nèi)容及其形式特征(主題)加以標(biāo)引,保證不同的標(biāo)引人員表達(dá)信息的一致性;(2)對(duì)主題相同及主題相關(guān)的信息予以集中或揭示其相關(guān)性;(3)將大量信息系統(tǒng)化、組織化,便于檢索人員按照一定的排列次序進(jìn)行有序化的管理;(4)方便標(biāo)引語(yǔ)言和檢索用語(yǔ)的相符性比較,提高檢索效率。2.1.3.3 按標(biāo)識(shí)組合的使用的方法不同先組式:表達(dá)信息主題概念的標(biāo)識(shí)在編表時(shí)已固定組配好,例:體系分類法、標(biāo)題詞法后組式:指在詞表編制和標(biāo)引信息時(shí)不規(guī)定表達(dá)主
6、題標(biāo)識(shí)的組配關(guān)系,在檢索時(shí)再根據(jù)需要將各個(gè)標(biāo)識(shí)進(jìn)行組配。例:敘詞語(yǔ)言、單元詞語(yǔ)言。散組式:指在詞表中不組配復(fù)雜的主題概念,在標(biāo)引階段將表達(dá)主題概念的若干標(biāo)識(shí),根據(jù)一定的規(guī)則組配在一起。例:冒號(hào)分類法。2.2.1 概念邏輯2.2.1.2 概念邏輯的方法概念的劃分與概括(分類):利用概念內(nèi)涵由反映事物本質(zhì)屬性的概念因素構(gòu)成,概念因素的增加或減少可以形成新的概念,概念內(nèi)涵與外延成反變關(guān)系等性質(zhì),對(duì)概念進(jìn)行劃分或概括,形成更為專指或更為泛指的新概念,用以區(qū)別事物。內(nèi)涵(抽象)概念的分析與綜合(組配):利用在概念的交叉關(guān)系中兩個(gè)概念外延的相同部分形成一個(gè)新概念,其內(nèi)涵等于原來兩個(gè)概念內(nèi)涵之和,并且它與原
7、來兩個(gè)概念具有隸屬關(guān)系的這種性質(zhì),進(jìn)一步發(fā)展為將一個(gè)內(nèi)涵較深的概念分解為兩個(gè)或者兩個(gè)以上內(nèi)涵較淺的概念,以及將兩個(gè)或兩個(gè)以上內(nèi)涵較淺的概念合成為一個(gè)內(nèi)涵較深的概念的一種方法。外延(側(cè)重個(gè)體)2.3.1 分類檢索語(yǔ)言概述分類檢索語(yǔ)言的概念指用標(biāo)記符號(hào)(分類號(hào))來揭示、表達(dá)信息內(nèi)容,依據(jù)知識(shí)分類將主題概念組織、排列成類目體系,通過類目體系的自身結(jié)構(gòu)顯示主題概念之間的關(guān)系的檢索語(yǔ)言?;驹砗吞攸c(diǎn)1直接體現(xiàn)知識(shí)分類 2以學(xué)科、專業(yè)為中心是其最主要特點(diǎn)。體系分類法主要應(yīng)用概念劃分與概括的方法,以學(xué)科為基礎(chǔ),把概括信息內(nèi)容與事物的各種類目組成一個(gè)層層隸屬、詳細(xì)列舉的等級(jí)結(jié)構(gòu)體系。特點(diǎn):一是對(duì)知識(shí)進(jìn)行邏輯
8、的、系統(tǒng)的組織,因此稱為體系分類法或系統(tǒng)分類法;二是把知識(shí)分門別類地進(jìn)行等級(jí)排列,因此也稱為等級(jí)分類法;三是把知識(shí)詳細(xì)地羅列、展開,因此又稱為列舉分類法或枚舉分類法。如:杜威十進(jìn)分類法、美國(guó)國(guó)會(huì)圖書館分類法、中國(guó)圖書館分類法、中國(guó)人民大學(xué)圖書館圖書分類法 組配分類法又稱為分面分類法或分面組配分類法。是基于概念的可分析性和可綜合性,即復(fù)雜的主題概念可以分析為若干簡(jiǎn)單的主題概念,若干簡(jiǎn)單主題概念可綜合表達(dá)復(fù)雜的主題概念,將一個(gè)復(fù)雜的主題概念用若干表達(dá)簡(jiǎn)單概念的標(biāo)識(shí)組配來表達(dá)的一種檢索語(yǔ)言。主要應(yīng)用概念分析與綜合的方法。體系分類法2.3.2.1 結(jié)構(gòu) 微觀結(jié)構(gòu)類目是表達(dá)信息內(nèi)容或主題范圍的概念,是構(gòu)
9、成分類法的細(xì)胞。一個(gè)類目是由類號(hào)、類名、類級(jí)、注釋和參照組成的。按照類目之間的關(guān)系建立起來的類目集合稱為類目體系,是分類法的核心。 類目是表達(dá)信息或主題范圍的概念,是構(gòu)成分類法的細(xì)胞,一個(gè)類目是由類號(hào)、類名、類級(jí)、注釋和參照構(gòu)成的。(5)類目之間的相互關(guān)系處理 從屬關(guān)系并列關(guān)系交替關(guān)系相關(guān)關(guān)系2.宏觀結(jié)構(gòu)按功能分,一般分為以下幾個(gè)部分:類目體系,標(biāo)記系統(tǒng),說明與注釋,類目索引。類目體系由主表和復(fù)分表組成。類目體系復(fù)分表(考復(fù)分表)n 有通用復(fù)分表和專用復(fù)分表。n 主要用途:一是可以縮小類表的篇幅,簡(jiǎn)化分類表;二是增強(qiáng)主表中有關(guān)類目的細(xì)分程度,并規(guī)范同性質(zhì)類目的細(xì)分。n 中圖法(第四版)的復(fù)分表
10、:總論表、世界地區(qū)表、中國(guó)地區(qū)表、國(guó)際時(shí)代表、中國(guó)時(shí)代表、世界種族和民族表、中國(guó)民族表、通用時(shí)間地點(diǎn)表共8個(gè)通用復(fù)分表和69個(gè)專用復(fù)分表(詳表中67個(gè),總論表和中國(guó)地區(qū)表中各一個(gè))。標(biāo)記系統(tǒng)說明與注釋l 說明是對(duì)分類法結(jié)構(gòu)原理和使用方法的揭示。 注釋是類名的補(bǔ)充。有些類目名稱不能準(zhǔn)確表達(dá)類目的涵義,它要通過注釋來明確。注釋可進(jìn)一步指明類目的內(nèi)容范圍,指出類目之間的關(guān)系,規(guī)定如何進(jìn)一步細(xì)分或用什么方式細(xì)分或者指出排列方法,規(guī)定某一類的特殊分類規(guī)則和方法等。類目索引-幫助使用者從類目名稱的字順或者音序來查找相應(yīng)的分類號(hào)的輔助性工具。l 直接索引:把分類表中的類目及其注釋中的有關(guān)主題的概念,按照名字
11、字順排列。難以反映相關(guān)事項(xiàng)和復(fù)雜的專指主題。l 相關(guān)索引:在直接索引的基礎(chǔ)上,還集中反映在分類中被分散了的相關(guān)事項(xiàng)。l 主題分類對(duì)照索引:在主題詞表中的主題詞后面列出對(duì)應(yīng)的分類法的類號(hào),以便從主題詞字順查找相應(yīng)分類號(hào)。是分類法和主題法溝通的橋梁,既是體系分類法的輔助工具,也是分類法和主題法相互轉(zhuǎn)換的工具。在一定程度上能緩解“集中分散”矛盾。(重點(diǎn)考)體系分類法主要特點(diǎn):l 按照學(xué)科、專業(yè)屬性建立類目體系,形成按學(xué)科、專業(yè)集中信息的知識(shí)概念體系,滿足用戶從學(xué)科、專業(yè)出發(fā)的檢索課題,提高查全率l 采用等級(jí)列舉式的概念標(biāo)識(shí)系統(tǒng)來揭示概念之間的關(guān)系,便于用戶“鳥瞰全貌”、“觸類旁通”地查找某一專業(yè)的信
12、息l 采用分類號(hào)作為標(biāo)識(shí),不受語(yǔ)種的限制l 分類標(biāo)識(shí)是定組式的、固定的、不可分拆的、其中諸因素是不可變換位置的缺點(diǎn):l 修訂不便,無(wú)法及時(shí)增加反映新知識(shí)的類目,對(duì)很狹窄的主題很難找到相應(yīng)的類目和類號(hào)l 采用先組定組式標(biāo)識(shí),難以進(jìn)行組配檢索,使得檢索途徑單一,檢準(zhǔn)率低l 采用分類號(hào)作為主題的標(biāo)識(shí),缺乏直觀性l 按學(xué)科和專業(yè)集中信息以及線性的分類體系,難以反映多維的知識(shí)空間結(jié)構(gòu)中國(guó)圖書館圖書分類法簡(jiǎn)稱中圖法、中國(guó)人民大學(xué)圖書館圖書分類法簡(jiǎn)稱人大法、中國(guó)科學(xué)院圖書館圖書分類法簡(jiǎn)稱科圖法。杜威十進(jìn)分類法(Dewey Decimal Classification)簡(jiǎn)稱DC或DDC、國(guó)際十進(jìn)分類法(Uni
13、versal Decimal Classification),簡(jiǎn)稱UDC,美國(guó)國(guó)會(huì)圖書館分類法(Library of Congress Classification)簡(jiǎn)稱LC。組配分類法:冒號(hào)分類法五個(gè)基本范疇:2.4主題檢索語(yǔ)言(主要理解記憶,敘詞語(yǔ)言集其他三家之長(zhǎng))專指度高、直觀性好、靈活性強(qiáng)。由于按字順(音序或者筆畫等)排列,同一學(xué)科的信息被分散在各處,在族檢索方面不及分類法1.標(biāo)題詞語(yǔ)言標(biāo)題詞的特點(diǎn):直接性。直觀性。受控性(或稱規(guī)范性)標(biāo)題只是選擇那些可能成為文獻(xiàn)主題的事物及其較為通用、準(zhǔn)確、專指、檢索效果好的名稱,并設(shè)法實(shí)現(xiàn)名稱與概念的惟一對(duì)應(yīng)。語(yǔ)義關(guān)聯(lián)性。先組性。示范性 標(biāo)題詞的類
14、型(標(biāo)題法的類型) 單級(jí)標(biāo)題。即一個(gè)標(biāo)題僅由一個(gè)名詞術(shù)語(yǔ)構(gòu)成。帶說明語(yǔ)的單級(jí)標(biāo)題。例如, “液壓傳動(dòng),用于機(jī)床的”;“期刊,化學(xué)的”;“期刊,信息密度,統(tǒng)計(jì)法”。多級(jí)標(biāo)題。由兩個(gè)或兩個(gè)以上的標(biāo)題詞采用組配符號(hào)“”連接起來的標(biāo)題形式稱為多級(jí)標(biāo)題。例如“腫瘤治療”。 “”后的標(biāo)題稱為子標(biāo)題。子標(biāo)題、次子標(biāo)題都必須是規(guī)范化的語(yǔ)詞這是區(qū)別于說明語(yǔ)的地方。倒置標(biāo)題。將復(fù)詞標(biāo)題中具有檢索意義的后置部分依次作為入口詞前置,并用逗號(hào)“,”與原入口詞連接的標(biāo)題形式稱為倒置標(biāo)題?!暗退亠w機(jī)” 與“ 飛機(jī),低速”帶限定詞的標(biāo)題。如“圖書館學(xué)(辭典)”、 “橘(樹)”“橘(水果)”。限定詞一般都置于括號(hào)中,用于作形式
15、復(fù)分,或區(qū)分兩個(gè)字面相同但無(wú)法用其他方式區(qū)分的標(biāo)題?;旌蠘?biāo)題系統(tǒng)。特點(diǎn) 1.用受控的自然語(yǔ)言語(yǔ)詞作標(biāo)識(shí),直觀地表達(dá)主題概念,直接標(biāo)引信息。2.以字順序列組織標(biāo)識(shí),提供直接的主題檢索途徑,以便利于進(jìn)行特性檢索。3.主要用參照系統(tǒng)間接顯示標(biāo)題所表達(dá)的主題極念之間的關(guān)系,形成語(yǔ)義網(wǎng)絡(luò)。它能為選用4.標(biāo)題進(jìn)行標(biāo)引和檢索提供一定方便。5.按事物集中文獻(xiàn),而不是按學(xué)科、專業(yè)集中。標(biāo)題語(yǔ)言適合于從事物出發(fā)的檢索。6.提供先組式的主題標(biāo)識(shí),標(biāo)識(shí)含義比較明確,選用標(biāo)識(shí)比較容易。缺點(diǎn):允許必要時(shí)自擬標(biāo)題表達(dá)新的或沒有列出的主題概念,適應(yīng)能力較強(qiáng)。多途徑檢索的可能性較小。按事物集中文獻(xiàn),而不是按學(xué)科、專業(yè)集中。適合
16、于從事物出發(fā)的檢索,不適合于從學(xué)科出發(fā)的族性檢索。2.單元詞語(yǔ)言單元詞:也是一種受控的自然語(yǔ)言語(yǔ)詞,是指那些最基本的、在概念上不能再分解的詞匯單位。如:“大學(xué)”、“管理”、“教育”。單元詞語(yǔ)言是一種以單元詞為主題標(biāo)識(shí),通過字面組配的方式表達(dá)資源主題的標(biāo)引語(yǔ)言。是一種后組式的主題語(yǔ)言。是對(duì)標(biāo)題法的革新。采用的后組配的方式,在標(biāo)引時(shí)不組配單元詞,在檢索時(shí)才對(duì)單元詞下所列的文獻(xiàn)號(hào)進(jìn)行對(duì)比,號(hào)碼相同的就表示有組配關(guān)系。特點(diǎn):1通過最基本的詞匯可以表達(dá)大量的專指概念和新概念,適合對(duì)專指主題進(jìn)行標(biāo)引。標(biāo)引專指度高;適應(yīng)性強(qiáng)。2標(biāo)引結(jié)果不存在詞序問題,每個(gè)單元詞都可以作為檢索入口,從而提供更多的檢索途徑;檢
17、索時(shí),可以通過單元詞的增減,較自由地?cái)U(kuò)大、縮小或改變檢索范圍。3詞表體積??;修訂容易。缺點(diǎn):1字面拆分和字面組配容易造成語(yǔ)義失真。2缺乏參照系統(tǒng),難以滿足族性檢索的需求。3直觀性和系統(tǒng)性差。4只適用于標(biāo)識(shí)單元方式的檢索系統(tǒng)。3.關(guān)鍵詞語(yǔ)言所謂關(guān)鍵詞,是指那些出現(xiàn)在文獻(xiàn)的標(biāo)題(篇名、章節(jié)名)以至摘要、正文中,對(duì)描述信息主題內(nèi)容具有實(shí)質(zhì)意義的語(yǔ)詞,亦即對(duì)揭示和描述文獻(xiàn)主題內(nèi)容來說是重要的、帶關(guān)鍵性的(可以作為檢索“入口”的)那些語(yǔ)詞。關(guān)鍵詞有點(diǎn)像單元詞。但單元詞是在同義詞和近義詞中作優(yōu)選的,而關(guān)鍵詞則不作優(yōu)選,甚至對(duì)同一個(gè)詞的單復(fù)數(shù)和變格等詞形變化也不加統(tǒng)一,而保持作者用詞原狀,同義詞、近義詞、一
18、個(gè)詞的不同形態(tài)并存。所有的關(guān)鍵詞是平等的,全部按字順排列。若干關(guān)鍵詞的結(jié)合構(gòu)成一條索引款目,說明一簡(jiǎn)文獻(xiàn)的主題內(nèi)容;但全部關(guān)鍵詞在檢索系統(tǒng)中部是彼此孤立,沒有任何聯(lián)系。原理: 1直接抽取信息中或題名中的語(yǔ)詞作標(biāo)識(shí)來表達(dá)信息資源主題內(nèi)容的一種主題檢索語(yǔ)言,2對(duì)作為標(biāo)識(shí)的詞不加規(guī)范或只作少量規(guī)范處理,不編制受控詞表來進(jìn)行詞匯控制,不顯示詞間關(guān)系,只是編制禁用詞表(非關(guān)鍵詞)來控制抽詞。3每個(gè)關(guān)鍵詞是平等的,都可作為檢索標(biāo)識(shí),按照字順輪流排至檢索位置(入口詞位置), 提供多途徑的主題字順檢索。4是最早用于計(jì)算機(jī)信息檢索的自然語(yǔ)言形式。優(yōu)點(diǎn): l 使用自然語(yǔ)言,表達(dá)主題比較直觀、專指,可以保證較高的檢
19、準(zhǔn)率,符合用戶使用習(xí)慣。l 檢索途徑多。l 標(biāo)引簡(jiǎn)單,標(biāo)引不需要查看詞表,降低對(duì)標(biāo)引人員的要求,節(jié)省標(biāo)引時(shí)間;同時(shí),易于使用計(jì)算機(jī)編制,保證資源傳遞過程的及時(shí)性和生產(chǎn)過程的高效性和低成本;l 及時(shí)性:能及時(shí)更新詞匯。缺點(diǎn): l 不揭示關(guān)鍵詞之間的等級(jí)關(guān)系和相關(guān)關(guān)系,不進(jìn)行同義詞、相關(guān)詞的處理,用戶檢索很難靠自己的了解查全同一概念的不同詞形及進(jìn)行相關(guān)詞的檢索,增加用戶負(fù)擔(dān),漏檢的可能大,影響查全率。l 題名中不少語(yǔ)詞為通用概念,它們?yōu)闄z索入口建立的檢索款目沒有實(shí)際意義。l 難以進(jìn)行族性檢索。關(guān)鍵詞索引的類型(要求區(qū)分)題內(nèi)關(guān)鍵詞索引,題外關(guān)鍵詞索引,詞對(duì)式關(guān)鍵詞索引(P57)4敘詞語(yǔ)言原理(博采
20、眾家之長(zhǎng))l 以從自然語(yǔ)言中精選出來的、經(jīng)過嚴(yán)格處理的表示單元概念的規(guī)范化語(yǔ)詞作為資源主題標(biāo)識(shí),通過概念組配方式表達(dá)主題的后組式檢索語(yǔ)言。l 敘詞的特點(diǎn):直觀性、規(guī)范性、組配性。(集眾家之長(zhǎng))敘詞語(yǔ)言的編制主表:將敘詞按字順排列,并附標(biāo)注事項(xiàng)和參照系統(tǒng)。分類索引:也稱為范疇索引,從學(xué)科或?qū)I(yè)的角度來選用敘詞。詞組索引:即等級(jí)索引,具有屬分關(guān)系的一組敘詞稱為一族,構(gòu)成從泛指到專指的敘詞等級(jí)系統(tǒng)輪排索引:將有相同單詞的詞組敘詞集中在一起,排列在這個(gè)單詞之下,方便從單詞出發(fā),查找某一個(gè)或全部含有該單詞的詞組敘詞。敘詞表編制的注意事項(xiàng):(1)主題詞的選擇與規(guī)范:l 詞形規(guī)范:如:儲(chǔ)氣筒(敘詞)貯氣筒(
21、非敘詞); l 詞義規(guī)范:如:加限定詞:結(jié)構(gòu)主義(心理學(xué));加含義注釋,計(jì)算機(jī)分析 注:用計(jì)算機(jī)進(jìn)行分析 l 詞類規(guī)范:對(duì)敘詞的選詞范圍進(jìn)行規(guī)范l 先組度規(guī)范:適當(dāng)?shù)南冉M度提高標(biāo)引的一致性,如“環(huán)境工程”、“親屬語(yǔ)言”、“獵戶星云”。(3) 主題詞的組配:交叉關(guān)系( “:” )、限定關(guān)系( “-”或“,” )、聯(lián)結(jié)關(guān)系。敘詞語(yǔ)言的性能優(yōu)點(diǎn): 結(jié)構(gòu)完備,詞匯控制嚴(yán)格,可根據(jù)檢索系統(tǒng)的需要對(duì)詞匯進(jìn)行有效控制; 組配準(zhǔn)確,標(biāo)引能力強(qiáng),能夠準(zhǔn)確、專指地標(biāo)引和揭示各種主題內(nèi)容; 檢索效率高,可通過靈活組配方式進(jìn)行多途徑檢索,達(dá)到較好的檢索效果。 對(duì)檢索系統(tǒng)適應(yīng)能力強(qiáng),可同時(shí)適用于標(biāo)識(shí)單元和文獻(xiàn)單元檢索方
22、式,既能較好適應(yīng)計(jì)算機(jī)檢索系統(tǒng)的要求,又能適應(yīng)手工檢索系統(tǒng)的需要。缺點(diǎn):l 詞匯控制要求嚴(yán)格,詞表編制和管理的難度大,成本高;l 資源標(biāo)引需在概念分析的基礎(chǔ)上進(jìn)行,標(biāo)引難度大,要求高。1969年,第一部分類主題一體化檢索語(yǔ)言的誕生。分面敘詞表是以英國(guó)艾奇遜主編的世界上第一部一體化詞表的名稱命名,可以說是最典型的一體化詞表 2.6.2 網(wǎng)絡(luò)環(huán)境下的分類檢索語(yǔ)言 (1)分類法的電子化提高標(biāo)引和檢索的效率。DDC、UDC、LCC都有電子化版本。(考) (2)分類體系結(jié)構(gòu)的多維化利用超文本技術(shù),更好地揭示類目之間的多維關(guān)系。自由分類法(Folksonomy)在類目劃分標(biāo)準(zhǔn)、橫向關(guān)系揭示和類目設(shè)置方面表
23、現(xiàn)出明顯的多維性。打破傳統(tǒng)目錄按照唯一標(biāo)準(zhǔn)進(jìn)行類目劃分的原則,輕松揭示多屬性主題、交叉學(xué)科、總論與專論、地區(qū)與主題、資源形式與主題等橫向關(guān)系。 (3)在內(nèi)容上,聚類標(biāo)準(zhǔn)的主題化、類目劃分的隨意性、類目排列的非邏輯性和類名的通俗化等。(重點(diǎn)考)輔助詞表的應(yīng)用l 后控詞表:即詞間關(guān)系表,是利用受控語(yǔ)言的基本原理和方法編制的自然語(yǔ)言檢索用詞表。是自然語(yǔ)言和受控語(yǔ)言結(jié)合的產(chǎn)物。(考)l 后控詞表的特點(diǎn):(考)l (1)詞匯只用于檢索l (2)詞匯控制不如先控詞表嚴(yán)格l (3)收詞豐富,包括同義詞、近義詞、俗稱、縮寫、流行俚語(yǔ)等l (4)動(dòng)態(tài)性強(qiáng),及時(shí)更新和增補(bǔ)新主題概念l (5)有較強(qiáng)的靈活性和自由度
24、,標(biāo)引簡(jiǎn)單l (6)具有面向文獻(xiàn)和用戶的特點(diǎn),文獻(xiàn)保障和用戶保障能力強(qiáng)第三章(記憶)著錄:在組織檢索系統(tǒng)時(shí),對(duì)具體信息的各種形式特征、內(nèi)容特征及物質(zhì)形態(tài)等進(jìn)行分析、選擇和記錄的過程。著錄的基本要求:準(zhǔn)確化和規(guī)范化機(jī)讀目錄與元數(shù)據(jù)(P82)機(jī)讀目錄:簡(jiǎn)稱MARC,指任何形式的計(jì)算機(jī)可以閱讀或識(shí)別的目錄,其格式規(guī)定書目在數(shù)據(jù)機(jī)讀介質(zhì)上的表示和標(biāo)識(shí)方法,包括機(jī)讀記錄的構(gòu)成、各數(shù)據(jù)字段在機(jī)讀介質(zhì)上的總體安排與內(nèi)容結(jié)構(gòu)機(jī)讀目錄格式特點(diǎn)(考)1)字段設(shè)置:在MARC記錄中字段的設(shè)置包含了書目數(shù)據(jù)的實(shí)際內(nèi)容。主要特征表現(xiàn)在三個(gè)方面: 字段數(shù)量多,并有空白(子)字段供用戶擴(kuò)充使用,共有001-999個(gè)字段,其
25、中第999字段為用戶自己規(guī)定字段含義; 字段內(nèi)容著錄詳盡,字段下設(shè)子字段以及重復(fù)字段; 字段作用強(qiáng)化,可檢索的字段多。2)標(biāo)記符號(hào): 字段標(biāo)識(shí),用3位數(shù)字表示,從001-999。 子字段代碼,用兩個(gè)字符表示,第一個(gè)是定義符,表示為子字段(如$),第二個(gè)字符用小寫字母a,b,c表示子字段順序。 指示符號(hào): 用以描述或指示可變長(zhǎng)字段代碼。指示符號(hào)用兩個(gè)數(shù)字表示。在每個(gè)字段說明中都有指示符號(hào)的使用和表示的含義。如果某個(gè)字段指示符號(hào)不用,則用空白符號(hào)表示。 字段和記錄分隔符。CNMARC的樣例分析元數(shù)據(jù)元數(shù)據(jù)(Metadata):關(guān)于數(shù)據(jù)的數(shù)據(jù),是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù)。在互聯(lián)網(wǎng)中,元數(shù)據(jù)是指描述任何
26、互聯(lián)網(wǎng)數(shù)據(jù)和資源,促進(jìn)互聯(lián)網(wǎng)信息資源的組織和發(fā)現(xiàn)的數(shù)據(jù),以協(xié)助對(duì)網(wǎng)絡(luò)資源的識(shí)別、描述、位置指示。(考)起源:起源于計(jì)算機(jī)科學(xué),原先主要指網(wǎng)絡(luò)信息資源的描述,后逐步擴(kuò)大到各種以電子形式存在的信息資源的描述。描述的對(duì)象:圖書、期刊、磁帶、錄像帶、縮微品、論文、科技報(bào)告及各種形式的網(wǎng)絡(luò)信息資源。描述的成分:通常從信息資源中抽取出來的用于說明其特征、內(nèi)容的數(shù)據(jù)。如題名、版本、出版數(shù)據(jù)、相關(guān)說明等元數(shù)據(jù)作用 定位和檢索著錄和描述資源管理:權(quán)利管理、數(shù)字簽名、存取管理資源保護(hù)與長(zhǎng)期保存都柏林核心與數(shù)據(jù)庫(kù)是一種跨領(lǐng)域的信息資源描述規(guī)范。這里的資源是“任何具有標(biāo)識(shí)的東西”DC元素修飾詞(判斷)歸入三類(考)(
27、1)內(nèi)容描述部分題名項(xiàng)Title:主題詞項(xiàng)Subject描述項(xiàng)Description來源項(xiàng)Source語(yǔ)言項(xiàng)Language關(guān)聯(lián)項(xiàng)Relation覆蓋范圍項(xiàng)Coverage(2)知識(shí)產(chǎn)權(quán)部分著者項(xiàng)Creator: 出版者項(xiàng)Publisher合作者項(xiàng)Contributor: 權(quán)限項(xiàng)Rights(3)外形描述部分日期項(xiàng)Date: 類型項(xiàng)Type:格式項(xiàng)Format 識(shí)別符IdentifierDC與marc二者比較(1)著錄的對(duì)象不同(2)數(shù)據(jù)的形式不同(3)著錄的主體不同(4)著錄的詳簡(jiǎn)程度不同(5)標(biāo)識(shí)的方法不同信息標(biāo)引的含義(考)通過對(duì)信息資源的分析,選用確切的檢索標(biāo)識(shí),如分類號(hào)、主題詞、關(guān)鍵
28、詞、人名、地名等,用以反映該信息資源內(nèi)容的過程。是內(nèi)容的內(nèi)容分析和用詞表達(dá)(轉(zhuǎn)換標(biāo)識(shí))兩個(gè)步驟的結(jié)合。2.標(biāo)引的方式(考)(1)依內(nèi)容單元選擇方式分整體標(biāo)引、全面標(biāo)引、對(duì)口標(biāo)引、分析標(biāo)引、互見標(biāo)引(2)依信息單元選擇方式分綜合標(biāo)引、分別標(biāo)引(3)依所用標(biāo)識(shí)與主題概念的對(duì)應(yīng)性分專指標(biāo)引、組配標(biāo)引、上位標(biāo)引、依附標(biāo)引、暫定標(biāo)引(4)依組配標(biāo)識(shí)是否是成串分先組標(biāo)引、后組標(biāo)引(5)依標(biāo)引實(shí)施的方式分:分散標(biāo)引、集中標(biāo)引、聯(lián)合標(biāo)引、在版標(biāo)引(6)依標(biāo)引語(yǔ)言的原理分:分類標(biāo)引、主題標(biāo)引標(biāo)引的質(zhì)量控制:深度(查全率)、專指度(表達(dá)信息內(nèi)容的精確程度)、一致性(表達(dá)文獻(xiàn)主題內(nèi)容所需標(biāo)引詞的一致程度)(考)分類
29、標(biāo)引的基本原則:學(xué)科屬性原則(首要原則)、專指性原則、實(shí)用性原則、系統(tǒng)性原則、一致性原則(考)組配規(guī)則(簡(jiǎn)單題)(1)必須是概念組配,而不是字面組配。(2)當(dāng)有幾種組配形式可選擇時(shí),優(yōu)先選擇交叉組配。(3)選用主題最直接相關(guān)的、最相鄰的主題進(jìn)行組配,不用泛指詞和越級(jí)詞。(4)組配標(biāo)引的結(jié)果必須概念清楚、明確,具有單義性。(5)組配次序一般按照“主體通用空間時(shí)間文獻(xiàn)類型”來。當(dāng)有多個(gè)主體因素主題詞時(shí),按照對(duì)象方法材料過程條件等次序排列。主題詞組配標(biāo)引的形式(標(biāo)題考)(1)交叉組配(2)限定組配(3)聯(lián)結(jié)關(guān)系組配自動(dòng)標(biāo)引方法(主考)1.詞頻統(tǒng)計(jì)法將文獻(xiàn)中詞的出現(xiàn)頻率按等級(jí)排列,以一定標(biāo)準(zhǔn)排除高頻詞
30、和低頻詞,剩下能代表文獻(xiàn)主題內(nèi)容的詞。有絕對(duì)詞頻統(tǒng)計(jì)法和相對(duì)詞頻統(tǒng)計(jì)法兩種。2.加權(quán)標(biāo)引法(1)逆文獻(xiàn)加權(quán)標(biāo)引法(2)詞區(qū)分值加權(quán)標(biāo)引法(4).統(tǒng)計(jì)學(xué)習(xí)標(biāo)引法 (3).n-Gram標(biāo)引法自動(dòng)分類(區(qū)分自動(dòng)歸類和自動(dòng)聚類考)即聚類聚到多個(gè)類目,分類分到某一個(gè)類目中,且聚類沒有確定的分類體系第四、五章(注意第一,最)1四庫(kù)全書總目中國(guó)清代官修書目,是中國(guó)古代最大的解題書目。2國(guó)外人文社會(huì)科學(xué)核心期刊總覽是中國(guó)第一次大規(guī)模利用文獻(xiàn)計(jì)量學(xué)原理對(duì)國(guó)外人文社會(huì)科學(xué)期刊進(jìn)行篩選的核心期刊工具。3烏利希國(guó)際期刊指南國(guó)際上收錄外文期刊最多的訂購(gòu)目錄。4美國(guó)全國(guó)聯(lián)合目錄:累計(jì)作者索引世界上收錄圖書最多、質(zhì)量上乘的
31、館藏聯(lián)合目錄。5美、加連續(xù)出版物聯(lián)合目錄與新連續(xù)出版物聯(lián)合目錄世界上收錄館藏連續(xù)出版物最多的聯(lián)合目錄之一。6全國(guó)報(bào)刊索引是中國(guó)有史以來連續(xù)出版時(shí)間最長(zhǎng)、收錄報(bào)刊最多、最全面的報(bào)刊論文索引。7科學(xué)引文索引是目前世界上最權(quán)威的通過引文檢索和評(píng)價(jià)論文及其期刊的參考工具書。8化學(xué)文摘美國(guó)化學(xué)文摘服務(wù)社編輯,是世界上最著名的文摘刊物之一。9中國(guó)百科年鑒補(bǔ)充中國(guó)大百科全書的不足。中國(guó)解放后第一次按年出版的綜合性的百科年鑒。10世界知識(shí)年鑒我國(guó)出版時(shí)間最長(zhǎng)的年鑒之一。11中國(guó)大百科全書是中國(guó)現(xiàn)代第一部大型綜合性百科全書。是世界上最大的百科全書。12. 中國(guó)第一部類書皇覽。中國(guó)歷史上規(guī)模最大的類書永樂大典。中
32、國(guó)現(xiàn)存的規(guī)模最大的綜合性類書古今圖書集成。附有多種索引。第六章根據(jù)計(jì)算機(jī)檢索服務(wù)形式分:定題檢索(SDI)、回溯檢索和日常檢索定題檢索:根據(jù)用戶檢索課題的內(nèi)容,定期的從新到資料數(shù)據(jù)中為特定用戶提問進(jìn)行進(jìn)行的計(jì)算機(jī)情報(bào)檢索。具有定期性、新穎性和批處理式的特點(diǎn)。(考)計(jì)算機(jī)信息檢索策略(重點(diǎn)考 布爾邏輯練習(xí))布爾邏輯局限:布爾檢索式的非友善性,即構(gòu)造一個(gè)好的檢索式是不容易的易造成零輸出或輸出過量無(wú)差別的組配元,不能區(qū)分各組配元的重要程度匹配標(biāo)準(zhǔn)存在某些不合理的地方檢索結(jié)果不能按照任何用戶定義的重要性排序輸出。檢索表達(dá)式(書上P)是檢索策略的邏輯表達(dá)式和具體體現(xiàn),是指信息檢索中用來表達(dá)用戶檢索提問的邏輯表達(dá)式;由檢索詞和各種布爾邏輯算符、位置算符以及系統(tǒng)規(guī)定的其他組配連接符號(hào)組成。是計(jì)算機(jī)可以識(shí)別和執(zhí)行的命令形式。1邏輯表達(dá)式2加權(quán)表達(dá)式3位置檢索表達(dá)式4截詞檢索表達(dá)式(主要適用于英語(yǔ)環(huán)境)檢索策略的構(gòu)造步
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年海鮮產(chǎn)品綠色包裝推廣合同3篇
- 食堂裝修工程2025年度施工合同糾紛解決協(xié)議2篇
- 2025版錨具出口貿(mào)易合同范本及操作指南4篇
- 2025年物業(yè)公司綠化養(yǎng)護(hù)專業(yè)承包合同樣本3篇
- 二零二五年度白酒二批經(jīng)銷商線上線下全渠道合作協(xié)議3篇
- 二零二五年度古建筑門修復(fù)與安裝合同4篇
- 二零二五版鋁礦資源開發(fā)環(huán)境保護(hù)責(zé)任合同4篇
- 二零二五版機(jī)床租賃與購(gòu)買選擇合同范本3篇
- 2025年度城市街道綠化帶綠植花卉租賃養(yǎng)護(hù)協(xié)議4篇
- 二零二五版財(cái)務(wù)軟件定制開發(fā)及實(shí)施服務(wù)協(xié)議3篇
- 第1本書出體旅程journeys out of the body精教版2003版
- 臺(tái)資企業(yè)A股上市相關(guān)資料
- 電 梯 工 程 預(yù) 算 書
- 羅盤超高清圖
- 參會(huì)嘉賓簽到表
- 機(jī)械車間員工績(jī)效考核表
- 2.48低危胸痛患者后繼治療評(píng)估流程圖
- 人力資源管理之績(jī)效考核 一、什么是績(jī)效 所謂績(jī)效簡(jiǎn)單的講就是對(duì)
- 山東省醫(yī)院目錄
- 云南地方本科高校部分基礎(chǔ)研究
- 廢品管理流程圖
評(píng)論
0/150
提交評(píng)論