第一章 數(shù)字文獻檢索基礎庫課件_第1頁
第一章 數(shù)字文獻檢索基礎庫課件_第2頁
第一章 數(shù)字文獻檢索基礎庫課件_第3頁
第一章 數(shù)字文獻檢索基礎庫課件_第4頁
第一章 數(shù)字文獻檢索基礎庫課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章數(shù)字文獻檢索基礎庫第一章數(shù)字文獻檢索基礎庫第1章數(shù)字文獻檢索基礎1.1數(shù)字文獻及其檢索概述1.2數(shù)字文獻的檢索技術1.3數(shù)字文獻的檢索策略1.4檢索效果評價2024/10/292第一章數(shù)字文獻檢索基礎庫1.1數(shù)字文獻及其檢索概述1.1.1文獻及數(shù)字文獻概述1.文獻的概念2.文獻的類型3.數(shù)字文獻的概念4.數(shù)字文獻的特點1.1.2數(shù)字文獻的檢索語言1.數(shù)字文獻檢索2.數(shù)字文獻檢索語言2024/10/293第一章數(shù)字文獻檢索基礎庫1.文獻的概念世界上最早的文獻:產生于距今大約10000~40000年前的舊石器時代。最古老的文獻:石刻圖像、楔形文字文獻、紙草文獻、克里特線性文字文獻、甲骨文獻等。文獻定義:記錄有知識的一切載體。文獻構成:由知識、載體和記錄方式3個要素構成,知識是內容,載體是形態(tài),記錄方式是構成文獻的手段,三者不可分割。2024/10/294第一章數(shù)字文獻檢索基礎庫2.文獻的類型文獻有多種分類方式

(1)按文獻出版形式和內容劃分①圖書

②報刊③科技報告④政府出版物⑤會議文獻

⑥學位論文

⑦專利文獻⑧標準文獻

⑨產品樣本

⑩其他零散資料

(2)按文獻載體形式劃分①印刷型文獻②縮微型文獻③視聽型文獻④機讀文獻(3)按文獻加工層次分①零次文獻②一次文獻

③二次文獻④三次文獻

2024/10/295第一章數(shù)字文獻檢索基礎庫3.數(shù)字文獻的概念數(shù)字文獻指以數(shù)字形式把文字、圖像、聲音和動畫等多種形式的信息,存儲在光、磁等非紙介質的載體中,并通過網(wǎng)絡通信、計算機或終端等方式再現(xiàn)出來的資源。主要的類型有:按表現(xiàn)形式:數(shù)據(jù)庫、電子圖書、電子期刊、電子報紙等按性質和功能:一次數(shù)字文獻、二次數(shù)字文獻和三次數(shù)字文獻按生產途徑和發(fā)布:商用電子資源、網(wǎng)絡公開學術資源和特色資源按生產方式:原生數(shù)字文獻和復合數(shù)字文獻按數(shù)據(jù)傳播范圍:網(wǎng)絡信息資源和單機信息資源按存儲介質:磁介質和光介質2024/10/296第一章數(shù)字文獻檢索基礎庫全文數(shù)據(jù)庫1)數(shù)據(jù)庫,是以一定的組織方式存儲在一起的相關數(shù)據(jù)的集合,是數(shù)字文獻最早的形式,也是數(shù)字文獻的主要構成部分,包括全文數(shù)據(jù)庫、文摘/題錄數(shù)據(jù)庫和參考數(shù)據(jù)庫等類型。①全文數(shù)據(jù)庫,即收錄有原始文獻全文的數(shù)據(jù)庫,以期刊論文、會議論文、政府出版物、研究報告、法律條文和案例以及商業(yè)信息等為主。如國內著名的全文數(shù)據(jù)庫有中國知網(wǎng)的中國期刊全文數(shù)據(jù)庫、重慶維普的中文科技期刊數(shù)據(jù)庫等;國外有ProQuest系統(tǒng)、EBSCOhost系統(tǒng)以及SpringerLink系統(tǒng)等2024/10/297第一章數(shù)字文獻檢索基礎庫文摘/題錄數(shù)據(jù)庫是指包含各種數(shù)據(jù)、信息或知識的原始來源和屬性的數(shù)據(jù)庫。它報道文獻信息的存在,揭示文獻信息的內容。按數(shù)據(jù)庫內容,可劃分為書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和索引(題錄)數(shù)據(jù)庫。書目數(shù)據(jù)庫主要是針對圖書進行內容及存儲地址的報道與揭示的,如各圖書館的館藏機讀目錄數(shù)據(jù)庫;文摘和索引數(shù)據(jù)庫則相對期刊論文、會議論文、專利文獻和學位論文等進行內容和屬性的認識與加工,它提供確定的文獻來源信息,供人們查閱和檢索??茖W引文索引(SCI)、社會科學引文索引(SSCI)、工程索引(EI)和科學技術會議錄索引(ISTP)是世界上最權威的四大索引,均屬文摘/題錄數(shù)據(jù)庫。2024/10/298第一章數(shù)字文獻檢索基礎庫參考數(shù)據(jù)庫是指包含大量事實、數(shù)據(jù),以及其他類型文獻信息的數(shù)據(jù)庫,具體有數(shù)值數(shù)據(jù)庫、指南數(shù)據(jù)庫、術語數(shù)據(jù)庫、視頻數(shù)據(jù)庫、英語學習數(shù)據(jù)庫和考試系統(tǒng)等。數(shù)值數(shù)據(jù)庫,指以數(shù)值為主要內容的數(shù)據(jù)庫,如統(tǒng)計數(shù)據(jù)庫、化學反應數(shù)據(jù)庫等;指南數(shù)據(jù)庫,是有關機構、人物等相關信息的簡要描述,如公司名錄、產品目錄等;術語數(shù)據(jù)庫,即專門存儲名詞術語信息、詞語信息等的數(shù)據(jù)庫,如電子版百科全書、網(wǎng)絡詞典等。視頻數(shù)據(jù)庫,是指能夠以多媒體方式播放的相關信息內容的數(shù)據(jù)庫,如愛迪科森網(wǎng)上報告廳、超星學術視頻等;英語學習系統(tǒng),主要是指以英語學習為主要內容的數(shù)據(jù)庫,如新東方多媒體學習庫、冰果英語和EBSCO的學生英語學習中心(SRC)等;考試系統(tǒng)是指提供試題和模擬考試的數(shù)據(jù)庫系統(tǒng),如銀符考試系統(tǒng)、起點考試系統(tǒng)等。2024/10/299第一章數(shù)字文獻檢索基礎庫電子圖書、電子期刊和電子報紙電子圖書:直接以數(shù)字形式出版的圖書或印刷型圖書的數(shù)字化形式,是以電子版的方式(其載體主要為光盤或網(wǎng)絡等)呈現(xiàn)的,并通過計算機或電子圖書閱讀器進行閱讀的一種電子文獻。如國外的NetLibrary、Ebrary;國內的超星電子圖書、書生電子圖書和方正Apabi電子圖書等。電子期刊:是指所有以電子形式存在的期刊,包括印刷型期刊的電子版、無印刷版的網(wǎng)絡型電子期刊。與紙本期刊并行的電子期刊,如著名的《科學》(Science)、《自然》(Nature)、Elsevier/Wiley/Springer/Kluwer等出版商的電子期刊等;純電子期刊,如《數(shù)字圖書館雜志》(D-LibMagazine)。電子報紙:指綜合運用多媒體技術、網(wǎng)絡技術和通信技術,完成出版、發(fā)行、利用全過程的新聞媒體。電子報紙的內容可以是文字、表格、彩色圖形、圖像,甚至是聲音、動畫等的多媒體信息。

2024/10/2910第一章數(shù)字文獻檢索基礎庫4.數(shù)字文獻的特點1)高度的共享性。2)類型的多樣性。3)檢索的便利性。4)信息的時效性。5)信息的不安全性。2024/10/2911第一章數(shù)字文獻檢索基礎庫1.1.2數(shù)字文獻的檢索語言1.數(shù)字文獻檢索:是指通過檢索系統(tǒng),采用一定的技術手段,根據(jù)一定的原則,在數(shù)據(jù)庫或其他形式的數(shù)字文獻中自動找出用戶所需相關信息的過程。廣義的檢索包括信息的存儲和檢索兩個過程,狹義的檢索僅包括用戶的信息檢索過程。在數(shù)字文獻檢索發(fā)展過程中,先后經(jīng)歷脫機檢索、聯(lián)機檢索、光盤檢索和網(wǎng)絡檢索四個階段。目前,網(wǎng)絡檢索已成為廣大用戶獲取信息的主要方式。2024/10/2912第一章數(shù)字文獻檢索基礎庫廣義的信息檢索過程2024/10/2913第一章數(shù)字文獻檢索基礎庫2.數(shù)字文獻檢索語言檢索語言,是信息存儲與檢索過程中用于描述文獻特征和表達用戶信息提問的一種專門語言。所謂檢索的運算匹配就是通過檢索語言的匹配來實現(xiàn)的。

文獻具有外部特征和內容特征。外部特征有題名(書名、篇名和刊名)、著者(個人、團體)、號碼(專利號、標準號、國際標準書號ISBN和國際標準刊號ISSN等)、機構名(責任者所屬機構、出版發(fā)表機構)以及時間等;內部特征指文獻內容所屬的學科和文獻內容的研究對象。2024/10/2914第一章數(shù)字文獻檢索基礎庫文獻檢索語言與檢索途徑關系2024/10/2915第一章數(shù)字文獻檢索基礎庫《中圖法》結構2024/10/2916第一章數(shù)字文獻檢索基礎庫TB一般工業(yè)技術TD礦業(yè)工程TE石油、天然氣工業(yè)TF冶金工業(yè)TG金屬學與金屬工藝TH機械、儀表工業(yè)TJ武器工業(yè)TK能源與動力工程TL原子能技術TM電工技術TN無線電電子學、電信技術TP自動化技術、計算機技術TQ化學工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學TV水利工程工業(yè)技術所含學科較多,其下位類用二個大寫英文字母表示2024/10/2917第一章數(shù)字文獻檢索基礎庫

H31英語

H32/H37各種常用外國語均可仿H31分

H32法語

H33德語

H34西班牙語

H35俄語

H36日語

H37阿拉伯語H3常用外國語2024/10/2918第一章數(shù)字文獻檢索基礎庫H311語音H311.9朗誦法、演講術H312文字H313語義、詞匯、詞義H313.1基本詞匯H313.2同義詞、多義詞、反義詞H313.3熟語、俗語H313.5外來語H313.6略語H313.9詞源H314語法H314.1構詞法H314.2詞類H314.3句法H315寫作、修辭H315.9翻譯H316詞典H317方言H319語文教學H31英語2024/10/2919第一章數(shù)字文獻檢索基礎庫H319.1教學改革H319.2教學計劃、教學大綱H319.3教學法英語學習方法入此。仿H193分H319.4讀物以提高閱讀能力為目的各科簡易讀物、對照讀物、注釋讀物入此。H319.6習題、試題H319.9會話口語、會話教材、聽說讀練習、視聽教學入此H319語文教學2024/10/2920第一章數(shù)字文獻檢索基礎庫

R1預防醫(yī)學、衛(wèi)生學

R2中國醫(yī)學

R3基礎醫(yī)學

R4臨床醫(yī)學

R5內科學

R6外科學

R71婦產科學

R72兒科學

R73腫瘤科學

R74神經(jīng)病學與精神病學

R75皮膚病學與性病學

R76耳鼻咽喉科學

R77眼科學

R78口腔科學

R79外國民族科學

R8特種醫(yī)學

R9藥學R醫(yī)藥、衛(wèi)生2024/10/2921第一章數(shù)字文獻檢索基礎庫R2中國醫(yī)學

R21中醫(yī)預防、衛(wèi)生學

R22中醫(yī)基礎理論

R24中醫(yī)臨床學

R25中醫(yī)內科

R26中醫(yī)外科

R271中醫(yī)婦產科

R272中醫(yī)兒科

R273中醫(yī)腫瘤科

R274中醫(yī)骨傷科

R275中醫(yī)皮科

R276中醫(yī)五官科

R277中醫(yī)其他學科

R278中醫(yī)急癥學

R28中藥學

R29中國少數(shù)民族醫(yī)學2024/10/2922第一章數(shù)字文獻檢索基礎庫R3基礎醫(yī)學

R31醫(yī)用一般科學

R32人體形態(tài)學

R33人體生理學

[R34]人體生物化學、分子生物學

[R35]人體生物物理學

R36病理學

R38醫(yī)學寄生蟲學

R392醫(yī)學免疫學

R394醫(yī)學遺傳學

R395醫(yī)學心理學、病理心理學2024/10/2923第一章數(shù)字文獻檢索基礎庫R4臨床醫(yī)學

R44診斷學

R45治療學

R47護理學

R48臨終關懷學

R49康復醫(yī)學2024/10/2924第一章數(shù)字文獻檢索基礎庫1.2數(shù)字文獻的檢索技術1.2.1布爾邏輯檢索技術1.2.2截詞檢索技術1.2.3位置檢索技術1.2.4字段檢索技術2024/10/2925第一章數(shù)字文獻檢索基礎庫1.2.1布爾邏輯檢索技術檢索詞:是單字匹配?還是詞組匹配?或者是句子匹配?舉例:《私營企業(yè)人力資源研究》如何檢索?布爾邏輯檢索是指通過標準的布爾邏輯關系算符來表達檢索詞與檢索詞間的邏輯關系的檢索方法主要的布爾邏輯關系詞有:邏輯與(AND)、邏輯或(OR)、邏輯非(NOT)2024/10/2926第一章數(shù)字文獻檢索基礎庫邏輯與邏輯與也稱邏輯乘:使用符號“and”

或“*”表示所連接的兩個檢索詞必須同時出現(xiàn)在結果中才滿足檢索條件。檢索式可表達為:AandB或A*B。如“圖書館and服務”,要求結果必須同時包含“圖書館”和“服務”。使用“邏輯與”技術,可以增加限制條件,縮小檢索范圍,增強檢索的專指性,提高信息檢索的查準率。檢索式中,邏輯與連接的檢索詞越多,檢索結果就越少。2024/10/2927第一章數(shù)字文獻檢索基礎庫邏輯或邏輯或也稱邏輯和:使用符號“or”或“+”表示所連接的兩個檢索詞中任意一個出現(xiàn)在結果中就滿足檢索條件。檢索式可表達為:AorB或A+B如“文獻or知識”,要求結果包含“文獻”或包含“知識”或同時包含“文獻”和“知識”。使用“邏輯或”技術,常用于連接同義詞、相關詞等,可以擴大檢索范圍,防止漏檢,提高信息檢索的查全率。2024/10/2928第一章數(shù)字文獻檢索基礎庫邏輯非邏輯非也稱邏輯差:使用符號“not”或“-”表示所連接的兩個檢索詞中應從第一個概念中排除第二個概念。檢索式可表達為:AnotB或A-B如“文獻not圖書”,要求結果必須包含“文獻”但不包含“圖書”。使用“邏輯非”技術,可以剔除不需要的概念,縮小檢索范圍,提高信息檢索的查準率;但這種方式也會排除掉相關信息,影響檢索信息的查全率。2024/10/2929第一章數(shù)字文獻檢索基礎庫舉例例如檢索:“打印機驅動程序”查詢關鍵詞:打印機、驅動程序檢索表達式:打印機*驅動程序例如檢索:“微型計算機”方面的有關信息查詢關鍵詞:微型計算機、微機檢索表達式:微型計算機+微機2024/10/2930第一章數(shù)字文獻檢索基礎庫舉例例:檢索“唐宋詩歌”的有關信息關鍵詞:唐、宋、詩歌;檢索表達式:(唐+宋)*詩歌;唐*詩歌+宋*詩歌;錯誤表達式:唐+宋*詩歌;唐*宋*詩歌;唐+宋+詩歌;唐*宋+詩歌;2024/10/2931第一章數(shù)字文獻檢索基礎庫注意布爾邏輯檢索技術應用非常廣泛,但在實現(xiàn)方式上有所差異,即所使用的邏輯符號可能是不同的。一些檢索工具會完全省略任何符號和關系,直接把布爾邏輯關系隱含在菜單中。一些搜索引擎甚至用“︺、,、-”(即空格、逗號、減號)來表示。一般情況下請按以下規(guī)則使用邏輯符號,但并非所有數(shù)據(jù)庫和搜索引擎都是如此,具體請參考所用數(shù)字資源。中文數(shù)據(jù)庫用:*+-andornot西文數(shù)據(jù)庫用:andornot搜索引擎用:︺,-2024/10/2932第一章數(shù)字文獻檢索基礎庫1.2.2截詞檢索技術主要應用于西文數(shù)字資源的檢索定義:是指在檢索式中用專門的符號(截詞符號)表示檢索詞的某一部分允許有一定的詞形變化。原因:在檢索中,常會遇到一些詞干相同、詞義相近的檢索詞或有英、美不同拼寫法的詞。作用:為使檢索時不遺漏相關詞,擴大檢索范圍,提高查全率,常使用截詞檢索。截詞符一般用“?”、“*”、“$”和“!”等,不同的系統(tǒng),不同的數(shù)據(jù)庫,其代表的含義可能有所不同。截詞方式根據(jù)截詞的位置不同,分為前截斷、后截斷、前后截斷和中截斷;根據(jù)截斷的數(shù)量不同,分為有限截斷和無限截斷。2024/10/2933第一章數(shù)字文獻檢索基礎庫截詞位置前截斷(左截斷、后方一致):允許檢索詞前有若干變化。如*physics就可檢索到physics、astrophysics、biophysics、chemophysics、geophysics等詞的結果。后截斷(右截斷、前方一致):允許檢索詞尾有若干變化。如comput*將檢索出computer、computing、computerised、computerized、computerization等結果。前后截斷(中間一致):詞干的前后各有一個截詞符,允許檢索詞的前端和尾部各有若干變化形式。如*computer*可檢索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等結果。中間截斷(前后一致):允許檢索詞中間有若干變化。例如wom*n可檢索出woman、women。英美的不同拼法,defen*e可檢索出defence、和defense的結果。2024/10/2934第一章數(shù)字文獻檢索基礎庫請注意在不同的數(shù)據(jù)庫和聯(lián)機檢索系統(tǒng)中,所使用的截詞符號沒有統(tǒng)一的標準,有的用“?”,有的用“*”,有的用“#”,用的用“$”等。即便常用的“?”和“*”在不同的數(shù)據(jù)庫中其用法也是不一定相同的。在允許截詞的檢索工具中,一般是指后截斷,部分支持中間截斷,左截斷比較少見。我們將要使用的一些數(shù)據(jù)庫,一般用“?”代表一個字符,用“*”代表任意一個字符串。2024/10/2935第一章數(shù)字文獻檢索基礎庫1.2.3鄰近檢索技術

鄰近檢索又稱位置檢索,主要是通過檢索式中的專門符號來規(guī)定檢索詞在結果中的相對位置。例如檢索“生物防治”的文獻,若用檢索式:

“biologicalandcontrol”檢索,則會將“抑制生物”

“controlbiological”的文獻也查出來,這顯然不是所需文獻。主要有相鄰位置算符(W)、(nW)、(N),(nN)2024/10/2936第一章數(shù)字文獻檢索基礎庫1.(W)算符(W)算符:表示此算符兩側的檢索詞必須按此前后順序相鄰排列,詞序不可變,且兩詞之間不許有其他的詞或字母,但允許有一空格或標點符號。如biological(W)control

相當于檢索biologicalcontrolCD(W)ROM相當于檢索CDROM或CD-ROM。

2024/10/2937第一章數(shù)字文獻檢索基礎庫2.(nW)算符(nW)算符:(nW)是nwords的縮寫,表示此算符兩側的檢索詞之間允許插入最多n個詞,且詞序不可變。如wear(1W)material相當于檢索wearmaterials、wearofmaterials等詞。2024/10/2938第一章數(shù)字文獻檢索基礎庫3.(N)和(nN)算符(N)是near的縮寫,表示此算符兩側的檢索詞必須緊密相連,詞序可變,詞間不允許插入其他詞或字母,但允許有一空格或標點符號。(nN)表示兩詞間可插入最多n個詞,詞序可變,如檢索式environment(2N)protection就可檢索出包含“environmentprotection”、“environmentoftheprotection”、“environmentofwaterprotection”、“protectionofforestenvironment”等內容的結果Information(1N)retrieval

可檢出:informationretrievalretrivealofinformation2024/10/2939第一章數(shù)字文獻檢索基礎庫請注意

鄰近檢索對提高檢索的查全率和查準率有重要作用。不同的系統(tǒng),不同的數(shù)據(jù)庫,截詞符號雖然含義相同,但形式可能有所不同。①有的可能有括號,有的可能沒有。②小寫n有時在大寫的W、N前面,有時在大寫的W、N后面。③常見的形式有:(W)、W、();(N)、N;(nW)、nW、(Wn)、Wn;(nN)、nN、(Nn)、Nn;2024/10/2940第一章數(shù)字文獻檢索基礎庫1.2.4字段檢索技術字段檢索是限定檢索詞在記錄中出現(xiàn)的字段范圍,檢索時,計算機只對限定字段進行查找。基本檢索字段及代碼主要有:如題名(TI)、主題詞/敘詞(DE)、文摘(AB)和ID(標識詞)等,適用于所有數(shù)據(jù)庫。一般基本檢索字段放在檢索詞(或檢索式)后,用“/”、“:”或“in”等連接。輔助檢索字段及代碼主要有:作者(AU)、語種(LA)、刊名(JN)、來源出版物(SO)、出版年代(PY)和文獻類型(DT)等。輔助檢索字段放在檢索詞(或檢索式)前,用“=”、“>=”、“<=”、“>”或“<”等連接。注意:不同的數(shù)據(jù)庫其字段代碼可能不同。2024/10/2941第一章數(shù)字文獻檢索基礎庫字段代碼表西文數(shù)據(jù)庫常用字段字段代碼中文數(shù)據(jù)庫常用字段AbstractsAB文摘、摘要Author/CorporateSourceAU/CS作者、著者/機構Descriptor、Subject、TopicDE、SU、TO敘詞/主題詞DocumentType、PublicationTypeDT、PT文獻類型、出版物類型Full-textFT全文ISBN、ISSNBN、SN國際標準書號、刊號JournalNameJN刊名KeywordKW、KY關鍵詞LanguageLA語種PublicationYearPY出版年SourceSO來源TitleTI題名、標題2024/10/2942第一章數(shù)字文獻檢索基礎庫1.3數(shù)字文獻的檢索策略檢索策略就是在分析信息需求內容實質的基礎上,為實現(xiàn)檢索目標而制定的一個合理的檢索方案。1.3.1信息需求分析1.3.2數(shù)據(jù)庫的選擇1.3.3檢索詞的確定1.3.4檢索表達式的構造2024/10/2943第一章數(shù)字文獻檢索基礎庫1.3.1信息需求分析1.明確檢索目的2.分析所需信息學科屬性和主題概念3.確定檢索的信息類型和時間范圍2024/10/2944第一章數(shù)字文獻檢索基礎庫1.3.2數(shù)據(jù)庫的選擇數(shù)據(jù)庫選擇要考慮所選擇數(shù)據(jù)庫是否與信息需求結合緊密、學科專業(yè)對口、覆蓋信息面廣、報道及時、揭示信息內容準確以及檢索功能是否完善等問題。具體選擇數(shù)據(jù)庫可借鑒國外稱之為“4C”的原則:①內容(Content)。②范圍(Coverago)。③時效(Currency)。④費用(Cost),了解所選數(shù)據(jù)庫的收費標準。2024/10/2945第一章數(shù)字文獻檢索基礎庫1.3.3檢索詞的確定確定檢索詞要考慮滿足課題檢索要求和數(shù)據(jù)庫輸入詞的要求,檢索詞選擇得恰當與否,會直接影響檢索效果。檢索詞可分為四類:一是表示主題的檢索詞,如標題詞、單元詞、敘詞或關鍵詞。二是表示作者的檢索詞,如作者姓名、機構名等。三是表示分類的檢索詞,如分類號等。四是表示特殊意義的檢索詞。如專利號、ISBN號、ISSN號或分子式等。檢索詞的選擇與確定需要遵循下列兩個原則。第一,根據(jù)檢索課題所涉及的學科內容選詞。第二,對檢索詞進行處理。2024/10/2946第一章數(shù)字文獻檢索基礎庫1.3.4檢索表達式的構造檢索表達式是檢索策略的邏輯表達式,是用來表達用戶檢索提問的,由基于檢索概念產生的檢索詞和各種檢索算符組配構成,確定檢索詞之間的概念關系和位置關系,準確表達課題需求的內容。檢索表達式需要能夠完整而準確地反映用戶需求的主題內容,適應所查數(shù)據(jù)庫的索引體系和檢索用詞規(guī)則,同時必須符合檢索系統(tǒng)的概念及限制條件的規(guī)定。在檢索式的構造中,檢索算符主要包括前面提到過的布爾邏輯算符、截詞算符、位置算符、字段算符以及括號等。不同的數(shù)據(jù)庫往往采用不同的符號或文字來描述詞與詞之間的組配關系。2024/10/2947第一章數(shù)字文獻檢索基礎庫1.4檢索效果評價1.4.1概述1.4.2查全率1.4.3查準率2024/10/2948第一章數(shù)字文獻檢索基礎庫1.4.1概述一個理想的檢索系統(tǒng),應該是用戶需要什么信息,它就能向用戶提供什么信息;用戶需要多少信息,它就能提供多少信息;其檢索結果不多也不少,而又使用方便,反饋信息的速度也很快。但是,目前實現(xiàn)這樣的檢索系統(tǒng)還存在許多困難。實際上,檢索效果就是看檢索出的相關文獻或信息有多少。不同的檢索系統(tǒng),其檢索效果是不一樣的。同樣的檢索系統(tǒng),如果具有不同的檢索能力,其檢索效果也是不一樣的。對檢索效果進行評價,就能為改善檢索系統(tǒng)性能提供明確的參考依據(jù),進而更有效地滿足用戶的信息需求。對檢索系統(tǒng)進行評價時,其判定檢索效果的主要指標是查全率和查準率。2024/10/2949第一章數(shù)字文獻檢索基礎庫1.4.2查全率查全率,是指檢索系統(tǒng)檢出的與某課題相關的文獻信息數(shù)量與檢索系統(tǒng)中實際與該課題相關的文獻信息總量之比。當進行檢索時,檢索系統(tǒng)把文獻分成兩部分,一部分是與檢索策略相匹配的文獻,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論