布爾邏輯檢索技術(shù)課件_第1頁
布爾邏輯檢索技術(shù)課件_第2頁
布爾邏輯檢索技術(shù)課件_第3頁
布爾邏輯檢索技術(shù)課件_第4頁
布爾邏輯檢索技術(shù)課件_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章

文獻信息檢索基礎(chǔ)第一章文獻信息檢索基礎(chǔ)1第一章

文獻信息檢索基礎(chǔ)第一節(jié)文獻信息資源及其檢索概述第二節(jié)文獻信息檢索系統(tǒng)第三節(jié)文獻信息檢索技術(shù)第四節(jié)文獻信息檢索策略第一章文獻信息檢索基礎(chǔ)第一節(jié)文獻信息資源及其檢索概述2一、文獻信息的概念1.文獻2.知識3.信息一、文獻信息的概念1.文獻3第一節(jié)信息檢索概述一、信息、知識、情報、文獻(一)定義信息(Information):是物質(zhì)存在的一種方式、形態(tài)或運動狀態(tài),是事物的一種普遍屬性。知識(Knowledge):是人們在認識和改造客觀世界的實踐中所獲得的認識和經(jīng)驗的總和。是人們對客觀事物的本質(zhì)和規(guī)律的認識。情報(intelligence)

:是滿足一定需求的、激活了的知識第一節(jié)信息檢索概述一、信息、知識、情報、文獻4文獻(Literature,Document):是記錄有知識的一切載體。記錄知識的具體內(nèi)容;記錄知識的手段:如文字、圖像、符號、聲頻、視頻等;記錄知識的物質(zhì)載體:如紙張、光盤、錄像帶等;記錄知識的表現(xiàn)形態(tài):如圖書、期刊、專利說明書等。文獻(Literature,Document):是記錄有知識5(二)關(guān)系

信息知識情報文獻(二)關(guān)系信息知識情報文獻6二、文獻信息的類型按載體的不同,常將文獻劃分為:1.印刷型2.電子型3.聲像型按出版類型,又常將文獻劃分為:1.圖書2.期刊3.會議文獻4.學(xué)位論文5.科技報告6.專利文獻7.WHO出版物教科書——參考書——專著——綜述——期刊論文論文——綜述——專著——教科書二、文獻信息的類型按載體的不同,常將文獻劃分為:7(1)圖書圖書:通常被認為是由正式出版社出版的出版物。其范圍很廣,包括專著、文集、教科書、普及讀物、百科全書、年鑒、手冊、詞典等。特征為出版社名稱(Publication、Press)、ISBN號等分為閱讀型和工具型(1)圖書圖書:通常被認為是由正式出版社出版的出版物。8特點:成熟,全面,可靠,時效性差用途:初步了解一般性問題

實例:作者:胡鞍鋼著出版社:北京大學(xué)出版社出版時間:2007-1-1字數(shù):297000版次:1頁數(shù):395印刷時間:2007/01/01開本:印次:紙張:膠版紙ISBN:9787301115367包裝:平裝特點:成熟,全面,可靠,時效性差作者:胡鞍鋼著9(2)期刊期刊:俗稱雜志。是定期或不定期周期性出的連續(xù)出版物,特征為刊名、卷Vol.、期No.、國際標準刊號ISSN期刊分為:學(xué)術(shù)性(Journal)

情報型:工具型(Abstracts,Index)報導(dǎo)型(News)綜合型(Review)(2)期刊期刊:俗稱雜志。是定期或不定期周期性出的連續(xù)出版物10特點:數(shù)量大,品種多,內(nèi)容豐富,出版周期短用途:獲取最新研究成果和動態(tài)實例:主管:中國科學(xué)技術(shù)協(xié)會主辦:中華醫(yī)學(xué)會編輯:中華醫(yī)學(xué)雜志編輯委員會總主編:巴德年編輯部主任:陳新石出版:中華醫(yī)學(xué)會雜志社ISSN0376-2491CN11-2137/R

特點:數(shù)量大,品種多,內(nèi)容豐富,出版周期短主管:中國科學(xué)技術(shù)11(3)特種文獻

特種文獻:形式比較獨特,一般是單獨成冊,主要出版特征是號碼,主要特種文獻有以下八種類型。(3)特種文獻特種文獻:形式比較獨特,一般是單獨成冊12①學(xué)位論文學(xué)位論文:是高等院校碩士(Ms.D)或博士(Ph.D)畢業(yè)生為申請學(xué)位而提交的畢業(yè)論文。

特征:學(xué)校名稱及學(xué)位①學(xué)位論文學(xué)位論文:是高等院校碩士(Ms.D)或博士(13布爾邏輯檢索技術(shù)ppt課件14布爾邏輯檢索技術(shù)ppt課件15②科技報告科技報告:研究機構(gòu)關(guān)于某項科研成果的正式報告,或者是對研究過程中階段進展情況的實際記錄。國防與航空航天方面居多。

特征:報告號

②科技報告科技報告:研究機構(gòu)關(guān)于某項科研成果的正式報告16例如:NASA20050082846(美國宇航局科技報告)ADA207606(美國國防系統(tǒng)研究報告)DE91011930(美國能源系統(tǒng)研究報告)PB90226341(美國民用系統(tǒng)研究報告)AGARDR775(北大西洋公約組織研究報告)HY93007(航空信息研究報告)例如:17

實例:

中國核科技報告

ChinaNuclearScienceandTechnologyReport主辦:《中國核科技報告》編輯部周期:

半年出版地:北京市語種:

中英開本:

16開

ISSN1671-7430CN11-9253/TL創(chuàng)刊年:1985

中國核科技報告

ChinaNuclear18③會議論文會議文獻:主要是學(xué)術(shù)會議上宣讀的論文或交流的書面論文,形式有單行本(會議預(yù)印本preprint)和會議論文集。特征為:會議名稱、時間、地點③會議論文會議文獻:主要是學(xué)術(shù)會議上宣讀的論文或交流的19會議論文特點:文獻論題集中,內(nèi)容新穎、豐富、專、深、學(xué)術(shù)性強,能反映出一個國家、一個地區(qū)或國際上當前某一科學(xué)技術(shù)領(lǐng)域的最新成就、最高水平和發(fā)展趨勢。

實例會議論文特點:文獻論題集中,內(nèi)容新穎、豐富、專、深、學(xué)術(shù)性強20④專利

專利:發(fā)明人申請專利時呈交的申請說明書。一般包括:發(fā)明人、發(fā)明的詳細說明、專利權(quán)范圍、插圖等。特征:專利號④專利21實例:輸液自動呼叫器

福建省大田星??萍奸_發(fā)有限公司程開海1、輸液過程中瓶內(nèi)藥液將要滴盡時能提前自動發(fā)出聲響信號,提醒護理人員注意;2、旋動呼叫器上的旋鈕可直接選擇用于各種規(guī)格容量藥瓶(袋)輸液終了的自動呼叫;3、自動呼叫后病人躺在床上可直接拉動拉線控制停呼。實例:輸液自動呼叫器22⑤政府出版物政府出版物:這是各國政府部門及其設(shè)立的專門機構(gòu)發(fā)表、出版的文件,分為行政性文件(如法令.統(tǒng)計等)和科技文獻(30%~40%)。⑤政府出版物政府出版物:這是各國政府部門及其設(shè)立的專門23⑥標準標準:主要是對工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格及其檢驗方法等方面所作的技術(shù)規(guī)定,是從事生產(chǎn)、建設(shè)的一種共同技術(shù)依據(jù)。特征為:標準號⑥標準標準:主要是對工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格及24⑦產(chǎn)品資料產(chǎn)品資料:產(chǎn)品資料是制造廠商為了推銷產(chǎn)品而發(fā)出的,以介紹產(chǎn)品性能為主的出版物。⑦產(chǎn)品資料產(chǎn)品資料:產(chǎn)品資料是制造廠商為了推銷產(chǎn)品而發(fā)25實例:實例:26⑧科技檔案科技檔案:科技檔案是科學(xué)技術(shù)研究和生產(chǎn)建設(shè)部門,在科學(xué)技術(shù)研究和生產(chǎn)建設(shè)活動中形成的,有具體工程對象的技術(shù)文件、圖樣、圖表、圖片、原始記錄的原本或代替原本的復(fù)制本等⑧科技檔案科技檔案:科技檔案是科學(xué)技術(shù)研究和生產(chǎn)建設(shè)部門,在27282.認識不同內(nèi)容層次的文獻一次文獻零次文獻二次文獻三次文獻文獻整理知識重組知識濃縮282.認識不同內(nèi)容層次的文獻一次文獻零次文獻二次文獻三次文28(1)零次文獻(ZeroDocument)

零次文獻指未經(jīng)正式發(fā)表或未進入學(xué)術(shù)交流的最原始的文獻。(2)一次文獻(PrimaryDocument):是指作者以其本人的研究成果(如實驗、觀察、調(diào)查研究等的結(jié)果)為基本素材寫成的原始創(chuàng)作,如專著、期刊論文、科技報告、學(xué)位論文等。(1)零次文獻(ZeroDocument)29(3)二次文獻(SecondaryDocument):是將大量無序、分散的一次文獻收集、整理、加工、著錄其特征,如著者、篇名、分類、主題、出處等,并按一定的順序加以編排,形成供讀者檢索所需一次文獻線索的新的文獻形式,如索引、文摘、目錄以及其相應(yīng)的數(shù)據(jù)庫等。因其具有的檢索功能而稱之為檢索工具或檢索系統(tǒng)。(3)二次文獻(SecondaryDocument):是將30(4)三次文獻(TertiaryDocument):是科技人員圍繞某一專題,借助于二次文獻,在充分研究與利用大量一次文獻的基礎(chǔ)上,經(jīng)過閱讀、分析、歸納、概括,撰寫而成的新的文獻。表現(xiàn)形式主要有:綜述(Review)、述評(Comment)、進展(Progress、Advance)、現(xiàn)狀(Update)、發(fā)展趨勢(Trend)等期刊文獻和百科全書、年鑒、手冊等參考工具書。(4)三次文獻(TertiaryDocument):是科技31文獻級別舉例一次文獻

二次文獻文獻級別舉例32文獻級別舉例三次文獻零次文獻文獻級別舉例33

科技文獻層次結(jié)構(gòu)知識產(chǎn)生

記錄原始文獻知識重組

知識濃縮詞典名錄指南手冊年鑒書目等述評專著教科書論文叢集百科全書等三次文獻

期刊論文會議論文科技報告學(xué)位論文專利說明書文獻整理目錄

索引文摘新書通報等二次文獻一次文獻零次文獻 科技文獻層次結(jié)構(gòu)知識產(chǎn)生記錄原始文獻知識重組34

研究活動(實驗、觀察、思考)

信息的直接記錄或傳遞

零次文獻(創(chuàng)造知識的素材)

將知識以文字等形式固化

一次文獻(初始的知識產(chǎn)品)

將分散的文獻序列化

二次文獻(一次文獻的替代品)將知識重新組合,使知識序列化

三次文獻(濃縮的新的信息產(chǎn)品)研究活動(實驗、觀察、思考)信息的直353.認識不同載體的文獻

印刷型文獻:紙質(zhì)電子型文獻:

縮微型文獻聲像型文獻機讀型文獻(電子文獻)多媒體型文獻3.認識不同載體的文獻36四、文獻信息的特點1.數(shù)量龐大,增長迅速2.文種繁多,但呈明顯的英文化趨勢3.內(nèi)容交叉重復(fù)4.文獻形式呈現(xiàn)多樣化5.文獻分布既集中又分散,但呈專題化或?qū)<厔?.知識老化加快,文獻壽命(半衰期)縮短7.交流傳播及變化速度加快四、文獻信息的特點1.數(shù)量龐大,增長迅速37五、文獻信息的社會功能1.科技文獻是科學(xué)表現(xiàn)的存在形式,是匯集人類財富的主要場所。2.科技文獻是衡量科學(xué)技術(shù)水平的重要依據(jù)。3.科技文獻是傳播科學(xué)知識的最基本、最主要的手段4.科技文獻是確認科學(xué)發(fā)現(xiàn)與技術(shù)發(fā)明優(yōu)先權(quán)的認證記錄。五、文獻信息的社會功能1.科技文獻是科學(xué)表現(xiàn)的存在形式,是匯38六、檢索基本原理經(jīng)選擇的信息主題分析標引語言表達文獻特征標識經(jīng)確立的課題主題分析檢索語言表達文獻需求標識信息集合詞表存儲檢索檢索結(jié)果什么樣的文獻信息能夠得以輸出呢?匹配檢索時匹配的究竟是什么?六、檢索基本原理經(jīng)選擇的信息主題分析標引語言表達文獻特征標識39第二節(jié) 文獻信息檢索系統(tǒng)一、文獻信息檢索系統(tǒng)的構(gòu)成二、數(shù)據(jù)庫的結(jié)構(gòu)三、文獻信息檢索系統(tǒng)的分類四、文獻信息檢索系統(tǒng)的功能第二節(jié) 文獻信息檢索系統(tǒng)一、文獻信息檢索系統(tǒng)的構(gòu)成40一、文獻信息檢索系統(tǒng)的構(gòu)成1.信息資源2.硬件設(shè)備3.軟件條件4.人力資源上述四方面內(nèi)容構(gòu)成了文獻信息檢索系統(tǒng)的空間結(jié)構(gòu),是系統(tǒng)運行的最基本前提。一、文獻信息檢索系統(tǒng)的構(gòu)成1.信息資源4142二、類型手工檢索檢索手段計算機檢聯(lián)機檢索光盤檢索網(wǎng)絡(luò)檢索42二、類型檢索手段4243二、類型文本信息檢索數(shù)據(jù)格式和檢索技術(shù)多媒體信息檢索超媒體和超文本檢索43二、類型文本信息檢索數(shù)據(jù)格式和檢索技術(shù)多媒體信息檢索超媒43三、數(shù)據(jù)庫的結(jié)構(gòu)(一)從數(shù)據(jù)庫組成的層次來劃分1.文檔(File)2.記錄(Record)3.字段(Field)(二)從數(shù)據(jù)庫組成的方式來劃分1.順排文檔2.倒排文檔三、數(shù)據(jù)庫的結(jié)構(gòu)(一)從數(shù)據(jù)庫組成的層次來劃分44字段1字段2字段3記錄1記錄2記錄3文檔1文檔2文檔3數(shù)據(jù)庫數(shù)據(jù)庫結(jié)構(gòu)字段1字段2字段3記錄1記錄2記錄3文檔1文檔2文檔3數(shù)據(jù)庫45上述數(shù)據(jù)庫的結(jié)構(gòu),可用英文單詞的單復(fù)數(shù)形式更直觀地表述為:

Record

Fields(記錄)

Database

Flies(數(shù)據(jù)庫)

File

Records(文檔)

Field

searchingentry(字段)(檢索入口上述數(shù)據(jù)庫的結(jié)構(gòu),可用英文單詞的單復(fù)數(shù)形式更直觀地表述為:46主文檔序號:N5序號:N4序號:N3序號:N2序號:N1主題詞:S1著者:Au1標題:t1……S1:N1,N3S2:N2,N3S3:N1,N4……Au1:N1,N4Au2:N3Au3:N4……主題詞倒排檔著者倒排檔……主題詞檢索途徑著者檢索途徑其它檢索途徑主文檔和倒排文檔的關(guān)系示意圖主文檔序號:N5序號:N4序號:N3序號:N2序號:N1S147四、文獻信息檢索系統(tǒng)的分類1.書目型數(shù)據(jù)庫2.事實數(shù)值型數(shù)據(jù)庫3.全文型數(shù)據(jù)庫四、文獻信息檢索系統(tǒng)的分類1.書目型數(shù)據(jù)庫4849

書目型數(shù)據(jù)庫全文型數(shù)據(jù)庫事實型數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫類型文獻信息數(shù)據(jù)庫49書目型數(shù)據(jù)庫全文型數(shù)據(jù)庫事實型數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫類型文49書目型數(shù)據(jù)庫(bibliographicdatabase):是二次文獻數(shù)據(jù)庫,主要存貯相關(guān)主題領(lǐng)域的各類文獻資料的書目信息,包括機讀版的文摘、題錄、目錄、索引等。用戶可從大量文獻記錄中篩選出有參考價值的文獻源,并依據(jù)記錄提供的來源指示獲取一次文獻。舉例:中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫、PubMed(P84)、EMBASE(P93)等。1、書目型數(shù)據(jù)庫書目型數(shù)據(jù)庫(bibliographicdatabase)50布爾邏輯檢索技術(shù)ppt課件51全文型數(shù)據(jù)庫(Full-textDatabase):收錄有原始文獻全文的數(shù)據(jù)庫,以期刊論文、會議論文、政府出版物、研究報告、法律條文和案例、商業(yè)信息等為主。優(yōu)點:能直接獲取文獻原文,集文獻檢索和全文提供于一體;提供全文字段檢索。舉例:中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(CNKI)、萬方數(shù)據(jù)資源的數(shù)字化期刊、OVID全文數(shù)據(jù)庫、ElsevierScience的SDOS等。2、全文型數(shù)據(jù)庫全文型數(shù)據(jù)庫(Full-textDatabase):收錄52布爾邏輯檢索技術(shù)ppt課件53布爾邏輯檢索技術(shù)ppt課件543、事實型數(shù)據(jù)庫事實型數(shù)據(jù)庫(FactDatabase):提供有關(guān)事物、人物、機構(gòu)等方面的事實性信息。舉例:ClinicalTrials(臨床試驗數(shù)據(jù)庫)是通過對自愿接受試驗患者的臨床研究,觀測藥物、診斷方法、疫苗和其他治療方法對某一種疾病或癥狀是否安全和有效。3、事實型數(shù)據(jù)庫事實型數(shù)據(jù)庫(FactDatabase):55布爾邏輯檢索技術(shù)ppt課件56數(shù)據(jù)型數(shù)據(jù)庫(NumericDatabase):提供數(shù)值性信息,包括各種統(tǒng)計數(shù)據(jù)、科學(xué)實驗數(shù)據(jù)、各種測量數(shù)據(jù)等。舉例:WHOSIS:可以獲取以下統(tǒng)計數(shù)據(jù)和資料:疾病負擔統(tǒng)計、死亡原因統(tǒng)計、世界衛(wèi)生報告年度統(tǒng)計、衛(wèi)生從業(yè)人員統(tǒng)計、人口統(tǒng)計、HIV/AIDS信息與數(shù)據(jù)、精神病死亡率統(tǒng)計、免疫接種統(tǒng)計等統(tǒng)計數(shù)據(jù),以及疾病負擔計劃、國際疾病分類法及WHO術(shù)語信息系統(tǒng)、衛(wèi)生系統(tǒng)成就、全球酒精數(shù)據(jù)庫(GlobalAlcoholDatabase)等與衛(wèi)生和衛(wèi)生統(tǒng)計有關(guān)的資料。(P264)美國疾病控制與預(yù)防中心(CDC)的DataandStatistics等。(P266)4、數(shù)據(jù)型數(shù)據(jù)庫數(shù)據(jù)型數(shù)據(jù)庫(NumericDatabase):提供數(shù)值性57布爾邏輯檢索技術(shù)ppt課件58布爾邏輯檢索技術(shù)ppt課件59四、文獻信息檢索系統(tǒng)的功能1.匯集文獻信息2.組織文獻信息3.檢索文獻信息上述三者之間的關(guān)系如何?理解這個問題對于整個文獻檢索課學(xué)習(xí)的意義何在?四、文獻信息檢索系統(tǒng)的功能1.匯集文獻信息60思考題:1.信息、知識、情報三者的聯(lián)系與區(qū)別。2.分別用抽象文字與具體圖示表達上述三者關(guān)系的意義。3.文獻級別演化的本質(zhì)及意義。4.文獻信息綜合應(yīng)用中“綜合”二字的含義。5.科技圖書與科技期刊之與學(xué)術(shù)生涯。6.信息檢索系統(tǒng)中“系統(tǒng)”二字的含義。7.信息檢索系統(tǒng)構(gòu)成與信息檢索原理的關(guān)系。8.如何理解信息檢索系統(tǒng)的諸多功能。思考題:1.信息、知識、情報三者的聯(lián)系與區(qū)別。61第三節(jié)文獻信息檢索技術(shù)第三節(jié)文獻信息檢索技術(shù)62一、信息檢索技術(shù)概念廣義的包括信息組織、數(shù)據(jù)庫建設(shè)在內(nèi)的涉及信息科學(xué)、情報學(xué)、計算機科學(xué)等諸多學(xué)科領(lǐng)域的技術(shù)方法;狹義僅指從現(xiàn)有的信息資源中提取相關(guān)信息的技術(shù)方法。一、信息檢索技術(shù)概念63信息檢索技術(shù)發(fā)展階段手工檢索方式:包括紙質(zhì)文獻的檢索和縮微式檢索;脫機檢索方式:包括機讀磁帶、磁盤檢索、光盤數(shù)據(jù)庫檢索等;計算機聯(lián)機檢索方式;網(wǎng)絡(luò)化信息檢索方式:如:SCI、EI、SpringerLink數(shù)據(jù)庫、EBSCO數(shù)據(jù)庫等。信息檢索技術(shù)發(fā)展階段64布爾邏輯檢索技術(shù)最常用的方法;用戶的信息需求通過檢索提問式表達;采用布爾代數(shù)中的邏輯符AND、OR和NOT作為邏輯組配算符;計算機根據(jù)表達式確定命中文獻的基本條件與查找途徑,同文檔中各篇文獻的標識進行匹配。凡符合條件的文獻即為命中文獻,予以輸出。布爾邏輯檢索技術(shù)最常用的方法;65布爾邏輯檢索技術(shù)布爾運算符AND、OR、NOT,分別表示邏輯與、邏輯或、邏輯非三種邏輯運算關(guān)系,如圖1-3-1所示。

AandBAorBAnotB圖1-3-1布爾邏輯運算示意圖

布爾邏輯檢索技術(shù)布爾運算符AandB66布爾邏輯檢索技術(shù)名稱符號表達式功能邏輯與ANDAANDB同時含有提問詞A和B的文獻,為命中文獻邏輯或ORAORB凡是含有提問詞A或B的文獻,為命中文獻邏輯非NOTANOTB凡是含有提問詞A但不含有B的文獻,為命中文獻布爾邏輯運算一覽表布爾邏輯檢索技術(shù)名稱符號表達式功能邏輯與ANDAANDB67布爾邏輯檢索技術(shù)邏輯“與”,檢索表達式為“AandB”。數(shù)據(jù)庫中同時含有檢索同A和B的文獻為命中文獻;作用是縮小檢索范圍,提高查準率;例如,查找“胰島素治療糖尿病”的文獻,檢索式為

insulin(胰島素)anddiabetes(糖尿病)。布爾邏輯檢索技術(shù)邏輯“與”,檢索表達式為“AandB”68布爾邏輯檢索技術(shù)邏輯“或”,檢索表達式為“AorB”。數(shù)據(jù)庫中的文獻中含有檢索詞A或B的文獻為命中文獻;作用是擴大檢索范圍;例如,查找“腫瘤”的文獻,檢索式為cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)。布爾邏輯檢索技術(shù)邏輯“或”,檢索表達式為“AorB”。69布爾邏輯檢索技術(shù)邏輯“非”,檢索表達式為“AnotB”。數(shù)據(jù)庫中凡含有檢索詞A而不含B的文獻為命中文獻;作用是縮小檢索范圍,提高查準率;例如,查“動物的乙肝病毒(不要人的)”的文獻,檢索式為

hepatitisBvirus(乙肝病毒)nothuman(人類)。布爾邏輯檢索技術(shù)邏輯“非”,檢索表達式為“AnotB”。70布爾邏輯檢索技術(shù)布爾邏輯運算的優(yōu)先順序當一個檢索表達式含有多個布爾算符時,執(zhí)行的順序為not優(yōu)先運算,and其次,or最后。可用圓括號改變運算順序,將需要優(yōu)先運算者置于圓括號中。例如,查找“維生素C或維生素E對糖尿病患者腎臟的保護作用”,檢索式為:(維生素Cor

維生素E)and糖尿病

and

腎。布爾邏輯檢索技術(shù)布爾邏輯運算的優(yōu)先順序71截詞檢索截詞檢索,利用截斷的詞的一個局部即截詞,進行檢索的技術(shù);自動地對同一概念檢索詞的不同詞尾變化、詞根相同等一類提問詞進行檢索,并自動用OR連接各詞的檢出結(jié)果,避免文獻的漏檢和逐詞鍵入的麻煩,提高查全率;常用的截詞符號有“*”、“

?”。截詞檢索截詞檢索,利用截斷的詞的一個局部即截詞,進行檢索的技72布爾邏輯檢索技術(shù)ppt課件73截詞檢索分類按是否采用截詞符號分為,采用截詞符號、不用截詞符號;按截斷位置的不同分為,右截詞、左截詞、中間截詞;按截斷的字符數(shù)量的不同分為,無限截詞、有限截詞。截詞檢索分類74鄰近檢索鄰近檢索(ProximitySearching)是用來表示檢索詞與檢索詞之間位置關(guān)系的檢索技術(shù),通常用位置算符來實現(xiàn);采用的位置算符有near,with?!皀ear”,表示檢索詞位置相鄰,檢索詞出現(xiàn)的順序可前可后,如geneNEARapoptosis;“with”,表示檢索詞位置相鄰,且兩詞出現(xiàn)的順序與輸入順序一致,如liverWITHcancer。鄰近檢索鄰近檢索(ProximitySearching)是75限定檢索限定檢索(limitSearching)又稱限定字段檢索(limitFieldSearching),是利用檢索詞出現(xiàn)的字段進行的檢索;用戶可以指定檢索某一字段或某幾個字段以使檢索結(jié)果更為準確,減少誤檢;檢索系統(tǒng)的限定檢索會采用縮寫形式的字段標識符;如TI表示Title,AD表示Address。限定檢索限定檢索(limitSearching)又稱限定字76布爾邏輯檢索技術(shù)ppt課件77擴展檢索擴展檢索(ExpandSearching)是同時對多個相關(guān)檢索詞執(zhí)行邏輯或檢索的技術(shù);即當用戶輸入一個檢索詞后,系統(tǒng)不僅能檢出該檢索詞的文獻,還能檢出與該檢索詞同屬于一個概念的同義詞或下位詞的文獻,如PubMed中主題詞的擴展檢索。擴展檢索擴展檢索(ExpandSearching)是同時對78加權(quán)檢索加權(quán)檢索(weighingsearching)不僅檢索提問詞是否存在,而且計算提問詞的權(quán)值,當權(quán)值之和超過閾值的記錄才能在數(shù)據(jù)庫中被檢出來。在某些數(shù)據(jù)庫中表現(xiàn)為僅檢索主要概念主題詞,如MEDLINE;而有些數(shù)據(jù)庫表現(xiàn)為詞頻檢索,如中國學(xué)術(shù)期刊全文數(shù)據(jù)庫。加權(quán)檢索加權(quán)檢索(weighingsearching)不僅79精確檢索和模糊檢索精確檢索(ExactSearching)是指所檢信息與輸入的詞組完全一致的匹配檢索技術(shù);在許多系統(tǒng)中用引號來表示,如檢索“AcutePancreatitis”;模糊檢索(FuzzySearching)允許所檢信息與檢索提問之間存在一定的差異。如檢索AcutePancreatitis,可檢索出AcutenecrotizingPancreatitis、AcutegallstonePancreatitis等。精確檢索和模糊檢索精確檢索(ExactSearching)80跨庫檢索跨庫檢索(Crossdatabasesearching、One-stopsearching)是一次對多個數(shù)據(jù)庫同時進行檢索的技術(shù)。跨庫檢索能為用戶提供統(tǒng)一的檢索接口,將用戶檢索需求轉(zhuǎn)化為不同數(shù)據(jù)庫的檢索表達式,并發(fā)地檢索本地和廣域網(wǎng)上的多個分布式異構(gòu)數(shù)據(jù)庫,并對檢索結(jié)果加以整合,以統(tǒng)一的格式將結(jié)果呈現(xiàn)給用戶??鐜鞕z索跨庫檢索(Crossdatabasesearch81跨庫檢索跨庫檢索82相關(guān)信息反饋檢索相關(guān)信息反饋檢索,是將與已檢結(jié)果存在某種程度相關(guān)的信息檢索出來的檢索技術(shù),多由檢索系統(tǒng)自動進行檢索。如Google()的“類似網(wǎng)頁”、PubMed的“RelatedArticles”。相關(guān)信息反饋檢索相關(guān)信息反饋檢索,是將與已檢結(jié)果存在某種程度83相關(guān)信息反饋檢索相關(guān)信息反饋檢索84布爾邏輯檢索技術(shù)ppt課件85智能檢索自動實現(xiàn)檢索詞、檢索詞對應(yīng)主題詞及該主題詞所含下位詞的同步檢索。如中國生物醫(yī)學(xué)文獻服務(wù)系統(tǒng)(SinoMed)的智能檢索。PubMed的“自動詞語匹配檢索”屬于智能檢索。智能檢索自動實現(xiàn)檢索詞、檢索詞對應(yīng)主題詞及該主題詞所含下位詞86二、多媒體信息檢索技術(shù)基于內(nèi)容的檢索基于內(nèi)容的檢索(ContentBasedRetrieval,CBR),主要是對多媒體對象的語義、媒體的視覺特征或聽覺特征進行檢索?;趦?nèi)容的圖像檢索基于內(nèi)容的圖像檢索(ContentBasedImageRetrieval,CBIR)使用了可以直接從圖像中獲得的客觀的視覺內(nèi)容特征,如顏色、紋理、形狀等來判斷圖像之間的相似性。二、多媒體信息檢索技術(shù)基于內(nèi)容的檢索87基于內(nèi)容的圖像檢索現(xiàn)有圖像檢索技術(shù)研究的主流。與傳統(tǒng)數(shù)據(jù)庫技術(shù)相結(jié)合,可以方便地實現(xiàn)海量多媒體數(shù)據(jù)的存儲和管理;與傳統(tǒng)Web搜索引擎技術(shù)相結(jié)合,可以用來檢索html網(wǎng)頁中豐富的多媒體信息;還可以廣泛應(yīng)用在多媒體數(shù)據(jù)庫、知識產(chǎn)權(quán)保護、數(shù)字圖書館、網(wǎng)絡(luò)多媒體搜索引擎、交互電視、藝術(shù)收藏和博物館管理、遙感和地球資源管理等許多領(lǐng)域中?;趦?nèi)容的圖像檢索現(xiàn)有圖像檢索技術(shù)研究的主流。88三、可視化信息檢索技術(shù)信息可視化(Informationvisualization)是將抽象數(shù)據(jù)用可視的形式表示出來,以利于分析數(shù)據(jù)、發(fā)現(xiàn)規(guī)律和決策制定??蓪崿F(xiàn)對信息數(shù)據(jù)的分析和提取,以圖形、圖像、虛擬現(xiàn)實等易為人們所認識、可視的方式,展示數(shù)據(jù)間的復(fù)雜關(guān)系、潛在信息和發(fā)展趨勢,以便更好地掌握和利用信息資源。三、可視化信息檢索技術(shù)信息可視化(Information89可視化檢索可視化檢索(VisualRetrieval)是信息可視化的一種。是指把文獻信息、用戶提問、各類情報檢索模型以及利用檢索模型進行信息檢索的過程中不可見的內(nèi)部語義關(guān)系轉(zhuǎn)換成圖形,在一個二維或三維的可視化空間中顯示出來??梢暬瘷z索可視化檢索(VisualRetrieval)是信90可視化檢索的特點檢索過程透明化檢索結(jié)果輸出高效性更為有效的檢索結(jié)果排序機制有效的用戶反饋機制可視化檢索的特點檢索過程透明化91第一章

文獻信息檢索基礎(chǔ)第四節(jié)文獻信息檢索策略第一章文獻信息檢索基礎(chǔ)第四節(jié)文獻信息檢索策略92一、文獻信息檢索途徑檢索途徑為檢索系統(tǒng)的檢索入口,即檢索系統(tǒng)所提供的、用以查詢獲取資源的各種標識,在計算機檢索系統(tǒng)中通常表現(xiàn)為字段檢索。一、文獻信息檢索途徑檢索途徑為檢索系統(tǒng)的檢索入口,即檢索系93主題詞檢索主題詞檢索途徑,是利用主題詞(SubjectHeadings)作為檢索入口來查找文獻;主題詞是經(jīng)過優(yōu)選和規(guī)范化處理的詞匯,由主題詞表來控制;目前支持主題詞途徑的檢索系統(tǒng)主要有,CBMDisc和PubMed。主題詞檢索主題詞檢索途徑,是利用主題詞(SubjectHe94自由詞檢索通過從文獻篇名、正文或文摘中抽取出來的能表達文獻主要內(nèi)容的單詞或詞組查找文獻的檢索途徑。自由詞途徑,靈活、自由、直觀、符合用戶習(xí)慣,為目前檢索系統(tǒng)中應(yīng)用最為廣泛的一種檢索途徑;但自由詞因未經(jīng)規(guī)范化處理,檢索時必須同時考慮到與檢索詞相關(guān)的同義詞、近義詞等,容易造成漏檢。自由詞檢索通過從文獻篇名、正文或文摘中抽取出來的能表達文獻95分類檢索分類檢索途徑是利用文獻在分類體系中的位置(類目名稱或分類號)作為檢索入口查找文獻的途徑,可滿足用戶從學(xué)科、專業(yè)等內(nèi)容出發(fā)獲取文獻的需要。例如,CBMDisc提供的分類途徑,即以文獻在《中國圖書館分類法》中的分類號作為檢索入口來查找文獻。分類檢索分類檢索途徑是利用文獻在分類體系中的位置(類目名稱或96引文檢索引文檢索途徑,是利用引文(citation,即文章末尾所附參考文獻)這一特征作為檢索入口查找文獻的途徑;許多檢索工具提供的引文檢索途徑允許以引文中出現(xiàn)的任何信息(如作者、題名、出處)等作為檢索入口。如WebofScience的CitedReferenceSearch(引文檢索)。引文檢索引文檢索途徑,是利用引文(citation,即文章末97缺省檢索缺省檢索是指自動在脊索系統(tǒng)預(yù)先設(shè)定的多個字段中同時進行檢索。例如,在CBMDisc的基本檢索界面直接輸入檢索詞,系統(tǒng)默認在缺省字段中進行檢索即同時在中文題名、關(guān)鍵詞、主題詞、文摘、刊名、特征詞等字段進行檢索。缺省檢索缺省檢索是指自動在脊索系統(tǒng)預(yù)先設(shè)定的多個字段中同時進98其它途徑著者檢索利用文獻上署名的作者、編者或機關(guān)團體名稱作為檢索入口查找文獻的途徑。題名檢索利用題名(Title,如書名、刊名、篇名等)作為檢索入口查找文獻的途徑。序號檢索機構(gòu)檢索其它途徑著者檢索99二、文獻信息檢索策略檢索策略的含義廣義的檢索策略是指用戶根據(jù)檢索需求選擇相應(yīng)的數(shù)據(jù)庫、確定檢索方式、檢索途徑及相應(yīng)檢索表達式進行檢索的一系列操作或方案,是用戶檢索目標的體現(xiàn);狹義的檢索策略僅指用戶確定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論