




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第一章
文獻(xiàn)信息檢索基礎(chǔ)第一章文獻(xiàn)信息檢索基礎(chǔ)1第一章
文獻(xiàn)信息檢索基礎(chǔ)第一節(jié)文獻(xiàn)信息資源及其檢索概述第二節(jié)文獻(xiàn)信息檢索系統(tǒng)第三節(jié)文獻(xiàn)信息檢索技術(shù)第四節(jié)文獻(xiàn)信息檢索策略第一章文獻(xiàn)信息檢索基礎(chǔ)第一節(jié)文獻(xiàn)信息資源及其檢索概述2一、文獻(xiàn)信息的概念1.文獻(xiàn)2.知識(shí)3.信息一、文獻(xiàn)信息的概念1.文獻(xiàn)3第一節(jié)信息檢索概述一、信息、知識(shí)、情報(bào)、文獻(xiàn)(一)定義信息(Information):是物質(zhì)存在的一種方式、形態(tài)或運(yùn)動(dòng)狀態(tài),是事物的一種普遍屬性。知識(shí)(Knowledge):是人們?cè)谡J(rèn)識(shí)和改造客觀世界的實(shí)踐中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。是人們對(duì)客觀事物的本質(zhì)和規(guī)律的認(rèn)識(shí)。情報(bào)(intelligence)
:是滿足一定需求的、激活了的知識(shí)第一節(jié)信息檢索概述一、信息、知識(shí)、情報(bào)、文獻(xiàn)4文獻(xiàn)(Literature,Document):是記錄有知識(shí)的一切載體。記錄知識(shí)的具體內(nèi)容;記錄知識(shí)的手段:如文字、圖像、符號(hào)、聲頻、視頻等;記錄知識(shí)的物質(zhì)載體:如紙張、光盤、錄像帶等;記錄知識(shí)的表現(xiàn)形態(tài):如圖書、期刊、專利說明書等。文獻(xiàn)(Literature,Document):是記錄有知識(shí)5(二)關(guān)系
信息知識(shí)情報(bào)文獻(xiàn)(二)關(guān)系信息知識(shí)情報(bào)文獻(xiàn)6二、文獻(xiàn)信息的類型按載體的不同,常將文獻(xiàn)劃分為:1.印刷型2.電子型3.聲像型按出版類型,又常將文獻(xiàn)劃分為:1.圖書2.期刊3.會(huì)議文獻(xiàn)4.學(xué)位論文5.科技報(bào)告6.專利文獻(xiàn)7.WHO出版物教科書——參考書——專著——綜述——期刊論文論文——綜述——專著——教科書二、文獻(xiàn)信息的類型按載體的不同,常將文獻(xiàn)劃分為:7(1)圖書圖書:通常被認(rèn)為是由正式出版社出版的出版物。其范圍很廣,包括專著、文集、教科書、普及讀物、百科全書、年鑒、手冊(cè)、詞典等。特征為出版社名稱(Publication、Press)、ISBN號(hào)等分為閱讀型和工具型(1)圖書圖書:通常被認(rèn)為是由正式出版社出版的出版物。8特點(diǎn):成熟,全面,可靠,時(shí)效性差用途:初步了解一般性問題
實(shí)例:作者:胡鞍鋼著出版社:北京大學(xué)出版社出版時(shí)間:2007-1-1字?jǐn)?shù):297000版次:1頁數(shù):395印刷時(shí)間:2007/01/01開本:印次:紙張:膠版紙ISBN:9787301115367包裝:平裝特點(diǎn):成熟,全面,可靠,時(shí)效性差作者:胡鞍鋼著9(2)期刊期刊:俗稱雜志。是定期或不定期周期性出的連續(xù)出版物,特征為刊名、卷Vol.、期No.、國(guó)際標(biāo)準(zhǔn)刊號(hào)ISSN期刊分為:學(xué)術(shù)性(Journal)
情報(bào)型:工具型(Abstracts,Index)報(bào)導(dǎo)型(News)綜合型(Review)(2)期刊期刊:俗稱雜志。是定期或不定期周期性出的連續(xù)出版物10特點(diǎn):數(shù)量大,品種多,內(nèi)容豐富,出版周期短用途:獲取最新研究成果和動(dòng)態(tài)實(shí)例:主管:中國(guó)科學(xué)技術(shù)協(xié)會(huì)主辦:中華醫(yī)學(xué)會(huì)編輯:中華醫(yī)學(xué)雜志編輯委員會(huì)總主編:巴德年編輯部主任:陳新石出版:中華醫(yī)學(xué)會(huì)雜志社ISSN0376-2491CN11-2137/R
特點(diǎn):數(shù)量大,品種多,內(nèi)容豐富,出版周期短主管:中國(guó)科學(xué)技術(shù)11(3)特種文獻(xiàn)
特種文獻(xiàn):形式比較獨(dú)特,一般是單獨(dú)成冊(cè),主要出版特征是號(hào)碼,主要特種文獻(xiàn)有以下八種類型。(3)特種文獻(xiàn)特種文獻(xiàn):形式比較獨(dú)特,一般是單獨(dú)成冊(cè)12①學(xué)位論文學(xué)位論文:是高等院校碩士(Ms.D)或博士(Ph.D)畢業(yè)生為申請(qǐng)學(xué)位而提交的畢業(yè)論文。
特征:學(xué)校名稱及學(xué)位①學(xué)位論文學(xué)位論文:是高等院校碩士(Ms.D)或博士(13布爾邏輯檢索技術(shù)ppt課件14布爾邏輯檢索技術(shù)ppt課件15②科技報(bào)告科技報(bào)告:研究機(jī)構(gòu)關(guān)于某項(xiàng)科研成果的正式報(bào)告,或者是對(duì)研究過程中階段進(jìn)展情況的實(shí)際記錄。國(guó)防與航空航天方面居多。
特征:報(bào)告號(hào)
②科技報(bào)告科技報(bào)告:研究機(jī)構(gòu)關(guān)于某項(xiàng)科研成果的正式報(bào)告16例如:NASA20050082846(美國(guó)宇航局科技報(bào)告)ADA207606(美國(guó)國(guó)防系統(tǒng)研究報(bào)告)DE91011930(美國(guó)能源系統(tǒng)研究報(bào)告)PB90226341(美國(guó)民用系統(tǒng)研究報(bào)告)AGARDR775(北大西洋公約組織研究報(bào)告)HY93007(航空信息研究報(bào)告)例如:17
實(shí)例:
中國(guó)核科技報(bào)告
ChinaNuclearScienceandTechnologyReport主辦:《中國(guó)核科技報(bào)告》編輯部周期:
半年出版地:北京市語種:
中英開本:
16開
ISSN1671-7430CN11-9253/TL創(chuàng)刊年:1985
中國(guó)核科技報(bào)告
ChinaNuclear18③會(huì)議論文會(huì)議文獻(xiàn):主要是學(xué)術(shù)會(huì)議上宣讀的論文或交流的書面論文,形式有單行本(會(huì)議預(yù)印本preprint)和會(huì)議論文集。特征為:會(huì)議名稱、時(shí)間、地點(diǎn)③會(huì)議論文會(huì)議文獻(xiàn):主要是學(xué)術(shù)會(huì)議上宣讀的論文或交流的19會(huì)議論文特點(diǎn):文獻(xiàn)論題集中,內(nèi)容新穎、豐富、專、深、學(xué)術(shù)性強(qiáng),能反映出一個(gè)國(guó)家、一個(gè)地區(qū)或國(guó)際上當(dāng)前某一科學(xué)技術(shù)領(lǐng)域的最新成就、最高水平和發(fā)展趨勢(shì)。
實(shí)例會(huì)議論文特點(diǎn):文獻(xiàn)論題集中,內(nèi)容新穎、豐富、專、深、學(xué)術(shù)性強(qiáng)20④專利
專利:發(fā)明人申請(qǐng)專利時(shí)呈交的申請(qǐng)說明書。一般包括:發(fā)明人、發(fā)明的詳細(xì)說明、專利權(quán)范圍、插圖等。特征:專利號(hào)④專利21實(shí)例:輸液自動(dòng)呼叫器
福建省大田星??萍奸_發(fā)有限公司程開海1、輸液過程中瓶?jī)?nèi)藥液將要滴盡時(shí)能提前自動(dòng)發(fā)出聲響信號(hào),提醒護(hù)理人員注意;2、旋動(dòng)呼叫器上的旋鈕可直接選擇用于各種規(guī)格容量藥瓶(袋)輸液終了的自動(dòng)呼叫;3、自動(dòng)呼叫后病人躺在床上可直接拉動(dòng)拉線控制停呼。實(shí)例:輸液自動(dòng)呼叫器22⑤政府出版物政府出版物:這是各國(guó)政府部門及其設(shè)立的專門機(jī)構(gòu)發(fā)表、出版的文件,分為行政性文件(如法令.統(tǒng)計(jì)等)和科技文獻(xiàn)(30%~40%)。⑤政府出版物政府出版物:這是各國(guó)政府部門及其設(shè)立的專門23⑥標(biāo)準(zhǔn)標(biāo)準(zhǔn):主要是對(duì)工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格及其檢驗(yàn)方法等方面所作的技術(shù)規(guī)定,是從事生產(chǎn)、建設(shè)的一種共同技術(shù)依據(jù)。特征為:標(biāo)準(zhǔn)號(hào)⑥標(biāo)準(zhǔn)標(biāo)準(zhǔn):主要是對(duì)工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格及24⑦產(chǎn)品資料產(chǎn)品資料:產(chǎn)品資料是制造廠商為了推銷產(chǎn)品而發(fā)出的,以介紹產(chǎn)品性能為主的出版物。⑦產(chǎn)品資料產(chǎn)品資料:產(chǎn)品資料是制造廠商為了推銷產(chǎn)品而發(fā)25實(shí)例:實(shí)例:26⑧科技檔案科技檔案:科技檔案是科學(xué)技術(shù)研究和生產(chǎn)建設(shè)部門,在科學(xué)技術(shù)研究和生產(chǎn)建設(shè)活動(dòng)中形成的,有具體工程對(duì)象的技術(shù)文件、圖樣、圖表、圖片、原始記錄的原本或代替原本的復(fù)制本等⑧科技檔案科技檔案:科技檔案是科學(xué)技術(shù)研究和生產(chǎn)建設(shè)部門,在27282.認(rèn)識(shí)不同內(nèi)容層次的文獻(xiàn)一次文獻(xiàn)零次文獻(xiàn)二次文獻(xiàn)三次文獻(xiàn)文獻(xiàn)整理知識(shí)重組知識(shí)濃縮282.認(rèn)識(shí)不同內(nèi)容層次的文獻(xiàn)一次文獻(xiàn)零次文獻(xiàn)二次文獻(xiàn)三次文28(1)零次文獻(xiàn)(ZeroDocument)
零次文獻(xiàn)指未經(jīng)正式發(fā)表或未進(jìn)入學(xué)術(shù)交流的最原始的文獻(xiàn)。(2)一次文獻(xiàn)(PrimaryDocument):是指作者以其本人的研究成果(如實(shí)驗(yàn)、觀察、調(diào)查研究等的結(jié)果)為基本素材寫成的原始創(chuàng)作,如專著、期刊論文、科技報(bào)告、學(xué)位論文等。(1)零次文獻(xiàn)(ZeroDocument)29(3)二次文獻(xiàn)(SecondaryDocument):是將大量無序、分散的一次文獻(xiàn)收集、整理、加工、著錄其特征,如著者、篇名、分類、主題、出處等,并按一定的順序加以編排,形成供讀者檢索所需一次文獻(xiàn)線索的新的文獻(xiàn)形式,如索引、文摘、目錄以及其相應(yīng)的數(shù)據(jù)庫等。因其具有的檢索功能而稱之為檢索工具或檢索系統(tǒng)。(3)二次文獻(xiàn)(SecondaryDocument):是將30(4)三次文獻(xiàn)(TertiaryDocument):是科技人員圍繞某一專題,借助于二次文獻(xiàn),在充分研究與利用大量一次文獻(xiàn)的基礎(chǔ)上,經(jīng)過閱讀、分析、歸納、概括,撰寫而成的新的文獻(xiàn)。表現(xiàn)形式主要有:綜述(Review)、述評(píng)(Comment)、進(jìn)展(Progress、Advance)、現(xiàn)狀(Update)、發(fā)展趨勢(shì)(Trend)等期刊文獻(xiàn)和百科全書、年鑒、手冊(cè)等參考工具書。(4)三次文獻(xiàn)(TertiaryDocument):是科技31文獻(xiàn)級(jí)別舉例一次文獻(xiàn)
二次文獻(xiàn)文獻(xiàn)級(jí)別舉例32文獻(xiàn)級(jí)別舉例三次文獻(xiàn)零次文獻(xiàn)文獻(xiàn)級(jí)別舉例33
科技文獻(xiàn)層次結(jié)構(gòu)知識(shí)產(chǎn)生
記錄原始文獻(xiàn)知識(shí)重組
知識(shí)濃縮詞典名錄指南手冊(cè)年鑒書目等述評(píng)專著教科書論文叢集百科全書等三次文獻(xiàn)
期刊論文會(huì)議論文科技報(bào)告學(xué)位論文專利說明書文獻(xiàn)整理目錄
索引文摘新書通報(bào)等二次文獻(xiàn)一次文獻(xiàn)零次文獻(xiàn) 科技文獻(xiàn)層次結(jié)構(gòu)知識(shí)產(chǎn)生記錄原始文獻(xiàn)知識(shí)重組34
研究活動(dòng)(實(shí)驗(yàn)、觀察、思考)
信息的直接記錄或傳遞
零次文獻(xiàn)(創(chuàng)造知識(shí)的素材)
將知識(shí)以文字等形式固化
一次文獻(xiàn)(初始的知識(shí)產(chǎn)品)
將分散的文獻(xiàn)序列化
二次文獻(xiàn)(一次文獻(xiàn)的替代品)將知識(shí)重新組合,使知識(shí)序列化
三次文獻(xiàn)(濃縮的新的信息產(chǎn)品)研究活動(dòng)(實(shí)驗(yàn)、觀察、思考)信息的直353.認(rèn)識(shí)不同載體的文獻(xiàn)
印刷型文獻(xiàn):紙質(zhì)電子型文獻(xiàn):
縮微型文獻(xiàn)聲像型文獻(xiàn)機(jī)讀型文獻(xiàn)(電子文獻(xiàn))多媒體型文獻(xiàn)3.認(rèn)識(shí)不同載體的文獻(xiàn)36四、文獻(xiàn)信息的特點(diǎn)1.數(shù)量龐大,增長(zhǎng)迅速2.文種繁多,但呈明顯的英文化趨勢(shì)3.內(nèi)容交叉重復(fù)4.文獻(xiàn)形式呈現(xiàn)多樣化5.文獻(xiàn)分布既集中又分散,但呈專題化或?qū)<厔?shì)6.知識(shí)老化加快,文獻(xiàn)壽命(半衰期)縮短7.交流傳播及變化速度加快四、文獻(xiàn)信息的特點(diǎn)1.數(shù)量龐大,增長(zhǎng)迅速37五、文獻(xiàn)信息的社會(huì)功能1.科技文獻(xiàn)是科學(xué)表現(xiàn)的存在形式,是匯集人類財(cái)富的主要場(chǎng)所。2.科技文獻(xiàn)是衡量科學(xué)技術(shù)水平的重要依據(jù)。3.科技文獻(xiàn)是傳播科學(xué)知識(shí)的最基本、最主要的手段4.科技文獻(xiàn)是確認(rèn)科學(xué)發(fā)現(xiàn)與技術(shù)發(fā)明優(yōu)先權(quán)的認(rèn)證記錄。五、文獻(xiàn)信息的社會(huì)功能1.科技文獻(xiàn)是科學(xué)表現(xiàn)的存在形式,是匯38六、檢索基本原理經(jīng)選擇的信息主題分析標(biāo)引語言表達(dá)文獻(xiàn)特征標(biāo)識(shí)經(jīng)確立的課題主題分析檢索語言表達(dá)文獻(xiàn)需求標(biāo)識(shí)信息集合詞表存儲(chǔ)檢索檢索結(jié)果什么樣的文獻(xiàn)信息能夠得以輸出呢?匹配檢索時(shí)匹配的究竟是什么?六、檢索基本原理經(jīng)選擇的信息主題分析標(biāo)引語言表達(dá)文獻(xiàn)特征標(biāo)識(shí)39第二節(jié) 文獻(xiàn)信息檢索系統(tǒng)一、文獻(xiàn)信息檢索系統(tǒng)的構(gòu)成二、數(shù)據(jù)庫的結(jié)構(gòu)三、文獻(xiàn)信息檢索系統(tǒng)的分類四、文獻(xiàn)信息檢索系統(tǒng)的功能第二節(jié) 文獻(xiàn)信息檢索系統(tǒng)一、文獻(xiàn)信息檢索系統(tǒng)的構(gòu)成40一、文獻(xiàn)信息檢索系統(tǒng)的構(gòu)成1.信息資源2.硬件設(shè)備3.軟件條件4.人力資源上述四方面內(nèi)容構(gòu)成了文獻(xiàn)信息檢索系統(tǒng)的空間結(jié)構(gòu),是系統(tǒng)運(yùn)行的最基本前提。一、文獻(xiàn)信息檢索系統(tǒng)的構(gòu)成1.信息資源4142二、類型手工檢索檢索手段計(jì)算機(jī)檢聯(lián)機(jī)檢索光盤檢索網(wǎng)絡(luò)檢索42二、類型檢索手段4243二、類型文本信息檢索數(shù)據(jù)格式和檢索技術(shù)多媒體信息檢索超媒體和超文本檢索43二、類型文本信息檢索數(shù)據(jù)格式和檢索技術(shù)多媒體信息檢索超媒43三、數(shù)據(jù)庫的結(jié)構(gòu)(一)從數(shù)據(jù)庫組成的層次來劃分1.文檔(File)2.記錄(Record)3.字段(Field)(二)從數(shù)據(jù)庫組成的方式來劃分1.順排文檔2.倒排文檔三、數(shù)據(jù)庫的結(jié)構(gòu)(一)從數(shù)據(jù)庫組成的層次來劃分44字段1字段2字段3記錄1記錄2記錄3文檔1文檔2文檔3數(shù)據(jù)庫數(shù)據(jù)庫結(jié)構(gòu)字段1字段2字段3記錄1記錄2記錄3文檔1文檔2文檔3數(shù)據(jù)庫45上述數(shù)據(jù)庫的結(jié)構(gòu),可用英文單詞的單復(fù)數(shù)形式更直觀地表述為:
Record
Fields(記錄)
Database
Flies(數(shù)據(jù)庫)
File
Records(文檔)
Field
searchingentry(字段)(檢索入口上述數(shù)據(jù)庫的結(jié)構(gòu),可用英文單詞的單復(fù)數(shù)形式更直觀地表述為:46主文檔序號(hào):N5序號(hào):N4序號(hào):N3序號(hào):N2序號(hào):N1主題詞:S1著者:Au1標(biāo)題:t1……S1:N1,N3S2:N2,N3S3:N1,N4……Au1:N1,N4Au2:N3Au3:N4……主題詞倒排檔著者倒排檔……主題詞檢索途徑著者檢索途徑其它檢索途徑主文檔和倒排文檔的關(guān)系示意圖主文檔序號(hào):N5序號(hào):N4序號(hào):N3序號(hào):N2序號(hào):N1S147四、文獻(xiàn)信息檢索系統(tǒng)的分類1.書目型數(shù)據(jù)庫2.事實(shí)數(shù)值型數(shù)據(jù)庫3.全文型數(shù)據(jù)庫四、文獻(xiàn)信息檢索系統(tǒng)的分類1.書目型數(shù)據(jù)庫4849
書目型數(shù)據(jù)庫全文型數(shù)據(jù)庫事實(shí)型數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫類型文獻(xiàn)信息數(shù)據(jù)庫49書目型數(shù)據(jù)庫全文型數(shù)據(jù)庫事實(shí)型數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫類型文49書目型數(shù)據(jù)庫(bibliographicdatabase):是二次文獻(xiàn)數(shù)據(jù)庫,主要存貯相關(guān)主題領(lǐng)域的各類文獻(xiàn)資料的書目信息,包括機(jī)讀版的文摘、題錄、目錄、索引等。用戶可從大量文獻(xiàn)記錄中篩選出有參考價(jià)值的文獻(xiàn)源,并依據(jù)記錄提供的來源指示獲取一次文獻(xiàn)。舉例:中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫、PubMed(P84)、EMBASE(P93)等。1、書目型數(shù)據(jù)庫書目型數(shù)據(jù)庫(bibliographicdatabase)50布爾邏輯檢索技術(shù)ppt課件51全文型數(shù)據(jù)庫(Full-textDatabase):收錄有原始文獻(xiàn)全文的數(shù)據(jù)庫,以期刊論文、會(huì)議論文、政府出版物、研究報(bào)告、法律條文和案例、商業(yè)信息等為主。優(yōu)點(diǎn):能直接獲取文獻(xiàn)原文,集文獻(xiàn)檢索和全文提供于一體;提供全文字段檢索。舉例:中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(CNKI)、萬方數(shù)據(jù)資源的數(shù)字化期刊、OVID全文數(shù)據(jù)庫、ElsevierScience的SDOS等。2、全文型數(shù)據(jù)庫全文型數(shù)據(jù)庫(Full-textDatabase):收錄52布爾邏輯檢索技術(shù)ppt課件53布爾邏輯檢索技術(shù)ppt課件543、事實(shí)型數(shù)據(jù)庫事實(shí)型數(shù)據(jù)庫(FactDatabase):提供有關(guān)事物、人物、機(jī)構(gòu)等方面的事實(shí)性信息。舉例:ClinicalTrials(臨床試驗(yàn)數(shù)據(jù)庫)是通過對(duì)自愿接受試驗(yàn)患者的臨床研究,觀測(cè)藥物、診斷方法、疫苗和其他治療方法對(duì)某一種疾病或癥狀是否安全和有效。3、事實(shí)型數(shù)據(jù)庫事實(shí)型數(shù)據(jù)庫(FactDatabase):55布爾邏輯檢索技術(shù)ppt課件56數(shù)據(jù)型數(shù)據(jù)庫(NumericDatabase):提供數(shù)值性信息,包括各種統(tǒng)計(jì)數(shù)據(jù)、科學(xué)實(shí)驗(yàn)數(shù)據(jù)、各種測(cè)量數(shù)據(jù)等。舉例:WHOSIS:可以獲取以下統(tǒng)計(jì)數(shù)據(jù)和資料:疾病負(fù)擔(dān)統(tǒng)計(jì)、死亡原因統(tǒng)計(jì)、世界衛(wèi)生報(bào)告年度統(tǒng)計(jì)、衛(wèi)生從業(yè)人員統(tǒng)計(jì)、人口統(tǒng)計(jì)、HIV/AIDS信息與數(shù)據(jù)、精神病死亡率統(tǒng)計(jì)、免疫接種統(tǒng)計(jì)等統(tǒng)計(jì)數(shù)據(jù),以及疾病負(fù)擔(dān)計(jì)劃、國(guó)際疾病分類法及WHO術(shù)語信息系統(tǒng)、衛(wèi)生系統(tǒng)成就、全球酒精數(shù)據(jù)庫(GlobalAlcoholDatabase)等與衛(wèi)生和衛(wèi)生統(tǒng)計(jì)有關(guān)的資料。(P264)美國(guó)疾病控制與預(yù)防中心(CDC)的DataandStatistics等。(P266)4、數(shù)據(jù)型數(shù)據(jù)庫數(shù)據(jù)型數(shù)據(jù)庫(NumericDatabase):提供數(shù)值性57布爾邏輯檢索技術(shù)ppt課件58布爾邏輯檢索技術(shù)ppt課件59四、文獻(xiàn)信息檢索系統(tǒng)的功能1.匯集文獻(xiàn)信息2.組織文獻(xiàn)信息3.檢索文獻(xiàn)信息上述三者之間的關(guān)系如何?理解這個(gè)問題對(duì)于整個(gè)文獻(xiàn)檢索課學(xué)習(xí)的意義何在?四、文獻(xiàn)信息檢索系統(tǒng)的功能1.匯集文獻(xiàn)信息60思考題:1.信息、知識(shí)、情報(bào)三者的聯(lián)系與區(qū)別。2.分別用抽象文字與具體圖示表達(dá)上述三者關(guān)系的意義。3.文獻(xiàn)級(jí)別演化的本質(zhì)及意義。4.文獻(xiàn)信息綜合應(yīng)用中“綜合”二字的含義。5.科技圖書與科技期刊之與學(xué)術(shù)生涯。6.信息檢索系統(tǒng)中“系統(tǒng)”二字的含義。7.信息檢索系統(tǒng)構(gòu)成與信息檢索原理的關(guān)系。8.如何理解信息檢索系統(tǒng)的諸多功能。思考題:1.信息、知識(shí)、情報(bào)三者的聯(lián)系與區(qū)別。61第三節(jié)文獻(xiàn)信息檢索技術(shù)第三節(jié)文獻(xiàn)信息檢索技術(shù)62一、信息檢索技術(shù)概念廣義的包括信息組織、數(shù)據(jù)庫建設(shè)在內(nèi)的涉及信息科學(xué)、情報(bào)學(xué)、計(jì)算機(jī)科學(xué)等諸多學(xué)科領(lǐng)域的技術(shù)方法;狹義僅指從現(xiàn)有的信息資源中提取相關(guān)信息的技術(shù)方法。一、信息檢索技術(shù)概念63信息檢索技術(shù)發(fā)展階段手工檢索方式:包括紙質(zhì)文獻(xiàn)的檢索和縮微式檢索;脫機(jī)檢索方式:包括機(jī)讀磁帶、磁盤檢索、光盤數(shù)據(jù)庫檢索等;計(jì)算機(jī)聯(lián)機(jī)檢索方式;網(wǎng)絡(luò)化信息檢索方式:如:SCI、EI、SpringerLink數(shù)據(jù)庫、EBSCO數(shù)據(jù)庫等。信息檢索技術(shù)發(fā)展階段64布爾邏輯檢索技術(shù)最常用的方法;用戶的信息需求通過檢索提問式表達(dá);采用布爾代數(shù)中的邏輯符AND、OR和NOT作為邏輯組配算符;計(jì)算機(jī)根據(jù)表達(dá)式確定命中文獻(xiàn)的基本條件與查找途徑,同文檔中各篇文獻(xiàn)的標(biāo)識(shí)進(jìn)行匹配。凡符合條件的文獻(xiàn)即為命中文獻(xiàn),予以輸出。布爾邏輯檢索技術(shù)最常用的方法;65布爾邏輯檢索技術(shù)布爾運(yùn)算符AND、OR、NOT,分別表示邏輯與、邏輯或、邏輯非三種邏輯運(yùn)算關(guān)系,如圖1-3-1所示。
AandBAorBAnotB圖1-3-1布爾邏輯運(yùn)算示意圖
布爾邏輯檢索技術(shù)布爾運(yùn)算符AandB66布爾邏輯檢索技術(shù)名稱符號(hào)表達(dá)式功能邏輯與ANDAANDB同時(shí)含有提問詞A和B的文獻(xiàn),為命中文獻(xiàn)邏輯或ORAORB凡是含有提問詞A或B的文獻(xiàn),為命中文獻(xiàn)邏輯非NOTANOTB凡是含有提問詞A但不含有B的文獻(xiàn),為命中文獻(xiàn)布爾邏輯運(yùn)算一覽表布爾邏輯檢索技術(shù)名稱符號(hào)表達(dá)式功能邏輯與ANDAANDB67布爾邏輯檢索技術(shù)邏輯“與”,檢索表達(dá)式為“AandB”。數(shù)據(jù)庫中同時(shí)含有檢索同A和B的文獻(xiàn)為命中文獻(xiàn);作用是縮小檢索范圍,提高查準(zhǔn)率;例如,查找“胰島素治療糖尿病”的文獻(xiàn),檢索式為
insulin(胰島素)anddiabetes(糖尿病)。布爾邏輯檢索技術(shù)邏輯“與”,檢索表達(dá)式為“AandB”68布爾邏輯檢索技術(shù)邏輯“或”,檢索表達(dá)式為“AorB”。數(shù)據(jù)庫中的文獻(xiàn)中含有檢索詞A或B的文獻(xiàn)為命中文獻(xiàn);作用是擴(kuò)大檢索范圍;例如,查找“腫瘤”的文獻(xiàn),檢索式為cancer(癌)ortumor(瘤)orcarcinoma(癌)orneoplasm(新生物)。布爾邏輯檢索技術(shù)邏輯“或”,檢索表達(dá)式為“AorB”。69布爾邏輯檢索技術(shù)邏輯“非”,檢索表達(dá)式為“AnotB”。數(shù)據(jù)庫中凡含有檢索詞A而不含B的文獻(xiàn)為命中文獻(xiàn);作用是縮小檢索范圍,提高查準(zhǔn)率;例如,查“動(dòng)物的乙肝病毒(不要人的)”的文獻(xiàn),檢索式為
hepatitisBvirus(乙肝病毒)nothuman(人類)。布爾邏輯檢索技術(shù)邏輯“非”,檢索表達(dá)式為“AnotB”。70布爾邏輯檢索技術(shù)布爾邏輯運(yùn)算的優(yōu)先順序當(dāng)一個(gè)檢索表達(dá)式含有多個(gè)布爾算符時(shí),執(zhí)行的順序?yàn)閚ot優(yōu)先運(yùn)算,and其次,or最后??捎脠A括號(hào)改變運(yùn)算順序,將需要優(yōu)先運(yùn)算者置于圓括號(hào)中。例如,查找“維生素C或維生素E對(duì)糖尿病患者腎臟的保護(hù)作用”,檢索式為:(維生素Cor
維生素E)and糖尿病
and
腎。布爾邏輯檢索技術(shù)布爾邏輯運(yùn)算的優(yōu)先順序71截詞檢索截詞檢索,利用截?cái)嗟脑~的一個(gè)局部即截詞,進(jìn)行檢索的技術(shù);自動(dòng)地對(duì)同一概念檢索詞的不同詞尾變化、詞根相同等一類提問詞進(jìn)行檢索,并自動(dòng)用OR連接各詞的檢出結(jié)果,避免文獻(xiàn)的漏檢和逐詞鍵入的麻煩,提高查全率;常用的截詞符號(hào)有“*”、“
?”。截詞檢索截詞檢索,利用截?cái)嗟脑~的一個(gè)局部即截詞,進(jìn)行檢索的技72布爾邏輯檢索技術(shù)ppt課件73截詞檢索分類按是否采用截詞符號(hào)分為,采用截詞符號(hào)、不用截詞符號(hào);按截?cái)辔恢玫牟煌譃椋医卦~、左截詞、中間截詞;按截?cái)嗟淖址麛?shù)量的不同分為,無限截詞、有限截詞。截詞檢索分類74鄰近檢索鄰近檢索(ProximitySearching)是用來表示檢索詞與檢索詞之間位置關(guān)系的檢索技術(shù),通常用位置算符來實(shí)現(xiàn);采用的位置算符有near,with。“near”,表示檢索詞位置相鄰,檢索詞出現(xiàn)的順序可前可后,如geneNEARapoptosis;“with”,表示檢索詞位置相鄰,且兩詞出現(xiàn)的順序與輸入順序一致,如liverWITHcancer。鄰近檢索鄰近檢索(ProximitySearching)是75限定檢索限定檢索(limitSearching)又稱限定字段檢索(limitFieldSearching),是利用檢索詞出現(xiàn)的字段進(jìn)行的檢索;用戶可以指定檢索某一字段或某幾個(gè)字段以使檢索結(jié)果更為準(zhǔn)確,減少誤檢;檢索系統(tǒng)的限定檢索會(huì)采用縮寫形式的字段標(biāo)識(shí)符;如TI表示Title,AD表示Address。限定檢索限定檢索(limitSearching)又稱限定字76布爾邏輯檢索技術(shù)ppt課件77擴(kuò)展檢索擴(kuò)展檢索(ExpandSearching)是同時(shí)對(duì)多個(gè)相關(guān)檢索詞執(zhí)行邏輯或檢索的技術(shù);即當(dāng)用戶輸入一個(gè)檢索詞后,系統(tǒng)不僅能檢出該檢索詞的文獻(xiàn),還能檢出與該檢索詞同屬于一個(gè)概念的同義詞或下位詞的文獻(xiàn),如PubMed中主題詞的擴(kuò)展檢索。擴(kuò)展檢索擴(kuò)展檢索(ExpandSearching)是同時(shí)對(duì)78加權(quán)檢索加權(quán)檢索(weighingsearching)不僅檢索提問詞是否存在,而且計(jì)算提問詞的權(quán)值,當(dāng)權(quán)值之和超過閾值的記錄才能在數(shù)據(jù)庫中被檢出來。在某些數(shù)據(jù)庫中表現(xiàn)為僅檢索主要概念主題詞,如MEDLINE;而有些數(shù)據(jù)庫表現(xiàn)為詞頻檢索,如中國(guó)學(xué)術(shù)期刊全文數(shù)據(jù)庫。加權(quán)檢索加權(quán)檢索(weighingsearching)不僅79精確檢索和模糊檢索精確檢索(ExactSearching)是指所檢信息與輸入的詞組完全一致的匹配檢索技術(shù);在許多系統(tǒng)中用引號(hào)來表示,如檢索“AcutePancreatitis”;模糊檢索(FuzzySearching)允許所檢信息與檢索提問之間存在一定的差異。如檢索AcutePancreatitis,可檢索出AcutenecrotizingPancreatitis、AcutegallstonePancreatitis等。精確檢索和模糊檢索精確檢索(ExactSearching)80跨庫檢索跨庫檢索(Crossdatabasesearching、One-stopsearching)是一次對(duì)多個(gè)數(shù)據(jù)庫同時(shí)進(jìn)行檢索的技術(shù)??鐜鞕z索能為用戶提供統(tǒng)一的檢索接口,將用戶檢索需求轉(zhuǎn)化為不同數(shù)據(jù)庫的檢索表達(dá)式,并發(fā)地檢索本地和廣域網(wǎng)上的多個(gè)分布式異構(gòu)數(shù)據(jù)庫,并對(duì)檢索結(jié)果加以整合,以統(tǒng)一的格式將結(jié)果呈現(xiàn)給用戶??鐜鞕z索跨庫檢索(Crossdatabasesearch81跨庫檢索跨庫檢索82相關(guān)信息反饋檢索相關(guān)信息反饋檢索,是將與已檢結(jié)果存在某種程度相關(guān)的信息檢索出來的檢索技術(shù),多由檢索系統(tǒng)自動(dòng)進(jìn)行檢索。如Google()的“類似網(wǎng)頁”、PubMed的“RelatedArticles”。相關(guān)信息反饋檢索相關(guān)信息反饋檢索,是將與已檢結(jié)果存在某種程度83相關(guān)信息反饋檢索相關(guān)信息反饋檢索84布爾邏輯檢索技術(shù)ppt課件85智能檢索自動(dòng)實(shí)現(xiàn)檢索詞、檢索詞對(duì)應(yīng)主題詞及該主題詞所含下位詞的同步檢索。如中國(guó)生物醫(yī)學(xué)文獻(xiàn)服務(wù)系統(tǒng)(SinoMed)的智能檢索。PubMed的“自動(dòng)詞語匹配檢索”屬于智能檢索。智能檢索自動(dòng)實(shí)現(xiàn)檢索詞、檢索詞對(duì)應(yīng)主題詞及該主題詞所含下位詞86二、多媒體信息檢索技術(shù)基于內(nèi)容的檢索基于內(nèi)容的檢索(ContentBasedRetrieval,CBR),主要是對(duì)多媒體對(duì)象的語義、媒體的視覺特征或聽覺特征進(jìn)行檢索?;趦?nèi)容的圖像檢索基于內(nèi)容的圖像檢索(ContentBasedImageRetrieval,CBIR)使用了可以直接從圖像中獲得的客觀的視覺內(nèi)容特征,如顏色、紋理、形狀等來判斷圖像之間的相似性。二、多媒體信息檢索技術(shù)基于內(nèi)容的檢索87基于內(nèi)容的圖像檢索現(xiàn)有圖像檢索技術(shù)研究的主流。與傳統(tǒng)數(shù)據(jù)庫技術(shù)相結(jié)合,可以方便地實(shí)現(xiàn)海量多媒體數(shù)據(jù)的存儲(chǔ)和管理;與傳統(tǒng)Web搜索引擎技術(shù)相結(jié)合,可以用來檢索html網(wǎng)頁中豐富的多媒體信息;還可以廣泛應(yīng)用在多媒體數(shù)據(jù)庫、知識(shí)產(chǎn)權(quán)保護(hù)、數(shù)字圖書館、網(wǎng)絡(luò)多媒體搜索引擎、交互電視、藝術(shù)收藏和博物館管理、遙感和地球資源管理等許多領(lǐng)域中?;趦?nèi)容的圖像檢索現(xiàn)有圖像檢索技術(shù)研究的主流。88三、可視化信息檢索技術(shù)信息可視化(Informationvisualization)是將抽象數(shù)據(jù)用可視的形式表示出來,以利于分析數(shù)據(jù)、發(fā)現(xiàn)規(guī)律和決策制定。可實(shí)現(xiàn)對(duì)信息數(shù)據(jù)的分析和提取,以圖形、圖像、虛擬現(xiàn)實(shí)等易為人們所認(rèn)識(shí)、可視的方式,展示數(shù)據(jù)間的復(fù)雜關(guān)系、潛在信息和發(fā)展趨勢(shì),以便更好地掌握和利用信息資源。三、可視化信息檢索技術(shù)信息可視化(Information89可視化檢索可視化檢索(VisualRetrieval)是信息可視化的一種。是指把文獻(xiàn)信息、用戶提問、各類情報(bào)檢索模型以及利用檢索模型進(jìn)行信息檢索的過程中不可見的內(nèi)部語義關(guān)系轉(zhuǎn)換成圖形,在一個(gè)二維或三維的可視化空間中顯示出來??梢暬瘷z索可視化檢索(VisualRetrieval)是信90可視化檢索的特點(diǎn)檢索過程透明化檢索結(jié)果輸出高效性更為有效的檢索結(jié)果排序機(jī)制有效的用戶反饋機(jī)制可視化檢索的特點(diǎn)檢索過程透明化91第一章
文獻(xiàn)信息檢索基礎(chǔ)第四節(jié)文獻(xiàn)信息檢索策略第一章文獻(xiàn)信息檢索基礎(chǔ)第四節(jié)文獻(xiàn)信息檢索策略92一、文獻(xiàn)信息檢索途徑檢索途徑為檢索系統(tǒng)的檢索入口,即檢索系統(tǒng)所提供的、用以查詢獲取資源的各種標(biāo)識(shí),在計(jì)算機(jī)檢索系統(tǒng)中通常表現(xiàn)為字段檢索。一、文獻(xiàn)信息檢索途徑檢索途徑為檢索系統(tǒng)的檢索入口,即檢索系93主題詞檢索主題詞檢索途徑,是利用主題詞(SubjectHeadings)作為檢索入口來查找文獻(xiàn);主題詞是經(jīng)過優(yōu)選和規(guī)范化處理的詞匯,由主題詞表來控制;目前支持主題詞途徑的檢索系統(tǒng)主要有,CBMDisc和PubMed。主題詞檢索主題詞檢索途徑,是利用主題詞(SubjectHe94自由詞檢索通過從文獻(xiàn)篇名、正文或文摘中抽取出來的能表達(dá)文獻(xiàn)主要內(nèi)容的單詞或詞組查找文獻(xiàn)的檢索途徑。自由詞途徑,靈活、自由、直觀、符合用戶習(xí)慣,為目前檢索系統(tǒng)中應(yīng)用最為廣泛的一種檢索途徑;但自由詞因未經(jīng)規(guī)范化處理,檢索時(shí)必須同時(shí)考慮到與檢索詞相關(guān)的同義詞、近義詞等,容易造成漏檢。自由詞檢索通過從文獻(xiàn)篇名、正文或文摘中抽取出來的能表達(dá)文獻(xiàn)95分類檢索分類檢索途徑是利用文獻(xiàn)在分類體系中的位置(類目名稱或分類號(hào))作為檢索入口查找文獻(xiàn)的途徑,可滿足用戶從學(xué)科、專業(yè)等內(nèi)容出發(fā)獲取文獻(xiàn)的需要。例如,CBMDisc提供的分類途徑,即以文獻(xiàn)在《中國(guó)圖書館分類法》中的分類號(hào)作為檢索入口來查找文獻(xiàn)。分類檢索分類檢索途徑是利用文獻(xiàn)在分類體系中的位置(類目名稱或96引文檢索引文檢索途徑,是利用引文(citation,即文章末尾所附參考文獻(xiàn))這一特征作為檢索入口查找文獻(xiàn)的途徑;許多檢索工具提供的引文檢索途徑允許以引文中出現(xiàn)的任何信息(如作者、題名、出處)等作為檢索入口。如WebofScience的CitedReferenceSearch(引文檢索)。引文檢索引文檢索途徑,是利用引文(citation,即文章末97缺省檢索缺省檢索是指自動(dòng)在脊索系統(tǒng)預(yù)先設(shè)定的多個(gè)字段中同時(shí)進(jìn)行檢索。例如,在CBMDisc的基本檢索界面直接輸入檢索詞,系統(tǒng)默認(rèn)在缺省字段中進(jìn)行檢索即同時(shí)在中文題名、關(guān)鍵詞、主題詞、文摘、刊名、特征詞等字段進(jìn)行檢索。缺省檢索缺省檢索是指自動(dòng)在脊索系統(tǒng)預(yù)先設(shè)定的多個(gè)字段中同時(shí)進(jìn)98其它途徑著者檢索利用文獻(xiàn)上署名的作者、編者或機(jī)關(guān)團(tuán)體名稱作為檢索入口查找文獻(xiàn)的途徑。題名檢索利用題名(Title,如書名、刊名、篇名等)作為檢索入口查找文獻(xiàn)的途徑。序號(hào)檢索機(jī)構(gòu)檢索其它途徑著者檢索99二、文獻(xiàn)信息檢索策略檢索策略的含義廣義的檢索策略是指用戶根據(jù)檢索需求選擇相應(yīng)的數(shù)據(jù)庫、確定檢索方式、檢索途徑及相應(yīng)檢索表達(dá)式進(jìn)行檢索的一系列操作或方案,是用戶檢索目標(biāo)的體現(xiàn);狹義的檢索策略僅指用戶確定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)不沾油普通臺(tái)式爐數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年春蘇教版生物八年級(jí)下冊(cè)教學(xué)課件 第22章 第2節(jié) 人的性狀和遺傳
- 化纖紗線企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 傳染病防控藥物支持行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 熱敏紙?jiān)埡驮埌迤髽I(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 木質(zhì)普通家具企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 合成纖維毛條企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 鉻鹽企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 化學(xué)制藥原料供應(yīng)鏈行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 布絨玩具企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 第三講:虹吸管及水泵的水力計(jì)算
- 網(wǎng)絡(luò)系統(tǒng)集成(第二版) 課件第一章 網(wǎng)絡(luò)系統(tǒng)集成緒論
- 真菌性角膜炎的護(hù)理
- 單肺通氣與肺保護(hù)通氣策略護(hù)理課件
- 科普作家協(xié)會(huì)會(huì)員
- 《鋼鐵是怎樣煉成的》選擇題100題(含答案)
- 垃圾中轉(zhuǎn)站報(bào)告
- 新型顯示行業(yè)Mini LED Micro LED Micro OLED多點(diǎn)開花產(chǎn)業(yè)鏈如何聚焦
- 市政工程試驗(yàn)檢測(cè)培訓(xùn)教程
- 高中英語定語從句之哪吒-Attributive Clause 課件
- 《房地產(chǎn)行政管理》課件
評(píng)論
0/150
提交評(píng)論