




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、醫(yī)學文獻信息檢索概論例子1:20世紀70年代,美國核專家泰勒收到一份題為制造核彈的方法的報告,他被報告精湛的技術設計所吸引,驚嘆地說:“至今我看到的報告中,它是最詳細、最全面的一份?!钡顾鼮轶@異的是,這份報告竟出于哈佛大學經濟專業(yè)的青年學生之手,而這個四百多頁的技術報告的全部信息來源又都是從圖書館那些極為平常的、完全公開的圖書資料中所獲得的。例子2:美國在實施“阿波羅登月計劃”中,對阿波羅飛船的燃料箱進行壓力實驗時,發(fā)現甲醇會引起鈦應力腐蝕,為此付出了數百萬美元來研究解決這一問題。事后查明,早在十多年前,就有人研究出來了,方法非常簡單,只需在甲醇中加入2%的水即可,檢索這篇文獻的時間是10
2、多分鐘。 信息檢索在科研活動中所占的比例1 信息概述2 信息組織與檢索原理3 圖書館的利用醫(yī)學文獻信息檢索概論1 信息的概述 1.1 信息的概念1.2 信息的特征1.3 信息的類型1.4 信息與知識、文獻的關系國家標準情報與文獻工作詞匯基本術語(GB/T4894-2009):信息是物質存在的一種方式、形態(tài)或運動狀態(tài),是事物的一種普遍屬性,一般指數據、消息中包含的意義,可以使消息中所描述事件的不確定性減少。1.1 信息的概念 (1)客觀性:信息客觀存在,不以人的意志轉移,并與物質、能量共同構成事物的三個基本方面。(2)依附性:信息只有被各種符號系統(tǒng)組織成不同形式的符號序列,并最終依附于一定的載體
3、上才能被識別、存儲、傳遞、顯示和利用。(3)可知性:信息作為客觀事物的反映,能夠通過人的感覺被接受和識別,信息是人類認識世界的基礎與前提。1.2 信息的特征 (4)傳遞性:又稱共享性,經人類感知(捕抓、獲?。┑男畔???梢酝ㄟ^各種方式,借助各種載體或媒介廣泛傳遞,為更多的人所接收和利用(5)可再生性:信息永遠都在產生、更新、演變,是取之不盡、用之不竭的智慧源泉,是人類社會與自然界不可或缺的可再生資源。(6)時效性:信息的含義與價值隨著時間遷移發(fā)生變化,這就要求人們在獲取、交流信息的過程中必須盡量加快速度,以便及時加以利用。1.2 信息的特征 信息是多種多樣的,多方面、多層次的,信息的類型可以從不
4、同的角度進行劃分,這里的信息類型主要指文獻信息的類型:(1) 按載體形式(2) 按出版形式 (3) 按信息揭示深度1.3 信息的類型(1)印刷型文獻:紙張為載體(2)縮微型文獻:感光材料為載體,利用光學記錄技術而形成的文獻類型。如縮微膠卷、縮微平片。(3)視聽型文獻 :又稱直感資料、聲像資料,它包括唱片、錄音帶、科技電影、幻燈片等。這種文獻直接記載聲音和圖像。(4)數字型文獻:以數字信號的方式將圖、文、聲、像等信息存儲到磁、光、電等介質上。1.3.1 按載體形式(1)圖書(2)期刊(3)年鑒(4)會議論文(5)學位論文(6)科技報告(7)專利文獻(8)政府出版物 1.3.1 按出版形式(1)一
5、次文獻(2)二次文獻(3)三次文獻(4)零次文獻 一次文獻是檢索對象,二次文獻是檢索工具,三次文獻是一次、二次文獻的濃縮與延伸。1.3.1 按信息揭示深度知識:是人們在認識與改造客觀世界的實踐中所獲得的認識與經驗的總和,是人類通過對信息的感知、獲取、選擇、處理等一系列思維過程,形成對客觀事物的本質和規(guī)律認識。分為隱性知識和顯性知識。1.4 信息與知識、文獻的關系 文獻:國家標準文獻著錄規(guī)則中對文獻的定義為:“記錄有知識的一切載體?!比祟惙e累創(chuàng)造的知識,用文字、圖形、符號、音頻、視頻等手段記錄保存下來,并用于交流傳播的一切物質形態(tài)的載體,都稱為文獻。1.4 信息與知識、文獻的關系信息、知識、文獻
6、的形成關系: 產生 大腦加工 記錄 事物 信息 知識 文獻1.4 信息與知識、文獻的關系信息、知識、文獻的相容關系:1.4 信息與知識、文獻的關系 2.1 信息組織2.2 信息檢索2 信息組織與檢索 信息組織是根據信息資源的特點和利用的需要,按照一定的科學方法和標準規(guī)范,對信息的外在特征和內在特征進行分析、提煉和揭示,將散亂無序的信息資源組織成有序的系統(tǒng)過程。 主要有:分類組織法和主題組織法2 .1 信息組織分類組織法 依據信息分類工具,將內容屬性或其他特征相同的信息歸在一起,區(qū)分出內容屬性與它不同的信息,根據相互關系組成一個系統(tǒng)。 國內外比較著名的分類法有杜威十進分類法、國際十進分類法、國會
7、圖書館分類法、中國圖書館分類法2.1 信息組織 中國圖書館分類法(Chinese Library Classification,簡稱中圖法) 將知識門類分為5大部類,22個基本大類,其中R類為醫(yī)藥、衛(wèi)生類,下設17個基本類目。 中圖法標記符號由拉丁字母和阿拉伯數字組成,我國圖書館一般采用中圖法來組織圖書文獻,圖書館圖書書脊上都貼著書標,書標上顯示是索書號,索書號由分類號和其他特征標識組成,圖書館的圖書按照索書號順序排列,位置固定,方便人們索取利用。2.1 信息組織 中國法5大部類:馬克思主義、列寧主義、毛澤東思想、鄧小平理論 哲學、宗教 社會科學 自然科學 綜合性圖書 2.1 信息組織 中國圖
8、書館分類法 22個基本大類 中圖法共分22大類,即社會科學包括九個學科,自然科學包括十個學科,再加上馬列、哲學和綜合性圖書。( 26個英文字母除去L、M、W、Y)2 .1 信息組織 基本大類(22個)A 馬克思主義、列寧主義、 毛澤東思想、鄧小平理論B 哲學、宗教 C 社會科學總論D 政治、法律E 軍事 F 經濟 G 文化、科學、教育、體育 H 語言、文字 I 文學J 藝術K 歷史、地理N 自然科學總論O 數理科學和化學P 天文學、地球科學Q 生物科學R 醫(yī)藥、衛(wèi)生S 農業(yè)科學T 工業(yè)技術U 交通運輸V 航空、航天X 環(huán)境科學、安全科學Z 綜合性圖書back3.1 信息組織 R類為醫(yī)藥、衛(wèi)生類
9、,下設17個基本類目: R1 預防醫(yī)學、衛(wèi)生學 R2 中國醫(yī)學 R3 基礎醫(yī)學 R4 臨床醫(yī)學 R5 內科學 R6 外科學 R71 婦產科學 R72 兒科學 R73 腫瘤學 R74 神經病學與精神病學 R75 皮膚病學與性病學 R76 耳鼻咽喉科學 R77 眼科學 R78 口腔科學 R79 外國民族醫(yī)學 R8 特種醫(yī)學 R9 藥學2.1 信息組織 中國圖書館分類法以科學分類為基礎,結合信息的特點,采用邏輯分類的一般規(guī)則,從總到分,從上到下,從一般到個別,逐級進行概念的劃分和概括,是層層展開的概念等級體系。例如R 醫(yī)藥衛(wèi)生 【一級類目】R5 內科學 【二級類目】R53 寄生蟲病 【三級類目】R5
10、31 原蟲病 【四級類目】R531.1 阿米巴病 【五級類目】R531.11 腸阿米巴病 【六級類目】R531.12 腸外阿米巴病 【六級類目】3.1 信息組織 例: 孫建萍主編 人民衛(wèi)生出版社出版的老年護理學在我館的索書號(索取號或排架號)為: R473.59-43 151:3 2.1 信息組織 主題組織法: 以自然語言中的詞語或規(guī)范化的詞語作為揭示文獻主題的標識,并以此標識編排組織文獻的方法。包括關鍵詞法和主題詞法 2.1 信息組織 關鍵詞法:關鍵詞是指表達信息主體內容的,具有實質意義的關鍵性的語詞,是未經人工選擇和控制的自然語言。關鍵詞法是以關鍵詞作為檢索標識和查詢依據的組織法,為適應計
11、算機檢索需要而產生。關鍵詞多選自信息標題、文摘及正文,使用者不需接受專門培訓。 2 .1 信息組織 關鍵詞優(yōu)點:使用方便,不需要培訓,可以檢索到新近出現的科技名詞術語。關鍵詞缺點:(1)于自然語言存在大量的同義詞和近義詞,也就是多詞一義。采用關鍵詞組織信息,容易出現相同主題內容的信息分散在不同語詞之下。如evidence-based medicine,有翻譯成循證醫(yī)學、證據醫(yī)學、實證醫(yī)學,這一主題的文獻就有可能分散于不同的關鍵詞中。 自行車、單車、腳踏車(2)也有一詞多義的情況,不同意義內容集中同一關鍵詞下。杜鵑 一種花,也可以是一種鳥。 顯然,使用關鍵詞組織信息,信息將呈分散狀態(tài),檢索時難以
12、查全。也會降低查準率,查到與主題無關的內容,所以需要主題組織法。2 .1 信息組織 主題詞法:通過采用人工控制的規(guī)范化語言的語詞表達信息內容及概念,并按一定順序排列成一套標識系統(tǒng),采用這套系統(tǒng)組織信息即為主題組織法。這一套標識系統(tǒng)就是主題詞表。國外最具代表性的醫(yī)學主題詞表是醫(yī)學主題詞表2.1 信息組織 醫(yī)學主題詞表(Medical Subject Headings , 簡稱MeSH),由美國國立醫(yī)學圖書館于1960年編制出版。MeSH是對生物醫(yī)學文獻信息進行主題分析、標引和檢索時使用的權威性詞表。單一性和動態(tài)性是MeSH比較突出的特點,單一性指一個主題詞只表達一個概念,假若一個概念存在同義詞和
13、近義詞,則只選其中一個詞作為主題詞,避免同一概念的信息被分散在多個“主題詞”之下。動態(tài)性是指MeSH每年更新,進行內容修改、增補和調整,增加新術語,淘汰舊術語。2.1 信息組織 MeSH主要由主題詞字順表、樹狀結構表及副主題詞表組成。(1)醫(yī)學主題詞字順表:是MeSH主表,所有主題詞依字母順序排列,用于信息的標引和檢索。(2)樹狀結構表也稱范疇表,從學科分類角度將MeSH主題詞劃分為15大類,大類下再細分可達9級,反映主題詞概念之間的內在關系。(3)副主題詞表對主題詞做進一步限定,說明所描述的信息內容限于該主題的某個方面,故也稱限定詞。2 .1 信息組織 美國國立醫(yī)學圖書館(NLM)建立了在線
14、免費查找MeSH詞匯的工具,即醫(yī)學主題詞瀏覽器(/mesh/MBrowser.html),它收錄MeSH主題詞、化學物質名稱詞和款目詞,提供樹狀結構瀏覽、直接輸入詞或詞根等查詢方式,幫助用戶快速地通過網絡查找MeSH主題詞。 MeSH的應用范圍很廣,被國內外許多醫(yī)學專業(yè)圖書館及信息機構采用。2 .1 信息組織 信息檢索是指從文獻信息集合中查找、識別或獲取所需信息的過程。廣義上講,信息檢索包括信息的存儲和檢索兩個過程。2 .2 信息檢索 信息檢索工作原理2 .2 信息檢索 信息檢索的類型(1)書目信息檢索(2)全文信息檢索(3)數據信息檢索(4)事實信息檢索2.2 信息檢索 信息檢索的類型(1)
15、書目信息檢索 書目信息檢索的對象是以標題、作者、來源出處、摘要、專利號、館藏單位等為主,檢索的結果是一系列相關的書目信息線索而不是全文。目的是為了提供相關簡要信息及獲取全文信息的線索。如PubMed、中國生物醫(yī)學文摘數據庫等。2.2 信息檢索 信息檢索的類型(2)全文信息檢索 全文信息檢索一般是以論文、著作、報告或專利說明書等全文信息為檢索目的和對象,檢索的結果是一系列相關的論文或專利說明書的全文文本。2.2 信息檢索 信息檢索的類型(3)數據信息檢索 是以數值或數據為對象的檢索,檢索的結果是經過測試、評價過的各種數據,可直接用于分析和研究。如人體轉氨酶的正常值、計算公式、數據圖表、化學分子式
16、等。2.2 信息檢索 信息檢索的類型(4)事實信息檢索 事實信息檢索是以事項為檢索目的和對象,檢索的結果是有關某一事物的具體答案,如人物、機構、事件、疾病的診斷和治療、藥物的用法和不良反應等信息。2.2 信息檢索 信息檢索的途徑(1)分類途徑(2)主題途徑(3)自由詞途徑(4)題名途徑(5)著者途徑(6)引文途徑(7)機構途徑(8)序號途徑(9)其他途徑2.2 信息檢索 信息檢索的途徑(1)分類途徑 按學科分類體系來檢索文獻,通常選擇分類名或分類號作為檢索入口。 如中國生物醫(yī)學文獻數據庫提供的分類途徑,是基于中國圖書館分類法2.2 信息檢索 信息檢索的途徑(2)主題途徑 主題途徑是利用反映文獻
17、資料內容的主題詞來檢索文獻。主題詞是經過規(guī)范化處理的詞匯,其作用在于對同義詞、近義詞進行歸并,能保證詞語與概念一一對應,還能顯示概念之間的相互關系如等級關系和上下位關系等,因而有助于提高查全率和查準率。如PubMed、中國生物醫(yī)學文獻數據庫提供主題檢索途徑,是利用美國國立醫(yī)學圖書館編制的醫(yī)學主題詞表(Mesh)2.2 信息檢索 信息檢索的途徑(3)自由詞途徑 也就是關鍵詞途徑,是利用與該篇文獻主題相關的詞匯進行檢索,其結果是包含該詞的所有文獻。自由詞是檢索工具中所出現的任意詞匯,包括題名詞、關鍵詞、文摘詞和全文詞等具有實質意義的詞匯。2.2 信息檢索 信息檢索的途徑(4)題名途徑 利用書、刊、
18、雜志名稱進行查找文獻,是查找文獻最方便的途徑2.2 信息檢索 信息檢索的途徑(5)著者途徑 是利用文獻上署名的作者、編者或機關團體名稱作為檢索入口查找文獻。 在外文檢索工具中,通常采用姓的全稱在前,名的縮寫在后的形式進行檢索,如利用PubMed檢索吳建國發(fā)表的文獻時,需采用Wu JG進行檢索。 2.2 信息檢索 信息檢索的途徑(6)引文途徑 引文途徑是以文章末尾所附參考文獻為檢索入口查找文獻的途徑。通過引文檢索可以查找一篇文獻被后人引用的情況,評價該文的學術質量,同時也可以將主題上具有繼承和發(fā)展關系的文獻找出。2.2 信息檢索 信息檢索的途徑(7)機構途徑 以機構名稱作為檢索詞查找該機構作者發(fā)
19、表文獻的途徑。有些檢索系統(tǒng)中機構信息并入作者地址字段中。2.2 信息檢索 信息檢索的途徑(8)序號途徑 是利用文獻特有序號作為檢索入口查找文獻的途徑。文獻的序號主要有專利號、公開號、報告號、合同號、標準號、國際標準書號和刊號、化學物質登記號等。2.2 信息檢索 信息檢索的途徑(9)其他途徑 如文獻的類型、語種、出版年份、出版機構、化學分子式、化學結構等途徑。2.2 信息檢索 信息檢索技術(1)布爾邏輯檢索(2)截詞檢索(3)詞組檢索(4)鄰近檢索(5)字段檢索(6)擴展檢索(7)加權檢索(8)跨庫檢索2.2 信息檢索 信息檢索技術(1)布爾邏輯檢索:即運用布爾邏輯算符表示檢索詞之間邏輯運算關系
20、的檢索技術。常用的布爾邏輯算符有邏輯“與”、邏輯“或”、邏輯“非”。 2 .2 信息檢索 信息檢索技術(1)布爾邏輯檢索: “與” “AND” 或 “*” 算符 實現邏輯“與”組配 ,檢索時,命中信息同時含有兩個概念,專指性強。 如:medical AND information 2 .2 信息檢索 信息檢索技術(1)布爾邏輯檢索:“或” “OR” 或 “ +” 算符 實現邏輯“或”組配 檢索,命中信息包含所有關于邏輯A或邏輯B或同時有A和B的內容,檢索范圍比AND擴大。如:light rail OR subways 2.2 信息檢索 信息檢索技術(1)布爾邏輯檢索: “非” “NOT” 或
21、“” 算符 實現邏輯“非”組配 命中信息包含邏輯A但不包含邏輯B,排除了不需要的檢索詞。 如:fruit NOT apple 2.2 信息檢索 信息檢索技術(2)截詞檢索 截詞檢索是指將檢索詞在適當的地方截斷,是用檢索詞的一個局部進行的檢索,凡是滿足這個局部記錄,系統(tǒng)都命中。截詞檢索在外文數據庫中廣泛使用。 有利于 檢索詞的單復數形式, 同一詞英、美不同拼法, 詞根相同的詞 的檢索。 這樣既可減少檢索詞的輸入量,又可擴大查找范圍,提高查全率。 按截詞位置分: 有前截斷、后截斷、中截斷、復合截斷; 表示截詞的截斷符號有?、*、#、$等,各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標準。Embase中“?”為
22、有限截詞符,代表1個字符,“*”為無限截詞符,代表任意個字符。2.2 信息檢索 信息檢索技術(2)截詞檢索 后截斷 后截斷是在檢索詞的詞干后面加截詞符,查找詞干相同的所有詞。 從檢索性質上講,后截斷是“前方一致”的檢索。分為:非限制截斷 和 限制截斷 非限制截斷:是在檢索詞詞干后面加一個截詞符,表示不限制詞尾可變化的字符位數。 例: comput? 表示允許其后可帶有任何字符且數量不限,相當于查找compute、 computed、 computes、 computing、 computer、 computers、computerize、computerized、computation、 co
23、mputations、 computational、 computationally 等詞。 librar? 相當于Libraries,librarian,library 不宜將詞截得過短,否則容易造成誤檢。 限制截斷 :是在檢索詞詞干后面加若干個截詞符,表示限制可變化的字符數。 例:fib? 相當于查找 fiber 或 fibre educat? 相當于Educator,educated 2.2 信息檢索 信息檢索技術(2)截詞檢索 前截斷 前截斷是在檢索詞的詞干前面加截詞符,查找詞干相同的所有詞。從檢索性質上講,前截斷是“后方一致”的檢索。 檢索式“*magnetic”它能夠檢索出含有 m
24、agnetic electromagnetic paramagnetic thermomagnetic 等詞匯的結果。2.2 信息檢索 信息檢索技術(2)截詞檢索 中截斷 是把截斷符號置于一個檢索詞的中間,對詞中間出現變化的字符數加以限定。一般中截斷僅允許有限截斷。 例:organi#ation, 可檢索到包含organization和organisation的記錄。 一個?代表零個或任意個字符。 例: colo?r ,可檢索到包含 color、colour、colonizer、 colorimeter的記錄。 一個? 和數字,其中的數字代表可替換的字符數。 例:colo?1r, 只能檢索到包
25、含colour的記錄。2.2 信息檢索 信息檢索技術(2)截詞檢索 復合截斷 是指同時采用兩種以上的截斷方式, 例如 ?chemi? 可以檢出chemical chemist chemistry electrochemical physicochemical thermochemistry2.2 信息檢索 信息檢索技術(3)詞組檢索 也稱為短語檢索或字符串檢索,是指所檢信息與所輸入的詞組完全一致的匹配檢索技術,是提高檢索準確度的一種方法。在許多檢索系統(tǒng)中用引號來表示, 如檢索“medical retrieval”則只有包含與medical retrieval完全相同的詞串的文獻才能被檢索出來,
26、而medical information retrieval 、 medical book retrieval等文獻則不能檢索出來。2.2 信息檢索 信息檢索技術(4)鄰近檢索 鄰近檢索又稱位置檢索,是利用位置算符表示檢索詞與檢索詞之間位置關系的檢索技術。這種檢索技術通常只出現在外文數據庫中,是調整檢索策略的一種重要手段。 比較常見的運算符有WITH、NEAR,不同檢索系統(tǒng)中位置算符的規(guī)定有所不同。 2.2 信息檢索 信息檢索技術(4)鄰近檢索 wtih With縮寫為W (W)表示此算符兩邊的檢索詞詞序不能顛倒,兩個詞之間可有一個空格、或一個標點符號、或一個連接號;檢索“CD-ROM”,則可
27、用 CD(W)ROM (nW)則表示兩個檢索詞之間最多嵌入n個詞。例如, 而用price(2W)inflation , 則可能檢出price levels and inflation。 2.2 信息檢索 信息檢索技術(4)鄰近檢索 Near Near縮寫為N(N)表示此算符兩邊的檢索詞必須緊密相連,此間不允許插入其他單詞或字母,但詞序可以顛倒。(nN)算符則表示在兩個檢索詞之間最多可以插入n個單詞,且詞序可以顛倒。 2.2 信息檢索 信息檢索技術(5)字段限定檢索 是一種限定檢索詞出現在數據庫記錄指定字段的檢索技術。通常有兩種方式:一是采用字段限定符;二是限定檢索途徑為指定的字段。 PubMed中采用“檢索詞字段標識符”形式。常用的檢索字段有:題名、著者、主題詞、關鍵詞、引文、文摘等2.2 信息檢索 信息檢索技術(6)擴展檢索是一種擴大檢索范圍、提高查全率的技術,表現為一詞輸入、多詞命中,即當用戶輸入一個檢索詞后,系統(tǒng)不僅能夠檢出含有該檢索詞的文獻,還能檢出與該檢索詞同屬于一個概念的同義詞或下位詞的文獻。需要主題詞表或分類詞表的支持。如PubMed提供下位主題詞擴展
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 益陽玻璃鱗片膠泥施工方案
- 邵陽站施工方案
- 平涼電梯轎底裝修施工方案
- 孝感雙層活動房施工方案
- 地鐵罩棚加固施工方案
- 城鎮(zhèn)景觀綠化施工方案
- 丹東天溝施工方案
- 市政工程改裝施工方案
- 未修復的公路邊坡施工方案
- 更換辦公室玻璃施工方案
- 零售業(yè)的門店形象提升及店面管理方案設計
- 高速公路40m連續(xù)T梁預制、架設施工技術方案
- 《論教育》主要篇目課件
- 《勞動保障監(jiān)察條例》課件
- 外籍工作人員聘用合同范本
- 大學生就業(yè)指導教學-大學生就業(yè)形勢與政策
- 中華人民共和國學前教育法
- 2021年廣東省公務員錄用考試《行測》題(鄉(xiāng)鎮(zhèn)卷)【原卷版】
- 2020年全國中學生生物學競賽聯賽試題真題(含答案解析)
- 足浴技師與店內禁止黃賭毒協(xié)議書范文
- 鐵路專業(yè)基礎知識考試題及答案
評論
0/150
提交評論