第一章 信息檢索基礎_第1頁
第一章 信息檢索基礎_第2頁
第一章 信息檢索基礎_第3頁
第一章 信息檢索基礎_第4頁
第一章 信息檢索基礎_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

文獻檢索醫(yī)學信息學教研室錢旦敏主要知識點◆信息與文獻的定義及類型◆信息檢索的定義及類型◆信息檢索語言定義及類型◆信息檢索工具◆信息檢索方法◆信息檢索途經(jīng)◆信息檢索步驟◆信息檢索效果第一章信息檢索基礎

信息檢索(InformationRetrieval)手工檢索計算機檢索網(wǎng)絡化、智能化檢索第一節(jié)信息與文獻

一、什么是信息?信息這個詞最早出現(xiàn)于唐朝詩人李中的《春秋懷故人》,有這樣的詩句:“夢斷美人沉信息,目穿長路依樓臺”,其中的信息是消息、跡象的意思。

信息,是事物運動的狀態(tài)與方式的反映。

二、信息的類型1.文字信息2.圖像信息3.數(shù)值數(shù)據(jù)信息4.語音信息三、什么是文獻?

文獻,是指記錄有信息的一切載體,即采用文字、圖像、符號、聲頻、視頻、編碼等方法記錄人類信息的各種載體,它們具有傳遞信息的功能。這個定義有四重含義:知識是文獻的實質內容,載體是文獻的外在形式,符號、文字、聲音等是人體感覺信息的媒介,記錄是把知識存附在載體上形成文獻的手段。

四、文獻的類型按文獻的記錄手段和載體劃分:1.印刷型:⑴圖書⑵期刊⑶特種文獻2.縮微型3.聲像型4.電子型:⑴數(shù)據(jù)庫⑵網(wǎng)絡文獻⑶印刷型文獻的數(shù)字化

按文獻的加工層次分:1.一次文獻:即原始文獻,是作者以生產(chǎn)或科研成果為依據(jù)而創(chuàng)作的文獻。2.二次文獻:根據(jù)一次文獻的內容和外表特征進行加工整序后的文獻。3.三次文獻:對一次文獻和二次文獻進行綜合、分析后編輯而成的文獻。4.零次文獻:一般認為是形成一次文獻之前的信息、知識、情報,即未經(jīng)記錄或未公開于社會的最原始的文獻,或沒有正式發(fā)表的文字材料,如書信、手稿、筆記、記錄等。也有人認為是科技人員口頭交談及直接作用于人的感覺器官的非文獻知識,如操作技能、診療經(jīng)驗等。也可以說,零次文獻是以文獻所有者本身為載體的未公布于世的科技知識。

第二節(jié)信息檢索一、什么是信息檢索?

信息檢索(InformationRetrieval)是指信息的有序化識別和查找的過程,即人們根據(jù)特定的信息需求,采取科學的方法,應用專門的工具,從浩瀚的信息海洋中迅速、準確地獲取所需信息的過程。

廣義的信息檢索:包括信息的存儲和信息的檢索,往往又稱為“信息存儲與檢索”。狹義的信息檢索:是指人們從任何信息系統(tǒng)中高效、準確地查找到自己所需的有用信息,而不管它以何種形式出現(xiàn),或借助于什么樣的媒體。二、信息檢索系統(tǒng)

根據(jù)社會發(fā)展需要和為達到特定的信息交流目的而建立的一種有序化的信息資源集合體。它通常是一個擁有選擇、整理、加工、存儲、檢索信息的設備與方法,并能夠向用戶提供信息服務的多功能開放系統(tǒng)。

信息檢索系統(tǒng)的構成要素:⑴信息資源、⑵設備、⑶方法與策略、⑷人。二、信息檢索的類型㈠、按信息檢索的對象分類

1.文獻檢索:從大量的文獻集合中查找出符合特定需要的相關文獻的過程。

2.數(shù)據(jù)檢索:以特定的數(shù)值型數(shù)據(jù)為檢索對象的檢索過程。

3.事實檢索:利用特定的參考工具書或事實型數(shù)據(jù)庫查找出能夠直接解答某一提問的事實。

三、信息檢索語音㈠、什么是信息檢索語言?

信息檢索語言是為建立信息檢索系統(tǒng)而創(chuàng)建的專門用來描述文獻特征(內容特征或外表特征)和表達檢索提問的一種人工語言,又稱為信息存儲與檢索語言、標引語言、索引語言等。㈡、按信息檢索的組織方式分類

1.目錄檢索:通過各種目錄查詢單位出版物。

2.題錄檢索:檢索單篇文獻的外表特征。

3.文摘檢索:在題錄的基礎上增加了摘要。

4.全文檢索:通俗的說就是查找整篇文章。

5.超文本檢索:基本組成元素是節(jié)點和節(jié)點間的邏輯聯(lián)接鏈,每個節(jié)點中所存儲的信息以及信息鏈被聯(lián)系在一起,構成相互交叉的信息網(wǎng)絡。鏈路網(wǎng)將同一篇文獻或不同文獻的相關部分結構化地連接起來,它主要通過非線性瀏覽獲取信息。

6.超媒體檢索:是對超文本檢索的補充。其存儲對象超出了文本范疇,融入了靜態(tài)或動態(tài)的圖形、圖像、聲音等多種媒體信息。信息的存儲結構從單維發(fā)展到多維。

超文本一種電子文檔,其中的文字包含有可以鏈接到其他字段或者文檔的超文本鏈接,允許從當前閱讀位置直接切換到超文本鏈接所指向的文字。通常使用超文本標記語言(HyperTextMarkupLanguage,簡稱HTML)書寫。大多數(shù)網(wǎng)頁都屬于超文本。超文本的發(fā)展歷史上幾個著名人物1計算機界公認的超文本的鼻祖是美國早期的一個計算機科學家:范尼瓦·布什。他于1945年發(fā)表的文章《按照我們的想象(AsWeMayThink)》呼喚在有思維的人和所有的知識之間建立一種新的關系。由于條件所限,布什的思想在當時并沒有變成現(xiàn)實,但是他的思想在此后的50多年中產(chǎn)生了巨大影響。人們普遍認為超文本的概念,源于布什。超文本的發(fā)展歷史上幾個著名人物2美國斯坦福研究院的道格·英格爾伯特將布什的思想付諸實施,他開發(fā)的聯(lián)機系統(tǒng)NLS(oN-LineSystem)已經(jīng)具備了若干超文本的特性。此外,英格爾伯特還發(fā)明了鼠標、多窗口、圖文組合文件等等,甚至可以說是他發(fā)明了超文本。超文本的發(fā)展歷史上幾個著名人物3“超文本”這個詞在英語詞典上并不存在,是美國人泰得·納爾遜于1965年杜撰的。后來,超文本一詞得到世界的公認,成了這種非線性信息管理技術的專用詞匯。㈡、信息檢索語言的主要功能1.簡單明了而又較為專指地描述信息的主題概念;2.容易地將概念進行系統(tǒng)排列;3.便于檢索時將標引用語與檢索用語進行相符性比較。

㈢、常用的信息檢索語言種類

1.分類檢索語言:以學科分類為基礎,結合信息內容特征的一種直接體現(xiàn)知識分類概念的檢索語言。其采用概念邏輯分類的一般規(guī)則進行層層劃分,構成具有上位類和下位類之間隸屬關系、同位類之間并列關系的概念等級體系。

2.主題檢索語言:用表達文獻主題內容的詞語作為標識的信息檢索語言。應用較多的是主題詞和關鍵詞。

⑴主題詞:以規(guī)范化為基礎,以揭示事物對象及其特征為出發(fā)點的信息檢索語言。最具代表性的是美國國立醫(yī)學圖書館的《醫(yī)學主題詞表》(MedicalSubjectHeadings,MeSH)。⑵關鍵詞:是指出現(xiàn)在文獻的題名、摘要或全文中,能夠反映文獻主題內容的專業(yè)名詞或術語。四、信息檢索工具1.手工檢索工具2.機械檢索工具3.計算機檢索工具4.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論