




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、1,第4課 計算機及網絡檢索概論,第六章 計算機信息檢索 (P45) 第七章 搜索引擎(P52),2,主要內容: 1、計算機文獻檢索的基本技術(重點) 2、通用搜索引擎(介紹) 3、中外文醫(yī)學專業(yè)搜索引擎(了解) 4、網上免費醫(yī)學信息資源(了解),3,一、計算機信息檢索的定義、原理、特點 定義:用戶利用計算機信息檢索系統(tǒng),使用檢索策略,從檢索系統(tǒng)中檢索出與用戶特定需求相一致的信息的過程。 原理:是將用戶所輸入的檢索詞同檢索系統(tǒng)中的檢索標識進行匹配。,4,一、計算機信息檢索的定義、原理、特點 特點:速度快、內容新、途徑多、資源共知共享、輸出方式多樣,5,二、計算機信息檢索發(fā)展的4階段 脫機檢索階
2、段(20世紀50年代中至60年代中) 磁帶 只能順序檢索 不能交互 聯(lián)機檢索階段(20世紀60年代中至70年代) 磁盤和磁盤機 人機交互 光盤檢索階段(20世紀80年代中期) 光盤庫 光盤塔 網絡檢索階段(20世紀90年代以后),6,三、數(shù)據庫的類型 根據數(shù)據庫所收錄的信息內容分為: 事實數(shù)據庫(fact database) 人物傳記數(shù)據庫、機構名錄數(shù)據庫、成果、產品、基金 專利等。 數(shù)值數(shù)據庫(numeric database) 電話號碼庫、化學分子式;股市行情、氣象數(shù)據、人口數(shù)據庫 書目數(shù)據庫(bibliographic database) 只提供文獻線索,不提供全文。如:CBM、PUBM
3、ED 全文數(shù)據庫(full-text database) 法律法規(guī)全文庫、中國日報全文庫、VIP、CNKI、萬方、LWW、OUP 多媒體數(shù)據庫(multimedia database),7,四、數(shù)據庫的結構 不同類型、不同內容的數(shù)據庫,結構不同,標引方式、檢索方式也都存在差異。 字段(field)記錄(record)文檔(file)數(shù)據庫(database),8,CBM題錄數(shù)據庫中的一條記錄: 中文題目(TI):因特網上醫(yī)學專業(yè)搜索引擎 著 者(AU):喬中; 周林; 陳昌鑫 著者單位(AD):鄖陽醫(yī)學院圖書館 442000 中文摘要(AB):本文簡要介紹了因特網上幾種主要醫(yī)學專業(yè)搜索引擎。給
4、出了具體的網址和使用方法。 出 處(SO):醫(yī)學信息(西安) 2001.01.05; 14(1): 10-11 關 鍵 詞(KW): Internet; 搜索引擎; 醫(yī)學 主 題 詞(MH): *信息存儲和檢索; *因特網,9,五、計算機文獻檢索的基本技術 作用: 將人類的自然語言轉化為計算機能識別的機器語言。 將用戶的檢索提問轉換成邏輯表達式。,10,五、計算機文獻檢索的基本技術 布爾邏輯算符:AND OR NOT 字段限定符:IN = 截詞符(通配符):* ? # $ ! 位置算符:same with near 其它檢索技術:加權檢索、聚類檢索等,11,布爾邏輯算符,邏輯“與” 用AND或
5、空格或*表示 ,表達概念間的交叉關系。 可以縮小檢索范圍,提高查準率。 如:胰島素 and 糖尿病 胰島素 糖尿病,12,布爾邏輯算符,邏輯“或” 用OR或+表示,表達概念間的并列關系。 可以擴大檢索范圍,提高查全率。 如:AIDS or 艾滋病 or愛滋病 肺癌 or 肺腫瘤 肺癌+肺腫瘤,13,布爾邏輯算符,邏輯“非” 用NOT或-表示 ,表達概念間的不包含關系。 可以縮小檢索范圍,提高查準率。 如:關節(jié)炎 not 類風濕 關節(jié)炎 -類風濕,14,布爾邏輯運算符注意事項,可以用多個檢索詞和多個邏輯運算符,組成一個復合邏輯檢索式。一般情況下,運算優(yōu)先級別如下: ( ) (AIDS or 艾滋
6、病 or 愛滋病)and 預防 不同的數(shù)據庫系統(tǒng)對運算次序有不同規(guī)定。,15,字段限定符,將檢索詞限定在具體某一字段中檢索,可縮小檢索范圍。 in 高血壓 in TI leukemia in TI = AU=喬中 Hypertension ti smith j au,16,截詞符,肝炎?疫苗 (有限截詞符) colo?r wom?n (0-1個字符) computer? (0-2個字符) 肝炎*疫苗 (無限截詞符) transplant* *magnetic 張$,17,18,截詞符,實質是用邏輯OR對具有相同的詞頭或詞尾的詞匯進行檢索。 可以避免漏檢,提高查全率,提高檢索效率。 不同的檢索系
7、統(tǒng)對截詞符的支持有差異。,19,位置運算符:對檢索詞的相對位置進行限制,with (字段級檢索) A(W)B 表示A、B兩個詞必須出現(xiàn)在同一字段,且詞序固定。 A (nW)B 表示A、B兩個詞必須出現(xiàn)在同一字段,且兩詞之間最多插入n個詞,詞序固定。 A(G)B 教授(G)英語 A W/n B computer W/3 careers 如:智能機器人(3w)控制,可檢出在同一字段中含有“智能機器人,控制”,“智能機器人行為控制”等的文獻。,20,位置運算符,near (自然句級檢索) A(N)B 表示A、B兩個詞必須出現(xiàn)在同一字段的同一句話中。 A(nN)B 表示A、B兩個詞必須出現(xiàn)在同一字段的
8、同一句話中,且兩詞之間最多插入n個詞 。 如:智能機器人(3n)控制,可檢出在同一句話中含有“智能機器人控制”、 “控制算法對智能機器人的影響” 、“智能機器人行為控制”等的文獻。,21,常用的位置算符:,22,常用的位置算符(續(xù)):,23,其它檢索技術,加權檢索( Weighting Searching ) 是一種定量檢索的技術。從量的方面對檢索詞之間的組配關系加以限制和表示。 對每個檢索詞給定一個數(shù)值表示其重要程度,這個數(shù)值稱為權值(Weight)。在檢索時,先查找該檢索詞在記錄中是否存在,然后計算該檢索詞在該記錄中出現(xiàn)的頻率。頻率達到或超過閾值,該記錄才為命中文獻。 可縮小檢索范圍,提高
9、檢準率。,24,其它檢索技術,聚類檢索 計算文獻的相似度,并把相似度較高的文獻集中在一起,形成一個個的文獻類。 根據不同的聚類水平的要求,可以形成不同聚類層次的類目體系。 主題相近、內容相關的文獻聚在一起,相異的被區(qū)分開來。,25,例:查找阿昔洛韋治療手足口病方面的文獻。 檢索策略: #1 阿昔洛韋治療應用 #2 手足口病藥物療法 #3 #1 AND #2,26,27,28,檢索結果的反饋調整,擴大檢索提高查全率 初始檢索范圍太小,命中文獻不多,需要擴大檢索范圍的方法。 方法:使用上位詞或相關詞;增加同義詞OR連接;截詞檢索;減少字段限定條件; 縮小檢索提高查準率 初始檢索范圍太大,命中文獻太
10、多,或查準率太低,需要增加查準率的一種方法。 方法:選擇專指性下位詞;增加檢索詞用AND連接;增加副主題詞;增加限定條件;主題詞加權檢索;,29,信息饑渴信息爆炸 利用網絡自動快速索引技術、動態(tài)緩存技術、分布計算技術、內容評價技術等多種技術手段,對網絡上各種資源進行組織、標引,并為檢索者提供檢索。 為搜索網絡上的各種資源而設計的檢索程序。讓用戶快速高效地獲取所需有效信息。,六、搜索引擎(search engine),30,1990年Alan Emtage 發(fā)明的Archie,以文件名查找FTP服務器上文件的檢索系統(tǒng)。 1993年,基于“蜘蛛”(Spider)程序原理的搜索引擎開始涌現(xiàn):從跟蹤一
11、個網站的鏈接開始,進而檢索整個互聯(lián)網。 1994年,Lycos Yahoo,從此搜索引擎進入高速發(fā)展時期。,六、搜索引擎,31,搜索引擎按其工作方式分三種: 全文搜索引擎(Full Text Search Engine) GoogleBaiduAltaVista 目錄索引類搜索引擎(Search Index/Directory) YahooSohuSina網易 元搜索引擎(Meta Search Engine) 在查詢時,同時在其他多個引擎上進行搜索。 Dogpile Metacrawler Vivisimo搜星,七、搜索引擎分類,32,按檢索功能分: 關鍵詞搜索引擎與分類目錄搜索引擎 按檢索
12、內容分: 通用型搜索引擎與專業(yè)型搜索引擎 按組合方式分: 獨立搜索引擎與元搜索引擎,七、搜索引擎分類,33,數(shù)據采集 數(shù)據組織 數(shù)據檢索,八、搜索引擎工作原理,34,Google是由美國斯坦福大學的兩位博士生拉里佩奇和謝爾蓋布林于1998年9月7日創(chuàng)建的。 用創(chuàng)建人佩奇的話說:“我們的任務就是要對世界上的信息編組”。,九、通用搜索引擎google,35,點擊直接到達排名第一的網頁,檢索設置,高級檢索,36,搜索設置,37,38,Google學術搜索 ,Google 學術作品搜索包括來自廣泛研究領域的同級評審文章、論文、圖書、摘要和其他學術文獻。您可以找到各種學術出版商和專業(yè)社團的作品,以及 W
13、eb 上的學術文章。Google 學術搜索可能還包括一篇文章的多個版本(可能是初始版本),您可以訪問這些版本。 絕大部分結果都提供了文章標題、作者、出版信息以及被引用次數(shù)等編目信息。,39,高級搜索和搜索設置,40,41,filetype:pdf 黃鐵柱,42,pdf 格式全文,43,Google檢索技巧,1、支持邏輯“與”、“或”、“非”運算。 如:干擾素 肝炎 信息素養(yǎng) OR 文獻檢索 武俠小說 金庸,44,2、Google會忽略最常用的詞和字符,這些詞和字符稱為忽略詞。 Google 自動忽略“http”, “.com”,“的”,“與”等字符以及數(shù)字和單字,這類字詞不僅無助于縮小查詢范圍
14、,而且會大大降低搜索速度。 使用英文雙引號或+可將這些忽略詞強加于搜索項縮小范圍,提高檢索精確度。 如: “物質與文化遺產” 我+的大學,45,3、只支持通配符,代替單個字符。 如: “以*治國”,46,4、查找指定類型文件。 如:肝炎 filetype:doc filetype:doc 肝炎 治療 filetype:pdf 肝炎 5、指定網域搜索。 如:學院 site:,47,6、其它功能 翻譯、定義查詢、貨幣轉換、天氣查詢、 郵編區(qū)號查詢、手機號碼歸屬地查詢、股票基金查詢等。,48,google高級檢索,49,(1)Medical Matrix 1994年美國醫(yī)學會主辦,堪薩斯大學創(chuàng)建,面
15、向臨床醫(yī)師和衛(wèi)生工作者,是目前最重要的醫(yī)學專業(yè)搜索引擎。免費使用。 關鍵詞搜索 分類目錄搜索(特色),十、醫(yī)學專業(yè)搜索引擎,50,分類目錄:其內容分為專業(yè)(Specialties)、疾病(Diseases)、臨床實踐(Clinical Practice)、文獻(Literature)、教育(Educatiom)、衛(wèi)生保健和職業(yè)(Healthcare and Professionals)、醫(yī)學計算機和Internet技術(Medical Computing Internet and Technology)、市場(Marketplace)8個大類 每
16、一大類下再根據其內容分為新聞、文摘、參考書、主要網址、病例、全文和多媒體、影像學和病理切片、病人教育等二級類目。 每個網址下均有星級評價和評論,便于讀者事先粗略了解該主頁。,51,分類目錄,關鍵詞搜索,52,53,檢索工具,教材,熱點問題,星級評價和評論,54,(2)Medical World Search(MWS,醫(yī)學世界檢索),1997年美國建立。收錄上千個醫(yī)學網點、近萬個eb頁面。使用規(guī)范醫(yī)學主題詞,準確性很高,可免費全文檢索。涵蓋基礎醫(yī)學;臨床醫(yī)學;藥學;預防醫(yī)學與衛(wèi)生學 (3) Health Web(衛(wèi)生健康網;)美國,1994年,提供免費MED
17、LINE數(shù)據庫及其他網絡資源及評價。,十、醫(yī)學專業(yè)搜索引擎,55,(4)Medscape () 美國1995年6月創(chuàng)建,由功能強大的通用搜索引擎AltaVista支持,可檢索圖像、聲頻、視頻資料??蔀g覽每日醫(yī)學新聞 ,網上查找醫(yī)學詞典,臨床醫(yī)學全文、1996年至今的MEDLINE數(shù)據庫和繼續(xù)教育資源。需免費注冊。 關鍵詞和專業(yè)分類檢索。 分類檢索:按疾病、學科、內容性質分類檢索 免費Medline檢索:3900多種醫(yī)學雜志,9,500,000多萬篇文章的摘要 Merriam Websters醫(yī)學詞典:55,000條內容 最大的在線藥物數(shù)據庫:200,000多種藥物的使用說明。 文獻全文:25,
18、000多篇著名醫(yī)學雜志文章全文。,56,57,()HealthAtoZ (臨床醫(yī)學) () 1994年,美國,HealthAtoZ是一個功能強大的Internet免費全文醫(yī)學信息資源搜尋器。它能對與醫(yī)學有關的信息進行準確、有效地搜尋。它所收集的信息均經過醫(yī)學專業(yè)人員的人工編排,以保證搜尋的準確性及方便性。所收集的內容每周更新。也提供MEDLINE免費檢索。注冊后可獲全文??砂捶诸惣瓣P鍵詞的方式進行檢索。,58,()網上健康基金會The Health On the Net Foundation ( HON )創(chuàng)建機構: Health On the Net Foundation 機構類型: 國際組
19、織 語 種: 英文;法文;德文等國 別: 1995年瑞士 學科分類: 藥學;臨床醫(yī)學 資源地址: http:/www.hon.ch/ 資源類型: 信息門戶;搜索引擎 揭示層次: 全文;文摘;題錄 獲取途徑: 通過域名或IP地址進入此網站,免費使用。,59,MedHunt:是一個針對醫(yī)藥衛(wèi)生領域的醫(yī)學專業(yè)搜索引擎,具有英文、法文兩個版本,主要檢索醫(yī)學站點、醫(yī)院信息等。 HONselect:是一個多功能智能型的搜索引擎,具有英文、法文、德文、西班牙文和葡萄牙文五個版本。它采用美國國立醫(yī)學圖書館的MeSH詞表組織網絡醫(yī)學信息資源,允許用戶查詢MeSH詞的釋義和等級結構,而且通過MeSH詞表將四個獨立
20、的數(shù)據庫(Medline、HONmedia、DailyNews、MedHunt)集成在一起,采用統(tǒng)一的檢索界面對MeSH詞、網站、權威科技論文、醫(yī)藥衛(wèi)生領域新聞和多媒體資源提供一體化檢索。,60,HONmedia:是一個包含 3300多種醫(yī)學圖像和音像資源的數(shù)據庫,涉及1,700多個主題。 Conference & Events:提供醫(yī)藥衛(wèi)生會議信息,可按日期(年月 )、主題(A-Z)、地點(美國、歐洲和其它)瀏覽和檢索會議名稱、召開日期、地點、簡單描述等。 Daily News: HONproject(HON項目): HONdossier(檔案):提供需要特別關注的衛(wèi)生專業(yè)及相關報告如Age
21、ing、Allergy Glossary 、Hepatitis B 、Mother and Child、Rare Diseases、Stop smoking、 Vision and Eye care FAQ。,61,62,()Clini Web International (/cliniweb) 提供分類,分類目錄有: 解剖學 微生物學 疾病 化學和藥理學 診斷和治療技術及儀器 心理學 生物學 同時還提供免費Medline文獻檢索。,63,十一、開放獲取信息資源及其利用,開放獲取(Open Access)是國際學術界、出版界、圖書情報界為了推動科研成果利用互
22、聯(lián)網自由傳播而采取的運動。其目的是促進科學及人文信息的廣泛交流,促進利用互聯(lián)網進行科學交流與出版,提升科學研究的共享程度與速度、保障科學信息的長期保存,提高科學研究的效率。 開放獲取數(shù)字資源是網絡上重要的共享學術信息資源,提供期刊論文全文的免費閱讀,是獲取學術信息的一種新模式。 國外的一些研究表明,在很多學科領域,開放獲取的文章比非開放獲取的文章具有更大的研究影響力。,64,(一)中國預印本服務系統(tǒng),預印本(Preprint)是指科研工作者的研究成果還未在正式出版物上發(fā)表,而出于和同行交流目的自愿先在學術會議上或通過互聯(lián)網發(fā)布的科研論文、科技報告等文章。與刊物發(fā)表的文章以及網頁發(fā)布的文章比,預
23、印本具有交流速度快、利于學術爭鳴、可靠性高的特點。,65,(一)中國預印本服務系統(tǒng), 由中國科學技術信息研究所與國家科技圖書文獻中心聯(lián)合建設的以提供預印本文獻資源服務為主要目的的實時學術交流系統(tǒng)。 用戶簡單注冊并登陸后,即可自由提交、檢索、瀏覽預印本文章全文、發(fā)表評論等功能。,66, 是由一群中國年輕的科學、教育與技術工作者創(chuàng)辦,非盈利性質的網絡服務項目。目的是為中國研究者提供免費、方便、穩(wěn)定的eprint平臺,并宣傳提倡開放獲取的理念。 可使用分類瀏覽或關鍵詞查詢的方法查找所需資料。,(二)奇跡文庫預印本,67,(三)中國科技論文在線, 是經教育部批準,由教育部科技發(fā)展中心創(chuàng)建,每日更新,可
24、為在本網站發(fā)表論文的作者提供該論文發(fā)表時間的證明,并允許作者同時向其它專業(yè)學術刊物投稿,以使科研人員新穎的學術觀點、創(chuàng)新思想和技術成果能夠盡快對外發(fā)布,并保護原創(chuàng)作者的知識產權。 目前已經有紙本期刊出版,文章的來源從網站中選擇。,68,(四)開放閱讀期刊聯(lián)盟,/ 由中國高校自然科學學報研究會發(fā)起,加入該聯(lián)盟的學報在網站上免費提供全文。讀者可登錄各會員期刊的網站,免費閱讀或索取論文?,F(xiàn)共有29種,其中醫(yī)學期刊5種。,69,70,(五)中國學術會議在線, 是面向全國的學術群體,最具權威性、公益性、互動性的國家級學術會議交流平臺,由教育部主管,于2005年1月開通
25、試運行。為科研人員打造優(yōu)質學術資源共享和交流的平臺,提供學術會議預報及在線服務、視頻點播、交互式會議等功能。,71,網絡外文期刊免費全文數(shù)據庫 加州工學院的開放數(shù)字文檔收集項目 Directory of Open Access Journals HighWire Press Free Medical Journals FreeFullText The Open Access Publisher Public Library of Science Journals J-STAGE E-Journal Scientific Electronic Library Online,部分國外開放獲取數(shù)字資
26、源,72,Directory of Open Access Journals,/ 是由瑞典蘭德大學圖書館整理的一份開放期刊目錄。該項服務涵蓋了免費的、可獲取全文的、高質量的科學和學術期刊(This service covers free, full text, quality controlled scientific and scholarly journals)。他們的目標是涵蓋所有學科和語言的開放期刊,目前一共有1332種開放期刊被收錄到了該目錄中,其中的708種可以進行文章檢索。,73,HighWire Press,http:/www.highwir
27、 是全球最大的提供免費全文的學術文獻出版商之一,于1995年由美國斯坦福大學圖書館創(chuàng)立。目前已收錄電子期刊1045多種,文章總數(shù)已達460萬多篇,其中超過180 萬篇可免費獲得全文,這些數(shù)據仍在不斷增加。該系統(tǒng)整合了Medline數(shù)據庫。收錄的期刊覆蓋以下學科:生命科學、醫(yī)學、物理學、社會科學。 基本檢索:關鍵詞和作者檢索 目錄瀏覽檢索:期刊瀏覽和專題瀏覽,74,免費注冊,關鍵詞檢索,期刊瀏覽和主題瀏覽,75,腫瘤學的臨床試驗設計的有關文獻。,Oncology 腫瘤學,76,方法,77,78,79,80,Free Medical Journals, 由法國建立的免費醫(yī)學期刊目錄服務網站。目前提供10多個語種的1000余種生物醫(yī)學期刊(包括部分生物醫(yī)學頂級雜志)的閱讀,并可快速鏈接到期刊網站,了解能免費提供全文的期刊名稱。 大部分期刊完全免費,還有一部分是限時免費(有些需免費注冊)。 提供期刊的影響因子,該網站僅僅是一個目錄,沒有提供檢索功能。只能預先知道文章的出處,依次找到該期刊點擊打開。,81,期刊按學科分類,按期刊名首字的英文字順排列,82,期刊按學科分類排列,83,有關AIDS的期刊,84,Free Full Text, 維護了一個超過7000種的提供免費閱讀全文的網絡學術期刊資源列表
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025建筑工程安全管理合同協(xié)議書
- 2025年西雙版納貨運資格證試題及答案
- 2025年防城港貨運從業(yè)資格證考試題庫
- 淡附片中藥飲片檢驗操作規(guī)程
- 單原子納米酶催化h2o2的關鍵限速步驟
- 2025年湖南貨運從業(yè)資格證筆答題
- unit-1-sports-and-games-topic-3-仁愛八年級上-
- 綁扎鋼筋搭接長度表
- 全國交通安全日講話稿11篇
- 標施工標準化之路基施工作業(yè)指導書(第二篇三分冊)
- 冷鏈物流成本控制-全面剖析
- 有關商品房預售合同樣本合同樣本7篇
- 2025年高考物理復習備考策略講座
- 管理學基礎-形考任務三-國開-參考資料
- 2024-2025學年北師大版七年級數(shù)學上冊期末復習壓軸題12個(84題)含答案
- 2025年3月版安全環(huán)境職業(yè)健康法律法規(guī)標準文件清單
- 中藥飲片儲存與養(yǎng)護
- 唐長安城高官住宅分布變遷之初步研究
- 蠟療技術PPT課件
- 友商S6實施五部曲銷售流程倉庫管理流
- EMC電磁兼容測試報告2
評論
0/150
提交評論