信息檢索與利用(第三版)課件 4網(wǎng)絡(luò)信息資源檢索_第1頁(yè)
信息檢索與利用(第三版)課件 4網(wǎng)絡(luò)信息資源檢索_第2頁(yè)
信息檢索與利用(第三版)課件 4網(wǎng)絡(luò)信息資源檢索_第3頁(yè)
信息檢索與利用(第三版)課件 4網(wǎng)絡(luò)信息資源檢索_第4頁(yè)
信息檢索與利用(第三版)課件 4網(wǎng)絡(luò)信息資源檢索_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

4網(wǎng)絡(luò)信息資源檢索4.1網(wǎng)絡(luò)信息資源概述4.2搜索引擎4.3開(kāi)放獲取4.4慕課4.1網(wǎng)絡(luò)信息資源概述1.網(wǎng)絡(luò)信息資源的定義字面理解:

“通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和”。具體理解:以數(shù)字化形式記錄的,以多媒體形式表達(dá)的,分布式存儲(chǔ)在網(wǎng)絡(luò)計(jì)算機(jī)的存儲(chǔ)介質(zhì)以及各類通信介質(zhì)上,并通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)通信方式進(jìn)行傳遞的信息內(nèi)容的集合。主體是internet2.網(wǎng)絡(luò)信息資源的特點(diǎn)(1)數(shù)量龐大,增長(zhǎng)迅速;(2)內(nèi)容豐富,形式多樣;(3)變化頻繁,價(jià)值不一;(4)結(jié)構(gòu)復(fù)雜,分布廣泛;(5)信息分散、無(wú)序;3.Internet信息資源類型網(wǎng)絡(luò)信息資源的種類很多,根據(jù)不同的分類標(biāo)準(zhǔn),可以將網(wǎng)絡(luò)信息資源分為不同的類型。第一,按網(wǎng)絡(luò)傳輸協(xié)議劃分:WWW信息資源,TELNET信息資源,FTP信息資源,新聞組信息資源,電子郵件信息資源,Gopher信息資源等。第二,按照網(wǎng)絡(luò)信息資源的組織方式劃分,可分為文件方式,超文本/超媒體方式、數(shù)據(jù)庫(kù)方式等。第三,依據(jù)信息源的信息內(nèi)容則可將網(wǎng)絡(luò)信息資源分為以下類型:網(wǎng)絡(luò)數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)出版物、社會(huì)信息、軟件資源等。4.網(wǎng)絡(luò)信息資源檢索的一般方法

網(wǎng)絡(luò)信息檢索方法分類目錄偶爾發(fā)現(xiàn)

順“鏈”而行主題檢索RSS閱讀網(wǎng)上瀏覽(目錄型檢索工具)搜索引擎(1)布爾邏輯檢索技術(shù)就是布爾檢索是將多個(gè)關(guān)鍵詞按照一定的邏輯關(guān)系組合在一起形成的組合檢索.

這是計(jì)算機(jī)信息檢索中最基本的也是最常用的技術(shù)。5.計(jì)算機(jī)檢索技術(shù)布爾邏輯運(yùn)算符邏輯“與”邏輯“或”邏輯“非”

邏輯“與”————————————————AB用符號(hào)“and”或“*”表示,其邏輯表達(dá)式為:

A*B或AandB

其意義為檢索記錄中必須同時(shí)含有檢索詞A和B的文獻(xiàn),才算命中文獻(xiàn)。

邏輯“或”AB用符號(hào)“or”或“+”表示,其邏輯表達(dá)式為:

AorB或A+B

其意義為檢索記錄中凡含有檢索詞A或檢索詞B,或同時(shí)含有檢索詞A和B的,均為命中文獻(xiàn)。

邏輯“非”

AB用符號(hào)“not”或“-”,其邏輯表達(dá)式為:

AnotB或A-B

其意義為:檢索記錄中含有檢索詞A,但不能含有檢索詞B的文獻(xiàn),才算命中文獻(xiàn)。舉例:

要檢索“非兒童的心理測(cè)試”,對(duì)用戶來(lái)說(shuō),需要包含“心理測(cè)試”的文獻(xiàn),但去掉那些包含兒童研究的文獻(xiàn)。在心理學(xué)數(shù)據(jù)庫(kù)可檢索到:心理測(cè)試43150

兒童11560

心理測(cè)試NOT兒童

1500

從圖中可以看出:邏輯“與”的組配縮小了檢索的范圍。參加邏輯“與”的檢索詞越多,檢索的結(jié)果范圍限制得越小,命中的文獻(xiàn)也就越少。邏輯“或”的關(guān)系擴(kuò)大了檢索范圍。用邏輯“或”組配相當(dāng)于增加了檢索詞的同義詞和近義詞,從而擴(kuò)大了檢索范圍。邏輯“非”的檢索也是一種縮小檢索范圍的組配方式。但是使用邏輯“非”的組配時(shí)需要特別小心,常常會(huì)把有用的文獻(xiàn)也排除掉。

(2)截詞檢索技術(shù)

截詞檢索就是用截?cái)嗟脑~的一個(gè)局部進(jìn)行的檢索,并認(rèn)為凡滿足這個(gè)詞局部中的所有字符(串)的文獻(xiàn),都為命中的文獻(xiàn)。截詞檢索是一種常用的檢索技術(shù),是防止漏檢的有效手段。特別是在西文檢索中,更是廣泛使用。西文的構(gòu)詞比較靈活,在詞干上加上不同性質(zhì)的前、后綴就可以派生出許多新的詞匯,而且這些詞匯在意義上都比較相近。按截?cái)嗟奈恢脜^(qū)分,可以有后截?cái)唷⑶敖財(cái)嘁约爸虚g截?cái)啵ㄖ虚g屏蔽)。

也叫做右截?cái)?,即將一個(gè)詞的后方或右方截去有限或無(wú)限個(gè)字符,后截?cái)鄼z索也叫“前方一致”檢索。

如:comput*為無(wú)限后截?cái)?,可以檢索包含以下詞匯的文獻(xiàn):

computable、computation、compute、computer、computers、computing、computerise、computerize……后截?cái)嗳纾篶omput???則表示有限后截?cái)?,?—3個(gè)字母,可檢索出包含compute、computer、computers、computing等詞匯的文獻(xiàn)

前截?cái)嘁步凶蠼財(cái)?。前截?cái)嗟臋z索方法也叫“后方一致”檢索。前截?cái)鄼z索常用于復(fù)合詞。

如:*magnetic(有磁性的,有吸引力的):為無(wú)限前截?cái)嗟谋磉_(dá)式,可檢出包含下列詞匯的文獻(xiàn):

magnetic、electromagnetic、electro-magnetic、paramagnetic(順磁的)、thermo-magnetic(熱磁的)等。前截?cái)嗳纾????jīng)濟(jì)則數(shù)據(jù)庫(kù)中含有經(jīng)濟(jì)、工業(yè)經(jīng)濟(jì)、農(nóng)業(yè)經(jīng)濟(jì)等方面的文獻(xiàn)均為命中文獻(xiàn)。前截?cái)嗯c后截?cái)嘁部梢越M合起來(lái)使用。如:*chemi*可以檢出下列詞匯:

chemical、chemistry、chemist、eletrochemical、electrochemistry、physicochemistry、thermochemistry等。

就是將提問(wèn)字符串中間的字符用通配符代替,主要用于英式美式不同拼法的英文單詞,或單復(fù)數(shù)不同的單詞。如:

manwomanorganizationdefensemenwomenorganisationdefence

檢索時(shí)為防止漏檢可用中間屏蔽的檢索方法:

m?nwom?norgani?ationdefen?e中間屏蔽注意:無(wú)論是前截?cái)?、后截?cái)嗪椭虚g屏蔽,從根本上來(lái)說(shuō),它們是邏輯“或”的運(yùn)算,因此能擴(kuò)大檢索范圍,提高查全率。此外還能減少輸入檢索詞的工作量,簡(jiǎn)化檢索步驟,節(jié)省機(jī)時(shí)和費(fèi)用。在中文數(shù)據(jù)庫(kù)中使用最多的是后截?cái)鄼z索。截詞檢索在不同的計(jì)算機(jī)檢索系統(tǒng)中規(guī)定不同,使用時(shí)請(qǐng)注意。

(3)字段限制檢索

在檢索系統(tǒng)中,為了提高檢索的查準(zhǔn)率,縮小檢索的范圍,通常有一些限制的手段和方法。使用這些方法進(jìn)行的檢索通常稱為限制檢索。常用的限制方法是字段限定。數(shù)據(jù)庫(kù)中每條記錄都有許多字段,將檢索詞限定在特定的字段中進(jìn)行檢索就叫做字段限定檢索。各個(gè)檢索系統(tǒng)的字段限制符可能并不一樣,字段的標(biāo)識(shí)符也有不同。有的系統(tǒng)不分前綴后綴限定,一律采用前綴或后綴檢索。在菜單式驅(qū)動(dòng)檢索界面中,通常用戶不需使用限制符,只要在下拉菜單中選擇某個(gè)字段名稱,在提問(wèn)框中輸入檢索詞,就可完成字段限定檢索。

4.2搜索引擎1.什么是搜索引擎?搜索引擎其實(shí)是一個(gè)網(wǎng)站,只不過(guò)該網(wǎng)站專門為你提供信息“檢索”服務(wù),是對(duì)互聯(lián)網(wǎng)上的信息資源進(jìn)行搜集整理,并提供查詢的系統(tǒng)。它包括信息搜集、信息整理和用戶查詢?nèi)糠?。用戶系統(tǒng)用戶接口搜索器索引器檢索器WWW信息資源FTP信息資源Telent信息資源Ghopher信息資源WAIS信息資源用戶服務(wù)組信息資源搜索引擎網(wǎng)絡(luò)網(wǎng)絡(luò)2.搜索引擎的構(gòu)成及工作原理

搜索引擎有兩個(gè)主要的功能:

1、收集網(wǎng)絡(luò)信息資源,對(duì)其進(jìn)行索引并建立數(shù)據(jù)庫(kù)。

2、提供網(wǎng)絡(luò)的信息導(dǎo)航與檢索服務(wù)(主要的功能)。

3.搜索引擎的發(fā)展歷史第一代搜索引擎是基于人工分類目錄搜索,以早期的Yahoo、AltaVista和Infoseek等為代表第二代搜索引擎的主要特征是運(yùn)用“符號(hào)計(jì)算”,基于關(guān)鍵詞搜索以及以關(guān)鍵詞組合為基礎(chǔ)的全文搜索和模糊搜索。以Google、DirectHit等為代表?;陉P(guān)鍵詞搜索的優(yōu)勢(shì)是使用方便,搜索速度快,直接搜索內(nèi)容,這是第一代搜索引擎無(wú)法比擬的。第三代搜索引擎。不僅索引規(guī)模大,而且更多地結(jié)合了自然語(yǔ)言理解、個(gè)性化等智能化技術(shù)4.發(fā)展中的搜索引擎整合搜索

社區(qū)搜索

移動(dòng)搜索

垂直搜索物聯(lián)網(wǎng)搜索:不僅僅是你找東西,甚至還有可能東西找你5.搜索引擎的種類

按信息搜集方法和服務(wù)提供方式目錄型搜索引擎關(guān)鍵詞型搜索引擎元搜索引擎(1)目錄型搜索引擎

以人工方式或半自動(dòng)方式搜集信息,人工形成信息摘要,并將信息置于事先確定的分類框架中。使用戶能通過(guò)瀏覽該目錄,發(fā)現(xiàn)、檢索到有關(guān)的信息。這種目錄索引并非嚴(yán)格意義上的搜索引擎,僅僅是按一定標(biāo)準(zhǔn)分類的網(wǎng)站目錄列表鏈接而已。這種目錄瀏覽服務(wù),信息大多面向網(wǎng)站。(2)關(guān)鍵詞型(索引型)搜索引擎

是通過(guò)用戶錄入關(guān)鍵詞來(lái)查找有關(guān)信息,這種方式直接方便,并可使用邏輯運(yùn)算符編制檢索式,對(duì)選定條件的資源準(zhǔn)確定位。優(yōu)點(diǎn)

范圍廣更新快,能及時(shí)向用戶提供新增信息檢索方便、直接缺點(diǎn)

檢索結(jié)果準(zhǔn)確性差有較多重復(fù)、虛假信息不同的搜索引擎檢索界面、檢索策略的構(gòu)造和輸入方式不同(2)關(guān)鍵詞型(索引型)搜索引擎適合于檢索特定的信息及較為專、深、具體或類屬不明確的課題。典型代表:

百度/Googlehttp://www.google.com

沒(méi)有獨(dú)立的數(shù)據(jù)庫(kù),只提供一個(gè)統(tǒng)一界面,把多個(gè)具有獨(dú)立功能的引擎組合起來(lái)。萬(wàn)緯搜索引擎:

超搜索:(已停用)

(3)元搜索引擎6.

百度1999年底由李彥宏、徐勇創(chuàng)建于美國(guó)硅谷。2001年10月22日,百度正式發(fā)布Baidu搜索引擎。先進(jìn)的超級(jí)鏈接分析技術(shù);內(nèi)容相關(guān)度評(píng)價(jià)技術(shù);WAP與PDA搜索服務(wù);17.

谷歌谷歌公司成立于1998年9月4日,由拉里·佩奇和謝爾蓋·布林共同創(chuàng)建,被公認(rèn)為全球最大的搜索引擎公司。谷歌是一家位于美國(guó)的跨國(guó)科技企業(yè),業(yè)務(wù)包括互聯(lián)網(wǎng)搜索、云計(jì)算、廣告技術(shù)等,同時(shí)開(kāi)發(fā)并提供大量基于互聯(lián)網(wǎng)的產(chǎn)品與服務(wù),其主要利潤(rùn)來(lái)自于AdWords等廣告服務(wù)。

1999年下半年,谷歌網(wǎng)站“Google”正式啟用。

2010年3月23日,宣布關(guān)閉在中國(guó)大陸市場(chǎng)搜索服務(wù)。

2017年2月,BrandFinance發(fā)布2017年度全球500強(qiáng)品牌榜單,排名第一。

主要業(yè)務(wù)Google搜索引擎主要的搜索服務(wù)有:網(wǎng)頁(yè),圖片,音樂(lè),視頻,地圖,新聞,問(wèn)答。GoogleBookSearch。該工具可以在搜索頁(yè)面提供由內(nèi)容出版商提供的書(shū)本內(nèi)容的搜索結(jié)果,并提供連向購(gòu)買書(shū)本的網(wǎng)頁(yè)以及內(nèi)容相關(guān)廣告。谷歌地圖提供各種地圖服務(wù),包括局部詳細(xì)的衛(wèi)星照片。GoogleAnswers是傳統(tǒng)搜索功能的擴(kuò)展-用戶不用自己搜索內(nèi)容,他們請(qǐng)專家搜索然后付費(fèi)。顧客問(wèn)問(wèn)題,并為問(wèn)題提供一個(gè)相應(yīng)的價(jià)錢,然后研究者們回答他們的問(wèn)題。2004年11月,谷歌發(fā)布“GoogleScholar”這是一個(gè)學(xué)術(shù)文獻(xiàn)資源搜索引擎.

谷歌翻譯谷歌免費(fèi)的在線語(yǔ)言翻譯服務(wù)可即時(shí)翻譯文本和網(wǎng)頁(yè),但功能還有待改進(jìn)。設(shè)置搜索偏好,包括每個(gè)網(wǎng)頁(yè)上默認(rèn)的搜索結(jié)果數(shù)量、界面語(yǔ)言,以及查詢語(yǔ)言Google的查詢界面直接進(jìn)入最符合搜索條件的網(wǎng)頁(yè)其他搜索搜狗/新浪資料搜索/百度網(wǎng)盤知乎簡(jiǎn)書(shū)果殼慕課網(wǎng)果殼網(wǎng)

果殼網(wǎng)是一個(gè)泛科技主題網(wǎng)站,于2010年創(chuàng)立,致力于向公眾倡導(dǎo)科技理念,提供負(fù)責(zé)任、有智趣的科學(xué)普及類內(nèi)容。果殼網(wǎng)現(xiàn)有科學(xué)人、小組、問(wèn)答、MOOC學(xué)院等板塊,由專業(yè)科技團(tuán)隊(duì)負(fù)責(zé)編輯,網(wǎng)站主編為拇姬。依興趣關(guān)注不同小組,閱讀有意思的科技內(nèi)容;在“果殼問(wèn)答”里提出困惑你的科技問(wèn)題,或提供靠譜的答案;關(guān)注各個(gè)門類和領(lǐng)域的果殼達(dá)人,加入興趣討論,分享智趣話題。在“MOOC學(xué)院”選擇感興趣的課程、對(duì)學(xué)過(guò)的課程進(jìn)行點(diǎn)評(píng)、用筆記記錄作業(yè)、資料和學(xué)習(xí)心得,與同學(xué)們一起分享,相互幫助探討問(wèn)題。知乎

知乎是北京智者天下科技有限公司于2011年1月26日上線的一個(gè)網(wǎng)絡(luò)問(wèn)答社區(qū)。知乎連接各行各業(yè)的用戶,為用戶提供社區(qū)服務(wù),使用戶能圍繞著某一感興趣的話題進(jìn)行相關(guān)的討論,同時(shí)可以關(guān)注興趣一致的人。知乎首頁(yè),大致有四個(gè)功能區(qū)?!白钚聞?dòng)態(tài)”主要呈現(xiàn)用戶所關(guān)注人的最新提問(wèn)及回答等信息。除了查看最新問(wèn)題及回答之外,也可以通過(guò)“設(shè)置”、“關(guān)注問(wèn)題”、“添加評(píng)論”、“分享”、“感謝”和“收藏”等功能參與到自己感興趣的問(wèn)題中。用戶相關(guān)行為管理信息有“我的草稿”、“我的收藏”、“所有問(wèn)題”、“我關(guān)注的問(wèn)題”和“邀請(qǐng)我回答的問(wèn)題”?!把?qǐng)好友加入知乎”,用戶可以通過(guò)電子郵件和新浪微博邀請(qǐng)自己朋友加入到知乎社區(qū)中。為用戶關(guān)注或感興趣話題或用戶推薦板塊。知乎可能根據(jù)用戶關(guān)注話題信息匯總,可能通過(guò)用戶在知乎網(wǎng)絡(luò)相關(guān)行為數(shù)據(jù)記錄統(tǒng)計(jì),達(dá)到相當(dāng)準(zhǔn)確推薦和匯總。“話題廣場(chǎng)”板塊中,知乎網(wǎng)將所有話題分類標(biāo)簽呈現(xiàn),為用戶除搜索和導(dǎo)航之外,有一種不錯(cuò)的獲取信息方式。簡(jiǎn)書(shū)

簡(jiǎn)書(shū)是一個(gè)創(chuàng)作社區(qū),任何人均可以在其上進(jìn)行創(chuàng)作。用戶在簡(jiǎn)書(shū)上面可以方便的創(chuàng)作自己的作品,互相交流。簡(jiǎn)書(shū)成為國(guó)內(nèi)優(yōu)質(zhì)原創(chuàng)內(nèi)容輸出平臺(tái)。產(chǎn)品功能享受沉浸式的創(chuàng)作體驗(yàn),隨時(shí)隨地可以進(jìn)行創(chuàng)作,同時(shí)支持離線保存支持高清圖片秒傳豐富的官方推薦專題打開(kāi)創(chuàng)作思路支持一鍵生成圖片分享支持私信、打賞、評(píng)論、點(diǎn)贊等社交功能支持專題匯聚文章功能檢索技巧明確檢索目的和要求,確定查詢策略選擇合適的網(wǎng)絡(luò)檢索工具

1、更換搜索引擎;

2、區(qū)分學(xué)術(shù)性檢索工具和商業(yè)性檢索工具,如GoogleScholar/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)。網(wǎng)絡(luò)信息檢索技巧提高檢索的精度、準(zhǔn)確性

1、選擇合適的檢索詞,盡量使用專指詞、特定概念或非常用詞,避免普通詞、泛指概念;

2、構(gòu)造恰當(dāng)?shù)臋z索提問(wèn),學(xué)會(huì)利用檢索工具所規(guī)定的AND、OR、NOT等邏輯符、引號(hào)等檢索符號(hào)。

3、使用限定條件、限定詞,充分利用檢索界面上提供的限制條件,如語(yǔ)種、時(shí)間、類型、數(shù)量等。

4、利用進(jìn)階、精練檢索功能,“Refine”或“二次檢索”。網(wǎng)絡(luò)信息檢索技巧擴(kuò)大檢索范圍

1、使用同義詞、近義詞;

2、使用多個(gè)搜索引擎或者元搜索引擎(All-In-One);

3、利用某些搜索引擎的自動(dòng)擴(kuò)檢功能,如“Morelikethis”、“相關(guān)網(wǎng)頁(yè)”等網(wǎng)絡(luò)信息檢索技巧加快檢索速度

1、直接進(jìn)入相關(guān)站點(diǎn);平日的積累收藏夾和書(shū)簽的利用

2、利用特殊型網(wǎng)絡(luò)檢索工具和一些特色服務(wù)站點(diǎn);新聞、天氣、交通、地圖等

3、多窗口瀏覽、檢索;4.3開(kāi)放存取開(kāi)放存?。∣penAccess)是國(guó)際科技界、學(xué)術(shù)界、出版界、圖書(shū)館界為推動(dòng)科研成果自由傳播而發(fā)起的運(yùn)動(dòng),其目的是促進(jìn)科學(xué)信息的廣泛傳播,促進(jìn)學(xué)術(shù)信息的交流與出版,提升科學(xué)研究的公共利用程度,保障科學(xué)信息的長(zhǎng)期保存。美國(guó)研究圖書(shū)館協(xié)會(huì)(Asso

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論