版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
因特網(wǎng)上的信息檢索第1頁,課件共34頁,創(chuàng)作于2023年2月改變關(guān)鍵詞盡量少用通配符與含糊的詞使用邏輯控制符AND,利用多個(gè)條件同時(shí)滿足要求進(jìn)行限制使用雙引號(hào)“””(英文狀態(tài)下)將連在一起的詞變成短語來搜索用近義詞代替關(guān)鍵詞使用邏輯控制符OR使用其他的搜索網(wǎng)站討論交流:哪些搜索技巧可以縮小搜索范圍?第2頁,課件共34頁,創(chuàng)作于2023年2月3.2因特網(wǎng)上的信息檢索第3頁,課件共34頁,創(chuàng)作于2023年2月3.2.1因特網(wǎng)信息檢索方法因特網(wǎng)是全球性的分布式系統(tǒng),信息組織處于一個(gè)無序的狀態(tài)?;诔谋?超媒體的信息瀏覽基于目錄服務(wù)的信息查詢基于搜索引擎的信息檢索第4頁,課件共34頁,創(chuàng)作于2023年2月1、基于超文本/超媒體的信息瀏覽能夠靈活、方便地查找信息,但信息檢索很大程度上取決于所提供的鏈接,搜索結(jié)果帶有偶然性和片面性。音頻資料視頻資料圖形圖像網(wǎng)頁網(wǎng)頁網(wǎng)頁第5頁,課件共34頁,創(chuàng)作于2023年2月2、基于目錄服務(wù)的信息查詢?nèi)藗兏鶕?jù)信息的主題將網(wǎng)絡(luò)上的資源進(jìn)行分類,并以目錄的形式組織和表現(xiàn)。一級(jí)二級(jí)三級(jí)四級(jí)第6頁,課件共34頁,創(chuàng)作于2023年2月3、基于搜索引擎的信息檢索查詢請(qǐng)求搜索引擎:信息檢索工具查詢結(jié)果:非資源本身資源的鏈接第7頁,課件共34頁,創(chuàng)作于2023年2月3.2.2搜索引擎的發(fā)展與分類1994年4月斯坦福大學(xué)兩名博士生美籍華人楊致遠(yuǎn)和美國人DavidFilo超級(jí)目錄索引雅虎最早的搜索引擎?1、搜索引擎的產(chǎn)生成功地使搜索引擎的概念深入人心從此搜索引擎進(jìn)入了高速發(fā)展時(shí)期第8頁,課件共34頁,創(chuàng)作于2023年2月1990年起搜索引擎發(fā)展舉例產(chǎn)生時(shí)間搜索工具開發(fā)組或公司網(wǎng)站特點(diǎn)1990ArchieMcGillUnibersity可搜索FTP文件名列表1993GopherNevadaSystemComputingServicesUniversity一個(gè)分布式信息檢索系統(tǒng)1994.4Yahoo斯坦福大學(xué)早期Yahoo數(shù)據(jù)是手工輸入1995.12AltaVistaDEC公司第一個(gè)支持自然語言關(guān)鍵詞和高級(jí)檢索的引擎1997.10北大天網(wǎng)北大計(jì)算機(jī)研究室收錄網(wǎng)頁約6000萬,有強(qiáng)大的FTP搜索功能1998.9Google斯坦福大學(xué)提供網(wǎng)頁評(píng)級(jí)動(dòng)態(tài)摘要、網(wǎng)頁快照,每天更新、多文檔格式支持2001.8Baidu百度公司快照、預(yù)覽、相關(guān)詞搜索、mp3、flash搜索功能第9頁,課件共34頁,創(chuàng)作于2023年2月2搜索引擎的分類目錄式搜索引擎全文搜索引擎元搜索引擎垂直搜索引擎集合式搜索引擎門戶搜索引擎免費(fèi)鏈接列表第10頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎的分類類型定義舉例目錄搜索網(wǎng)絡(luò)信息資源按照主題分類,并以層次樹狀形式進(jìn)行組織的一類搜索引擎.
優(yōu)點(diǎn):實(shí)實(shí)在在找到用戶所關(guān)心內(nèi)容分類,網(wǎng)站導(dǎo)航質(zhì)量高缺點(diǎn):分類不夠細(xì),需要人工介入,目錄的維護(hù)量大,更新可能不夠及時(shí).第11頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎的分類類型定義舉例全文搜索使用關(guān)鍵詞到預(yù)先建好的或租用其它索引數(shù)據(jù)庫查詢信息的一類搜索引擎.
優(yōu)點(diǎn):信息量大、更新較及時(shí)、不需人工干預(yù)。缺點(diǎn):返回信息過多,有很多無關(guān)信息。第12頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎的分類類型定義舉例元搜索引擎元搜索引擎就是通過一個(gè)統(tǒng)一的用戶界面向多個(gè)搜索引擎同時(shí)遞交用戶查詢,對(duì)結(jié)果去重合并再返回給用戶.
優(yōu)點(diǎn):結(jié)果精確、全面,匯聚各大搜索引擎的結(jié)果。
缺點(diǎn):檢索速度較慢、犧牲個(gè)別搜索引擎性能,并非1+1=2
第13頁,課件共34頁,創(chuàng)作于2023年2月如果你是搜索引擎公司的老總,談?wù)勈裁词呛玫乃阉饕??搜索結(jié)果準(zhǔn)確,搜索精度高響應(yīng)速度快及時(shí)更新檢索數(shù)據(jù)庫,剔除“死鏈”思考第14頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展1、提高對(duì)用戶檢索提問的理解2、對(duì)檢索結(jié)果進(jìn)行進(jìn)一步的處理3、確定搜索引擎信息搜索范圍,提高搜索引擎的針對(duì)性第15頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展1、提高對(duì)用戶檢索提問的理解自然語言的使用使網(wǎng)絡(luò)交流更加人性化,讓查詢變得更加方便、直接、有效。案例:了解關(guān)于殺計(jì)算機(jī)病毒的方法。關(guān)鍵詞1:計(jì)算機(jī)病毒關(guān)鍵詞2:如何清除計(jì)算機(jī)病毒第16頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展2、對(duì)檢索結(jié)果進(jìn)行進(jìn)一步的處理①基于鏈接評(píng)價(jià)的搜索引擎Google設(shè)計(jì)者認(rèn)為:一個(gè)網(wǎng)頁的重要性取決于他被其他網(wǎng)頁鏈接的數(shù)量②基于訪問大眾性的搜索引擎這類搜索引擎的設(shè)計(jì)者認(rèn)為大多數(shù)人選擇訪問的網(wǎng)站就是最重要的網(wǎng)站。③去掉檢索結(jié)果中附加的多余信息第17頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展3、確定搜索引擎信息搜索范圍,提高搜索引擎的針對(duì)性1、垂直主題搜索引擎:高度的目標(biāo)化和專業(yè)化第18頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展3、確定搜索引擎信息搜索范圍,提高搜索引擎的針對(duì)性1、垂直主題搜索引擎:高度的目標(biāo)化和專業(yè)化2、非WWW信息搜索:提供FTP類信息的檢索第19頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展3、確定搜索引擎信息搜索范圍,提高搜索引擎的針對(duì)性1、垂直主題搜索引擎:高度的目標(biāo)化和專業(yè)化2、非WWW信息搜索:提供FTP類信息的檢索3、多媒體搜索引擎:實(shí)現(xiàn)多媒體檢索第20頁,課件共34頁,創(chuàng)作于2023年2月搜索引擎技術(shù)的發(fā)展1、提高對(duì)用戶檢索提問的理解2、對(duì)檢索結(jié)果進(jìn)行進(jìn)一步的處理3、確定搜索引擎信息搜索范圍,提高搜索引擎的針對(duì)性第21頁,課件共34頁,創(chuàng)作于2023年2月3.2.3搜索引擎的工作過程信息檢索人工智能計(jì)算機(jī)網(wǎng)絡(luò)分布式處理數(shù)據(jù)庫數(shù)據(jù)挖掘數(shù)字圖書館自然語言處理……搜索引擎是一個(gè)交叉的研究領(lǐng)域,極具綜合性和挑戰(zhàn)性。第22頁,課件共34頁,創(chuàng)作于2023年2月目錄式搜索引擎的工作過程以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息后,人工形成信息摘要,并將信息置于事先確定的分類框架中。用戶通過瀏覽分類目錄來查看自己所需要的信息,再鏈接到信息資源所在的位置。目錄頁面Sodig分類“國家地區(qū)”……“四川”……“成都”……“川師附中”……第23頁,課件共34頁,創(chuàng)作于2023年2月全文搜索引擎的工作過程搜索器互聯(lián)網(wǎng)初識(shí)數(shù)據(jù)索引器檢索器索引數(shù)據(jù)庫接口界面IE瀏覽器用戶搜索輸出查詢信息系統(tǒng)定期搜索網(wǎng)絡(luò)提取并組織、排序關(guān)鍵字對(duì)比、提取第24頁,課件共34頁,創(chuàng)作于2023年2月Spider系統(tǒng)程序:像蜘蛛一樣在網(wǎng)絡(luò)間爬來爬去,追蹤互聯(lián)網(wǎng),捕獲網(wǎng)址。第25頁,課件共34頁,創(chuàng)作于2023年2月第26頁,課件共34頁,創(chuàng)作于2023年2月用戶接口第27頁,課件共34頁,創(chuàng)作于2023年2月課堂小結(jié)一、信息檢索的方法基于超文本/超媒體的信息瀏覽基于目錄服務(wù)的信息查詢基于搜索引擎的信息檢索二、主要二類搜索引擎1、目錄式搜索引擎2、全文搜索引擎第28頁,課件共34頁,創(chuàng)作于2023年2月一、選擇題1.以下選項(xiàng)中,不屬于因特網(wǎng)中信息檢索的主要方法是()A.基于超文本/超媒體的信息瀏覽B.基于搜索引擎的信息檢索C.基于“我的電腦”文件搜索D.基于目錄服務(wù)的信息查詢答案:C2.(多選題)以下選項(xiàng)中,屬于網(wǎng)絡(luò)主要搜索引擎的分類是()A.全文搜索B.目錄搜索C.專業(yè)搜索D.元搜索答案:AB第29頁,課件共34頁,創(chuàng)作于2023年2月一、選擇題3.我們通過網(wǎng)頁中的鏈接去訪問另外一個(gè)信息資源的信息檢索方法是()。A.基于超文本/超媒體的信息瀏覽B.基于目錄服務(wù)的信息查詢C.基于搜索引擎的信息檢索D.特種搜索引擎答案:A4.使用全文搜索引擎,搜索的結(jié)果是()。A.我們所要找的全部信息B.互聯(lián)網(wǎng)上客觀存在的網(wǎng)頁數(shù)據(jù)C.搜索引擎數(shù)據(jù)庫中的數(shù)據(jù)D.以上都不是答案:C第30頁,課件共34頁,創(chuàng)作于2023年2月一、選擇題5.全文搜索引擎一般采用什么原理來采集信息()。A.人工方式B.“蜘蛛”程序C.關(guān)鍵字檢索D.檢索工具答案:B6.如果要搜索桂林旅游景點(diǎn),則應(yīng)該在搜索框輸入什么關(guān)鍵字才能高效地找到有用信息()。A.桂林or旅游景點(diǎn)B.桂林or旅游or景點(diǎn)C.桂林or旅游and景點(diǎn)D.桂林and旅游and景點(diǎn)答案:D第31頁,課件共34頁,創(chuàng)作于2023年2月二、判斷題7.由于因特網(wǎng)是全球性的分布式系統(tǒng),數(shù)以百萬計(jì)的信息提供都難以按照一定的約定來提供信息,因此,整個(gè)因特網(wǎng)的信息組織處于一個(gè)無序狀態(tài)。()答案:對(duì)8.搜索引擎是因特網(wǎng)上信息檢索的軟件系統(tǒng),最早的搜索引擎出現(xiàn)于1994年4月,是由斯坦福大學(xué)的兩名博士(其中包含美籍華人楊致遠(yuǎn))創(chuàng)辦的雅虎。()答案:對(duì)9.目錄式搜索引擎是以人工方式收集信息,由編輯人員查看信息后并將信息分類置于事先確定的相應(yīng)目錄中。()答案:對(duì)第32頁,課件共34頁,創(chuàng)作于2023年2月二、判斷題10.目錄式搜索引擎是通過計(jì)算機(jī)進(jìn)行分類和整理,不需要人工干預(yù)。()答案:錯(cuò) 分類不夠細(xì),需要人工介入,目錄的維護(hù)量大,更新可能不夠及時(shí).11.全文搜索引擎的優(yōu)點(diǎn)是信息量大、更新較及時(shí)、不需人工干預(yù);缺點(diǎn)是返回信息過多,有很多無關(guān)信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度電梯事故應(yīng)急救援預(yù)案制定及演練合同4篇
- 二零二五年度農(nóng)業(yè)觀光園舊房轉(zhuǎn)讓合同范本4篇
- 2025年度城市文化節(jié)場(chǎng)地運(yùn)營(yíng)管理服務(wù)合同4篇
- 2025年零擔(dān)貨物運(yùn)輸節(jié)能減排管理合同4篇
- 二零二五年度廚房設(shè)備節(jié)能環(huán)保產(chǎn)品認(rèn)證與推廣合同4篇
- 二零二五年度跨境民間借款擔(dān)保及結(jié)算服務(wù)合同4篇
- 2025年度個(gè)人房屋租賃合同樣本(含裝修條款)2篇
- 二零二五年度米廠水稻種植與農(nóng)產(chǎn)品溯源體系共建合同3篇
- 二零二五年度農(nóng)產(chǎn)品電商平臺(tái)合作協(xié)議范本4篇
- 2025年度女方離婚協(xié)議書范本與執(zhí)行效力分析4篇
- 2025年上半年江蘇連云港灌云縣招聘“鄉(xiāng)村振興專干”16人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- DB3301T 0382-2022 公共資源交易開評(píng)標(biāo)數(shù)字見證服務(wù)規(guī)范
- 人教版2024-2025學(xué)年八年級(jí)上學(xué)期數(shù)學(xué)期末壓軸題練習(xí)
- 江蘇省無錫市2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 俄語版:中國文化概論之中國的傳統(tǒng)節(jié)日
- 2022年湖南省公務(wù)員錄用考試《申論》真題(縣鄉(xiāng)卷)及答案解析
- 婦科一病一品護(hù)理匯報(bào)
- 哪吒之魔童降世
- 2022年上海市各區(qū)中考一模語文試卷及答案
- 2024年全國統(tǒng)一高考數(shù)學(xué)試卷(新高考Ⅱ)含答案
- 我國無菌包裝行業(yè)消費(fèi)量已超千億包-下游需求仍存擴(kuò)容潛力
評(píng)論
0/150
提交評(píng)論