搜索引擎的發(fā)展課件_第1頁
搜索引擎的發(fā)展課件_第2頁
搜索引擎的發(fā)展課件_第3頁
搜索引擎的發(fā)展課件_第4頁
搜索引擎的發(fā)展課件_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

搜索引擎的發(fā)展課件1定義:搜索引擎是指根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,并將處理后的信息顯示給用戶,是為用戶提供檢索服務(wù)的系統(tǒng)。簡單的說:

搜索引擎其實(shí)就是指一個(gè):1.先抓取網(wǎng)頁2.再處理網(wǎng)頁3.然后提供檢索服務(wù)的系統(tǒng)定義:簡單的說:2首先要介紹一下這個(gè):Robot(機(jī)器人)ComputerRobot是指某個(gè)能以人類無法達(dá)到的速度不斷重復(fù)執(zhí)行某項(xiàng)任務(wù)的自動(dòng)程序。由于專門用于檢索信息的Robot程序象蜘蛛(spider)一樣在網(wǎng)絡(luò)間爬來爬去,因此,搜索引擎的Robot程序被稱為spider程序。首先要介紹一下這個(gè):ComputerRobot是指某個(gè)能以3搜索引擎也有祖先:1990年,加拿大麥吉爾大學(xué)(UniversityofMcGill)計(jì)算機(jī)學(xué)院的師生開發(fā)出Archie。當(dāng)時(shí),萬維網(wǎng)(WorldWideWeb)還沒有出現(xiàn),人們通過FTP來共享交流資源。Archie能定期搜集并分析FTP服務(wù)器上的文件名信息,提供查找分別在各個(gè)FTP主機(jī)中的文件。用戶必須輸入精確的文件名進(jìn)行搜索,Archie告訴用戶哪個(gè)FTP服務(wù)器能下載該文件。雖然Archie搜集的信息資源不是網(wǎng)頁(HTML文件),但和搜索引擎的基本工作方式是一樣的:自動(dòng)搜集信息資源、建立索引、提供檢索服務(wù)。所以,Archie被公認(rèn)為現(xiàn)代搜索引擎的鼻祖。搜索引擎也有祖先:4第一個(gè)兒子:1994年4月,斯坦福大學(xué)的兩名博士生,美籍華人JerryYang(楊致遠(yuǎn))和DavidFilo共同創(chuàng)辦了Yahoo。隨著訪問量和收錄鏈接數(shù)的增長,Yahoo目錄開始支持簡單的數(shù)據(jù)庫搜索。因?yàn)閅ahoo!的數(shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實(shí)上只是一個(gè)可搜索的目錄。雅虎于2002年12月23日收購inktomi,2003年7月14日收購包括Fast和Altavista在內(nèi)的Overture,2003年11月,Yahoo全資收購3721公司。第一個(gè)兒子:5第二個(gè)兒子:1994年初,華盛頓大學(xué)(UniversityofWashington)的學(xué)生BrianPinkerton開始了他的小項(xiàng)目WebCrawler。1994年4月20日,WebCrawler正式亮相時(shí)僅包含來自6000個(gè)服務(wù)器的內(nèi)容。WebCrawler是互聯(lián)網(wǎng)上第一個(gè)支持搜索文件全部文字的全文搜索引擎,在它之前,用戶只能通過URL和摘要搜索,摘要一般來自人工評論或程序自動(dòng)取正文的前100個(gè)字。第二個(gè)兒子:6第三個(gè)兒子:1994年7月,卡內(nèi)基·梅隆大學(xué)(CarnegieMellonUniversity)的MichaelMauldin將JohnLeavitt的spider程序接入到其索引程序中,創(chuàng)建了Lycos。除了相關(guān)性排序外,Lycos還提供了前綴匹配和字符相近限制,Lycos第一個(gè)在搜索結(jié)果中使用了網(wǎng)頁自動(dòng)摘要,而最大的優(yōu)勢還是它遠(yuǎn)勝過其它搜索引擎的數(shù)據(jù)量。第三個(gè)兒子:7新的開始!元搜索引擎!1995年,一種新的搜索引擎形式出現(xiàn)了——元搜索引擎。用戶只需提交一次搜索請求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理,提交給多個(gè)預(yù)先選定的獨(dú)立搜索引擎,并將從各獨(dú)立搜索引擎返回的所有查詢結(jié)果,集中起來處理后再返回給用戶。第一個(gè)元搜索引擎,是Washington大學(xué)碩士生EricSelberg和OrenEtzioni的Metacrawler。新的開始!元搜索引擎!8搜索引擎的革新?。。。。?995年12月,DEC的正式發(fā)布AltaVista。AltaVista是第一個(gè)支持自然語言搜索的搜索引擎,第一個(gè)實(shí)現(xiàn)高級搜索語法的搜索引擎(如AND,OR,NOT等)。用戶可以用AltaVista搜索新聞組(Newsgroups)的內(nèi)容并從互聯(lián)網(wǎng)上獲得文章,還可以搜索圖片名稱中的文字、搜索Titles、搜索Javaapplets、搜索ActiveXobjects。AltaVista最有趣的新功能之一,是搜索有鏈接指向某個(gè)URL的所有網(wǎng)站。它在搜索框區(qū)域下放了“tips”以幫助用戶更好的表達(dá)搜索式,這些小tip經(jīng)常更新,這樣,在搜索過幾次以后,用戶會(huì)看到很多他們可能從來不知道的的有趣功能。這系列功能,逐漸被其它搜索引擎廣泛采用。1997年,AltaVista發(fā)布了一個(gè)圖形演示系統(tǒng)LiveTopics,幫助用戶從成千上萬的搜索結(jié)果中找到想要的。搜索引擎的革新?。。。。?世界級搜索引擎的誕生世界級搜索引擎的誕生101998年10月之前,Google只是斯坦福大學(xué)的一個(gè)小項(xiàng)目BackRub。1995年博士生LarryPage開始學(xué)習(xí)搜索引擎設(shè)計(jì),于1997年9月15日注冊了的域名,1997年底,在SergeyBrin和ScottHassan、AlanSteremberg的共同參與下,BachRub開始提供Demo。1999年2月,Google完成了從Alpha版到Beta版的蛻變。Google公司則把1998年9月27日認(rèn)作自己的生日。Google以網(wǎng)頁級別(Pagerank)為基礎(chǔ),判斷網(wǎng)頁的重要性,使得搜索結(jié)果的相關(guān)性大大增強(qiáng)。Google公司的奇客(Geek)文化氛圍、不作惡(Don’tbeevil)的理念,為Google贏得了極高的口碑和品牌美譽(yù)。2006年4月,Google宣布其中文名稱“谷歌”,這是Google第一個(gè)在非英語國家起的名字。搜索引擎的發(fā)展課件11中國搜索引擎的崛起:1996年8月,sohu公司成立,制作中文網(wǎng)站分類目錄,曾有“出門找地圖,上網(wǎng)找搜狐”的美譽(yù)。隨著互聯(lián)網(wǎng)網(wǎng)站的急劇增加,這種人工編輯的分類目錄已經(jīng)不適應(yīng)。sohu于2004年8月獨(dú)立域名的搜索網(wǎng)站“搜狗”,自稱“第三代搜索引擎”。中國搜索引擎的崛起:12全球最大的中文搜索引擎誕生!??!全球最大的中文搜索引擎誕生?。。?32000年1月,兩位北大校友,超鏈分析專利發(fā)明人、前Infoseek資深工程師李彥宏與好友徐勇(加州伯克利分校博士后)在北京中關(guān)村創(chuàng)立了百度(Baidu)公司。2001年8月發(fā)布B搜索引擎Beta版,2001年10月22日正式發(fā)布Baidu搜索引擎,專注于中文搜索。Baidu搜索引擎的其它特色包括:百度快照、網(wǎng)頁預(yù)覽/預(yù)覽全部網(wǎng)頁、相關(guān)搜索詞、錯(cuò)別字糾正提示、mp3搜索、Flash搜索。2002年3月閃電計(jì)劃開始后,技術(shù)升級明顯加快。后推出貼吧、知道、地圖、國學(xué)、百科等一系列產(chǎn)品,深受網(wǎng)民歡迎。2005年8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論