《谷歌的工作原理》PPT課件.ppt_第1頁
《谷歌的工作原理》PPT課件.ppt_第2頁
《谷歌的工作原理》PPT課件.ppt_第3頁
《谷歌的工作原理》PPT課件.ppt_第4頁
《谷歌的工作原理》PPT課件.ppt_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Google是如何工作的,講解人員:X X 日 期:2011年01月17日,2,Google工作的基本原理,工作原理 (一)搜集資訊:搜索引擎靠機(jī)器人程式 (spider)處理網(wǎng)站資料的收錄工作 (二)整理資訊:搜索引擎整理資訊的過程 稱為建立索引,搜索引擎不僅要 保存搜集起來的資訊,還要將它們按 照一定的規(guī)則進(jìn)行編排 (三)接受查詢:用戶向搜索引擎發(fā)出查詢, 搜索引擎接受查詢并向用戶返回資料,3,Google工作原理實(shí)例演示(一),你寫了篇博客,發(fā)了個(gè)評(píng)論,對(duì) 網(wǎng)站進(jìn)行了更新或者添 加內(nèi)容到網(wǎng)上,Google的網(wǎng)絡(luò)蜘蛛爬取整個(gè)網(wǎng)絡(luò), 包括你發(fā)布的內(nèi)容,一旦爬取后,頁面會(huì)在幾秒內(nèi)被 索引,Go

2、ogle還可以通過博客的ping命令或者 Xml sitemap來找到你的網(wǎng)站,從高權(quán)威性的網(wǎng)站獲得越多外鏈, 則這些網(wǎng)頁獲得越高的權(quán)威性,如果到你網(wǎng)站的外鏈有nofollow標(biāo)簽, Google不會(huì)通過這些連接爬取你的 網(wǎng)站,如果你通過robot.txt告訴Google別 爬取的網(wǎng)站,Google將不會(huì)爬取,Google網(wǎng)絡(luò)蜘蛛跟隨連接進(jìn)行爬取, 如果你的網(wǎng)站沒有外鏈,那么你的 網(wǎng)站不會(huì)進(jìn)行常規(guī)和深度爬取,爬取沒有nofollow標(biāo)簽的連接,網(wǎng)頁內(nèi)容存儲(chǔ)在一個(gè)逆索引 (reverse index)中,網(wǎng)頁標(biāo)題 和連接數(shù) 據(jù)存在一 個(gè)索引 中,用于 寬泛競(jìng)爭(zhēng) 激烈的 搜索,網(wǎng)頁內(nèi)容 存在另外

3、一個(gè)索引 中,用于 不常見或 長(zhǎng)尾關(guān)鍵 字的搜索,當(dāng)你通過Google搜索時(shí),不是搜索實(shí)現(xiàn)的 網(wǎng)絡(luò),而是搜索Google的不斷更新的,4,Google工作原理實(shí)例演示(二),Google根據(jù)連接評(píng)估域名和網(wǎng)頁 總體的權(quán)威性,網(wǎng)頁根據(jù)編輯政策被再次檢查,同時(shí)網(wǎng)頁被分割成很多數(shù)據(jù)塊, 用戶搜索時(shí)將使用這些數(shù)據(jù),Google的搜索質(zhì)量團(tuán)隊(duì)和反垃圾 團(tuán)隊(duì)反復(fù)評(píng)估和完善算法,1萬遠(yuǎn)程測(cè)試者對(duì)他們的搜索 質(zhì)量進(jìn)行評(píng)分,Google從用戶收集網(wǎng)頁 垃圾報(bào)告數(shù)據(jù),Google根據(jù)DMCA的通知剔除 侵權(quán)的內(nèi)容,5,Google工作原理實(shí)例演示(三),用戶使用Google搜索,Google根據(jù)用戶鍵入的字母或

4、詞語提供關(guān)鍵字建議,Google將相似的同義詞包含在 查詢中,產(chǎn)生初步的搜索結(jié)果,Google可能會(huì)找到超過百萬 的搜索結(jié)果,但最終顯示出 來的可能只有1000條 (或少于1000條),搜索結(jié)果本地化:本地網(wǎng)站在 搜索結(jié)果中將被優(yōu)先推介,6,Google工作原理實(shí)例演示(四),根據(jù)權(quán)威性和PageRank 對(duì)搜索結(jié)果進(jìn)行排序 同時(shí)移除重復(fù)內(nèi)容,Google根據(jù)關(guān)鍵字、廣告 匹配類型和用戶所在地 找到相關(guān)廣告,廣告必須遵循相關(guān)政策和規(guī)定,關(guān)聯(lián)的廣告根據(jù)潛在收入 進(jìn)行排序(根據(jù)競(jìng)標(biāo)價(jià)格和 廣告質(zhì)量打分),如果關(guān)鍵字搜索量很少 或者點(diǎn)擊量很少,廣告 可能自動(dòng)被停止,廣告發(fā)布者如果不遵守 相關(guān)規(guī)則,賬

5、號(hào)將被禁止,大型或受歡迎的廣告, 比如,可能 會(huì)有折扣,對(duì)大多數(shù)廣告發(fā)布者來說,預(yù)先 已經(jīng)創(chuàng)建了廣告內(nèi)容,但有時(shí)與關(guān)鍵字 相關(guān)的動(dòng)態(tài)內(nèi)容也會(huì)顯示給用戶,有些廣告可能顯示擴(kuò)展內(nèi)容, 類似site links,電話號(hào)碼, 產(chǎn)品鏈接,所在地等。,對(duì)內(nèi)容進(jìn)行過濾,如果廣告有足夠高的轉(zhuǎn)化率, 廣告可能會(huì)被顯示在搜索結(jié)果上端,其他的廣告顯示在右側(cè),7,Google工作原理實(shí)例演示(五),對(duì)內(nèi)容進(jìn)行過濾,對(duì)于通用搜索來說,如果Google認(rèn)為新聞搜索、 購物搜索、視頻搜索、書籍搜索、本地搜索或 其他任何垂直搜索的結(jié)果和你查詢的關(guān)鍵字有關(guān), 他們可能會(huì)直接將這些搜索結(jié)果混合顯示給用戶。,個(gè)性化搜索:用戶曾經(jīng)訪

6、問過的 網(wǎng)站通常會(huì)被優(yōu)先推薦,過度(excessive)或者刻意SEO的 錨文字可能會(huì)從搜索結(jié)果中移除,鏈接間的互聯(lián):如果網(wǎng)頁被高排名網(wǎng)站 鏈接,那么這些網(wǎng)頁排名將靠前,趨勢(shì):如果搜索關(guān)鍵字被大量搜索或最近有 很多相關(guān)的新聞,Google可能會(huì)傾向于最新的結(jié)果,如果同一個(gè)域名返回多個(gè)高排名的結(jié)果, 會(huì)被整合在一起顯示給用戶,顯示不帶廣告的搜索結(jié)果,8,Google工作原理實(shí)例演示(六),其他的廣告顯示在右側(cè),生成用戶看到的搜索結(jié)果頁面, 所有的這一切都在一秒內(nèi)完成, 每天搜索超過3億次, 每年為Google產(chǎn)生200億美元的收入,顯示不帶廣告的搜索結(jié)果,9,謝謝您的收看播放結(jié)束,由于本人水平十分的有限和時(shí)間的倉促, 谷歌搜索引擎內(nèi)幕的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論