




已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
搜索引擎工作原理簡單模擬,上海易聞SEO培訓(xùn)班,前言,這里的模擬非常簡單和傻瓜,但可以說明搜索引擎是如何處理頁面的過程。 第一步:通過蜘蛛抓取頁面; 什么是蜘蛛? 如何抓取頁面?以文本形式下載,送會服務(wù)器。,第一步:通過蜘蛛抓取頁面,什么是蜘蛛? Googlebot、baiduspider、 Yahoo、Slurp、Msnbot 如何抓取頁面? 以文本形式下載,送會服務(wù)器。 可能會做一些預(yù)處理,比如:壓縮等 可能妨礙蜘蛛抓取的行為:跳轉(zhuǎn)、識別分辨率,第二步:網(wǎng)頁文件處理,首先過濾所有HTML標(biāo)簽、CSS樣式表、JS代碼 工具:/Seo/Spider.asp,百度一下,你就知道新 聞網(wǎng) 頁貼 吧知 道MP3圖 片幫助高級 空間 | 更多把百度設(shè)為首頁企業(yè)推廣|搜索風(fēng)云榜|關(guān)于百度|AboutBaidu2007Baidu使用百度前必讀京ICP證030173號,百度首頁經(jīng)過處理后得到后的樣子:,第三步:識別文字內(nèi)容,通過對過濾后文字內(nèi)容的分析,來判斷網(wǎng)頁的核心內(nèi)容。,百度一下,你就知道新 聞網(wǎng) 頁貼 吧知 道MP3圖 片幫助高級 空間 | 更多把百度設(shè)為首頁企業(yè)推廣|搜索風(fēng)云榜|關(guān)于百度|AboutBaidu2007Baidu使用百度前必讀京ICP證030173號,搜索引擎程序通過對上面文字的分析,發(fā)現(xiàn)以下信息: 一共有95個(gè)字符;其中56個(gè)中文字。 “百度”出現(xiàn)4次,共8個(gè)中文,占16個(gè)字符。 8560.14 14% 1695 0.1616% 判斷結(jié)論:本頁面和關(guān)鍵詞“百度”有密切關(guān)系。,第四步:進(jìn)行權(quán)重分值技術(shù),假設(shè)關(guān)鍵詞重復(fù)1次得1分,那百度首頁的得分就是“4” 當(dāng)然,搜索引擎的真實(shí)計(jì)算過程非常負(fù)責(zé),有數(shù)百個(gè)參數(shù)參與計(jì)算。 YAHOO!的工程師告訴我: “所有搜索引擎最核心的是外部鏈接的技術(shù)和關(guān)鍵詞密度的技術(shù)”,第五步:存入排名數(shù)據(jù)庫,通過以上各種分析后,一個(gè)頁面就可以存入排名數(shù)據(jù)庫了(也叫索引數(shù)據(jù)庫)。 百度首頁就可能放入一個(gè)叫“百度”的小數(shù)據(jù)庫中。 以后當(dāng)用戶搜索“百度”時(shí),就打開“百度”小數(shù)據(jù)庫,然后按分值排列,做成HTML展示到用戶面前。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 出門演出合同范本
- 低價(jià)改造廠房合同范本
- 農(nóng)家葡萄售賣合同范本
- 保險(xiǎn)分銷服務(wù)合同范本
- 個(gè)人過橋資金合同范本
- 協(xié)議酒店價(jià)格合同范本
- 保險(xiǎn)變更合同范本
- 企業(yè)對外投資合同范本
- 個(gè)人門店裝修合同范本
- 醫(yī)療公司供貨合同范本
- 《國際金融》課件國際金融導(dǎo)論
- 各種el34名膽電子管評測
- 超分子化學(xué)-杯芳烴課件
- 車標(biāo)識別 課講義件課件
- 一年級下學(xué)期安全教育教案
- 哈薩克斯坦共和國勞動法解讀
- 送達(dá)地址確認(rèn)書(樣本)
- 甘肅省酒泉市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)
- 壓力容器考試審核考試題庫(容標(biāo)委-氣體協(xié)會聯(lián)合)
- 學(xué)校食堂操作流程圖
- DB13 2795-2018 大清河流域水污染物排放標(biāo)準(zhǔn)
評論
0/150
提交評論