網(wǎng)絡(luò)信息資源檢索與利用--課內(nèi)實(shí)驗(yàn)二_第1頁(yè)
網(wǎng)絡(luò)信息資源檢索與利用--課內(nèi)實(shí)驗(yàn)二_第2頁(yè)
網(wǎng)絡(luò)信息資源檢索與利用--課內(nèi)實(shí)驗(yàn)二_第3頁(yè)
網(wǎng)絡(luò)信息資源檢索與利用--課內(nèi)實(shí)驗(yàn)二_第4頁(yè)
網(wǎng)絡(luò)信息資源檢索與利用--課內(nèi)實(shí)驗(yàn)二_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)信息資源檢索與利用 課程實(shí)驗(yàn)第 2 次實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)內(nèi)容及基本要求:實(shí)驗(yàn)項(xiàng)目名稱(chēng): 網(wǎng)絡(luò)搜索引擎的應(yīng)用實(shí)驗(yàn)類(lèi)型: 驗(yàn)證每組人數(shù): 1實(shí)驗(yàn)內(nèi)容及要求: 1. 請(qǐng)分別針對(duì)網(wǎng)絡(luò)資源目錄使用的分類(lèi)方法進(jìn)行舉例。2. 在google的分類(lèi)目錄中找到一條路徑指向網(wǎng)站:中國(guó)新聞漫畫(huà)網(wǎng)。3. 在yahoo的分類(lèi)目錄中找到一條路徑指向網(wǎng)站論文:/Summer98/koumoutsakos.pdf。4. 在新浪網(wǎng)的分類(lèi)目錄中找到一條路徑指向?qū)W校的網(wǎng)站:5. 在sohu的分類(lèi)目錄中找到一條路徑指向網(wǎng)站:/Flash/6. 請(qǐng)指出google,yahoo,sina,sohu的分類(lèi)目錄之間的異同和優(yōu)劣(500字以內(nèi))7. 請(qǐng)了解google和baidu在進(jìn)行關(guān)鍵詞檢索中語(yǔ)法的異同,并舉例說(shuō)明這兩者在針對(duì)某一主題進(jìn)行檢索時(shí)檢索結(jié)果的差異以及對(duì)檢索意圖理解準(zhǔn)確度的差異。8. 搜索并了解主流的rss訂閱軟件,完成用rss在兩個(gè)以上網(wǎng)站訂閱兩個(gè)以上專(zhuān)題。實(shí)驗(yàn)結(jié)果:1. 請(qǐng)分別針對(duì)網(wǎng)絡(luò)資源目錄使用的分類(lèi)方法進(jìn)行舉例。(1) 主題分類(lèi)法(2) 學(xué)科分類(lèi)法(3) 圖書(shū)分類(lèi)法(4) 分面組配法2. 在google的分類(lèi)目錄中找到一條路徑指向網(wǎng)站:中國(guó)新聞漫畫(huà)網(wǎng)。3. 在yahoo的分類(lèi)目錄中找到一條路徑指向網(wǎng)站論文: /Summer98/koumoutsakos.pdf4. 在新浪網(wǎng)的分類(lèi)目錄中找到一條路徑指向?qū)W校的網(wǎng)站:5. 在sohu的分類(lèi)目錄中找到一條路徑指向網(wǎng)站:/Flash/6. 請(qǐng)指出google,yahoo,sina,sohu的分類(lèi)目錄之間的異同和優(yōu)劣(500字以內(nèi))7. 請(qǐng)了解google和baidu在進(jìn)行關(guān)鍵詞檢索中語(yǔ)法的異同,并舉例說(shuō)明這兩者在針對(duì)某一主題進(jìn)行檢索時(shí)檢索結(jié)果的差異以及對(duì)檢索意圖理解準(zhǔn)確度的差異。百度搜索引擎使用了高性能的“網(wǎng)絡(luò)蜘蛛”程序自動(dòng)的在互聯(lián)網(wǎng)中搜索信息,可定制、高擴(kuò)展性的調(diào)度算法使得搜索器能在極短的時(shí)間內(nèi)收集到最大數(shù)量的互聯(lián)網(wǎng)信息。百度搜索引擎的特點(diǎn)1. 基于字詞結(jié)合的信息處理方式。巧妙解決了中文信息的理解問(wèn)題,極大地提高了搜索的準(zhǔn)確性和查全率。2. 支持主流的中文編碼標(biāo)準(zhǔn)。包括GBK(漢字內(nèi)碼擴(kuò)展規(guī)范)、GB2312(簡(jiǎn)體)、BIG5(繁體),并且能夠在不同的編碼之間轉(zhuǎn)換。3. 智能相關(guān)度算法。采用了基于內(nèi)容和基于超鏈分析相結(jié)合的方法進(jìn)行相關(guān)度評(píng)價(jià),能夠客觀分析網(wǎng)頁(yè)所包含的信息,從而最大限度保證了檢索結(jié)果相關(guān)性。4. 檢索結(jié)果能標(biāo)示豐富的網(wǎng)頁(yè)屬性(如標(biāo)題、網(wǎng)址、時(shí)間、大小、編碼、摘要等),并突出用戶的查詢串,便于用戶判斷是否閱讀原文。5. 百度搜索支持二次檢索(又稱(chēng)漸進(jìn)檢索或逼進(jìn)檢索)。可在上次檢索結(jié)果中繼續(xù)檢索,逐步縮小查找范圍,直至達(dá)到最小、最準(zhǔn)確的結(jié)果集。利于用戶更加方便地在海量信息中找到自己真正感興趣的內(nèi)容。6. 相關(guān)檢索詞智能推薦技術(shù)。在用戶第一次檢索后,會(huì)提示相關(guān)的檢索詞,幫助用戶查找更相關(guān)的結(jié)果,統(tǒng)計(jì)表明可以促進(jìn)檢索量提升10-20%。7. 運(yùn)用多線程技術(shù)、高效的搜索算法、穩(wěn)定的UNIX平臺(tái)、和本地化的服務(wù)器,保證了最快的響應(yīng)速度。百度搜索引擎在中國(guó)境內(nèi)提供搜索服務(wù),可大大縮短檢索的響應(yīng)時(shí)間(一個(gè)檢索的平均響應(yīng)時(shí)間小于0.5秒)8. 可以提供一周、二周、四周等多種服務(wù)方式。可以在7天之內(nèi)完成網(wǎng)頁(yè)的更新,是目前更新時(shí)間最快、數(shù)據(jù)量最大的中文搜索引擎。9. 檢索結(jié)果輸出支持內(nèi)容類(lèi)聚、網(wǎng)站類(lèi)聚、內(nèi)容類(lèi)聚+網(wǎng)站類(lèi)聚等多種方式。支持用戶選擇時(shí)間范圍,提高用戶檢索效率。10. 智能性、可擴(kuò)展的搜索技術(shù)保證最快最多的收集互聯(lián)網(wǎng)信息。擁有目前世界上最大的中文信息庫(kù),為用戶提供最準(zhǔn)確、最廣泛、最具時(shí)效性的信息提供了堅(jiān)實(shí)基礎(chǔ)。11. 分布式結(jié)構(gòu)、精心設(shè)計(jì)的優(yōu)化算法、容錯(cuò)設(shè)計(jì)保證系統(tǒng)在大訪問(wèn)量下的高可用性、高擴(kuò)展性、高性能和高穩(wěn)定性。12. 高可配置性使得搜索服務(wù)能夠滿足不同用戶的需求。13. 先進(jìn)的網(wǎng)頁(yè)動(dòng)態(tài)摘要顯示技術(shù)。14. 獨(dú)有百度快照,15. 支持多種高級(jí)檢索語(yǔ)法,使用戶查詢效率更高、結(jié)果更準(zhǔn)。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“l(fā)ink:”,還將繼續(xù)增加其它高效的搜索語(yǔ)法。Google作為全球最大的多語(yǔ)言搜索引擎,在國(guó)際上占有的市場(chǎng)越來(lái)越大,成為互聯(lián)網(wǎng)最具潛力的企業(yè),以下就介紹下GOOGLE搜索引擎的主要特點(diǎn):1.特有的PR技術(shù),PR 能夠?qū)W(wǎng)頁(yè)的重要性做出客觀的評(píng)價(jià)。PR是GOOGLE評(píng)價(jià)一個(gè)網(wǎng)站質(zhì)量高低的重要標(biāo)準(zhǔn),PR分為十個(gè)等級(jí),從容不1至10,PR越高代表網(wǎng)站質(zhì)量和權(quán)威性越高,排名也就越靠前。2.更新和收錄快,GOOGLE收錄新站一般在十個(gè)工作日左右,是所有搜索引擎收錄最快的,更新也比較穩(wěn)定,一般一個(gè)星期都會(huì)有大的更新。3.重視鏈接的文字描述和鏈接的質(zhì)量,鏈接的文字描述也就是做鏈接用的文字,這個(gè)文字對(duì)GOOGLE排名起一定作用,因此我們建議如果網(wǎng)站要做某些關(guān)鍵詞,在交換鏈接時(shí)要用這個(gè)關(guān)鍵詞做鏈向你網(wǎng)站,鏈接的質(zhì)量與鏈接網(wǎng)站的權(quán)威性和與你站是否相關(guān)有關(guān),權(quán)威越高側(cè)你站獲得的排名越好,4.重視Description描述,多次研究發(fā)現(xiàn),那些在GOOGLE排名好的網(wǎng)站在描述中勻含有關(guān)鍵詞,而且有些重復(fù)二次,因此可推斷其對(duì)描述還是相當(dāng)重視。五、超文本匹配分析:Google 的搜索引擎同時(shí)也分析網(wǎng)頁(yè)內(nèi)容。并不采用單純掃描基于網(wǎng)頁(yè)的文本(網(wǎng)站發(fā)布商可以通過(guò)元標(biāo)記控制這類(lèi)文本)的方式,而是分析網(wǎng)頁(yè)的全部?jī)?nèi)容以及字體、分區(qū)及每個(gè)文字精確位置等因素。同時(shí)還會(huì)分析相鄰網(wǎng)頁(yè)的內(nèi)容,以確保返回與用戶查詢最相關(guān)的結(jié)果。他們的搜索排序方式與廣告展現(xiàn)也有不同,百度有競(jìng)價(jià)排名,而Google是機(jī)器程序自動(dòng)排序,完全按照預(yù)先設(shè)計(jì)的機(jī)器程

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論