因特網(wǎng)信息資源檢索課件_第1頁(yè)
因特網(wǎng)信息資源檢索課件_第2頁(yè)
因特網(wǎng)信息資源檢索課件_第3頁(yè)
因特網(wǎng)信息資源檢索課件_第4頁(yè)
因特網(wǎng)信息資源檢索課件_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、因特網(wǎng)信息資源檢索搜索引擎(Search Engine)是一種用于幫助因特網(wǎng)用戶查詢信息的搜索工具,它以一定的策略在因特網(wǎng)中搜集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織的處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的。 信息檢索目錄索引類搜索引擎全文搜索引擎 sogou sina 按目錄類別查找搜索:比如:查高考資料選擇“教育”類目沒(méi)找到“高考”,就找 “教育”里跟接近“高考”的“中小學(xué)教育”找到啦! 按關(guān)鍵詞語(yǔ)查找搜索:注意啦,要先在這里輸入關(guān)鍵字!現(xiàn)在可以按“搜索”按鈕了點(diǎn)擊我就可以進(jìn)入“高考”有關(guān)內(nèi)容了!工作原理全文搜索引擎的工作原理搜索引擎是如何搜索信息的呢?你聽(tīng)說(shuō)過(guò)“網(wǎng)絡(luò)機(jī)器人”、

2、“爬蟲”、“蜘蛛”嗎?他們只是搜索引擎的一個(gè)部分,叫“搜索器”搜索器定期自動(dòng)到各網(wǎng)站上抓取網(wǎng)頁(yè)搜索引擎的組成索引器 分析抓取的網(wǎng)頁(yè),索引,存入服務(wù)器的數(shù)據(jù)庫(kù)中檢索器接收用戶提交的關(guān)鍵詞,從索引數(shù)據(jù)庫(kù)中提取相關(guān)資源,顯現(xiàn)結(jié)果 搜索器 索引器 輸入查詢表達(dá)式 查詢結(jié)果顯示 查詢信息排序 采集結(jié)果索引數(shù)據(jù)庫(kù)檢索器 索引 排序 用戶查詢查詢結(jié)果信息采集篩選全文搜索引擎的工作原理:百度搜索“海南概括”:百度蜘蛛 輸入“海南概括” 查詢結(jié)果顯示 查詢信息排序 檢索器 索引器 索引數(shù)據(jù)庫(kù) 索引 排序 用戶查詢查詢結(jié)果檢索中國(guó)日?qǐng)?bào)網(wǎng) 爬中國(guó)在線海南概括頁(yè)面網(wǎng)址 抓抽取“海南、概括”等關(guān)鍵字 抽取關(guān)聯(lián) 工作原理

3、目錄索引類搜索引擎的工作原理(1)人工采集和存儲(chǔ)網(wǎng)絡(luò)信息,手工為每個(gè)網(wǎng)站確定一個(gè)標(biāo)題,給出大概的描述,建立關(guān)鍵字索引,將其放入相應(yīng)的類目體系中。 (2)網(wǎng)絡(luò)目錄: 按主題性質(zhì)分類 以某種分類體系為依據(jù) 形成由信息鏈組成的樹(shù)狀結(jié)構(gòu) 即總目錄專題目錄鏈接網(wǎng)站先分領(lǐng)域,后分各科專題 ,最后列出網(wǎng)站特點(diǎn)和區(qū)別目錄索引全文索引無(wú)需輸入關(guān)鍵字,可通過(guò)瀏覽主題了解某一主題的相關(guān)資源 需要關(guān)鍵字查詢 人工采集并存儲(chǔ)網(wǎng)絡(luò)信息 搜索器在因特網(wǎng)中抓取網(wǎng)頁(yè),索引器提取、組織并建立數(shù)據(jù)庫(kù) 網(wǎng)頁(yè)內(nèi)容豐富、學(xué)術(shù)性較強(qiáng)信息資源多、復(fù)雜,不易了解主題內(nèi)容維護(hù)費(fèi)用大、更新速度慢 搜索器定期自動(dòng)“抓”網(wǎng)頁(yè) 元搜索引擎(2019年出

4、現(xiàn))是一種調(diào)用其他多個(gè)獨(dú)立搜索引擎的引擎,是對(duì)多個(gè)獨(dú)立搜索引擎的整合、調(diào)用、控制和優(yōu)化,能方便地檢索多個(gè)搜索引擎,擴(kuò)大檢索范圍,提高檢索的全面性。元搜索引擎在搜索的時(shí)候,用戶只需提交一次搜索請(qǐng)求,而且可以同時(shí)搜索多個(gè)數(shù)據(jù)庫(kù),并根據(jù)多個(gè)搜索引擎的檢索結(jié)果進(jìn)行二次加工,如對(duì)檢索結(jié)果進(jìn)行重排和標(biāo)明檢索結(jié)果來(lái)源等,輸出給用戶。缺點(diǎn):一般支持AND、OR、NOT等操作,一般只使用簡(jiǎn)單、直接的搜索策略,并且檢索速度也慢。元搜索引擎 當(dāng)我們查找圖片、音頻等信息時(shí),使用綜合信息檢索引擎通常會(huì)找到很多無(wú)用的信息,所以搜索效率和有效性都不高。這時(shí),就可以使用特色搜索引擎(有時(shí)是綜合信息檢索工具中的一個(gè)功能),特色

5、檢索工具專門搜集某一類的信息資源,內(nèi)容豐富,數(shù)據(jù)量大,能幫助我們迅速找到一些有用的信息。 此外還有一些專業(yè)性質(zhì)的搜索引擎,如SOSIG是專門搜集社會(huì)科學(xué)信息的信息檢索工具(sosig.ac.uk),涉及經(jīng)濟(jì)學(xué)、哲學(xué)、教育、政治、環(huán)境科學(xué)、心里學(xué)、人類學(xué)、社會(huì)福利、政府管理和婦女研究等信息資源。特色信息檢索工具 以FTP、Telnet、Usenet等資源為檢索對(duì)象的檢索工具。 如北大天網(wǎng)、Archic等。其他信息檢索工具發(fā)展趨勢(shì) 專業(yè)垂直搜索引擎多媒體信息檢索傳統(tǒng)的多媒體數(shù)據(jù)庫(kù)中,除了文本和數(shù)字還包括圖形、圖象、聲音、視頻、動(dòng)畫等各種媒體組合。但多媒體信息具有豐富的內(nèi)涵,如:圖象的顏色、紋理、形狀,動(dòng)畫中的運(yùn)動(dòng)、聲音和音調(diào)等。例如歌曲的旋律、音調(diào)、音質(zhì)等難以用文字描述。這正是基于內(nèi)容的音頻檢索需要研究和解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論