![第四章網(wǎng)絡(luò)信息檢索.ppt.ppt_第1頁](http://file1.renrendoc.com/fileroot2/2020-1/11/65bcecae-754c-4876-9c45-cfcc04e26a8c/65bcecae-754c-4876-9c45-cfcc04e26a8c1.gif)
![第四章網(wǎng)絡(luò)信息檢索.ppt.ppt_第2頁](http://file1.renrendoc.com/fileroot2/2020-1/11/65bcecae-754c-4876-9c45-cfcc04e26a8c/65bcecae-754c-4876-9c45-cfcc04e26a8c2.gif)
![第四章網(wǎng)絡(luò)信息檢索.ppt.ppt_第3頁](http://file1.renrendoc.com/fileroot2/2020-1/11/65bcecae-754c-4876-9c45-cfcc04e26a8c/65bcecae-754c-4876-9c45-cfcc04e26a8c3.gif)
![第四章網(wǎng)絡(luò)信息檢索.ppt.ppt_第4頁](http://file1.renrendoc.com/fileroot2/2020-1/11/65bcecae-754c-4876-9c45-cfcc04e26a8c/65bcecae-754c-4876-9c45-cfcc04e26a8c4.gif)
![第四章網(wǎng)絡(luò)信息檢索.ppt.ppt_第5頁](http://file1.renrendoc.com/fileroot2/2020-1/11/65bcecae-754c-4876-9c45-cfcc04e26a8c/65bcecae-754c-4876-9c45-cfcc04e26a8c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章搜索引擎、學(xué)習(xí)目標(biāo)、知識目標(biāo)熟悉搜索引擎的基本知識各種搜索引擎的特征能力目標(biāo)學(xué)會使用各種搜索引擎獲取信息(1)網(wǎng)絡(luò)基本知識1、網(wǎng)絡(luò)通信協(xié)議互聯(lián)網(wǎng)通信協(xié)議群集(TCP/IP): TCP傳輸控制協(xié)議IP internet協(xié)議:向指定的地址發(fā)送信息,負(fù)責(zé)信息傳輸時的定位和尋址。 2 .網(wǎng)站:互聯(lián)網(wǎng)上計(jì)算機(jī)的地址。 IP地址:用32位的二進(jìn)制表示,用“.”符號分為4段。 0255示例: 24域名:以英文字符串表示網(wǎng)絡(luò)上計(jì)算機(jī)的地址,以便于讀取和寫入。 結(jié)構(gòu)主機(jī)名.機(jī)構(gòu)名.網(wǎng)絡(luò)類型.頂級域名示例: URL (統(tǒng)一資源定位符) :確定特定信息資源在網(wǎng)絡(luò)中的位置。 結(jié)構(gòu):應(yīng)用協(xié)
2、議、主機(jī)地址、文件路徑和文件名示例: (http是超文本傳輸協(xié)議吉林大學(xué)圖書館的主機(jī)地址/jsk/index.htm是目錄路徑和文件名。) (1)網(wǎng)絡(luò)基本知識3、互聯(lián)網(wǎng)上的信息資源(由其傳輸協(xié)議分開) WWW萬維網(wǎng):世界規(guī)模的信息網(wǎng)絡(luò)。 是互聯(lián)網(wǎng)上最主要最直觀的信息資源。 互聯(lián)網(wǎng)論壇:是最豐富、自由、開放的網(wǎng)絡(luò)信息資源。 FTP文件傳輸服務(wù):可以從遠(yuǎn)程計(jì)算機(jī)獲取和下載文件,也可以將文件從本地計(jì)算機(jī)上載到遠(yuǎn)程計(jì)算機(jī)。 (2)網(wǎng)絡(luò)信息檢索的一般方法通過網(wǎng)絡(luò)資源指南,利用搜索信息的網(wǎng)絡(luò)信息檢索工具,搜索信息的:網(wǎng)絡(luò)檢索工具搜索引擎。 有機(jī)地組織世界各地的相關(guān)信息資源,用戶可以通過互聯(lián)網(wǎng)獲得所需的文本
3、、圖像、電影、聲音等信息。 (3)www搜索引擎,定義:廣義的搜索引擎,是指基于互聯(lián)網(wǎng)提供信息管理、查詢、搜索等服務(wù)的工具、系統(tǒng)和網(wǎng)站。 狹義的搜索引擎是指為了利用ROBOT軟件自動搜索互聯(lián)網(wǎng)上的面對面和網(wǎng)站信息資源而特別修正的搜索服務(wù)軟件。 常用的更嚴(yán)格的搜索引擎定義: (1)目錄搜索引擎:初始搜索引擎收集因特網(wǎng)中的資源服務(wù)器的地址,按照所提供的資源的類型分類為不同的目錄,進(jìn)一步分級。 多數(shù)信息面向網(wǎng)站,提供目錄閱覽服務(wù)和直接檢索服務(wù)。 優(yōu)勢:信息準(zhǔn)確,導(dǎo)航質(zhì)量高的缺點(diǎn):需要人工干預(yù),維護(hù)量大,信息量少,來不及更新信息。 代表:雅虎! 搜索狐分類目錄,2個搜索引擎的類型,(2)全文搜索引擎:
4、大型機(jī)運(yùn)行的程序按照某些策略自動在互聯(lián)網(wǎng)上收集和發(fā)現(xiàn)信息,索引器將收集的信息建立索引,搜索器根據(jù)用戶的查詢輸入建立索引服務(wù)方式面向全文檢索服務(wù)。 優(yōu)勢:信息量大、更新及時、無需人工干預(yù)的缺點(diǎn):返回的信息太多,可能有很多不相關(guān)的信息,用戶必須從結(jié)果中過濾。 代表:谷歌,百度,天網(wǎng)系統(tǒng)結(jié)構(gòu)信息收集子系統(tǒng)(搜索器)索引子系統(tǒng)(索引器)搜索子系統(tǒng)(搜索器)用戶界面,2搜索引擎類型,(3)元搜索:沒有自己的數(shù)據(jù),用戶的問題3搜索引擎的搜索功能和技術(shù)(常用語法規(guī)則),搜索技術(shù)選擇合適的搜索工具,同時至少使用2個搜索工具進(jìn)行搜索。提取合適的關(guān)鍵字是指檢索關(guān)鍵字正確使用布爾邏輯或其他操作符號的作用來限制“域”
5、的功能、3檢索引擎的檢索功能和技術(shù)(常用語法規(guī)則)、修正器運(yùn)算符1、使用邏輯運(yùn)算符(布爾邏輯檢索技術(shù)) (1)AND(* ) :邏輯上“and”。 搜索表達(dá)式表示:NC機(jī)床*目錄(2)OR () :邏輯上表示“or”,如果用它連接兩個詞匯,或者表示該詞匯或者該詞匯出現(xiàn)在搜索結(jié)果中,當(dāng)然可能出現(xiàn)兩個詞匯擴(kuò)大檢索范圍,提高全檢查率。 /檢索修正算法和編程語言的文獻(xiàn)。 檢索式:補(bǔ)正機(jī)算法OR補(bǔ)正機(jī)編程語言。 (3)NOT(-) :邏輯上表示“不”,使用它連接兩個詞匯的話,就會檢索包含NOT以前的詞匯的文件,但包含NOT以后的詞匯的文件除外。 例:檢索互聯(lián)網(wǎng)以外的補(bǔ)正機(jī)關(guān)文獻(xiàn)檢索式: computer
6、 - Internet或computer NOT Internet的優(yōu)先順序: NOT AND OR用括弧變更該檢索式,構(gòu)筑多層次檢索式。 例如:“汽車使用和維護(hù)”用布爾邏輯關(guān)系表示其檢索式汽車AND (使用OR維護(hù)),2、優(yōu)先運(yùn)算符: () 3、位置運(yùn)算符: Nn(near):運(yùn)算符兩側(cè)的檢索詞接近,詞序必須顛倒。 Wn(with ) :運(yùn)算符兩側(cè)的檢索詞必須接近,語序也不能顛倒。 4、切片檢索技術(shù):“?” “*”字符串檢索也稱為精密檢索,需要雙引號、引號的使用目的,是為了向檢索引擎?zhèn)鬟_(dá)將幾個關(guān)鍵字作為完整的組合字符串進(jìn)行檢索。 (檢索句子和句子整體)字段限制檢索(限定檢索)加權(quán)檢索擴(kuò)展檢索
7、,高級檢索功能1,自然語言檢索:將自然語言中的某個詞,某個詞,某個句子直接作為檢索提問方式進(jìn)行信息檢索。 2 .模糊檢索3、精密檢索4、管道檢索5、區(qū)分大小寫的檢索6、概念檢索7、相關(guān)信息反饋檢索8、檢索范圍的限制、檢索引擎檢索技巧簡單檢索雙引號(“)檢索加號()檢索:某詞匯必須出現(xiàn)在檢索結(jié)果中減號(-)搜索:強(qiáng)調(diào)搜索結(jié)果中不顯示單詞。 括號()搜索:空間搜索通配符(*? 搜索:區(qū)分大小寫進(jìn)行搜索的布爾邏輯搜索元詞搜索,(4)常用的中文搜索引擎和特點(diǎn),1996年2月服務(wù)的臺灣番茄芋藤搜索引擎,標(biāo)志著中文搜索引擎的正式開始。 此后,華澤、奇摩、悠游等中文搜索引擎相繼出現(xiàn)在港臺的中國大陸上,四路利
8、方公司(新浪網(wǎng)前身)開發(fā)了國內(nèi)最早的中文搜索引擎Richsurf后,又開發(fā)了網(wǎng)易、搜索客、常青藤、北極星、搜索狐、新浪、北大天網(wǎng)、百度等搜索引擎。 以下是一些著名的中文搜索引擎: 1、谷歌搜索引擎2、百度搜索引擎3、中文雅虎4、搜索狐搜索引擎5、新浪搜索引擎6、網(wǎng)易搜索引擎7、天網(wǎng)中文搜索引擎、(4)常用中文搜索引擎和特征谷歌在全球每天處理的搜索請求達(dá)到2億次,谷歌數(shù)據(jù)庫中存儲了42.8億個WEB文件。 不是第一個搜索引擎,而是當(dāng)前最成功的搜索引擎。 03年全球市場占有率達(dá)到79,Yahoo! 中斷合作后,市場占有率仍為51 . 2000年進(jìn)入中國,迅速成為大眾喜愛的搜索引擎。 谷歌學(xué)術(shù)搜索為
9、搜索學(xué)術(shù)文獻(xiàn)提供了專業(yè)搜索工具。 1、谷歌搜索引擎,谷歌特征(1)提供常規(guī)和高級搜索功能。用戶可以從10到100個信息條目中選擇搜索結(jié)果頁面中包含的條目數(shù)。 提供網(wǎng)站內(nèi)的咨詢、橫向的相關(guān)咨詢,提供特殊的主題搜索等。 (2)語言支持:允許用100種以上的語言進(jìn)行檢索。 (3)搜索規(guī)則:按關(guān)鍵字搜索時,短語搜索返回結(jié)果中包含的關(guān)鍵字的全部和部分,默認(rèn)情況下不支持單詞的多形態(tài)和斷詞搜索。 1、谷歌中文搜索引擎、基本搜索(1)布爾邏輯技術(shù)在谷歌的應(yīng)用自動使用“and”進(jìn)行查詢,不需要在關(guān)鍵詞之間加上“and”或“”。 如果想縮小搜索范圍,可以輸入更多關(guān)鍵詞,在關(guān)鍵詞之間留出空格。 例:圣誕老人2000
10、報價! 搜索結(jié)果必須不包含特定的信息。 減號“-”“表示邏輯”不是“動作”(-前面加空格)。 例:“歷史-文化”! 您可以使用“”將這些單詞壓在搜索詞上,但必須在“”前加空格。 不要! 支持“或”搜索。 archie OR蜘蛛”(2)谷歌不支持詞干法、通配符。 (3)無視詞問題可以自動忽略“http”、“com”、“www”、“的”和“*”、“”等符號無視詞,用英語雙引號將這些無視詞壓在檢索項(xiàng)目上。 基本檢索(4)用專用語詢問。 用雙引號括住術(shù)語可以進(jìn)行準(zhǔn)確的搜索。 用于搜索明文或?qū)S妹~。 /對社會的貢獻(xiàn)等于價值。 (5)搜索不區(qū)分字母大小寫,用小寫處理所有字符。 (6)拼音漢字自動轉(zhuǎn)換,支
11、持模糊的拼音檢索。 搜索“萬羅興文”后,發(fā)現(xiàn)“您在找什么:網(wǎng)絡(luò)新聞嗎? 否則這些變更僅會影響目前的文件。 谷歌的特殊功能(高級檢索) (1)限制檢索的網(wǎng)站。 只需在搜索框中鍵入site:即可搜索中文教育科研網(wǎng)站()上包括古龍?jiān)趦?nèi)的所有頁面。 搜索:“古龍site: (2)在某種文件中搜索信息。 要查找PDF、Microsoft(doc、ppt、xls、rtf )等各種格式的文件,輸入“關(guān)鍵字filetype:doc”即可。 例:“電子商務(wù)filetype:doc” (3)訂正計(jì)算機(jī)。 內(nèi)置了提供簡單的修正算法、復(fù)雜的科學(xué)修正算法、單位換算、各種物理常數(shù)等的修正算法機(jī)。 (4)相似頁面。 單擊“
12、類似于網(wǎng)頁”后,搜索引擎將搜索與該網(wǎng)頁相關(guān)的網(wǎng)頁。 (5)鏈接搜索:搜索鏈接到某個URL地址的所有網(wǎng)頁.在搜索框中輸入 link: ,將顯示指向該網(wǎng)站的所有網(wǎng)頁. 但是,不能與關(guān)鍵詞檢索并用。 例如,“l(fā)ink:”指定要搜索的范圍,并且“1”、“intitle (或title )”將搜索范圍限制為頁面標(biāo)題中的頁面標(biāo)題,這通常是頁面內(nèi)容的抽出表達(dá)式的總結(jié)。 如果將詢問內(nèi)容的范圍限定為網(wǎng)頁標(biāo)題,則有時得到良好的效果。 例如,intitle:劉德華注意不要在intitle:和后續(xù)關(guān)鍵字之間加空格。 例如:搜索劉德華的寫真集:照片intitle:劉德華指定搜索范圍,2,site將搜索范圍限定在特定網(wǎng)站
13、的site,知道某個網(wǎng)站有自己想要搜索的內(nèi)容,將搜索范圍限定在這個網(wǎng)站,提高搜索效率使用方法是在詢問內(nèi)容后面加上“site:域名”。 例如,文獻(xiàn)檢索site 3360注意“site:”后面的站點(diǎn)域名不要有“http:/”,并且不要在site 3360和站點(diǎn)名之間加入空格或site。 site還可以搜索域中的示例內(nèi)容。 關(guān)鍵字site:edu在教育網(wǎng)絡(luò)(.edu )中搜索示例。 搜索中文教育科學(xué)研究網(wǎng)站()上的所有內(nèi)容:“古龍site:注意:關(guān)鍵字和site之間必須有空格,冒號和點(diǎn)必須為半角,指定搜索對象的范圍,3,inurl在url鏈接中的網(wǎng)頁url中實(shí)現(xiàn)方法是“inurl:”,后面是出現(xiàn)在u
14、rl中的關(guān)鍵字。 例如:查找photoshop的用法搜索表達(dá)式: photoshop inurl:jiqiao上的此查詢字符串的“photoshop”可以在網(wǎng)頁上的任意位置顯示,“jiqiao”必須顯示在網(wǎng)頁的url上inurl:語法和后續(xù)關(guān)鍵字不得包含空格。 搜索同義詞-,可以在單詞前面加上符號來搜索同義詞。 例如,您可以搜索house,搜索house,搜索定義define。 define:關(guān)鍵字示例: define:css相當(dāng)于搜索css的定義。 如果無法打開網(wǎng)頁結(jié)果,請單擊網(wǎng)頁的快照以顯示該網(wǎng)頁。 (7)手的調(diào)子好:按下“手的調(diào)子好”按鈕,谷歌就會自動進(jìn)入搜索的第一頁,完全看不到其他的搜
15、索結(jié)果。 (8)自動糾錯功能:糾錯軟件系統(tǒng)自動掃描輸入的關(guān)鍵字,檢查是否有誤字,提供糾正可能誤字的提示。 (9)中英語詞典。 只要輸入“(翻譯、FY、FY中的任意一個)想查的中(英)句的單詞”即可。 (十)查詢天氣、股票、郵政編碼、手機(jī)號碼。 要查看天氣,只需輸入城市名稱天氣(天氣、TQ、TQ之一)即可查詢股價和股市行情,只需輸入股名或代碼股。要查詢郵政編碼或長途電話號碼, 只需輸入“想查的城市地名或者郵政編碼或者電話號碼或者區(qū)號”就可以常用的中文搜索引擎和特點(diǎn)2、百度搜索引擎百度公司于1999年底在美國的硅谷設(shè)立,回國發(fā)展。 百度()作為國內(nèi)最大的商業(yè)化搜索引擎,其功能完整,搜索結(jié)果匹配度極
16、高,尤其是其MP3搜索功能,是目前國內(nèi)技術(shù)水平最高的搜索引擎之一。 目前,全國有36個大網(wǎng)站采用百度引擎。 百度搜索引擎、百度產(chǎn)品(1)網(wǎng)頁搜索:擁有世界上最大的中文搜索引擎,總量超過3.5億網(wǎng)頁。 (2)MP3檢索:從每天更新的3億5千萬的中文網(wǎng)頁中提取MP3下載鏈接,構(gòu)筑MP3歌庫。 提供歌曲名稱歌詞檢索功能,還具有自動驗(yàn)證下載速度的功能,下載速度最快者排名靠前。 (3)新聞檢索:是目前世界上最大的中文新聞檢索平臺,每天發(fā)布8萬到10萬條新聞。 新聞來源包括500多個權(quán)威網(wǎng)站(4)的帖子。 如果web搜索不能滿足您的要求,請發(fā)布查詢請求,用別人的知識、想法和經(jīng)驗(yàn)來解決您的問題。 百度搜索引擎,(5)圖片搜索:目前世界上最大的中文畫廊。 可以直接輸入任意關(guān)鍵字,搜索所需的圖像數(shù)據(jù),支持圖像大小和圖像格式的搜索,還可以快速分類圖像閱覽導(dǎo)航。 下車吧。 用戶可以與互聯(lián)網(wǎng)上的其他用戶輕松、快速、安全地上傳和下載大容量電影、游戲、音樂、軟件和照片。 (7)網(wǎng)站:百度網(wǎng)站導(dǎo)航采用主題分類的方法,人工維持更新,推薦最優(yōu)秀的網(wǎng)絡(luò)資源,目前網(wǎng)站導(dǎo)航共分為4大類,60多個子類別。 (8)搜索風(fēng)云榜。 基于每天數(shù)千萬次的搜索數(shù)據(jù),提供最有權(quán)威的中文搜索風(fēng)云排行榜,例如金曲排行榜、小說排行榜、人物排行榜等。 (9)地區(qū)檢索:通過選擇某省、自治區(qū)、地區(qū)的信息資源進(jìn)行檢索
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 腎內(nèi)分泌科護(hù)理工作總結(jié)
- 2025年全球及中國醫(yī)用全自動凝血分析儀行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國企業(yè)級機(jī)械硬盤和固態(tài)硬盤行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球3D晶體管行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球立式不銹鋼離心泵行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球汽車電池試驗(yàn)箱行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國游戲人工智能NPC行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030全球自動藥敏分析儀行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國無線藍(lán)牙肉類溫度計(jì)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國固定橋式坐標(biāo)測量機(jī)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025-2030年中國清真食品行業(yè)運(yùn)行狀況及投資發(fā)展前景預(yù)測報告
- 廣東省茂名市電白區(qū)2024-2025學(xué)年七年級上學(xué)期期末質(zhì)量監(jiān)測生物學(xué)試卷(含答案)
- 《教育強(qiáng)國建設(shè)規(guī)劃綱要(2024-2035年)》全文
- 山東省濱州市2024-2025學(xué)年高二上學(xué)期期末地理試題( 含答案)
- 2025年河南洛陽市孟津區(qū)引進(jìn)研究生學(xué)歷人才50人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年度軍人軍事秘密保護(hù)保密協(xié)議與信息安全風(fēng)險評估合同3篇
- 數(shù)字化轉(zhuǎn)型中的職業(yè)能力重構(gòu)
- 運(yùn)用PDCA降低住院患者跌倒-墜床發(fā)生率
- 2025屆高中數(shù)學(xué)一輪復(fù)習(xí)專練:橢圓(含解析)
- 立春氣象與生活影響模板
- 中國服裝零售行業(yè)發(fā)展環(huán)境、市場運(yùn)行格局及前景研究報告-智研咨詢(2025版)
評論
0/150
提交評論