2022年信息檢索----使用搜索引擎_第1頁
2022年信息檢索----使用搜索引擎_第2頁
2022年信息檢索----使用搜索引擎_第3頁
2022年信息檢索----使用搜索引擎_第4頁
2022年信息檢索----使用搜索引擎_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、.精選文檔精選文檔.精選文檔上機一 信息檢索-使用搜索引擎1.1上機目的1掌握百度搜索引擎的根本檢索技術(shù);2了解百度搜索引擎的高級檢索技術(shù)。1.2上機內(nèi)容按照上機實施步驟進行搜索引擎使用練習。1.3上機操作步驟1.3.1百度公司概述百度公司Baidu ,Inc于1999年底成立于美國硅谷,它的創(chuàng)立者是資深信息檢索技術(shù)專家、超鏈分析專利的唯一持有人百度總裁李彥宏,及其好友百度執(zhí)行副總裁徐勇博士。百度是目前全球最優(yōu)秀的中文信息檢索與傳遞技術(shù)供應商。中國所有提供搜索引擎的門戶網(wǎng)站中,超過80%以上都由百度提供搜索引擎技術(shù)支持。百度搜索引擎由四局部組成:蜘蛛程序、監(jiān)控程序、索引數(shù)據(jù)庫、檢索程序。百度搜

2、索引擎使用了高性能的“網(wǎng)絡蜘蛛程序自動的在互聯(lián)網(wǎng)中搜索信息,可定制、高擴展性的調(diào)度算法使得搜索器能在極短的時間內(nèi)收集到最大數(shù)量的互聯(lián)網(wǎng)信息。百度在中國各地和美國均設有效勞器,搜索范圍涵蓋了中國大陸、香港、臺灣、澳門、新加坡等華語地區(qū)以及北美、歐洲的局部站點。百度搜索引擎擁有目前世界上最大的中文信息庫,總量到達1億2千萬頁以上,并且還在以每天幾十萬頁的速度快速增長。1.3.2根本檢索技術(shù)1.3.2.1“與運算與運算可以增加搜索范圍。運算符為“空格或“+。圖1-1 “與運算示意1圖1-2 “與運算示意21.3.2.2“非運算“非運算可以減除無關(guān)資料。運算符為“-()。減號前必須留一空格、減號后即括

3、號前面不要有空格,語法是“A B。有時候,排除含有某些詞語的資料有利于縮小查詢范圍。圖1-3 “非運算示意1.3.2.3“或運算“或運算為并行搜索。運算符為“|。使用A | B來搜索或者包含關(guān)鍵詞A,或者包含關(guān)鍵詞B,或者包含A、B的網(wǎng)頁。圖1-4 “或運算示意1.3.2.4使用雙引號或書名號進行精確搜索引號必須是半角符號即英文符號。用雙引號可以進行整句話的精確搜索。如,我們想在網(wǎng)上查一下什么是搜索引擎,如果把關(guān)鍵字確定為“搜索引擎,那么得到的結(jié)果可能會讓我們哭笑不得,因為根本上是一些搜索引擎注冊、哪個網(wǎng)站是搜索引擎之類的,但換關(guān)鍵字呢?輸入什么是搜索引擎。圖 STYLEREF 1 s 15

4、雙引號運算示意書名號是百度獨有的一個特殊查詢語法。在其他搜索引擎中,書名號會被忽略,而在百度,中文書名號是可被查詢的。加上書名號的查詢詞,有兩層特殊功能,一是書名號會出現(xiàn)在搜索結(jié)果中;二是被書名號擴起來的內(nèi)容,不會被拆分。 書名號在某些情況下特別有效果,例如,查名字很通俗和常用的那些電影或者小說。比方,查電影“ ,如果不加書名號,很多情況下出來的是通訊工具 ,而加上書名號后,? ?結(jié)果就都是關(guān)于電影方面的了。圖 STYLEREF 1 s 16 書名號運算示意1.3.2.5百度快照當上網(wǎng)的時候遇到過“該頁無法顯示找不到網(wǎng)頁的錯誤信息時,百度快照能為您很好的解決這個問題。百度搜索引擎已先預覽各網(wǎng)站

5、,拍下網(wǎng)頁的快照,為用戶貯存大量應急網(wǎng)頁。百度快照功能在百度的效勞器上保存了幾乎所有網(wǎng)站的大局部頁面,使我們在不能鏈接所需網(wǎng)站時,暫存的網(wǎng)頁也可救急。而且通過百度快照尋找資料要比常規(guī)鏈接的速度快得多。因為:百度快照的效勞穩(wěn)定,下載速度極快,不受死鏈接或網(wǎng)絡堵塞的影響;在快照中,關(guān)鍵詞均已用不同顏色在網(wǎng)頁中標明,一目了然;點擊快照中的關(guān)鍵詞,還可以直接跳到它在文中首次出現(xiàn)的位置,使瀏覽網(wǎng)頁更方便。圖 STYLEREF 1 s 17 百度快照示意1.3.2.6相關(guān)檢索如果無法確定輸入什么關(guān)鍵詞才能找到滿意的資料,或者選擇的查詢詞不是很妥當。我們可以通過參考別人是怎么搜的,來獲得一些啟發(fā)。百度的“相

6、關(guān)搜索,就是和您的搜索很相似的一系列查詢詞。首先輸入一個簡單詞語搜索,然后,百度搜索引擎會為您提供“其它用戶搜索過的相關(guān)搜索詞作參考。百度相關(guān)搜索排布在搜索結(jié)果頁的下方,按搜索熱門度排序。點擊任何一個相關(guān)搜索詞,都能得到那個相關(guān)搜索詞的搜索結(jié)果。圖 STYLEREF 1 s 18 “相關(guān)搜索示意1.3.2.7其他根本檢索技術(shù)除了上述列出的幾種,百度還提供了其他的根本搜索技術(shù),如英漢互譯詞典、計算器和度量衡轉(zhuǎn)換、股票和列車時刻表查詢、天氣查詢、貨幣換算、拼音提示、錯別字提示等搜索技術(shù)。圖 STYLEREF 1 s 19 詞典示意圖圖 STYLEREF 1 s 1 SEQ 圖 * ARABIC s

7、 1 10 列車車次查詢示意圖 STYLEREF 1 s 1 SEQ 圖 * ARABIC s 1 11 錯別字提示示意1.3.3高級檢索技術(shù)1.3.3.1專業(yè)文檔搜索很多有價值的資料,在互聯(lián)網(wǎng)上并非是普通的網(wǎng)頁,而是以Word、PowerPoint、PDF等格式存在。百度支持對Office文檔包括Word、Excel、Powerpoint、Adobe PDF文檔、RTF文檔進行了全文搜索。要搜索這類文檔,很簡單,在普通的查詢詞后面,加一個“filetype:文檔類型限定?!癴iletype:后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有這些文件

8、類型。例如,查找張五常關(guān)于交易費用方面的經(jīng)濟學論文?!敖灰踪M用 張五常 filetype:doc,點擊結(jié)果標題,直接下載該文檔,也可以點擊標題后的“HTML版,快速查看該文檔的網(wǎng)頁格式內(nèi)容。圖 STYLEREF 1 s 112 文檔搜索1.3.3.2把搜索范圍限定在網(wǎng)頁標題中intitle網(wǎng)頁標題通常是對網(wǎng)頁內(nèi)容提綱挈領(lǐng)式的歸納。把查詢內(nèi)容范圍限定在網(wǎng)頁標題中,有時能獲得良好的效果。使用的方式,是把查詢內(nèi)容中,特別關(guān)鍵的局部,用“intitle:領(lǐng)起來。根本語法為:intitle+:+關(guān)鍵字1+空格+關(guān)鍵字2圖 STYLEREF 1 s 113 intitle示意1.3.3.3把搜索范圍限定在

9、特定網(wǎng)站中site有時候,您如果知道某個站點中有自己需要找的東西,就可以把搜索范圍限定在這個站點中,提高查詢效率。使用的方式,是在查詢內(nèi)容的后面,加上“site:站點域名。例如,天空網(wǎng)下載軟件不錯,就可以這樣查詢:msn site:skycn 注意,“site:后面跟的站點域名,不要帶“ :/;另外,site:和站點名之間,不要帶空格。圖 STYLEREF 1 s 114 site示意1.3.3.4把搜索范圍限定在url鏈接中inurl網(wǎng)頁url中的某些信息,常常有某種有價值的含義。于是,您如果對搜索結(jié)果的url做某種限定,就可以獲得良好的效果。實現(xiàn)的方式,是用“inurl:,后跟需要在url

10、中出現(xiàn)的關(guān)鍵詞。例如,找關(guān)于photoshop的使用技巧,可以這樣查詢:photoshop inurl:jiqiao上面這個查詢串中的“photoshop,是可以出現(xiàn)在網(wǎng)頁的任何位置,而“jiqiao那么必須出現(xiàn)在網(wǎng)頁url中。注意,inurl:語法和后面所跟的關(guān)鍵詞,不要有空格。圖 STYLEREF 1 s 115 inurl示意1.4上機體會1百度搜索引擎由哪幾局部構(gòu)成,各自的功能為何?搜索引擎一般由搜索器、索引器、檢索器和用戶接口四個局部組成。搜索器:其功能是在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息;索引器:其功能是理解搜索器所搜索到的信息,從中抽取出索引項,用于表示文檔以及生成文檔庫的索引表;檢索器:其功能是根據(jù)用戶的查詢在索引庫中快速檢索文檔,進行相關(guān)度評價,對將要輸出的結(jié)果排序,并能按用戶的查詢需求合理反響信息;用戶接口:其作用是接納用戶查詢、顯示查詢結(jié)果、提供個性化查詢項。2請結(jié)合自己的學科,設計一個查找該學科相關(guān)文獻的實例。比方,你所在學科為“信息管理,我們可以通過將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論