第6次小課互聯(lián)網技術_第1頁
第6次小課互聯(lián)網技術_第2頁
第6次小課互聯(lián)網技術_第3頁
第6次小課互聯(lián)網技術_第4頁
第6次小課互聯(lián)網技術_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 學習目的學習目的 學會通過網絡搜索相關資料,找答案,鍛煉積累搜索技巧,好好利用網絡為我們的學習,生活甚至為以后的工作服務,而不是用網絡一味的聊天或是游戲。2一、一、 internetinternet是全球最大的信息源是全球最大的信息源特點:(1)其信息是海量的; (2)是一個動態(tài)性極強的信息源;(3)信息的形式多種多樣;(4)只有很小的一部分信息是有用的.據說99%的web信息相對99%的用戶是無用的。3問題問題: :如何從海量的信息中如何從海量的信息中, ,找到自己需要的內容找到自己需要的內容? ?解決問題的三個前提條件:(1)意識問題 -想到互聯(lián)網“只有你想不到的,沒有你找不到的”“你

2、要的我統(tǒng)統(tǒng)都給你!”(2)找什么?-目標(3)怎樣找?-方法必要的搜索技能,特別是搜索引擎的知識4二、網絡信息的組織形式二、網絡信息的組織形式1、組織形式 網站:綜合的,專門的 目錄及子目錄: 網頁:.htm 或 .html 各類文件: 文本:.txt,.doc,pdf,ppt多媒體:.jpg,.bmp,.avi,.mp3,幫助文件:.chm,軟件:自由軟件、共享軟件等文獻:期刊、雜志、專業(yè)數據庫等52、超鏈接 文本超鏈接 多嫖體超鏈接 文件超鏈接:下載6三、中國四大主流網絡體系三、中國四大主流網絡體系公用計算機互聯(lián)網chinanet中國教育科研網cernet中國科學技術網:(china sc

3、ience and technology network)國家公用經濟信息通信網絡(金橋網)(chinagbn)7 四、搜索引擎四、搜索引擎“大海撈針大海撈針”的利器的利器 1、什么是搜索引擎? 搜索引擎是專門幫助人們查詢信息的站點,通過這些具有強大查找能力的站點,我們可以得到想要的信息。因為這些站點提供全面的信息查詢和良好的搜索速度,就像發(fā)動機一樣強勁有力,所以人們就把這些站點稱為“搜索引擎”。 搜索引擎按一定的策略在互聯(lián)網中搜集、發(fā)現(xiàn)信息,對信息進行理解、提取、組織和處理,并為用戶提供檢索服務,從而起到信息導航的目的。搜索引擎站點也被美譽為“網絡門戶”。搜索引擎技術因而成為計算機界和學術界

4、爭相研究、開發(fā)的對象。82、搜索引擎的分類n目錄式分類搜索引擎n全文搜索引擎(機器人搜索引擎) n分類全文搜索引擎 93、搜索引擎的工作過程包括如下三個過程:1. 在互聯(lián)網中發(fā)現(xiàn)、搜集網頁信息;2. 對信息進行提取和組織建立索引庫;3. 再由檢索器根據用戶輸入的查詢關字,在索引庫中快速檢出文檔,進行文檔與查詢的相關度評價,對將要輸出的結果進行排序,并將查詢結果返回給用戶。10搜集搜集webweb信息信息建立索引庫建立索引庫檢索查詢檢索查詢wwwwww用戶用戶搜集搜集webweb信息信息建立索引庫建立索引庫檢索查詢檢索查詢wwwwww用戶用戶搜索引擎工作流程搜索引擎工作流程11五、搜索引擎的使用

5、五、搜索引擎的使用 以google搜索引擎為例,介紹搜索引擎的使用方法。 1.google搜索引擎的使用方法 google成立于1997年,幾年間迅速發(fā)展成為目前規(guī)模最大的搜索引擎,并向yahoo、aol等其他目錄索引和搜索引擎提供后臺網頁查詢服務。目前google每天處理的搜索請求已達2億次!而且這一數字還在不斷增長。google數據庫存有億個web文件。屬于全文(full text)搜索引擎。 google搜索規(guī)則:以關鍵詞搜索時,返回結果中包含全部及部分關鍵詞;短語搜索時默認以精確匹配方式進行;不支持單詞多形態(tài)和斷詞查詢;字母無大小寫之分,默認全部為小寫。12 要用google搜索,首先

6、要進入google網站。在ie窗口的“地址欄”中輸入google的網址,按回車鍵進入google網站。 google的首頁很清爽,logo下面,排列了四大功能模塊:網站、圖像、網上論壇和網頁目錄,默認是網站搜索,下面逐一介紹這四大功能模塊。13 (1) (1) 網站搜索網站搜索 在該網頁的“搜索框”中輸入要查詢的內容,如“華軟軟件學院”,然后敲一下回車鍵或單擊“google搜索”按鈕。稍等片刻,彈出如圖所示的頁面,在該頁面中顯示了所有關于華軟軟件學院主題的網站,單擊相應的主題即可進入該網站。如果單擊“手氣不錯”按鈕,將自動進入查詢到的第一個網頁,您將完全看不到其它的搜索結果。使用“手氣不錯”進

7、行搜索表示用于搜索網頁的時間較少而用于檢查網頁的時間較多。例如,要查找 “華軟軟件學院”的主頁,只需在“搜索框”中輸入“華軟軟件學院”,然后單擊“手氣不錯”按鈕。將直接帶您進入華軟軟件學院的主頁 。1415 (2) (2) 圖像搜索圖像搜索 google自稱可以檢索390,000,000張圖片,并稱自己為“互聯(lián)網上最好用的圖像搜索工具”。從使用結果來看,google的圖片搜索的確不錯,對中國用戶而言,google的圖片搜索引擎已經是最好的了。 在google搜索引擎首頁中,點擊“圖像”鏈接就進入了google的圖像搜索界面。在“搜索框”中輸入描述圖像內容的關鍵字,如“希望工程”,就會搜索到大量

8、的有關“希望工程”的圖片,如圖所示。比如要在某個版面上插一張專題圖片,用google的圖片搜索功能幾秒鐘就可以搞定。也就是說如果要搜索的圖片是分散的,那么用google圖片搜索將非常方便。1617 (3) 網頁目錄檢索 在google首頁點擊“網頁目錄”鏈接就進入了google的目錄檢索界面,如圖所示。點擊“world”鏈接點,在所打開的頁面中再點擊“chinese_simplified”鏈接點,進入google的中文分類目錄. google 網頁目錄按主題對網頁進行組織整理,這樣,就可以通過瀏覽分類主題來查找用于搜索的關鍵詞。也可以一步步單擊分類鏈接,直至找到您所需要的資料。 分類的網站目錄

9、一般由專人負責,分類明確,信息集中。因此讀者應該養(yǎng)成這樣的習慣:首先考慮所需要的信息能否在一個專門主題的網站上找到。 181920 (4) 新聞群組搜索(網上論壇搜索) 新聞組有詳盡的分類主題,某些主題還有專人管理和編輯,具有大量的有價值信息。由于新聞組包含的信息實在是海量,因此不利用工具進行檢索是不大可能的。在google搜索引擎首頁中,點擊“網上論壇”鏈接進入google的網上論壇搜索界面,如圖4-41所示。在此界面中,有兩種信息查找方式,一種是一層層的點擊進入特定主題討論組,另一種則是直接搜索。如查找一下新聞組中關于山頂洞人的討論信息,則在“搜索框”中輸入“山頂洞人”,單擊“google

10、搜索按鈕”,就會搜索到大量關于山頂洞人的網上論壇,如下圖所示。搜索結果默認按照“內容相關性”排序,但是也可以點擊“按照日期排序”按鈕,讓帖子按照發(fā)布日期排列。2122232.google搜索引擎的使用技巧 (1) 學會使用多個關鍵詞搜索 google用“ ”(空格)表示邏輯“與”操作,也就是說兩個或多個關鍵詞必須同時出現(xiàn)在搜索結果中。例如想了解北京旅游方面的信息,那么在“搜索框”中輸入“北京 旅游”,這樣就能獲取與北京旅游有關的信息。 (2) 學會使用減號“-” google用減號“-”表示邏輯“非”操作?!癮-b”表示搜索包含a但沒有b的網頁?!?”的作用是為了去除無關的搜索結果,提高搜索結

11、果相關性。比如,你要找“申花”的企業(yè)信息,輸入“申花”卻找到一大堆申花隊踢足球的新聞,在發(fā)現(xiàn)這些新聞的共同特征是“足球”后,輸入“申花 -足球”來搜索,就不會再有體育新聞來麻煩你了。24 這里“-”號,是英文字符,在減號之前必須留一空格,操作符(減號)與作用的關鍵字之間,不能有空格。 (3) 搜索結果至少包含多個關鍵字中的任意一個。 google用大寫的“or”表示邏輯“或”操作。搜索“a or b”,意思就是說,搜索的網頁中,要么有a,要么有b,要么同時有a和b。 “或”操作必須用大寫的“or”,而不是小寫的“or”。 (4) 搜索整個短語或者句子用“”(半角) google的關鍵字可以是單

12、詞(中間沒有空格),也可以是短語(中間有空格)。但是,用短語做關鍵字,必須加英文引號,否則空格會被當作“與”操作符。25(5) 搜索引擎忽略的字符以及強制搜索: google對一些網絡上出現(xiàn)頻率極高的英文單詞,如“i”、“com”、“www”等,以及一些符號如“*”、“.”等,作忽略處理。如果要對忽略的關鍵字進行強制搜索,則需要在該關鍵字前加上明文的“+”號或把上述的關鍵字用英文雙引號引起來。 (6) 限制搜索網站 使用site語法,可以將搜索結果局限于某個具體網站,如、,或者是某個域名,如、com等等。如果是要排除某網站或者域名范圍內的頁面,只需用“-網站/域名”即可。26 注意:site后

13、的冒號為英文字符,冒號后不 能有空格,否則,site:將被作為一個搜索 的關鍵字。此外,網站域名不能有http:/” 前綴,也不能有任何“/”的目錄后綴;網站 頻道則只局限于“頻道名.域名”方式,而不能是“域名/頻道名”方式。 (7) 在某一類文件中查找信息 “filetype:”是google開發(fā)的非常強大實用的一個搜索語法。已經能檢索微軟的office文檔,其中最實用的文檔搜索是pdf搜索。pdf文檔通常是一些圖文并茂的綜合性文檔,提供的資訊一般比較集中全面。27 (8) 搜索的關鍵字包含在url鏈接中 使用inurl語法,返回的網頁鏈接中包含第一個關鍵字,后面的關鍵字則出現(xiàn)在鏈接中或者網

14、頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如“mp3”、“gallary”等,于是,就可以用inurl語法找到這些相關資源鏈接,然后,用第二個關鍵詞確定是否有某項具體資料。inurl語法和基本搜索語法的最大區(qū)別在于,前者通常能提供非常精確的專題資料。28 (1 1)錯別字)錯別字(2 2)關鍵詞太常見)關鍵詞太常見(3 3)多義詞)多義詞(4 4)不會輸入關鍵詞,想要什么輸入什么)不會輸入關鍵詞,想要什么輸入什么3.搜索時容易犯的錯誤和解決方法293 3 搜索引擎站點精選搜索引擎站點精選 1.1.雅虎中國(雅虎中國() 雅虎在全球共有24個網站,12種語

15、言版本,其中雅虎中國網站()于1999年9月正式開通,它是雅虎在全球的第20個網站。 中文yahoo在許多人的心目中是搜索引擎的同義詞,名聲在外的yahoo也確有其過人之處,分類目錄查詢就做得相當出色,無論從網站的數量還是分類的合理性方面都可圈可點。站點目錄分為14個大類,每一個大類下面又分若干子類,搜索十分方便。該站點連接速度快,包含范圍廣,數據容量大,簡便易用,是查詢各種信息的好去處。雅虎中國網站為用戶提供了強大的搜索功能,通過其14類簡單易用、手工分類的簡體中文網站目錄及強大的搜索引擎。30 2. 2.百度(百度() “眾里尋她千百度”,“百度”二字是源自辛棄疾的青玉案,象征著百度對中文

16、信息檢索技術執(zhí)著的追求。作為著名的中文搜索引擎,百度擁有全球領先的“超鏈分析”技術,并使用了高性能的“網絡蜘蛛”程序自動的在互聯(lián)網中搜索信息,可定制、高擴展性的調度算法使得搜索器能在極短的時間內收集到最大數量的互聯(lián)網信息。百度在中國各地和美國均設有服務器,搜索范圍涵蓋了中國大陸、香港、臺灣、澳門、新加坡等華語地區(qū)以及北美、歐洲的部分站點。百度搜索引擎還擁有目前世界上最大的中文信息庫,總量達到6000萬頁以上,并且還在以每天幾十萬頁的速度快速增長。31 (1)百度搜索引擎的功能特點 支持主流的中文編碼標準。包括gbk(漢字內碼擴展規(guī)范)、gb2312(簡體)、big5(繁體),并且能夠在不同的編

17、碼之間轉換。 智能相關度算法。采用了基于內容和基于超鏈分析相結合的方法進行相關度評價,能夠客觀分析網頁所包含的信息,從而最大限度保證了檢索結果相關性。 百度搜索支持二次檢索(又稱漸進檢索或逼進檢索)??稍谏洗螜z索結果中繼續(xù)檢索,逐步縮小查找范圍,直至達到最小、最準確的結果集。利于用戶更加方便地在海量信息中找到自己真正感興趣的內容。 相關檢索詞智能推薦技術。在用戶第一次檢索后,會提示 相關的檢索詞,幫助用戶查找更相關的結果,統(tǒng)計表明可以促進檢索量提升10-20%。32 運用多線程技術、高效的搜索算法、穩(wěn)定的unix平臺、和本地化的服務器,保證了最快的響應速度。百度搜索引擎在中國境內提供搜索服務,

18、可大大縮短檢索的響應時間(一個檢索的平均響應時間小于0.5秒) 先進的網頁動態(tài)摘要顯示技術??梢詣討B(tài)摘要顯示網頁中含有用戶查詢字串的任意位置文字,使用戶閱讀和判斷搜索結果更方便更快捷。 獨有百度快照,巧妙解決了搜索用戶經常遇到的死鏈接問題。百度搜索引擎已先預覽各網站,拍下網頁的快照,為用戶貯存大量的應急網頁。百度快照不僅下載速度極快,而且已將用戶查詢字串用不同顏色在網頁中標記。33(2 2)百度搜索引擎使用技巧)百度搜索引擎使用技巧 在搜索框上方選擇要搜索信息的類型,如新聞、mp3、圖片等,將會縮小搜索范圍,達到更好的搜索效果。 在進行第一次搜索后,選中“在結果中查詢”功能,重新輸入查詢內容,可在當前搜索結果中進行精確搜索。 在搜索完成之后,如果效果不理想,可能是輸入的搜索關鍵字不準確,這時可以在網頁下方百度提供的“相關搜索”欄目中選擇與搜索目標最相近的關鍵字再次進行搜索。 使用“百度快照”功能快速打開網頁,查看搜索效果,這將大大提高搜索效率,而且是對付“死鏈接”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論