版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
信息與引擎搜索第一頁,共一百二十二頁,2022年,8月28日第一節(jié)信息素質
一、信息素質
1、定義:信息素質是人們在工作中運用信息、學習信息技術、利用信息解決問題的能力。
第二頁,共一百二十二頁,2022年,8月28日2、信息素質構成要素:
信息意識:強烈的信息意識——對信息敏感。
信息能力:信息的搜集獲取能力主要包括信息接受能力力;信息捕捉能力;信息吸收能力;信息檢索能力等。其中信息檢索能力指熟悉各種信息源,掌握信息檢索的基礎理論和基本技術,熟練地利用各種手工檢索工具和計算機檢索系統(tǒng)查找所需信息的能力。信息道德:在信息領域中用以規(guī)范人們相互關系的思想觀念與行為準則。
第三頁,共一百二十二頁,2022年,8月28日3、信息素質可分為:工具素質:能用印刷和電子信息資源的有關工具,如計算機、軟件等;資源素質:了解信息資源的種類、形式和查找、檢索方法;社會結構素質:掌握信息的社會地位、作用、影響;研究素質:掌握利用信息進行有關學科研究的技能;出版和傳播信息素質:能利用文本或多媒體報告研究結果。第四頁,共一百二十二頁,2022年,8月28日
4、美國信息素質評價1999年1月,美國大學與圖書館協(xié)會通過了“美國高等教育中學生信息素質能力標準”,共5條,每條附有具體的操作說明,為教師或圖書館對學生、用戶、讀者的信息素質評價提供了依據。這5條主要內容如下:(1)能確定信息資源的特點和范圍;(2)能有效地獲取所需信息;(3)能評價信息及其來源,(4)利用其知識基礎和價值系統(tǒng)選擇適當?shù)男畔?;?)能有效利用所獲得的信息實現(xiàn)特定的目標;第五頁,共一百二十二頁,2022年,8月28日美國信息素質評價要點:(1)能運用新的和以前的信息開發(fā)新產品或項目;(2)能調整開發(fā)產品或項目的過程;(3)能與別人就產品或項目情況進行有效的溝通(4)了解信息使用的經濟、法律和社會問題,在信息獲取和利用時自覺遵守道德規(guī)范和有關的法律。(即在產品或項目開發(fā)中能正確使用有關信息資源,如合理使用或引用等)第六頁,共一百二十二頁,2022年,8月28日第二節(jié)信息與科研一、學術研究中的時間分配據美國科學基金會統(tǒng)計,一個科研人員花費在查找和消化科技資料上的時間需占全部科研時間的51%,計劃思考占8%,實驗研究占32%,書面總結占9%。由上述統(tǒng)計數(shù)字可以看出,科研人員花費在科研文獻查詢的時間為全部科研時間一半還要多。第七頁,共一百二十二頁,2022年,8月28日信息檢索、分析。。。SynthesisofAminoAcids1JACS19952JOC1987SynthesisofAminoAcids問題?創(chuàng)意?試驗、計算。。。發(fā)表:口頭報告、論文、專利。。。1JACS19952JOC1987SynthesisofAminoAcidsSynthesisofAminoAcids新的問題?發(fā)展、延伸。。。同行評價、引用、應用。。。二、科研流程圖第八頁,共一百二十二頁,2022年,8月28日三、科研選題和文獻檢索科技信息是知識創(chuàng)新的源泉:世界上任何一項科研成果或創(chuàng)新都是在吸取和借鑒前人或他人研究成果的基礎上,再加上自己的鉆研和創(chuàng)新所獲得的。科技信息是科研的先決條件。第九頁,共一百二十二頁,2022年,8月28日四、科研選題及其步驟課題是為了實現(xiàn)某個特定目標所需要研究的一個或一組科學問題。
科研選題就是形成、選擇和確定所要研究和解決的課題??蒲羞x題的步驟一般是:文獻調研和實際考察——提出選題——初步論證——評議和確定課題。第十頁,共一百二十二頁,2022年,8月28日第十一頁,共一百二十二頁,2022年,8月28日第三節(jié)、Internet概論
一、Internet簡介
INTERNET中文譯為因特網,它是由眾多計算機網絡互聯(lián)而成的,也稱網間網(NetworkofNetworks),是覆蓋全球的信息交流與共享網絡。計算機網絡是一個數(shù)據通信系統(tǒng),是由相互獨立的計算機相互連接在一起的計算機集合,它跨越了時空的限制,最大限度地實現(xiàn)了信息資源的共享。計算機網絡經過了由最簡單的兩臺計算機通過諸如電纜連接而成,發(fā)展到今天的由全世界上億臺計算機通過電纜、光纜和無線等方式連通的全球Internet。第十二頁,共一百二十二頁,2022年,8月28日二、計算機網絡的分類:(按分布距離的長短)1、局域網(LAN):將有限范圍內的各計算機、終端和外部設備互聯(lián)成網??煞譃楣蚕硎胶徒粨Q式兩種。最大距離不超過10KM。特點是容易管理與配置,拓撲結構簡潔整齊,傳輸速率高、延遲短、成本低、應用廣、級網方便、使用靈活。例如圖書館網絡。2、城域網(MAN):將現(xiàn)有的局域網互連起來的一種規(guī)模較大的城市范圍內的網絡。范圍為幾十公里。3、廣域網(WAN):一種跨城市、地區(qū)甚至國家的遠程網絡。采用分組交換技術,點對點通信技術。4、互聯(lián)網(Internet):將不同的物理網絡技術按某種協(xié)議統(tǒng)一起來的一種高層技術。第十三頁,共一百二十二頁,2022年,8月28日三、Internet在中國的發(fā)展1986年撥號到歐洲一些國家,1994年4月正式接入Internet網。四個骨干網:中國公用計算機互聯(lián)網(Chinanet)中國教育與科研計算機網(Cernet)中國科技計算機網(Cstnet)中國金橋互聯(lián)網(ChinaGBN)第十四頁,共一百二十二頁,2022年,8月28日四、Internet相關概念1、傳輸控制協(xié)議/網間協(xié)議(TCP/IP)傳輸控制協(xié)議/網間協(xié)議:(TransmissionControlProtocol/InternetProtocol/TCP/IP)是Internet的基礎協(xié)議。是不同型號的計算機和操作系統(tǒng)進行數(shù)據傳輸?shù)囊环N規(guī)則。TCP/IP協(xié)議好比因特網上一種公共語言,使來自各個不同國家和地區(qū)的人們可以相互交流和建立聯(lián)系。第十五頁,共一百二十二頁,2022年,8月28日2、IP地址為了保證Internet上的計算機(主機)在通信時能相互識別,TCP/IP協(xié)議要求Internet上任何一臺計算機都有一個不允許重復的地址,這個地址就是IP地址(InternetProtocolAddress)。IP地址由四組數(shù)字組成,每組數(shù)字中間用點隔開,如:是的主機在Internet上的IP地址。圖書館購買的數(shù)據庫的使用權限絕大多數(shù)通過IP控制。第十六頁,共一百二十二頁,2022年,8月28日3、WWWWWW(WorldWideWeb),譯為萬維網。是一種基于超文本(Hypertext)方式的信息查詢工具。
WWW通過這種超文本的方式,把世界各地服務器上的信息連接在一起,圖文并茂地顯示在用戶面前。
WWW基于以下幾個基本概念:
超文本標記語言(HTML)超文本傳輸協(xié)議(HTTP)統(tǒng)一資源定位符(URL)瀏覽器(BROWSER)WEB服務器(WEBSERVER)第十七頁,共一百二十二頁,2022年,8月28日4、瀏覽器(Browser)瀏覽器是用戶訪問WWW的工具。與其它瀏覽器不同的是WWW瀏覽器不僅可以瀏覽簡單的二進制文件,還可以瀏覽超文本標記語言中所能描述的圖形、圖像、聲音、動畫、表格以及進一步的連接信息。目前流行的瀏覽器主要有:NetscapeNavigator和MicrosoftInternetExplorer(簡稱IE)。第十八頁,共一百二十二頁,2022年,8月28日IE瀏覽器是目前應用最普遍的瀏覽器。通常計算機WINDOWS桌面上,可以找到上面的圖標,這就是IE瀏覽器的標示。雙擊它可打開瀏覽器。第十九頁,共一百二十二頁,2022年,8月28日五、Internet的主要服務功能(1)電子郵件服務(E-mail)(2)文件傳輸服務(Ftp)(3)遠程登錄服務(4)萬維網(5)電子論壇(BBS、Blog)第二十頁,共一百二十二頁,2022年,8月28日第四節(jié)網絡信息資源一、網絡信息資源定義(NetworkInformationResource)
指以電子數(shù)據的形式將文字、圖像、聲音、動畫等多種形式的信息存放在光磁等非印刷質的載體中,并通過網絡通信、計算機或終端等方式再現(xiàn)出來的信息資源。隨著因特網的迅速發(fā)展和普及,網絡信息資源主要指放置在因特網上的信息集合,但并非包含所有因特網信息,而只是指其中能滿足人們信息需求的那一部分。第二十一頁,共一百二十二頁,2022年,8月28日二、網絡信息資源的類型1、依據信息源的信息內容則可將網絡信息源分為以下類型:
(1)聯(lián)機數(shù)據庫各類數(shù)據庫是聯(lián)機存儲電子信息源的主體,據統(tǒng)計,僅至1991年中期,世界上就有數(shù)據庫7600個。目前,很多重要的數(shù)據庫都已經聯(lián)入Internet,僅DIALOG就有400多個。這些數(shù)據庫包括各個學科,涉及各種文獻的信息。第二十二頁,共一百二十二頁,2022年,8月28日(2)聯(lián)機館藏目錄庫目前Internet上的電子圖書館很多,國內外的許多圖書館都已經在網上提供服務。包括美國國會圖書館在內的許多著名公共圖書館、大學圖書館及學術機構的圖書館的館藏機讀目錄庫,通過網絡對外開放,提供OPAC(圖書館聯(lián)機公共目錄查詢系統(tǒng))服務。第二十三頁,共一百二十二頁,2022年,8月28日(3)網絡圖書電子圖書在Internet上越來越多,電子圖書涉及的領域特別廣泛,包括文學、藝術、科學、人文等各個領域。其中網上的電子詞典、百科全書更是獨樹一幟。(4)網絡報刊在Internet上,已有很多的電子期刊對用戶提供服務。世界著名的《Times》、《Forbes》、《Science》、《Nature》等都有網絡電子版。我國的很多刊物報紙也都已經上網提供服務。如:《人民時報》、《經濟日報》第二十四頁,共一百二十二頁,2022年,8月28日(5)軟件與娛樂游戲類網上的這類資源也很多,且大都是免費的。如Internet上有搜索引擎的介紹、語言幫助、幼兒教育之類的培訓信息。而且隨著遠程教育的發(fā)展,這類信息的數(shù)量將大量增加。(6)動態(tài)性信息在Internet上有許多動態(tài)性信息,如BBS、廣告、新聞時事等。第二十五頁,共一百二十二頁,2022年,8月28日三、文獻信息網絡檢索工具網絡檢索工具,是指在因特網上提供信息檢索服務的計算機系統(tǒng),其檢索的對象是存在于因特網信息空間中各種類型的網絡信息資源。
科研文獻信息網絡檢索主要分為兩種方式:
網絡資源檢索
專業(yè)數(shù)據庫檢索第二十六頁,共一百二十二頁,2022年,8月28日第五節(jié)網絡資源檢索方法
網絡資源檢索和數(shù)據庫檢索有相同之處,也有不同點,總的來講,網絡資源檢索的目標是檢索與要求相關的網站或網頁,通過這些網站或網頁所提供的信息來決定檢索的最終選擇。網絡資源檢索的方法主要有以下幾種:
一、布爾邏輯檢索大多數(shù)網絡檢索工具都支持布爾邏輯檢索,即:用布爾邏輯算符來表達檢索詞之間的邏輯關系。
第二十七頁,共一百二十二頁,2022年,8月28日常用的布爾邏輯算符有:邏輯或(+,OR)邏輯與(*,AND)邏輯非(--,NOT)邏輯或(+,OR):表達檢索詞間的并列關系??蓴U大檢索范圍,提高查全率。如:A+B,表明結果中含有A或B都為檢索命中邏輯與(*,AND):表達檢索詞間的交叉關系??煽s小檢索范圍,提高查準率。如:A*B,表明結果必須同時含有A和B才為命中
邏輯非(-,NOT):表達檢索詞間的排除關系??煽s小檢索范圍,提高查準率,但要慎用。如:A—B,表明結果是A中不包含B的那部分。第二十八頁,共一百二十二頁,2022年,8月28日邏輯或邏輯與邏輯非ABABAB第二十九頁,共一百二十二頁,2022年,8月28日第三十頁,共一百二十二頁,2022年,8月28日第三十一頁,共一百二十二頁,2022年,8月28日第三十二頁,共一百二十二頁,2022年,8月28日二、截詞檢索(通配符檢索)又稱詞干檢索、模糊檢索。檢索時,只需用詞干加截詞符號,凡是含有與該詞干相同的文獻均能被檢出。該方法能很好避免漏檢現(xiàn)象的出現(xiàn)。
檢索系統(tǒng)不同,截詞符也不同,常用的有:#,?,*等。
截詞檢索也是一般數(shù)據庫檢索中常用的方法。
截詞的方式有多種,按截斷部位可分為右截斷、左截斷、中間截斷、復合截斷等;按截斷長度可以分為有限截斷和無限截斷。第三十三頁,共一百二十二頁,2022年,8月28日
1.右截斷:截去某個詞的尾部,是詞的前方一致比較,也稱前方一致檢索。例如:輸入geolog?(?為截斷符號),將會把含有geological、geologic、geologist、geologize、geology等詞的記錄檢索出來。而在搜索引擎中,目前多只提供右截法。而且搜索引擎中的截詞符則通常采用星號*。如educat*。相當于education+educational+educator。
若輸入PY=199?,會把90年代的記錄全部查出來。
第三十四頁,共一百二十二頁,2022年,8月28日2.左截斷:截去某個詞的前部,是詞的后方一致比較,也稱后方一致檢索。例如:輸入?magnetic能夠檢出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等詞的記錄。
3.中間截斷:截去某個詞的中間部分,是詞的兩邊一致比較,也稱兩邊一致檢索。例如:輸入organi?ation可以檢出organization、organisation;輸入f??t可查出foot、feet。
第三十五頁,共一百二十二頁,2022年,8月28日4.復合截斷:是指同時采用兩種以上的截斷方式。例如?chemi?可以檢出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。第三十六頁,共一百二十二頁,2022年,8月28日按截斷長度可以分為有限截斷和無限截斷。1、.有限截斷:是指允許截去有限個字符。例如“acid??”表示截去一個字符,它可檢出acid、acids,但不能檢出acidic、acidicity、acidity等詞。又如comput????可檢出compute、computer、computers、computing等詞,不能檢出computable、computation、computerize等詞。
注意:詞干后面連續(xù)的數(shù)個問號是截斷符,表示允許截去字符的個數(shù),最后一個問號是終止符,它與截斷符之間要有一個空格,輸入時一定要注意。
第三十七頁,共一百二十二頁,2022年,8月28日2、無限截斷:是指允許截去的字符數(shù)量不限,也稱開放式截斷。上面右截斷、左截斷所舉的例子均屬此類型。
任何一種截詞檢索,都隱含著布爾邏輯檢索的“或”運算。采用截詞檢索時,既要靈活、又要謹慎,截詞的部位要適當,如果截得太短(輸入的字符不得少于3個),將增加檢索噪聲,影響查準率。
第三十八頁,共一百二十二頁,2022年,8月28日另外,不同的機檢系統(tǒng)使用的截詞符不同、各數(shù)據庫所支持的截斷類型也不同,例如DIALOG系統(tǒng)和STN系統(tǒng)用?、ORBIT系統(tǒng)用:、BRS系統(tǒng)用$、ESA-IRS系統(tǒng)用+等。并不是所有檢索工具都能使用通配符檢索,有些檢索工具可以自動截詞,如:Yahoo。第三十九頁,共一百二十二頁,2022年,8月28日第四十頁,共一百二十二頁,2022年,8月28日三、詞組檢索詞組檢索是將一個詞組(通常用雙引號“”括起)當作一個獨立運算單元,進行嚴格匹配,以提高檢索的精度和準確度,它也是一般數(shù)據庫檢索中常用的方法。
如:要檢索“計算機網絡”方面的網站或網頁,可輸入“computernetwork”。詞組檢索實際上體現(xiàn)了臨近位置運算(Near運算)的功能,即它不僅規(guī)定了檢索式中各個具體的檢索詞及其相互間的邏輯關系,而且規(guī)定了檢索詞之間的臨近位置關系。第四十一頁,共一百二十二頁,2022年,8月28日幾乎所有的搜索引擎都支持詞組檢索,并且都采用雙引號來代表詞組,如“信息教育”。但在Infoseek中,除了用雙引號外,還使用了短橫線“-”來代表詞組,如digital-library-definition,區(qū)別在于以“-”表示的詞組不區(qū)分大小寫。
InfoSeek是1995年2月由InfoSeek公司推出的搜索引擎。2001年2月InfoSeek改用Overture的搜索結果。
InfoSeek公司后被Disney公司兼并,InfoSeek搜索引擎成為G的一部分,并采用Google的引擎技術。其網址是::
第四十二頁,共一百二十二頁,2022年,8月28日第四十三頁,共一百二十二頁,2022年,8月28日第四十四頁,共一百二十二頁,2022年,8月28日四、限制檢索
限制檢索(Range)是通過限制檢索范圍,達到優(yōu)化檢索結果的方法。限制檢索的方式有多種,例如進行字段檢索、使用限制符、采用限制檢索命令等。
1.字段檢索:是把檢索詞限定在某個/些字段中,如果記錄的相應字段中含有輸入的檢索詞則為命中記錄,否則檢不中。
在搜索引擎中,字段檢索多表現(xiàn)為限制前綴符的形式。第四十五頁,共一百二十二頁,2022年,8月28日屬于主題字段限制的有:Title,Subject,Keywords,Summary等。
屬于非主題字段限制的有:Image,Text等。字段限制也可以用縮寫:
TI(題名)AU(作者)AB(文摘)JN(刊名)PY(年代)LA(語種)……如:information/TILA=english文摘=網絡信息資源
第四十六頁,共一百二十二頁,2022年,8月28日作為一種網絡檢索工具,搜索引擎提供了許多帶有典型網絡檢索特征的字段限制類型,如主機名(host);域名(domain);鏈接(link);URL(site);新聞組(newsgroup)和E-mail限制等。這些字段限制功能限定了檢索詞在數(shù)據庫記錄中出現(xiàn)的區(qū)域。由于檢索詞出現(xiàn)的區(qū)域對檢索結果的相關性有一定的影響,因此,字段限制檢索可以用來控制檢索結果的相關性,以提高檢索效果。在著名的搜索引擎中,目前能提供較豐富的限制檢索功能的有AltaVista,Lycos和Hotbot等。第四十七頁,共一百二十二頁,2022年,8月28日
如:用標題字段檢索時可輸入標題字段的標示符,通常是英文詞“title”加“:”構成。用URL字段檢索時用輸入“url”加“:”,冒號后面跟上檢索式。如:檢索標題為運動與健康方面的網頁,可以輸入:title:sportandhealth,冒號后不能有空格。并不是所有檢索工具的標題字段檢索都使用titlt,如:Yahoo的標題字段檢索可使用“title”也可使用“t”。因此,要根據不同的檢索工具的檢索功能使用檢索詞或標示符。除常用的標題字段以外,還有域名字段、主機字段及出版物字段等。第四十八頁,共一百二十二頁,2022年,8月28日第四十九頁,共一百二十二頁,2022年,8月28日
2.使用限制符:用表示語種、文獻類型、出版國家、出版年代等的字段標識符來限制檢索范圍。例如要查找1999年出版的英文或法文的微型機或個人計算機方面的期刊,則檢索式為:(microcomputer??/de,ti,abORpersonalcomputer/ti,ab)ANDPY=1999AND(LA=ENORFR)ANDDT=Serial
第五十頁,共一百二十二頁,2022年,8月28日
3.使用范圍符號:
如:、Lessthan、Greaterthan、Fromto等,如查找1989~1999年的文獻,可表示為:PY=1989:1999或者PY=1989toPY=1999
又如查找2000年以來的計算機方面的文獻,可表示為computer??AndGreaterthan1999查找在指定的文摘號范圍內有關地震方面的文獻,可表示為earthquake?/635000-800000第五十一頁,共一百二十二頁,2022年,8月28日
4.使用限制指令:限制指令可以分為:一般限制指令(Limit,它對事先生成的檢索集合進行限制)、全限制指令(Limitall,它是在輸入檢索式之前向系統(tǒng)發(fā)出的,它把檢索的全過程限制在某些指定的字段內)。
例如:LimitS5/328000-560000表示把先前生成的第5個檢索集合限定在指定的文摘號內。又如:Limitall/de,ti表示將后續(xù)檢索限定在敘詞和題名字段。
上述幾種限制檢索方法既可獨立使用,也可以混合使用。第五十二頁,共一百二十二頁,2022年,8月28日五、位置算符通過位置算符對復合檢索詞進行加工,限定詞與詞之間的位置關系,提高檢準率。
(W)算符:表示該算符兩邊的檢索詞順序排列,不能顛倒,且除空格和標點符號外,不能插入其他詞或字母。
例:High(w)Strength結果:HighStrengthHigh_Strength在google,yahoo,baidu中,檢索“產品(W)蒸餾”,都沒有得到理想結果。第五十三頁,共一百二十二頁,2022年,8月28日
(nW)算符:允許兩詞間最多插入n個詞例:Heat(1W)Combustion結果:HeatofCombustion
(N)算符:除空格和標點符號外,不得插入其它詞或字母,但兩詞順序可以顛倒。例:money(N)supply結果:moneysupplysupplymoney
(nN)算符:兩詞順序可以顛倒,中間可以插入最多n個詞。例:number(2N)theory結果:numbertheorytheoryofnumbertheoryofthenumber第五十四頁,共一百二十二頁,2022年,8月28日
六、加權檢索加權檢索:用專門符號規(guī)定某個檢索詞在檢索結果中的權值
例:+environment表示關鍵詞environment必須出現(xiàn)在結果中例:-truck表示關鍵詞truck一定不能出現(xiàn)在結果中第五十五頁,共一百二十二頁,2022年,8月28日第六節(jié)網絡資源檢索工具搜索引擎一、搜索引擎的定義:
搜索引擎(SearchEngine)是INTERNET上完成各種信息檢索任務的一種工具。廣義上是指一種基于INTERNET的信息查詢系統(tǒng),包括信息抓取、信息管理和信息檢索;狹義上是指一種為搜集INTERNET上的網頁信息而設計的檢索軟件。它通過分析Web頁面的標題并跟蹤它們所含的具體信息,整理成含有站點及Web頁的URL、關鍵字等信息的龐大數(shù)據庫,并根據用戶的檢索請求,返回其需要的信息。第五十六頁,共一百二十二頁,2022年,8月28日二、搜索引擎的主要功能:1、在INTERNET上搜集信息;2、對搜集到的信息進行標引和分類等處理,并以此來建立或更新數(shù)據庫;3、接受用戶的訪問,提供實時的檢索服務。作為因特網上專門提供網上信息查詢服務的網站,搜索引擎可以在浩如煙海的網站中迅速查找有效信息,具有強大的導航作用,已經成為人們上網時必備的工具。第五十七頁,共一百二十二頁,2022年,8月28日中文雅虎若比鄰中文搜索引擎天網百度搜索客1.AltaVista()2.Excite()3.Webcrawler()4.Lycos()5.Opentext()6.Infoseek()7.Yahoo!()8.HotBot()10.Magellan()第五十八頁,共一百二十二頁,2022年,8月28日三、典型搜索引擎Yahoo
1、Yahoo簡介
Yahoo!是世界上第一個搜索引擎,也是Internet最著名的查詢系統(tǒng),提供免費查詢服務。
Yahoo!是由兩名斯坦福大學電機工程博士生DavidFilo和JerryYang(楊致遠,華人)于1994年開發(fā)的,并于1995年成立Yahoo!公司。
Yahoo!擁有第一流的Web目錄和最佳的新聞鏈接以及許多附加服務,因而Yahoo擁有許多用戶,每天約有400萬人次訪問,在短短的幾年里,Yahoo就成為網上最熱門的搜索工具,而且還為Internet增添了無窮魅力。第五十九頁,共一百二十二頁,2022年,8月28日Yahoo!對收集到的信息都進行嚴格的審核和分類,從而保證了內容饋乏的網站不會在Yahoo!中找到。如果用戶的檢索要求沒有滿足,Yahoo會自動將用戶的檢索要求轉到Google進行查尋。在瀏覽器地址框鍵入即進入Yahoo!世界。第六十頁,共一百二十二頁,2022年,8月28日第六十一頁,共一百二十二頁,2022年,8月28日第六十二頁,共一百二十二頁,2022年,8月28日2、Yahoo搜索功能:
Yahoo!提供一些操作符用以對檢索項的限定,主要包括以下幾種:
(1)+:表示結果中必須包含這個詞,如:+market檢索表示檢索結果中必須含有market一詞。(2)-:表示限定檢索字串一定不要出現(xiàn)在結果中,如:+market-survey表示檢索結果中一定不包含有survey一詞。注意“-”與詞之間不能有空格。第六十三頁,共一百二十二頁,2022年,8月28日(3)詞組檢索:把檢索詞放在雙引號“”中,則此檢索詞作為短語檢索,如“AmericanMarketingAssociation”。若沒有雙引號則表示各單詞為“或”的關系,即“+”功能。
(4)截詞檢索:通配符號用“*”,但詞干部分必須有3個字母。
(5)字段檢索:Yahoo允許兩種類型的字段檢索,title和url。
t:表示只查網站名稱,如t:football,在網站名稱中查football。u:表示只查詢網址(url),u:football網址中含football。第六十四頁,共一百二十二頁,2022年,8月28日3、Yahoo搜索方式:
目錄查詢
普通搜索
高級搜索第六十五頁,共一百二十二頁,2022年,8月28日(1)Yahoo目錄查詢Yahoo的真正優(yōu)勢在于其分類目錄的內容組織,其目錄和分類系統(tǒng)比其它搜索引擎詳細。Yahoo數(shù)據庫有65,000篇HTML文獻和其它Internet資源,共20多萬個條目,提供優(yōu)秀的主題瀏覽工具,對網站信息按主題建立分類索引,按字母順序列出14個大類,每個大類所包含的子類有精煉的描述,每個子類有數(shù)以千計的相關Internet網站信息。
Yahoo的目錄查詢使用很簡單,只要進入其主題分類界面,選定所查主題,逐級進入即可。如查科學技術,鏈接科學技術選項即可。第六十六頁,共一百二十二頁,2022年,8月28日第六十七頁,共一百二十二頁,2022年,8月28日(2)Yahoo普通搜索打開Yahoo!主頁進入普通搜索界面,在窗口的對話框中直接輸入關鍵詞進行檢索,此時將在Categories(類目);WebSites(網站);WebPages(網頁);NewsStories(新聞故事);NetEvents(網絡新聞);Images(圖像);Products(產品)中進行。Yahoo!會從其數(shù)據庫里檢索符合條件的主題目錄的Web站點,其結果依次為站點(TheWeb),目錄(Directory),新聞(News),Products(產品),要想查看檢索到的目錄、站點和新聞,直接點擊即可。第六十八頁,共一百二十二頁,2022年,8月28日第六十九頁,共一百二十二頁,2022年,8月28日第七十頁,共一百二十二頁,2022年,8月28日第七十一頁,共一百二十二頁,2022年,8月28日(3)Yahoo高級搜索(AdvancedSearch):高級搜索界面提供多種選擇,包括搜索方式、搜索范圍、時間范圍以及顯示結果數(shù)等,同時,還提供了檢索詞的邏輯組配方式,包括
邏輯與(includeallofthewords)詞組檢索(includethisexactphrase)邏輯或(includeatleastoneofthesewords)邏輯非(excludethesewords)第七十二頁,共一百二十二頁,2022年,8月28日第七十三頁,共一百二十二頁,2022年,8月28日第七十四頁,共一百二十二頁,2022年,8月28日第七十五頁,共一百二十二頁,2022年,8月28日第七十六頁,共一百二十二頁,2022年,8月28日第七十七頁,共一百二十二頁,2022年,8月28日4、Yahoo搜索結果:Yahoo!搜尋引擎會根據分類類目網站信息與關鍵字的相關程度來排列出相關的Yahoo!類目和網站。影響相關程度的因素有:與關鍵詞相同的詞的多少,相同的詞愈多,表示相關程度愈高。(2)與關鍵詞完全符合(ExactMatch),相關程度高于部分符合。(3)與關鍵詞符合的詞的位置。網站名稱(或新聞標題)符合關鍵詞的相關程度高于網址(或新聞內文)符合關鍵詞的網站。(4)對新聞檢索而言,新聞更新的時間也是搜尋結果排序的考慮要素,最新更新的新聞將優(yōu)先列出。第七十八頁,共一百二十二頁,2022年,8月28日四、典型搜索引擎Google()1、Google簡介Google由兩位斯坦福大學的博士生LarryPage和SergeyBrin于1998年創(chuàng)立。GoogleInc.于1999年創(chuàng)立。Google通過自己的公共站點提供服務。Google收錄的網站內容豐富,在主頁中使用“I`mfeelinglucky”,“手氣不錯”按鈕,可以使檢索直達與關鍵詞最相關的網站中,這是該搜索引擎的一個特色。Google包含20多億網頁,搜索速度快。現(xiàn)在,Google每天提供1.5億次查詢服務。第七十九頁,共一百二十二頁,2022年,8月28日第八十頁,共一百二十二頁,2022年,8月28日
2、Google搜索功能:自動使用“and”進行查詢:不需在關鍵詞之間加上邏輯算符“and”或“*”,關鍵詞之間“空格”表示邏輯關系與。忽略詞:Google會忽略最常用的詞和字符,這些詞和字符稱為忽略詞。Google自動忽略“http”,“.com”和“的”等字符以及數(shù)字和單字,這類字詞不僅無助于縮小查詢范圍,而且會大大降低搜索速度。
使用英文雙引號可將這些忽略詞強加于搜索項。第八十一頁,共一百二十二頁,2022年,8月28日截詞檢索:為提供最準確的資料,Google不支持截詞(通配符*)搜索,即Google只搜索與輸入的關鍵詞完全一樣的字詞。
忽略大小寫:Google搜索不區(qū)分英文字母大小寫,所有的字母均當做小寫處理。例如:搜索“google”、“GOOGLE”或“GoOgLe”,得到的結果都一樣第八十二頁,共一百二十二頁,2022年,8月28日搜索方式-目錄搜索
Google目錄搜索,按照主題分為若干類,其搜索方法與Yahoo!基本相似。第八十三頁,共一百二十二頁,2022年,8月28日搜索方式-基本搜索:進入Google的查詢界面即為基本搜索,其搜索簡潔方便,僅需輸入關鍵詞并按回車鍵(Enter),或單擊“Google搜索”按鈕即可得到最相關的內容。第八十四頁,共一百二十二頁,2022年,8月28日第八十五頁,共一百二十二頁,2022年,8月28日第八十六頁,共一百二十二頁,2022年,8月28日第八十七頁,共一百二十二頁,2022年,8月28日第八十八頁,共一百二十二頁,2022年,8月28日搜索方式-高級搜索(AdvancedSearch):點擊“高級搜索”即可進入高級搜索界面,高級搜索界面提供多種選擇,包括搜索方式、搜索范圍、時間范圍以及顯示結果數(shù)等。同時,還提供了檢索詞的邏輯組配方式包括:邏輯與(包含以下全部的字詞)詞組檢索(包含以下的完整字句)邏輯或(包含以下任何一個字詞)邏輯非(不包括以下字詞)第八十九頁,共一百二十二頁,2022年,8月28日第九十頁,共一百二十二頁,2022年,8月28日第九十一頁,共一百二十二頁,2022年,8月28日Google的特殊功能:查找PDF文件:除一般網頁外,Google現(xiàn)在還可以查找文檔格式為PDF的文件。如果某個搜索結果是PDF文件而不是網頁,它的標題前面會出現(xiàn)以藍色字體標明的[PDF]。這樣,用戶就知道需要啟動AcrobatReader程序才能瀏覽該文件。單擊[PDF]右側的標題鏈接就可以訪問這個PDF文檔。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 豌豆思維課程設計待遇
- 2025年度個人自建住房施工監(jiān)理服務合同樣本4篇
- 砌墻工程施工方案
- 樓房加固施工方案模板
- 食工原理課程設計果蔬汁
- 年度醫(yī)療健康大數(shù)據戰(zhàn)略市場規(guī)劃報告
- 年度化學材料:灌漿料產業(yè)分析報告
- 二零二五版智能門窗系統(tǒng)安裝與遠程監(jiān)控服務合同4篇
- 影視劇制作方與臨時演員的2025年度聘用合同6篇
- 2025年豬圈配套設施安裝服務合同124篇
- 冷庫存儲合同協(xié)議書范本
- AQ/T 4131-2023 煙花爆竹重大危險源辨識(正式版)
- 武術體育運動文案范文
- 設計服務合同范本百度網盤
- 2024年市級??谱o士理論考核試題及答案
- 肺炎臨床路徑
- 供應商供貨服務方案(2篇)
- JB∕T 3077-2019 汽輪機圖形符號
- 《藥物臨床試驗機構備案評估指南及檢查細則(試行)》
- 河北省2022年中考數(shù)學真題及答案
- 氨水安全技術說明書msds
評論
0/150
提交評論