第四講搜索引擎檢索_第1頁
第四講搜索引擎檢索_第2頁
第四講搜索引擎檢索_第3頁
第四講搜索引擎檢索_第4頁
第四講搜索引擎檢索_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四講搜索引擎檢索本講具體內容安排:

4.1網(wǎng)絡信息檢索概述4.2搜索引擎概述

4.3常用搜索引擎介紹4.4檢索實例4.1網(wǎng)絡信息檢索概述一、網(wǎng)絡信息資源的定義、特點1.定義:從字面上理解,網(wǎng)絡信息資源是指“通過計算機網(wǎng)絡可以利用的各種信息資源的總和”。具體的是指所有以電子數(shù)據(jù)的形式把文字、圖像、聲音、動畫等多種形式的信息存貯在光、磁等非紙介質的載體中,并通過網(wǎng)絡通信、計算機終端等方式再現(xiàn)出來的資源。

2、特點(1)分布地域廣(2)傳播速度快(3)數(shù)量大(4)質量參差不齊(5)類型多樣(6)無序性、不穩(wěn)定性二、網(wǎng)絡信息資源的類型按人類信息交流的方式分類:非正式出版信息。如電子郵件、電子會議、專題組和論壇、電子公告、新聞等。正式出版物。即用戶可以查詢到的各種數(shù)據(jù)庫、聯(lián)機雜志、電子版工具書、報紙、專利信息等。從網(wǎng)絡信息檢索角度,按信息查詢方式對網(wǎng)絡信息進行分類:(1)互聯(lián)網(wǎng)(WWW)信息。(2)FTP信息。(3)Telnet(遠程登錄)信息。(4)USENET/Newsgroup,即新聞討論組,是UsesNetwork的縮寫。(5)Gopher信息(信息查找系統(tǒng))。按信息的媒體形式分為:文本信息、超文本信息、多媒體信息。

按網(wǎng)絡信息服務方式分為:網(wǎng)站信息、新聞組信息、論壇信息、文件服務信息。按信息格式分為:HTML、TXT、DOC、PDF、RM、MP3……。三、網(wǎng)絡信息檢索的一般方法1.網(wǎng)上瀏覽(1)偶然發(fā)現(xiàn)。(2)順“鏈”而行。2.網(wǎng)絡資源指南(目錄型檢索工具)3.搜索引擎4.圖書館網(wǎng)站的網(wǎng)絡導航4.2搜索引擎概述一、搜索引擎的概念和特點二、搜索引擎的發(fā)展三、搜索引擎的分類四、搜索引擎的工作原理五、搜索引擎的使用技巧一、搜索引擎的概念和特點搜索引擎(searchengine)是指根據(jù)一定的策略或算法,運用特定的計算機程序搜集互聯(lián)網(wǎng)上的信息,在對信息進行組織和處理后,將結果顯示給用戶。與普通網(wǎng)站不同的是,搜索引擎是一個在Internet中主動搜索WWW信息并能進行自動索引、提供查詢服務的網(wǎng)站。因此,也有人稱之為Internet上具有檢索功能的網(wǎng)站。

特點大部分搜索引擎本身及其檢索結果在有效性、有序性、可檢性、學術性、專業(yè)性方面比較差。面向互聯(lián)網(wǎng)廣泛收集信息,比較全面且實時更新,信息的時效性非常強。二、搜索引擎的發(fā)展最早的真正意義上的搜索引擎是Lycos,創(chuàng)建于1994年的春天,Yahoo也是當年成立的。最初的發(fā)展模式有多種,到今天搜索引擎的核心逐步轉變成為網(wǎng)絡導航服務,在技術上,很多搜索引擎的功能不再單一化,更多是將關鍵詞搜索引擎、主題分類指南、元搜索引擎的功能融為一體。三、搜索引擎的類型1.按工作語種可以分為單語種搜索引擎和多語種搜索引擎如AltaVista搜索引擎可以用25種語言進行查詢2.按信息采集的內容可以分為綜合類搜索引擎和專業(yè)類搜索引擎例如Google、百度、雅虎等綜合類搜素引擎

Scirus科技搜索引擎,GoogleScholar學術搜索引擎是專業(yè)類搜索引擎的代表三、搜索引擎的類型3.按內容組織方式

可分為目錄索引式搜索引擎和全文搜索引擎

目錄索引搜索引擎是采用人工或機器搜索WWW信息,依靠專業(yè)人員對信息進行甄別和分類而建立的以分類導航或分類摘要查詢?yōu)橹鞯囊活愃阉饕?。?yōu)點是檢準率高,但信息量較小,維護需要耗費大量的人力物力。較有代表性的有Yahoo、搜狐搜索等。全文搜索引擎又稱為機器人搜索引擎,是指利用網(wǎng)上搜索軟件(網(wǎng)絡蜘蛛系統(tǒng)或機器人系統(tǒng)),自動收集網(wǎng)頁全文信息并建立索引數(shù)據(jù)庫的搜索引擎。優(yōu)點是信息量大、更新及時、無需人工干預,但反饋的信息過多,檢準率低。比較有代表性的是Google、HotBot、百度、天網(wǎng)等。三、搜索引擎的類型4.按搜索范圍可以分為獨立搜索引擎和元搜索引擎獨立搜索引擎擁有自己的檢索程序(Indexer),搜索時僅在本身的數(shù)據(jù)庫中進行,由其反饋出相應的查詢信息,或者是相鏈接的站點指向。例如Google、AlltheWeb、百度等。元搜索引擎又稱集成搜索引擎,特點是將多個獨立搜索引擎集合在一起,提供一個統(tǒng)一的檢索界面,在接受用戶查詢請求時,同時在其他多個引擎上進行搜索,檢索多個數(shù)據(jù)庫,對結果簡單合并、去重,進行相關度排序后顯示給用戶。著名的元搜索引擎有InfoSpace、Dogpile等,中文元搜索引擎中最早的是比比貓搜索引擎,后來倒閉,現(xiàn)常用的有搜樂搜索、搜魅搜索、覓搜等。

四、搜索引擎的工作原理從互聯(lián)網(wǎng)上抓取網(wǎng)頁(網(wǎng)絡蜘蛛(Spider)程序)建立索引數(shù)據(jù)庫(索引系統(tǒng)程序)在索引數(shù)據(jù)庫中搜索并對搜索結果進行處理排序(搜索系統(tǒng)程序)反饋結果給用戶(用戶接口/檢索界面)搜索繩引擎給工作礦原理五、遺搜索嗓引擎條的使段用技向巧1.選擇隆合適厚的搜篩索引循擎根據(jù)掃每個株搜索氣請求崇的不聞同,倉通常股利用旺綜合帶類搜蠢索引灰擎、掛分類錦目錄擱搜索挪引擎公或者表專業(yè)盜類搜輔索引量擎。2.選擇屯恰當灑的關身鍵詞搜索繡用的針關鍵本詞要俘做到沃“精刮”、鈔“準收”、鑼“有盼代表看性”異,盡弓可能遵的使命用核死心詞3.閱讀從搜索匪引擎羽的幫叢助信黎息4.使用救搜索散引擎貢的限慕制性各查詢火功能搜索踩引擎薯提供淡的范滲圍限僅制類但型大涂體有乏分類正范圍蟲、地筐域范綢圍、琴時間羊范圍螺、網(wǎng)剖站類云型以晨及其兩他特若殊范邁圍。4.3常用唐搜索絕引擎鹿介紹4.校3.唐1距Go賤og嚼le的使去用4.側3.合2百度薯的使敲用4.保3.娃3新浪雞愛問葛的使嚼用4.仔3.廟4搜狐對搜狗諒的使煎用4.榜3.扔5其他顫綜合嗓類中飛文搜輔索引造擎4.扭3.狹6專業(yè)棋性搜現(xiàn)索引墓擎4.務4.鋼1閘Go秤og擇le的使撞用Go崗og隨le目前睜被公受認為堂萬維濁網(wǎng)上浴最大申的搜趕索引藝擎,注它提筋供了腔簡單妖易用派的免驚費服撕務,僻使用賓戶能捏夠訪績問一鈴個包努含超沿過80億個龍網(wǎng)址診的索隨引。20舍06年4月12日Go秘og位le公司絨宣布Go感og酸le的全階球中渣文名討稱正盡式取丸名為扎“谷恩歌”順。Go悅og輝le的特槳殊功丸能1.查找罪非HT腎ML文件可以視支持13種非HT夢ML文件朱的搜菠索,期如PD率F,謀D浪OC弱,組PP朱T,檔X識LS坑,少SW且F。例1:搜廟索包和含“釋電子言商務哭”關泉鍵詞櫻的wo翻rd文件受。輸任入:卸電子雖商務fi焦le存ty乓pe丹:d但oc。例2:搜痰索包蓬含“受網(wǎng)絡蔽資源厚與信壟息檢牙索”臨方面鍬的po壺we血rp戰(zhàn)oi遠nt肺er文件污。輸載入:朗網(wǎng)絡福資源訪與信泰息檢戶索fi鑄le惕ty蹲pe夾:p羞pt。2.宮問答想知怕道日字本有租多少瓦人口凱嗎?步長江疤的長存度?秤只要澤輸入及這些栽事實膠性的耽問題接或關淋鍵字灶(如沾"日訂本的斃人口即")技,G譯oo衫gl我e劫會在牛網(wǎng)上跌查找巡壽答案蜂。3.計算損器Go前og妹le為用蜻戶提文供了嶺一個盛內置脾計算窮器。的只需擴要在敲搜索朝字段伴中輸席入算宰式,像按一忌下回悉車鍵怨或者愧搜索惡就可驗以了揪。做職所有古簡單譜的計簽算,擁一些察復雜租的科叫學計真算,攤單位角換算喊,以哨及提目供各富種物勒理常鍬數(shù)。例子蒜:5腸+2出*2水1英寸=?厘阻米4.哨網(wǎng)頁替快照Go素og服le紀在墾訪問頂網(wǎng)站仰時,銷會將翼看過險的網(wǎng)窮頁復蓄制一層份網(wǎng)器頁快觀照,愈以備衣在找嬸不到唉原來燈的網(wǎng)坐頁時斥使用梁。單寫擊“外網(wǎng)頁謊快照確”時型,您范將看兔到余Go歸og廚le夏將罩該網(wǎng)睡頁編作入索該引時話的頁棄面。喚Go諒og島le授依沫據(jù)這卵些快時照來援分析覽網(wǎng)頁田是否畏符合歌您的灰需求熟。5.屠貨幣芽轉換使用饞內置踐貨幣如轉換插器,再只需玻在Go榨og增le搜索掉框中呈鍵入棕您需仗要完世成的害貨幣尿轉換次,并膜單擊姑“回鑰車”合鍵或Go靠og工le疑S摧ea遙rc寄h按鈕期即可。示例柔:1懂0新孤加坡賀元等利于多別少印書度盧安比8人限民幣蹦換成浙泰國涌的貨棚幣6.用Go運og像le查詢素手機艱電話右號碼袖歸屬擱地,確您只爺需直斯接輸償入要路查的良號碼臨即可飄。7.懸天氣憲查詢用融Go母og湯le查詢練中國閉城市緣瑞地區(qū)射的天吩氣和談天氣太預報。例如安:輸廣入“沉包頭疾天氣祥”8.股票最查詢用Go需og境le查詢工股票柴價格卻和股別市行蝴情輸入和股票儀名稱套或股凳票代冠碼9.地圖查查尋使用陷Go私og搖le刪查尋頑城市抹地圖披或具老體地氏址,涂只需潑要在衫捜索偽框直壯接鍵查入城渠市名強或地僚址后父加上鑰“地漸圖”銜即可杰,或線直接胃輸入紋具體淘地址。10斷.手氣去不錯按下在“手爸氣不南錯”畫按鈕賓將自難動進思入Go龜og孟le查詢貫到的茂第一接個網(wǎng)夾頁。粉您將作完全飯看不姨到其劣它的蹲搜索網(wǎng)結果堵。使配用“臭手氣勒不錯漿”進亡行搜插索表溜示用喘于搜化索網(wǎng)姨頁的況時間震較少斧而用押于檢巴查網(wǎng)關頁的焰時間矛較多盆。11睜.錯別持字改川正Go泳og勿le的錯搜別字聞改正鈔軟件伯系統(tǒng)補會對深輸入黃的關騾鍵詞全進行喘自動豆掃描,它能帆提供領相應甘提示爹來幫寧助糾病正可炮能有賠的錯穗別字瓶。例遺如,廉搜索漠“互霉連網(wǎng)戀”,Go勿og定le會自膨動提車示鳴“您竄是不夜是要店找:及互聯(lián)亮網(wǎng)”脖。Go停og狼le退出碎中國倦大陸輸事件20厘10年1月份孔,Go罰og小le官方挖博客飽表示殖谷歌絡集團涼考慮舊關閉鏟“谷奇歌中寒國”予網(wǎng)站嶼以及邁中國精辦事蔥處。3月23日宣忽布將戚其在辯中國形內地美的主馳營搜響索服薯務移勢至香只港,有停止壘對在Go盜og材le甚.c洋n搜索敲服務唱上的匠自我更審查溉包括Go寺og不le塊S穩(wěn)ea壺rc違h(網(wǎng)窯頁搜邪索)爬、Go鴉og退le乎N枯ew陜s(資拒訊搜鄭索)值和Go政og飼le甲I隆ma耽ge幣s(圖妙片搜糕索)獄。切訪問Go蛾og沫le雨.c斜n的用記戶將傘指向Go糾og壟le梅.c疏om僚.h竄k,在吩這個愚域名封上提嫩供未黎經(jīng)審蕩查的閱簡體工中文與搜索雕結果煩,這效些為餅中國梳大陸旋用戶戶設計眾的服擊務將融通過麗在香儉港的幅服務晴器使敬用。4.感2.型2百度脾搜索丘引擎百度查(Ba燭id捆u.斜co告m,In謎c)于19顏99年底流成立鑼于美露國硅呀谷,20公00年回啄國發(fā)諒展。線百度盡是目駕前全貌球最曬優(yōu)秀既的中舊文信映息檢釣索與洞傳遞互技術儉供應仔商。國中國謎所有驕提供烈搜索晝引擎撕的門熟戶網(wǎng)漠站中駛,80橡%以上芝都有墻百度犬提供編搜索查引擎根技術娛支持納。百度春在中鍬國各譽地和此美國蔽均設赤有服南務器借,搜導索范蔑圍涵生蓋了施中國鞏大陸寇、香膚港、期臺灣焰、澳焰門、編新加興坡等冷華語憤地區(qū)阿以及券北美污、歐深洲的申部分恰站點留。百度妥相關獵事件百度跨的競早價排砌名機搏制:掃競懸價排層名服些務是邁百度限向客升戶提希供的走在線嬸市場密推廣測服務肯,目紛的是第將客怠戶介撤紹給喚使用麥者,虜從而援為客兆戶帶周來更釀大的劍利潤喜。但雞當網(wǎng)飄民在匪百度畜網(wǎng)站牢上搜鞭索信蕩息時協(xié),總圣會不壞適時鈴的跳換出百過度客妙戶的教網(wǎng)站著鏈接繭即所曲謂的形“垃麥圾信頓息”雕,對櫻網(wǎng)民爬造成巖一定條程度精上的奶視覺電污染題,也揀影響彼了網(wǎng)謙民們乖搜索動質量嘆,浪戚費了振網(wǎng)民覽們的繩寶貴申時間坑。4.底4.蝕3新浪焰愛問累的使妻用4.蹦4.材4搜狐吃搜狗拍的使姥用4.瘋4.縮慧5其他落的比哭較好攀的中月文綜客合性少搜索逢引擎什還有院:1.中國兆雅虎2.中搜3.網(wǎng)易新旗下沃搜索——有道4.天網(wǎng)罩搜索4.桿4垂直墊搜索乖引擎垂直泊搜索嚷又稱績?yōu)閷8`業(yè)性拼搜索日引擎轟,是盒針對劍某一指個行澇業(yè)的經(jīng)專業(yè)堡搜索林引擎腹,是心搜索上引擎幕的細泉分和橋延伸朽,是肥對網(wǎng)德頁庫顛中的駱某類祥專門冷的信介息進錢行一澤次整碼合,固定向炎分字侵段抽昏取出杏需要矛的數(shù)刪據(jù)進管行處板理后狠再以索某種漫形式蜻返回張給用稠戶。1.學術碌類搜情索引剃擎Go克og托l(wèi)e學術可搜索恩的功抗能從一進個位技置方瞧便地搜索各種嘆資源查找報告萍、摘散要及我引用單內容通過隙您的根圖書剃館或罷在We籍b上查找完整冤的論放文了解任何桃科研泉領域煉的重纏要論敬文讀秀嚼學術憤搜索2.工作惰搜索夜引擎中華嬸英才貿網(wǎng)--呢-w炭ww券.ch認in霸ah絹r.潑co蜻m前程注無憂--降-ww兼w.在51頸jo濕b.崖co究m智聯(lián)甘招聘--龜-ww酬w.針zh鑼ao筆pi財n.父co床m職友農(nóng)集--槍-ww房誠w.宵jo征bu腰i.呢co創(chuàng)m搜職膽網(wǎng)--銜-ww兵w.團gl李ob總eh午r.恒co猜m牛耳縱搜職益網(wǎng)--機-ww娛w.控ne代we英rj得ob浪.c濃om職業(yè)譜大百倡科--綠-ww睜w.戒jo嶺bs耗os衫o.族co址m3.論壇免搜索件引擎ww賊w.鍋qi訊ho蒜o.命co爆m:qi蛙ho希o(奇圍虎)問論壇槽搜索謹,目母前最限好的我論壇怠搜索顛引擎粥。ww吸w.競te在ei鼠n.毀co饅m:Te寺ei站n論壇抽搜索母有高匠級搜稠索選抱項,工功能銷強大雕。頁隆面布喜局合討理,緒有不恨少貼其心的銹小功皇能。ww趨w.印da旋qi冠.c康om:大陵旗網(wǎng)4.軟件腳搜索登引擎ww也w.拳so翅ft若8.捉ne煉t:搜索鞏軟件圈吧,弊中國逝首家醉專業(yè)堵軟件嗎搜索奪引擎每。ww臉w.寺di慨gd什ig魂.c畏om池.c孕n:海劉量軟盯件搜壟索ww宜w.僚ch帽ao垃ji勉.c斯om:超社級軟梨件搜晝索4.天4檢索粥實例利用削學術顫類搜脂索引霧擎搜成索課需題(1)課乳題名看:“吃工業(yè)蹲廢水葛的循蹦環(huán)利年用研幣究”(2)課吵題分舞析:嬸提煉趙概念晨詞“茂工業(yè)踢”、情“廢懼水”濃、謎“循征環(huán)”蓬為課倚題的苗檢索躁詞,衫循環(huán)諷利用紅是廢訓水的柔利用何方式術之一屑,因墳使用杠搜索嚼引擎醒,檢降索詞繭可以艇帶口績語,扇“利屋用研緩究”剩都可乘以根題據(jù)檢秤索結熔果進奇行調占整。(3)選均擇搜創(chuàng)索引賭擎:go曲og齡le學術群搜索(4)檢燒索策翁略調穿整:a.使用go庸og勵le學術革高級鍛搜索悲,輸組入檢濁索詞具工業(yè)航廢水駝、循鋒環(huán)做童邏輯凱與組備配(阻即在桑包含袍全部率詞項突中)岡,在巾“文犯章中端任何樣位置姥”,嗓時間語范圍若為20摧00籌-2歡01步1年進怕行搜悶索,槽得到旋結果13鍛30租0條。b.調整狂策略論,將縮慧“工鑰業(yè)廢盟水”傘作為券一個晨確切妙的詞授檢索笑,與謠“循梳環(huán)”寒做邏藍輯與病組配慚,檢拔索得鋸到38奇50條結言果。c.進一吳步調掘整策夠略,皂將搜集索詞框出現(xiàn)蜜位置隔改為蹈“位呈于文段章標知題”談檢葡索得寫到27條結癢果,丈瀏覽析記錄胡,結睜果較圣為滿特意。(5格)整理材檢索蘋結果閘(選溜取一豈條)工業(yè)羅廢水炮再生著回用巷于循聲環(huán)冷列卻水糟水質外要求慚淺析朱傳借俊,猶劉概艷飛掙,兇邵宏會謙…塌-化工參標準.計量.質量,謎20幼04致-cq淘vi悄p.幟co荷m工程降技術>>化學昏工程>>摘要.工業(yè)夏廢水削再生拔回用軟于循投環(huán)冷輔卻水糠水質郊要求扎淺析.評論訴推薦.在線蘇閱讀秋下絹載全扶文收委藏本稍文.朱傳立俊策劉艷扁飛方邵宏晉謙協(xié)李琳.天津扇化工晝研究撞院,天津30懇01擔31央.挖..卡.頁數(shù):共6頁.頁碼拼范圍:牛21父-2痰6頁.關鍵布詞:工業(yè)挺廢水鉆污忘水回洲用殖循環(huán)泛冷卻貌水離水質各要求木殺闊菌消廊毒既沉降占過濾.學科購分類..放.被引司用次撒數(shù):1-相關闊文章-所有3個版萄本(6)標聚示原占文線毯索工業(yè)司廢水金再生英回用突于循未環(huán)冷搜卻水絮水質無要求兵淺析朱傳尋俊劉艷多飛邵宏辛謙李琳天津餅化工愁研究洗院,莫天津30肆01腐31ht準tp娛:/鉛/w金ww猴.c夜qv晃ip播.c倚om仿/q在k/清96劍87次7a宮/2伯00激40喉2/睛92膚40記21它6.煎ht耽ml1、分帖析檢奴索問章題:首先可要分竭析檢棵索的倚主題轟,明響確要攝查找群什么堡?關聰鍵詞菌最好酒是專濁業(yè)術妥語。閑構造僻檢索

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論