版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
LOGO信息檢索技術(shù)搜索引擎應(yīng)用第三章01了解網(wǎng)絡(luò)資源的特征、了解網(wǎng)絡(luò)資源檢索方法。02理解網(wǎng)絡(luò)資源檢索工具的原理和分類。03熟悉網(wǎng)絡(luò)搜索引擎的使用。04掌握常用搜索引擎的功能。學(xué)習(xí)目標目錄網(wǎng)絡(luò)信息資源概述3.1搜索引擎的利用3.2搜索引擎使用3.33.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類 3.1.4搜索引擎的使用技巧3.2.1Baidu及其基本操作
3.2.2地圖搜索
3.2.3圖像搜索3.3.1搜索引擎常見問題3.3.2搜索引擎的選擇3.1網(wǎng)絡(luò)信息資源概述214網(wǎng)絡(luò)信息資源檢索的特點搜索引擎概念及工作原理搜索引擎的使用技巧3搜索引擎檢索的分類3.1.1網(wǎng)絡(luò)信息資源檢索的特點網(wǎng)絡(luò)信息資源不是傳統(tǒng)信息資源的復(fù)制,也不能取代傳統(tǒng)的信息媒體和交流渠道,它是對傳統(tǒng)信息資源和信息交流渠道的補充。網(wǎng)絡(luò)信息資源檢索的特點交互式作業(yè)方式信息檢索空間的拓寬用戶透明度友好的用戶界面3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧搜索引擎起源于傳統(tǒng)的信息全文檢索理論,它由一個稱為蜘蛛的機器人程序以某種策略自動地在Internet中發(fā)現(xiàn)、搜集網(wǎng)頁信息;然后由索引器對信息進行理解、提取、組織和處理,建立索引庫;再由檢索器根據(jù)用戶輸入的查詢關(guān)鍵字,在索引庫中快速檢出文檔,通過掃描每一篇文章中的每一個詞,建立以詞為單位的排序文件。從使用者的角度看,搜索引擎提供一個網(wǎng)頁界面,讓人們通過瀏覽器提交一個詞語或者短語,然后很快返回一個可能和用戶輸入內(nèi)容相關(guān)的信息列表。這個列表中的每一條目代表一篇網(wǎng)頁,每個條目至少有3個元素。(1)標題。(2)URL(3)摘要。3.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧搜索引擎的工作原理需要澄清兩個問題。①提交查詢時,搜索引擎并不是即刻在Internet上“搜索”,形成列表呈現(xiàn)給用戶,而是在事先已“搜集”的數(shù)據(jù)中進行系統(tǒng)內(nèi)部的“搜索”。②返回結(jié)果列表中的某一項很可能是用戶所需要的,單擊URL,此時訪問的則是網(wǎng)頁的原始出處。3.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧按資源的搜集、索引方法及檢索特點與用途來分分類目錄型全文檢索型文摘型按檢索方式分單獨型匯集型按覆蓋范圍分通用搜索引擎專業(yè)搜索引擎按搜索引擎的功能分1常規(guī)搜索引擎多元搜索引擎按搜索引擎的功能分2獨立搜索引擎集成搜索引擎3.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧分類目錄型搜索引擎又稱為目錄服務(wù)(DirectorService),檢索系統(tǒng)將搜索到的Internet資源按主題分成若干大類,每個大類下面又分設(shè)二級類目、三級類目等,一些搜索引擎可細分到十幾級類目。這類搜索引擎的特點是:由系統(tǒng)先將網(wǎng)絡(luò)資源信息系統(tǒng)地歸類,用戶可以清晰方便地查找到某一類信息,用戶只要遵循該搜索引擎的分類體系,層層深入即可。1.分類目錄型全文檢索型搜索引擎通常被稱為索引服務(wù)(IndexingService),通過使用大型的信息數(shù)據(jù)庫來收集和組織Internet資源,大多具有收集記錄、索引記錄、搜索索引和提交搜索結(jié)果等功能。其特點是信息量很大,索引數(shù)據(jù)庫規(guī)模大,更新較快。2.全文檢索型3.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧多元集成型又稱為元搜索引擎。有串行處理和并行處理兩種方式。串行處理是將檢索要求先發(fā)送給某一個搜索引擎,然后將檢索結(jié)果處理后,傳遞給下一個搜索引擎,依次進行下去,最終將結(jié)果反饋給用戶。串行處理方式準確性高,但速度慢。并行處理則是將檢索請求同時發(fā)給所有要調(diào)用的搜索引擎。并行處理方式速度快,但重復(fù)內(nèi)容較多。3.多元集成型圖像搜索引擎面向Internet上的嵌入式圖像或被鏈接的圖像,通常要實現(xiàn)以下功能:第一,允許用關(guān)鍵詞搜索圖像內(nèi)容、日期和制作人;第二,能通過顏色、形狀和其他形式上的屬性進行搜索;第三,把圖像作為搜索結(jié)果的一部分顯示。4.圖像搜索型3.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧4.單擊搜索結(jié)果前先思考5.滿意的搜索結(jié)果是多次搜索出來的6.善于改正錯誤1.搜索之前先思考3.學(xué)會使用減號“-”2.學(xué)會使用兩個關(guān)鍵詞搜索搜索引擎的使用技巧3.1.1網(wǎng)絡(luò)信息資源檢索的特點3.1.2搜索引擎概念及工作原理3.1.3搜索引擎檢索的分類3.1.4搜索引擎的使用技巧213Baidu及其基本操作地圖搜索圖像搜索3.2搜索引擎的利用Baidu(百度,)于2000年1月在北京中關(guān)村創(chuàng)立,是目前全球最大的中文搜索引擎。圖3.2百度首頁的搜索界面3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索(1)關(guān)鍵詞檢索。用戶只需要在搜索框內(nèi)輸入所要檢索內(nèi)容的關(guān)鍵詞,單擊“百度一下”按鈕即可得到檢索結(jié)果。用戶也可根據(jù)需要進行不同項目(新聞、hao123、地圖、貼吧、視頻、圖片、網(wǎng)盤等)的切換,無選擇時默認為網(wǎng)頁搜索。(2)網(wǎng)站導(dǎo)航。。如單擊“更多”按鈕,進入全頁面顯示,用戶可進行任意選擇。如圖3.3。1.檢索方法圖3.3百度導(dǎo)航檢索界面3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索1)減除無關(guān)資料.百度支持“-”功能,用于有目的地刪除某些無關(guān)網(wǎng)頁,但減號之前必須留一空格,語法是“A-B”2)并行搜索.使用“A|B”來搜索“或者包含關(guān)鍵詞A,或者包含關(guān)鍵詞B”的網(wǎng)頁。
3)相關(guān)檢索.百度搜索引擎會提供“其他用戶搜索過的相關(guān)搜索詞”。4)把搜索范圍限定在網(wǎng)頁標題中——intitle
5)把搜索范圍限定在特定站點中——site
6)把搜索范圍限定在URL鏈接中——inurl
7)精確匹配——雙引號和書名號
8)要求搜索結(jié)果中不含特定查詢詞
2.檢索技巧3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索1)例如,要搜尋關(guān)于“武俠小說”,但不含“古龍”的資料,可使用如下查詢式:“武俠小說
-古龍”。2)例如:使用者要查詢“圖片”或“寫真”的相關(guān)資料,無須分兩次查詢,只要輸入“圖片|寫真”搜索即可。
3)例如,找林青霞的寫真,就可以這樣查詢:“寫真intitle:林青霞”。4)例如,天空網(wǎng)下載軟件不錯,就可以這樣查詢:“msnsite:”。這里需要注意是,“site:”后面跟的站點域名,不要帶“http://”;另外,“site:”和站點名之間不要帶空格。5)例如,找關(guān)于Photoshop的使用技巧,可以這樣查詢:“Photoshopinurl:jiqiao”。這個查詢串中的Photoshop,可以出現(xiàn)在網(wǎng)頁的任何位置,而jiqiao則必須出現(xiàn)在網(wǎng)頁URL中。這里需要注意是,“inurl:”和后面所跟的關(guān)鍵詞之間不要有空格。6)例如,搜索上??萍即髮W(xué),如果不加雙引號,搜索結(jié)果被拆分,但加上雙引號“上海科技大學(xué)”,獲得的結(jié)果就全是符合要求的了7)比如,查電影“手機”,《手機》結(jié)果就都是關(guān)于電影方面的了。8)搜“神雕俠侶”,希望是關(guān)于武俠小說方面的內(nèi)容,卻發(fā)現(xiàn)很多關(guān)于電視劇方面的網(wǎng)頁。那么就可以這樣查詢:“神雕俠侶-電視劇”3.檢索技巧舉例3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索電子地圖的特點用戶可指定地圖的顯示范圍、顯示圖層、查詢內(nèi)容,以及設(shè)定地圖比例尺等要素。(1)交互性由于數(shù)字化使信息更容易復(fù)制、傳播和共享,所以電子地圖能大量無損復(fù)制,并能通過計算機網(wǎng)絡(luò)傳播。(2)無級縮放電子地圖則可實現(xiàn)在一定范圍內(nèi)的多級或任意無級縮放以滿足用戶的需求。(5)共享性紙質(zhì)地圖受紙張幅面大小的限制,圖幅總有一定范圍,一個地區(qū)可能需要多張圖幅才能容納。而電子地圖由于很容易實現(xiàn)“漫游”和“平移”,能一次性容納一個地區(qū)的所有地圖內(nèi)容。(3)無縫連接除具備各種地圖符號外,還能配合外掛數(shù)據(jù)庫來使用和查詢,地圖內(nèi)容不會受太多限制。(4)信息豐富3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索(1)普通搜索。進入百度地圖首頁,在搜索框中輸入要查詢地點的名稱或地址(如“張氏帥府博物館”),單擊“搜索”即可得到想要的結(jié)果,如圖3.4所示。圖3.4普通搜索功能一、百度地圖的基本搜索功能1.地點搜索3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索(2)附近搜索。若要想了解選中地點周邊的美食、酒店、公交站、景點、電影院、銀行等場所,可以的選擇搜索目的地下方的“附近”如圖3.5和圖3.6圖3.5附近搜索功能一、百度地圖的基本搜索功能1.地點搜索圖3.6附近搜索結(jié)果3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索圖3.7公交方案的查詢(1)公交方案查詢。只需要直接輸入“從哪到哪”,或者選擇公交,并在輸入框中輸入起點和終點便可查詢公交方案??梢赃x擇出發(fā)時間、交通工具(是否乘坐地鐵)。搜索結(jié)果會顯示出“推薦線路”、“時間短”、“少換乘”和“少步行”4種方案,如圖3.7所示。一、百度地圖的基本搜索功能2.公交搜索3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索(2)公交線路查詢。直接輸入公交線路的名稱,便能看到對應(yīng)的公交線路,查詢到所有途經(jīng)車站、運營時間和票價等信息,如圖3.8所示。圖3.8公交線路查詢一、百度地圖的基本搜索功能1.地點搜索3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索圖3.9駕車線路查詢駕車方案查詢。在搜索框中直接輸入“從哪到哪”,或者選擇駕車,并在輸入框中輸入起點和終點,便可查詢駕車方案。百度地圖將精確計算出駕車方案,并提供“推薦路線”“最短路程”和“不走高速”3種策略,見圖3.9。一、百度地圖的基本搜索功能3.駕車搜索3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索(2)跨城市駕車查詢
百度地圖支持全國各城市間的駕車查詢,使用者通過它可以輕松走遍神州大地。它對描述進行了優(yōu)化,將城市內(nèi)的方案合并為一條,還可將其展開,查看詳細的駕車方案。(3)添加途經(jīng)點
百度地圖提供添加途經(jīng)點功能,以方便快速地調(diào)整駕車路線,滿足個性化需求。一、百度地圖的基本搜索功能3.駕車搜索3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索
(1)交通流量查詢??梢挥[全城路況,幫助出行者合理規(guī)劃出行線路。還可進入流量預(yù)測模式,查看路況預(yù)報,提前為出行做好準備,(2)全屏功能。使用者可以盡情地瀏覽地圖(3)測距功能??蓽y得地圖兩點之間的距離(4)標記功能??稍诘貓D某一位置加上標記。(5)獲取鏈接功能??蓪斍暗貓D內(nèi)容分享給他人。(6)默認城市功能。會根據(jù)IP,直接進入用戶所在的城市。用戶可以在百度地圖的首頁設(shè)置默認城市,或根據(jù)切換城市后的提示修改默認城市。二、百度地圖基本功能3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索圖像是互聯(lián)網(wǎng)上重要的信息資源。同文本文獻相比,圖像資料直觀逼真、形象生動,既與其他類型的信息資源相互補充,又是一種獨立的信息載體。
主要有兩類圖像搜索引擎技術(shù)正在研究和應(yīng)用之中:一種是采用傳統(tǒng)的基于關(guān)鍵字的圖像檢索技術(shù);另一種是采用基于內(nèi)容特征的圖像檢索技術(shù)。1.傳統(tǒng)的基于關(guān)鍵字的圖像檢索技術(shù)
使用傳統(tǒng)的基于關(guān)鍵字的搜索引擎進行圖像搜索,其原理與搜索普通信息一樣,差別只是搜索的關(guān)鍵詞不同,或者分類類別不同而已,包含圖片、圖像和照片。傳統(tǒng)的圖像專用搜索引擎的工作原理也是如此。2.基于內(nèi)容特征的圖像檢索系統(tǒng)
這種方式實現(xiàn)了基于文本式的描述,用關(guān)鍵詞及關(guān)鍵詞的邏輯組合或自然語言來表達查詢的概念,這就是語義的匹配。但由于對圖像的理解比文本更容易產(chǎn)生歧義,當詞語不足以形象和準確地描述視覺感知時,用戶就需要利用其所呈現(xiàn)的視覺特性來查詢,例如利用顏色、紋理、形狀等特征。因此,就出現(xiàn)了基于圖像本身固有屬性(Content-based)匹配的圖像檢索技術(shù),即我們稱為基于內(nèi)容特征的圖像檢索。3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索圖3.12百度圖片搜索結(jié)果3.常見的圖像搜索引擎(1)百度圖片百度圖片搜索()的熱門搜索包括:壁紙、頭像、手抄報和高清美圖。同時還提供人物、建筑、動物、風(fēng)景旅游、設(shè)計素材、繪畫、餐飲美食、植物、時尚化妝、家居等精美合輯。百度圖片搜索支持圖片格式為JPEG、GIF、PNG和BMP格式的圖片。在搜索圖片時,可以根據(jù)需求選擇“版權(quán)”、“高清”、“最新”、“動畫”、“全部尺寸”、“全部顏色”,如圖3.12所示。3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索圖3.13新浪圖片3.常見的圖像搜索引擎(2)新浪圖片
新浪圖片搜索引擎(/),提供分類目錄搜索和關(guān)鍵詞搜索兩種檢索途徑。分類目錄搜索可在:新聞、體育、娛樂、科技、軍事、歷史、時尚、女性、收藏、財經(jīng)、星座、健康、教育、育兒、博客、航空等目錄中實現(xiàn)。每個目錄下面,還提供子目錄,如新聞目錄提供:國內(nèi)、國際、社會、天氣、看見、天下、歷史7個子目錄。關(guān)鍵詞搜索支持:+、-、&、空格、and。3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索圖3.14Veer圖庫搜索3.常見的圖像搜索引擎(3)Veer圖庫Veer圖庫(/)是隸屬視覺中國旗下網(wǎng)站,是一家國際化的微圖提供商,Veer承襲了iStock的高標準低價格策略,在線提供優(yōu)質(zhì)圖像資料,素材不僅覆蓋了圖片、矢量圖和插畫,而且審美很棒,熱點相關(guān)內(nèi)容豐富,可以滿足資訊類平臺日常配圖的絕大部分需求。Veer不僅提供導(dǎo)航搜索:照片、插畫、設(shè)計素材、模板。還提供了按照類型、格式、構(gòu)圖、種族、人數(shù)、年齡、性別、色彩等的搜索。如圖3.14。3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索3.常見的圖像搜索引擎(4)國外圖片分享網(wǎng)站①Flickr(
/),F(xiàn)lickr是一個圖片存儲和視頻托管網(wǎng)站。除了供用戶儲存?zhèn)€人照片,它還可以把圖片分享到博客和社交媒體。②Photobucket(
/),Photobucket是一個圖片托管、視頻托管、幻燈片制作和照片共享網(wǎng)站。③喀嚓魚Snapfish(
/
,
/)喀嚓魚(Snapfish)是一個基于Web的照片共享和打印照片服務(wù)平臺,該平臺是由惠普所擁有。用戶免費可以上傳圖片并存儲。會員可以共享相冊、個人照片、動畫Snapshows,GroupRooms或喀嚓魚產(chǎn)品。3.2.1Baidu及其基本操作3.2.2地圖搜索3.2.3圖像搜索3.3搜索引擎使用1搜索引擎常見問題2搜索引擎的選擇(1)數(shù)據(jù)庫記錄的更新速度如何。(2)檢索詞是否確實在網(wǎng)頁上出現(xiàn)了,在哪個地方出現(xiàn)的。(4)搜索引擎是否精確地按照輸入的字符串進行檢索,或者用所包含的相似詞匯進行檢索。(3)缺省的布爾算符是否改變,某次檢索的錯誤可能是由不正確的布爾邏輯處理過程引起的。搜索引擎常見問題3.3.1
搜索引擎常見問題3.3.2搜索引擎的選擇在選擇搜索引擎時應(yīng)該注意以下幾個方面。(1)知名度。最好選擇知名度高的搜索引擎,如百度、谷歌。(2)收錄范圍。綜合性搜索引擎通常支持多語種,有特殊需要的用戶,應(yīng)該首先選用相應(yīng)語種的搜索引擎。(3)數(shù)據(jù)庫容量。(4)響應(yīng)速度。(5)用戶界面。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年泰州職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 2024年泉州醫(yī)學(xué)高等??茖W(xué)校高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 2024年阜新市傳染病醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2024年江西傳媒職業(yè)學(xué)院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年畢節(jié)職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 2024年安徽林業(yè)職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 中國量子點太陽能電池行業(yè)發(fā)展現(xiàn)狀分析及未來前景研究報告
- 2024年四川藝術(shù)職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 小學(xué)語文教師年度考核2022-2024-2025年度述職報告工作總結(jié)(33篇)
- 2024年北京電子科技職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試歷年參考題庫含答案解析
- 立項報告蓋章要求
- 2023年非標自動化工程師年度總結(jié)及來年計劃
- 2023-2024學(xué)年甘肅省嘉峪關(guān)市酒鋼三中高三上數(shù)學(xué)期末學(xué)業(yè)質(zhì)量監(jiān)測試題含解析
- 水利機械施工方案
- 懸挑式腳手架驗收記錄表
- 主變壓器試驗報告模板
- 電動叉車安全操作規(guī)程
- 靜鉆根植樁施工組織設(shè)計
- 安全防護通道施工方案
- 工程精細化管理
- 視覺元素對心理感知的影響
評論
0/150
提交評論