




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
搜索引擎及免費網(wǎng)絡資源主要內(nèi)容搜索引擎搜索引擎概論(發(fā)展\分類\排名)搜索引擎使用技巧百度資源利用GoogleScholar使用介紹免費網(wǎng)絡資源(學術)與本學科相關的免費學術資源利用預印本系統(tǒng)與OpenAccess搜索引擎發(fā)展史1990ArchieAlanEmtageftp搜索系統(tǒng)蒙特利爾大學1994Yahoo超級目錄索引WebCrawler楊致遠DavidFilo深入人心1993ALIWEB系統(tǒng)網(wǎng)站自己提交索引信息Yahoo前身1993年底Spider搜索引擎出現(xiàn)19947月Lycos網(wǎng)頁自動摘要1995元搜索引擎MetaCrawler199512月Altavista自然語言搜索高級搜索語法搜索引擎發(fā)展史1997天網(wǎng)ftp搜索主題搜索1998Google謝爾蓋·布林拉里·佩奇Pagerank動態(tài)摘要網(wǎng)頁快照等。1999Fast/AllTheWebODP自動分類2001Teoma自動分類的RefineBaidu最大中文發(fā)展史代表最早的搜索引擎出現(xiàn)在1994年4月。斯坦福大學的兩名博士生,美籍華人楊致遠和美國人DavidFilo共同創(chuàng)辦了超級目錄索引雅虎(Yahoo),并成功地使搜索引擎的概念深入人心。從此搜索引擎進入了高速發(fā)展時期。1998年,Google創(chuàng)始人謝爾蓋·布林和拉里·佩奇,兩位斯坦福大學計算機系的學生在宿舍里創(chuàng)建了互聯(lián)網(wǎng)搜索引擎Google。發(fā)展史代表1999年底,懷抱“科技改變?nèi)藗兊纳睢钡膲粝?,李彥宏回國?chuàng)辦百度。經(jīng)過多年努力,百度已經(jīng)成為中國人最常使用的中文網(wǎng)站,全球最大的中文搜索引擎,同時也是全球最大的中文網(wǎng)站。2005年8月,百度在美國納斯達克成功上市,成為全球資本市場最受關注的上市公司之一。
Google和Baidu的神話全球互聯(lián)網(wǎng)搜索份額美國市場:Google占52% 是Yahoo的2倍,Msn的4倍英國市場:Google占有四分之三德國市場:Google占91%中國市場:Baidu+Google≥80%Google的市值已經(jīng)超越800億美元 超過世界上所有媒體公司(時代華納)Baidu的市值50億美元左右Google名字由來Baidu夢里尋他千百度“Googol”
10的100次方辛棄疾《青玉案元夕》創(chuàng)立在三年搜索引擎的合作研究技術基礎上創(chuàng)立Google1998年兩位StanfordUniv.的計算機專業(yè)博士生LarryPage和SergeyBrin兩位攜風險資金從硅谷回中國闖蕩的年輕人李彥宏、徐勇2000年在李彥宏的專利搜索技術推出Baidu中文搜索引擎Baidu的神話2000年,兩個年輕人李彥宏、徐勇攜風險資金從硅谷回到中關村,推出Baidu中文搜索引擎2001年,為Sina、Sohu、Tom等提供搜索引擎2005年,在Nasdaq正式掛牌交易 李彥宏身價超過9億美元。Baidu的今天百度是世界上規(guī)模最大的中文搜索引擎收錄中文網(wǎng)頁超過9000萬擁有全球最大的中文網(wǎng)頁庫每天處理來自一百多個國家的超過一億人次的搜索請求Google的神話1998年,兩位StanfordUniv.的計算機專業(yè)博士生 LarryPage和SergeyBrin在三年合作研究搜索引擎的基礎技術上創(chuàng)立了Google2000年,被Yahoo選作搜索引擎的東風,一飛沖天2004年,在Nasdaq正式掛牌交易2005年,股價多次突破300美元大關Google的今天日搜索量為2億人次 支持80種語言 包括全球4億幅圖片和20多億個網(wǎng)頁最近一個月以來,用戶登錄Google的時間總計達到1300萬小時出臺中文的新聞搜索,它的優(yōu)勢開始向全方位發(fā)展了Google向Microsoft發(fā)出挑戰(zhàn)MicrosoftPKGooglePC時代PKInternet時代 產(chǎn)品競爭人才競爭歷史事件回放:2005年7月18日,微軟全球副總裁李開復跳槽Google,擔任中國區(qū)總裁Microsoft與Google的競爭 代表兩個時代的競爭 PC時代vs互聯(lián)網(wǎng)時代
李開復跳槽事件已經(jīng)超出了微軟與Google兩家公司對一位技術人才的爭奪本身。這是一場PC時代巨人和互聯(lián)網(wǎng)時代巨人對于未來霸主地位的爭奪預言——以微軟為代表的PC時代正在加速沒落,而Google正在顯示一個新時代引領者的形象搜索引擎(SearchEngine)的定義搜索引擎是指通過網(wǎng)絡搜索軟件或網(wǎng)站登陸等方式,將互聯(lián)網(wǎng)上大量網(wǎng)站的頁面收集到本地,經(jīng)過加工處理而建庫,從而能夠?qū)τ脩籼岢龅母鞣N查詢作出響應,提供用戶所需的信息。SearchEngine,常常是用戶利用網(wǎng)上資源的第一途徑。搜索引擎原理搜索引擎的原理,可以看做三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索排序。搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實際上是預先整理好的網(wǎng)頁索引數(shù)據(jù)庫。搜索引擎也不能真正理解網(wǎng)頁上的內(nèi)容,它只能機械的匹配網(wǎng)頁上的文字?;谀夸浰饕乃阉饕嬖?實際上是按目錄分類的網(wǎng)站鏈接列表網(wǎng)站所有者向搜索引擎提交網(wǎng)站,并人工填寫網(wǎng)站簡介信息,手工操作超級目錄索引。 例如:yahoo
標準的搜索引擎工作原理從互聯(lián)網(wǎng)抓取網(wǎng)頁建立索引數(shù)據(jù)庫檢索排序自動信息收集功能定期搜索,派出spider程序?qū)σ欢ǚ秶鷥?nèi)的網(wǎng)站進行檢索,發(fā)現(xiàn)新的或更新后的網(wǎng)站會自動提取網(wǎng)站信息加入數(shù)據(jù)庫。網(wǎng)站所有者主動向搜索引擎提交網(wǎng)址,然后搜索引擎在一定時間內(nèi)派出spider程序搜集有關信息加入數(shù)據(jù)庫。(天網(wǎng))檢索與排序技術索引信息檢索全文檢索超鏈分析技術超鏈分析技術除了分析網(wǎng)頁本身內(nèi)容,還分析所有指向該網(wǎng)頁的鏈接的url、文本甚至鏈接周圍的文字。松花湖風光介紹A…….湖泊…………B…….湖泊…………C…….湖泊…………D…….湖泊…………E…….湖泊…………搜索引擎高級檢索技巧利用“”的基本用法
檢索類:「“”」語意:查詢符合引號間的語句全體的網(wǎng)頁資料(強迫搜尋完整詞組)基本查詢語法:「“關鍵詞”」使用時機:當想要進行確定短語,而不進行自動關鍵詞拆分的檢索范例:”計算機系統(tǒng)模擬“作為完整的關鍵詞來查詢注意事項:無——「+」或「空格」的基本用法
檢索類:「空格」或*語意:與基本查詢語法:「關鍵詞1」+「空格」+「關鍵詞2」使用時機:想要查詢兩個關鍵詞都包含的網(wǎng)頁范例:蘋果計算機或蘋果*計算機可以找到有關蘋果計算機相關資料的極大值例子:公路災害預警系統(tǒng)「OR」的基本用法(適用google)
檢索類:「OR」語意:或者基本查詢語法:「關鍵詞1」+「空格」+「OR」+「空格」+「關鍵詞2」使用時機:查詢與關鍵詞1與關鍵詞2的相關數(shù)據(jù)范例:四級ORCET4,會按照「四級」→「CET4」→「四級CET4」這樣的檢索詞順序顯示檢索結(jié)果注意事項:OR一定要大寫「siteorInsite」的基本用法
檢索類:site基本查詢語法:「關鍵詞」+「site」+「:」「網(wǎng)站名稱」or「國別」使用時機:1.查詢單一網(wǎng)站中的資料2.限定查詢資料的網(wǎng)頁國籍范例:CET4site:,在教育網(wǎng)中查找有關CET4的網(wǎng)頁資源,或在新浪網(wǎng)站上查找嫦娥一號的相關內(nèi)容:嫦娥一號site:注意事項:在查詢的網(wǎng)站前面不可加上「http」以及「www」的網(wǎng)址部份連結(jié)的網(wǎng)頁「inurl」的基本用法檢索類:inurl基本查詢語法:「inurl」+「:」+「關鍵詞1」+「空格」+「關鍵詞2」使用時機:想要更精確定位在網(wǎng)頁中的資料,針對特定連結(jié)做搜尋范例:inurl:白樺林,檢索出所有資源URL中含有白樺林的網(wǎng)頁資源注意事項:其實質(zhì)是URL字段對關鍵詞的包含關系,「inurl」后面續(xù)接的關鍵詞不可以有空格inurl,拆開來,就是inurl,它的作用是限定在url中搜索。URL,全稱UniformResourceLocator,中文譯為“統(tǒng)一資源定位器”,就是地址欄里的內(nèi)容。
——「intitle」的基本用法
檢索類:intiltle基本查詢語法:「intitle」+「:」+「關鍵詞1」+「空格」+「關鍵詞2」使用時機:查詢特定標題網(wǎng)頁中的資料范例:intitle:免費軟件下載,檢索出所有資源網(wǎng)頁Title中含有免費軟件下載的網(wǎng)頁資源注意事項:「intitle」檢索語與關鍵詞間不可以有空格「filetype」的基本用法
檢索類:filetype基本查詢語法:「filetype」+「:」+「檔案類型」+「空格」+「關鍵詞1」使用時機:查詢特定類別的文獻資料范例:filetype:DOC保先教育,檢索出所有資源內(nèi)容包含保先教育的Word文檔資源注意事項:適用此檢索方式之前,確定其網(wǎng)的文獻資源的擴展名查找的文檔類型“filetype:”是搜索引擎開發(fā)的非常強大實用的一個搜索語法。也就是說,搜索引擎不僅能搜索一般的文字頁面,還能對某些二進制文檔進行檢索。目前,Google已經(jīng)能檢索微軟的Office文檔如.xls、.ppt、.doc,.rtf,WordPerfect文檔,Lotus1-2-3文檔,Adobe的.pdf文檔,ShockWave的.swf文檔(Flash動畫)等。其中最實用的文檔搜索是PDF搜索。PDF是ADOBE公司開發(fā)的電子文檔格式,現(xiàn)在已經(jīng)成為互聯(lián)網(wǎng)的電子化出版標準。目前google檢索的PDF文檔大約有2500萬左右,大約占所有索引的二進制文檔數(shù)量的80%。PDF文檔通常是一些圖文并茂的綜合性文檔,提供的資訊一般比較集中全面。例子數(shù)據(jù)倉庫filetype:doc數(shù)據(jù)挖掘filetype:ppt網(wǎng)站策劃書filetype:pdfFDIfiletype:pdfGoogle圖片類型搜索Google支持不同格式的圖片搜索Jpg\gif\bmp\png等例子:搜索嫦娥一號jpg格式的相關圖片嫦娥一號filetype:jpg查找友情鏈接“l(fā)ink:”(英文單字link后加冒號)用于搜索鏈接到某個URL地址的網(wǎng)頁??梢粤私庥心男┚W(wǎng)頁把鏈接指向你的網(wǎng)頁。例如,“l(fā)ink:”表示搜索有鏈接指向《羊城晚報》的網(wǎng)頁。link:百度部分功能百度指數(shù)百度行業(yè)報告百度新聞訂閱百度學術資源圖書搜索百科國學教育網(wǎng)站專利搜索文檔搜索法律Google資源GoogleScholar通過GoogleScholar可以過濾掉普通搜索結(jié)果中的大量垃圾信息,幫助人們快速尋找各種學術資料,如專家評審文獻、論文、書籍、預印本、摘要以及技術報告等。目前,Google公司與許多科學和學術出版商進行了合作,中文信息來源包括萬方數(shù)據(jù)資源系統(tǒng)、維普、主要大學發(fā)表的學術期刊、公開的學術期刊、中國大學的論文以及網(wǎng)上可以搜索到的各類文章。
除公開免費的資源外,GoogleScholar搜索的文章大部分只能看到摘要信息,全文需要購買才能看到。GoogleScholar與Google相比之下的特點可通過作者檢索檢索某一作者發(fā)表的文章;可以限定文章發(fā)表的刊物;提供被檢索文章的引用信息,說明一篇文章在學術文獻中被引用的頻率;提供檢索文章的圖書館館藏的鏈接信息;結(jié)果頁面不包含廣告GoogleScholar中文學術高級搜索舉例查找2005以來論述HBV的相關文獻檢索結(jié)果查看文章的摘要信息查看引用該篇文章的文章信息鏈接中科院國家圖書館館藏信息GoogleBooks二網(wǎng)上免費資源國家科技圖書文獻中心/newprint/index.jsp中國預印本系統(tǒng)/eprint/index.jspOpenAccess中文資源/英語開放期刊檢索:/coop/cse?cx=004223467171690464973%3Acqqyzzlqjd8/中國計算機行業(yè)協(xié)會\學會//開放程序網(wǎng)站:/OpenAccessOpenAccess(簡稱“OA”)可譯為“開放存取”、“開放獲取”。本報告采用“開放獲取”的漢譯。“開放獲取”是指“可以在公共因特網(wǎng)上免費地獲取文獻,允許任何的用戶閱讀、下載、復制、發(fā)布、打印和查找
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025湖北省建筑安全員知識題庫附答案
- 成都農(nóng)業(yè)科技職業(yè)學院《創(chuàng)客教育》2023-2024學年第二學期期末試卷
- 無錫太湖學院《高級日語3》2023-2024學年第二學期期末試卷
- 武漢工程職業(yè)技術學院《體育產(chǎn)業(yè)學》2023-2024學年第二學期期末試卷
- 廣東省外語藝術職業(yè)學院《創(chuàng)新設計與實踐》2023-2024學年第二學期期末試卷
- 長春工程學院《稅法(下)》2023-2024學年第二學期期末試卷
- 青海交通職業(yè)技術學院《小學科學教學法》2023-2024學年第二學期期末試卷
- 烏海職業(yè)技術學院《人工智能教育應用》2023-2024學年第二學期期末試卷
- 黑龍江工程學院昆侖旅游學院《主流輿情智能分析實踐》2023-2024學年第二學期期末試卷
- 湖南工程學院《科技文獻檢索(醫(yī)科)》2023-2024學年第二學期期末試卷
- 新媒體運營合作合同范本
- 2024年12月2025中央統(tǒng)戰(zhàn)部直屬事業(yè)單位應屆高校畢業(yè)生公開招聘21人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2025年中國主題樂園行業(yè)發(fā)展概況、市場全景分析及投資策略研究報告
- 產(chǎn)后疼痛管理指南
- 工娛治療及其護理
- 人效管理措施
- 2024-2025學年人教部編版七年級上語文寒假作業(yè)(五)
- 四年級下冊勞動《小小快遞站》課件
- 中國妊娠期糖尿病母兒共同管理指南(2024版)解讀
- 籃球教練職業(yè)生涯規(guī)劃
- 春節(jié)促銷活動方案(7篇)
評論
0/150
提交評論