信息檢索與利用筆記 選修課課件_第1頁
信息檢索與利用筆記 選修課課件_第2頁
信息檢索與利用筆記 選修課課件_第3頁
信息檢索與利用筆記 選修課課件_第4頁
信息檢索與利用筆記 選修課課件_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

《信息檢索與利用》總結朱學軍2012年10月與信息相關的幾個概念

知識是人類大腦活動的產(chǎn)物,是一種升華的信息——高級信息

知識是人類通過信息對自然界、人類社會的認識,是人的大腦通過思維重新組合的系統(tǒng)化的信息的集合。信息是知識產(chǎn)生和形成的基礎知識是信息的一部分,不直接等同于信息知識是人對客觀事物的認識和經(jīng)驗的總和1.知識(Knowledge)

知識與信息的關系:

人類為了保存信息與知識,使用一定的記錄手段將系統(tǒng)化的信息內(nèi)容存儲在某種媒體上,則形成文獻。文獻是指記錄知識的一切載體2.文獻(Document)1.紙質(zhì)文獻(印刷型文獻)利用紙張為存儲介質(zhì),以手寫、印刷為記錄手段而產(chǎn)生的文獻。包括油印、鉛印、膠印、復印等印刷品及手稿。優(yōu)點:閱讀方便,利于流通缺點:笨重、體積大,不易保存,不利于資源共享

是以感光材料為存儲介質(zhì),利用縮微照相技術使文獻縮微化的文獻。2.縮微文獻優(yōu)點:存儲信息密度高,體積小,易保存,便于遠距離傳遞。缺點:不能直接閱讀,需借助縮微閱讀機才能閱讀的文獻。

以磁性或感光材料為存儲介質(zhì),利用特定的設備及技術,直接記錄聲音、圖像信息的文獻3.聲像型文獻(視聽資料)優(yōu)點:形象、直觀;缺點:制作成本高,需要借助一定的設備才能閱讀。4.電子信息源(計算機閱讀型文獻)

以電子數(shù)據(jù)的方式將圖、文、聲、像等信息存儲在磁光介質(zhì)上,通過網(wǎng)絡通信、計算機或類似設備再現(xiàn)的信息資源

優(yōu)點:存儲密度高,存取速度快,原有記錄可以改變更新,可以提供多維、有序化的可操作功能,便于檢索。

指未經(jīng)公開發(fā)表或未交流于社會的文獻不同加工深度的文獻信息源

1.零次文獻

私人筆記、設計草圖、實驗記錄、論文草稿、會議記錄、書信2.一次文獻(檢索的目標)

指以著者本人的研究成果為依據(jù)而創(chuàng)作或撰寫,并通過某種渠道而公開的文獻

期刊論文、科技報告、會議論文、學位論文、專利文獻、技術檔案二次文獻與三次文獻的區(qū)別:對象不同二次文獻以“篇”或“本”為單位進行加工;三次文獻則歸納了較多的一次文獻內(nèi)容。用途不同二次文獻為檢索一次文獻的工具;三次文獻能直接提供檢索答案。學習文檢課的目的之一:如何通過二次文獻去查找一次文獻

信息組織是指對大量的信息(主要指文獻信息)進行收集,并對其進行組織和控制,使之有序化的過程。無序信息流信息組織是信息檢索與傳播的前期準備有序信息流

信息組織

信息篩選

信息描述

信息存儲第一節(jié)信息組織的基本程序與方法(一)信息外表特征的描述與標識

信息的外表特征是指信息的名稱、來源、加工者、類型及表現(xiàn)形式等內(nèi)容。期刊論文:

文獻的題目、著者、著者單位、文獻出處(刊名、年卷期、起止頁碼)、語種、參考文獻及圖表的數(shù)量、刊號圖書:

書名、著者(或編者、譯者)、出版項(出版社、地點、時間)、稽核項(價格、頁數(shù)、參考文獻)、書號不同的檢索系統(tǒng)(數(shù)據(jù)庫)所描述的項目與標識符有所不同(二)內(nèi)容特征的描述與標識信息內(nèi)容特征描述是指在對信息內(nèi)容進行分析的基礎上,根據(jù)一定的規(guī)則對信息的內(nèi)容予以揭示,并賦予標識的過程。

具體項目:分類號、主題詞、文摘信息內(nèi)容特征描述也稱為對信息內(nèi)容的著錄與標引信息內(nèi)容特征描述分類描述(分類法)主題描述(主題詞法)信息檢索語言:根據(jù)信息檢索的需要創(chuàng)造的一種人工語言馬克思主義、列寧主義、毛澤東思想哲學社會科學中國圖書館分類法的體系結構部類(5個)自然科學綜合性圖書基本大類(一級類目)22個主題語言:自然語言和人工語言(三)信息著錄格式及文獻類型辨識方法

科學技術文獻(1)科技圖書(2)科技期刊(3)科技報告(4)會議文獻(5)專利文獻(6)標準文獻(7)學位論文(8)產(chǎn)品資料(9)技術檔案(10)科技報紙出版特征(著錄格式):十大情報源1.AnckerJrCJ,GafarianAv.Somequeueingproblemswithbalkingandreneging:I.OpnsRes.1963,11:88-1002.AndersSkyttebol,LennartJosefson.Numericalsimulationofflashbutt-weldingofrailwayrails.Proceedings7thInternationalSeminaronNumericalAnalysisofWeldability,GrazSeggau(Austria)September-October2003,pp21-303.Pollard,F.H.;Cannizzard,S.InvestigationofpulsatingflowhydraulicConcepts.Finalrept.1May64-1Jul65.1965,p.1-1404.Amoozegar,SeyedFared.Neuralnetwort-baseddetectionandtrackingofmaneuveringtargetsinclutterforradarapplication.Ph.D.TheUniversityofArizona.1994,276pp5.SkolinkMI.Radarhandbook[M].NewYork:McGraw-Hill,1990科技期刊H.Tohyama①,AplasmaImagebarforanelectrophoto--graphicprinter②,JournaloftheImagingScience③,Vol.35④NO.5⑤,330-333⑥(Sept-Oct1991)⑦辨識方法:刊名(Journal或J.或縮寫,有時斜體)、年、卷、期、頁碼等會議文獻A.M.Heyman.①Low-profilehigh-frequencyoff-linequasi-resonantconverter.②ProceedingsofIEEEAppliedPowerElectronicsConferenceandExposition.③1987,V.169,P.42-47④注釋:①作者②篇名③會議名稱(常用的會議特征有Conference,Congress,Symposium,Convention,Workshop等,常用的主辦會議的機構特征有Society,Association等);④會議文獻的年卷期以及頁碼。會議文獻的識辨特征有:如會前出版物的Paper,會后出版物的Proceedings等。學位論文ENGINEERING,ELECTRONICSANDELECTRICAL①Neuralnetwort-baseddetectionandtrackingofmaneuveringtargetsinclutterforradarapplication②.Amoozegar,SeyedFared③,Ph.D.④TheUniversityofArizona⑤,1994⑥,276pp⑦.Director:MalurK.Sundareshan⑧注釋:①類目名稱;②論文題名;③著者;④學位級別;⑤授予學位單位⑥授予學位時間⑦原文頁碼⑧指導教師辨識方法:篇名一般著有學位和學位論文的名稱,如Ph.D.Dissertation即哲學博士學位論文,若碩士論文則為MasterThesis,此外標有學位論文名稱、頒發(fā)學位的單位及學位授予時間等信息標準文獻BSI,“Specificationforcommunicationandinterferencelimitsandmeasurements”,BS6839-1987標準文獻著錄的特點是:1、通常有表示標準的詞如standard,recommendation,Specification等;2、有標準號。標準號每個標準一個號,并按慣例由標準頒布機構代碼,順序號和頒布年份三部分構成,如本例的“BS6839--1987”??萍紙蟾鎴蟮?記錄)研究和開發(fā)調(diào)查工作的成果或進展情況的一種文獻類型,一般都編有號碼,供識別報告本身及其發(fā)行機構??梢哉f,報告是一種典型的機關團體出版物,常用的報告名稱有:科技報告按報告的形式可分為:report(報告書),technicalnotes(技術札記),memorandum(備忘錄),papers(論文),bulletin(通報),technicaltranslations(技術譯叢),specialpublications(特種出版物)。參考文獻類型及文獻類型標識專著--M會議論文集--C報紙文章--N期刊文章--J學位論文--D報告--R標準--S專利--P非電子出版物的著錄格式——

[序號]作者.題名[J].刊名,出版年,卷(期):起止頁.[序號]作者.題名[N].報名,出版年-月-日(版次).[序號]作者.題名[D].地點:學位授予單位,年份.[序號]作者.書名[M].出版地:出版者,出版年:引文頁.[序號]標準代號標準順序號—發(fā)布年標準名稱[S].

(多作者可列出前3位,其后加“等”)

非電子出版物的著錄示例——

[1]楊平,馮賢平.偏壓對空心陰極放電等離子體濺射制備氮化碳薄膜的影響

[J].物理實驗,2005,25(12):15-19.[2]LeuenbergerUA,BrubakerD,QuraishiS.Effectsofintermittenthypoxiaonsympatheticactivityandbloodpressureinhumans

[J].AutonNeurosci,2005,121(1-2):87-93.[3]翟裕生,鄧軍.古大陸邊緣成礦系統(tǒng)[M].北京:地質(zhì)出版社,2002:55-65.[4]

雷和平,林之詮.西部能源開發(fā)區(qū)現(xiàn)狀解析[N].

金融時報,2005-12-20(C09).[5]羅凱.懷槐培養(yǎng)細胞生產(chǎn)異黃酮的條件優(yōu)化與控制[D].合肥:合肥工業(yè)大學,2005.[6]GB/T5009.204—2005食品中丙烯酰胺含量的測定方法

氣相色譜-質(zhì)譜(GC-MS)法[S].

非電子出版物中專利文獻的著錄格式——

[序號]專利申請者.題名:專利國別,專利號[P].公告日期.[7]北京佳訊飛鴻電氣有限責任公司.呼叫延伸系統(tǒng)及呼叫處理方法:中國,1822625[P].2006-08-23.[8]KURITAWATERINDLTD(JP).ELECTRICDEIONIZINGAPPARATUS:JP,2004082092[P].2004-03-18.

電子文獻的著錄格式——

[序號]作者.

題名[文獻類型/文獻載體].出版地:出版者,出版年(更新或修改日期)[引用日期].獲取和訪問路徑.

在以上著錄項目中:[文獻類型/文獻載體]一項對電子文獻是必須的;[引用日期]、獲取和訪問路徑——這兩項,對電子文獻中的聯(lián)機文獻是必須的。上述三項對非電子出版物都是可以任選的!

文獻類型與標志代碼——

期刊(J),專著(M),專利(P),報紙(N),匯編(G),報告(R),標準(S),論文集(C),學位論文(D),數(shù)據(jù)庫(DB),計算機程序(CP),電子公告(EB).

電子文獻載體與標志代碼——

磁帶(MT),磁盤(DK),光盤(CD),聯(lián)機網(wǎng)絡(OL).

一、信息檢索的類型1.按檢索對象內(nèi)容劃分(1)文獻檢索(DocumentRetrieval)檢索的結果是文獻資料,查找相關文獻的內(nèi)容、出處、收藏單位等。如系統(tǒng)地查找水壓伺服控制閥原理方面的相關文獻<論文>

(2)數(shù)據(jù)檢索(DataRetrieval)以數(shù)值信息為檢索對象,通過檢索,用戶可獲得所需要的確切數(shù)據(jù)。如某種材料的電阻;化學分子式、數(shù)據(jù)圖表等<手冊>

(3)事實檢索(FactRetrieval)檢索的結果是事實結論,查詢某一事務(事件)的性質(zhì)、定義、原理以及發(fā)生的時間、地點過程等。如某產(chǎn)品的生產(chǎn)廠家,哪個牌子的最好;第一顆人造衛(wèi)星是什么時候升空的<年鑒>

第二節(jié)信息檢索的類型、程序與方法(2)計算機檢索2、按照信息檢索手段劃分(1)手工信息檢索從內(nèi)容單一、編排粗糙的文獻檢索刊物發(fā)展為形式多樣、功能齊全、復蓋所有知識門類的文獻信息檢索體系。經(jīng)歷單機檢索、光盤檢索、國際聯(lián)機檢索、數(shù)據(jù)庫的網(wǎng)絡化檢索等階段。

信息檢索的程序是指根據(jù)課題的要求,選擇相應的信息檢索工具或系統(tǒng),采用適當?shù)耐緩胶图夹g,查找所需文獻的過程。(一)分析與研究課題目的:科研立題、科研階段性研究、科研成果鑒定、申請專利、撰寫論文、綜述、述評…基本要求:檢索的時間范圍、文獻類型、檢索深度為題錄、文摘還是全文等結果要求:了解某一理論、方法、設備、過程等的具體的片斷的信息,以解決研究中的具體問題,要求“準”;申請發(fā)明,申報成果獎勵、鑒定科研成果以及立項查新,往往需要全面的收集某一主題范圍的文獻信息,這類課題具有普查追溯的特點,應著眼于“全”三、信息檢索的基本程序(二)選擇檢索工具或數(shù)據(jù)庫

選擇合適檢索工具的前提是對網(wǎng)絡資源有一個較全面的、清晰的了解,具體地說要對檢索工具的類型、內(nèi)容特點、時間范圍、學科范圍、甚至出版商的大體情況都要有一個了解。方法:1、注重平時的積累2、不要盲目檢索,應養(yǎng)成檢索前了解一下數(shù)據(jù)庫的習慣3、注重與他人的交流4、重視圖書館主頁的資源(三)確定檢索途徑以文獻的外部特征為檢索途徑(1)題名途徑(2)責任者途徑(3)號碼途徑(4)機構途徑2.以文獻信息的內(nèi)容特征為檢索途徑(1)分類檢索途徑(2)主題檢索途徑3.以文獻的相互引證關系為檢索途徑 (四)編制檢索提問式1、主要的檢索技術1)、布爾邏輯算符組配檢索

是將多個檢索詞進行邏輯組配形成的一種復合性檢索要求。(1)邏輯與用符號“AND”“

and”或“*”表示,

其邏輯表達式為:AandB或A*B

其意義為檢索記錄中必須同時含有檢索詞A和B的文獻,才算命中文獻。AB

其意義為檢索記錄中凡含有檢索詞A或檢索詞B,或同時含有檢索詞A和B的,均為命中文獻。AB(2)邏輯或用符號“OR”“or”或“+”表示,其邏輯表達式為:AorB或A+BAB同義詞是文獻檢索中的永恒難題!w詞表中與“規(guī)程”對應的英文詞:codes,regulation,rules,specificationsw詞表中與“清晰度”對應的英文詞:definition,resolution,sharpness

其意義為:檢索記錄中含有檢索詞A,但不能含有檢索詞B的文獻,才算命中文獻。

AB(3)邏輯非9用符號“NOT”“not”或“-”表示,其邏輯表達式為:AnotB或A-B2)、位置邏輯算符

它是用位置邏輯算符表示詞與詞之間的相互位置關系和前后次序。(1)(W)——表示兩個詞之間不得有詞或其他字母,可有一空格或標點符號或連字符“—”,詞序不得顛倒。(2)(nW)——表示各檢索詞之間允許插入最多n個詞,詞序不能顛倒。如:智能機器人(3W)控制,可檢出“智能機器人控制”,“智能機器人行為控制”等(3)(nN)——表示各檢索詞之間允許插入最多幾個詞,詞序可以顛倒。如:智能機器人(3N)控制,可檢出“智能機器人控制”,“…控制算法對智能機器人的影響”等(4)(S)——是“Sentence”的縮寫,表示各檢索詞必須同時在一個句子中出現(xiàn),詞序可任意變化,且各詞間可任意加詞。(5)(F)——是“Field”的縮寫,表示各檢索詞必須同時出現(xiàn)在文獻記錄的某個或某些字段中。3)、截詞(模糊檢索)(1)截詞主要是利用檢索詞的詞干或不完整的詞形進行檢索。A、后方截斷(無限截)

Computer(計算機)Comput?Computer、Computers、Computerise、Computerize等均為命中。B、前方截斷

后方一致派生詞的檢索。把截詞符放在字根的左邊,如?Conputer,那么在計算機檢索時,索引詞Microcomputer均算命中。C、有限截斷

就是檢索詞后加一個或一個以上的(最多不超過四個)“?”,空一格再加一個“?”。如:Conputer??D、中間截

就是在一串字符中插入一個或一個以上“?”,表示在該符號的相應位置上可轉換數(shù)目相當?shù)淖址?。M?n相當于man、men4).限制檢索A、字段限定檢索利用字段進行限制,如題名、摘要、全文等,通常的字段限制范圍的大小順序是:題名<關鍵詞<摘要<全文B、二次檢索在前一次檢索的結果中進行另一概念的檢索5)、詞組檢索(精確短語檢索)

通常用“”或{}來表示兩詞是作為一個詞組來檢索的。如“profit

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論