版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
信息檢索基本知識及技巧1第一頁,共六十一頁,2022年,8月28日目錄outline信息檢索的定義、分類及其作用二檢索語言三檢索的效率、手段和方法2023/1/18第二頁,共六十一頁,2022年,8月28日信息檢索的定義、分類及其作用1.1信息檢索的定義信息檢索(InformationRetrieval):,是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關的信息過程,所以它的全稱又叫“信息的存儲與檢索(InformationStorageandRetrieval),這是廣義的信息檢索。狹義的信息檢索則僅指該過程的后半部分,即從信息集合中找出所需要的信息的過程,相當于人們通常所說的信息查尋(InformationSearch)。2023/1/18第三頁,共六十一頁,2022年,8月28日1.2信息檢索的手段(1)手工檢索eg:美國工程索引(2)光盤檢索eg:medline(3)網(wǎng)絡檢索eg:springerlink2023/1/18第四頁,共六十一頁,2022年,8月28日1.3信息檢索的對象(1)文獻檢索(DocumentRetrieval):是以文獻(包括題錄、文摘和全文)為檢索對象的檢索。可分為全文檢索和書目檢索兩種。
(2)事實檢索(FactRetrieval):是以某一客觀事實為檢索對象,查找某一事物發(fā)生的時間、地點及過程的檢索。
(3)數(shù)據(jù)檢索(DataRetrieval):是以數(shù)值或數(shù)據(jù)(包括數(shù)據(jù)、圖表、公式等)為對象的檢索。
2023/1/18第五頁,共六十一頁,2022年,8月28日1.4信息檢索的作用(1)信息檢索是獲取知識的捷徑
eg:princeton的學生約翰·菲利普利用圖書館公開資料設計原子彈。
(2)信息檢索是科學研究的向導
eg:(美)阿波羅飛船的燃料箱的重復研究問題。(3)信息檢索是終身教育的基礎
unesco:可以防止知識老化,不斷更新知識2023/1/18第六頁,共六十一頁,2022年,8月28日二信息檢索的要素
(1)前提——信息意識/信息素養(yǎng)informationliteracy新聞閱讀:《武漢的士起步價調(diào)為兩公里16元12月1日起執(zhí)行》
看到標題,能聯(lián)想到什么?
從信息認知、信息情感和信息行為三個方面進行分析!2023/1/18第七頁,共六十一頁,2022年,8月28日(2)基礎——信息源A、信息的載體:
印刷型
縮微型機讀型聲像型2023/1/18第八頁,共六十一頁,2022年,8月28日B、信息的內(nèi)容和加工級次:
一次文獻
二次文獻三次文獻2023/1/18第九頁,共六十一頁,2022年,8月28日C、信息的出版形式:圖書期刊會議資料學位論文專利標準報告百科全書、類書2023/1/18第十頁,共六十一頁,2022年,8月28日圖書的檢索途徑主要用到:
書名作者出版社ISBN關鍵詞期刊的檢索途徑主要用到:
刊名篇名作者關鍵詞ISSN2023/1/18第十一頁,共六十一頁,2022年,8月28日會議論文的檢索途徑主要用到:
會議名稱主辦單位會議地點關鍵詞作者會議文章篇名學位論文的檢索途徑主要用到:
作者學位授予單位導師姓名關鍵詞論文篇名2023/1/18第十二頁,共六十一頁,2022年,8月28日專利資料的檢索途徑主要用到:
關鍵詞專利權人發(fā)明人國際專利分類號公開號標準資料的檢索途徑主要用到:
標準編號標準名稱發(fā)布單位發(fā)布日期關鍵詞2023/1/18第十三頁,共六十一頁,2022年,8月28日報告資料的檢索途徑主要用到:
報告號關鍵詞作者報告單位合同戶報告代碼百科全書、類書資料的檢索途徑主要用到:
音形義2023/1/18第十四頁,共六十一頁,2022年,8月28日(3)核心——信息利用能力掌握各種信息源掌握檢索語言熟練使用檢索工具對檢索結果的評價,判斷2023/1/18第十五頁,共六十一頁,2022年,8月28日附:期刊的指數(shù)計算(1)影響因素=該年引用該刊前兩年文章的總次數(shù)當年該刊所發(fā)表文章的總數(shù)即年指標前兩年該刊所發(fā)表文章的總數(shù)=一特定年度對該刊當年發(fā)表文章的引用次數(shù)影響因素是一種期刊中論文的平均被引率特定年度的影響因素用于測度一種期刊被利用的速度,也是測度期刊重要性的依據(jù)即年指標2023/1/18第十六頁,共六十一頁,2022年,8月28日自引率與被引率
自引率是指一種期刊中引用本刊的參考文獻對全部參考文獻之比;被自引率是一種期刊被本刊中文章引用的次數(shù)與該刊被引用的總次數(shù)之比。=自引率某刊自引的引文量該刊全部引文量被引率
=某刊自引的引文量某刊被引用的總次數(shù)2023/1/18第十七頁,共六十一頁,2022年,8月28日二檢索語言2.1按表現(xiàn)形式劃分的檢索語言
外表特征語言內(nèi)容特征語言2023/1/18第十八頁,共六十一頁,2022年,8月28日外表特征:就是文獻上記明的、顯而易見的特征。外表特征語言(書目引文語言)題名(書名、篇名)著者姓名文獻序號(如:ISBN、ISSN、專利號、報告號等)書目引文出版事項文獻類型2023/1/18第十九頁,共六十一頁,2022年,8月28日
內(nèi)容特征語言非句法語言句法語言等級制體系分類法標題詞關鍵詞敘詞單元詞加標志的敘詞組面詞(如:組面分類法)短語文獻全文的自然語言2023/1/18第二十頁,共六十一頁,2022年,8月28日2.2按應用功能劃分的檢索語言
分類語言主題語言2023/1/18第二十一頁,共六十一頁,2022年,8月28日2.21分類語言
是用分類號和相應的分類款目名稱來表達信息內(nèi)容的主題概念,并按學科體系的邏輯次序將信息資源系統(tǒng)地加以劃分和組織的語言。分類語言能反映事物的從屬派生關系,便于按學科門類進行族檢索。2023/1/18第二十二頁,共六十一頁,2022年,8月28日杜威十進分類法——
DeweyDecimalClassification,DC/DDC美國M.杜威編制的綜合性等級列舉式分類法。分為詳、簡兩種版本,詳本于1876年問世,取名為《圖書館圖書小冊子排架及編目適用的分類法和主題索引》,1951年的第15版改名《杜威十進分類法》000總論
100哲學
200宗教
300社會科學
400語言
500自然科學和數(shù)學
600技術(應用科學)
700藝術、美術和裝飾藝術
800文學
900地理、歷史及輔助學科
第一層展開層630農(nóng)業(yè)
631農(nóng)業(yè)經(jīng)營
631.5作物栽培
2023/1/18第二十三頁,共六十一頁,2022年,8月28日
通用十進制圖書分類法——UniversalDecimalClassificationUDC十進制圖書分類法由兩位比利時書目專家(PaulOtlet、HenrilaFontaine)19世紀末在杜威十進制圖書分類法的基礎上繼續(xù)研發(fā)的分類方法。此種分類方法由數(shù)字和特殊符號組成,把涉及各種知識體系及學科的書籍予以分類。介于數(shù)字和符號無語言障礙的特性,該分類法在世界各地的圖書館中被廣泛應用。
總分類0總匯1哲學,心理學2宗教,神學3社會學,政治,經(jīng)濟,法律,教育,人類學4暫無(由圖書館具體添加)5自然學科,數(shù)學6實用學科,醫(yī)學,科技,企業(yè)經(jīng)濟學,計算機
7藝術,手工藝品,音樂,競技,體育8語言學,文學9地理,生物,歷史2023/1/18第二十四頁,共六十一頁,2022年,8月28日附加+:并列符(例:178.1+33酒精主義者和國民經(jīng)濟)::關系符(例:178.1:33酒精主義對國民經(jīng)濟的影響)
/:包含符(例:592/599系統(tǒng)動物學,從592到599)
=:語言符(例:=71拉丁語)(0...):書類符(例:(042)演講,講義)(...):地域符(例:(234.3)阿爾卑司)2023/1/18第二十五頁,共六十一頁,2022年,8月28日美國國會圖書館圖書分類法——LibraryofCongressClassification
2023/1/18第二十六頁,共六十一頁,2022年,8月28日第一層2023/1/18第二十七頁,共六十一頁,2022年,8月28日末層2023/1/18第二十八頁,共六十一頁,2022年,8月28日中國圖書館圖書分類法——ChineseLibraryClassification,
CLC
中國圖書館分類法,簡稱《中圖法》。包括“馬列主義、毛澤東思想,哲學,社會科學,自然科學,綜合性圖書五大部類,22個基本大類,具體如下:2023/1/18第二十九頁,共六十一頁,2022年,8月28日中國科學院圖書館圖書分類法簡稱科圖法。1958年由中國科學院圖書館編寫,1974年、1979年、1994年分別進行了修訂。分為25大類。中國科學院圖書館圖書分類法2023/1/18第三十頁,共六十一頁,2022年,8月28日國際專利分類法——InternationalPatentClassification,IPC
《關于國際專利分類斯特拉斯堡協(xié)定》與1975年10月7日生效,它為發(fā)明專利,包括出版的專利申請書、發(fā)明證書說明書、實用新型說明書(一下簡稱為“專利文獻”)提供了一種共同的分類。分類表示使各國專利文獻獲得統(tǒng)一分類的一種工具。它的基本目的是作為各專利局以及其他使用者在確定專利申請的新穎性、創(chuàng)造性(包括對技術先進性和實用價值作出評價)而進行的專利文獻檢索是的一種有效檢索工具。
2023/1/18第三十一頁,共六十一頁,2022年,8月28日2023/1/18第三十二頁,共六十一頁,2022年,8月28日2023/1/18第三十三頁,共六十一頁,2022年,8月28日2023/1/18第三十四頁,共六十一頁,2022年,8月28日2023/1/18第三十五頁,共六十一頁,2022年,8月28日2023/1/18第三十六頁,共六十一頁,2022年,8月28日2023/1/18第三十七頁,共六十一頁,2022年,8月28日2023/1/18第三十八頁,共六十一頁,2022年,8月28日2023/1/18第三十九頁,共六十一頁,2022年,8月28日2023/1/18第四十頁,共六十一頁,2022年,8月28日2023/1/18第四十一頁,共六十一頁,2022年,8月28日2023/1/18第四十二頁,共六十一頁,2022年,8月28日2023/1/18第四十三頁,共六十一頁,2022年,8月28日技術主體的分析2023/1/18第四十四頁,共六十一頁,2022年,8月28日2.22主題語言
2023/1/18第四十五頁,共六十一頁,2022年,8月28日2023/1/18第四十六頁,共六十一頁,2022年,8月28日
INSPEC敘詞表舉例:Locomotive
NT①
diesel-electriclocomotiveBT
②vehicles
TT③
vehiclesRT
④railtrafficrailwaystractionCC⑤
B8520-nC3360DFC
⑥
b8520-nc3360DeDI
⑦January19731、下位敘詞2、上位敘詞3、族首詞4、相關詞5、INSPEC數(shù)據(jù)庫使用的分類號6、輸入到INSPEC數(shù)據(jù)庫使用的分類號7、該敘詞的啟用日期英國電氣工程學會(InstituteofElectricEngineering簡稱IEE)下設的國際物理和工程信息服務部(InternationalInformationServicesforthePhysicsandEngineeringCommunities,簡稱INSPEC)2023/1/18第四十七頁,共六十一頁,2022年,8月28日三檢索的效率、手段和方法3.1檢索效率評價2023/1/18第四十八頁,共六十一頁,2022年,8月28日3.2索引語言中改善查全率的措施(1)同義詞控制法
是指當一個概念具有多個同義詞的時候,為了保證標引與檢索的一致性,避免文獻的分散和漏檢,指引詞匯的使用者從其他的同義詞找到一個被專門選擇作為正式主題詞的詞的用法。例如:用符號USE、SEE、Y(用)從正式詞引見非正式的詞,則用USEFOR、D(代)2023/1/18第四十九頁,共六十一頁,2022年,8月28日(2)詞的關聯(lián)法索引詞的關聯(lián),最普通的形式是等級上的關聯(lián)。例如:A、由專指詞到較泛指的詞,使用符號BT(broaderterm),或者S(屬)
B、由泛指詞到較專指的詞,使用符號NT(narrowerterm),或者F(分)
C、由指向近義的詞,使用符號RT(relatedterm),或者C(參),或seealso(參見)
2023/1/18第五十頁,共六十一頁,2022年,8月28日《漢語主題詞表》詞的關聯(lián)舉列
交流發(fā)電機F同步發(fā)電機異步發(fā)電機S發(fā)電機
交流換向電機D交流整離子電機S交流電機Z電機C調(diào)速電動機異步電動機2023/1/18第五十一頁,共六十一頁,2022年,8月28日(3)字形的控制法
即把具有同一詞根的字組合在一起。當然這不是提供標引的措施,而是提供檢索用的輔助手段。在計算機檢索中,是采用截詞實現(xiàn)的:例如:“反射”、“反射波”、“反射性”、“反射望遠鏡”等。都有reflect,用reflect進行截詞檢索,就能檢索出與“反射”有關的所有文獻。2023/1/18第五十二頁,共六十一頁,2022年,8月28日(4)聚類法
在對檢索詞進行統(tǒng)計的基礎上,將有關的索引次進行聚類,可以查出更多的文獻,從而改善查全性。例如:“枯萎”是與“莊稼”、“植物生長”聯(lián)系在一起的,如果“銹菌”也是常與“植物生長”等詞聯(lián)系在一起的話,我們就可以推斷“枯萎”與“銹菌”之間存在某種聯(lián)系。2023/1/18第五十三頁,共六十一頁,2022年,8月28日3.3索引語言中改善查準率的措施組配即兩個或兩個以上概念的組合,有兩種組配形式,先組和后組。
先組式是指概念之間的組合是在詞表編制階段就已經(jīng)定義好的,組配后的符合概念成為供標引的完整索引詞。
心理聲學(是心理學與聲學的組配)蒸發(fā)冷卻(是蒸發(fā)與冷卻的組配)
后組式是指在檢索階段把兩個或兩個以上的有關索引詞進行組合。
“計算機”與“設計”2023/1/18第五十四頁,共六十一頁,2022年,8月28日
先組式有助于提高索引詞的專指度,減少標引到每個詞的文獻數(shù)量,減少和避免假組配,從而有利于查準率。但是先組式的詞在數(shù)量上是有限的,不能適應各種角度和深度的符合概念檢索。
后組式便于各種角度和深度的檢索,有利于查準率的提高,但是可能出現(xiàn)假組配,致使誤檢的增多。對于先組和后組式的評價2023/1/18第五十五頁,共六十一頁,2022年,8月28日3.4計算機檢索語言(1)布爾邏輯檢索功能邏輯或(OR、+)檢索項A、B若用“邏輯或”組配,則邏輯式為“AORB”,或者“A+B”AB表示被檢索的文獻只要包含有其中的一個檢索項,或者同時含有這兩個檢索項,那么它就會被命中。202
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鋁單板藝術中心施工合同
- 新能源材料堆場租賃協(xié)議
- 屋頂人力資源租賃合同
- 融資貸款居間合同范例
- 融資借款協(xié)議三篇
- 蜘蛛人更換玻璃協(xié)議書(2篇)
- 公路檢測資質掛鉤合同范本
- 集體土地所有權登記成果更新匯交服務合同
- 集體合同主要條款
- 住房代銷代理合同范例
- 上海生活垃圾分類現(xiàn)狀調(diào)查報告
- 《數(shù)與形》(教案)2023-2024學年數(shù)學六年級上冊
- 江蘇省南京市選調(diào)生考試(行政職業(yè)能力測驗)綜合能力題庫含答案
- 幼兒園勞動教育國內(nèi)外研究現(xiàn)狀
- 河道水環(huán)境維護方案
- 軍事理論-綜合版-知到答案、智慧樹答案
- 施工單位檔案管理辦法
- SYT 6968-2021 油氣輸送管道工程水平定向鉆穿越設計規(guī)范-PDF解密
- 光伏發(fā)電技術項目投標書(技術標)
- 安全標準化建設事件事故管理事故事件統(tǒng)計分析臺賬
- 2024年上海海洋大學馬克思主義基本原理概論(期末考試題+答案)
評論
0/150
提交評論