




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第一講信息檢索概論第一講信息檢索概論
劉暢第一講信息檢索概論【目的與要求】了解信息檢索有關(guān)概念熟悉各類型信息源、信息檢索語言【重點】各類型信息源、信息檢索語言【難點】信息檢索語言第一講信息檢索概論Contents關(guān)于幾個基本概念的辨析信息資源類型檢索定義及類型信息檢索定義及類型4123信息檢索語言第一講信息檢索概論一、幾個基本概念的辨析1.信息(information,inform帶有指令性)“信息是用來消除隨機不定性的東西?!?/p>
—美國數(shù)學(xué)家、信息論創(chuàng)始人申農(nóng),1948“信息就是信息,既非物質(zhì),也非能量。”
—美國數(shù)學(xué)家、控制論創(chuàng)始人維納,1948第一講信息檢索概論2.文獻“文,典籍也;獻,賢也”
——宋,朱熹“在存貯、檢索、利用或傳遞記錄信息的過程中,可作為一個單元處理的,在載體內(nèi)、載體上或依附載體而存貯有信息或數(shù)據(jù)的載體”
——ISO《文獻情報術(shù)語國際標(biāo)準(zhǔn)》“文獻是記錄有知識和信息的一切載體?!?/p>
——《中華人民共和國國家標(biāo)準(zhǔn)·文獻著錄總則》第一講信息檢索概論3.情報情報是指被傳遞的知識或事實,是知識的激活,是運用一定的載體,越過空間和時間傳遞給特定用戶,解決科研,生產(chǎn)中的具體問題所需要的特定知識和信息。
第一講信息檢索概論4.知識中國古代:智慧、學(xué)問“士雖有學(xué),而行為本焉”
——《墨子﹒修身》“吾有知乎哉?無知也”
——《論語、子罕》第一講信息檢索概論現(xiàn)代知識社會:
“知識是對事實或思想的一套有系統(tǒng)的闡述提出合理的判斷或經(jīng)驗性的結(jié)果,它通過某種交流手段,以某種系統(tǒng)的方式傳播給其他人?!?/p>
——美國學(xué)者丹尼爾,20世紀(jì)70年代
內(nèi)涵:關(guān)于事實與思想的陳述;這些陳述能提出合理判斷或?qū)嵶C結(jié)果;它們可通過傳媒傳遞給他人第一講信息檢索概論四個概念間的關(guān)系:Titleinhere情報文獻知識信息信息與知識:今天最低氣溫是0攝氏度水在0攝氏度時結(jié)冰知識可被視為載有經(jīng)驗、評價、敏銳洞察力的信息。文獻與知識:文獻記錄的知識僅僅是顯性知識,隱性知識是無法記錄的。情報與知識:情報不一定屬于知識的范疇,有些情報可以屬于知識,是知識的一種,有些情報未必是知識。文獻與情報:不是所有文獻都能成為情報,所有情報也不都能記載在文獻中。第一講信息檢索概論記錄型實物型智力型零次二、信息資源的類型和特征政府性商業(yè)性公益性公開非公開半公開
一次:新穎性、創(chuàng)新性二次:濃縮性、有序性
三次:綜合性關(guān)于信息資源類型劃分的多種觀點
按信息資源的運營機制劃分
B潛在現(xiàn)實按照信息資源加工程度劃分從信息資源管理和開發(fā)角度劃分
按信息傳遞的范圍劃分
按信息存在狀態(tài)劃分
第一講信息檢索概論信息資源類型框架圖第一講信息檢索概論1.刻寫型文獻信息資源
2.印刷型文獻信息資源3.縮微型文獻信息資源4.視聽型文獻信息資源(一)文獻型信息資源
第一講信息檢索概論1.刻寫型文獻信息資源以刻劃和手工書寫為手段,將知識信息內(nèi)容記錄在各種自然物質(zhì)材料和紙張等不同的載體上而形成的文獻。第一講信息檢索概論《滾滾紅塵》——三毛第一講信息檢索概論1.刻寫型文獻信息資源
2.印刷型文獻信息資源3.縮微型文獻信息資源4.視聽型文獻信息資源(一)文獻型信息資源
第一講信息檢索概論2.印刷型文獻信息資源
通過石印、油印、鉛印、膠印、復(fù)印等印刷方式,將知識信息內(nèi)容記錄在紙質(zhì)載體上的一種文獻形式。圖書狹義的圖書,是指以紙張為載體材料,記錄與傳播知識、具有完整裝幀形式的非連續(xù)性出版物。按照使用目的,可將圖書劃分為以下兩類:一類是供閱讀的著作,另一類是供查考的工具書。第一講信息檢索概論連續(xù)出版物
期刊的特點是:①內(nèi)容廣泛,知識新穎,不同種類的期刊內(nèi)容涉及各個領(lǐng)域;②出版周期短,傳遞信息快,能及時反映新理論、新技術(shù)、新方法、新動向;③數(shù)量龐大,流通范圍廣,作者與讀者人數(shù)多,影響面寬。期刊的種類:政論性期刊、學(xué)術(shù)性期刊、工藝技術(shù)性期刊、文學(xué)藝術(shù)期刊、通俗性期刊、檢索性期刊、資料性期刊、報道性期刊第一講信息檢索概論特種文獻資料:似書非書,似刊非刊。特點:
①內(nèi)容廣泛新穎,類型復(fù)雜多樣,涉及科學(xué)技術(shù)、生產(chǎn)生活各個領(lǐng)域;
②現(xiàn)實性強,情報價值高,從不同領(lǐng)域及時反映當(dāng)前科學(xué)技術(shù)的創(chuàng)造發(fā)明、進展動態(tài)、研究水平及發(fā)展趨勢
③出版發(fā)行無規(guī)律,有的有一定的保密性,收集比較困難。特種文獻資料主要包括以下幾種類型:科技報告、政府出版物、會議文獻、學(xué)位論文、專利文獻、標(biāo)準(zhǔn)文獻、產(chǎn)品資料第一講信息檢索概論其他零散資料
主要指檔案資料、輿圖、圖片和樂譜等零散資料。萬國坤輿圖——利瑪竇,明萬歷三十年1602年第一講信息檢索概論第一講信息檢索概論1.刻寫型文獻信息資源
2.印刷型文獻信息資源3.縮微型文獻信息資源4.視聽型文獻信息資源(一)文獻型信息資源
第一講信息檢索概論3.縮微型文獻信息資源
主要指縮微資料,它是利用光學(xué)記錄技術(shù),將印刷型文獻的影像縮小記錄在感光材料上制成的文獻復(fù)制品。
第一講信息檢索概論1.刻寫型文獻信息資源
2.印刷型文獻信息資源3.縮微型文獻信息資源4.視聽型文獻信息資源(一)文獻型信息資源
第一講信息檢索概論4.視聽型文獻信息資源
主要指視聽資料,又稱聲像文獻。它是以電磁材料為載體,以電磁波為信息符號,將聲音、文字及圖像記錄下來的一種動態(tài)型文獻。第一講信息檢索概論(二)數(shù)字化信息資源
網(wǎng)絡(luò)信息資源單機信息資源
聯(lián)機檢索信息資源(數(shù)據(jù)庫)
因特網(wǎng)信息資源
磁帶磁盤光盤指以數(shù)字化的形式,將文字、圖像、聲音、動畫等多種形式的信息存儲在光、磁等非紙質(zhì)載體中,以光信號、電信號的形式傳輸,并通過計算機和其他外部設(shè)備再現(xiàn)出來的信息資源。
第一講信息檢索概論信息焦慮數(shù)量幾何倍增長質(zhì)量嚴(yán)重不均衡過量的信息與沒有信息引起的困惑同樣是問題人們必須在有限的時間范圍,有效地獲得自己所需要的信息,排除不相關(guān)的信息。需要專門工具來幫助人們完成互聯(lián)網(wǎng)檢索定律:在互聯(lián)網(wǎng)上您總能找到或者說只能找到您不需要的東西。第一講信息檢索概論三、信息檢索的概念
(一)定義信息檢索(InformationRetrieval)是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關(guān)的信息過程,所以它的全稱又叫“信息的存儲與檢索”(InformationStorageandRetrieval),這是廣義的信息檢索。狹義的信息檢索,則僅指該過程的后半部分,即從信息集合中找出所需要的信息的過程,相當(dāng)于人們通常所說的信息查尋(InformationSearch)。簡而言之,從一定的檢索系統(tǒng)中查尋(Search)出符合特定需要的信息。第一講信息檢索概論(二)分類1.按檢索手段分(1)手工檢索:利用目錄、索引、文摘等手工檢索工具(在計算機和互聯(lián)網(wǎng)出現(xiàn)之前,我們用過的工具書如詞典、字典、類書、政書、年鑒等等看中文工具書導(dǎo)論)(2)光盤檢索:中國大百科全書、不列顛大百科全書(3)聯(lián)機檢索:dialog(4)網(wǎng)絡(luò)檢索:數(shù)據(jù)庫、SE、OPAC網(wǎng)絡(luò)檢索是信息檢索的發(fā)展方向,我們目前最常用的也是網(wǎng)絡(luò)檢索,因此我們這么課程主要講授的就是網(wǎng)絡(luò)檢索。第一講信息檢索概論手工檢索光盤檢索聯(lián)機檢索網(wǎng)絡(luò)檢索文獻型信息檢索——凡是查找某一主題、時代、地區(qū)、著者和文種的有關(guān)文獻,以及回答這些文獻的出處和收藏處所等
——借助于各種書目型數(shù)據(jù)庫
數(shù)值型信息檢索——是以數(shù)值或數(shù)據(jù)為對象的一種檢索——各種數(shù)值數(shù)據(jù)庫和統(tǒng)計數(shù)據(jù)庫事實型信息檢索——是一某一客觀事實為檢索對象,查找某一事物發(fā)生的時間、地點及過程的檢索——指南數(shù)據(jù)庫、全文數(shù)據(jù)庫、搜索引擎按檢索手段分檢索對象形式
(二)檢索類型第一講信息檢索概論四、文獻信息檢索語言思考:信息檢索就是從一定的文獻集合(即檢索系統(tǒng))中查找出符合特定需要的文獻,那么這個過程是如何實現(xiàn)的呢?第一講信息檢索概論計算機檢索的基本原理:它是將用戶的檢索提問詞與數(shù)據(jù)庫文獻記錄中的標(biāo)引詞進行對比,當(dāng)提問詞與標(biāo)引詞匹配一致時,即為命中,檢索成功。這里所說的“準(zhǔn)確”,是指用戶所選的檢索詞必須與數(shù)據(jù)庫中標(biāo)引文獻記錄所用的標(biāo)引詞一致。然而實際工作中,從事信息存儲的人員與從事信息檢索的人員絕大多數(shù)情況下不可能進行直接的思想交流,因而會造成存儲信息與檢索信息所依據(jù)的規(guī)則不一致,導(dǎo)致存入的文獻檢不出。為了避免這種情況發(fā)生,在信息標(biāo)引人員與信息檢索人員之間必須制定一種共同遵守的規(guī)則,即一種約定的相同標(biāo)識和線路,這就是檢索語言。第一講信息檢索概論(一)定義
檢索語言檢索語言(informationretrievallanguage),是信息存儲與檢索過程中用于描述信息特征和表達用戶信息提問的一種專門語言。所謂檢索的運算匹配就是通過檢索語言的匹配來實現(xiàn)的。檢索語言把信息的存儲與檢索聯(lián)系起來,把標(biāo)引人員與用戶聯(lián)系起來,以便取得共同理解、實現(xiàn)交流的語言。第一講信息檢索概論(二)檢索語言的工作原理1.存儲:檢索系統(tǒng)對文獻內(nèi)容進行分析,概括分析出若干能代表文獻內(nèi)容的語詞,并賦予一定的標(biāo)識,如題名、作者、主題詞等,作為存儲與檢索的依據(jù),然后納入到數(shù)據(jù)庫中。2.檢索:檢索人員首先要對檢索課題進行分析,同樣形成若干能代表信息需求的語詞,然后通過檢索系統(tǒng)在數(shù)據(jù)庫中匹配具有同樣語詞和標(biāo)識的文獻,找到自己所需的信息。第一講信息檢索概論(三)檢索語言的作用1.使文獻成為有序的集合體,使文獻信息的存儲集中化、系統(tǒng)化、組織化,便于檢索者按照一定的排列次序進行有序化檢索;2.標(biāo)引文獻信息內(nèi)容及其外表特征,保證不同標(biāo)引人員表征文獻的一致性;3.保證檢索提問與文獻信息標(biāo)引的一致性;4.提供檢索入口,如內(nèi)部特征:主題詞、分類號等。這些檢索系統(tǒng)中的標(biāo)識系統(tǒng),提供檢索的出發(fā)點也就是我們的檢索點,如著者、分類號、主題詞、關(guān)鍵詞等;5.保證檢索者按不同需要檢索文獻時,都能獲得最高查全率和查準(zhǔn)率。第一講信息檢索概論(四)檢索語言的基本類型
目前使用的檢索語言包括自然語言和人工語言,前者可以為那些不懂人工語言的網(wǎng)絡(luò)用戶提供極大的便利,而前者又分為分類語言與主題語言。第一講信息檢索概論1.自然語言(naturallanguage)(1)定義檢索用詞是從信息內(nèi)容本身抽取的,主要依賴于計算機自動抽詞技術(shù)完成,輔以人工自由標(biāo)引(非依據(jù)詞表的標(biāo)引方法),是非規(guī)范詞(uncontrolledterm)。①關(guān)鍵詞(keyword):直接從信息資源名稱、正文或文摘中抽出的代表信息主要內(nèi)容的重要語詞。②題名:信息資源的名稱,如論文篇名、圖書書名、網(wǎng)站名稱等。③全文:從資源的內(nèi)部內(nèi)容中自動抽取、查找,是目前網(wǎng)上各類搜索引擎使用的最多的方法。④引文(quotation):將文獻所引用的參考文獻的作者、篇名、來源出版物抽取出來進行標(biāo)引。(2)優(yōu)點①新穎性強:一旦文獻中出現(xiàn)某個新詞語,即可直接使用這一詞語作為檢索入口,根本無需像受控語言那樣冥思苦想地將其轉(zhuǎn)換成另一規(guī)范詞用于檢索。②檢索方便:它解除了人工語言的種種限制,不需要復(fù)雜的檢索規(guī)則,使用者能較快適應(yīng),易用性強。③標(biāo)引準(zhǔn)確度高:自然語言采用從文獻中抽詞標(biāo)引的方式,不容易發(fā)生誤標(biāo)引,適用于計算機檢索。只要數(shù)據(jù)庫的文獻標(biāo)題中含有該檢索詞,即視為命中,健全率較高。(3)缺點:①詞匯量太大,給詞匯的存儲、加工和檢索帶來許多操作性方面的困難。②當(dāng)文獻的主題很明白清楚地在標(biāo)題或主題詞中表達出來時,檢索才會較成功,反之則失效。③詞匯具有模糊性,另外多義、近義、同義現(xiàn)象較多,給標(biāo)引和檢索帶來困難。第一講信息檢索概論2.人工語言由人工創(chuàng)制的,采用規(guī)范詞,用來專指某個概念或與之相應(yīng)的概念??梢詫⑼x詞、近義詞、相關(guān)詞、多義詞及縮略詞規(guī)范在一起,由人工控制。包括分類檢索語言、主題檢索語言、代碼檢索語言。(1)分類檢索語言按學(xué)科范疇及知識之間的關(guān)系列出類目,并用數(shù)字、字母符號對類目進行標(biāo)識的一種語言體系,也稱分類法。中國圖書館圖書分類法美國國會圖書館分類法杜威十進位分類法IPC國際專利分類表第一講信息檢索概論《中圖法》的類目表由基本大類、簡表、詳表和復(fù)分表組成?;敬箢愂欠诸惙ㄖ械牡谝患夘惸?,是對學(xué)科領(lǐng)域的基本劃分。《中圖法》共有二十二個基本大類,每個大類都用一個英文字母表示。如下所示:
A馬克思主義、列寧主義、毛澤東思想、鄧小平理論
B哲學(xué)宗教
C社會科學(xué)總論
D政治法律
E軍事
F經(jīng)濟
G文化科學(xué)教育體育
H語言文字
I文學(xué)
J藝術(shù)
K歷史地理
N自然科學(xué)總論
O數(shù)理科學(xué)化學(xué)
P天文學(xué)地球科學(xué)
Q生物科學(xué)
R醫(yī)藥衛(wèi)生
S農(nóng)業(yè)科學(xué)
T工業(yè)技術(shù)
U交通運輸
V航空航天
X環(huán)境科學(xué)勞動保護科學(xué)
Z綜合性圖書第一講信息檢索概論簡表又稱為基本類目表,是分別對每個基本大類,依據(jù)它的某些屬性,作進一步劃分后而形成的二、三級類目表如:
Q生物科學(xué)Q1普通生物學(xué)Q2細(xì)胞學(xué)Q3遺傳學(xué)Q4生理學(xué)Q5生物化學(xué)第一講信息檢索概論詳表又稱主表或正表,由簡表進一步細(xì)分而成的最小概念性分類表。如:
I文學(xué)
I0文學(xué)理論
I1世界文學(xué)
I2中國文學(xué)
I20
I21作品集
I22詩歌、韻文
I23戲劇文學(xué)
I24小說
I242古代至近代作品
I246現(xiàn)代作品
I247當(dāng)代作品
I247.4章回小說
I247.5新體長篇、中篇小說
I247.7新體短篇小說
I247.8故事、微型小說
I25報告文學(xué)
I26散文
┇
I3/7各國文學(xué)第一講信息檢索概論(2)主題檢索語言
是以詞語作為表達主題概念的標(biāo)識,按字順編排的檢索語言。標(biāo)題詞語言是最早使用的一種主題語言。它
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司聘用合同范本6
- 公對個人合同范本
- 公司外包合同范本
- 亞馬遜運營托管合同范本
- 供電系統(tǒng)維修合同范本
- 生物質(zhì)能源開發(fā)與種植合同
- 自然人反擔(dān)保保證合同
- 醫(yī)療器械生產(chǎn)合作合同
- 股權(quán)激勵合同協(xié)議書
- 太原住宅租賃合同
- 新審定人教版小學(xué)數(shù)學(xué)六年級下冊教材分析課件
- 小學(xué)科學(xué)教科版五年級上冊全冊思維導(dǎo)圖(2021新版)
- 全國水資源保護規(guī)劃技術(shù)大綱
- 企業(yè)員工培訓(xùn)PPT課件:職務(wù)犯罪培訓(xùn)
- 蛋白質(zhì)分離技術(shù)全PPT課件
- 汪小蘭有機化學(xué)課件(第四版)9醛酮醌
- 磷酸鐵鋰電池工商業(yè)儲能項目施工組織設(shè)計方案
- 震旦ad188維修手冊
- 五金英語詞匯盤點
- 內(nèi)容講義說明案例nxt pop trainning
- 工業(yè)自動化設(shè)備項目用地申請報告(模板)
評論
0/150
提交評論