版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、信息檢索基礎(chǔ)前前 言言 本課程主要采用以問題為基礎(chǔ)的教學(xué)方法(Problem-based Learning, PBL),通過檢索理論與實(shí)踐的教學(xué),使學(xué)生掌握信息檢索的基礎(chǔ)知識(shí),熟練掌握臨床醫(yī)學(xué)及基礎(chǔ)醫(yī)學(xué)的檢索技能,能夠靈活運(yùn)用檢索工具進(jìn)行文獻(xiàn)、數(shù)據(jù)、網(wǎng)絡(luò)資源等信息的檢索及查新咨詢服務(wù),理解各種檢索語言,并能對(duì)檢索系統(tǒng)進(jìn)行評(píng)價(jià)和優(yōu)選,從而提高自身信息素養(yǎng)信息素養(yǎng),并加強(qiáng)學(xué)術(shù)規(guī)范和信息道德修養(yǎng)。信息檢索課的學(xué)習(xí)目標(biāo) 1.掌握信息、情報(bào)、文獻(xiàn)、知識(shí)的基本概念 2.了解文獻(xiàn)的類型、特點(diǎn) 3.知道數(shù)據(jù)庫的類型與結(jié)構(gòu) 4.掌握信息檢索的途徑、步驟 5.理解檢索式的編寫與檢索策略的調(diào)整 6.熟悉信息網(wǎng)絡(luò)技術(shù)
2、與網(wǎng)絡(luò)信息檢索最終培養(yǎng)同學(xué)們終身學(xué)習(xí)的能力,提高信息素養(yǎng)。l 信息學(xué)l 信息素養(yǎng)l 信息技術(shù)計(jì)算機(jī)信息檢索概述l 計(jì)算機(jī)檢索方法l 計(jì)算機(jī)信息檢索策略與檢索步驟目目 錄錄信息學(xué) l信息概述l信息需要與行為信息及相關(guān)概念l 信息l 知識(shí)l 情報(bào)l 文獻(xiàn)信息信息 李清照李清照 “不乞隨珠與和碧,只乞相關(guān)新信息不乞隨珠與和碧,只乞相關(guān)新信息”。 周密周密 “覓梅花信息,擁吟袖,暮鞭寒覓梅花信息,擁吟袖,暮鞭寒” 李中李中 “夢(mèng)斷美人沉信息,目穿長路倚樓臺(tái)夢(mèng)斷美人沉信息,目穿長路倚樓臺(tái)”美國數(shù)學(xué)家克勞德美國數(shù)學(xué)家克勞德申農(nóng)申農(nóng)“信息是用來消除不確定信息是用來消除不確定性的東西性的東西”。美國控制論創(chuàng)始
3、人維納認(rèn)為美國控制論創(chuàng)始人維納認(rèn)為“信息是人們?cè)谶m應(yīng)外信息是人們?cè)谶m應(yīng)外部世界并且使這種適應(yīng)反作用于外部世界的過程中部世界并且使這種適應(yīng)反作用于外部世界的過程中同外部世界進(jìn)行交換的內(nèi)容的名稱同外部世界進(jìn)行交換的內(nèi)容的名稱”。中國學(xué)者鐘義信認(rèn)為中國學(xué)者鐘義信認(rèn)為“信息是事物運(yùn)動(dòng)的狀態(tài)以及信息是事物運(yùn)動(dòng)的狀態(tài)以及它的狀態(tài)改變的方式,是物質(zhì)的一種屬性它的狀態(tài)改變的方式,是物質(zhì)的一種屬性”。知識(shí)是經(jīng)過人的思維整理過的信息、數(shù)據(jù)、形知識(shí)是經(jīng)過人的思維整理過的信息、數(shù)據(jù)、形象、意向價(jià)值標(biāo)準(zhǔn)以及社會(huì)的其他符號(hào)化產(chǎn)物象、意向價(jià)值標(biāo)準(zhǔn)以及社會(huì)的其他符號(hào)化產(chǎn)物“。情報(bào)就是人們?cè)谔囟〞r(shí)間內(nèi)為一定目的而傳情報(bào)就是人們
4、在特定時(shí)間內(nèi)為一定目的而傳遞的有特殊效用的知識(shí)或信息。遞的有特殊效用的知識(shí)或信息。中華人民共和國文獻(xiàn)工作標(biāo)準(zhǔn)中華人民共和國文獻(xiàn)工作標(biāo)準(zhǔn)中定中定義:義:“文獻(xiàn)是記錄有知識(shí)的一切載體文獻(xiàn)是記錄有知識(shí)的一切載體”。信息的特性(1)普遍性 信息是事物運(yùn)動(dòng)的狀態(tài)和狀態(tài)變化的方式,因此,只要有客觀事物的存在,只要客觀事物在不斷地運(yùn)動(dòng),就會(huì)有它們運(yùn)動(dòng)的狀態(tài)和狀態(tài)變化的方式,也就存在著信息,所以信息是普遍存在的,信息具有普遍性。(2)傳遞性 信息在事物之間的相互聯(lián)系必定在信息流動(dòng)中發(fā)生。信息的傳遞性表現(xiàn)在人與人之間的消息交換,人與機(jī)器、機(jī)器與機(jī)器之間的信息交換,動(dòng)物與植物的信號(hào)交換。信息的傳遞和流通過程是一個(gè)
5、重復(fù)使用的流通過程,在這一過程中,信息的占有者不會(huì)因傳遞信息而失掉信息,一般說來,也不會(huì)因多次使用而改變信息的自身價(jià)值。(3)依存性 信息總是依附于一定的物質(zhì)載體而存在,需要某種物質(zhì)承擔(dān)者。信息必須依附于一定的物質(zhì)形式(如聲波、電磁波、紙張、化學(xué)材料、磁性材料等等)之上。 (4)相對(duì)性 客觀上信息是無限的,但相對(duì)于信息用戶來說,人們實(shí)際獲得(實(shí)得信息)總是有限的。并且由于不同的信息用戶有著不同的感受能力、不同的理解能力和不同的目的性,因此,同一信息對(duì)不同認(rèn)知水平的用戶所產(chǎn)生的作用和有效性也不相同。 (5)可加工性 信息可以加工處理,可以壓縮、擴(kuò)充和疊加,也可以變換形態(tài)。在流通和使用過程中,經(jīng)過
6、綜合、分析、再加工,大量的原始醫(yī)藥信息可以變成醫(yī)學(xué)文摘數(shù)據(jù)庫和Cochrane Library的系統(tǒng)評(píng)價(jià)。 (6)時(shí)效性 現(xiàn)代社會(huì)中,信息的使用周期迅速縮短,信息的價(jià)值實(shí)現(xiàn)取決于及時(shí)地把握和運(yùn)用信息。信息是活躍的,不斷變化的,及時(shí)地獲取有效的信息將獲得信息的最佳價(jià)值,如時(shí)效性很強(qiáng)的天氣預(yù)報(bào)、經(jīng)濟(jì)信息、交易信息、科學(xué)信息等。不能及時(shí)地使用最新信息,信息的價(jià)值就會(huì)隨其滯后使用的時(shí)差而減值或貶值。 (7) 可共享性 與物質(zhì)、能量不同,信息沒有排他性,它可以共享。信息的作用(1)信息是人類認(rèn)識(shí)客觀世界及其發(fā)展規(guī)律的基礎(chǔ)(2)信息是科學(xué)研究的必要條件(3)信息是管理和決策的主要參考依(4)信息是社會(huì)發(fā)展
7、的資源 知識(shí)概念 知識(shí)的認(rèn)識(shí)觀:知識(shí)就是對(duì)事物屬性與聯(lián)系的認(rèn)識(shí)。表現(xiàn)為對(duì)事物的知覺、表象、概念、法則等心理形式。即是說,知識(shí)是對(duì)事物本質(zhì)及聯(lián)系的認(rèn)識(shí)。根據(jù)這種知識(shí)觀,人們把知識(shí)分為直接知識(shí)與間接知識(shí)兩大類。 知識(shí)的信息觀:知識(shí)是人類通過信息對(duì)自然界、生物界、人類社會(huì)運(yùn)動(dòng)規(guī)律的認(rèn)識(shí)和概括,是人的大腦通過思維重新集成整合的系統(tǒng)化信息,是信息中最有價(jià)值的部分。即是說,信息是產(chǎn)生知識(shí)的原材料,知識(shí)是信息加工的抽象化產(chǎn)物。經(jīng)濟(jì)合作與發(fā)展組織(OECD)知識(shí)分為四類 知事(Know-what):即關(guān)于事實(shí)認(rèn)知的知識(shí)。 知因(Know-why ):即關(guān)于科學(xué)原理以及自然規(guī)律的知識(shí)。 技能(Know-how)
8、:即從事業(yè)務(wù)的技巧、秘訣、竅門與能力。 知人(Know-who):即那些人有特殊專長的知識(shí)及特殊社會(huì)人脈關(guān)系。 情報(bào)概念 情報(bào)是指?jìng)鬟f著的有特定效用的知識(shí)。(錢學(xué)森說情報(bào)是激活的知識(shí))情報(bào)三個(gè)基本屬性 知識(shí)性、傳遞性、效用性 信息、知識(shí)、情報(bào)、文獻(xiàn)的關(guān)系信息源信息源按產(chǎn)生次序和加工整理的程度不同按出版類型 (按信息按信息產(chǎn)生次序和加工整理的程度不同產(chǎn)生次序和加工整理的程度不同分分)零次信息零次信息 未經(jīng)正式發(fā)表或不宜公開和大范圍內(nèi)交流的比較原始未經(jīng)正式發(fā)表或不宜公開和大范圍內(nèi)交流的比較原始素材。如底稿、書信、工作文稿、口頭交流的知識(shí)等。素材。如底稿、書信、工作文稿、口頭交流的知識(shí)等。一次信息(
9、原始信息)一次信息(原始信息) 人類社會(huì)實(shí)踐活動(dòng)中直接產(chǎn)生或得到的各種數(shù)據(jù)、概人類社會(huì)實(shí)踐活動(dòng)中直接產(chǎn)生或得到的各種數(shù)據(jù)、概念、知識(shí)、經(jīng)驗(yàn)及其總結(jié)。如期刊論文、學(xué)位論文、科技念、知識(shí)、經(jīng)驗(yàn)及其總結(jié)。如期刊論文、學(xué)位論文、科技報(bào)告等。報(bào)告等。二次信息二次信息 將分散的無序的一次信息進(jìn)行加工整理后,使之成為將分散的無序的一次信息進(jìn)行加工整理后,使之成為系統(tǒng)有序的信息。系統(tǒng)有序的信息。 如書目、引文索引、搜索引擎的搜索如書目、引文索引、搜索引擎的搜索結(jié)果等。結(jié)果等。三次信息三次信息 根據(jù)二次信息提供的線索,利用一次信息,經(jīng)過調(diào)研、根據(jù)二次信息提供的線索,利用一次信息,經(jīng)過調(diào)研、分析、綜合而形成的。如
10、百科全書、綜述、述評(píng)、字詞典分析、綜合而形成的。如百科全書、綜述、述評(píng)、字詞典等。等。 一次信息有如下特點(diǎn):(1)創(chuàng)造性:一次信息是人們根據(jù)自己在生產(chǎn)和科學(xué)研究中的成果撰寫的,是創(chuàng)造性勞動(dòng)的結(jié)晶。它報(bào)道新成果、新技術(shù)、新發(fā)明、新創(chuàng)造。例如專利,它具有新穎性和創(chuàng)造性,反映了發(fā)明創(chuàng)造、技術(shù)革新與改進(jìn)的創(chuàng)造性勞動(dòng)成果。正由于一次信息的創(chuàng)造性,故受到人們重視。 (2)原始性:一次信息是一種原始的創(chuàng)作,也必然是初次發(fā)表的,一般是作者根據(jù)自己所積累的原始素材、原始數(shù)據(jù)創(chuàng)作而成,故其既有真實(shí)可靠的一面,又有特定性和不成熟一面。 (3)多樣性:一次性信息是每個(gè)作者的不同成果,故在內(nèi)容上多樣化;另外,在表現(xiàn)形式
11、上也呈現(xiàn)出多樣性,有文學(xué)讀物、期刊論文,也有研究報(bào)告、學(xué)位論文等等。 二次信息具有以下特點(diǎn): (1)集中性:二次信息集中了某個(gè)特定領(lǐng)域范圍的文獻(xiàn)信息。它可以是某個(gè)信息部門的所有書刊資料,某個(gè)學(xué)科領(lǐng)域的信息,某個(gè)作者的所有信息等。二次信息是在所集中的某個(gè)特定范圍的信息基礎(chǔ)上,用科學(xué)的方法加工整理、組織編排而成,它比較完整地反映了某信息部門、某學(xué)科、某作者等的信息情況。 (2)工具性:二次信息可稱之為工具性的文獻(xiàn),它以特定的方法,簡(jiǎn)練的語言揭示文獻(xiàn)的外部特征和內(nèi)容特征,并加以科學(xué)的編排。它是累積、報(bào)告和查找文獻(xiàn)線索的一種工具。一般所說的信息檢索,即指對(duì)于此類文獻(xiàn)的有效利用,從中查檢到一定的知識(shí)信息
12、或某項(xiàng)課題的文獻(xiàn)線索。 (3)系統(tǒng)性:二次信息本身具有自己的系統(tǒng)結(jié)構(gòu),為了方便利用,一般提供多個(gè)檢索途徑。所以一種好的二次信息往往具有比較固定的體系結(jié)構(gòu)。 三次信息具有以下特點(diǎn):(1)綜合性:三次信息是在大量有關(guān)文獻(xiàn)的基礎(chǔ)上,經(jīng)過綜合、分析而成。綜合性就是將大量分散的有關(guān)特定課題的信息、事實(shí)和數(shù)據(jù)進(jìn)行綜合、評(píng)價(jià)、篩選,以簡(jiǎn)練的文字扼要敘述出來,內(nèi)容十分概括。它可以是縱向綜合,如某學(xué)科的過去、現(xiàn)狀和將來的綜述;也可是橫向的綜合,如對(duì)各產(chǎn)業(yè)部門同類產(chǎn)品的比較綜述等。 (2)針對(duì)性:三次信息是為了特定的目的,搜集大量相關(guān)的文獻(xiàn),進(jìn)行分析、綜合而編寫出來的。因此,具有很強(qiáng)的針對(duì)性,即針對(duì)特定用戶的信息
13、需求,為特定的目的服務(wù)。 (3)科學(xué)性:三次信息是在已有的知識(shí)成果的基礎(chǔ)上,對(duì)特定專業(yè)課題的總結(jié)和綜述,因此,其觀點(diǎn)比較成熟,內(nèi)容比較可靠,有材料、有事實(shí)、有數(shù)據(jù)、有建議、有結(jié)論,具有較高的科學(xué)性,一般可直接提供參考、借鑒和使用,因而普遍為科研人員和管理者所重視。如循證醫(yī)學(xué)中的系統(tǒng)評(píng)價(jià)和實(shí)踐指南。 期刊論文會(huì)議論文科技報(bào)告專利說明書學(xué)位論文標(biāo) 準(zhǔn)檔 案 目 錄 文 摘 索 引 百科全書手 冊(cè)年 鑒詞 典綜 述述 評(píng)記錄知識(shí)的產(chǎn)生傳播信息的利用信息級(jí)別示意圖圖圖書書期刊期刊會(huì)會(huì)議議文文獻(xiàn)獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)科科技技報(bào)報(bào)告告標(biāo)準(zhǔn)標(biāo)準(zhǔn)學(xué)學(xué)位位論論文文科科技技檔檔案案產(chǎn)產(chǎn)品品樣樣本本政府出版物政府出版物
14、 信息需要,就是指人們?cè)趶氖赂黜?xiàng)實(shí)踐活動(dòng)的過程中,為解決所遇到的各種問題而產(chǎn)生的對(duì)信息的需求。美國心理學(xué)家馬洛斯將人的基本需要?jiǎng)澐譃樯硇枰?、安全需要、社交需要、尊重需要、求知需要、求美需要和自我?shí)現(xiàn)需要七個(gè)層次。當(dāng)人們?cè)谛袆?dòng)中遇到某些問題時(shí),就必須獲得各種信息的支持才能使問題得到解決。 信息需要的特征 廣泛性:人類的實(shí)踐活動(dòng)的廣泛性也決定了信息需要是普遍存在著的心理現(xiàn)象。 社會(huì)性:信息需要的產(chǎn)生和發(fā)展是由社會(huì)環(huán)境和社會(huì)活動(dòng)決定的。所以信息需求不僅僅是個(gè)體的特性,而且主要是一種社會(huì)需要。 發(fā)展性:社會(huì)實(shí)踐活動(dòng)的發(fā)展,社會(huì)現(xiàn)象日趨復(fù)雜,刺激了信息需要的日益增長。 多樣性:信息用戶的知識(shí)結(jié)構(gòu)、專業(yè)
15、、地位、職責(zé)等的多樣性決定了信息需要千差萬別,即使對(duì)于同一信息用戶,在不同的時(shí)間、地點(diǎn)和環(huán)境條件下,由于具體任務(wù)的變化,其信息需要也會(huì)有很大的差別。信息需要的層次未知的信息需要 有些現(xiàn)實(shí)問題過于復(fù)雜和隱蔽,或個(gè)人的認(rèn)知能力有限或缺乏信息意識(shí),因此沒有、或沒有意識(shí)到自己處于信息需要的狀態(tài),屬客觀信息需要。潛在信息需要 有些人可能認(rèn)識(shí)到了自己的信息需要,但卻沒有表達(dá)出來,致使信息需求無法用信息符號(hào)表達(dá)出來而處于“意會(huì)”的狀態(tài)。人們認(rèn)識(shí)到而未表達(dá)出來的信息需要稱為潛在信息需要?,F(xiàn)實(shí)的信息需要 當(dāng)人們意識(shí)到信息需要,而且明確表達(dá)出來的,稱之為現(xiàn)實(shí)信息需要。用戶在表達(dá)出來后,向信息服務(wù)機(jī)構(gòu)提出具體的信息
16、要求的稱之為信息提問,用戶自己動(dòng)手尋找信息的稱之為信息自問。注:需要特別提出的是信息需要和信息需要表達(dá) 常常是不能完全一致的。我們常常遇到這樣的問題,當(dāng)信息需要是“糖尿病足的護(hù)理”,但信息需要表達(dá)出的概念也許是“糖尿病人的足部護(hù)理”。信息表達(dá)往往并不能充分和完全地表達(dá)信息需要的全部?jī)?nèi)涵。信息需要的內(nèi)容 對(duì)信息本身的需要是用戶信息需要的最終目標(biāo)。人們?cè)趶氖赂鞣N社會(huì)活動(dòng)的過程中,為了解決所遇到的問題,就需要了解情況,增長知識(shí),及時(shí)做出有效的決策。由于信息本身的諸多屬性,用戶對(duì)信息的需求也涉及到許多方面。 如內(nèi)容上要求有助于特定問題的解決;類型上要求各種類型的信息;在質(zhì)量上要求準(zhǔn)確/可靠、完整、全面
17、的信息;在數(shù)量上要求適度、能夠有效消化的信息,避免“信息過載”等等。 各類信息用戶的需要特點(diǎn) 各類信息用戶的信息需要在內(nèi)容上、質(zhì)量和數(shù)量上、類型上根據(jù)解決問題的屬性均有所區(qū)別。同時(shí)各類人員的信息需要特點(diǎn)也是有所差異。如科研人員需要的是理論性強(qiáng)、原始的、完整的信息;管理決策人員需要內(nèi)容綜合廣泛、具有戰(zhàn)略性、全局性和預(yù)測(cè)性的涉及決策對(duì)象內(nèi)外各方面的、經(jīng)過濃縮加工的信息;工程技術(shù)人員的信息需要主要集中某一專業(yè)方向,具體的、經(jīng)過驗(yàn)證的數(shù)據(jù)、技術(shù)信息,信息的類型往往是專利、標(biāo)準(zhǔn)、技術(shù)報(bào)告、工程圖紙、產(chǎn)品樣本等等。醫(yī)務(wù)人員注重解決臨床難題的方法、數(shù)據(jù)等具體情報(bào)信息,如疾病診斷和治療方法,特別注重信息的準(zhǔn)確
18、性與可靠。信息類型均以國內(nèi)外期刊為首選,獲取方式上,十分著重同行之間交流獲取信息,與閱讀期刊所獲占同樣比例,獲取手段上要求快捷。 信息行為是人們滿足自己信息需要的社會(huì)活動(dòng)的過程。用戶的信息行為主要有信息檢索行為、信息的選擇行為和信息利用行為。 (1)信息檢索行為 (2)信息選擇行為 (3)信息利用行為信息檢索行為 信息檢索行為,指的是用戶自己查找、采集和尋求所需要信息的活動(dòng)。 而在尋找信息源的過程中,信息查詢者對(duì)于信息查詢路線的選擇,往往總是首先選用最便于接近的信息源,而對(duì)于這些信息源的質(zhì)量與可靠性的考慮,則處于次要地位。 此外,信息查詢者比較注重信息源系統(tǒng)的易用性。就是說,如果一個(gè)信息源系統(tǒng)
19、,在使用其獲取信息時(shí)比不獲取信息時(shí)更費(fèi)心更麻煩,那么這個(gè)系統(tǒng)就不會(huì)得到利用。這是可近性的延伸,二者相輔相成,決定著某個(gè)信息源系統(tǒng)能否得到利用。信息選擇行為 信息選擇行為指的是信息采集者從某一信息群中把符合自己需要的一部分信息挑選出來的過程。 信息選擇的核心標(biāo)準(zhǔn)是相關(guān)性和適用性。 所謂“相關(guān)”和“適用”指的就是對(duì)于用戶來說是相關(guān)的和適用的。信息利用行為 信息利用是用戶尋求信息的根本目的。信息利用行為指的是用戶利用信息解決其所面臨問題的過程。 由于信息利用的過程就是問題解決的過程,所以關(guān)于信息利用的研究就集中在“問題解決”上。問題解決的過程一般包括:?jiǎn)栴}提出、問題空間確立、問題空間搜索、問題解釋、
20、問題解決。問題提出 用戶在有了信息需要并進(jìn)一步在信息動(dòng)機(jī)的驅(qū)使下產(chǎn)生信息行為時(shí)就已經(jīng)提出了具體的“問題”。 所謂“問題”就是問題解決者(即用戶)在面臨一項(xiàng)任務(wù)又沒有直接的手段去完成時(shí)所產(chǎn)生的復(fù)雜的心理活動(dòng)。 問題空間確立 問題空間是問題解決者對(duì)一個(gè)問題所達(dá)到的全部認(rèn)識(shí)。人們要解決問題,首先是理解這個(gè)問題,明確問題的初始狀態(tài),構(gòu)想問題的目標(biāo)狀態(tài),從記憶中提取相關(guān)信息,對(duì)問題進(jìn)行解釋和表征,構(gòu)成問題空間。 問題空間不是現(xiàn)成的,也不是自然生成的,它是問題解決者根據(jù)所掌握的信息自我主動(dòng)構(gòu)造的。所以,問題解決者的素質(zhì)、修養(yǎng)和能力對(duì)問題空間的構(gòu)建有很大的影響。 由此導(dǎo)致問題空間的復(fù)雜性。不同的人,對(duì)于同一
21、個(gè)問題可能構(gòu)成不同的問題空間;而同一個(gè)人,對(duì)同一個(gè)問題所構(gòu)建的問題空間在問題解決之前也會(huì)不斷發(fā)生變化,甚至?xí)捎谇闆r的變化而重新構(gòu)建新的問題空間。當(dāng)然,不同的人面對(duì)不同的問題肯定是構(gòu)建不同的問題空間。 最重要的問題是用戶如何構(gòu)建一個(gè)適宜的問題空間。因?yàn)檫m宜的問題空間對(duì)解決問題有直接的影響。 問題空間搜索 問題空間搜索,就是查詢解決問題所需要的信息,以找到一條從問題的初始狀態(tài)到達(dá)目標(biāo)狀態(tài)的通路。 在問題空間中,需要被解釋的信息,稱作“被解信息”。而解釋本身所含的信息,稱作“解含信息”。所謂“解釋”,就是尋求被解信息與解含信息之間的關(guān)系。要獲得圓滿的解釋,就要對(duì)問題空間中的被解信息和解含信息進(jìn)行不
22、斷的搜索。 問題空間搜索的范圍,一般首先是用戶的大腦,然后是已有的社會(huì)信息流總庫。搜索的結(jié)果,會(huì)獲得新的被解信息,接下來就是運(yùn)用新信息進(jìn)行解釋。 問題解釋 問題解釋是整個(gè)問題解決過程的核心環(huán)節(jié)。解釋就是變本來不可理解為可以理解而進(jìn)行思考和陳述的信息激活工作。認(rèn)知心理學(xué)認(rèn)為,思維主體在接受到新信息之后,就開始了對(duì)問題的解釋。解釋過程不是照相式、錄音式的機(jī)械過程,是一個(gè)對(duì)感知的信息加以理解、選擇、組織,使之成為一個(gè)統(tǒng)一體的復(fù)雜過程。顯然,在這里人具有主動(dòng)性和選擇性,所以人的心理因索、文化背景、閱歷經(jīng)驗(yàn)、知識(shí)修養(yǎng)等素質(zhì)、修養(yǎng)和能力都會(huì)對(duì)解釋產(chǎn)生影響。問題解決 問題得到圓滿的或相對(duì)圓滿的解釋就是最后的
23、問題解決。問題的解決關(guān)鍵在于對(duì)問題做出有價(jià)值的解釋。這就要求所獲得的信息必須是相關(guān)、合適的。這種與問題直接相關(guān)的、適量的信息被稱為合適的信息度。要達(dá)到完全的合適信息度是困難的,但是盡可能地接近這個(gè)合適信息度,減少偏離度是可能的。 整個(gè)信息行為過程是“信息需要、信息查找、信息選擇、信息利用(問題解決)”的過程。 信息檢索是指為達(dá)到某一特定目的,將信息源與用戶需求連接起來,查詢、鑒別、選擇并確定相關(guān)信息的過程。廣義的信息檢索包括信息的存儲(chǔ)和信息的檢索,所以又稱為“信息存儲(chǔ)與檢索”(Information Storage and Retrieval)。信息的存儲(chǔ)主要包括對(duì)在一定專業(yè)范圍內(nèi)的信息選擇基
24、礎(chǔ)上進(jìn)行信息特征描述、加工并使其有序化,即建立數(shù)據(jù)庫。信息檢索意義如下: (1)信息控制的手段 (2)獲取知識(shí)的門徑,學(xué)習(xí)的助手 (3)科學(xué)研究的工具和指南 (4)決策與管理的支持與參考l 信息學(xué)l 信息素養(yǎng)l 信息技術(shù)計(jì)算機(jī)信息檢索概述l 計(jì)算機(jī)檢索方法l 計(jì)算機(jī)信息檢索策略與檢索步驟目目 錄錄信息素養(yǎng)的含義: 是指判斷何時(shí)、何地需要信息,并有效的定位、獲取、評(píng)價(jià)和利用信息的一系列能力的總和。包括:計(jì)算機(jī)素養(yǎng)、因特網(wǎng)素養(yǎng)、媒體素養(yǎng)、圖書館素養(yǎng)、研究素養(yǎng)、批判性思考的能力。 信息素養(yǎng)主要體現(xiàn)在:(1)信息意識(shí):是人們對(duì)信息需求的自覺反映,即對(duì)信息的捕捉、分析、判斷和吸收的敏感性。(2)信息能力
25、:是人們有效快速地獲取加工存儲(chǔ)利用和傳遞信息的能力。(3)信息道德:是指在整個(gè)信息活動(dòng)中,信息創(chuàng)建者、信息服務(wù)提供者和信息使用者所必須要遵守的社會(huì)法律法規(guī)和行為準(zhǔn)則。2006年美國科學(xué)與工程技術(shù)學(xué)科信息素養(yǎng)研究委員會(huì)基于ACRL制定的信息素養(yǎng)五大標(biāo)準(zhǔn)(1 1)有信息素養(yǎng)的學(xué)生能確定所需信息的性質(zhì)和范圍)有信息素養(yǎng)的學(xué)生能確定所需信息的性質(zhì)和范圍 確定意味著在獲取信息資源的過程中個(gè)人可以決定所需要的信息種類和程度,表現(xiàn)為主動(dòng)學(xué)習(xí)、自主吸納知識(shí)的過程。 書、刊、學(xué)位論文、會(huì)議論文、專利、標(biāo)準(zhǔn)背景信息概念、事實(shí)、數(shù)據(jù)摘要信息題目、標(biāo)題、文摘、參考文獻(xiàn)全文信息觀點(diǎn)、方法、結(jié)論、理論(電子、印刷的)(2
26、 2)有信息素養(yǎng)的學(xué)生有效地獲取所需信息)有信息素養(yǎng)的學(xué)生有效地獲取所需信息 有效意味著能選用最適當(dāng)?shù)牟檎曳椒ɑ驒z索系統(tǒng)來建構(gòu)完善的檢索策略,獲取所需信息。 分類法、主題法、題名法、關(guān)鍵詞法、作者法、機(jī)構(gòu)法、組配法 綜合性、專業(yè)性、單一性-熟悉所在學(xué)科領(lǐng)域的主要信息源(3)有信息素養(yǎng)的學(xué)生批判性地評(píng)價(jià)采集的信息及信息源有信息素養(yǎng)的學(xué)生批判性地評(píng)價(jià)采集的信息及信息源,決定是否需要調(diào)整最初的信息需求,決定是否需要調(diào)整最初的信息需求/ /或?qū)で蟾嘈畔⒃椿驅(qū)で蟾嘈畔⒃?,并?chuàng)建一個(gè)新的研究過程。,并創(chuàng)建一個(gè)新的研究過程。 在分析信息的基礎(chǔ)上熟練地、批判性地評(píng)價(jià)信息,有效吸收、存儲(chǔ)和快速提取信息,能從
27、所收集的信息中概括出信息的中心思想,并能依據(jù)研究問題的要求來評(píng)價(jià)信息及其來源,提取出權(quán)威性的、經(jīng)典的和具有創(chuàng)新理念的觀點(diǎn)及其它發(fā)現(xiàn),同時(shí)能在構(gòu)建新的假設(shè)中查找補(bǔ)充所需信息,對(duì)新舊信息進(jìn)行整合和綜述。(4 4)作為個(gè)體或團(tuán)隊(duì)成員,具有信息素養(yǎng)的學(xué)生了解信息)作為個(gè)體或團(tuán)隊(duì)成員,具有信息素養(yǎng)的學(xué)生了解信息及信息技術(shù)利用相關(guān)的經(jīng)濟(jì)、道德、法律和社會(huì)問題,有及信息技術(shù)利用相關(guān)的經(jīng)濟(jì)、道德、法律和社會(huì)問題,有效地、合乎倫理和法律地實(shí)現(xiàn)特定目的。效地、合乎倫理和法律地實(shí)現(xiàn)特定目的。 具備信息素養(yǎng)能力的人應(yīng)了解與信息利用有關(guān)的道德、法律和社會(huì)經(jīng)濟(jì)問題,并能遵守法律、規(guī)章制度和有關(guān)獲取與使用信息資源的行為規(guī)范
28、。 知識(shí)產(chǎn)權(quán)與版權(quán)、信息法、電子資源惡意下載與非法(5 5)有信息素養(yǎng)的學(xué)生能認(rèn)識(shí)到信息素養(yǎng)是一個(gè)不斷發(fā)展)有信息素養(yǎng)的學(xué)生能認(rèn)識(shí)到信息素養(yǎng)是一個(gè)不斷發(fā)展的過程,是終身學(xué)習(xí)的一個(gè)重要組成部分,認(rèn)識(shí)到需要時(shí)的過程,是終身學(xué)習(xí)的一個(gè)重要組成部分,認(rèn)識(shí)到需要時(shí)刻保持對(duì)自己研究領(lǐng)域最新發(fā)展的關(guān)注??瘫3謱?duì)自己研究領(lǐng)域最新發(fā)展的關(guān)注。 有效地利用信息意味著為達(dá)到某一特定的目的,在信息查找、獲取、評(píng)價(jià)、補(bǔ)充的知識(shí)積累基礎(chǔ)上,將文獻(xiàn)中的主要觀點(diǎn)、思想及相應(yīng)事實(shí)數(shù)據(jù)等應(yīng)用于自己有利于目的實(shí)現(xiàn)的表現(xiàn)形式,如學(xué)位論文、調(diào)查報(bào)告等,以此來與他人進(jìn)行有效的交流。l 信息學(xué)l 信息素養(yǎng)l 信息技術(shù)計(jì)算機(jī)信息檢索概述l
29、計(jì)算機(jī)檢索方法l 計(jì)算機(jī)信息檢索策略與檢索步驟目目 錄錄信息技術(shù) l計(jì)算機(jī)信息檢索概論l信息檢索關(guān)鍵技術(shù)-數(shù)據(jù)庫技術(shù) (1)數(shù)據(jù)庫技術(shù) 數(shù)據(jù)庫為滿足多個(gè)用戶的多種應(yīng)用需要,按一定的數(shù)據(jù)模型在計(jì)算機(jī)中組織、存儲(chǔ)和使用的相互聯(lián)系的數(shù)據(jù)集合。(2)數(shù)據(jù)通信技術(shù) 通信系統(tǒng)是實(shí)現(xiàn)通信過程的系統(tǒng)。包括信源、信宿、變換器和反變換器、信道以及噪聲源。(3)多媒體技術(shù) 多媒體技術(shù)是將文字、聲音、圖形、靜態(tài)圖像、動(dòng)態(tài)圖像等信息媒體與計(jì)算機(jī)集成在一起,使計(jì)算機(jī)應(yīng)用由單純的文字處理進(jìn)入文、圖、聲、影集成處理的技術(shù)。 (1)數(shù)據(jù)庫技術(shù)簡(jiǎn)介 (2)數(shù)據(jù)庫特點(diǎn) 數(shù)據(jù)共享、面向全組織的數(shù)據(jù)結(jié)構(gòu)化、數(shù)據(jù)獨(dú)立性、可控?cái)?shù)據(jù)冗余度、
30、統(tǒng)一數(shù)據(jù)控制功能(3)數(shù)據(jù)庫的構(gòu)成 數(shù)據(jù)庫一般由“文檔-字段-記錄-數(shù)據(jù)項(xiàng)”四個(gè)層次構(gòu)成 文檔文檔在數(shù)據(jù)庫中有順排文檔和倒排文檔之分。 順排文檔是數(shù)據(jù)庫的主體,又稱主文檔,它按每條記錄的順序號(hào)排列。數(shù)據(jù)庫中得到的檢索結(jié)果都來自于順排文檔。倒排文檔是供檢索順排文檔的工具,在一個(gè)數(shù)據(jù)庫中可能有若干個(gè)倒排文檔,如主題詞索引、著者索引、刊名索引等,它按索引的字順排列。檢索時(shí),計(jì)算機(jī)按輸入檢索詞的字順先從指定的倒排文檔(索引)中找到匹配的索引詞,然后根據(jù)索引詞后的記錄順序號(hào)到主文檔中調(diào)出記錄。 字段字段是組成記錄的數(shù)據(jù)項(xiàng)目。例如,在MEDLINE中一條記錄代表一篇書目文獻(xiàn),在這條記錄中有題名、著者、來源
31、、文摘、主題詞等字段。每個(gè)字段都有自己的字段標(biāo)識(shí)符(Field tag),如TI(篇名)、AU(著者)、SO(文獻(xiàn)出處)、AB(文摘)、AD(著者所在結(jié)構(gòu))、AN(記錄順序號(hào))等。將記錄細(xì)劃成字段作用是:幫助識(shí)別記錄內(nèi)容,方便檢索結(jié)果輸出時(shí)格式的選擇,便于進(jìn)行字段檢索。 記錄記錄是構(gòu)成文獻(xiàn)數(shù)據(jù)庫的一個(gè)完整的信息單元,每條記錄描述了一原始信息的外部特征和內(nèi)部特征。例如,書目數(shù)據(jù)庫中的一條記錄通常代表一篇文獻(xiàn),其他類型數(shù)據(jù)庫中的記錄可能是一種治療方案、一組理化指數(shù)。 數(shù)據(jù)項(xiàng)數(shù)據(jù)項(xiàng)是依據(jù)字段內(nèi)容所做的描述,是組成記錄的最小單位。上述數(shù)據(jù)庫的結(jié)構(gòu),可用英文單詞的單復(fù)數(shù)形式更直觀地表述為:record
32、fFields (記錄)(記錄) database flies(數(shù)據(jù)庫)(數(shù)據(jù)庫)File Records (文檔)(文檔)field searching entry (字段)(檢索入口(字段)(檢索入口主文檔主文檔序號(hào):N5序號(hào):N4序號(hào):N3序號(hào):N2序號(hào):N1主題詞:S1著者:Au1標(biāo)題:t1S1:N1,N3S2:N2,N3S3:N1,N4Au1:N1,N4Au2:N3Au3:N4主題詞倒排檔主題詞倒排檔著者倒排檔著者倒排檔主題詞檢索途徑主題詞檢索途徑著者檢索途徑著者檢索途徑其它檢索途徑其它檢索途徑主文檔和倒排文檔的關(guān)系示意圖 提 綱 記錄每一項(xiàng)是一個(gè)字段l 信息學(xué)l 信息素養(yǎng)l 信息技
33、術(shù)計(jì)算機(jī)信息檢索概述l 計(jì)算機(jī)檢索方法l 計(jì)算機(jī)信息檢索策略與檢索步驟目目 錄錄計(jì)算機(jī)信息檢索概述 l計(jì)算機(jī)信息檢索的原理l計(jì)算機(jī)信息檢索系統(tǒng)l計(jì)算機(jī)信息檢索語言 計(jì)算機(jī)信息檢索是指利用計(jì)算機(jī)存儲(chǔ)信息存儲(chǔ)信息和檢索信息檢索信息。 存儲(chǔ)過程:存儲(chǔ)過程:用手工或者自動(dòng)方式將大量的原始信息進(jìn)行加工。 檢索過程:檢索過程:用戶對(duì)檢索課題加以分析、明確檢索范圍、弄清主題概念,然后用系統(tǒng)檢索語言來表示主題概念,形成檢索標(biāo)識(shí)及檢索策略,輸入到計(jì)算機(jī)進(jìn)行檢索。 信息檢索原理圖信息檢索原理圖*檢索過程一次信息信息特征檢索語言信息特征標(biāo)識(shí)檢索結(jié)果信息需求檢索提問檢索提問標(biāo)識(shí)分析分析標(biāo)引標(biāo)引輸入檢索輸入存儲(chǔ)過程信息
34、檢索工具(系統(tǒng))檢索結(jié)果的管理和分析 是按某種方式、方法建立起來的供用戶檢索信息的一種有層次的信息體系,是表征有序的信息特征的集合體。(1)檢索系統(tǒng)的功能 報(bào)道職能、存儲(chǔ)職能、檢索職能(2)檢索系統(tǒng)的評(píng)估標(biāo)準(zhǔn)信息的收錄范圍信息特征標(biāo)識(shí)的詳略信息摘錄及標(biāo)識(shí)的質(zhì)量信息報(bào)道的時(shí)差檢索功能的完善 (3)檢索系統(tǒng)的類型 參考數(shù)據(jù)庫 源數(shù)據(jù)庫 混合型數(shù)據(jù)庫(4)檢索系統(tǒng)的構(gòu)成模式 信息數(shù)據(jù)的選擇、處理、錄入、維護(hù)子系統(tǒng) 詞表和標(biāo)引子系統(tǒng) 檢索子系統(tǒng) 用戶接口系統(tǒng)(5)檢索系統(tǒng)的組織 組織的要求a) 信息內(nèi)容有序化b) 信息流向明確化c) 信息流速適度化d) 信息質(zhì)量最優(yōu)化 組織的方法:編輯者角度為組織法;
35、檢索使用者角度為檢索法。a) 傳統(tǒng)組織方法包括:分類組織法、主題組織法 、字順組織法、號(hào)碼組織法、自然組織法b) 現(xiàn)代組織法包括:字段組織法、網(wǎng)絡(luò)組織法目前對(duì)網(wǎng)絡(luò)信息資源進(jìn)行組織使用的多為:文件組織方式、主題數(shù)組織方式、超文本組織方式、超媒體組織方式、元數(shù)據(jù)組織方式。 檢索語言是檢索信息所使用的人工語言人工語言。其實(shí)質(zhì)為從自然語言中精選出來并加以規(guī)范化的一套詞匯符號(hào),用以對(duì)信息內(nèi)容進(jìn)行概括其內(nèi)容或外在特征的概念及其相互關(guān)系的概念標(biāo)識(shí)體系。 檢索語言由詞匯和語法兩部分組成。 詞匯:登錄在類表、詞表中的所有的標(biāo)識(shí),是可識(shí)別的語詞。 語法:如何運(yùn)用標(biāo)識(shí)來準(zhǔn)確表達(dá)信息內(nèi)容和特征,以有效實(shí)現(xiàn)信息檢索的規(guī)
36、則。 (1)檢索語言基礎(chǔ)知識(shí)(見P.27-)(2)檢索語言的類型 分類語言 主題語言 關(guān)鍵詞 關(guān)鍵詞的四種變化 關(guān)鍵詞的多重排列組合 關(guān)鍵詞的專指和泛指來提高查準(zhǔn)率和查全率 使用地理位置 (3)檢索語言的作用(4)常用主題詞表 美國醫(yī)學(xué)主題詞表(MesH) 荷蘭醫(yī)學(xué)文摘的主題情(EMTree) 中國中醫(yī)藥學(xué)主題詞表組成:主題詞表主要由字順輪排表和樹狀結(jié)構(gòu)表構(gòu)成。a) 字順輪排表(索引) 是將主題詞表中主題詞和入口詞按一定順序(字順等)排列而成。 入口詞:款目詞,包括主題詞的同義詞、近義詞、縮略語、不同拼寫方式,倒裝或順裝以及已經(jīng)取消而意義相近的主題詞。b) 樹狀結(jié)構(gòu)表(范疇表) 將全部主題詞按
37、內(nèi)容分為15個(gè)類目,各類主題詞按各主題詞內(nèi)涵范圍的大小逐級(jí)排列,形成樹狀結(jié)構(gòu)。 上下位概念:上位詞的范圍大,下位詞的范圍小,擴(kuò)展檢索是指某主題詞所有下位主題詞標(biāo)引的全部文獻(xiàn)都檢出。 副主題詞(關(guān)聯(lián)詞):使用時(shí)有明確規(guī)定,必須遵循其定義與使用范圍。 副主題詞也有上下位關(guān)系,使用時(shí)應(yīng)選擇恰當(dāng),以提高檢全與檢準(zhǔn)率。l 信息學(xué)l 信息素養(yǎng)l 信息技術(shù)計(jì)算機(jī)信息檢索概述l 計(jì)算機(jī)檢索方法l 計(jì)算機(jī)信息檢索策略與檢索步驟目目 錄錄計(jì)算機(jī)信息方法 l布爾邏輯檢索l位置邏輯檢索l截詞檢索l字段限制檢索l括號(hào)檢索l短語檢索l模糊檢索l加權(quán)檢索l自然語言檢索l多語種檢索l區(qū)分大小寫檢索 布爾邏輯基本運(yùn)算形式共有三
38、種,邏輯“與”、邏輯“或”輯“非”。(1)邏輯“與”。邏輯“與”一般用AND或“*”號(hào)表示。設(shè)提問集A和B,如果文獻(xiàn)C同時(shí)滿足A和B中的每一個(gè)提問項(xiàng),則為命中文獻(xiàn),否則為不命中。用數(shù)學(xué)模型來表示,則C為A和B的交集。(2)邏輯“或”。邏輯“或”一般用OR或“+”號(hào)表示。設(shè)提問集A和B,如果文獻(xiàn)C滿足A或者滿足B,即為命中文獻(xiàn),否則為不命中。用數(shù)學(xué)模型來表示,則C為A和B的并集。(3)邏輯“非”。邏輯“非”一般用NOT或“-”號(hào)表示。設(shè)提問集A和B,如果文獻(xiàn)C滿足A,且不包含B為命中,否則為不命中。邏輯“非”實(shí)際上反映了A集合對(duì)B集合的差運(yùn)算。布爾運(yùn)算符的優(yōu)先級(jí)為:-、*、+,使用括號(hào)可改變運(yùn)算
39、順序。舉例:邏輯運(yùn)算 AND糖 尿 病 的 飲 食 治 療糖 尿 病飲 食 治 療舉例:邏輯運(yùn)算 OR微微量量元元素素(銅銅、錳錳、硒硒)與與克克山山病病的的關(guān)關(guān)系系A(chǔ)CBAorBorC舉例:邏輯運(yùn)算 NOT簡(jiǎn)簡(jiǎn)例例:邏邏輯輯運(yùn)運(yùn)算算 NOTl非病毒性肝炎(除病毒性肝炎之外的其它肝炎)A:各種肝炎B:病毒性肝炎ANOTB 又稱鄰近檢索、相鄰度檢索。它是基于文獻(xiàn)中或文獻(xiàn)記錄中語詞之間的相對(duì)次序或位置不同,它們所表達(dá)的意思可能不同;相應(yīng)地,一個(gè)檢索提問中語詞之間的相對(duì)次序和位置不同,其表達(dá)的檢索意圖也不一樣。因此,可以使用一些特定曲位置邏輯算符來限定檢索詞之間的位置關(guān)系,使檢索提問式盡可能表達(dá)檢索
40、者真正的檢索意圖,從而既提高檢準(zhǔn)率,又提高見檢全率。 常用的位置算符有near 、 with等。 near算符 表示此算符兩側(cè)的檢索詞的距離最近。 A near(n) B 表示命中記錄中左右兩個(gè)檢索詞出現(xiàn)在同一句子中。 截詞檢索是指在檢索詞中保留相同的部分,用截詞符號(hào)代替可變化的部分。它是為了部分解決由于檢索式中對(duì)同義詞列舉不全造成的漏檢現(xiàn)象而提出的,相當(dāng)于用邏輯“或”擴(kuò)展檢索范圍。截詞符號(hào)一般用“?”或“*”等。 截詞模式有兩種:無限截?cái)嗪陀邢藿財(cái)?。其中,無限截?cái)嘤址譃榍敖財(cái)?后方一致)、中截?cái)?除中間外,前后一致)和后截?cái)?前方一致)。無限截?cái)嘤袝r(shí)可能會(huì)檢出許多與檢索主題毫無關(guān)系的內(nèi)容,使
41、檢索結(jié)果十分龐大。因此,選擇合適的詞干是很重要的。 有限截?cái)嗍怯脕韺?duì)檢索量進(jìn)行限制的一種方法。其原理是在詞干前后加以字符限制,使得檢索出的詞除詞干外,前后綴所含字符必須與限定字符個(gè)數(shù)一致,或者在限定數(shù)以內(nèi)。例如,銀盤公司的MEDLINE光盤檢索,computer?可以查到有關(guān)computer、computers、comptery詞,但不會(huì)檢出computerized 、computerizing、computerlab、computerphobia等詞。 截詞檢索主要用于年代、作者、同根詞和單復(fù)數(shù)詞的檢索,減少輸入負(fù)擔(dān),節(jié)省檢索時(shí)間和費(fèi)用,提高檢全率。 字段檢索是指將檢索詞的匹配限定在某個(gè)或某
42、些特定的字段范圍內(nèi)進(jìn)行。不同檢索系統(tǒng)的字段限定方法可能不同,如有的是在檢索詞前用一個(gè)字段符加“=”表示,有的是在檢索詞后加“in”和一個(gè)字段符表示。 用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的運(yùn)算優(yōu)先進(jìn)行。 短語用引號(hào)(“”)表示,檢索出與引號(hào)(“”)內(nèi)形式完全相同的短語,以提高檢索的精度和準(zhǔn)確度,因此也稱為“精確檢索”。 又稱為概念檢索,使用某一檢索詞進(jìn)行檢索時(shí),能同時(shí)對(duì)該詞的同義詞、近義詞、上位詞、下位詞進(jìn)行檢索,以達(dá)到擴(kuò)大檢索范圍、避免漏檢的目的。 加權(quán)檢索是為了彌補(bǔ)布爾邏輯檢索不能揭示檢索概念與檢索課題相關(guān)程度的缺陷而提出來的。其基本思路是,由檢索者自行對(duì)各檢索詞設(shè)置一個(gè)權(quán)值,并提出一個(gè)閾值,當(dāng)
43、檢索出的提問式的總權(quán)值大于或等于閾值時(shí),該文獻(xiàn)為命中,否則為不命中。 加權(quán)檢索使量的概念進(jìn)入了布爾檢索,總權(quán)值的大小代表了文獻(xiàn)與檢索課題的相關(guān)程度。最后輸出檢索結(jié)果時(shí),可以根據(jù)權(quán)值的大小順序排列,這對(duì)用戶是非常有用的。 直接采用自然語言中字、詞、句進(jìn)行提問式檢索,又稱為“智能檢索”。 核心是一種自然語言與情報(bào)語言檢索的對(duì)應(yīng)表。對(duì)應(yīng)表既可以是自然語言與主題檢索語言的語詞的對(duì)應(yīng),也可以是自然語言與分類檢索語言的語詞(即分類號(hào))的對(duì)應(yīng)。 自然語言接口用的對(duì)應(yīng)表可在使用過程中不斷增補(bǔ)以達(dá)到完備,要點(diǎn)是對(duì)應(yīng)關(guān)系一定要正確。Pubmed和embase都提供自然語言接口。 提供多種語言的檢索環(huán)境供用戶選擇,
44、系統(tǒng)按用戶選定的語種進(jìn)行檢索并反饋結(jié)果,支持多語種檢索的如文天網(wǎng),英文Alta Vista、Google等。 對(duì)于具有區(qū)分大小寫檢索功能的工具而言,如用戶輸入的檢索式用小寫字母表示,搜索工具既匹配大寫又匹配小寫;但如用大寫字母表示,搜索工具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些與用戶鍵入的輸入形式完全相同的結(jié)果。 目前極少數(shù)搜索引擎支持區(qū)分大小寫的檢索。l 信息學(xué)l 信息素養(yǎng)l 信息技術(shù)計(jì)算機(jī)信息檢索概述l 計(jì)算機(jī)檢索方法l 計(jì)算機(jī)信息檢索策略與檢索步驟目目 錄錄信息檢索的步驟 檢索課題分析檢索課題分析1 明確檢索目的 * 需要關(guān)于某一課題的系統(tǒng)詳盡的信息 * 需要關(guān)于某課題的最新信息 * 了
45、解一些片段信息,解決一些具體問題2 明確課題的主題或主要內(nèi)容 要形成若干個(gè)既能代表信息需求又具有檢 索意義的主題詞(關(guān)鍵詞),主題詞(關(guān)鍵詞),及其關(guān)系3 課題涉及的學(xué)科范圍4 所需信息的數(shù)量、語種、年代范圍等指標(biāo) 檢索系統(tǒng)和數(shù)據(jù)庫的選擇 在需求分析的基礎(chǔ)上選擇相應(yīng)的數(shù)據(jù)庫 關(guān)于某一課題的最新信息 了解某一方面的信息,解決一些具體問題檢索點(diǎn)和檢索詞的選擇 分析課題的概念 隱含概念的分析 核心概念的選取 選取檢索詞應(yīng)注意問題分析課題的概念 選擇所涉及的主要概念,并找出能代表這些概念的若干個(gè)詞或詞組,進(jìn)而分析各概念之間的上、下、左、右關(guān)系,以便制定檢索策略。如“網(wǎng)絡(luò)資源的只是產(chǎn)權(quán)保護(hù)”可選“知識(shí)產(chǎn)
46、權(quán)保護(hù)”、“網(wǎng)絡(luò)資源”作為關(guān)鍵詞。隱含概念的分析 有些課題的實(shí)質(zhì)性內(nèi)容很難從課題的名稱上反映出來,其隱含的概念和相關(guān)內(nèi)容需從專業(yè)的角度做深入的分析,才能提煉出確切反映課題內(nèi)容的檢索概念。如“知識(shí)產(chǎn)權(quán)保護(hù)”概念中的“知識(shí)產(chǎn)權(quán)”一詞隱含著“著作權(quán)”和“版權(quán)”等概念。 核心概念的選取 有些檢索詞概念已體現(xiàn)在所使用的數(shù)據(jù)庫中,這些概念應(yīng)予以排除。如World Textiles中“世界”一詞應(yīng)排除。另外有些比較泛指、檢索意義不大的檢索概念,如“發(fā)展”“現(xiàn)狀”“趨勢(shì)”等在不是專門檢索綜述類信息時(shí)也應(yīng)予以排除。檢索詞選取時(shí)應(yīng)注意的幾個(gè)問題。 檢索詞的選取應(yīng)適當(dāng),具有專指性,涵蓋主要主題概念,意義明確。一般應(yīng)優(yōu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 臨沂職業(yè)學(xué)院《篆刻2》2023-2024學(xué)年第一學(xué)期期末試卷
- 江西應(yīng)用工程職業(yè)學(xué)院《建筑設(shè)備自動(dòng)化系統(tǒng)》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖北開放職業(yè)學(xué)院《城市設(shè)計(jì)B》2023-2024學(xué)年第一學(xué)期期末試卷
- 遵義職業(yè)技術(shù)學(xué)院《中國古代文學(xué)5》2023-2024學(xué)年第一學(xué)期期末試卷
- 株洲師范高等專科學(xué)?!斗沁z影像策劃與制作》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶青年職業(yè)技術(shù)學(xué)院《數(shù)據(jù)結(jié)構(gòu)及算法》2023-2024學(xué)年第一學(xué)期期末試卷
- 株洲師范高等專科學(xué)?!吨攸c(diǎn)傳染病防治知識(shí)規(guī)培》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江外國語學(xué)院《課程與教學(xué)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江工貿(mào)職業(yè)技術(shù)學(xué)院《建筑美術(shù)Ⅲ》2023-2024學(xué)年第一學(xué)期期末試卷
- 中南林業(yè)科技大學(xué)《物理化學(xué)(1)》2023-2024學(xué)年第一學(xué)期期末試卷
- 淺析商務(wù)英語中模糊語言的語用功能
- 老年人能力評(píng)估標(biāo)準(zhǔn)解讀講義課件
- 材料報(bào)價(jià)三家對(duì)比表
- 2024年國家公務(wù)員考試公共基礎(chǔ)知識(shí)全真模擬試題及答案(共四套)
- 標(biāo)準(zhǔn)輔助航空攝影技術(shù)規(guī)范
- 2023年中國人保財(cái)險(xiǎn)校園招聘筆試參考題庫附帶答案詳解
- hdx7底層黑磚刷寫和字庫救磚教程bysmartyou
- 年會(huì)頒獎(jiǎng)晚會(huì)頒獎(jiǎng)盛典簡(jiǎn)約PPT模板
- 年產(chǎn)10000噸柑橘飲料的工廠設(shè)計(jì)
- 雷電知識(shí)、雷電災(zāi)害防御知識(shí)匯總-上(單選題庫)
- 導(dǎo)學(xué)案 高中英語人教版必修三Unit4 Astronomy the science of the stars
評(píng)論
0/150
提交評(píng)論