《信息資源檢索與利用》課程重點_第1頁
《信息資源檢索與利用》課程重點_第2頁
《信息資源檢索與利用》課程重點_第3頁
《信息資源檢索與利用》課程重點_第4頁
《信息資源檢索與利用》課程重點_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、信息資源檢索與利用課程要點1信息資源信息是普遍存在的,但并非所有的信息都是信息資源,信息只有經(jīng)過人類加工后,可被利用的信息才能稱為信息資源。2信息資源的分類按信息資源的存在狀態(tài)可將其分為潛在的信息資源和現(xiàn)實的信息資源兩大類。其中現(xiàn)實的信息資源依據(jù)其載體可分為體載信息資源、文獻信息資源、實物信息資源和網(wǎng)絡(luò)信息資源。 (1)體載信息資源體載信息資源指以人體為載體并能為他人識別的信息資源,按其表達方式又可分為口語信息資源和體語信息資源??谡Z信息資源是人類以口頭語言表達出來但未被記錄下來的信息資源,如談話、授課、講演、討論等;體語信息資源是以人的體態(tài)表達出來的信息資源,如表情、手勢、姿態(tài)、舞蹈等。 (

2、2)文獻信息資源:文獻信息資源是以文獻為載體的信息資源。A按信息資源出版類型劃分(10大信息源)科技圖書;科技期刊;科技報告;會議文獻;專利文獻;學位論文;標準文獻;政府出版物;產(chǎn)品樣本;技術(shù)檔案B按加工層次劃分一次信息資源。一次信息的載體形式稱為一次信息資源,也稱原始文獻。它是以作者本人的科研工作成果為依據(jù)而創(chuàng)作的原始文獻,如期刊論文、科技報告、會議論文、專利文獻、學位論文等,它具有新穎性、創(chuàng)造性和系統(tǒng)性等特征,參考和使用的價值較高。個人專著(某某著書,而某某編的書不是一次文獻而是二次或三次文獻)。二次信息資源。濃縮二次信息的載體形式稱為二次信息資源,是查找一次信息資源的工具。它是將分散的、

3、無序的一次信息資源進行加工整理,使之成為系統(tǒng)有序的信息資源。二次信息資源具有濃縮性、匯集性、有序性等特點,它的作用不僅在于報道信息的內(nèi)容,更重要的是可以提供原一次信息資源的線索。 例如:書目(marc數(shù)據(jù))、題錄、文摘、索引等。 (圖書館檢索室)三次信息資源。三次信息的載體形式稱為三次信息資源,它是指對一次信息資源進行綜合分析、研究和評述而編寫出來的成果。如手冊、百科全書、年鑒以及其他綜述和評論性文章等。三次信息資源源于一次信息資源,又高于一次信息,是一種再創(chuàng)性文獻。 它可分為兩大類:一類是綜述、述評等,如各種綜述、動態(tài)、進展報告;另一類是參考性工具書,如百科全書、年鑒、手冊、詞典、文獻指南等

4、零次信息資源。零次信息的載體形式稱為零次信息資源。它是指未經(jīng)正式出版發(fā)行的最原始的記錄,如書信、手稿、筆記、實驗記錄等。其主要特點是內(nèi)容新穎,具有原始性,但不成熟,分散,難于檢索。 如書信、手稿、筆記、記錄等。也有人認為是科技人員口頭交談及直接作用于人的感覺器官的非文獻知識,如操作技能、診療經(jīng)驗等。也可以說,零次文獻是以文獻所有者本身為載體的未公布于世的科技知識。以上四級信息資源的關(guān)系是,零次信息資源是一次信息資源的素材;一次信息資源是二次、三次信息資源的來源和基礎(chǔ);二次、三次信息資源是對一次信息資源進行組織、加工、綜合后形成的,它們編寫的目的明確,專指性強。(3)實物信息資源實物信息資源是指

5、以實物為載體的信息資源。(4)網(wǎng)絡(luò)信息資源網(wǎng)絡(luò)信息資源是指從計算機、通信技術(shù)、多媒體技術(shù)相互融合而形成的網(wǎng)絡(luò)上可查找到的資源。網(wǎng)上可利用的信息資源是多種多樣的,從網(wǎng)絡(luò)信息管理和利用的角度出發(fā),人們對已存在于網(wǎng)絡(luò)中的信息資源進行了類型化和系統(tǒng)化研究,不同的角度有不同的分類形式,一般有以下幾種: 按信息表現(xiàn)形式分有電子出版物和非電子出版物信息資源。 按信息的媒體形式分本為文本信息資源、超文本信息資源、多媒體信息資源和超媒體信息資源。 按網(wǎng)絡(luò)信息資源加工層次,可以分為網(wǎng)絡(luò)資源指南和搜索引擎,聯(lián)機館藏目錄、數(shù)據(jù)庫信息資源、電子出版物、網(wǎng)上參考工具和其它動態(tài)信息。 按照用戶采用的不同的網(wǎng)絡(luò)協(xié)議來劃分,可

6、以分為基于超文本傳輸協(xié)議(HTTP)的信息資源、基于文件傳輸協(xié)議(FTP)的信息資源、基于遠程登錄(TELNET)的信息資源、新聞組(Usenet/Newsgroups)資源和電子郵件(E-mail)信息資源。此外隨著web2.0的發(fā)展信息資源也便及整個web2.0中,如博客,百科,維基,播客等等。3.信息資源檢索信息資源檢索是從信息資源集合中找出所需信息內(nèi)容的過程。從廣義上講,信息資源檢索包括兩個過程,一是信息資源的存儲(Information Storage),所謂存儲是對有關(guān)信息進行選擇,并對信息特征進行著錄、標引和組織,建立信息數(shù)據(jù)庫的過程;二是信息資源的檢索(Information

7、Retrieval),所謂檢索是根據(jù)檢索提問制定檢索策略,利用信息數(shù)據(jù)庫查找信息資源的過程。從狹義上講,信息資源檢索僅指后一部分。 4.信息資源檢索的分類(1)按信息資源檢索結(jié)果的內(nèi)容劃分信息檢索。信息檢索按照其信息系統(tǒng)、內(nèi)容及結(jié)果可分為以下兩種類型: 信息線索檢索。利用書目、文摘和書目型數(shù)據(jù)庫等檢索系統(tǒng),檢索的結(jié)果只是提供了信息線索。 信息的全文檢索。這種檢索以查找到信息全文為目的,檢索的結(jié)果是找到全文信息。 數(shù)據(jù)檢索。數(shù)據(jù)檢索是指從檢索系統(tǒng)存儲的數(shù)據(jù)中查出用戶所需數(shù)據(jù)的檢索,如科技數(shù)據(jù)、金融數(shù)據(jù)、人口統(tǒng)計數(shù)據(jù)等。 事實檢索。事實檢索是指對特定的事件或事實的檢索,包括事物的性質(zhì)、定義、原理及

8、發(fā)生的地點、時間、前因后果等。 (2)按信息資源檢索技術(shù)劃分全文文本檢索。全文文本檢索也稱全文數(shù)據(jù)庫檢索,它通過計算機將文件的全貌,包括文字、圖形和圖像等信息轉(zhuǎn)換成計算機可讀形式,直接采用自然語言來設(shè)置檢索入口,檢索時以文中任意信息單元作為檢索點,計算機自動進行高速比照,完成檢索過程。 多媒體檢索。多媒體檢索是指能夠支持兩種以上媒體的數(shù)據(jù)庫檢索。超文本檢索。超文本檢索是指超文本(hypertext)的內(nèi)容排列是非線性的,它按知識(信息)單元及其關(guān)系建立起知識結(jié)構(gòu)網(wǎng)絡(luò),如具有圖形的信息又稱超媒體(hypermedia),超文本(媒體)的檢索是通過超文本(媒體)鏈接(hyperlink)來實現(xiàn)的。

9、 網(wǎng)絡(luò)信息資源檢索。網(wǎng)絡(luò)信息資源檢索是一種集合各種新型檢索技術(shù)于一體,能夠?qū)Ω鞣N類型、各種媒體的信息進行跨時間、跨地理檢索的大系統(tǒng)。5.信息資源檢索系統(tǒng) 檢索系統(tǒng)是用于報道、存儲與查找信息的工具。檢索系統(tǒng)的實質(zhì)是將描述特定用戶所需信息的提問特征與信息存儲的檢索標識進行異同比較,從中找出與提問特征一致或基本一致的信息。檢索系統(tǒng)應(yīng)包括以下兩個主要的方面: (1)信息標引和存儲過程。對大量無序的信息資源進行標引處理,使之有序化,并按科學的方法存儲,組成檢索工具或檢索文檔,即組織檢索系統(tǒng)的過程。 (2)信息的需求分析和檢索過程。分析用戶的信息需求,利用已組織好的檢索系統(tǒng)所提供的方法與途徑檢索有關(guān)信息,

10、即檢索系統(tǒng)的應(yīng)用過程。 6.數(shù)據(jù)庫及數(shù)據(jù)庫類型 (1)數(shù)據(jù)庫的定義。根據(jù) ISO/DIS 5127 號標準,數(shù)據(jù)庫(Database)的定義為:至少由一種文檔組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。 (2)數(shù)據(jù)庫類型。按照國際上通用的分類方法,數(shù)據(jù)庫通常可劃分為以下幾個類型: 參考數(shù)據(jù)庫(Reference Database)。參考數(shù)據(jù)庫是指用戶在這些數(shù)據(jù)庫中獲取信息線索后,還需要進一步查找原文或其他資料的一類數(shù)據(jù)庫。它包括書目數(shù)據(jù)庫和指南數(shù)據(jù)庫。書目數(shù)據(jù)庫(Bibliographic Database):它是存儲某個學科領(lǐng)域二次信息資源的數(shù)據(jù)庫,其顯著特征是向用戶

11、提供信息線索,只能檢索出信息的標題、出處、著者、主題等。例如,EI Village 2、美國化學文摘數(shù)據(jù)庫、中文科技期刊篇名數(shù)據(jù)庫等。指南數(shù)據(jù)庫(Directory Database):它是存儲能夠提供用戶參考、給予用戶指南的各類信息,如商業(yè)、企業(yè)等機構(gòu)的名稱、地址、電話,人物,出版物,項目,程序,活動等簡要描述性信息的一類數(shù)據(jù)庫,亦稱指示性數(shù)據(jù)庫。例如,公司名錄數(shù)據(jù)庫、人物傳記數(shù)據(jù)庫、技術(shù)標準數(shù)據(jù)庫等均屬此類。 源數(shù)據(jù)庫(Source Database)。此類數(shù)據(jù)庫在歐洲也稱數(shù)據(jù)銀行(Data Bank)。它是能夠直接為用戶提供原始資料或具體數(shù)據(jù)的一類數(shù)據(jù)庫。7.信息資源的檢索方法直接檢索:

12、指通過直接瀏覽或閱讀原始文獻獲取所需信息的方法。通過它可以直接查找一次信息資源和三次信息資源。間接檢索:指借助檢索工具或檢索系統(tǒng)查得文獻線索再獲取原始文獻的方法稱為間接檢索。它是文獻檢索常用的檢索方法。8.檢索策略廣義地說,檢索策略(Retrieval Strategy)是為實現(xiàn)檢索目標而制定的全盤計劃或方案,包括課題分析、檢索系統(tǒng)選擇、確定檢索詞及其相互間的邏輯關(guān)系、檢索式的制定、調(diào)整檢索方案等。狹義地說,檢索策略是指填寫的“檢索提問單”。在計算機檢索中,策略問題是明確提出來的,必須慎重考慮的,因為它可能要完成的是一個比較復(fù)雜、精細的檢索課題,又是在人與機器的交互、對話中實現(xiàn)的。手檢的策略考

13、慮較少,因為比較簡單,方案研究的余地不多。9.課題檢索步驟分析研究課題(明確檢索目的和要求)選擇檢索工具和檢索方法選擇檢索途徑和檢索標志查找文獻線索整理檢索結(jié)果索取原文。(1)課題分析分析檢索課題的目的是使用戶搞清楚其課題要解決的實質(zhì)問題,即它所包含的概念和具體要求以及它們之間的關(guān)系。這是制定檢索策略的根本出發(fā)點,也是檢索效率高低或成敗的關(guān)鍵。課題分析需要明確以下具體問題:研究課題的主題、課題所涉及的學科范圍、課題所需信息內(nèi)容及其內(nèi)容特征。課題所需信息的類型,包括文獻信息載體、出版類型、所需文獻量、年代范圍、涉及的語種、有關(guān)著者、機構(gòu)等。課題對查新、查準、查全的指標要求。(2)檢索系統(tǒng)或檢索工

14、具的選擇一個計算機檢索系統(tǒng)通??梢蕴峁┒鄠€可檢索數(shù)據(jù)庫,一個手工檢索系統(tǒng)就是一種檢索工具。選擇檢索工具和檢索系統(tǒng)時,要考慮的主要問題是:從內(nèi)容上和時間上,考慮檢索工具和數(shù)據(jù)庫對課題的覆蓋和一致性,比如應(yīng)綜合考慮選擇專業(yè)性強、收錄范圍廣、檢索途徑多、編制質(zhì)量高、使用方便的檢索工具或數(shù)據(jù)庫。在手段和技術(shù)上,有機檢條件的一般就不選擇手檢工具,機檢無疑有較高的效率??紤]價格和可獲得性,選擇手頭容易獲得的檢索系統(tǒng),注意數(shù)據(jù)庫的價格,權(quán)衡價格效益比。 (3)檢索途徑 不同的檢索入口,有相應(yīng)的檢索路徑(approach),稱作檢索途徑。手檢工具只提供比較常用的檢索途徑,如分類途徑、主題途徑、著者途徑、號碼途

15、徑、引文途徑等;在計算機檢索系統(tǒng)中,檢索點很多,幾乎文獻的每一個特征都可作為檢索點,并且可以實現(xiàn)全文檢索。(4)檢索式的制定 依據(jù)檢索詞之間的邏輯關(guān)系,用檢索系統(tǒng)識別的符號將檢索詞連接起來,反映研究內(nèi)容、表達研究者意圖的式子。在手檢系統(tǒng)中,每次檢索只能從一個檢索點出發(fā),而且只能選擇其中的一個屬性值,比如主題檢索,只能從某個概念出發(fā),檢索范圍比較寬。機檢時利用檢索式(各種途徑結(jié)合)可以有效地控制檢索范圍。(5)原文索取 用戶無論是利用手工檢索系統(tǒng)還是計算機檢索系統(tǒng),信息資源檢索的目的都是找到適合的信息資源。這是檢索過程的終結(jié),也是進行信息資源檢索的最終目的。原文獲取主要有以下幾種方法先電子后印刷

16、,數(shù)字化出版特一般更新快、出版快,查詢輸出非常方便。先近后遠,可以先查所在圖書館的館藏,如果沒有,可以利用聯(lián)合目錄數(shù)據(jù)庫,查看附近的圖書館或其它信息機構(gòu)是否有收藏。利用館際互借及原文傳遞服務(wù),許多圖書館設(shè)有此項服務(wù),難以獲取的外文文獻可以向國外的圖書館和文獻提供機構(gòu)求助。館際互借ILL(Inter Library Loan)是指館與館間的圖書資料借閱合作,是圖書館開放服務(wù)(Open Service)的一個重要方面。原始的辦法是靠人去其他合作館借還原件或取回復(fù)印件,這可由個人也可委托圖書館服務(wù)部門來完成。文獻傳遞DD(Document Delivery)是指利用各種通信手段、從各種文獻服務(wù)中心獲

17、取文獻信息的有效手段。其服務(wù)模式多樣,比如:郵遞(Mail)、快遞(Express Mail)、電傳(Telex)、傳真(Fax)及電子郵件(E-mail)等。文獻傳遞的電子化、網(wǎng)絡(luò)化使傳送的信息量更大,內(nèi)容更豐富,使傳送的速度更快捷,手續(xù)更簡單,使用戶獲得文獻信息的渠道更暢通。網(wǎng)絡(luò)環(huán)境下的資源共享目前基于互聯(lián)網(wǎng)進行的全文服務(wù)大致可以分為兩種類型:全文鏈接服務(wù)和原文傳遞服務(wù)。全文鏈接服務(wù)(Link to Full Text)。用戶在數(shù)據(jù)庫中找到一篇適用的文獻,系統(tǒng)在界面上提供了一個全文鏈接按鈕,幫助用戶直接鏈接到其他數(shù)據(jù)庫或其他系統(tǒng)中的原文文獻,稱為全文鏈接服務(wù)。這種鏈接是通過系統(tǒng)與系統(tǒng)之間的

18、協(xié)議或接口、數(shù)據(jù)庫和數(shù)據(jù)庫之間內(nèi)容的整合實現(xiàn)的,是直接鏈接到具體文獻(Title to Title),而不是超鏈接(Hyperlink),后者僅僅鏈接到期刊刊名或數(shù)據(jù)庫一層,用戶還必須再次檢索。原文傳遞服務(wù)(Document Delievrey)。即二次文獻數(shù)據(jù)庫具備網(wǎng)上檢索和發(fā)送原文傳遞請求的功能,用戶檢索到所需文獻后,單擊“原文傳遞”按鈕,將索要全文的請求直接發(fā)送給數(shù)據(jù)庫提供商,提供商或提供商委托的文獻提供單位為用戶提供原文傳遞服務(wù)。目前有這項服務(wù)的國內(nèi)數(shù)據(jù)庫主要有:CALIS聯(lián)合目錄數(shù)據(jù)庫和國家科技圖書文獻中心外文期刊目次庫。10.檢索方式(1)瀏覽檢索 瀏覽檢索,它是人工檢索語言的應(yīng)用

19、與延伸,即由系統(tǒng)提供一個樹狀結(jié)構(gòu)的概念等級體系,用戶可以沿著這顆“樹”進入不同的分支,到達葉子節(jié)點,并在節(jié)點看到檢索結(jié)果列表。它的作用就是為用戶提供一個知識體系,讓用戶可以俯瞰全貌,了解某一個方面的信息總體情況。如主題瀏覽、分類瀏覽、文獻類型瀏覽、學科導航等等。(2)簡單檢索簡單檢索又稱為基本檢索、快速檢索,即為用戶提供一個簡單的檢索界面,幫助非專業(yè)事初入門用戶方便地提交檢索式。頁面上通常只有一個檢索框,用戶提交檢索式后,系統(tǒng)將提問發(fā)送到默認的一個或幾個標引字段中進行匹配運算,檢索出結(jié)果。(3)高級檢索高級檢索也稱復(fù)雜檢索、指南檢索、專家檢索,它是為專業(yè)用戶、資深用戶提供的比較復(fù)雜的檢索界面,

20、可以構(gòu)建比較細致的檢索式,幫助用戶進行精確檢索。命令檢索就屬于高級檢索的一種。命令檢索通常用于聯(lián)機檢索系統(tǒng),通過命令方式實施檢索。檢索式由若干檢索詞組配形成。這些檢索詞的擴展、限定的字段,它們之間的邏輯關(guān)系、位置關(guān)系等均可由算符的連接來表示。盡管不同的聯(lián)機系統(tǒng)由各自定義的算符表示,命令形式不盡相同,但都有許多一致的檢索功能。以下用國際上比較成熟的美國 Dialog 聯(lián)機檢索系統(tǒng)的命令方式為例來討論命令檢索基礎(chǔ)。(4)索引檢索索引是一個線性的表單,可以將任何一個標引字段中的概念按字母順序線性排列起來,不分等級。用戶通過檢索,可以定位在索引中的任意某個位置,并瀏覽在這個位置附近的所有詞語,進而查詢

21、所需詞語對應(yīng)的結(jié)果列表。索引的種類很多,如人名索引、出版物索相、地名索引、主題索引、機構(gòu)索引等等。(5)超文本檢索超文本檢索是指超文本(hypertext)的內(nèi)容排列是非線性的,它按知識(信息)單元及其關(guān)系建立起知識結(jié)構(gòu)網(wǎng)絡(luò),如具有圖形的信息又稱超媒體(hypermedia),超文本(媒體)的檢索是通過超文本(媒體)鏈接(hyperlink)來實現(xiàn)的。 11.評價指標檢索效果(Retrieval Effectiveness)是指信息資源檢索系統(tǒng)檢索信息資源的有效程度,反映信息資源檢索系統(tǒng)的能力??颂m弗登(Cranfield)在分析用戶基本要求的基礎(chǔ)上,提出了 6 項評價系統(tǒng)性能的指標,包括收錄

22、范圍、查全率、查準率、響應(yīng)時間、用戶負擔及輸出形式。(1)查全率(recall ratio)指檢出文獻中合乎需要的文獻數(shù)量占數(shù)據(jù)庫中存在的合乎該需要的所有文獻的比例。用字母R表示。R=檢出的相關(guān)文獻量 / 檢索系統(tǒng)中相關(guān)文獻量(2)查準率(precision ratio)指檢出文獻中合乎需要的文獻數(shù)量占檢出文獻全部數(shù)量的比例。用字母P表示。P=檢出的相關(guān)文獻量 / 檢出的文獻總量一系列的試驗結(jié)果表明,查全率和查準率之間存在互逆關(guān)系,如果對檢索系統(tǒng)要求較高的查全率,則查準率必然下降,反之亦然。12.檢索匹配方式(1)精確匹配:輸入的檢索詞與檢索結(jié)果完全一致,如檢索詞“ABC”,檢索結(jié)果也為:“A

23、BC”(2)前項匹配:輸入的檢索詞在檢索結(jié)果的最前面,其余部分沒有限制。如檢索詞“ABC”,檢索結(jié)果為:“ABC”(3)后項匹配:輸入的檢索詞在檢索結(jié)果的最后面,其余部分沒有限制。如檢索詞“ABC”,檢索結(jié)果為:“ABC”(4)模糊匹配:輸入的檢索詞在檢索結(jié)果的任意部分。如檢索詞“ABC”,檢索結(jié)果可以為“ABC”、“ABC”、“ABC”或者“ABC”13.參考數(shù)據(jù)庫 參考數(shù)據(jù)庫(reference database)是指包含各種數(shù)據(jù)、信息或知識的原始來源和屬性的數(shù)據(jù)庫。數(shù)據(jù)庫中的記錄是通過對數(shù)據(jù)、信息或知識的再加工和過濾,如編目、索引、摘要、分類等,然后形成的。一般說來,參考數(shù)據(jù)庫主要是針對印刷型出版物而開發(fā)的。 參考數(shù)據(jù)庫主要包括:書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫、索引數(shù)據(jù)庫。書目數(shù)據(jù)庫主要是針對圖書進行內(nèi)容及存儲地址的報道與提示,如各圖書館館的館藏目錄;文摘和索引數(shù)據(jù)庫則相對期刊論文、會議論文、專利文獻、學位論文等進行內(nèi)容和屬性的認識與加工,它提供確定的文獻來源信息,供人們查閱和檢索,但一般不提供原始文獻的館藏信息。14四大檢索工具: 美國工程索引(the Engineering Index,EI)。 美國科學引文索引(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論