第2章信息檢索原理與技術(shù)_第1頁(yè)
第2章信息檢索原理與技術(shù)_第2頁(yè)
第2章信息檢索原理與技術(shù)_第3頁(yè)
第2章信息檢索原理與技術(shù)_第4頁(yè)
第2章信息檢索原理與技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2.信息檢索原理及技術(shù)2.1信息檢索概述2.2信息檢索原理2.3信息檢索方法2.4信息檢索技術(shù)2.1信息檢索概述2.1.1信息檢索的含義2.1.2信息檢索的本質(zhì)2.1.3信息檢索的類型和特點(diǎn)2.1.1信息檢索的含義信息檢索通常是指從任何方式組成的信息集合中,查找特定用戶在特定時(shí)間和條件下所需信息的方法與過(guò)程。因此,完好的信息檢索應(yīng)包括以下兩個(gè)方面:1.信息標(biāo)引和存儲(chǔ)過(guò)程2.信息的檢索過(guò)程2.1.2信息檢索的本質(zhì)將描畫(huà)特定用戶所需信息的提問(wèn)特征,與信息存儲(chǔ)的檢索標(biāo)識(shí)進(jìn)展異同的比較,從中找出與提問(wèn)特征一致或根本一致的信息。提問(wèn)特征是指從欲檢索課題中選擇出能代表信息需求的主題詞、關(guān)鍵詞或分類號(hào)等。例如一區(qū)域開(kāi)展中的生態(tài)環(huán)境特征研討提問(wèn)特征〔關(guān)鍵詞〕1.區(qū)域開(kāi)展生態(tài)環(huán)境2.區(qū)域生態(tài)環(huán)境例如二食品中常見(jiàn)病原菌快速檢測(cè)提問(wèn)特征〔關(guān)鍵詞〕食品、食物病原菌檢測(cè)2.1.3信息檢索的類型和特點(diǎn)1.書(shū)目信息檢索2.全文信息檢索3.數(shù)據(jù)信息檢索4.現(xiàn)實(shí)信息檢索5.小結(jié)書(shū)目信息檢索以標(biāo)題、作者、原文來(lái)源、摘要及收藏地點(diǎn)為檢索對(duì)象,是一種相關(guān)性檢索。特點(diǎn):檢索結(jié)果不直接解答課題用戶提出的技術(shù)問(wèn)題,只提供與之相關(guān)的線索。普通以目錄、索引、文摘數(shù)據(jù)庫(kù)為檢索工具。例如:查找有關(guān)“城市生態(tài)環(huán)境及可繼續(xù)開(kāi)展〞方面的國(guó)內(nèi)外信息有那些?檢索工具:中文科技期刊數(shù)據(jù)庫(kù)、萬(wàn)方數(shù)據(jù)資源系統(tǒng)、EI等。全文信息檢索以論文或?qū)@U明書(shū)的全文為檢索對(duì)象,也是相關(guān)性檢索。特點(diǎn):是在書(shū)目信息檢索根底上更深層次的內(nèi)容檢索。例如:檢索由侯果山撰寫(xiě),發(fā)表在小說(shuō)評(píng)論,2021,(S1)“淺談<紅樓夢(mèng)>與<家>的類似之處〞一文。檢索工具:中國(guó)期刊全文數(shù)據(jù)庫(kù)數(shù)據(jù)信息檢索以具有數(shù)量性質(zhì)并以數(shù)值方式表示的數(shù)據(jù)為檢索對(duì)象,是一種確定性檢索。檢索的結(jié)果是經(jīng)過(guò)測(cè)試和評(píng)價(jià)過(guò)的各種數(shù)據(jù),可用于比較分析和定量分析。它普通以數(shù)據(jù)大全、手冊(cè)、年鑒等為檢索工具。例如2021年懇求中國(guó)發(fā)明專利和獲得授權(quán)發(fā)明專利的國(guó)家有哪些?檢索工具中國(guó)統(tǒng)計(jì)年鑒現(xiàn)實(shí)信息檢索以事項(xiàng)為檢索對(duì)象,檢索結(jié)果是有關(guān)某一事物的詳細(xì)答案,也是一種確定性檢索。普通利用字詞典、年鑒、百科全書(shū)、手冊(cè)等為檢索工具。例如問(wèn)題:國(guó)內(nèi)計(jì)算機(jī)軟件的研討機(jī)構(gòu)?檢索工具:中國(guó)企業(yè)、公司及產(chǎn)品數(shù)據(jù)庫(kù)中油油氣勘探軟件國(guó)家工程研討中心四川省嵌入式計(jì)算機(jī)軟件技術(shù)重點(diǎn)實(shí)驗(yàn)室信息產(chǎn)業(yè)部實(shí)時(shí)計(jì)算機(jī)系統(tǒng)及運(yùn)用重點(diǎn)實(shí)驗(yàn)室電子科技大學(xué)嵌入式實(shí)時(shí)計(jì)算研討所黑龍江省計(jì)算機(jī)軟件工程技術(shù)研討中心江蘇省計(jì)算機(jī)軟件工程研討中心中山大學(xué)計(jì)算機(jī)軟件研討所云南省計(jì)算機(jī)軟件技術(shù)開(kāi)發(fā)研討中心計(jì)算機(jī)軟件國(guó)家工程研討中心武漢大學(xué)計(jì)算機(jī)軟件工程研討所貴州大學(xué)計(jì)算機(jī)軟件與實(shí)際研討所浙江大學(xué)計(jì)算機(jī)軟件研討所小結(jié):書(shū)目信息檢索是利用各種目錄、題錄和文摘工具獲取有關(guān)信息的線索。例如:各種圖書(shū)目錄、期刊目錄國(guó)內(nèi)外著名的題錄和文摘有<全國(guó)報(bào)刊索引>、<工程索引>〔EI〕、<科學(xué)引文索引>〔SCI〕等。全文信息檢索是利用各種全文系統(tǒng)獲取有關(guān)的全文信息。例如:中國(guó)科技期刊全文數(shù)據(jù)庫(kù)數(shù)據(jù)和現(xiàn)實(shí)檢索是利用各種參考工具書(shū)獲取有關(guān)確實(shí)定性數(shù)據(jù)或現(xiàn)實(shí)信息。例如:各種百科全書(shū)、年鑒、手冊(cè)等。2.2信息檢索原理2.2.1信息檢索效率2.2.2信息檢索系統(tǒng)2.2.3信息檢索言語(yǔ)2.2.1信息檢索效率信息檢索效率是評(píng)價(jià)一個(gè)檢索系統(tǒng)性能優(yōu)劣的質(zhì)量規(guī)范,它貫穿于信息的存儲(chǔ)和檢索的全過(guò)程。其評(píng)價(jià)目的主要是:查全率查準(zhǔn)率2.2.2信息檢索系統(tǒng)信息檢索系統(tǒng)是擁有一定的存儲(chǔ)、檢索技術(shù)配備、存儲(chǔ)有各種信息,并能為用戶檢索所需信息的效力任務(wù)系統(tǒng)。目前常用的是手工檢索系統(tǒng)和計(jì)算機(jī)檢索系統(tǒng)。2.2.3信息檢索言語(yǔ)檢索言語(yǔ)又稱標(biāo)引言語(yǔ),是系統(tǒng)存儲(chǔ)和檢索時(shí)共同運(yùn)用的一種商定言語(yǔ),以到達(dá)信息存儲(chǔ)和檢索的一致性,提高檢索效率。檢索言語(yǔ)的類型體系分類言語(yǔ)分類言語(yǔ)組配分類言語(yǔ)混合分類言語(yǔ)標(biāo)題詞言語(yǔ)主題言語(yǔ)關(guān)鍵詞言語(yǔ)敘詞言語(yǔ)單元詞言語(yǔ)體系分類言語(yǔ)體系分類言語(yǔ)是按學(xué)科邏輯分類的原理,運(yùn)用概念劃分的方法,按知識(shí)門類從總到分,從上到下,層層劃分,逐級(jí)展開(kāi)組成分類表,并以分類表來(lái)標(biāo)引、存儲(chǔ)信息和檢索信息。特點(diǎn)是表達(dá)學(xué)科的系統(tǒng)性,反映事物的平行、隸屬和派生關(guān)系,有利于從學(xué)科的角度進(jìn)展族性檢索,到達(dá)較高的查全率。<中圖法>第四版分類體系組成及構(gòu)造<中圖法>T工業(yè)技術(shù)及環(huán)境科學(xué)大類簡(jiǎn)表〔二級(jí)類目表〕TB普通工業(yè)技術(shù)TL原子能技術(shù)TD礦業(yè)工程TM電工技術(shù)TE石油、天然氣工業(yè)TN無(wú)線電電子學(xué)、電信技術(shù)TF冶金工業(yè)TP自動(dòng)化技術(shù)、計(jì)算機(jī)技術(shù)TG金屬學(xué)與金屬工藝TQ化學(xué)工業(yè)TH機(jī)械、儀表工業(yè)TS輕工業(yè)、手工業(yè)TJ武器工業(yè)TU建筑科學(xué)TK能源與動(dòng)力工程TV水利工程關(guān)鍵詞言語(yǔ)關(guān)鍵詞言語(yǔ)是一種主題言語(yǔ)〔采用表達(dá)某一事物或概念的名詞術(shù)語(yǔ)標(biāo)引、存儲(chǔ)和檢索的一種言語(yǔ)〕。它是直接從原文的標(biāo)題、摘要、全文中,研討課題中抽選出來(lái)的具有本質(zhì)意義的、未經(jīng)規(guī)范化處置的自然言語(yǔ)詞匯作為存儲(chǔ)和檢索根據(jù)的一種檢索言語(yǔ)。例如一海岸帶濕地變化及其對(duì)生態(tài)環(huán)境的影響關(guān)鍵詞:海岸帶濕地生態(tài)環(huán)境例如二高性能纖維的制備和研討關(guān)鍵詞:纖維制備2.3信息檢索方法

2.3.1信息需求分析2.3.2制定檢索戰(zhàn)略2.3.3實(shí)施檢索戰(zhàn)略2.3.1信息需求分析信息需求是人們?cè)诳陀^或客觀上就課題所需信息的要求,是人們檢索信息的根本出發(fā)點(diǎn),也是評(píng)價(jià)檢索效果的根據(jù)。它包括兩個(gè)方面〔參見(jiàn)教材24頁(yè)〕1.明確檢索的目的和要求2.對(duì)主題進(jìn)展分析例如課題稱號(hào):相變儲(chǔ)能纖維的制備一、檢索目的和要求:目的:科技立項(xiàng)要求:國(guó)內(nèi)外有無(wú)1.相變儲(chǔ)能纖維制備的研討報(bào)道;2.已采用的制備方法有哪些?二、主題分析第一層面:相變儲(chǔ)能纖維—相變資料第二層面:制備—微膠囊化2.3.2制定檢索戰(zhàn)略檢索戰(zhàn)略是為了到達(dá)檢索目的而制定的詳細(xì)檢索方案。包括選擇檢索系統(tǒng)、確定檢索途徑或檢索詞、擬定檢索程序。按檢索手段分為手工檢索戰(zhàn)略和上機(jī)檢索戰(zhàn)略。2.3.3實(shí)施檢索戰(zhàn)略分獲取信息線索和索取原始信息兩步。獲取信息線索本質(zhì)上是實(shí)現(xiàn)書(shū)目信息檢索。索取原始信息本質(zhì)上是實(shí)現(xiàn)全文信息檢索。2.4信息檢索技術(shù)及其運(yùn)用信息檢索技術(shù)是指利用現(xiàn)代信息檢索系統(tǒng),如聯(lián)機(jī)數(shù)據(jù)庫(kù)、光盤數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索有關(guān)信息而采用的相關(guān)技術(shù),主要有布爾檢索、詞位檢索、截詞檢索和限制檢索。2.4.1布爾檢索布爾檢索技術(shù)運(yùn)用的邏輯算符及含義〔1〕邏輯與〔2〕邏輯或〔3〕邏輯非邏輯與1.概念:邏輯與是一種具有概念交叉或概念限定關(guān)系的組配。2.算符:“*〞或“AND〞3.特點(diǎn):加強(qiáng)專指度,提高查準(zhǔn)率。4.舉例:“遙感技術(shù)〞AND“監(jiān)測(cè)〞,表示兩個(gè)概念應(yīng)同時(shí)包含在一條記錄中。邏輯或1.概念:邏輯或是一種具有概念一樣、概念相關(guān)或概念并列關(guān)系的組配。2.算符:“+〞或“OR〞3.特點(diǎn):擴(kuò)展檢索范圍,提高了查全率。4.舉例:廢水OR污水,表示這兩個(gè)相關(guān)概念分別在一條記錄中出現(xiàn)或同時(shí)在一條記錄中出現(xiàn)。邏輯非1.概念:邏輯非是一種具有概念排除關(guān)系的組配。2.算符:“-〞或“NOT〞3.特點(diǎn):提高查準(zhǔn)率,影響查全率。4.舉例:制藥廢水NOT放射廢水,表示檢索出的記錄中要排除含有“放射廢水〞的記錄。2.4.2詞位檢索詞位檢索具有限定檢索詞詞間位置關(guān)系的功能,可彌補(bǔ)布爾邏輯算符只是定性規(guī)定檢索詞的范圍,到達(dá)提高檢準(zhǔn)率的效果。臨近檢索用于網(wǎng)絡(luò)數(shù)據(jù)庫(kù),常用的位置邏輯算符有:同句、同段、NERA、SAME。NERA表示兩詞之間不得多于9個(gè)詞,詞前后位置恣意,SAME要求檢索詞在同一個(gè)句子中,這里所指的同一個(gè)句子是兩個(gè)句號(hào)之間的字符串,檢索詞在句子中的順序恣意。例如:airNEARpollutionairSAMEpollution2.4.3截詞檢索截詞檢索是防止漏檢,提高查全率的一種常用檢索技術(shù),大多數(shù)數(shù)據(jù)庫(kù)都提供了截詞檢索的功能。用*或?表示。截詞是在檢索詞的適當(dāng)位置進(jìn)展截?cái)啵?jié)省輸入的字符,到達(dá)較高的查全率,常用的有后截詞方式。例如:book??表示截一個(gè)字符,為有限截詞符。comput?Comput*表示截?zé)o限個(gè)字符,為無(wú)限截詞符。特殊情況:中截詞fib?r2.4.4限制檢索為了確定檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的字段位置,可采用字段限制查找的范圍。常用的字段代碼有標(biāo)題〔TI〕、文摘〔AB〕、作者〔AU〕、語(yǔ)種〔LA〕、刊名〔JN〕等。限制檢索在光盤數(shù)據(jù)庫(kù)中普通用前、后綴表示,在網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中普通運(yùn)用下拉菜單進(jìn)展選擇限制。2.4.5信息檢索方法及技術(shù)運(yùn)用實(shí)例檢索課題:相變儲(chǔ)能纖維的制備1.信息需求分析〔1〕明確檢索目的與要求1〕檢索目的:學(xué)位論文開(kāi)題查新2〕檢索要求:國(guó)內(nèi)外相變儲(chǔ)能纖維的制備的相關(guān)信息?!?〕進(jìn)展主題分析,確定主題范圍。根據(jù)檢索目的與要求,該課題涉及的主題范圍重點(diǎn)為:相變儲(chǔ)能纖維、制備。

2.制定檢索戰(zhàn)略〔1〕選擇檢索詞:相變資料—phasechangematerial相變纖維—phasechangefibers微膠囊化—microencapsulation制備—preparation〔2〕運(yùn)用相關(guān)檢索技術(shù)構(gòu)造提問(wèn)式式1:〔相變資料or相變纖維〕and〔原位微膠囊化or微膠囊化〕and制備式2:phasechangematerialandmicroencapsulation式3:phasechangefibersandmicroencapsulation式4:phasechangematerialandpreparation式5:phasechangefibersandpreparation式6:phasechangematerial*andmicroencapsulation式7:phasechangefib?r*andmicroencapsulatio

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論