計(jì)算機(jī)檢索技術(shù)概述_第1頁
計(jì)算機(jī)檢索技術(shù)概述_第2頁
計(jì)算機(jī)檢索技術(shù)概述_第3頁
計(jì)算機(jī)檢索技術(shù)概述_第4頁
計(jì)算機(jī)檢索技術(shù)概述_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、字段(字段(field)field):如在數(shù)據(jù)庫(kù)中題名、作者、作者單位、期刊名、摘要、全文等等均是字段;一條記錄由多個(gè)字段值組成;對(duì)計(jì)算機(jī)檢索來說字段相當(dāng)于檢索入口。 常用字段縮寫:常用字段縮寫:tititle tititle 文章題目文章題目ababstract ababstract 文章摘要文章摘要kwkey word kwkey word 關(guān)鍵詞關(guān)鍵詞auauthor auauthor 作者作者afaffiliation afaffiliation 作者單位作者單位sosource sosource 文章來源(刊名信息等)文章來源(刊名信息等)issn(isbn) internation

2、al standard serial (book) number issn(isbn) international standard serial (book) number pypublication year pypublication year 出版年出版年lalanguage lalanguage 語種語種數(shù)據(jù)庫(kù)的類型數(shù)據(jù)庫(kù)的類型書目數(shù)據(jù)庫(kù)全文數(shù)據(jù)庫(kù)文摘數(shù)據(jù)庫(kù)按信息處理層次劃分期刊論文數(shù)據(jù)庫(kù)書目及圖書全文數(shù)據(jù)庫(kù)專利數(shù)據(jù)庫(kù)學(xué)位論文數(shù)據(jù)庫(kù)產(chǎn)品數(shù)據(jù)庫(kù)按收錄的文獻(xiàn)類型劃分圖像數(shù)據(jù)庫(kù) 文本數(shù)據(jù)庫(kù)數(shù)值數(shù)據(jù)庫(kù) 聲音數(shù)據(jù)庫(kù) 視頻數(shù)據(jù)庫(kù)多媒體數(shù)據(jù)庫(kù)按媒體信息劃分綜合性數(shù)據(jù)庫(kù)專業(yè)性數(shù)據(jù)庫(kù)按收錄文獻(xiàn)信息的范

3、圍劃分單機(jī)數(shù)據(jù)庫(kù)聯(lián)機(jī)數(shù)據(jù)庫(kù)網(wǎng)絡(luò)數(shù)據(jù)庫(kù)按服務(wù)模式劃分精確與模糊檢索精確與模糊檢索 基本技術(shù)基本技術(shù)詞間位置檢索詞間位置檢索 加權(quán)檢索加權(quán)檢索 布爾邏輯檢索布爾邏輯檢索 限定字段檢索限定字段檢索 限定范圍檢索限定范圍檢索 截詞檢索截詞檢索 1. 1.邏輯邏輯 “ “與與” ” (and)(and),表示為,表示為 a and b a and b 或或 a a * * b b 2. 2.邏輯邏輯 “ “或或”(or)(or),表示為,表示為 a or b a or b 或或 a + b a + b 3. 3.邏輯邏輯 “ “非非”(not)(not),表示為,表示為 a not b a not b

4、或或 a - ba - b aba and b例:檢索例:檢索“太陽能太陽能”文獻(xiàn)文獻(xiàn)太陽太陽能源能源aba or b例:檢索例:檢索“光盤和磁盤光盤和磁盤”文獻(xiàn)文獻(xiàn)光盤光盤磁盤磁盤 邏輯邏輯“非非”(not)(not) 表示檢索結(jié)果中排除含有某些詞的記錄,可以縮小檢索范圍,減少文獻(xiàn)輸出量,但并不一定能提高查準(zhǔn)率。aba not b例:檢索例:檢索“除核能以外有關(guān)能源除核能以外有關(guān)能源”文獻(xiàn)文獻(xiàn)能源能源核能核能 也叫也叫鄰接檢索鄰接檢索”, 表示兩個(gè)或多個(gè)檢索詞之間的關(guān)表示兩個(gè)或多個(gè)檢索詞之間的關(guān)系檢索方式,常用的位置算符有系檢索方式,常用的位置算符有: : 1. w (with)1. w (

5、with) 表示兩個(gè)檢索詞前后次序固定,二者之間只能間隔連表示兩個(gè)檢索詞前后次序固定,二者之間只能間隔連字符、空格或者是逗號(hào)。字符、空格或者是逗號(hào)。 【實(shí)例】在【實(shí)例】在oclcoclc中輸入中輸入communication w satellitecommunication w satellite; 2 2 . wn (with n) wn (with n) 表示兩個(gè)檢索詞前后次序固定,二者之間最多間隔表示兩個(gè)檢索詞前后次序固定,二者之間最多間隔n n個(gè)個(gè)字符。字符。 【實(shí)例】在【實(shí)例】在ebscoebsco中輸入中輸入communication w3 satellitecommunicati

6、on w3 satellite;后截?cái)酂o限截?cái)酂o限截?cái)嗳纾簆hysic?截詞檢索與截詞檢索算符physicphysicsphysicstphysicalismphysicphysicsphysicst如:physic*有限截?cái)嘤邢藿財(cái)嘀薪財(cái)嘀薪財(cái)嗲敖財(cái)嗲敖財(cái)鄊?nmanmen 4.4.英語或漢語中都有許多虛詞,不能作為檢索詞。英語或漢語中都有許多虛詞,不能作為檢索詞。如:漢語中如:漢語中“的、地、得、了的、地、得、了”等助詞等助詞; ; 英語中的英語中的a about also and any as at be a about also and any as at be between by

7、both for some so not this withbetween by both for some so not this with等等介詞或冠詞等介詞或冠詞等 檢索策略是對(duì)檢索的全面策劃,在操作上檢索策略是對(duì)檢索的全面策劃,在操作上主要指檢索式的編制和數(shù)據(jù)庫(kù)的選擇。主要指檢索式的編制和數(shù)據(jù)庫(kù)的選擇。 檢索策略在計(jì)算機(jī)檢索中直接決定檢索結(jié)檢索策略在計(jì)算機(jī)檢索中直接決定檢索結(jié)果的準(zhǔn)與全。果的準(zhǔn)與全。例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究例:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究 1.1.本課題包含本課題包含“神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)” “旋轉(zhuǎn)機(jī)械旋轉(zhuǎn)機(jī)械” “故障診斷故障診斷”三個(gè)概念三個(gè)

8、概念,“,“應(yīng)用應(yīng)用”和和“研究研究”屬于意義過于寬泛的詞,不屬于意義過于寬泛的詞,不應(yīng)該作為檢索詞。應(yīng)該作為檢索詞。 2.2.擴(kuò)展擴(kuò)展 神經(jīng)網(wǎng)絡(luò):相關(guān)的上位詞有人工智能神經(jīng)網(wǎng)絡(luò):相關(guān)的上位詞有人工智能旋轉(zhuǎn)機(jī)械旋轉(zhuǎn)機(jī)械故障診斷:相關(guān)詞有故障定位、故障檢測(cè),上位詞有故障診斷:相關(guān)詞有故障定位、故障檢測(cè),上位詞有容錯(cuò)技術(shù)容錯(cuò)技術(shù) 3.3.檢索式:檢索式:(神經(jīng)網(wǎng)絡(luò)(神經(jīng)網(wǎng)絡(luò) or or 人工智能)人工智能)andand(旋轉(zhuǎn)機(jī)械)(旋轉(zhuǎn)機(jī)械)and (and (故障診斷故障診斷 or or 故障定位故障定位 or or 故障檢測(cè)故障檢測(cè) or or 容錯(cuò)技術(shù))容錯(cuò)技術(shù)) . .要從概念入手,而不是

9、從字面意思入手;要從概念入手,而不是從字面意思入手; . .概念擴(kuò)展時(shí)要考慮同義詞、相關(guān)詞、上位詞概念擴(kuò)展時(shí)要考慮同義詞、相關(guān)詞、上位詞/ /下位詞等下位詞等( (既詞表中提到的用、代、分、屬、參、族),還要注意中英文既詞表中提到的用、代、分、屬、參、族),還要注意中英文混用的現(xiàn)象混用的現(xiàn)象 ; 3.3.當(dāng)課題比較生疏時(shí),應(yīng)當(dāng)首先利用百科全書、圖書等弄清當(dāng)課題比較生疏時(shí),應(yīng)當(dāng)首先利用百科全書、圖書等弄清楚概念,了解課題的有關(guān)專業(yè)知識(shí),弄清楚課楚概念,了解課題的有關(guān)專業(yè)知識(shí),弄清楚課 題的內(nèi)容和要解決題的內(nèi)容和要解決的問題以及解決該問題的初步設(shè)想等,進(jìn)而確定檢索的主題范圍。的問題以及解決該問題的

10、初步設(shè)想等,進(jìn)而確定檢索的主題范圍。 4.4.人文社會(huì)科學(xué)的檢索,如果是回溯檢索,應(yīng)該熟悉不同年人文社會(huì)科學(xué)的檢索,如果是回溯檢索,應(yīng)該熟悉不同年代所使用的概念和術(shù)語代所使用的概念和術(shù)語 5.5.忽略那些意義過于寬泛、通用的詞,比如忽略那些意義過于寬泛、通用的詞,比如:“:“研究研究” ” 、“應(yīng)用應(yīng)用” “” “探討探討”等。等。 分析課題時(shí)須注意的問題分析課題時(shí)須注意的問題 明確檢索要求,選擇數(shù)據(jù)庫(kù)明確檢索要求,選擇數(shù)據(jù)庫(kù)選擇數(shù)據(jù)庫(kù)要考慮以下因素:選擇數(shù)據(jù)庫(kù)要考慮以下因素:1.1.檢索目的:檢索的時(shí)間范圍、文獻(xiàn)類型、檢索深度為檢索目的:檢索的時(shí)間范圍、文獻(xiàn)類型、檢索深度為題錄、文摘還是全文

11、等等題錄、文摘還是全文等等2.2.檢索結(jié)果:對(duì)于研究生做學(xué)位論文來說,做課題前應(yīng)檢索結(jié)果:對(duì)于研究生做學(xué)位論文來說,做課題前應(yīng)充分了解一下本課題國(guó)內(nèi)外的研究現(xiàn)狀(即論文的綜述充分了解一下本課題國(guó)內(nèi)外的研究現(xiàn)狀(即論文的綜述部分),這時(shí)應(yīng)對(duì)該課題進(jìn)行較全面的檢索,包括綜述部分),這時(shí)應(yīng)對(duì)該課題進(jìn)行較全面的檢索,包括綜述性的文章,要求全面;對(duì)于該課題的核心部分,即該課性的文章,要求全面;對(duì)于該課題的核心部分,即該課題所要解決的具體問題,創(chuàng)新的地方,則需要準(zhǔn),技術(shù)題所要解決的具體問題,創(chuàng)新的地方,則需要準(zhǔn),技術(shù)細(xì)節(jié)越細(xì)越好。細(xì)節(jié)越細(xì)越好。3.3.檢索內(nèi)容所屬學(xué)科檢索內(nèi)容所屬學(xué)科, ,對(duì)與自己相關(guān)的數(shù)據(jù)庫(kù)要有一個(gè)對(duì)與自己相關(guān)的數(shù)據(jù)庫(kù)要有一個(gè)全面的了解全面的了解. . 檢索效率檢索效率 查全率和查準(zhǔn)率是判定檢索效果的主要指查全率和查準(zhǔn)率是判定檢索效果的主要指標(biāo)。標(biāo)。查全率查全率: : (recall ratiorecall ratio) 指系統(tǒng)在進(jìn)行某一檢索指系統(tǒng)在進(jìn)行某一檢索時(shí),檢索出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫(kù)中相關(guān)文時(shí),檢索出的相關(guān)文獻(xiàn)量與系統(tǒng)文獻(xiàn)庫(kù)中相關(guān)文獻(xiàn)總量的比率。用公式表示為:獻(xiàn)總量的比率。用公式表示為: 檢出的相關(guān)文獻(xiàn)量檢出的相關(guān)文獻(xiàn)量 系統(tǒng)數(shù)據(jù)庫(kù)中的相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論