![信息檢索系統(tǒng)的評(píng)價(jià).ppt_第1頁(yè)](http://file.renrendoc.com/FileRoot1/2019-2/1/3394bc9b-11d6-476c-87a4-afa635a3c303/3394bc9b-11d6-476c-87a4-afa635a3c3031.gif)
![信息檢索系統(tǒng)的評(píng)價(jià).ppt_第2頁(yè)](http://file.renrendoc.com/FileRoot1/2019-2/1/3394bc9b-11d6-476c-87a4-afa635a3c303/3394bc9b-11d6-476c-87a4-afa635a3c3032.gif)
![信息檢索系統(tǒng)的評(píng)價(jià).ppt_第3頁(yè)](http://file.renrendoc.com/FileRoot1/2019-2/1/3394bc9b-11d6-476c-87a4-afa635a3c303/3394bc9b-11d6-476c-87a4-afa635a3c3033.gif)
![信息檢索系統(tǒng)的評(píng)價(jià).ppt_第4頁(yè)](http://file.renrendoc.com/FileRoot1/2019-2/1/3394bc9b-11d6-476c-87a4-afa635a3c303/3394bc9b-11d6-476c-87a4-afa635a3c3034.gif)
![信息檢索系統(tǒng)的評(píng)價(jià).ppt_第5頁(yè)](http://file.renrendoc.com/FileRoot1/2019-2/1/3394bc9b-11d6-476c-87a4-afa635a3c303/3394bc9b-11d6-476c-87a4-afa635a3c3035.gif)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
,提 問 1 試解釋信息檢索系統(tǒng)的內(nèi)涵。 2 什么是”評(píng)價(jià)”?,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,一、意義 評(píng)價(jià)(Evaluation):發(fā)現(xiàn)和收集關(guān)于某種活動(dòng)的數(shù)據(jù),從中判斷該項(xiàng)活動(dòng)的質(zhì)量及達(dá)到預(yù)期目標(biāo)程度的行為。 簡(jiǎn)單地說,評(píng)價(jià)就是對(duì)系統(tǒng)的價(jià)值和效率進(jìn)行測(cè)評(píng)。 信息檢索系統(tǒng)評(píng)價(jià):根據(jù)給定的指標(biāo)體系,采用一定的方法和程序,對(duì)信息檢索系統(tǒng)的功能、特性和運(yùn)營(yíng)狀況進(jìn)行評(píng)測(cè),或?qū)τ嘘P(guān)假設(shè)、預(yù)期效益、性能值進(jìn)行驗(yàn)證,以確定系統(tǒng)達(dá)到了何種水平、投入成本是否值得、是否可以改進(jìn)和如何改進(jìn),乃至系統(tǒng)是否應(yīng)生存下去。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,一、意義 信息檢索系統(tǒng)的評(píng)價(jià)研究,一直是信息檢索領(lǐng)域的一項(xiàng)重要研究?jī)?nèi)容。多年來人們進(jìn)行了大量的評(píng)價(jià)試驗(yàn)和多角度的探索。 原因在于,檢索系統(tǒng)評(píng)價(jià)工作在為研究者驗(yàn)證檢索系統(tǒng)效益、比較各種檢索技術(shù)的優(yōu)劣、改進(jìn)現(xiàn)有檢索系統(tǒng)、開發(fā)新的應(yīng)用領(lǐng)域等方面,都具有不可替代的作用。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,一、意義 主要意義: 了解已有檢索系統(tǒng)的功能,找出缺陷并改進(jìn); 比較各種檢索系統(tǒng)的優(yōu)劣; 提高提高效率和效益; 有助于新的檢索系統(tǒng)的設(shè)計(jì); 豐富信息檢索的理論。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,二、評(píng)價(jià)范圍與類型 信息檢索系統(tǒng)是一個(gè)有眾多功能模塊組成的集合體。 評(píng)價(jià)可以從不同角度、基于不同目的和方法來進(jìn)行。 評(píng)價(jià)范圍:各種類型的檢索系統(tǒng)及組成要素。 評(píng)價(jià)類型: 宏觀評(píng)價(jià):著眼于檢索系統(tǒng)的宏觀方面,如情報(bào)源類型、系統(tǒng)結(jié)構(gòu)、收錄范圍、利用率等。 個(gè)別評(píng)價(jià):僅對(duì)系統(tǒng)的某一性能、功能進(jìn)行評(píng)價(jià)。 性能評(píng)價(jià)(performance evaluation):面向用戶的評(píng)價(jià),測(cè)定檢索系統(tǒng)的質(zhì)量或服務(wù)效果。也稱為檢索效果評(píng)價(jià)(effectiveness evaluation)。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.1 評(píng)價(jià)研究概述,二、評(píng)價(jià)范圍與類型 評(píng)價(jià)類型: 效益評(píng)價(jià)(benefits evaluation):測(cè)定系統(tǒng)或用戶獲得的的經(jīng)濟(jì)效益和社會(huì)效益。 (有直接的、潛在的;難以直接計(jì)量) 費(fèi)用/效果評(píng)價(jià)(cost effectiveness evaluation):考察系統(tǒng)達(dá)到的性能與費(fèi)用消耗之間的關(guān)系。(用戶、系統(tǒng)兩方面) 費(fèi)用/效益評(píng)價(jià)(cost benefits evaluation):考察系統(tǒng)的服務(wù)效益與費(fèi)用消耗間的關(guān)系。(計(jì)量難度較大) (詳見P207的解釋),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),一、評(píng)價(jià)指標(biāo)體系 要評(píng)價(jià)一個(gè)檢索系統(tǒng),必須有一套科學(xué)的評(píng)價(jià)標(biāo)準(zhǔn)。 建立檢索系統(tǒng)評(píng)價(jià)指標(biāo)體系應(yīng)遵循的原則: 各指標(biāo)應(yīng)定義單一、明確,具有可操作性。 評(píng)價(jià)指標(biāo)最好能夠量化或計(jì)量。 指標(biāo)要完善、細(xì)致、全面。 下面給出傳統(tǒng)檢索系統(tǒng)評(píng)價(jià)指標(biāo)體系模型:(供參考),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),逐一評(píng)價(jià)這些指標(biāo),可以判定檢索系統(tǒng)的優(yōu)劣。 其中,比較重要的是檢索性能指標(biāo)。,11.2 評(píng)價(jià)指標(biāo),問 題: 什么是查全率、查準(zhǔn)率?,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 1查全率和查準(zhǔn)率 查全率(Recall ratio,R):衡量一次檢索中與提問相關(guān)的文獻(xiàn)有多少篇被檢出。(衡量檢出相關(guān)文獻(xiàn)的能力),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 1查全率和查準(zhǔn)率 查準(zhǔn)率(Precision ratio,P):衡量被檢出的文獻(xiàn)中有多少篇與提問相關(guān)。 (衡量檢索的精確度),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 例: 設(shè)某檢索系統(tǒng)的數(shù)據(jù)庫(kù)中共有相關(guān)文獻(xiàn)20篇。針對(duì)某一個(gè)提問,檢出文獻(xiàn)總數(shù)為30篇,其中相關(guān)文獻(xiàn)數(shù)為15篇。求查全率R、查準(zhǔn)率P。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 為便于分析,我們給出數(shù)學(xué)語(yǔ)言描述:設(shè)某文獻(xiàn)庫(kù)所存儲(chǔ)的文獻(xiàn)總量為L(zhǎng)。對(duì)某一給定提問, a表示被檢出的與提問相關(guān)的文獻(xiàn)數(shù);(前例 a=15) b表示被檢出的與提問無關(guān)的文獻(xiàn)數(shù);(誤檢,前例 b=15) c表示與提問相關(guān),但未被檢出的文獻(xiàn)數(shù)(漏檢,前例 c=5),顯然,p,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 1查全率和查準(zhǔn)率 下面討論與查全率、查準(zhǔn)率有關(guān)的幾個(gè)問題。 ()查全率和查準(zhǔn)率的相互關(guān)系 一個(gè)理想的檢索系統(tǒng),應(yīng)是、。 但實(shí)際上是不可能的。 一般說來,二者之間存在著反變關(guān)系,即: 若要提高查全率,查準(zhǔn)率往往就會(huì)下降; 若要提高查準(zhǔn)率,查全率又就會(huì)下降。 (二者相互制約),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 ()查全率和查準(zhǔn)率的相互關(guān)系 與的關(guān)系可由下圖描述:(稱為圖),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 1查全率和查準(zhǔn)率 ()影響查全率、查準(zhǔn)率的相關(guān)因素 文獻(xiàn)庫(kù)編制質(zhì)量 文獻(xiàn)收集是否齊全,索引體系是否完善,檢索途徑的多少,都會(huì)影響到查全率。 對(duì)情報(bào)需求的理解 要達(dá)到較高的查全率和查準(zhǔn)率,應(yīng)較好地理解情報(bào)需求,制定好檢索策略。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 ()影響查全率、查準(zhǔn)率的相關(guān)因素 檢索語(yǔ)言的一致性 檢索的實(shí)質(zhì)就是提問標(biāo)識(shí)與文獻(xiàn)標(biāo)識(shí)的異同比較。 為此,需要不同人員表達(dá)文獻(xiàn)主題的語(yǔ)言一致,更需要標(biāo)識(shí)提問與標(biāo)識(shí)文獻(xiàn)的語(yǔ)言一致。即,標(biāo)引語(yǔ)言和檢索語(yǔ)言的一致性,對(duì)查全和查準(zhǔn)起著支配作用。 標(biāo)引的網(wǎng)羅性 對(duì)文獻(xiàn)主題分析得越透徹,抽出的檢索詞越多,檢索時(shí)可檢出的相關(guān)文獻(xiàn)就越多,即查全率越高。但檢出的文獻(xiàn)并非全部適用,因而查準(zhǔn)率降低。 反之,如果標(biāo)引時(shí)只標(biāo)出中心主題,檢出的文獻(xiàn)必然比較適用,即查準(zhǔn)率較高。但漏檢會(huì)增多,從而降低查全率。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 ()影響查全率、查準(zhǔn)率的相關(guān)因素 檢索詞的專指性 檢索詞選得詞意越狹窄、越具體、越專深,檢出的文獻(xiàn)就會(huì)越對(duì)口,查準(zhǔn)率就越高。但命中文獻(xiàn)就越少,查全率就會(huì)降低。 相反,如果檢索詞定得較籠統(tǒng)、較寬泛,檢出的文獻(xiàn)就會(huì)增多,查全率會(huì)提高。但不相關(guān)的文獻(xiàn)也會(huì)增多,查準(zhǔn)率會(huì)降低。 檢索策略和提問構(gòu)造 對(duì)檢索詞的選取,需恰當(dāng)?shù)卮_定網(wǎng)羅度和專指度。 當(dāng)采用布爾組配時(shí),若使用AND較多,即限制嚴(yán),則下降,而上升;反之,若使用OR較多,則上升,而下降。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 ()影響查全率、查準(zhǔn)率的相關(guān)因素 檢索軟件的功能 檢索軟件功能是否完善,結(jié)構(gòu)是否合理,影響到是否會(huì)漏檢和誤檢。 檢索者的熟練程度 檢索人員的專業(yè)知識(shí)水平、使用系統(tǒng)的熟練程度,對(duì)R和P影響很大。往往是系統(tǒng)一方的檢索者自擬定檢索式時(shí)查準(zhǔn)率高,而檢索用戶編制檢索式時(shí),因不熟悉系統(tǒng)和不善于使用系統(tǒng),就容易造成誤檢、漏檢。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 1查全率和查準(zhǔn)率 ()對(duì)查全率和查準(zhǔn)率的要求 作為一個(gè)檢索系統(tǒng),應(yīng)同時(shí)具備較強(qiáng)的查全能力和查準(zhǔn)能力。但并不是每個(gè)用戶在任何時(shí)候都需要高查全率和高查準(zhǔn)率,不同用戶有不同要求。 通常,根據(jù)不同的情報(bào)需求,可分為四種要求: a要求查全率= 如申請(qǐng)專利、發(fā)明或評(píng)定某項(xiàng)成果,需要對(duì)世界范圍的有關(guān)情報(bào)作全面了解,才能作出客觀的評(píng)價(jià)。此時(shí)往往要求=的檢索。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 ()對(duì)查全率和查準(zhǔn)率的要求 b要求較高查全率 例如編寫教材、綜述某學(xué)科或技術(shù)領(lǐng)域的發(fā)展,往往需要較全面地獲得有關(guān)文獻(xiàn)或情報(bào)。此時(shí)對(duì)查全率有較高要求,但不一定要求。 c要求較高查準(zhǔn)率 例如要了解某種具體產(chǎn)品的有關(guān)信息,解決某一具體問題或查新等,往往只需了解某一方面或某一時(shí)期的有關(guān)情報(bào)。此時(shí)要求查準(zhǔn)率較高。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 ()對(duì)查全率和查準(zhǔn)率的要求 d對(duì)查全率、查準(zhǔn)率無具體要求 有些情報(bào)需求,用戶本身不能作出確切表達(dá)。因此,用戶對(duì)查全率和查準(zhǔn)率也無法提出具體要求。 從上面的討論可以看出,在分析和評(píng)價(jià)某一檢索的檢索質(zhì)量時(shí),不能千篇一律地追求查全率和查準(zhǔn)率,而應(yīng)具體問題具體分析。,二、主要性能指標(biāo)及分析 2響應(yīng)時(shí)間(response time) 對(duì)任何計(jì)算機(jī)應(yīng)用系統(tǒng),響應(yīng)時(shí)間都是一個(gè)重要指標(biāo)。 信息檢索的響應(yīng)時(shí)間可分為兩種情形: (1)委托檢索,表示從用戶送交提問到收到檢索結(jié)果所花的時(shí)間; (2)非委托檢索,表示用戶實(shí)際的檢索時(shí)間。 計(jì)算響應(yīng)時(shí)間一般都是針對(duì)某一個(gè)提問而言,不同的提問對(duì)應(yīng)的響應(yīng)時(shí)間不同。(因提問式長(zhǎng)短、復(fù)雜程度而不同) 有時(shí)給出平均響應(yīng)時(shí)間T。ti表示對(duì)第i個(gè)提問的響應(yīng)時(shí)間,k為提問個(gè)數(shù),第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),問 題: 檢索響應(yīng)時(shí)間與哪些因素有關(guān)?,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 2響應(yīng)時(shí)間 通過對(duì)檢索響應(yīng)時(shí)間的分析,我們可歸納出影響該指標(biāo)的因素: (1)文獻(xiàn)庫(kù)規(guī)模 規(guī)模越大,檢索時(shí)間越長(zhǎng),響應(yīng)時(shí)間值也就越大。 (2)機(jī)器速度 主機(jī)運(yùn)行速度越快,響應(yīng)時(shí)間越短。 (3)檢索軟件 檢索軟件是關(guān)鍵,其性能越好,檢索時(shí)間就越短。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 2響應(yīng)時(shí)間 (4)存儲(chǔ)設(shè)備類型和數(shù)據(jù)的存貯結(jié)構(gòu) 存儲(chǔ)設(shè)備的訪問速度越快,數(shù)據(jù)的存貯結(jié)構(gòu)(外存貯)越合理,檢索越容易,響應(yīng)時(shí)間也就越短。 (5)提問組配形式 檢索式的構(gòu)造需要有一定的專業(yè)技能和檢索經(jīng)驗(yàn),是一個(gè)不斷修改和完善的過程。 (6)信息中心與檢索者的距離 通信傳輸時(shí)間與距離有關(guān)。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 存貯空間開銷 包括系統(tǒng)所占用的內(nèi)存空間和外存空間。 對(duì)內(nèi)存空間,當(dāng)檢索系統(tǒng)采用大、中型計(jì)算機(jī)時(shí),一般不必考慮;而當(dāng)系統(tǒng)采用小型、微型機(jī)時(shí),因內(nèi)存空間有限,就需合理分配。 對(duì)外存空間,不同的文檔結(jié)構(gòu)所需存儲(chǔ)空間差別很大。例如,順排文檔檢索和倒排文檔檢索所需空間不同;而對(duì)倒排檢索,系統(tǒng)僅提供布爾檢索功能與提供正文檢索功能相比,所需的空間也大不一樣。,第十一章 信息檢索系統(tǒng)評(píng)價(jià) 11.2 評(píng)價(jià)指標(biāo),二、主要性能指標(biāo)及分析 其它
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國(guó)乙烯-丙烯酸乙酯共聚物(EEA)行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025醫(yī)療服務(wù)合同有什么特征
- 2025委托經(jīng)營(yíng)管理合同(詳細(xì))
- 提高時(shí)間管理能力的訓(xùn)練
- 提高學(xué)習(xí)效果的方法和技巧
- 2025廣告場(chǎng)地租賃合同樣本版
- 演出合同范文集合
- 續(xù)簽借款簡(jiǎn)單的合同范本
- 建設(shè)工程廉政合同范本年
- 旅游資源開發(fā)合同2024
- 選擇性必修一 期末綜合測(cè)試(二)(解析版)2021-2022學(xué)年人教版(2019)高二數(shù)學(xué)選修一
- 學(xué)校制度改進(jìn)
- 各行業(yè)智能客服占比分析報(bào)告
- 年產(chǎn)30萬(wàn)噸高鈦渣生產(chǎn)線技改擴(kuò)建項(xiàng)目環(huán)評(píng)報(bào)告公示
- 民謠酒吧項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 2023年珠海市招考合同制職員筆試參考題庫(kù)(共500題)答案詳解版
- 心電監(jiān)護(hù)考核標(biāo)準(zhǔn)
- 特種行業(yè)許可證申請(qǐng)表
- 古典芭蕾:基本技巧和術(shù)語(yǔ)
- 內(nèi)地居民前往香港或者澳門定居申請(qǐng)表
- DB43-T 2612-2023林下竹蓀栽培技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論