




已閱讀5頁,還剩108頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博士研究生學(xué)位論文 題目: 基基于用戶反饋的個(gè)性化 檢索技術(shù)研究 姓 名: 學(xué) 號(hào): 院 系: 信息科學(xué)技術(shù)學(xué)院 專 業(yè): 計(jì)算機(jī)系統(tǒng)結(jié)構(gòu) 研究方向: 網(wǎng)絡(luò)與分布式系統(tǒng) 導(dǎo)師姓名: 李曉明教授 二零 年 五 月 in of ( i 2007 版權(quán)聲明 任何收存和保管本論文各種版本的單位和個(gè)人,未經(jīng)本論文作者同意,不得將本論文轉(zhuǎn)借他人,亦不得隨意復(fù)制、抄錄、拍照或以任何方式傳播。否則,引起有礙作者著作權(quán)之問題,將可能承擔(dān)法律責(zé)任。 i 摘 要 隨著互聯(lián)網(wǎng)的飛速發(fā)展,搜索引擎日漸成為人們必不可少的一項(xiàng)工具。然而一方面由于搜索引擎的用戶大多是普通用戶,很難將自己復(fù)雜的檢索目的組織成搜索引擎所需要的簡(jiǎn)單的查詢?cè)~表示;因此為用戶提供更多的交互式接口,提供啟發(fā)式檢索手段就顯得特別重要。另一方面在通用搜索引擎中,當(dāng)不同的用戶輸入同一個(gè)檢索詞時(shí),搜索引擎將 不做區(qū)分的返回同樣的檢索結(jié)果。然而實(shí)踐證明,用戶的檢索目的是多種多樣的。即使是同樣的檢索詞,不同用戶所期待的檢索結(jié)果也是各不相同的。此時(shí)需要一些更加貼近用戶的手段來改變這種檢索方式,使得用戶能夠得到真正自己關(guān)心的信息。這也就是“個(gè)性化檢索”所試圖解決的問題。 個(gè)性化檢索系統(tǒng)是指那些針對(duì)不同用戶背景返回不同檢索結(jié)果的信息檢索系統(tǒng)。在這些系統(tǒng)中,文檔的相關(guān)性是基于不同用戶的背景和興趣而單獨(dú)計(jì)算的。而用戶的興趣和背景通常是通過顯式或隱式的用戶反饋來獲得。通過對(duì)基于用戶反饋的個(gè)性化檢索技術(shù)的深入研究和探討,本文得到 了如下研究成果和結(jié)論: (1) 一種無須人工干預(yù)的、用于衡量搜索引擎排序結(jié)果質(zhì)量的方法和指標(biāo) of a 該指標(biāo)能夠用于衡量一個(gè)文檔排序結(jié)果的質(zhì)量;在實(shí)際的檢索過程中,該指標(biāo)不需人工干預(yù)即可計(jì)算得到,而以往的指標(biāo)都需要有人工標(biāo)注的結(jié)果集才可計(jì)算。實(shí)驗(yàn)結(jié)果表明了 標(biāo)與 成正比,也就是說 標(biāo)確實(shí)反映了一個(gè)排序結(jié)果的真實(shí)質(zhì)量。 (2) 一種基于 標(biāo)的個(gè)性化重排序算法。在有了 標(biāo)的基礎(chǔ)上,就可以通過當(dāng)前排序結(jié)果的質(zhì)量來衡量用戶不同反饋文檔的相關(guān)度高低,這正是 權(quán) 排序算法的思想。通過這種方法,相關(guān)度較高的反饋文檔將對(duì)重排序過程起著更重要的作用,從而有效的改進(jìn)了個(gè)性化排序的結(jié)果質(zhì)量。 (3) 一種 利用分類輔助的 摘要比較算法 摘要比較算法是個(gè)性化重排序算法過程中必 不可少的一個(gè)子模塊。 法的主要思想是 根據(jù) 搜索引擎返回 摘要的特點(diǎn),利用分類技術(shù)來擴(kuò)展短摘要的信息,以改進(jìn)摘要比較算法。 該方法有效的克服了摘要文本短,內(nèi)容少,無法直接比較的特點(diǎn);從而改進(jìn)了摘要比較的結(jié)果,進(jìn)而提高了排序算法的質(zhì)量。最終的 實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性。 (4) 一種無損的基于聚類的層次 類算法。 法是一種經(jīng)典的分類算法,然而其在處理大規(guī)模訓(xùn)練文檔時(shí)效率上存在缺陷。本文利用層次聚類算法對(duì)訓(xùn)練文檔進(jìn)行有效的組織,實(shí)現(xiàn)了在提高分類效率的同時(shí),分類質(zhì)量不下降。 (5) 在深入研究并探討了訓(xùn)練數(shù)據(jù)集對(duì)分類結(jié)果的影響之后,本文提出了一種穩(wěn)定的分類評(píng)測(cè)指標(biāo) 評(píng)測(cè)指標(biāo)具有如下優(yōu)點(diǎn):( a) 在不同的訓(xùn)練數(shù)據(jù)集上, 1 表現(xiàn)較穩(wěn)定;( b) 使用新的評(píng)測(cè)指標(biāo),不同的研究工作在不同訓(xùn)練數(shù)據(jù)集上的性能可以直接 進(jìn)行比較;( c) 在給定一個(gè)分類器在某個(gè)訓(xùn)練數(shù)據(jù)集上的 1 值時(shí),可以推導(dǎo)得到該分類器在另一個(gè)訓(xùn)練數(shù)據(jù)集上的分類結(jié)果(即真實(shí)的分類精度、召回率以及 )。 (6) 一 個(gè) 個(gè) 性 化 檢 索 系 統(tǒng) 原 型 。它是一種基于顯式用戶反饋的個(gè)性化檢索系統(tǒng),該系統(tǒng)通過一個(gè)客戶端來完成用戶信息的搜集以及檢索結(jié)果的重排序工作。用這種方式可以對(duì)不同的用戶產(chǎn)生不同的排序效果,滿足用戶不同的檢索目的,從而達(dá)到個(gè)性化檢索的目的。 關(guān)鍵詞 :搜索引擎,信息檢索,個(gè)性化, 相關(guān)反饋,分類 do a in to s a do do a in It is an to by of as In is to by 1) A of a is to of a R be of a R is in to CG R be to of a 2) of is to of is In an in of is of is 3) An to A is a in as is to of by CG of 4) An is in a to a of do in to to of 0 as NN ) A of is to of of on on of an on as on be of 6) A is to v of in is a to 目 錄 第 1 章 引言 . 1 究工作的背景和意義 . 1 戶反饋技術(shù)的 線裝概述 . 2 何獲得用戶反饋信息 . 4 何使用用戶反饋信息 . 9 何評(píng)價(jià)反饋技術(shù) . 14 文的主要工作 . 18 文的主要研究?jī)?nèi)容 . 18 文的創(chuàng)新之處 . 20 文的組織結(jié)構(gòu) . 21 第 2 章 對(duì)重排序算法的研究 . 22 紹 . 22 關(guān)工作 . 24 一個(gè)排序結(jié)果質(zhì)量的評(píng)估 . 25 量一個(gè)排序質(zhì)量的現(xiàn)有指標(biāo) . 25 個(gè)特征以及 標(biāo) . 26 于新指標(biāo) 實(shí)驗(yàn) . 30 用 標(biāo)改進(jìn)的重排序算法及實(shí)驗(yàn)結(jié)果 . 34 章小結(jié) . 36 第 3 章 利用分類改進(jìn)的摘要比較算法 . 37 言 . 37 用分類技術(shù)改進(jìn)的摘要比較算法 . 37 言 . 37 關(guān)工作 . 39 要比較算法 . 40 驗(yàn)設(shè)置和實(shí)驗(yàn)結(jié)果 . 44 結(jié) . 47 分類算法效率的改進(jìn) . 47 言 . 47 關(guān)工作 . 49 于聚類的無損層次 類算法 . 49 驗(yàn)結(jié)果和算法分析 . 53 結(jié) . 55 章小結(jié) . 55 第 4 章 對(duì)中文分類評(píng)測(cè)方法的研究 . 57 言 . 57 關(guān)研究 . 59 個(gè)因素 . 60 素 1 訓(xùn)練集中的文檔比例 . 60 素 2:類半徑 . 62 素 3:類間距 . 64 評(píng)測(cè)指標(biāo)以及實(shí)驗(yàn) . 66 評(píng)測(cè)指標(biāo) . 66 驗(yàn) 1:同一個(gè)分類器在不同數(shù)據(jù)集上的表現(xiàn) . 67 驗(yàn) 2:12 個(gè)不同分類器在 2 個(gè)不同數(shù)據(jù)集上的表現(xiàn) . 68 評(píng)測(cè)指標(biāo)的優(yōu)點(diǎn) . 69 章小結(jié) . 70 第 5 章 一個(gè)應(yīng)用實(shí)例及應(yīng)用前景 . 72 性化檢索技術(shù)應(yīng)用現(xiàn)狀 . 72 個(gè)應(yīng)用實(shí)例 . 74 他應(yīng)用場(chǎng)景及實(shí)例 . 76 戶端 服務(wù)器 . 76 反饋 顯式用戶反饋 . 77 用搜索引擎 個(gè)性化搜索引擎 . 78 關(guān)工作及系統(tǒng) . 78 章小結(jié) . 79 第 6 章 總結(jié)和展望 . 81 文的總結(jié) . 81 一步的研究工作 . 83 參考文獻(xiàn) . 85 博士期間錄用和提交的論文 . 93 博士期間的主要科研項(xiàng)目與所獲獎(jiǎng)勵(lì) . 94 致謝 . 96 圖示 圖 1擬評(píng)測(cè) . 18 圖 2果序列的特征 . 29 圖 2詢樣例 . 31 圖 2計(jì)相關(guān)文檔個(gè)數(shù) . 32 圖 2征 2:半徑 . 33 圖 2征 3:可能的相關(guān)文檔比例 . 33 圖 2R 指標(biāo)與 的關(guān)系 . 34 圖 2排序算法 流程 . 34 圖 2. 36 圖 3要實(shí)例 A . 39 圖 3要實(shí)例 B . 39 圖 3要實(shí)例 C . 39 圖 3網(wǎng)搜索引擎返回摘要 . 41 圖 3文網(wǎng)頁分類器的工作流程 . 43 圖 3要比較算法 . 46 圖 3 關(guān)系圖 . 47 圖 3個(gè)反例 . 50 圖 3定規(guī)則說明 . 51 圖 3例:二維空間 . 54 圖 42 個(gè)不同分類器在 2 個(gè)不同數(shù)據(jù)集上的宏平均精度 . 59 圖 4檔比例對(duì)分類結(jié)果的影響 . 62 圖 4素 2:類半徑的含義 . 63 圖 4半徑對(duì)分類結(jié)果的影響 . 64 圖 4素 3:類間距的含義 . 65 圖 4間距對(duì)分類結(jié)果的影響 . 65 圖 . 68 圖 5性化檢索系統(tǒng) . 73 圖 5于用戶反饋的個(gè)性化檢索原型 . 75 x 圖 5使用過程 . 76 圖 5統(tǒng)說明 . 78 表格 表 1種用戶行為的分類 . 6 表 3本集中類別及實(shí)例數(shù)量的分布情況 . 42 表 3文網(wǎng)頁分類器 . 43 表 3詢集合說明 . 45 表 3次 法效 率 . 54 表 3法效率 . 54 表 4息檢索系統(tǒng)的評(píng)價(jià)標(biāo)準(zhǔn) . 57 表 . 67 表 4據(jù)集 . 68 表 4據(jù)集 . 69 表 42 個(gè)不同的分類器在 2 個(gè)數(shù)據(jù)集 上性能評(píng)價(jià) . 69 表 5性化檢索系統(tǒng)的劃分 . 73 第 1 章 引言 1 第 1章 引言 究工作的背景和意義 隨著 模的迅速增長(zhǎng)和內(nèi)容的不斷豐富,用戶越發(fā)的需要搜索引擎這一信息服務(wù)形式以幫助 用戶 快速、準(zhǔn)確的在信息的海洋中找到自己需要的內(nèi)容。 一個(gè)典型的使用場(chǎng)景是:用戶將自己的檢索目的組織成若干個(gè)查詢?cè)~作為輸入送給搜索引擎;搜索引擎根據(jù)查詢?cè)~ 進(jìn)行檢索,將檢索結(jié)果返回給用戶;用戶瀏覽這些結(jié)果并點(diǎn)擊查看自己想要的結(jié)果頁面。然而一個(gè)突出的問題是:一個(gè)查詢結(jié)果集中往往包含了成千上萬參差不齊、內(nèi)容各異的結(jié)果。這些結(jié)果有些是符合用戶檢索目的的,但是大部分都是不相關(guān)文檔,也就是說查詢結(jié)果集的精度低。從 年的評(píng)測(cè)結(jié)果中也說明了通用搜索引擎的這一問題,而“查詢?cè)~的內(nèi)容含糊”是導(dǎo)致這種情況的主要原因之一。 由于檢索目的不明確或是對(duì)檢索環(huán)境的不熟悉 et 1998等因素,許多事實(shí)表明用戶無法將自己的檢索意圖組織成高質(zhì)量的查詢?cè)~。 經(jīng)驗(yàn)豐富的用戶,能夠構(gòu)造出“好”的查詢?cè)~;所謂“好”的查詢?cè)~是指查詢中包含大量區(qū)分度高的詞(即在少量文檔中大量出現(xiàn)的詞)。但是大多數(shù)用戶并不能清楚的描述他的需求,最終得到的檢索結(jié)果也往往難以令人滿意。 因此搜索引擎需要一些額外的技術(shù)來輔助挖掘用戶的查詢意圖,改進(jìn)檢索結(jié)果。 另一方面,在通用搜索引擎中,當(dāng)不同的用戶輸入同一個(gè)檢索詞時(shí),搜索引擎將不做區(qū)分的返回同樣的檢索結(jié)果。然而實(shí)踐證明,用戶的檢索目的是多種多樣的。即使是同樣的檢索詞,不同用戶所期 待的檢索結(jié)果也是各不相同的。此時(shí)需要一些更加貼近用戶的手段來改變這種檢索方式,使得用戶能夠得到真正自己關(guān)心的信息。這也就是“個(gè)性化檢索”所試圖解決的問題。 相關(guān)反饋技術(shù)( 在個(gè)性化檢索方面最重要的方法之一( 傳統(tǒng)的相關(guān)反饋技術(shù)主要是用于查詢擴(kuò)展,然而近些年相關(guān)反饋技術(shù)已經(jīng)廣泛的應(yīng)用在了各種個(gè)性化檢索系統(tǒng)中。這一點(diǎn)將會(huì)在后面的章節(jié)中說明) 。經(jīng)典的信息檢索模型通常由 4個(gè)要素組成 ),(,ji 中: ( 1) D 是對(duì)一個(gè)大文檔集合的邏輯表示; ( 2) Q 是對(duì)用戶信息需求的邏輯表示; ( 3) 第 1 章 引言 2 ( 4) R(qi,一個(gè)排序算法。對(duì)任意一個(gè)用戶信息需求 (即用戶檢索詞),該算法計(jì)算得到每個(gè)文檔 的相關(guān)度權(quán)值 983。 而相關(guān)反饋技術(shù)最主要的作用是提供一個(gè)新的排序算法 ),(,在增加了一個(gè)已知條件 用戶的反饋信息集合)的情況下,重新計(jì)算對(duì)于查詢 ,文檔 相關(guān)度權(quán)值;從而改變?cè)瓉淼呐判蚪Y(jié)果,進(jìn)而改進(jìn)檢索質(zhì)量。需要注意的是,對(duì)于d , (即 在一個(gè)相關(guān)反饋系統(tǒng)中,實(shí)際的操作流程如下: 用戶對(duì)檢索出的文檔顯式或隱式的進(jìn)行相關(guān)性判定,系統(tǒng)根據(jù)這些判定生成新的查詢,對(duì)檢索結(jié)果進(jìn)行重排序。這一過程可以不斷的迭代進(jìn)行,直到用戶找到滿意的相關(guān)文檔集合。許多實(shí)驗(yàn)結(jié)果都證明了這一方法能夠有效的改進(jìn)查詢結(jié)果的質(zhì)量,這種改進(jìn)主要得益于查詢擴(kuò)展以及對(duì)查詢?cè)~權(quán)重的重新計(jì)算。 根據(jù)所記錄的用戶反饋歷史長(zhǎng)短,相關(guān)反饋技術(shù)可以分為長(zhǎng)期及短期兩種:長(zhǎng)期( 關(guān)反饋即長(zhǎng)期記錄用戶 的行為,建立并維護(hù)用戶模型( 根據(jù)用戶模型對(duì)用戶的行為進(jìn)行預(yù)測(cè);短期( 關(guān)反饋只處理一個(gè)會(huì)話( 的用戶行為(通常指一次信息檢索查詢中對(duì)查詢結(jié)果集的優(yōu)化),因此也就不涉及用戶長(zhǎng)期歷史以及用戶模型的變遷維護(hù)。本文中主要討論的是短期用戶反饋所使用的各種相關(guān)技術(shù)。 相關(guān)反饋相對(duì)于其他查詢處理方法而言,具有如下優(yōu)點(diǎn): ( 1)用戶只需對(duì)文檔做出相關(guān)性判斷,而不需要了解查詢處理的技術(shù)細(xì)節(jié); ( 2)用戶反饋技術(shù)將整個(gè)檢索過程分割成 3 個(gè)用戶容易理解的部分:提交查詢,進(jìn) 行相關(guān)性判斷,對(duì)查詢結(jié)果的重排序; ( 3)它提供了一種可控制的方法來突出某些查詢?cè)~或是削弱某些查詢?cè)~。 由此可見,相關(guān)反饋技術(shù)是理解用戶檢索意圖、實(shí)現(xiàn)個(gè)性化排序、改進(jìn)搜索引擎排序結(jié)果,提高用戶對(duì)搜索引擎結(jié)果滿意度的重要工具。因此本文將對(duì)基于用戶反饋的個(gè)性化檢索技術(shù) 這一具有重要理論意義和廣闊應(yīng)用前景的課題進(jìn)行研究和探索。 戶反饋技術(shù)的現(xiàn)狀概述 第 1 章 引言 3 傳統(tǒng)的用戶相關(guān)反饋技術(shù)主要包括 2 個(gè)方面的研究?jī)?nèi)容:查詢擴(kuò)展( 及權(quán)值調(diào)整( 隨著技術(shù)的進(jìn)步,相關(guān) 反饋的研究?jī)?nèi)容逐漸發(fā)生了變化。目前的相關(guān)反饋技術(shù)主要可以劃分為以下 3 個(gè)方面的研究工作:如何獲得用戶反饋信息(即上文所提到的 ;如何使用用戶反饋信息來改進(jìn)檢索系統(tǒng)的質(zhì)量(即如何構(gòu)造新的排序算法),( ) ;如何評(píng)價(jià)用戶反饋技術(shù)。 如何獲得用戶反饋信息?在傳統(tǒng)相關(guān)反饋技術(shù)中,主要是通過用戶顯式的對(duì)文檔進(jìn)行相關(guān)性標(biāo)記來獲得。要求用戶顯式的相關(guān)反饋會(huì)導(dǎo)致用戶不堪負(fù)荷,這也是傳統(tǒng)的相關(guān)反饋技術(shù)不能廣泛應(yīng)用的最大限制。目前,有許多新的反饋 獲得方法,隱反饋( 偽反饋( 其中最突出的兩種技術(shù)。隱反饋技術(shù)是指從用戶的行為(例如點(diǎn)擊、瀏覽、打印 .1997; Le et 2001; 004中,通過種種數(shù)據(jù)挖掘技術(shù)來發(fā)現(xiàn)用戶隱含的興趣及愛好,并將這些隱含的信息作為反饋信息來輔助檢索。偽反饋技術(shù) et 2005是指將檢索結(jié)果中的若干個(gè)文檔假設(shè)為“相關(guān)文檔”作為反饋信息來輔助檢索。 如何使用用戶反饋信息來改進(jìn)檢索系統(tǒng)的質(zhì)量?根據(jù)所使用的信息檢索模型的不同,可以將對(duì)這一問題的研究分成三個(gè)方向。這三個(gè)信息檢索模型為:向量空間模型、概率模型和語言模型。不論使 用哪一種信息檢索模型,其中心思想都是盡可能的將查詢貼近用戶的檢索興趣即用戶的反饋信息。 如何評(píng)價(jià)用戶反饋技術(shù)?這里涉及到評(píng)價(jià)所使用的數(shù)據(jù)集、評(píng)價(jià)指標(biāo)、評(píng)測(cè)方式以及評(píng)測(cè)環(huán)境的構(gòu)建。不同的評(píng)測(cè)環(huán)境會(huì)帶來不同的評(píng)測(cè)結(jié)果。 本小節(jié)的主要貢獻(xiàn)是對(duì)相關(guān)反饋領(lǐng)域當(dāng)前的研究進(jìn)展,做了全面的介紹;同時(shí)將用戶反饋問題劃分成 3 個(gè)基本的技術(shù)問題(如何獲得反饋信息、如何使用反饋信息以及如何評(píng)價(jià)反饋技術(shù));并對(duì)目前這 3 個(gè)基本問題的常用解決方法以及研究進(jìn)展進(jìn)行了介紹。以前也曾經(jīng)有過一些綜述性的工作,例如 003; 003; 004。但是其中 004只是對(duì)相關(guān)反饋技術(shù)做了很簡(jiǎn)略的說明; 003的工作完成的比較早,遺漏了一些重要的部分(比如隱反饋以及語言模型),而這兩個(gè)部分都是目前研究工作較集中的方面。文獻(xiàn) 003只是對(duì)隱反饋中的主要文章做了說明,主要內(nèi)容是側(cè)重于介紹如何取得反饋,關(guān)于第 1 章 引言 4 性能評(píng)價(jià)以及如何使用反饋信息以改進(jìn)檢索系統(tǒng)的質(zhì)量并沒有做出很好的說明。 本文的以下部分是這樣組織的:第 說明了如何獲得用戶反饋信息,介紹了當(dāng)前主要的 3 種用戶反饋信息取得手段以及對(duì)應(yīng)的典型系統(tǒng)及優(yōu)缺點(diǎn)。第 說明了如何使用用戶反饋信息來改進(jìn)檢索系統(tǒng)的排序質(zhì)量,同時(shí)介紹了在 3 種模型下各 種不同的反饋算法。第 說明了如何評(píng)價(jià)用戶反饋技術(shù)。 何獲得用戶反饋信息 獲得用戶反饋信息主要有 3 種手段:顯式用戶反饋( 隱式用戶反饋( 及偽反饋( 顯式用戶反饋是一種經(jīng)典的方法;許多研究人員還在考慮如何從用戶的交互行為中隱式的發(fā)現(xiàn)信息作為用戶反饋,也就是隱反饋;偽反饋的思想是從返回結(jié)果中選擇一些文檔作為用戶反饋。 顯式用戶反饋 早期的用戶反饋技術(shù)主要是用于文本信息檢索領(lǐng)域,當(dāng)時(shí)主要是采用顯式用戶反饋來獲取用戶的反饋信息。 統(tǒng) 990就是顯式用戶反饋方面的一個(gè)經(jīng)典系統(tǒng)。該系統(tǒng)要求用戶對(duì)檢索結(jié)果顯式的做出標(biāo)記行為,給出反饋信息。例如指定關(guān)鍵詞、對(duì)文檔進(jìn)行選擇或是標(biāo)注、給出自己的興趣范圍等等,這些方式都稱為顯式用戶反饋。這種方式有一個(gè)前提是:用戶在檢索期間是有一個(gè)明確的檢索目的,而這一目的不會(huì)變更。當(dāng)把所有檢索結(jié)果文檔呈現(xiàn)在用戶面前時(shí),用戶能夠從中挑選出符合自己檢索意圖的相關(guān)文檔或是不相關(guān)文檔做出標(biāo)記。這一過程是可以迭代進(jìn)行的:用戶給出一次顯式反饋,檢索系統(tǒng)根據(jù)用戶標(biāo)記的反饋文檔,使用反饋算法來改進(jìn)檢索結(jié)果的質(zhì)量;在新的 結(jié)果集上,用戶還可以繼續(xù)給出反饋。這一過程可以不斷進(jìn)行直到用戶滿意為止。 如何顯式的獲得用戶反饋信息,通常的做法是把檢索結(jié)果按照其與查詢?cè)~之間的相關(guān)度大小排序之后返回給用戶,以供用戶瀏覽;并在界面上提供接口,允許用戶在瀏覽時(shí),對(duì)其中的某些文檔進(jìn)行標(biāo)注,例如標(biāo)注為“相關(guān)文檔”或是“不相關(guān)文檔”。如何提供更方便實(shí)用的接口來顯式的與用戶進(jìn)行互動(dòng),這一問題更多的是依賴于人機(jī)交互領(lǐng)域的技術(shù),在本文中將第 1 章 引言 5 不詳細(xì)進(jìn)行討論。 在顯式獲得用戶反饋技術(shù)方面,有 2 個(gè)值得說明的問題:一是主動(dòng)學(xué)習(xí)( 在顯式用戶反饋中的研究;二是關(guān)于負(fù)反饋信息的處理。 主動(dòng)反饋“ et 2000; 001; 003; 005是指在用戶對(duì)檢索結(jié)果進(jìn)行反饋之前,先對(duì)結(jié)果集進(jìn)行一些預(yù)處理,并選擇其中的部分文檔集展示給用戶。主動(dòng)反饋的目的是保證所得到的反饋文檔能帶來最大的信息增益,加快反饋迭代過程,從而盡可能快的達(dá)到用戶的檢索目標(biāo)。 主動(dòng)反饋的算法有很多,列舉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 風(fēng)險(xiǎn)控制融資協(xié)議書(2篇)
- 電網(wǎng)事故分級(jí)、案例及處置
- 生物制品行業(yè)
- 2025年會(huì)計(jì)職稱考試《初級(jí)會(huì)計(jì)實(shí)務(wù)》錯(cuò)題復(fù)盤強(qiáng)化沖刺解析
- 2025年初中地理環(huán)境與可持續(xù)發(fā)展模擬試題及答案精講卷
- 高壓電工考試題庫(kù)2025:高壓電氣事故預(yù)防措施與應(yīng)急處理演練評(píng)估試題
- 2025年注冊(cè)會(huì)計(jì)師考試《會(huì)計(jì)》合并財(cái)務(wù)報(bào)表難點(diǎn)解析與解析試卷
- 2025年美發(fā)師創(chuàng)意造型考核試卷:美發(fā)師創(chuàng)業(yè)指導(dǎo)與案例分析試題
- 2025年法語DELFB2水平測(cè)試卷(基礎(chǔ)與提高)
- 2025年調(diào)酒師職業(yè)技能大賽創(chuàng)新飲品設(shè)計(jì)試題試卷
- 復(fù)數(shù)算符在圖像處理中的應(yīng)用
- 百融云創(chuàng)風(fēng)險(xiǎn)決策引擎V5產(chǎn)品操作手冊(cè)
- GB 15979-2024一次性使用衛(wèi)生用品衛(wèi)生要求
- 2024年合肥市軌道交通集團(tuán)有限公司招聘筆試沖刺題(帶答案解析)
- CJJT8-2011 城市測(cè)量規(guī)范
- 故事繪本后羿射日
- 產(chǎn)前篩查標(biāo)準(zhǔn)技術(shù)操作規(guī)程
- ISO27001:2022信息安全管理手冊(cè)+全套程序文件+表單
- 國(guó)測(cè)省測(cè)四年級(jí)勞動(dòng)質(zhì)量檢測(cè)試卷
- SAT真題 2023年6月 亞太卷
評(píng)論
0/150
提交評(píng)論