基于用戶聚類的推薦系統(tǒng)_第1頁
基于用戶聚類的推薦系統(tǒng)_第2頁
基于用戶聚類的推薦系統(tǒng)_第3頁
基于用戶聚類的推薦系統(tǒng)_第4頁
基于用戶聚類的推薦系統(tǒng)_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、2.1數(shù)據(jù)預處理2.2對用戶聚類用戶聚類的目的是將目標用戶與其所在的類簇與整個用戶集分離開來,緩解用戶集過大帶來的可擴展性差和實現(xiàn)性能弱的問題。本文選取了K-means對用戶集聚類。算法產生聚類簇過程:在所有用戶中隨機挑選K個用戶作為初始聚類中心點;repeat;計算剩余的其他用戶與各個聚類中心的相似度,并根據(jù)相似度將相應用戶分配到對應的類簇;計算上一步新生成的類簇的中心點;when各個類簇的中心點不再產生變化end。最近鄰居集的生成鄰居集是要向目標用戶產生推薦的用戶集合,是一個與目標用戶興趣最相近的用戶集合。鄰居集產生步驟:在聚類簇中找到目標用戶所在的類簇;計算該類簇中其它用戶與目標用戶相似

2、度最高的K個用戶;將這K個用戶歸類為目標用戶的最近鄰居集。Top-N推薦在最近鄰居集中進行目標用戶評分的預測,計算出目標用戶所有未評分項目的預測評分,將這些項目按照預測評分從大到小排序,選取其中最大的N個項目推薦給目標用戶。預測評分算法過程:%表示目標用戶對未評分項目.的預測評分,M表示目標用戶的最近鄰,咯表示目標用戶的平均評分,召表示用戶叫的平均評分2.4.1準確率平均絕對誤差(MAE)是用來評價推薦系統(tǒng)準確率的一個重要指標。MAE是用來衡量預測評分值與用戶對該項目的實際評分值之間的平均偏差。其計算公式如下:真屮二表示用丿對項訂i的預測評分,g發(fā)示用戶対貞H;的實稱評分、N麥示參與測試的用廣對項口的淫分個數(shù).改進的相似度計算在網站發(fā)布之初,評分矩陣稀疏性必定很大,本系統(tǒng)采用了章中針對協(xié)同過濾算法的稀疏性問題的解決辦法,通過改進的相似度計算公式離線計算所有項目間的相似度,兩個項目和之間的相似度是這樣計算的:s/(G力)=嘰杭/加(G方)只.加叫斶實驗結果:1250.95ID2D304Q50$070B0棗舉棒龜目圖5-3不同聚類數(shù)目在UTCF算法匕的稱度比較-基于用戶聚類的協(xié)同推薦算法研究

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論