04Mahout算法庫算法模塊2_第1頁
04Mahout算法庫算法模塊2_第2頁
04Mahout算法庫算法模塊2_第3頁
04Mahout算法庫算法模塊2_第4頁
04Mahout算法庫算法模塊2_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Mahout算法庫算法模塊22學習任務Mahout算法庫協(xié)同過濾算法頻繁項集挖掘算法3Mahout算法庫Mahout自從2008年興起以來,發(fā)展迅速,從最開始的只有推薦系統(tǒng)到現(xiàn)在的多個算法模塊,涵蓋了很多行業(yè)。這些模塊有聚類算法、分類算法、協(xié)同過濾算法和頻繁項集挖掘算法,每個模塊都含有一個或者幾個不同的實現(xiàn)算法,下面分別進行介紹。4Mahout算法3–協(xié)同過濾算法協(xié)同過濾算法也可以稱為推薦算法。在Mahout算法庫中,主要包括:

Distributed

Item-Based

Collaborative

Filtering,

Collaborative

Filtering

using

a

parallel

matrix

factorization,

下面進行簡要分析

5Mahout算法3–協(xié)同過濾算法(1)Distributed

item-based

Collaborative

FilteringDistributedItem-BasedCollaborativeFiltering是基于項目的協(xié)同過濾算法,其簡單思想就是利用項目之間的相似度來為用戶進行項目推薦。項目之間的相似度通過不同用戶對該項目的評分來求出,每個項目都有一個用戶向量,兩個項目之向的相似度便是根據這個用戶向量求得的。求得項目之間的相似度,便可以針對用戶對項目的評分清單來推薦與清單中極為相似的項目。

6Mahout算法3–協(xié)同過濾算法(2)CollaborativeFilteringusingaparallelmatrixfactorizationCollaborativeFilteringusingaparallelmatrixfactorization在Mahout的介紹中是以CollaborativeFilteringwithALS-WR的名稱出現(xiàn)的。該算法最核心的思想就是把所有的用戶以及項目想象成一個二維表格,該表格中有數(shù)據的單元格(i,j),便是第i個用戶對第j個項目的評分,然后利用該算法使用表格中有數(shù)據的單元格來預測為空的單元格。預測得到的數(shù)據即為用戶對項目的評分,然后按照預測的項目評分從高到低排序,便可以進行推薦了。

7Mahout算法4–頻繁項集挖掘算法在Mahout算法庫中,頻繁項集挖掘算法主要是指FP樹關聯(lián)規(guī)則算法。傳統(tǒng)關聯(lián)規(guī)則算法是根據數(shù)據集建立FP樹,然后對FP樹進行挖掘,得到數(shù)據庫的頻繁項集。在Mahout中實現(xiàn)并行FP樹關聯(lián)規(guī)則算法的主要思路是按照一定的規(guī)則把數(shù)據集分開,然后在每個分開的部分數(shù)據集建立FP樹,然后再對FP樹進行挖掘,得到頻繁項集。這里使用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論