![推薦系統(tǒng)案例-第二天3mllib與_第1頁](http://file4.renrendoc.com/view/8d152cc622ae34533da0810efaff0a5e/8d152cc622ae34533da0810efaff0a5e1.gif)
![推薦系統(tǒng)案例-第二天3mllib與_第2頁](http://file4.renrendoc.com/view/8d152cc622ae34533da0810efaff0a5e/8d152cc622ae34533da0810efaff0a5e2.gif)
![推薦系統(tǒng)案例-第二天3mllib與_第3頁](http://file4.renrendoc.com/view/8d152cc622ae34533da0810efaff0a5e/8d152cc622ae34533da0810efaff0a5e3.gif)
![推薦系統(tǒng)案例-第二天3mllib與_第4頁](http://file4.renrendoc.com/view/8d152cc622ae34533da0810efaff0a5e/8d152cc622ae34533da0810efaff0a5e4.gif)
![推薦系統(tǒng)案例-第二天3mllib與_第5頁](http://file4.renrendoc.com/view/8d152cc622ae34533da0810efaff0a5e/8d152cc622ae34533da0810efaff0a5e5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
MLlib與MLlib與推薦系主要內1SparkMLlib1SparkMLlib2MLlib推薦算法3MLlib推薦算法4總主要內1SparkMLLib1SparkMLLib2MLlib推薦算法3MLlib推薦算法4總SparkSparkMLlibMLLib是基于Spark引擎實現(xiàn)的機器學良好的擴展性和容充分利用了Spark擴展性屬于Spark生態(tài)系統(tǒng)重要組成實現(xiàn)了大部分常用的數(shù)據(jù)挖聚類分類推薦
MLlib分類算(summarystatisticsstratifiedsamplingrandomdatagenerationClassificationandregression分類一般針對離散型數(shù)linearmodels(SVMs,logisticregressionlinearregressionnaive decisiontreesensemblesoftrees(RandomForestsandGradient-BoostedTreesMLlib分類算 alternatingleastsquaresALS)交替最小二乘法(ALS singular position 奇異值分principal ysis(PCA)主成分分stochasticgradientdescent隨機梯度下limited-memoryBFGS(L-BFGS)短時 的BFGS(擬 DeveloperApi在未來的發(fā)布種可能會被修改主要內1SparkMLlib1SparkMLlib2MLlib推薦算法3MLlib推薦算法4總MLlib協(xié)同過濾算MLlibMLlib基于ALS(alternatingleastsquares)的協(xié)同numBlocks:計算并行度(若為-1表示自動化配置Rank:模型中隱含影響因子,默認是Iterations:迭代次數(shù),默認是Lambda:ALS中正則化參implicitPrefs:是否使用顯式反饋變量或使用隱式反饋數(shù)據(jù)的變Alpha:ALS中的一個參數(shù),作用于隱式反饋變量,控制基本的信心主要內1SparkMLlib1SparkMLlib2MLlib推薦算法3MLlib推薦算法4總MLlibMLlibALS加載數(shù)據(jù)將數(shù)據(jù)集解析成ALS要求的格將數(shù)據(jù)集分割成兩部分:訓練集和測試運行ALS,產(chǎn)生并評估模將最終模型用于推MLlibMLlibALS推薦步驟1valvalconf=newvalsc=newvalvalmovieLensHomeDir=valdataSet=sc.textFile(newFile(movieLensHomeDir,MLlibMLlibALS推薦步驟2valvalrating=dataSet.map{linevalfields=//format:(timestamp%10,Rating(userId,movieId,}MLlibMLlibALS推薦步驟3valnumPartitions=valtraining=ratings.filter(x=>x._1<valvalidation=ratings.filter(x=>x._1>=6&&x._1<valtest=ratings.filter(x=>x._1>=valnumTraining=training.count()valnumTest=test.count()MLlibALSMLlibALS推薦步驟4:運行defdeftrain(ratings:RDD[Rating],rank:Int,iterations:Int,lambda::MatrixFactorizationModel=你的代}MLlibALSMLlibALS推薦步驟4(2):運行ranks=List(8,vallambdas=List(1.0,valnumIters=List(10,varbestModel:Option[MatrixFactorizationModel]=NonevarbestValidationRmse=Double.MaxValuevarbestRank=varbestLambda=-1.0varbestNumIter=-1//findbestmodelherevaltestRmse=computeRmse(bestModel.get,test,println("Thebestmodelwastrainedwithrank="+bestRank+"andlambda="++",andnumIter="+bestNumIter+",anditsRMSEonthetestsetis"+testRmse+MLlibALS推薦步驟4(2):運行for(rank<-ranks;lambda<-lambdas;numIter<-numIters)valmodel=ALS.train(training,rank,numIter,valvalidationRmse=computeRmse(model,validation,numValidation)println("RMSE(validation)="+validationRmse+"forthemodeltrainedwithrank=+rank+",lambda="+lambda+",andnumIter="+numIter+".")if(validationRmse<bestValidationRmse){bestModel=Some(model)bestRank=rankbestLambda=bestNumIter=}}MLlibALS推薦步驟MLlibALS推薦步驟5:使用模 //...你的代}valcandida
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度辦公室翻新與餐飲店改造設計施工合同
- 二零二五年度城市公共安全報警系統(tǒng)電路升級改造合同
- 提取公積金借款合同
- 銷售抵押合同
- 電商零售平臺開發(fā)合同
- 個人理財指南
- 農產(chǎn)品公共檢測與溯源體系建設作業(yè)指導書
- 質量管理工具與方法應用作業(yè)指導書
- 平面設計聘用合同
- 2025年廣西貨運考試題目
- 長江委水文局2025年校園招聘17人歷年高頻重點提升(共500題)附帶答案詳解
- 2025年湖南韶山干部學院公開招聘15人歷年高頻重點提升(共500題)附帶答案詳解
- 廣東省廣州市番禺區(qū)2023-2024學年七年級上學期期末數(shù)學試題
- 不可切除肺癌放療聯(lián)合免疫治療專家共識(2024年版)j解讀
- DB23/T 3657-2023醫(yī)養(yǎng)結合機構服務質量評價規(guī)范
- 教科版科學六年級下冊14《設計塔臺模型》課件
- 智研咨詢發(fā)布:2024年中國MVR蒸汽機械行業(yè)市場全景調查及投資前景預測報告
- 法規(guī)解讀丨2024新版《突發(fā)事件應對法》及其應用案例
- IF鋼物理冶金原理與關鍵工藝技術1
- JGJ46-2024 建筑與市政工程施工現(xiàn)場臨時用電安全技術標準
- 煙花爆竹重大危險源辨識AQ 4131-2023知識培訓
評論
0/150
提交評論