![面向個性化推薦系統(tǒng)的自適應(yīng)算法的研究與實現(xiàn)-計算機應(yīng)用技術(shù)專業(yè)畢業(yè)論文_第1頁](http://file4.renrendoc.com/view/7c7afd9309b07f6b66f05dd9b185a5f2/7c7afd9309b07f6b66f05dd9b185a5f21.gif)
![面向個性化推薦系統(tǒng)的自適應(yīng)算法的研究與實現(xiàn)-計算機應(yīng)用技術(shù)專業(yè)畢業(yè)論文_第2頁](http://file4.renrendoc.com/view/7c7afd9309b07f6b66f05dd9b185a5f2/7c7afd9309b07f6b66f05dd9b185a5f22.gif)
![面向個性化推薦系統(tǒng)的自適應(yīng)算法的研究與實現(xiàn)-計算機應(yīng)用技術(shù)專業(yè)畢業(yè)論文_第3頁](http://file4.renrendoc.com/view/7c7afd9309b07f6b66f05dd9b185a5f2/7c7afd9309b07f6b66f05dd9b185a5f23.gif)
![面向個性化推薦系統(tǒng)的自適應(yīng)算法的研究與實現(xiàn)-計算機應(yīng)用技術(shù)專業(yè)畢業(yè)論文_第4頁](http://file4.renrendoc.com/view/7c7afd9309b07f6b66f05dd9b185a5f2/7c7afd9309b07f6b66f05dd9b185a5f24.gif)
![面向個性化推薦系統(tǒng)的自適應(yīng)算法的研究與實現(xiàn)-計算機應(yīng)用技術(shù)專業(yè)畢業(yè)論文_第5頁](http://file4.renrendoc.com/view/7c7afd9309b07f6b66f05dd9b185a5f2/7c7afd9309b07f6b66f05dd9b185a5f25.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
.@:OOrgnayNocehiPresenng面5tessinP翻alfufmentofterquiemensfrteMater5degreeatEastChaNormalUnveri,IwarattattistessorgialandanyofteecquesPeendinteteshavebenfguedoutbyme.AnyofterfrneestotecoPyightadmakPaen,0理rorPrPreyrghtofoteshavebeenexPetyaknowedgedandiudednteReerneeseonattendoftiste.孰 n:儲2‘CoPyrghtNoce1hereinagreehatteLbrayofECNUshalmaketseoPesfeeyavaabeforinsPecon.I允eragreehatexensiecoPyigofthetess5aowabeonyforsehoayPurposesinPatcula,SorngtheeonetoftisthessioreevatdaabasesaswelaseomPigandPubshngthetteandabtatof而5teeonssntwihueasPerbedinteCoPyightLawofThePeoPe5RePubeofCn幾一辜疥 “顯顯蟹氫碩士學位論文辯委會成名單名 職稱 單位 備注咬J匕,, 終身教授 華東師范大學 答辯主席口 高工 華東師范大學 答辯委員靜 副教授 華東師范大學 答辯委員摘 摘 要隨著et和信息技術(shù)的飛速發(fā)展,益嚴重的信息過載和信息迷向”問題助推了個性化推薦系統(tǒng)的蓬勃發(fā)展現(xiàn)有的個性化推薦技術(shù)在一定程度上緩解了人們尋找自己喜好信息的壓力和開銷本文通過對現(xiàn)有推薦技術(shù)尤其是推薦算法的深入分析揭示了現(xiàn)有推薦算法的特征和局限性— 難以滿足前大型推薦系統(tǒng)的高推薦精度和擴展性需求,并進一步歸納了推薦系統(tǒng)框架,說明了現(xiàn)有的推薦技術(shù)的瓶頸所在:用戶興趣模型的表示方法不科學以及相應(yīng)推薦算法的低性能問題。本文接著重點在用戶模型和推薦算法兩方面提出了改進的方法用戶模型方面提出了利用機器學習算法來建立用戶興趣模型UAM)的方法和過程推薦算法方面提出了CBD相似度計算方法與CFUPS協(xié)同推薦算法,分別改善了推薦算法的相似度計算精度和推薦結(jié)果的精度。進而,本文基于UAM興趣模型以及BD、CFUPS方法提出了一種適應(yīng)推薦算法ARA)。該算法以標用戶為中心,采用協(xié)同過濾的思想,基于UAM興趣模型,對不同的用戶適應(yīng)地賦予相應(yīng)的推薦參數(shù)來為標用戶提供其最感興趣的信息,進行個性化推薦。最后,通過實驗分析來驗證本文提出的算法的有效性,并且同其他主要推薦算法進行了對比。實驗結(jié)果表明本文提出的適應(yīng)推薦算法較傳統(tǒng)的推薦算法在推薦精度和擴展性方面都有一定的改善。關(guān)鍵詞:個性化推薦,協(xié)同過濾,用戶興趣模型,相似度計算,適應(yīng)推薦華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)AbstraCtwhterPddeveopmentofthehtemetandinformatontechnoo跳 theprobemofnfonnaon overoadng and nformaon amazing,whch wearehavng been加stated,hasbeeamemorean moreworse.Ad alheseboostthefo碩shingdeveoPmeni of PersonaiZed reeonn endaton sysem. Present Personlzed,reeornrQendaioneehnoogyhaseasedthePressue andeostforPeoPefndngtheir運eresednfonnaion.ThisPapershowsuste characersieandmtaonofPresetconedion go,weh e notbeo y e qemet ofrecoln endaionPreeseandseaabt,hroughdeePeseaehandanaysitoteexsngreeorrnendaoneelmoog.Furhermore面5Paperunlnaizethefeworkofreeornendaonsysem andeXPanste boteneekofPresenireeonunendatoneenooy:mPeceexreg ruereetmodelndow Peomceofrecoln endaonagorUns.hinextseP,tisPaperemPhaszeste modeingofusernierestmodelandrecorornendaonalgorbmsandProPosestemProvedmehods.ForusermodeingwentodueethemehodsandapProachusngmachneengteor.Forreeonrnendaiongom,ePtwdCBDmPovedCBockDance)reomPngmiybeeenuesndCFUPSeoboivengbaedonusPal而aiy)foreeommendaon.ThenweProPoseteARAadatvereeormendaionagorhm)basedonUAM nteestmodeCBDandCFUPSehfocungon agetuser5iteresadoPngthedeaofeoaboraveflerngbasedonUAM nierestmodel盼dvenserPoledndtegOm0nI0uhadpveyaungerecornrnendaonParancterforeachuser.ieedwevdehevldyoforPoPoedagoms0uhePeme,階deomParewithPresentrecornrnendaonagorhms.Theresusshow usthatourmetodsouPe而rm te exsngmethodsneeonn endaionpeeseand恤eeo,whcheonrbuteteexeeetPeronnaceofPersonazedrecolm endaonsysem·華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn):Personalzed eoaborave useriterestmodel,maity adaPvereco~ endaion華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)目 錄摘 要…1Abtact……2第一章 引言111個性化推薦系統(tǒng)的蓬勃發(fā)展112推薦算法的現(xiàn)狀與瓶頸513本文的研究思路64論文的結(jié)構(gòu)安排7第二章 相關(guān)推薦技術(shù)821協(xié)同過濾推薦技術(shù)82.2其他推薦技術(shù)介紹1823本章小結(jié)21第三章 個性化推薦系統(tǒng)的框架2231個性化推薦系統(tǒng)框架2232現(xiàn)有的用戶模型及相關(guān)推薦算法分析23321推薦系統(tǒng)的用戶模型分析23322推薦系統(tǒng)相關(guān)推薦算法分析2533用戶適應(yīng)模型田月喲25331UAM興趣模型構(gòu)建253311問題闡述253312.興趣模型構(gòu)建26332UAM興趣模型更新3034本章小結(jié)30第四章 ICBD和CFUPS推薦算法3141改進的ctBockDisance的相似性計算方法aCBD)31411現(xiàn)有相似性計算方法的局限性31412CBD相似性計算方法3242基于用戶興趣局部相似性的推薦算法(CFUPs)34421現(xiàn)有協(xié)作過濾算法的主要不足34422CFUPS推薦算法354221 用戶興趣局部相似興趣的挖掘364222 計算相似性37423 用戶評分的預測374224 產(chǎn)生推薦4043本章小結(jié)40第五章 基于UAM興趣模型的適應(yīng)推薦算法(ARA)4151ARA算法架構(gòu)4152ARA算法介紹41521基于適應(yīng)權(quán)重的用戶相似性計算4152.2近鄰用戶計算方法43523預測評分44華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)524產(chǎn)生推薦4453本章小結(jié)44第六章 實驗分析4661算法ICBD的性能分析與對比一46611數(shù)據(jù)集46612.實驗方法47613.評價尺度47614.參數(shù)優(yōu)化48615.性能對比4962算法CFUPS的參數(shù)分析與性能對比實驗51621實驗數(shù)據(jù)集一一526:2 實驗方法526..3實驗結(jié)果5363適應(yīng)推薦算法ARA的性能對比實驗55631數(shù)據(jù)集55632實驗方法56633實驗結(jié)果5664本章小結(jié)~58第七章 結(jié)論與展望5971本文工作總結(jié)5972工作展望59附錄61參考文獻61后記63華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)第一章引言11個性化推薦系統(tǒng)的蓬勃發(fā)展1LI個性化推薦系統(tǒng)研究背景當今世界,信息技術(shù)的迅猛發(fā)展,特別是e20的出現(xiàn),使得互聯(lián)網(wǎng)信息量成爆炸式增長,特網(wǎng)將世界各地的信息資源聯(lián)接在一起,形成了一個內(nèi)容豐富、包羅萬象的信息海洋,真正地將人類帶入了信息時代。bo的精髓就是以用戶為本提升用戶使用互聯(lián)網(wǎng)的體驗。中國互聯(lián)網(wǎng)信息中心的統(tǒng)計數(shù)據(jù)顯示從2000年到現(xiàn)在,中國網(wǎng)民的人數(shù)應(yīng)從220萬攀升到3億,比去年同期增長了10萬人,同比增長62%,這一數(shù)字將會持續(xù)快速增長。由于在e20模式下,每個用戶都是信息資源的提供者和創(chuàng)造者。這使得網(wǎng)絡(luò)資源異常豐富用戶個性化需求也異常迫切尤其在網(wǎng)絡(luò)搜索、網(wǎng)絡(luò)購物、網(wǎng)絡(luò)新聞、網(wǎng)絡(luò)音視頻服務(wù)等領(lǐng)域為用戶提供個性化的服務(wù)成為企業(yè)商家具有競爭力的核心內(nèi)容。據(jù)英國的Nt公司保守統(tǒng)計,截止206年,全球的網(wǎng)站數(shù)量已達1億,而Gooe的個性化搜索能使得我們從這些巨大數(shù)量網(wǎng)站資源中盡可能地找到我們感興趣的信息,這使得其成為全球最大的搜索引擎。0 萬個20046 200412 20056 2005.12 20066 200612 20076 200712 20086圖1中國網(wǎng)站數(shù)量增長情況著名的騰訊拍拍網(wǎng)在207年第二季度為止,注冊用戶已接近500萬,在線商華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)品數(shù)量超過000萬。作為用戶,面對大量商品,如何在最短的時間內(nèi)選出自己最感興趣的商品是一個巫需解決的問題。表1中國網(wǎng)絡(luò)購物使用率絡(luò)購物 2006年l月 2007年1月 2007年2月2008年6月用率 20% 150% 22% 250%模(萬人) 332 2055 4641 6329信息技術(shù)的發(fā)展帶來了信息資源的極大豐富,使得人們獲取任何自己需要的信息成為可能。然而在人們享受信息技術(shù)帶來的便利的同時信息過載信息迷向”問題也日益嚴重。人們?yōu)樗褜ぷ约盒枰?、有效的信息資源而花費的代價正日益增加。這些問題的產(chǎn)生推動了信息服務(wù),尤其是信息檢索、信息推薦的深入發(fā)展。這些發(fā)展體現(xiàn)在從傳統(tǒng)的單純的根據(jù)用戶查詢提供的關(guān)鍵詞進行檢索的信息檢索系統(tǒng)發(fā)展成在動態(tài)環(huán)境下進行信息收集、分析及評價,并提供高效的信息服務(wù)的信息推薦系統(tǒng)。這是由于傳統(tǒng)的信息檢索系統(tǒng)存在著明顯的缺陷,主要有以下幾點:)不同用戶由于背景知識和興趣愛好的不同對信息資源的需要也不相同他們訪問的往往都只是信息系統(tǒng)或因特網(wǎng)上某一個特定領(lǐng)域的資源子集,因此信息檢索和信息反饋需要與特定領(lǐng)域用戶的研究興趣相結(jié)合。2)前大多數(shù)的信息檢索系統(tǒng)對所有的用戶都是千篇一律的界面檢索方式和檢索結(jié)果,用戶無法準確地表述自己對特定領(lǐng)域和信息的興趣和需求,即使是使用了先進的搜索技術(shù),也不能在一個相對較短的列表中向用戶提供精確的信息。)傳統(tǒng)的檢索系統(tǒng)一般是用關(guān)鍵詞的字面進行匹配這樣的檢索一般精確度比較高,但是卻遺漏了很多語義上概念相近的詞語,因而無法為用戶提供更多有效的信息。另外,對于用戶的潛在興趣,傳統(tǒng)的檢索系統(tǒng)也不能通過分析用戶的訪問行為訪問歷史和背景知識來發(fā)掘和描述用戶的潛在興趣,更無法進行面向用戶的有針對性的推薦反饋。由于以上問題的存在,對信息檢索系統(tǒng)中如何實現(xiàn)個性化的、智能化的服務(wù)功能逐漸成為人們關(guān)注和探索的熱點傳統(tǒng)的信息檢索系統(tǒng)也逐步發(fā)展為個性化的信華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)息推薦系統(tǒng),即從系統(tǒng)被動接受信息用戶的請求轉(zhuǎn)化為主動感知瀏覽者的信息需求,實現(xiàn)系統(tǒng)對信息用戶的個性化的主動的信息服務(wù)個性化推薦技術(shù)正是針對上述情況提出來的個性化推薦系統(tǒng)針對某一領(lǐng)域,能夠根據(jù)用戶的描述文件、歷史興趣信息來進行用戶興趣行為分析依靠推薦引擎的算法主動為用戶計算并推薦其感興趣的信息。112個性化推薦系統(tǒng)應(yīng)用實例個性化推薦系統(tǒng)是個性化服務(wù)技術(shù)的高級階段,隨著信息社會對個性化服務(wù)技術(shù)的需求的趨提高,個性化推薦系統(tǒng)蓬勃發(fā)展,應(yīng)用范圍十分廣泛。)網(wǎng)頁推薦:這類推薦系統(tǒng)向用戶推薦符合其興趣愛好的網(wǎng)頁鏈接主要采用b數(shù)據(jù)挖掘的方法和技術(shù)來分析用戶的興趣。一些示例系統(tǒng)有:. Fb:Fb由斯坦福大學開發(fā),它組合了基于內(nèi)容過濾和協(xié)同過濾的技術(shù),同時支持兩種類型的推薦服務(wù),用于推薦WV萬網(wǎng)頁。Fb系統(tǒng)由頁面收集代理,個人推薦代理和中心路由器組成頁面收集代理從b上收集特定主題的頁面,個人推薦代理從特定主題中選擇用戶感興趣的頁面推薦給用戶。個人推薦代理根據(jù)文檔內(nèi)容信息建立用戶的用戶檔案,然后根據(jù)用戶檔案之間的相似性搜索用戶的最近鄰居。. GoupMk:提出了一個基于共享書簽bonk)的vw推薦系統(tǒng)roPMk,它組合了協(xié)同過濾和信息過濾技術(shù),并提供了推薦結(jié)果的可視化功能。2)新聞和郵件推薦. 幾pe州pey]是一個實驗性的郵件系統(tǒng),用于推薦電子郵件和新聞。Pey有幾個局限性:用戶數(shù)比較少,所以數(shù)據(jù)集太小;要求用戶用TQL提交信息,TQ(apeyQueyLnae是一種使用真值表達式的查詢語句,增加了用戶使用的難度;只適用于用戶群體比較小的場合:缺乏安全性方面的考慮。Pey使用協(xié)同過濾技術(shù),屬于早期的主動協(xié)同過濾系統(tǒng)cveonbovet血),在這種系統(tǒng)中,只有指定的人群才會共享知識,也就是說,評分者和瀏覽者之間有某些直接關(guān)聯(lián)。與主動協(xié)同過濾系統(tǒng)相對的另一個華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)概念是動協(xié)同過濾系統(tǒng)omconbrvengymACE)。. roPs:Goupn屬于動協(xié)同過濾推薦系統(tǒng)它的主要功能是實現(xiàn)對新聞網(wǎng)的協(xié)同過濾,幫助人們在已有的文章中找到他們感興趣的一部分。新聞閱讀的客戶端向用戶顯示對新聞評分的預測,便于用戶在閱讀新聞后對它們進行評分;一個名叫BtritBes的評分服務(wù)器端,負責收集和傳送評分。Golns采用了開放式的體系結(jié)構(gòu),客戶端和服務(wù)器端BrieBes的軟件可以被獨立開發(fā)。用戶可以通過系統(tǒng)提供的PI函數(shù)向CPes服務(wù)器提供評分信息,請求推薦結(jié)果。適合于用戶數(shù)量比較大的場合。3)書籍推薦. TwnFdr:一個在線書店所使用的推薦系統(tǒng),該系統(tǒng)使用了兩種技術(shù)來改進傳統(tǒng)的基于內(nèi)容的推薦:使用OdMcngMhdoMM技術(shù)來反映用戶主動揭示的興趣信息;使用rsMcgMhdCMM技術(shù)來反映用戶隱含興趣的信息。4)電影推薦. 叭eoeo~dr:協(xié)同過濾推薦系統(tǒng)硒doeond1用于電影推薦。它通過電子郵件的方式收集用戶評分數(shù)據(jù),提供推薦服務(wù)。它可以預測用戶最喜歡的電影,也可以預測用戶對特定電影的評分。ieoeo~ner系統(tǒng)提供推薦結(jié)果時,同時向用戶提供最近鄰居的電子郵件聯(lián)系方式,以及用戶與最近鄰居的相似度等信息。. MoiLnS:動協(xié)同過濾推薦系統(tǒng)Mves由Mea大學開發(fā),用于推薦電影。MvLns是一個基于Wb的推薦系統(tǒng),系統(tǒng)通過瀏覽器的方式進行用戶評分數(shù)據(jù)收集與推薦結(jié)果顯示,方便了用戶的使用。5)音樂推薦. Rgo:協(xié)同過濾推薦系統(tǒng)Rng1由MT媒體實驗室開發(fā),用于提供個性化的音樂推薦服務(wù)。幾g。系統(tǒng)可以向用戶推薦用戶最喜歡的音樂,預測用戶最不喜歡的音樂,也可以預測用戶對特定音樂的評分。hdnnd和Mes在這一系統(tǒng)中實驗了一組用于計算用戶間距離的方法包括皮爾遜相關(guān)和余弦向量。他們比較了各種算法的平均絕對誤差MenbeEm。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)12 推薦算法的現(xiàn)狀與瓶頸對于個性化推薦系統(tǒng),最核心的部分是推薦算法。推薦算法的優(yōu)劣直接關(guān)系到推薦系統(tǒng)的推薦質(zhì)量和用戶的使用感受在傳統(tǒng)的推薦系統(tǒng)研究的綜述中,一般也是以推薦算法的分類來區(qū)分不同推薦系統(tǒng)的各國的研究者們?yōu)榱耸沟猛扑]算法產(chǎn)生精確的推薦結(jié)果保證推薦系統(tǒng)的實時性要求研究者提出了各種不同的推薦算法。如:關(guān)聯(lián)規(guī)則推薦,基于內(nèi)容的推薦,基于用戶的協(xié)作過濾推薦,基于項目的協(xié)作過濾推薦,Byn網(wǎng)絡(luò)技術(shù),聚類技術(shù)以及基于圖的Hog圖技術(shù)等。其中,前比較流行的推薦算法主要有:基于規(guī)則的推薦,基于內(nèi)容的推薦,協(xié)同推薦以及混合推薦算法。這些算法都在一定程度上解決了某方面的問題推進了個性化推薦技術(shù)的發(fā)展但是在一定的條件下還不能滿足推薦系統(tǒng)的需求,還存在一定的瓶頸。關(guān)聯(lián)規(guī)則技術(shù)在零售業(yè)得到了廣泛的應(yīng)用,關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性基于關(guān)聯(lián)規(guī)則的推薦算法根據(jù)生成的關(guān)聯(lián)規(guī)則模型和用戶當前的購買行為向用戶產(chǎn)生推薦。關(guān)聯(lián)規(guī)則模型的生成可以離線進行,因此可以保證有效地推薦系統(tǒng)的實時性要求然而隨著系統(tǒng)規(guī)模的增大各種規(guī)則也隨著劇增。因此對各種規(guī)則的管理和更新變得異常復雜影響推薦系統(tǒng)的推薦質(zhì)量和擴展性。協(xié)同過濾是至今最成功的推薦技術(shù)并且在網(wǎng)絡(luò)中許多成功的推薦系統(tǒng)己經(jīng)得到使用協(xié)同式過濾推薦產(chǎn)品給用戶是基于其它用戶的偏好信息協(xié)同推薦系統(tǒng)使用歷史記錄來識別用戶的鄰居并且分析這些鄰居來識別有可能被這個用戶喜歡的信息,我們叫這種方法為基于用戶的協(xié)同推薦算法。傳統(tǒng)的協(xié)作過濾推薦通過用戶的最近鄰居產(chǎn)生最終的推薦,基于項目的協(xié)作過濾推薦首先計算項之間的相關(guān)性然后通過用戶對相關(guān)項目的評分預測用戶對未評分項目的評分。對于協(xié)同過濾技術(shù),存在冷啟動、數(shù)據(jù)稀疏性和擴展性問題。Byn網(wǎng)絡(luò)技術(shù)利用訓練集創(chuàng)建相應(yīng)的模型,模型用決策樹表示,節(jié)點和邊表示用戶信息訓練得到的模型非常小,所以對模型的應(yīng)用非???。這種方法適合于用戶的興趣愛好變化比較慢的場合。聚類技術(shù)將具有相似興趣愛好的用戶分配到相同的簇中,聚類產(chǎn)生之后,根據(jù)簇中其他用戶對商品的評價預測標用戶對該商品的評價。由于聚類過程離線進華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)行所以在線的推薦算法產(chǎn)生推薦的速度比較快聚類技術(shù)雖然提高了系統(tǒng)的擴展性,但是聚類會導致同類別內(nèi)部的興趣的同化,偏離個性化。且類別的更新很耗時。H叭g圖技術(shù)是一種基于圖的方法節(jié)點代表用戶邊代表兩個用戶之間的相似度。在圖中搜索近鄰節(jié)點,然后綜合近鄰節(jié)點的評分形成最后的推薦。Hog圖技術(shù)可以跳過中間節(jié)點尋找最近鄰居考慮了節(jié)點之間的傳遞相似關(guān)系。該算法將用戶之間的相似關(guān)系歸納為圖結(jié)構(gòu),可利用現(xiàn)有的圖的多種算法來求解問題,但是該技術(shù)本質(zhì)上并沒有解決擴展性問題。除此之外,H沙d系統(tǒng)還通過將各種不同的過濾技術(shù)進行混合應(yīng)用以得到更好的推薦針對數(shù)據(jù)的極端稀疏性問題文獻]提出通過奇異值分解sVD減少項目空間的維數(shù),使得用戶在降維后的項目空間上對每一個項均有評分,實驗結(jié)果表明,這種方法可以有效地解決同義詞ynonm)問題,顯著地提高推薦系統(tǒng)的伸縮能力。但降維會導致信息損失,降維效果與數(shù)據(jù)集密切相關(guān),在項目空間維數(shù)很高的情況下,降維的效果難保證。13本文的研究思路現(xiàn)有推薦算法在某些方面提高了推薦系統(tǒng)的性能但是面對大規(guī)模的推薦系統(tǒng),隨著數(shù)據(jù)量的劇增,現(xiàn)有推薦算法存在瓶頸。本文通過對現(xiàn)有算法的分析和總結(jié),認為個性化推薦系統(tǒng)面臨著兩個基本挑戰(zhàn):. 推薦系統(tǒng)的質(zhì)量:數(shù)據(jù)的稀疏性以及較低的數(shù)據(jù)利用率使得推薦系統(tǒng)推薦質(zhì)量降低。推薦系統(tǒng)必須向用戶產(chǎn)生有價值的推薦,否則用戶就對系統(tǒng)失去了信心。. 算法的可擴展性:隨著系統(tǒng)數(shù)據(jù)量的迅速累積,推薦系統(tǒng)面臨著越來越嚴重的擴展性問題,難以滿足系統(tǒng)實時性要求。本文為應(yīng)對上述問題,提出一種基于用戶適應(yīng)模型的個性化推薦技術(shù),本文工作簡述如下:)利用機器學習技術(shù)來建立用戶適應(yīng)模型。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn))基于該用戶適應(yīng)模型采用協(xié)同過濾的思想構(gòu)建相關(guān)的推薦算法并建立個性化推薦系統(tǒng)。)通過實驗來驗證推薦算法的有效性及同傳統(tǒng)協(xié)同推薦技術(shù)的優(yōu)越性。14 論文的結(jié)構(gòu)安排本文主要研究個性化推薦系統(tǒng)的適應(yīng)算法并進行實驗驗證文章的結(jié)構(gòu)安排如下:第一章主要介紹了個性化推薦系統(tǒng)的發(fā)展以及相關(guān)推薦算法的現(xiàn)狀與瓶頸。第二章主要描述了現(xiàn)有的相關(guān)推薦技術(shù)。其中重點介紹了協(xié)同過濾推薦技術(shù),因為本文的適應(yīng)算法也借鑒了協(xié)同過濾的思想。第三章總結(jié)了個性化推薦系統(tǒng)的框架結(jié)構(gòu)其中重點分析了框架中用戶模型的表示以及推薦算法模塊的重要性。最后提出了一種用戶適應(yīng)模型UAM),并給出了構(gòu)建的過程。第四章提出了兩種算法將被應(yīng)用到第五章提出的自適應(yīng)推薦算法當中CBD是基于Cylo-ice的一種改進距離計算方法用來計算用戶之間的相似性。CFUPS是一種基于用戶興趣局部相似性的推薦算法。第五章是本文的核心提出了適應(yīng)推薦算法ARA)該算法基于UAM興趣模型以及CBD、CFUPS算法,對用戶進行適應(yīng)推薦。第六章是實驗分析部分。實驗均以Mvls 為數(shù)據(jù)集,分為三個部分,分別對CBD、CFUPS和ARA算法進行了實驗分析。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)第二章相關(guān)推薦技術(shù)2,協(xié)同過濾推薦技術(shù)211協(xié)過濾推薦簡介協(xié)同過濾推薦onboie仙igeo~ ndao)是前研究最多的個性化推薦技術(shù)它一般采用最近鄰技術(shù)利用用戶的歷史喜好信息計算用戶之間的距離,然后利用目標用戶的最近鄰居用戶對商品評價的加權(quán)評價值來預測目標用戶對特定商品的喜好程度,系統(tǒng)從而根據(jù)這一喜好程度來對標用戶進行推薦。協(xié)同過濾最大優(yōu)點是對推薦對象沒有特殊要求,能處理非結(jié)構(gòu)化的復雜對象如音樂、電影等,如Go即Les3]?;趨f(xié)同過濾的推薦系統(tǒng)可以說是從用戶的角度來進行相應(yīng)推薦的而且是自動的,即用戶獲得的推薦是系統(tǒng)從購買模式或瀏覽行為等隱式獲得的,不需要用戶努力地找到適合自己興趣的推薦信息,如填寫一些調(diào)查表格等。和基于內(nèi)容的過濾方法相比,協(xié)同過濾具有如下的優(yōu)點:)能夠過濾難以進行機器動內(nèi)容分析的信息,如藝術(shù)品,音樂等。)共享其他人的經(jīng)驗避免了內(nèi)容分析的不完全和不精確并且能夠基于一些復雜的,難以表述的概念(如信息質(zhì)量、個人品味)進行過濾。)有推薦新信息的能力可以發(fā)現(xiàn)內(nèi)容上完全不相似的信息用戶對推薦信息的內(nèi)容事先是預料不到的這也是協(xié)同過濾和基于內(nèi)容的過濾一個較大的差別,基于內(nèi)容的過濾推薦很多都是用戶本來就熟悉的內(nèi)容協(xié)同過濾可以發(fā)現(xiàn)用戶潛在的但自己尚未發(fā)現(xiàn)的興趣偏好。)能夠有效的使用其他相似用戶的反饋信息較少用戶的反饋量加快個性化學習的速度。12協(xié)同過濾技術(shù)的實現(xiàn)流程協(xié)同過濾onbveengC)是應(yīng)用最廣泛最成熟的推薦技術(shù)它的基本思想是用戶是可以按照興趣分類的,同類用戶具有非常相似的興趣,因此可以由其他用戶的資料協(xié)同過濾得到對標用戶的推薦用戶信息由項及用戶對該項目的評分組成的向量表示即用戶項矩陣矩陣中的數(shù)據(jù)是用戶對項目的評分對華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)標用戶的所有可能的推薦,肯定都包含在項集合中。協(xié)同過濾的意思,就是如何過濾這個項集得到對標用戶的N個推薦項目因為我們是根據(jù)歷史數(shù)據(jù)來進行推薦的,所以在CF技術(shù)中,一般不考慮用戶的興趣會隨時間的推移而發(fā)生變化,即認為用戶對項目的評分是不隨時間改變的。協(xié)同過濾系統(tǒng)的主要實現(xiàn)步驟一般分為三步:用戶信息的表示、鄰居的產(chǎn)生和產(chǎn)生推薦,具體如圖21所示。e… ④ O伙”呀),·掃SOUCeDatabasee用戶信息表示 計算目標用戶鄰居 產(chǎn)生推薦項目集圖21協(xié)同過濾步驟)用戶信息表示用戶信息的獲取主要是指獲得用戶對項目的評價。這種評價一般分為顯示評價和隱式評價兩種顯示評價是指協(xié)同過濾系統(tǒng)提供信息列表用戶根據(jù)自己的興趣,有意識的對這些項進行評價。隱式評價是系統(tǒng)根據(jù)用戶的行為來分析得到用戶信息,一般通過分析用戶瀏覽時間的長短,購買記錄,點擊次數(shù)等獲得信息。獲得隱式評價有一定的技術(shù)難度,前大多數(shù)協(xié)同過濾系統(tǒng)都是使用前者。但是從長遠來看,隱式方法更容易得到較多用戶信息,并且能使供應(yīng)商更具主動性。隨著技術(shù)的發(fā)展,這個方法所占的比重將會越來越大。用戶信息主要是用來描述用戶的個人特征,以及消費習慣等我們一般用一個用戶一項矩陣Rx來表示項代表購買商品(例如書本、文具等),或者查看標(例如在線觀看的電影等))。矩陣的每個元素j表示用戶i對商品j的評價值(例如購買頻率或點擊率)。2)居的產(chǎn)生華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)協(xié)同過濾最重要的步驟就是標用戶的鄰居的形成。所謂鄰居,就是與標用戶具有相似興趣的用戶。兩個用戶間的相似性用相似度m力度量。鄰居關(guān)系的構(gòu)造主要是為了對每個用戶u找到一個鄰居集u=凡從~從},使得mu凡)>mu從)>…>mu從)O)產(chǎn)生推薦根據(jù)目標用戶的歷史信息,以及他的最近鄰居的歷史信息,獲得標用戶對目標項的預測興趣度,即預測評分值設(shè)用戶的最近鄰居集為戈對于用戶u未評分的項目i的預測評分計算為:藝mx)=瓦+些 藝mI凡通過對用戶u所有未評分項目的預測,根據(jù)預測評分的高低進行排序,選取前N項,產(chǎn)生op一推薦項集。213協(xié)同過濾技術(shù)分類根據(jù)過濾方法的不同,可以大致把協(xié)同過濾技術(shù)分為兩種:基于用戶的協(xié)同過濾和基于項目的協(xié)同過濾。簡單的說,基于用戶的協(xié)同過濾是根據(jù)用戶和用戶之間的相似性找到標用戶的鄰居用戶然后根據(jù)鄰居用戶的歷史信息給出對目標用戶的推薦。基于項目的協(xié)同過濾通過分析項目之間的相似性,以目標用戶己購買的,并且比較喜愛的(例如評價值較高的)項目為參考,把與這些項目相似的項推薦給目標用戶基于用戶的協(xié)同過濾技術(shù)是最先提出來的,所以在早期的文獻提到的協(xié)同過濾技術(shù),往往指的是基于用戶的協(xié)同過濾技術(shù)。近幾年來基于項目的協(xié)同過濾才開始研究的比較多。(1)基于用戶的協(xié)同過濾華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)基于用戶的協(xié)同過濾是根據(jù)用戶的相似性來產(chǎn)生推薦,這很符合我們的生活經(jīng)驗很多人在購買商品的時候都會參考與己生活習慣或者愛好相近的親戚朋友的購買經(jīng)驗,購買相似的物品。因此這個過濾方法要先找到最近鄰居,根據(jù)鄰居的情況對標用戶給出推薦,即在相似用戶集中得到推薦項集。GoPLns就是第一個基于鄰近用戶的協(xié)同過濾的系統(tǒng)。) 算法介紹基用戶協(xié)過推薦應(yīng)用最泛法它基鄰戶的興趣愛好預測標用戶的興趣偏好算法先使用統(tǒng)計技術(shù)尋找與標用戶有相同喜好的鄰居,然后根據(jù)標用戶的鄰居的喜好產(chǎn)生向標用戶的推薦。)信息表示:在一個典型的采用基于用戶的協(xié)同過濾技術(shù)的推薦系統(tǒng)中輸入數(shù)據(jù)通??梢员硎鰹橐粋€m的矩陣凡表示這個矩陣也稱用戶一項矩陣凡,表示m個用戶對個商品的評價,表示用戶i對商品j的評價值(例如購買頻率或點擊率),如表2l。表21戶 項目II1 I22 Inll InnUUll 44 55 00 ll姚 33 55 55 llUm11 22 55 44 55UUmm 44 ll 55 44)計算鄰居:基于用戶的協(xié)同過濾技術(shù)實現(xiàn)的推薦系統(tǒng)的核心是為一個需要推薦服務(wù)的目標用戶尋找最相似的最近鄰居”集Neeeghbor),即對一個用戶u,要產(chǎn)生一個根據(jù)與其相似度大小排列的鄰居集合=N從…從},使得mu凡)>mu從)卜>mu從)用戶之間的相似性的計算方法主要包括三種方法:夾角余弦相似性、eon相關(guān)相似性以及修正的余弦相似性。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)余弦相似性(Cse):把用戶評分看作是n維項空間上的向量,如果用戶對項沒有評分,則將用戶對該項目的評分設(shè)為0用戶間的相似性通過向量間的夾角余弦值來度量。設(shè)用戶和用戶j在n維項空間上的評分分別表示為量,,則用戶和用戶j之間的相似性m力表示如下:了 、mj)=o)= 了分子為兩個用戶評分向量的內(nèi)積,分母是兩個用戶向量模的乘積?!は嚓P(guān)似C):用戶和j共評分過得項用表示則用戶i和j之間的相似性m)通過en相關(guān)系數(shù)度量:藝.動c與sim(力= 2)這里,:、分別表示用戶、j對項目的評分,、分別表示用戶和j對項目的平均評分。修正的余弦相似性(AuedCse):在余弦相似性度量方法中沒有考慮不同用戶的評分尺度修正的余弦相似性度量方法通過減去用戶對項目的平均評分改善述缺陷設(shè)用戶和j共評過分的項集合用表示和毛分別表示用戶i和j評分過的項目集合,則用戶i、j之間的相似性sm力為:藝.動cC與smj)=一般來說,鄰居用戶的確定有兩種方法,一是根據(jù)預先確定的相似性閉值,選擇相似性大于閉值的作為鄰居用戶;二是根據(jù)預先確定的鄰居數(shù)N,選擇最相似的前N個用戶作為鄰居用戶。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn))產(chǎn)生推薦:標用戶的最近鄰居”集產(chǎn)生后,可計算兩類結(jié)果:用戶對任意項的興趣度的預測值和興趣度最高的op一形式的推薦集。標用戶對任意項的興趣度的預測值計算方法:設(shè)用戶u的相應(yīng)的已評價項集為u,則對u未評價的任意項t)的興趣度預測值peuO計算如下:藝smuu)r)uCN)Preu)=兀+ 藝m) 4).Nu)其中,表示標用戶的平均評分,N)表示標用戶的鄰居集合。乙表示鄰居用戶的平均評分?!p一 推薦集的產(chǎn)生:分別根據(jù)公式4)計算標用戶對未評分項目的預測評分值,取評分值最高的前N個項目作為op一推薦集推薦給標用戶。) 算法分析基于用戶的協(xié)同過濾推薦的優(yōu)勢是很明顯的。首先,它能夠通過用戶間的相互協(xié)助、根據(jù)用戶對項目的評價的相似性對用戶進行分類,找到標用戶的鄰居。這樣能得到的推薦結(jié)果是比較精確的。其次,在基于用戶的系統(tǒng)過濾系統(tǒng)中,所有用戶都能從鄰居用戶的評價中受益,只要每個用戶為系統(tǒng)貢獻一份力量,系統(tǒng)就能維持比較好的性能這就是角色一致性oe耐)角色一致性能推動協(xié)同過濾系統(tǒng)性發(fā)展,使系統(tǒng)保持有效的推薦。最后,基于用戶的協(xié)同過濾系統(tǒng)容易挖掘出標用戶潛在的新興趣,即能夠?qū)崿F(xiàn)奇異發(fā)現(xiàn)任何單個的推薦算法都存在著不足?;谟脩舻膮f(xié)同推薦的最大缺陷就在于不能解決稀疏問題。在圖32所顯示的用戶項矩陣中,n和m的維數(shù)都是很大的,也就是說任何一個現(xiàn)實的推薦系統(tǒng),所面對的用戶數(shù)和項數(shù)都是很多的。很多情況下每個用戶都只會對其中很少的項做出評價使得整個用戶一項矩陣非常稀疏導致用戶間的相似性計算不準確,得到的鄰居用戶也就不可靠。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)(2)基于項目的協(xié)同過濾) 算法介紹基于項目的協(xié)同過濾推薦算法最早由Sn教授于201年提出。這種算法先計算標項和己評價項目的相似性,以相似度作為權(quán)重加權(quán)各己評價項目的評價分得到預測項預測值各項目間的相似性可以而且一般都是離線計算的有助于改善系統(tǒng)的擴展性。這個方法的根本思想是:一個用戶將也會喜歡那些和他已經(jīng)購買的項相似的項目在這類方法中歷史信息(用戶項矩陣)是用來反映項之間的關(guān)系的,比如一個項目的購買經(jīng)常導致另一個項或一組相類似項目的購買。因此,該方法是利用用戶項矩陣分析每個項目的相似性,在這個基礎(chǔ)上計算被推薦的前N個項目。)兩個項目的相似性測量:設(shè)和2代表用戶項矩陣中兩個項目列向量則此兩個項目的相似性用相關(guān)系數(shù)表示:藝.動.動加(i)=藝瓜.}藝,上式中,是對項目、都有評分的用戶的集合,·分別是用戶對項.的評分,、瓦分別是項、的對應(yīng)評分的平均值。)計算標用戶未評分項目的鄰居項集:設(shè)標用戶a己經(jīng)評分的項集為a…幼對未評分的任意項a計算項集合a各項相似性,預測評分如下:藝m)氏Pea)=+ 丫sm) 6)I。其中,表項平均評分。)得到op一個推薦項目:根據(jù)公式6)可以計算出對目標用戶所有未評分項目的預測評分值,取評分最高的前N個項目 即為提供給標用戶的推薦項目。華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)) 算法分析基于項目的協(xié)同過濾的思考角度是從項之間的相似性出發(fā),它除了能提高推薦系統(tǒng)的擴展性還能夠?qū)ν扑]結(jié)果做出比較好的解釋,因為大多數(shù)時候,特定的用戶經(jīng)常會對特定的一些商品感興趣但是基于項目的協(xié)同推薦不能做出跨類型”的推薦,因為它推薦的總是相似的項目,也就不能挖掘用戶的潛在興趣。214協(xié)過濾問題分析()協(xié)同過濾推薦系統(tǒng)在應(yīng)用中存在的問題)盡管協(xié)同過濾在電子商務(wù)推薦系統(tǒng)中的應(yīng)用獲得了較大的成功,但隨著站點結(jié)構(gòu)的復雜化,商品信息量和用戶與日俱增基于協(xié)同過濾的推薦系統(tǒng)的發(fā)展面臨著兩個主要挑戰(zhàn):)提高協(xié)同過濾算法的可擴展性協(xié)同過濾算法能夠容易地為幾千名用戶提供較好的推薦但是隨著電子商務(wù)網(wǎng)站的發(fā)展,用戶數(shù)已經(jīng)達到成百上千萬,這就一方面需要提高響應(yīng)時間的要求,能夠為用戶實時地進行推薦;另一方面還應(yīng)考慮到存儲空間的要求,盡量減少推薦系統(tǒng)運行的負擔。)提高推薦信息的質(zhì)量用戶需要值得信任的推薦系統(tǒng)來幫助他找到自己喜歡的信息或商品假如推薦系統(tǒng)老是推薦用戶不喜歡的信息,或者用戶相信推薦購買了商品,而后發(fā)現(xiàn)自己并不喜歡用戶對推薦系統(tǒng)推薦結(jié)果的信任度降低同時將不愿再次使用該推薦系統(tǒng)。為了能夠更好地改進協(xié)同過濾技術(shù),適應(yīng)推薦系統(tǒng)發(fā)展的需要,首先要分析協(xié)同過濾在推薦系統(tǒng)實現(xiàn)過程存在的問題,從而進行有針對性的改進。)前,協(xié)同過濾推薦系統(tǒng)主要受到數(shù)據(jù)的稀疏性和算法的可擴展性問題的制約:)數(shù)據(jù)稀疏性問題(Spy)協(xié)同過濾技術(shù)的基礎(chǔ)是基于用戶的歷史信息,包括標用戶和其它用戶,這些信息通過用戶一項矩陣來表示但是我們又發(fā)現(xiàn),盡管電子商務(wù)系統(tǒng)中的項目非常多,但是并不是所有的項目大家都喜歡。一般情況下,多數(shù)用戶購買商品的總量占華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)網(wǎng)站總商品量的%左右,因此造成了用戶一項矩陣非常稀疏在這種數(shù)據(jù)量大而且又稀疏的情況下,一方面難以找到最近鄰居用戶集,另一方面進行相似性計算的耗費也會很大。同時,由于數(shù)據(jù)非常稀疏,在形成標用戶的最近鄰居用戶集時,往往會造成信息的丟失,從而導致推薦效果的降低。例如鄰居用戶關(guān)系傳遞性的丟失:用戶A與用戶B相關(guān)程度很高,用戶B與用戶C相關(guān)程度也很高,但由于用戶A與用戶C很少對共同的產(chǎn)品進行評價,而認為兩者關(guān)聯(lián)程度較低,于數(shù)據(jù)的稀疏性,丟失了用戶A與用戶C之間潛在的關(guān)聯(lián)。)算法可擴展性問題(cby)文獻中把協(xié)同過濾算法分為全局數(shù)值算法和基于模型算法全局數(shù)值算法能及時利用最新的信息為用戶產(chǎn)生相對準確的用戶興趣度預測或進行推薦但是前大多數(shù)電子商務(wù)系統(tǒng)的用戶都很多商品信息更多,而一般的協(xié)同過濾算法卻不能適應(yīng)這種膨脹,性能也越來越差。這就是協(xié)同過濾算法的擴展性問題。雖然與基于模型的算法相比全局數(shù)值算法節(jié)約了為建立模型而花費的訓練時間,但是用于識別最近鄰居算法的計算量隨著用戶和項的增加而大大增加對于上百萬的數(shù)目,通常的算法會遇到嚴重的擴展性瓶頸問題。該問題解決不好,直接影響著基于協(xié)同過濾技術(shù)的推薦系統(tǒng)實時向用戶提供推薦問題的解決,而推薦系統(tǒng)的實時性越好,精確度越高,該系統(tǒng)才會被用戶所接受;基于模型的算法雖然可以在一定程度上解決算法的可擴展性問題但是該類算法往往比較適于用戶的興趣愛好比較穩(wěn)定的情況,因為它要考慮用戶模型的學習過程以及模型的更新過程,對于最新信息的影響沒有全局數(shù)值算法敏感。()現(xiàn)有的解決辦法)奇異值分解(SVD):為了較好地解決協(xié)同過濾在推薦系統(tǒng)實現(xiàn)中存在的數(shù)據(jù)稀疏同義詞(由于習慣或地域問題同類產(chǎn)品不同用戶會使用不同的名稱進行描述,從而無法發(fā)現(xiàn)這一相關(guān)性)等問題,前提出了使用在信息檢索中被廣泛使用的、用于解決同義詞和多義詞問題的降維技術(shù)一隱性語義索引(Letemcndex,華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)LI)。降維可以提高數(shù)據(jù)的密度,發(fā)現(xiàn)更多的隱性的用戶評價信息,這對解決數(shù)據(jù)稀疏性問題是很有利的。LI使用奇異值分解SlraeDeoPsnSD)作為其矩陣分解的算法SVD可以很好的與協(xié)同過濾技術(shù)結(jié)合從而有效的降低數(shù)據(jù)噪聲、發(fā)現(xiàn)潛在的關(guān)聯(lián),而且SVD計算可以離線進行。需要說明的是在使用SVD技術(shù)之前,需要對用戶項矩陣進行規(guī)范化,例如將矩陣中評估值為0的項用相關(guān)列的平均值代替,即項的平均評估值接著將矩陣每行規(guī)范化為相同長度。選擇不同數(shù)量項的用戶對相似度計算結(jié)果的影響不同容易造成偏差規(guī)范化為相同長度后,降低了選擇項數(shù)較多的用戶對相似度計算結(jié)果的影響。經(jīng)過這樣的處理,可以得到矩陣R~,作為算法的輸入矩陣。也正因為如此規(guī)范化會使矩陣不再能夠完全真實地反映用戶的信息,從而也就降低了推薦的質(zhì)量。另外,雖然降維法在一定程度上解決了數(shù)據(jù)稀疏問題,可是當數(shù)據(jù)量非常大時,SVD訓練所需的消耗非常大。2)特征加權(quán)(Feuewtg)在協(xié)同過濾算法中用戶之間的相似性可以通過計算皮爾森相關(guān)系數(shù)或向量相似性等方法來度量,但計算公式中對兩個用戶評價過的所有項的處理上是完全相同的,即處于同等地位沒有重要與非重要之分,這可能會對預測結(jié)果的準確性上有一定的影響因此使用一些加權(quán)的方法來控制不同項(用戶信息的描述項或特征項)對用戶興趣度預測的影響減小甚至消除某些項產(chǎn)生的消極影響提高與標項緊密相關(guān)項的影響,這樣在一定程度上會提高推薦結(jié)果的質(zhì)量,但會使得算法的擴展性進一步惡化。3)居用戶的篩選基于全局數(shù)值的協(xié)同過濾算法是基于這樣的假設(shè):具有相似興趣的用戶會對相同的項目感興趣。然而,在實際中這樣的假設(shè)并不總是成立的。因此,為了提高系統(tǒng)結(jié)果的準確度,一方面可以通過給不同項賦予不同的權(quán)重.另一方面可以在最近鄰居用戶的選擇上作一定的改進。在上文中提到計算用戶間的相似性之后,一般按照相似性值的大小選取最近鄰居用戶如果有更好的方法選取這一集合中的數(shù)據(jù),找到標用戶的真正的”鄰居,一方面提高預測的準確度,另一方面減少計算的復雜度鄰居用戶篩選的標華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)準主要有:用戶的描述文件、用戶的權(quán)威性以及基于具體應(yīng)用的特殊用戶。此舉在一定程度上提高了算法的可擴展性。4) 聚類技術(shù)(Cueng)聚類技術(shù)是是基于某種距離計算方法,先將用戶動劃分成多個類別,不同類別用戶群之間的距離盡可能大而相同類別中的用戶盡可能相似然后在每個類別用戶群內(nèi)部,分別采用協(xié)同過濾技術(shù)來進行推薦聚類技術(shù)大大降低了為標用戶尋找最近鄰的時間開銷,提高了算法的擴展性。但是存在一些缺陷)聚類的標準難以選擇)每次更新聚類所需要的時間開銷很大)每個類別中的用戶群的興趣會逐步同化,與個性化推薦”的初衷相違背,影響了推薦質(zhì)量。22其他推薦技術(shù)介紹)基于內(nèi)容的推薦技術(shù)基于內(nèi)容的推薦Cobsdeo~dio)是信息過濾技術(shù)的延續(xù)與發(fā)展,它是建立在項的內(nèi)容信息上做出推薦的,而不需要依據(jù)用戶對項的評價意見,更多地需要用機器學習的方法從關(guān)于內(nèi)容的特征描述的事例中得到用戶的興趣資料。在基于內(nèi)容的推薦系統(tǒng)中,項或?qū)ο笫峭ㄟ^相關(guān)的特征的屬性來定義,系統(tǒng)基于用戶評價對象的特征,學習用戶的興趣,考察用戶資料與待預測項的相匹配程度,如PolWbwcher2和新聞過濾系統(tǒng)NewsWeeder]。用戶的資料模型取決于所用學習方法,常用的有決策樹、神經(jīng)網(wǎng)絡(luò)和基于向量的表示方法等?;趦?nèi)容的用戶資料是需要有用戶的歷史數(shù)據(jù),用戶資料模型可能隨著用戶的偏好改變而發(fā)生變化?;趦?nèi)容推薦方法的優(yōu)點是:不需要其它用戶的數(shù)據(jù),沒有冷開始問題和稀疏問題。能為具有特殊興趣愛好的用戶進行推薦.能推薦新的或不是很流行的項,沒有新項問題。通過列出推薦項的內(nèi)容特征,可以解釋為什么推薦那些項。已有比較好的技術(shù),如關(guān)于分類學習方面的技術(shù)己相當成熟。缺點是要求內(nèi)容能容易抽取成有意義的特征,要求特征內(nèi)容有好的結(jié)構(gòu)性,華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法研究與實現(xiàn)并且用戶的口味必須能夠用內(nèi)容特征形式來表達不能顯式地得到其它用戶的判斷情況。2)基于規(guī)則的推薦基于關(guān)聯(lián)規(guī)則的推薦AcinRuebsdeo~ndin)是以關(guān)聯(lián)規(guī)則為基礎(chǔ),把已購商品作為規(guī)則頭,規(guī)則體為推薦對象。關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性,在零售業(yè)中己經(jīng)得到了成功的應(yīng)用。管理規(guī)則就是在一個交易數(shù)據(jù)庫中統(tǒng)計購買了商品集X 的交易中有多大比例的交易同時購買了商品集Y其直觀的意義就是用戶在購買某些商品的時候有多大傾向去購買另外一些商品。比如購買牛奶的同時很多人會同時購買面包。算法的第一步關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)最為關(guān)鍵且最耗時是算法的瓶頸但可以離線進行。其次,商品名稱的同義性問題也是關(guān)聯(lián)規(guī)則的一個難點。)基于知識的推薦基于知識的推薦KoldeadRco~ edo)在某種程度是可以看成是一種推理c技術(shù)],它不是建立在用戶需要和偏好基礎(chǔ)上推薦的?;谥R方法因它們所用功識不而有顯別用知識ninlKolde是一種關(guān)于一個項如何滿足某一特定用戶的知識,因此能解釋需要和推薦的關(guān)系,所以用戶資料可以是任何能支持推理的知識結(jié)構(gòu),它可以是用戶已經(jīng)規(guī)范化的查詢,也可以是一個更詳細的用戶需要的表示。)混合的推薦技術(shù)由于各種推薦方法都有優(yōu)缺點,所以在實際中,混合推薦哪ybdeo~ndio)經(jīng)常被采用。研究和應(yīng)用最多的是內(nèi)容推薦和協(xié)同過濾推薦的組合最簡單的做法就是分別用基于內(nèi)容的方法和協(xié)同過濾推薦方法去產(chǎn)生一個推薦預測結(jié)果,然后用某方法組合其結(jié)果。盡管從理論上有很多種推薦組合方法,但在某一具體問題中并不見得都有效組合推薦一個最重要原則就是通過組合后要能避免或彌補各推薦技術(shù)的弱點。在組合方式上,文獻提出了七種組合思路:華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)加權(quán)t):加權(quán)多種推薦技術(shù)結(jié)果。變換Si):根據(jù)問題背景和實際情況或要求決定變換采用不同的推薦技術(shù)?;旌险be):同時采用多種推薦技術(shù)給出多種推薦結(jié)果為用戶提供參考。特征織合伊ecobio):全合來不同椎薦數(shù)據(jù)源的特征被另一種推薦算法所采用。層疊Cce):先用一種推薦技術(shù)產(chǎn)生一種粗糙的推薦結(jié)果第二種推薦技術(shù)在此推薦結(jié)果的基礎(chǔ)上進一步作出更精確的推薦。特征擴充Freumt):一種技術(shù)產(chǎn)生附加的特征信息嵌入到另一種推薦技術(shù)的特征輸入中。元級別M-v):用一種推薦方法產(chǎn)生的模型作為另一種推薦方法的輸入。表22推薦方法對比推薦方 優(yōu)點 缺點法基于內(nèi) 推薦方法簡單有效;不需要領(lǐng)域知識。 難發(fā)現(xiàn)用戶的新興趣;新容的推 用戶問題;復雜的屬性難薦 以表達。協(xié)同過 能發(fā)現(xiàn)用戶新的興趣點;不需要領(lǐng)域知識;隨著 稀疏性問題;可擴展性問濾推薦 時間推移性能提高;推薦個性化動化程度高; 題;新用戶問題;冷啟動能處理復雜的非結(jié)構(gòu)化對象。 問題?;谝?guī) 能發(fā)現(xiàn)用戶新的興趣點;不需要領(lǐng)域知識。 規(guī)則難以抽取,而且耗則推薦 時;產(chǎn)品名同義性問題;個性化程度低。基于知 能把用戶的需求反映到產(chǎn)品上;能考慮非產(chǎn)品屬 對象的知識難以獲取;推識推薦 性。 薦是靜態(tài)的。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)3本章小結(jié)本章對協(xié)同過濾技術(shù)和其他主要推薦技術(shù)做了較為詳細的介紹和分析。協(xié)同過濾在電子商務(wù)推薦系統(tǒng)中的應(yīng)用雖然取得了很大的成功,但隨著系統(tǒng)規(guī)模(用戶數(shù)量、產(chǎn)品種類)的不斷擴大,基于協(xié)同過濾的推薦系統(tǒng)也面臨著很多問題。本章結(jié)尾并對各種推薦技術(shù)做了簡單的對比。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)第三章個性化推薦系統(tǒng)的框架31個性化推薦系統(tǒng)框架311個性化推薦系統(tǒng)框架介紹個性化推薦系統(tǒng),簡而言之就是根據(jù)用戶以往的交互操作通過對用戶訪問數(shù)據(jù)記錄的分析,動挖掘、表示和維護用戶興趣信息,并根據(jù)用戶興趣信息為其進行個性化推薦服務(wù)。本文根據(jù)推薦系統(tǒng)的特點,概括了推薦系統(tǒng)的框架結(jié)構(gòu),如下圖所示:圖31個性化推薦系統(tǒng)框架如圖31所示,個性化推薦系統(tǒng)框架各個組件說明如下:用戶日志數(shù)據(jù)庫:記錄用戶對各種資源的訪問記錄以及用戶的行為記錄。規(guī)格化歷史記錄數(shù)據(jù)庫:該數(shù)據(jù)庫是存儲對用戶日志數(shù)據(jù)庫規(guī)格化后的數(shù)據(jù)庫。所謂規(guī)格化,是應(yīng)個性化推薦引擎的需求,對原始數(shù)據(jù)庫進行數(shù)據(jù)清理,以滿足推薦算法對數(shù)據(jù)格式的要求。華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)資源數(shù)據(jù)庫:記錄系統(tǒng)資源的各種信息數(shù)據(jù)庫。用戶興趣模型表示:該模塊是基于規(guī)格化歷史記錄數(shù)據(jù)庫和資源數(shù)據(jù)庫、采用某種數(shù)學建模方法、對用戶歷史訪問記錄進行分析以及抽象化用戶興趣的過程。個性化推薦引擎:是推薦系統(tǒng)的核心模塊,它采用某種推薦算法、基于用戶興趣模型為用戶進行信息的個性化推薦。用戶交互接口:該接口是個性化推薦系統(tǒng)向用戶展示推薦結(jié)果并同用戶交互的部分。312個性化推薦系統(tǒng)框架分析在個性化推薦系統(tǒng)框架的各個組件中其中最重要的是個性化推薦引擎和用戶興趣模型表示兩部分。個性化推薦引擎中推薦算法是推薦系統(tǒng)的靈魂推薦算法的性能直接決定著推薦系統(tǒng)的成敗。用戶模型表示在推薦系統(tǒng)中也起著舉足輕重的作用從廣義上來講,其也是推薦算法的一部分性能優(yōu)異的推薦算法必然需要適合的用戶模型表示方法,用戶模型表示和推薦算法息息相關(guān)現(xiàn)有的大部分個性化推薦技術(shù)由于太注重了對推薦算法的改良而沒有對用戶模型表示方面做深入的分析,結(jié)果直接影響了推薦系統(tǒng)的性能和推薦質(zhì)量。32現(xiàn)有的用戶模型及相關(guān)推薦算法分析321推薦系統(tǒng)的用戶模型分析()推薦系統(tǒng)用戶建模概述用戶興趣與更新信息收集圖32用戶建模一般過程用戶建模是個性化推薦系統(tǒng)的基礎(chǔ)和核心要素之一,是開展個性化推薦處理的華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)前提條件。一般地推薦系統(tǒng)需要經(jīng)過用戶建模、項目匹配和推薦輸出三個階段來實現(xiàn)個性化推薦。用戶建模是獲取和維護與用戶興趣、需求或習慣相關(guān)的知識的過程(如圖3),其結(jié)果將產(chǎn)生一個表示用戶特有興趣、需求偏好或模式的用戶模型項目匹配階段將以這一模型為依據(jù)運用各種推薦技術(shù)尋找出與其相匹配的項目,然后在推薦輸出階段將這些項目以預測值、op一推薦或者其他形式呈現(xiàn)給用戶。由此可見,用戶模型是推薦系統(tǒng)產(chǎn)生個性化推薦的主要知識源,其捕捉用戶真實偏好的能力在很大程度上決定了推薦的成功與否。從應(yīng)用要求看用戶模型應(yīng)當包含個體用戶的興趣模型和群體用戶的行為模型。顯然前者側(cè)重于個體用戶的興趣發(fā)現(xiàn)和描述問題,后者側(cè)重于群體用戶訪問行為及群體用戶和資源對象或源項之間關(guān)系或特征模式分析基于用戶興趣模型,可以開展興趣資源推薦,即針對當前訪問的某個特定用戶,主動將跟該用戶興趣內(nèi)容一致或相似的資源對象呈現(xiàn)出來基于群體用戶的訪問行為和用戶項矩陣,則可以開展協(xié)同資源推薦,幫助用戶發(fā)現(xiàn)新的、可能感興趣的資源。(2)推薦系統(tǒng)主要的用戶模型分析對于現(xiàn)有的推薦系統(tǒng),都會直接或者間接地運用到了用戶模型。前的用戶模型比較單一,對原始數(shù)據(jù)的抽象程度不夠高。對前主要用戶模型概括如下:·基于人口信息的用戶模型該類模型主要是通過用戶的注冊信息以及調(diào)查信息而得到用戶的一些屬性信息,比如年齡、職業(yè)、國籍、教育背景以及相關(guān)領(lǐng)域的興趣愛好等信息。這類模型獲取的用戶信息有限而且比較固定僅僅反映了用戶某一時刻對部分信息的興趣愛好可見根據(jù)此模型來匹配用戶感興趣的信息是不科學的,因為用戶的興趣是復雜多變的,不能進行個性化推薦?!せ趦?nèi)容關(guān)鍵詞的用戶模型該模型比較容易構(gòu)建但是對于提高個性化推薦算法的質(zhì)量和擴展性具有局限性。隨著信息資源的劇增,眾多的關(guān)鍵詞會存在同義性、多義性、準確性和數(shù)據(jù)冗余等問題,內(nèi)容關(guān)鍵詞的抽取、管理和更新都比較困難,嚴重影響推薦系統(tǒng)的推薦精確度?!せ谟脩繇椩u分矩陣模型華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)該模型對于提高個性化推薦算法的質(zhì)量和擴展性具有局限性首先如何準確地獲取用戶對眾多資源的評分信息。其次,隨著信息資源的劇增,矩陣的維度增大,評分矩陣的稀疏性以及處理大量數(shù)據(jù)的耗時性,都使得推薦算法的性能低下。322推薦系統(tǒng)相關(guān)推薦算法分析對于推薦系統(tǒng)而言推薦算法是建立在用戶模型之上的,由321分析可知現(xiàn)有的用戶模型存在一定的不足影響了推薦算法的性能基于人口信息的用戶模型、內(nèi)容關(guān)鍵詞的用戶模型和用戶項評分矩陣模型的推薦算法主要有基于內(nèi)容過濾的推薦算法基于關(guān)聯(lián)規(guī)則的推薦算法、基于協(xié)同過濾的推薦算法,其中基于協(xié)同過濾的推薦算法又分為基于用戶的協(xié)同過濾和基于項目的協(xié)同過濾算法這類算法的優(yōu)缺點已在第二章做了深入的分析主要問題可歸納為:用戶的相似性計算問題和算法的擴展性問題。33用戶適應(yīng)模型UAM)鑒于傳統(tǒng)個性化推薦系統(tǒng)中的用戶模型存在數(shù)據(jù)稀疏性和擴展性問題,本文提出一種用戶適應(yīng)模型,具體做以下改進:引入興趣量模型:對原始的用戶項評價信息做進一步處理先運用機器學習算法或者領(lǐng)域本體知識對項資源進行語義分類然后基于該分類,統(tǒng)計用戶在各個類別上的興趣度,構(gòu)建用戶興趣向量。這樣,就用戶對各個類別的興趣而言,稀疏性大大降低,同時更好表達用戶興趣。設(shè)用戶u;的興趣模型為awau幾waZual,31uAM興趣模型構(gòu)建 度性量肛}w.、度上的權(quán)重。該模型的構(gòu)建過程如下文所述。.311 問題闡述隨著推薦系統(tǒng)規(guī)模的增大用戶的原始評分數(shù)據(jù)劇增,即用戶的評分向量的維度極高。而傳統(tǒng)的用戶相似性計算方法,如eon相關(guān)系數(shù)都是基于用戶原始評分向量來計算的,由此產(chǎn)生的計算復雜度很高,為用戶推薦項目的耗時增加,導致華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)了系統(tǒng)嚴重的擴展性問題。本文為解決上述問題,用機器學習算法或者領(lǐng)域本體知識對項資源進行語義分類,然后基于該分類,統(tǒng)計用戶在各個類別上的興趣度,構(gòu)建用戶興趣向量。3312.興趣模型構(gòu)建()資源分類:常用方法有決策樹算法、svM算法、貝葉斯學習算法及領(lǐng)域本體語義分類方法。)決策樹算法決策樹可看作一個樹狀預測模型,它通過把實例從根節(jié)點排列到某個葉子節(jié)點來分類實例,葉子節(jié)點即為實例所屬的分類。決策樹的核心問題是選擇分裂屬性和決策樹的剪枝。決策樹的算法有很多,有D3、C5、CART等等。這些算法均采用頂向下的貪婪算法每個節(jié)點選擇分類效果最好的屬性將節(jié)點分裂為2個或多個子結(jié)點繼續(xù)這一過程直到這棵樹能準確地分類訓練集,或所有屬性都已被使用過。下面簡單介紹最常用的決策樹算法分類回歸樹CAT1。分類回歸樹CART)是機器學習中的一種分類和回歸算法。設(shè)訓練樣本集L{x…nYo其中,戈l,2,,)稱為屬性向量;Y稱為標簽向量或類別向量。當Y是有序的數(shù)量值時,稱為回歸樹;當Y是離散值時,稱為分類樹。在樹的根節(jié)點處搜索問題集數(shù)據(jù)集合空間)找到使得下一代子節(jié)點中數(shù)據(jù)集的非純度下降最大的最優(yōu)分裂變量和相應(yīng)的分裂閉值在這里非純度指標用G而指數(shù)來衡量,它定義為:)藝)藝,j其中,t)是節(jié)點t的G而指數(shù),(i/O表示在節(jié)點t中屬于i類的樣本所占的比例,(j/O是節(jié)點t中屬于J類的樣本所占的比例用該分裂變量和分裂閉值把根節(jié)點l分裂成和如果在某個節(jié)點t處不可能再有進一步非純度的顯著低則該節(jié)華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)點t成為葉結(jié)點,否則繼續(xù)尋找它的最優(yōu)分裂變量和分裂閉值進行分裂。對于分類問題,當葉節(jié)點中只有一個類,那么這個類就作為葉節(jié)點所屬的類,若節(jié)點中有多個類中的樣本存在根據(jù)葉節(jié)點中樣本最多的那個類來確定節(jié)點所屬的類別;對于回歸問題,則取其數(shù)量值的平均值。很明顯,一棵很大的樹可能過分擬合數(shù)據(jù),但較小的樹又可能無法捕獲重要的結(jié)構(gòu)樹的最佳大小是控制模型復雜性調(diào)整參數(shù),它應(yīng)該數(shù)據(jù)適應(yīng)的選擇。一種可取的策略是增長一棵較大的樹,僅當達到最小節(jié)點大小(比如)時才停止分裂過程。然后利用剪枝策略和5折或0折交叉驗證相結(jié)合的方法來修剪這棵樹,從而將一些噪聲和千擾數(shù)據(jù)排除,獲得最優(yōu)樹。b)SVM算法SVM法即支持向量機suppoterMahn法。由Vp血等人于95年提出,具有相對優(yōu)良的性能指標]。該方法是建立在統(tǒng)計學習理論基礎(chǔ)上的機器學習方法。通過學習算法,SVM可以動尋找出那些對分類有較好區(qū)分能力的支持向量,由此構(gòu)造出的分類器可以最大化類與類的間隔,因而有較好的適應(yīng)能力和較高的區(qū)分率。該方法只需要由各類域的邊界樣本的類別來決定最后的分類結(jié)果。支持向量機算法的的在于尋找一個超平面H),該超平面可將訓練集中的數(shù)據(jù)分開,且與類域邊界的沿垂直于該超平面方向的距離最大,故SVM法亦被稱為最大邊緣洲x~Mg)算法所謂最優(yōu)超平面就是要求超平面不但能將兩類正確分開,而且使分類間隔最大;使分類間隔最大實際上就是對模型推廣能力的控制,這正是SVM的核心思想所在。SVM學習算法最終歸結(jié)為求解二次規(guī)劃問題常用的SVM學習算法包括vMt、SMO、chr面g等。一般而言,支持向量機有如下三個主要特點:結(jié)構(gòu)風險最小化原則給出實際風險的上界保證學習機器具有好的推廣能力。算法最終轉(zhuǎn)化為一個線性約束的凸優(yōu)化問題保證了算法的全局最優(yōu)性和解的唯一性?!?yīng)用核技術(shù)將輸入空間中的線性不可分問題轉(zhuǎn)化為特征空間的線性可分問華華東師范大學碩士學位論文 面?zhèn)€性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn))貝葉斯學習算法Bys法是一種在知先驗概率與類條件概率的情況下的模式分類方法,待分樣本的分類結(jié)果取決于各類域中樣本的全體。設(shè)訓練樣本集分為M類,記為C二……氣},每類的先驗概率為(),il2M 。當樣本集非常大時,可以認為()=類樣本數(shù)總樣本數(shù)。對于一個待分樣本X,其歸于類的類條件概率是(X/),則根據(jù)Bys定理,可得到c類的后驗概率(i/X):(吼/X)=(X/)x()/(X)若ptX)低匆/X),i=M,j=2M有X。上式是最大后驗概率判決準則,進一步有:若pX/cpc)枷 pe/X),i=2M ,j=2M ,則X只。這就是最大后驗概率判決準則,這就是常用到的Bys分類判決準則。經(jīng)過長期的研究,Bys分類方法在理論上論證得比較充分,在應(yīng)用上也是非常廣泛的。Bys方法的薄弱環(huán)節(jié)在于實際情況下,類別總體的概率分布和各類樣本的概率分布函數(shù)或密度函數(shù)常常是不知道的。為了獲得它們,就要求樣本足夠大。此外,當用于文本分類時Bys法要求表達文本的主題詞相互獨立,這樣的條件在實際文本中一般很難滿足,因此該方法往往在效果上難以達到理論上的最大值。)基于領(lǐng)域本體語義分類方法一個本體提供了定義好的重要概念以及概念之間的語義關(guān)系的結(jié)構(gòu),Ogy的目標是捕獲相關(guān)領(lǐng)域的知識,提供對該領(lǐng)域知識的共同理解,確定該領(lǐng)域內(nèi)共同認可的詞匯并從不同層次的形式化模型上給出這些術(shù)語詞匯以及他們之間的相互關(guān)系的明確定義。對于某特定領(lǐng)域,建立領(lǐng)域本體好后,利用領(lǐng)域本體抽取項目的語義信息建立特定領(lǐng)域的語義分類樹為了后續(xù)方便比較計算用戶的語義相似性,華華東師范大學碩士學位論文 面向個性化推薦系統(tǒng)的適應(yīng)算法的研究與實現(xiàn)將各項抽取出來的實例屬性轉(zhuǎn)換為向量表示,使用向量空間模型表示項目的屬性。()類別權(quán)重根據(jù) (1)可得到關(guān)于資源項目的語義屬性信息,即屬性向量,設(shè)為及抓幾},每個項目的語義屬性可分解為在該向量上的值,如項目t的屬性量可表示為l}。進而,我們可以根據(jù)用戶對項的評分數(shù)據(jù)來構(gòu)造每個用戶在語義向量萬各分量屬性上的喜好權(quán)重。構(gòu)造方法如下:)對用戶構(gòu)造屬頻數(shù)量賓:初化數(shù)量只=仍戶價過每個項;項性量為風}:一一UUhketdiske)基于上述公式可得到用戶項屬性頻數(shù)矩陣凡,對于每個用戶u,進一步來戶性量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 13《我能行》(說課稿)-2023-2024學年統(tǒng)編版道德與法治二年級下冊
- Unit 6 How do you feel Part B Read and Write(說課稿)-2024-2025學年人教PEP版英語六年級上冊
- 6《一封信》說課稿-2024-2025學年統(tǒng)編版語文二年級上冊
- 12 低碳生活每一天 第二課時 說課稿-2023-2024學年道德與法治四年級上冊統(tǒng)編版001
- 2025城市房屋拆遷安置補償合同
- 公司轉(zhuǎn)讓工程合同范本
- 6《探訪古代文明》說課稿-2023-2024學年道德與法治六年級下冊統(tǒng)編版
- 鋁合金踢腳線施工方案
- 項目租車方案
- 住建部 認購合同范例
- Unit 6 Beautiful landscapes Integration說課稿 - 2024-2025學年譯林版英語七年級下冊
- 新版人教版七年級下冊數(shù)學全冊教案教學設(shè)計含教學反思
- 北京市東城區(qū)2023-2024學年高二下學期期末英語試題 含解析
- 中國食物成分表2020年權(quán)威完整改進版
- 2024年金屬非金屬礦山(地下礦山)安全管理人員考試練習題(100題)附答案
- GB/T 35506-2017三氟乙酸乙酯(ETFA)
- 特種設(shè)備安全監(jiān)察指令書填寫規(guī)范(特種設(shè)備安全法)參考范本
- 硬筆書法全冊教案共20課時
- 《長方形的面積》-完整版課件
- PDCA降低I類切口感染發(fā)生率
- 工業(yè)企業(yè)現(xiàn)場監(jiān)測工況核查表
評論
0/150
提交評論