



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、日志挖掘論文:網(wǎng)絡日志挖掘和協(xié)同過濾算法的研究【中文摘要】隨著互聯(lián)網(wǎng)技術(shù)出現(xiàn)至今不過短短幾十年的時間,但是正是在這并不算太長的時間里經(jīng)歷的不斷發(fā)展,使得互聯(lián)網(wǎng)技術(shù)對每個人的生活都產(chǎn)生了極其深遠的影響。相對于傳統(tǒng)意義上的網(wǎng)站而言,在二十世紀末二十一世紀初所興起的Web 2.0技術(shù)不僅帶來了最新的技術(shù),也致力于將提升用戶使用體驗作為目標。在這樣的動力之下,也帶動了各種提升用戶的網(wǎng)站使用體驗和優(yōu)化網(wǎng)站結(jié)構(gòu)以及個性化用戶訪問等等方面的研究。作為實現(xiàn)對北京語言大學Web服務器日志的挖掘來優(yōu)化該網(wǎng)站的設計,構(gòu)建以用戶為中心的網(wǎng)站,為用戶提供個性化的信息服務目標的第一步,本文在充分考慮了北京語言大學Web服
2、務器日志實際情況下,對日志挖掘的工具做了相對應優(yōu)化和改進工作。本文還詳細介紹了日志挖掘預處理中的各個步驟,分析了其中牽涉到的各種預處理算法,并且實現(xiàn)了一個完整的日志挖掘工具。為將來更細致更詳盡的日志挖掘工作打下了一個良好的基礎。此外,本文還詳盡分析了兩種傳統(tǒng)的協(xié)同過濾算法,對比了基于用戶相似度的協(xié)同過濾算法和基于項目相似度的協(xié)同過濾算法在不同相似度公式之下的表現(xiàn),并且根據(jù)這兩種算法各自的優(yōu)缺點,提出了一種新的基于混合相似度的協(xié)同過濾算法。分析了這種新的算法在理論上對兩種傳統(tǒng)算法的優(yōu)勢所在。本文也實現(xiàn)了以上各種算法,并使用MovieLens的數(shù)據(jù)集對各種算法進行了測試。結(jié)果證明,本文所提出來的新
3、的基于混合相似度的協(xié)同過濾算法不僅吸收了兩種傳統(tǒng)算法的優(yōu)點,同時也在一定程度上對兩種傳統(tǒng)算法的缺點有改進,在MAE以及召回率等度量指標上都一定程度的提升?!居⑽恼縄t was only couple of decades since the emergence of Internet, but as the quickly growing of Internet and developing of techniques, Internet has impacted everyones everyday life enormously. Comparing the traditional w
4、ebsite which only offer the users text and multimedia, Web 2.0 developing during late 20th century and 21st century not only brings new technology but only on the purpose of increasing users experience on the website. Under such an endeavor, researches among increasing users experiences, optimizing
5、the structure of website and personalizing users visiting become more and more important.In order to optimize Beijing Language and Culture Universitys web structure, to construct a website suitable for users and to personalize users information services by mining the logs of web servers, this articl
6、e serves as the first step. After thoroughly considering the current situation of Beijing Language and Culture Universitys web log, this article does corresponding optimization and improvement in doing web mining. Also this article depicts the details of every single step of pre-processing of web lo
7、g mining, analysis different pre-processing algorithm involving it. This article also implements a completed web mining tools, as a solid foundation for future web log mining procedures.Besides that, this article also analyses two traditional collaborative filtering algorithms, which are user-based
8、collaborative filtering algorithm and item-based collaborative filtering algorithm. By comparing the advantages and disadvantages of these two algorithms with different way to calculate similarity, this article introduces a new method called mixed-based collaborative filtering algorithm, and depicts
9、 the advantages of the new method to the traditional two. After implementation and tested with the data of MovieLens, the result proves that this new mixed-based collaborative filtering algorithm not only has the advantages of the traditional two methods but also overtake some disadvantages of them. The results also show that on different measurements like MAE and ratio of recal
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車廂工廠轉(zhuǎn)讓協(xié)議書
- 黃金買賣合同協(xié)議書
- 車輛代租代管協(xié)議書
- 公費醫(yī)學生分配協(xié)議書
- 項目管理分包協(xié)議書
- 駕駛培訓安全協(xié)議書
- 非訴事務委托協(xié)議書
- 集體種植合作協(xié)議書
- Brand KPIs for second-hand apparel online shops hewi. (hardly ever worn it) in the United Kingdom-外文版培訓課件(2025.2)
- 項目策劃框架協(xié)議書
- 醫(yī)院培訓課件:《靜脈中等長度導管臨床應用專家共識》
- 高職《旅游英語》課程標準
- BEC商務英語(中級)閱讀模擬試卷11(共405題)
- 汽車維修工(汽車維修檢驗工)技能考核內(nèi)容結(jié)構(gòu)表與技能考核要素細目表
- 《研學旅行基地運營與管理》課件-2.2研學旅行基地產(chǎn)品的開發(fā)
- 柘榮縣生態(tài)公益林護林員考核評分表
- 2024-2030年中國煙草收獲機行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 《第10課 我喜歡的機器人》參考課件1
- 2024年7月浙江省高中學業(yè)水平考試數(shù)學試卷真題(含答案詳解)
- 攤位簡單轉(zhuǎn)讓合同范本2024年
- 大學生創(chuàng)新創(chuàng)業(yè)基礎(廣西師范大學)智慧樹知到期末考試答案章節(jié)答案2024年廣西師范大學
評論
0/150
提交評論