6.3.1聚類分析《財務大數(shù)據分析》教學課件_第1頁
6.3.1聚類分析《財務大數(shù)據分析》教學課件_第2頁
6.3.1聚類分析《財務大數(shù)據分析》教學課件_第3頁
6.3.1聚類分析《財務大數(shù)據分析》教學課件_第4頁
6.3.1聚類分析《財務大數(shù)據分析》教學課件_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

財務大數(shù)據分析第六章

大數(shù)據在投資者角度分析與決策中的應用物以類聚”智者觀物,固非以一物視之,別之以類,格而致知,推而及其他者也?!?3聚類算法應用聚類分析1生活中的聚類2聚類分析概述3K-Means聚類算法一、生活中的聚類科學研究社會調查衣食住行一、生活中的聚類在市場營銷中,基于消費者背景和歷史交易信息將顧客進行劃分,對不同類型的消費者進行不同的營銷策略。一、生活中的聚類在投資過程中,為了降低風險,應盡量選擇較為平衡的投資組合。在現(xiàn)有條件下,對一系列投資產品從不同方面進行歸類。二、聚類分析概述概念:通過觀察個體的特征,將群體中的個體歸為不同的族群/簇的歸類過程。過程:針對幾個特定的業(yè)務指標,將觀察對象的群體按照相似性和相異性進行不同群組的劃分。經過劃分后,每個群組內部對象的相似度會很高,而在不同群組間具有很高的相異度。二、聚類分析概述聚類分析步驟相似性度量40%選取數(shù)據20%聚類算法60%有效性檢驗80%聚類結果100%相似性度量40%選取數(shù)據20%三、K-Means聚類算法含義:K-means聚類算法也稱k均值聚類算法,是集簡單和經典于一身的基于距離的聚類算法。它采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。三、K-Means聚類算法步驟一:選擇初始數(shù)據集,經過相似性度量假設K=2。隨機選擇兩個k類所對應的類別質心,即圖中的紅色質心和藍色質心。三、K-Means聚類算法步驟二:分別計算所有樣本中的點到這兩個質心的距離,并標記每個樣本的類別為和該樣本距離最小的質心的類別,得到所有樣本點的第一輪迭代后的類別。三、K-Means聚類算法步驟三:對當前標記為紅色和藍色的點分別求其新的質心,如圖所示,新的紅色質心和藍色質心的位置已經發(fā)生了變動。三、K-Means聚類算法步驟四:再次計算所有樣本中的點到這兩個質心的距離,并標記每個樣本的類別為和該樣本距離最小的質心的類別,得到所有樣本點的第二輪迭代后的類別。三、K-Means聚類算法步驟五:對當前標記為紅色和藍色的點再次分別求其新的質心,最終我們得到的兩個類別如圖所示。質心的位置變化不大,趨于穩(wěn)定,聚類已

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論