版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 扌旨導教師 丿XXX 線 I I I I I I I I 題目: K_Means聚類算法分析與實現(xiàn) 院一 XXXXXXXXXXXXXXXXXXXX 業(yè) XXXXXXXXXXXXXXXX 號一 XXXXXXXXXXX 名 XXXX 20 xx 年 x 月 xx H K-Means 聚類算法 KMeans算法的基本思想是初始隨機給定K個簇中心,按照最鄰近原則把待分類 樣本 點分到各個簇。然后按平均法重新計算各個簇的質(zhì)心,從而確立新的簇心。一直 迭代,直 到簇心的移動距離小于某個給定的值。 K-Means聚類算法主要分為三個步驟: (1) 第一步是為待聚類的點尋找聚類中心 (2) 第二步是計算每個
2、點到聚類中心的距離,將每個點聚類到離該點最近的聚類中去 (3) 第三步是計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中 心 反復執(zhí)行(2)、(3),直到聚類中心不再進行大范圍移動或者聚類次數(shù)達到要求為止 下圖展示了對n個樣本點進行K-means聚類的效果,這里k取2: (a) 未聚類的初始點集 (b) 隨機選取兩個點作為聚類中心 (C)計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去 (d) 計算每個聚類中所有點的坐標平均值,并將這個平均值作為新的聚類中心 (e) 重復(c),計算每個點到聚類中心的距離,并聚類到離該點最近的聚類中去 (f) 的坐標平均值, 重復(d),
3、計算每個聚類中所有點 并將這個平均值作為新的聚類中 (c) (b) Mat lab 實現(xiàn): %!機獲取150個點 X = randn (50, 2) +o nes (50, 2) ;ra ndn (50, 2)o nes (50, 2) ;ra ndn (50, 2) + o nes (50, 1), o nes ( 50,1); opts 二 statset( Displayfi naV): %調(diào)用Kmeans函數(shù) %X N*P的數(shù)據(jù)矩陣 %Idx N*1的向量,存儲的是每個點的聚類標號 %Ctrs K*P的矩陣,存儲的是K個聚類質(zhì)心位置 %SumD 1*的和向量,存儲的是類間所有點與該類質(zhì)
4、心點距離之和 %DN*K的矩陣,存儲的是每個點與所有質(zhì)心的距離;ldx, Ctrs,SumD, D = kmea ns (X, 3, Replicates , 3, Optio ns , opts); %8出聚類為1的點。X(Idx=l, 1),為第一類的樣本的第一個坐標;X(Idx=l,2)為第二類 的樣本 的第二個坐標 plot (X(ldx=l, 1), X(ldx=l, 2), r. , MarkerSize, 14) hold on plot (X (Idx=2, 1), X (Idx=2, 2)bMarkersize, 14) hold on plot (X(Idx=3, 1),
5、X (Idx=3, 2)MarkerSize, 14) %繪出聚類中心點,kx表示是圓形 plot (Ctrs (:, 1), Ctrs (:, 2), kx ,,Markersize,, 14, LineWidth , 4) plot (Ctrs (:, 1), Ctrs (:, 2)kx MarkerSize , 14, LineWidth , 4) plot (Ctrs(:, 1), Ctrs(:, 2),,kx , MarkerSize, 14, LineWidth, , 4) legendCluster 1 , Cluster 2, Cluster 3 , Centroids,, L
6、ocation , NW) Ctrs SumD 執(zhí)行結(jié)果: Kmeans 6 iterations, 10 iterations, totai sum of distances 二 204.821 total sum of distances 二 205. 886 total sum of distances 二 204.821 9 iterations, total sum of distances 二 16 iterations, 205.886 9 iterations, totai sum of distances 二 205.886 8 iterations, 8 iterations, 14 iterations, total sum of distances 二 204. 821 total sum of distances 二 204. 821 total sum of distances 二 205. 886 14 it erations, t otel sum of dis tances 二 205. 886 6 iterations, total sum of distances 二 204.821 Ctrs 二 1.0754 1. 0482 -1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 ISO/IEC 15434:2025 EN Information technology - Automatic identification and data capture techniques - Syntax for high-capacity ADC media
- 《單證管理流程》課件
- 《少兒青春期教育》課件
- 單位管理制度集粹選集人員管理
- 《電化學局部腐蝕》課件
- 單位管理制度合并匯編【員工管理篇】
- 單位管理制度分享合集職工管理篇
- 單位管理制度范例匯編員工管理篇
- 單位管理制度呈現(xiàn)匯編【人力資源管理篇】十篇
- 單位管理制度呈現(xiàn)大全員工管理篇十篇
- 《科學與工程倫理》課件-1港珠澳大橋工程建設中的白海豚保護相關案例分析
- 浙江省杭州市錢塘區(qū)2023-2024學年四年級上學期數(shù)學期末試卷
- 《湖北省市政基礎設施工程質(zhì)量標準化圖冊》(燃氣管網(wǎng)工程)
- 天車租賃合同范例
- 無機化學實驗試題
- 2025年中考道德與法治二輪復習:主觀題 答題模板與技巧(含練習題及答案)
- 衡重式及重力式擋土墻自動計算表
- 有關大學生寒假生活計劃-大學生的寒假計劃
- 2024年01月11129土木工程力學(本)期末試題答案
- 家政公司員工合同范例
- 2025年度安全培訓計劃
評論
0/150
提交評論