K-Means算法實(shí)驗(yàn)報(bào)告_第1頁
K-Means算法實(shí)驗(yàn)報(bào)告_第2頁
K-Means算法實(shí)驗(yàn)報(bào)告_第3頁
K-Means算法實(shí)驗(yàn)報(bào)告_第4頁
K-Means算法實(shí)驗(yàn)報(bào)告_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 扌旨導(dǎo)教師 丿XXX 線 I I I I I I I I 題目: K_Means聚類算法分析與實(shí)現(xiàn) 院一 XXXXXXXXXXXXXXXXXXXX 業(yè) XXXXXXXXXXXXXXXX 號一 XXXXXXXXXXX 名 XXXX 20 xx 年 x 月 xx H K-Means 聚類算法 KMeans算法的基本思想是初始隨機(jī)給定K個(gè)簇中心,按照最鄰近原則把待分類 樣本 點(diǎn)分到各個(gè)簇。然后按平均法重新計(jì)算各個(gè)簇的質(zhì)心,從而確立新的簇心。一直 迭代,直 到簇心的移動(dòng)距離小于某個(gè)給定的值。 K-Means聚類算法主要分為三個(gè)步驟: (1) 第一步是為待聚類的點(diǎn)尋找聚類中心 (2) 第二步是計(jì)算每個(gè)

2、點(diǎn)到聚類中心的距離,將每個(gè)點(diǎn)聚類到離該點(diǎn)最近的聚類中去 (3) 第三步是計(jì)算每個(gè)聚類中所有點(diǎn)的坐標(biāo)平均值,并將這個(gè)平均值作為新的聚類中 心 反復(fù)執(zhí)行(2)、(3),直到聚類中心不再進(jìn)行大范圍移動(dòng)或者聚類次數(shù)達(dá)到要求為止 下圖展示了對n個(gè)樣本點(diǎn)進(jìn)行K-means聚類的效果,這里k取2: (a) 未聚類的初始點(diǎn)集 (b) 隨機(jī)選取兩個(gè)點(diǎn)作為聚類中心 (C)計(jì)算每個(gè)點(diǎn)到聚類中心的距離,并聚類到離該點(diǎn)最近的聚類中去 (d) 計(jì)算每個(gè)聚類中所有點(diǎn)的坐標(biāo)平均值,并將這個(gè)平均值作為新的聚類中心 (e) 重復(fù)(c),計(jì)算每個(gè)點(diǎn)到聚類中心的距離,并聚類到離該點(diǎn)最近的聚類中去 (f) 的坐標(biāo)平均值, 重復(fù)(d),

3、計(jì)算每個(gè)聚類中所有點(diǎn) 并將這個(gè)平均值作為新的聚類中 (c) (b) Mat lab 實(shí)現(xiàn): %!機(jī)獲取150個(gè)點(diǎn) X = randn (50, 2) +o nes (50, 2) ;ra ndn (50, 2)o nes (50, 2) ;ra ndn (50, 2) + o nes (50, 1), o nes ( 50,1); opts 二 statset( Displayfi naV): %調(diào)用Kmeans函數(shù) %X N*P的數(shù)據(jù)矩陣 %Idx N*1的向量,存儲(chǔ)的是每個(gè)點(diǎn)的聚類標(biāo)號 %Ctrs K*P的矩陣,存儲(chǔ)的是K個(gè)聚類質(zhì)心位置 %SumD 1*的和向量,存儲(chǔ)的是類間所有點(diǎn)與該類質(zhì)

4、心點(diǎn)距離之和 %DN*K的矩陣,存儲(chǔ)的是每個(gè)點(diǎn)與所有質(zhì)心的距離;ldx, Ctrs,SumD, D = kmea ns (X, 3, Replicates , 3, Optio ns , opts); %8出聚類為1的點(diǎn)。X(Idx=l, 1),為第一類的樣本的第一個(gè)坐標(biāo);X(Idx=l,2)為第二類 的樣本 的第二個(gè)坐標(biāo) plot (X(ldx=l, 1), X(ldx=l, 2), r. , MarkerSize, 14) hold on plot (X (Idx=2, 1), X (Idx=2, 2)bMarkersize, 14) hold on plot (X(Idx=3, 1),

5、X (Idx=3, 2)MarkerSize, 14) %繪出聚類中心點(diǎn),kx表示是圓形 plot (Ctrs (:, 1), Ctrs (:, 2), kx ,,Markersize,, 14, LineWidth , 4) plot (Ctrs (:, 1), Ctrs (:, 2)kx MarkerSize , 14, LineWidth , 4) plot (Ctrs(:, 1), Ctrs(:, 2),,kx , MarkerSize, 14, LineWidth, , 4) legendCluster 1 , Cluster 2, Cluster 3 , Centroids,, L

6、ocation , NW) Ctrs SumD 執(zhí)行結(jié)果: Kmeans 6 iterations, 10 iterations, totai sum of distances 二 204.821 total sum of distances 二 205. 886 total sum of distances 二 204.821 9 iterations, total sum of distances 二 16 iterations, 205.886 9 iterations, totai sum of distances 二 205.886 8 iterations, 8 iterations, 14 iterations, total sum of distances 二 204. 821 total sum of distances 二 204. 821 total sum of distances 二 205. 886 14 it erations, t otel sum of dis tances 二 205. 886 6 iterations, total sum of distances 二 204.821 Ctrs 二 1.0754 1. 0482 -1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論