對fuzzyKmeans的認(rèn)識_第1頁
對fuzzyKmeans的認(rèn)識_第2頁
對fuzzyKmeans的認(rèn)識_第3頁
對fuzzyKmeans的認(rèn)識_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、俗話說:“物以類聚,人以群分”,在自然科學(xué)和社會科學(xué)中,存在著大量的分類問題。聚類()分析是由若干模式()組成的。通常,模式是一個度量()的向量,或者是多維空間中的一個點。聚類分析以相似性為基礎(chǔ),在一個聚類中的模式之間比不在同一聚類中的模式之間具有更多的相似性。所以,聚類分析依賴于對觀測間的接近程度(距離)或相似程度的理解,定義不同的距離量度和相似性量度就可以產(chǎn)生不同的聚類結(jié)果。所謂類,通俗地說,就是指相似元素的集合。聚類就是按照事物間的相似性進(jìn)行區(qū)分和分類的過程。聚類分析又稱群分析,它是研究(樣品或指標(biāo))分類問題的一種統(tǒng)計分析方法。聚類分析起源于分類學(xué),聚類分析也可以作為其他分析算法的一個預(yù)

2、處理步驟。中文翻譯作“聚類”,簡單地說就是把相似的東西分到一組,同分類不同,理想情況下,一個會從它得到的訓(xùn)練集中進(jìn)行“學(xué)習(xí)”,從而具備對未知數(shù)據(jù)進(jìn)行分類的能力,這種提供訓(xùn)練數(shù)據(jù)的過程通常叫做監(jiān)督學(xué)習(xí),而在聚類的時候,我們并不關(guān)心某一類是什么,我們需要實現(xiàn)的目標(biāo)只是把相似的東西聚到一起,因此,一個聚類算法通常只需要知道如何計算相似度就可以開始工作了,稱作無監(jiān)督學(xué)習(xí))無監(jiān)督分類最常用的方法之一是均值或、模糊均值和()。有其缺點:產(chǎn)生類的大小相差不會很大,對于臟數(shù)據(jù)很敏感。不得不承認(rèn)這并不是很好的結(jié)果。不過其實大多數(shù)情況下給出的結(jié)果都還是很令人滿意的,算是一種簡單高效應(yīng)用廣泛的方法。選定個中心的這個

3、過程通常是針對具體的問題有一些啟發(fā)式的選取方法,或者大多數(shù)情況下采用隨機選取的辦法。因為前面說過并不能保證全局最優(yōu),而是否能收斂到全局最優(yōu)解其實和初值的選取有很大的關(guān)系,所以有時候我們會多次選取初值跑,并取其中最好的一次結(jié)果因為每迭代一次就需要遍歷所有數(shù)據(jù),盡量減少迭代次數(shù),初值很重要,可先用K-Me求初始聚類中心。易于陷入局部最小,對初始值較敏感。K-means算法結(jié)束條件:1)給定一個迭代次數(shù),達(dá)到這個次數(shù)就停止,這好像不是一個好建議。2)k個質(zhì)心應(yīng)該達(dá)到收斂,即第n次計算出的n個質(zhì)心在第n+1次迭代時候位置不變。3)n個文檔達(dá)到收斂,即第n次計算出的n個文檔分類和在第n+1次迭代時候文檔

4、分類結(jié)果相同。4)RSS值小于一個閥值,實際中往往把這個條件結(jié)合條件1使用模糊參數(shù)可以取大于或等于的任何值,但當(dāng)時,聚類結(jié)果最滿意(),所以一般取=模糊均值聚類也叫模糊聚類r該方法的結(jié)果是用隸屬度表示,表明屬于某種類型的程度。它是目前唯一的重疊分類方法。KmGt1.2.3.設(shè)定聚類數(shù)號疋”最大執(zhí)行曝邊”啲容忍誤差0決定聚類中心起始位置黠,0j0Kf0YLX山心vAAAZ(A)fi)rj=l!,N-計算各數(shù)據(jù)點到聚類中心的距離=rC=K.K-(ii)計算數(shù)據(jù)點屬于哪隈類(隸屬度矩陣嚴(yán)=LargminJ0.otherwiseA(B)更新聚類中心c;=冃1.噩豫號盼廠肝I0決定聚類中心起始位置灌幾0勺三疋,JkfoFj=1計算隸屬度矩陣”常=工fi)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論