模糊聚類(lèi)案例分析_第1頁(yè)
模糊聚類(lèi)案例分析_第2頁(yè)
模糊聚類(lèi)案例分析_第3頁(yè)
模糊聚類(lèi)案例分析_第4頁(yè)
模糊聚類(lèi)案例分析_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、模糊數(shù)學(xué)方法及其應(yīng)用論文題目: 模糊聚類(lèi)方法案例分析 小組成員:王季光 宋申輝 蘭潔 陳倩蕓 肖侖 楊洋 吳云峰2013年 10 月 27 日模糊聚類(lèi)分析方法1.1距離和相似系數(shù)為了將樣品(或指標(biāo))進(jìn)行分類(lèi),就需要研究樣品之間關(guān)系。目前用得最多的方法有兩個(gè):一種方法是用相似系數(shù),性質(zhì)越接近的樣品,它們的相似系數(shù)的絕對(duì)值越接近1,而彼此無(wú)關(guān)的樣品,它們的相似系數(shù)的絕對(duì)值越接近于零。比較相似的樣品歸為一類(lèi),不怎么相似的樣品歸為不同的類(lèi)。另一種方法是將一個(gè)樣品看作P維空間的一個(gè)點(diǎn),并在空間定義距離,距離越近的點(diǎn)歸為一類(lèi),距離較遠(yuǎn)的點(diǎn)歸為不同的類(lèi)。但相似系數(shù)和距離有各種各樣的定義,而這些定義與變量的類(lèi)

2、型關(guān)系極大,因此先介紹變量的類(lèi)型。由于實(shí)際問(wèn)題中,遇到的指標(biāo)有的是定量的(如長(zhǎng)度、重量等),有的是定性的(如性別、職業(yè)等),因此將變量(指標(biāo))的類(lèi)型按以下三種尺度劃分:間隔尺度:變量是用連續(xù)的量來(lái)表示的,如長(zhǎng)度、重量、壓力、速度等等。在間隔尺度中,如果存在絕對(duì)零點(diǎn),又稱(chēng)比例尺度,本書(shū)并不嚴(yán)格區(qū)分比例尺度和間隔尺度。有序尺度:變量度量時(shí)沒(méi)有明確的數(shù)量表示,而是劃分一些等級(jí),等級(jí)之間有次序關(guān)系,如某產(chǎn)品分上、中、下三等,此三等有次序關(guān)系,但沒(méi)有數(shù)量表示。名義尺度:變量度量時(shí)、既沒(méi)有數(shù)量表示,也沒(méi)有次序關(guān)系,如某物體有紅、黃、白三種顏色,又如醫(yī)學(xué)化驗(yàn)中的陰性與陽(yáng)性,市場(chǎng)供求中的“產(chǎn)”和“銷(xiāo)”等。不同

3、類(lèi)型的變量,在定義距離和相似系數(shù)時(shí),其方法有很大差異,使用時(shí)必須注意。研究比較多的是間隔尺度,因此本章主要給出間隔尺度的距離和相似系數(shù)的定義。設(shè)有個(gè)樣品,每個(gè)樣品測(cè)得項(xiàng)指標(biāo)(變量),原始資料陣為其中為第個(gè)樣品的第個(gè)指標(biāo)的觀測(cè)數(shù)據(jù)。第個(gè)樣品為矩陣的第行所描述,所以任何兩個(gè)樣品與之間的相似性,可以通過(guò)矩陣X中的第K行與第L行的相似程度來(lái)刻劃;任何兩個(gè)變量與之間的相似性,可以通過(guò)第列與第列的相似程度來(lái)刻劃。1.2 F相似關(guān)系 1.2.1定義設(shè),如果具有自反和對(duì)稱(chēng)關(guān)系,則稱(chēng)為上的一個(gè)相似關(guān)系(表示模糊)當(dāng)論域?yàn)橛邢迺r(shí),相似關(guān)系可以用矩陣表示。具有F相似關(guān)系的矩陣,稱(chēng)為相似矩陣。在實(shí)際應(yīng)用時(shí),通常只能得

4、到自反矩陣和對(duì)稱(chēng)舉證,即相似矩陣?,F(xiàn)在的問(wèn)題是對(duì)具有相似關(guān)系的元素怎樣進(jìn)行分類(lèi),也就是如何將相似矩陣改造為等價(jià)矩陣。1.2.2 定理若,則稱(chēng)為對(duì)稱(chēng)矩陣。(1)若(是單位矩陣),則稱(chēng)為自反矩陣。(2)若,則稱(chēng)為傳遞的關(guān)系。(3)若滿(mǎn)足上面三點(diǎn)則稱(chēng)為等價(jià)矩陣。定理1:相似矩陣的傳遞閉包是等價(jià)矩陣,且。證 只需要證明是自反的、對(duì)稱(chēng)的。因是自反的,故,。不難得到不減,因此,即是自反的。因?yàn)?,故是?duì)稱(chēng)的。有定理1可見(jiàn),要想將相似矩陣改變?yōu)榈葍r(jià)矩陣,只需求相似矩陣的傳遞閉包。定理2:設(shè)是自反矩陣,則任意自然數(shù),都有證由自反性推得當(dāng)時(shí),有1.3 聚類(lèi)分析所謂聚類(lèi)分析,就是用數(shù)學(xué)的方法對(duì)事物進(jìn)行分類(lèi),它有廣泛

5、的實(shí)際應(yīng)用。在模糊數(shù)學(xué)產(chǎn)生之前,聚類(lèi)分析已是數(shù)理統(tǒng)計(jì)多元分析的一個(gè)分支,然而現(xiàn)實(shí)的分類(lèi)問(wèn)題往往伴有模糊性。例如,環(huán)境污染分類(lèi)、春天連陰雨預(yù)報(bào)、臨床癥狀資料分類(lèi)、巖石分類(lèi),等等。對(duì)這些伴有模糊性的聚類(lèi)問(wèn)題,用模糊數(shù)學(xué)語(yǔ)言來(lái)表達(dá)更為自然。模糊聚類(lèi)分析的步驟:第一步:數(shù)據(jù)標(biāo)準(zhǔn)化數(shù)據(jù)矩陣設(shè)論域?yàn)楸环诸?lèi)的對(duì)象,每個(gè)對(duì)象由m個(gè)指標(biāo)表示其性狀,即于是得到原始數(shù)據(jù)矩陣為數(shù)據(jù)標(biāo)準(zhǔn)化在實(shí)際問(wèn)題中,不同的數(shù)據(jù)一般有不同的量綱。為了使有不同的量綱的量也能進(jìn)行比較,通常需要對(duì)數(shù)據(jù)作適當(dāng)?shù)淖儞Q。但是,即使這樣,得到的數(shù)據(jù)也不一定在區(qū)間0,1上。因此,這里說(shuō)的數(shù)據(jù)標(biāo)準(zhǔn)化,就是要根據(jù)模糊矩陣的要求,將數(shù)據(jù)壓縮到區(qū)間0,1上。

6、通常需要作如下集中變換。1) 平移標(biāo)準(zhǔn)差變換2) 平移極差變換3) 對(duì)數(shù)變換第二步標(biāo)定(建立模糊相似矩陣)設(shè)為待分類(lèi)的全體。其中每一待分類(lèi)對(duì)象由一組數(shù)據(jù)表征如下:現(xiàn)在的問(wèn)題是如何建立和之間的相似關(guān)系。這有許多方法(這里選一些,列在下面),我們可以按照實(shí)際情況,選其中一種來(lái)求與的相似關(guān)系。(1)形似系數(shù)法數(shù)量積法其中M為一適當(dāng)選擇之正數(shù),滿(mǎn)足夾角余弦法相關(guān)系數(shù)法其中 最大最小法算術(shù)平均最小法幾何平均最小法絕對(duì)值指數(shù)法絕對(duì)值減數(shù)法其中,適當(dāng)選取,使。(2)距離法1)直接距離法海明距離歐幾里得距離切比雪夫距離2) 倒數(shù)距離法3) 指數(shù)距離法選擇上述哪一個(gè)方法好,要按實(shí)際情況而定。在實(shí)際應(yīng)用時(shí),最好采

7、用多種方法,選取分類(lèi)最符合實(shí)際的結(jié)果。第三步聚類(lèi)(求動(dòng)態(tài)聚類(lèi)圖)。由第一步得到的矩陣一般只滿(mǎn)足自反性和對(duì)稱(chēng)性,即是相似矩陣,需將它改造成模糊等價(jià)矩陣。為此,采用平方法求出的傳遞閉包,便是所求的模糊等價(jià)矩陣。通過(guò)便可對(duì)進(jìn)行分類(lèi)。實(shí)際應(yīng)用具體問(wèn)題如下:地區(qū)生產(chǎn)總值(當(dāng)年價(jià)格)(億元);:第一產(chǎn)業(yè)增加值;:第二產(chǎn)業(yè)增加值;:第三產(chǎn)業(yè)增加值;:地方財(cái)政一般預(yù)算內(nèi)收入;:工業(yè)企業(yè)數(shù)(個(gè));:工業(yè)總產(chǎn)值(當(dāng)年價(jià)格)(萬(wàn)元);:從業(yè)人員年平均人數(shù)(萬(wàn)人);:流動(dòng)資產(chǎn)年平均余額(萬(wàn)元) ;:主營(yíng)業(yè)務(wù)收入(萬(wàn)元):利潤(rùn)總額(萬(wàn)元);:移動(dòng)電話(huà)年末用戶(hù)數(shù)(萬(wàn)戶(hù));:國(guó)際互聯(lián)網(wǎng)用戶(hù)數(shù)(戶(hù));:公路里程;:普通中學(xué)學(xué)生數(shù)(萬(wàn)人);:醫(yī)院、衛(wèi)生院數(shù)(個(gè));:醫(yī)生數(shù)(執(zhí)業(yè)醫(yī)師+執(zhí)業(yè)助理醫(yī)師)(個(gè))。17項(xiàng)指標(biāo)來(lái)描述江西省11各市區(qū)經(jīng)濟(jì)發(fā)展水平情況。現(xiàn)將11個(gè)不同經(jīng)濟(jì)發(fā)展水平的市區(qū)進(jìn)行聚類(lèi)。標(biāo)準(zhǔn)差變換下夾角余弦法構(gòu)造相似矩陣R采用傳遞閉包法進(jìn)行聚類(lèi),得到的動(dòng)態(tài)聚類(lèi)圖如下:標(biāo)準(zhǔn)差

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論