聚類分析作業(yè)_第1頁(yè)
聚類分析作業(yè)_第2頁(yè)
聚類分析作業(yè)_第3頁(yè)
聚類分析作業(yè)_第4頁(yè)
聚類分析作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGE5PAGE7各地區(qū)社會(huì)總產(chǎn)值的部門(mén)構(gòu)成的聚類聚類分析作業(yè)組員:§1.對(duì)題目的理解與分析題目:對(duì)各地區(qū)社會(huì)總產(chǎn)值的部門(mén)構(gòu)成進(jìn)行聚類分析社會(huì)總產(chǎn)值:是指一定時(shí)期內(nèi)(通常為1年)以貨幣表現(xiàn)的農(nóng)業(yè)、工業(yè)、建筑業(yè)、運(yùn)輸郵電業(yè)和商業(yè)(包括飲食業(yè)和物資供銷業(yè))五大物質(zhì)生產(chǎn)部門(mén)的總產(chǎn)值之和,也稱社會(huì)總產(chǎn)品。它是反映一個(gè)國(guó)家或地區(qū)在一定時(shí)期內(nèi)物質(zhì)生產(chǎn)總成果的重要指標(biāo)。部門(mén)構(gòu)成:工業(yè)、農(nóng)業(yè)、建筑業(yè)、貨物運(yùn)輸業(yè)、為生產(chǎn)服務(wù)的郵電業(yè)、商業(yè)、物資供銷業(yè)及飲食業(yè)聚類分析:從統(tǒng)計(jì)學(xué)的觀點(diǎn)看,聚類分析是通過(guò)數(shù)據(jù)建模簡(jiǎn)化數(shù)據(jù)的一種方法。傳統(tǒng)的統(tǒng)計(jì)聚類分析方法包括系統(tǒng)聚類法、分解法、加入法、動(dòng)態(tài)聚類法、有序樣品聚類、有重疊聚類和模糊聚類等。通過(guò)對(duì)此題的理解以及分析,我們可以確定此題的目的是:對(duì)變量(部門(mén)構(gòu)成)進(jìn)行聚類,而非個(gè)案(各地區(qū))§2.數(shù)據(jù)的查找有了對(duì)題目的理解,才能有針對(duì)性性的去查找數(shù)據(jù),只有這樣,數(shù)據(jù)才能與之匹配,所做的分析才有意義。數(shù)據(jù)來(lái)源:中國(guó)統(tǒng)計(jì)局網(wǎng)——《2009年個(gè)地區(qū)生產(chǎn)總值》數(shù)據(jù)鏈接:各地區(qū)社會(huì)總產(chǎn)值部門(mén)構(gòu)成.sav§3.操作步驟1)打開(kāi)數(shù)據(jù)文件后,進(jìn)行如下步驟:Analyze Classify HierarchicalClusterAnalysis將除“地區(qū)”外的所有變量選入Variable(s)列表框,作為分層聚類的變量在Cluster選項(xiàng)組中選擇Variable單項(xiàng)按鈕,即要求按變量進(jìn)行聚類4)在Statistics中點(diǎn)選Proximitymatrix,即畫(huà)出相似矩陣單擊Continue按鈕確認(rèn)選擇并返回主對(duì)話框5)單擊Plot按鈕:Plot對(duì)話框中選擇Dendrogram復(fù)選框,要求輸出樹(shù)形圖。單擊Continue按鈕確認(rèn)選擇并返回主對(duì)話框6)單擊Method按鈕:ClusterMethod復(fù)選框中選擇CentroidClustering,即重心法聚類;在Measure中的interval復(fù)選框中點(diǎn)選Euclideandistant,即歐氏距離。單擊Continue按鈕確認(rèn)選擇并返回主對(duì)話框7)單擊OK按鈕,執(zhí)行分層聚類操作§4.輸出結(jié)果分析說(shuō)明:此題我們采用歐氏距離公式計(jì)算兩個(gè)體K個(gè)變量值之差的平方和的平方根,和重心法進(jìn)行聚類分析。重心法,以兩個(gè)類的重心之間的距離作為類與類之間的距離進(jìn)行聚類分析。其歐氏距離公式為:是個(gè)體的第個(gè)變量的變量值,是個(gè)體的第個(gè)變量的變量值。1)相似矩陣分析ProximityMatrixCaseMatrixFileInputZscore(農(nóng)業(yè))Zscore(工業(yè))Zscore(建筑業(yè))Zscore(交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè))Zscore(批發(fā)和零售業(yè))Zscore(住宿和餐飲業(yè))Zscore(金融業(yè))Zscore(房地產(chǎn)業(yè))Zscore(其他服務(wù)業(yè))Zscore(農(nóng)業(yè)).0003.8283.2823.9165.1553.9826.6615.5345.258Zscore(工業(yè))3.828.0002.0722.0642.0141.8584.0232.5872.924Zscore(建筑業(yè))3.2822.072.0002.7512.9913.0014.6843.5413.737Zscore(交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè))3.9162.0642.751.0002.7902.9534.4823.3923.355Zscore(批發(fā)和零售業(yè))5.1552.0142.9912.790.0002.4282.6321.3051.900Zscore(住宿和餐飲業(yè))3.9821.8583.0012.9532.428.0003.8972.5692.333Zscore(金融業(yè))6.6614.0234.6844.4822.6323.897.0002.0032.399Zscore(房地產(chǎn)業(yè))5.5342.5873.5413.3921.3052.5692.003.0001.630Zscore(其他服務(wù)業(yè))5.2582.9243.7373.3551.9002.3332.3991.630.000從表中可得到,各變量間的歐式距離,先找到變量間距離最短的合為一類,即把房地產(chǎn)業(yè)和金融業(yè)先合為一類。按照此原則,由重心法依次聚類,得到下表(聚類過(guò)程)。2)分層聚類中的凝聚狀態(tài)表分析Centroid

LinkageAgglomerationScheduleStageClusterCombinedCoefficientsStageClusterFirstAppearsNextStageCluster1Cluster2Cluster1Cluster21581.3050022591.4391033571.8072054261.8580055251.6414366242.1595077232.1206088123.478070表中:第一列表示聚類分析的第幾步;第二列、第三列表示本步聚類中哪兩個(gè)樣本或小類聚成一類;第四列是個(gè)體距離或小類距離;第五列表示Cluster1上一次在第幾步聚類中出現(xiàn);第六列表示Cluster2上一次在第幾步聚類中出現(xiàn);第七列表示本步聚類的結(jié)果將在以下第幾步中用到。此表顯示了九個(gè)部門(mén)聚類的情況。例如:在聚類分析的第一步中,5號(hào)部門(mén)與8號(hào)部門(mén)聚成一小類,他們的個(gè)體距離(歐氏距離)是1.305,這個(gè)小類將在下面的第2步用到;同理,聚類分析的第2步中,9號(hào)部門(mén)與第一步聚成的小類(以該小類中第一個(gè)部門(mén)號(hào)5為標(biāo)記)又聚成一小類,它們的距離是1.439,形成的小類將在下面的第四步用到。經(jīng)過(guò)8步聚類過(guò)程,9個(gè)部門(mén)最后聚成了一大類。第n步完成時(shí)可形成“”個(gè)類。3)冰川圖分析VerticalIcicleNumberofclustersCaseZscore(建筑業(yè))Zscore(交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè))Zscore(金融業(yè))Zscore(其他服務(wù)業(yè))Zscore(房地產(chǎn)業(yè))Zscore(批發(fā)和零售業(yè))Zscore(住宿和餐飲業(yè))Zscore(工業(yè))Zscore(農(nóng)業(yè))1XXXXXXXXXXXXXXXXX2XXXXXXXXXXXXXXXX3XXXXXXXXXXXXXXX4XXXXXXXXXXXXXX5XXXXXXXXXXXXX6XXXXXXXXXXXX7XXXXXXXXXXX8XXXXXXXXXX由此圖可知:當(dāng)聚成四類時(shí),(批發(fā)和零售業(yè)、金融業(yè)、房地產(chǎn)業(yè)

、住宿和餐飲業(yè))為一類,交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)、建筑業(yè)和農(nóng)業(yè)分別自成一類。當(dāng)聚成三類時(shí),(批發(fā)和零售業(yè)、交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)、金融業(yè)、房地產(chǎn)業(yè)

、住宿和餐飲業(yè))為一類,建筑業(yè)和農(nóng)業(yè)分別自成一類。當(dāng)聚成二類時(shí),其他服務(wù)業(yè)、批發(fā)和零售業(yè)、金融業(yè)、房地產(chǎn)業(yè)、建筑業(yè)、交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)

、工業(yè)、住宿和餐飲業(yè)合并為一類,農(nóng)業(yè)為一類。4)分層聚類的譜系圖分析

Dendrogram

using

Centroid

Method

Rescaled

Distance

Cluster

Combine

C

A

S

E

0

5

10

15

20

25

Label

Num

++++++

Z批發(fā)和

5

─┬─┐

Z房地產(chǎn)

8

─┘

├───────┐

Z其他服

9

───┘

├─┐

Z金融業(yè)

7

───────────┘

├─────┐

Z工業(yè)

2

─────────────┤

Z住宿和

6

─────────────┘

├─────────────────────────────┐

Z交通運(yùn)

4

───────────────────┤

Z建筑業(yè)

3

───────────────────┘

Z農(nóng)業(yè)

1

─────────────────────────────────────────────────┘如圖所示:第一次是批發(fā)和零售業(yè)與房地產(chǎn)業(yè)合并;第二次是其他服務(wù)業(yè)與(批發(fā)和零售業(yè)和房地產(chǎn)業(yè))合并;第三次是金融業(yè)與(其他服務(wù)業(yè)、批發(fā)和零售業(yè)和房地產(chǎn)業(yè))合并;第四次是工業(yè)、住宿和餐飲業(yè)與(金融業(yè)、其他服務(wù)業(yè)、批發(fā)和零售業(yè)和房地產(chǎn)業(yè));第五次是建筑業(yè)、交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論