聚類分析的SPSS實現課件_第1頁
聚類分析的SPSS實現課件_第2頁
聚類分析的SPSS實現課件_第3頁
聚類分析的SPSS實現課件_第4頁
聚類分析的SPSS實現課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

用SPSS作聚類分析以經濟效益數據為例,用聚類分析法對各省市作分類(見spssex-4/全國各省市經濟效益數據)以城鎮(zhèn)居民消費資料為例,用聚類分析法對各省市作分類(見spssex-4/城鎮(zhèn)居民消費支出資料)

用SPSS作聚類分析以經濟效益數據為例,用聚類分析法對各省市SPSS中的聚類分析Spss中的聚類功能常用的有兩種:快速聚類(迭代過程):

K-MeansCluster系統(tǒng)聚類:HierarchicalClusterSPSS中的聚類分析Spss中的聚類功能常用的有兩種:一、HierarchicalCluster聚類系統(tǒng)聚類由兩種方法:分解法和凝聚法。系統(tǒng)聚類的功能:即可進行樣品的聚類,也可進行變量的聚類。系統(tǒng)聚類的原理:即我們前面介紹過的系統(tǒng)聚類方法的原理和過程。一、HierarchicalCluster聚類系統(tǒng)聚類由兩系統(tǒng)聚類的中要進行以下的選擇:數據的標準化測度方法的選擇:距離方法的選擇或相似性、關聯程度的選擇。聚類方法的選擇:即以什么方法聚類,spss中提供了7中方法可進行選擇。輸出圖形的選擇:樹形圖或冰柱圖。系統(tǒng)聚類的中要進行以下的選擇:系統(tǒng)聚類

系統(tǒng)聚類

見(一)聚類方法見(二)各種距離和相似系數見(一)聚類方法見(二)各種距離和相似系數Method聚類方法標準化變換親疏關系指標Method聚類方法標準化變換親疏關系指標(一)聚類方法1.Between-groupslinkage類間平均法兩類距離為兩類元素兩兩之間平均平方距離2.Within-groupslinkage類內平均法兩類距離為合并后類中可能元素兩兩之間平均平方距離3.Nearestneighbor最短距離法4.Furthestneighbor最長距離法5.Centroidclustering重心法(歐式距離)6.Medianclustering中間距離法(歐式距離)7.WardMethod離差平方法(歐式距離)(一)聚類方法

1.squaredeuclideandistance

平方歐式距離2.euclideandistance

歐式距離3.cosine

夾角余弦(R型)4.pearsoncorrelation

皮爾遜相關系數(R)5.chebychev

切比雪夫距離(二)各種距離和相似系數(親疏關系指標)(二)各種距離和相似系數(親疏關系指標)6.block絕對值距離7.minkowski明考斯基8.customized

6.block絕對值距離聚類分析的SPSS實現課件Statistics聚類進度表相似矩陣樣品或變量的分類情況Statistics聚類進度表相似矩陣樣品或變量的分類情況聚類分析的SPSS實現課件

凝聚狀態(tài)表的第一列表示聚類分析的第幾步;第二列、第三列表示本步聚類中哪兩個樣本或小類聚成一類;第四列是相應的樣本距離或小類距離;第五列、第六列表明本步聚類中,參與聚類的是樣本還是小類。0表示樣本,數字n(非0)表示由第n步聚類產生的小類參與本步聚類;第七列表示本步聚類的結果將在下面聚類的第幾步中用到。凝聚狀態(tài)表的第一列表示聚類分析的第幾步聚類分析的SPSS實現課件Plot樹狀結構圖冰柱圖冰柱的方向Plot樹狀結構圖冰柱圖冰柱的方向NumberofclustersCase

X7

X5

X4

X3

X6

X8

X2

X11XXXXXXXXXXXXXXX2XXXXXXXXXXXXX

X3X

XXXXXXXXXXX

X4X

XXXXX

XXXXX

X5X

XXX

X

XXXXX

X6X

X

X

X

XXXXX

X7X

X

X

X

X

XXX

XVerticalIcicle67NumberofclustersCaseX5X4

冰柱圖因其樣子非常象冬天房頂垂下的冰柱得名,它以圖形的方式顯示層次聚類分析結果,一般從冰柱圖的最后一行開始觀察,第一列表示類數。兩樣品之間的“х”表示將其兩邊的樣品(類)聯結起來聚成新類。冰柱圖因其樣子非常象冬天房頂垂下的冰柱得聚類分析的SPSS實現課件應用舉例:4-1應用舉例:4-1

首先對表4-1中的原始數據進行標準化變換處理,經過運算使數據標準化得到表4-2,使它的每列數據的平均值為0,方差為1,這樣表4-1中5列具有不同量綱、不同數量級的數據不同地區(qū)數據求出歐氏距離。就能放在一起比較;其次用表4-2中經過標準化處理后的30個首先對表4-1中的原始數據進行標準化變換處聚類分析的SPSS實現課件聚類分析的SPSS實現課件表4-1表4-1聚類分析的SPSS實現課件表4-2表4-2聚類分析的SPSS實現課件聚類分析的SPSS實現課件K-MeansCluster聚類K-MeansCluster聚類K-MeansCluster原理首先,選擇n個數值型變量參與聚類分析,最后要求的聚類數為k個;其次,由系統(tǒng)選擇k個(聚類的類數)觀測量(也可由用戶指定)作為聚類的種子。第三,按照距離這些類中心的距離最小的原則把所有觀測量(樣品)分派到各類重心所在的類中去。第四,這樣每類中可能由若干個樣品,計算每個類中各個變量的均值,以此作為第二次迭代的中心;第五,然后根據這個中心重復第三、第四步,直到中心的迭代標準達到要求時,聚類過程結束。K-MeansCluster原理首先,選擇n個數值型變量參K-MeansCluster聚類過程由Analyze——Classify

——K-MeansCluster將個變量放入Variable;輸入最后聚類的個數;K-MeansCluster聚類過程由Analyze——C例飲料數據(spssex/drink.sav)16種飲料的熱量、咖啡因、鈉及價格四種變量

例飲料數據(spssex/drink.sav)16種飲

快速聚類快速聚類選項讀寫凝聚點人為固定分類數ANOVA表,初始凝聚點等選項讀寫凝聚點人為固定分類數ANOVA表,快速聚類法的聚類數由用戶指定,分類是唯一的。1.分類數:如希望聚成K類2.聚類方法:method:iterateandclussify(聚類分析的

clussifyonly(聚類分析過程類中心3.聚類中心:centers4.迭代次數:iterate5.保存分類結果:save每一步都重新計算新的類中心點)點始終為初始類中心點,僅作一次迭代)快速聚類法的聚類數由用戶指定,分類是唯一的。每一步都重新計算InitialClusterCenter:快速聚類的初始類中心點(本例由系統(tǒng)自行指定四個類的初始類中心點)指定聚成四類InitialClusterCenter:快速聚類的初始IterationHistory:快速聚類的迭代步驟在迭代過程中,完成第一次迭代后形成的四個新類中心點距初始類中心點的歐氏距離分別為5.065、12.532、12.275、25.901。第四次迭代后形成的四個新類中心點幾乎與上次確定的中心點沒有差別。經過四次迭代,快速聚類完成。IterationHistory:快速聚類的迭代步驟快速聚類的最終類中心點快速聚類的最終類中心點NumberofCasesineachCluster:快速聚類的最終結果快速聚類的類成員情況各樣本距其所在的類中心的歐氏距離各類中的成員數NumberofCasesin快速聚類的類成員情況各人有了知識,就會具備

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論