spss聚類分析教程課件_第1頁
spss聚類分析教程課件_第2頁
spss聚類分析教程課件_第3頁
spss聚類分析教程課件_第4頁
spss聚類分析教程課件_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2022/12/141基本統(tǒng)計分析有了數(shù)據,可以利用SPSS的各種分析方法進行分析,但選擇何種統(tǒng)計分析方法,即調用哪個統(tǒng)計分析過程,是得到正確分析結果的關鍵SPSS有數(shù)字分析和作圖分析兩類方法2022/12/142基本統(tǒng)計分析概述目錄上頁下頁返回結束基本統(tǒng)計分析是進行其他更深入的統(tǒng)計分析的前提,通過基本統(tǒng)計分析,用戶可以對分析數(shù)據的總體特征有比較準確的把握,從而選擇更為深入的分析方法對分析對象進行研究。在SPSS的Analyze菜單中包括了一系列統(tǒng)計分析過程。其中Reports和DescriptiveStatistics命令項中包括的功能是對單變量的描述統(tǒng)計分析DescriptiveStatistics包括的統(tǒng)計功能有:Frequencies:頻數(shù)分析Descriptives:描述統(tǒng)計量分析Explore:探索分析Crosstabs:多維頻數(shù)分布交叉表(列聯(lián)表)2022/12/145目錄上頁下頁返回結束SPSS數(shù)值統(tǒng)計分析過程均在Analyze菜單中基本統(tǒng)計分析:Reports,DescriptiveStatisticsb、均值比較與檢驗:CompareMeansd、方差分析:ANOVAModelsb、相關分析:Correlatee、回歸分析:Regressionf、聚類與判別:Classifyg、因子分析:DataReductionh、非參數(shù)檢驗:NonparametricTests

等等2022/12/146第一章聚類分析聚類分析的基本思想聚類分析上機實現(xiàn)2022/12/147§1.1聚類分析的思想目錄上頁下頁返回結束我們認為,所研究的樣品或指標(變量)之間是存在著程度不同的相似性(親疏關系)。于是根據一批樣品的多個觀測指標,具體找出一些能夠度量樣品或指標之間的相似程度的統(tǒng)計量,以這些統(tǒng)計量為劃分類型的依據,把一些相似程度較大的樣品(或指標)聚合為一類,把另外一些彼此之間相似程度較大的樣品(或指標)又聚合為另外一類,…。關系密切的聚合到一個小的分類單位,關系疏遠的聚合到一個大的分類單位,直到把所有的樣品(或指標)都聚合完畢,把不同的類型一一劃分出來,形成一個由小到大的分類系統(tǒng)。最后再把整個分類系統(tǒng)畫成一張分群圖(又稱譜系圖),用它把所有的樣品(或指標)間的親疏關系表示出來。2022/12/148目錄上頁下頁返回結束對樣品的分類常稱為Q型聚類分析對變量的分類常稱為R型聚類分析2022/12/1410目錄上頁下頁返回結束2022/12/1412目錄上頁下頁返回結束第一位重要的問題是“什么是類”?粗糙地講,相似樣品(或指標)的集合稱作類。。

聚類分析給人們提供了豐富多采的方法進行分類,這些方法大致可歸納為:(1)系統(tǒng)聚類法。(2)模糊聚類法。(3)K-均值法。(4)有序樣品的聚類。(5)分解法。(6)加入法。2022/12/1414目錄上頁下頁返回結束(2)最長距離法(farthestneighbor或completelinkagemethod)。2022/12/1415目錄上頁下頁返回結束(3)類平均法(groupaveragemethod)。

2022/12/1416目錄上頁下頁返回結束(4)重心法(Centroidmethod)。

(5)離差平方和法(SumofSquaresmethod)。

2022/12/14中國人民大學六西格瑪質量管理研究中心17§1.3系統(tǒng)聚類法目錄上頁下頁返回結束系統(tǒng)聚類法(hierarchicalclusteringmethod)在聚類分析中諸方法中用的最多,包含下列步驟:

2022/12/1418目錄上頁下頁返回結束注:不同的距離定義方式用到系統(tǒng)聚類程序中,得到不同的系統(tǒng)聚類法。我們現(xiàn)在通過一個簡單的例子,來說明各種系統(tǒng)聚類法。2022/12/1420§1.5案例研究目錄上頁下頁返回結束例3我們以2005年31個省、市、自治區(qū)的城鎮(zhèn)居民月平均消費支出數(shù)據為例,在SPSS中利用K-均值法對31個省、市、自治區(qū)的城鎮(zhèn)居民消費水平進行聚類分析。在SPSS中依次點擊“Analyze”→“Classify”→“K-MeansCluster”,打開K-MeansClusterAnalysis對話框,將8個變量選入Variable框中,將表示地區(qū)的變量選入LabelCasesBy欄中,將分類數(shù)(Numberofclusters)定為3。另外,點擊Iterate按鈕可以在其中輸入最大迭代次數(shù)(Maximumiterations)和收斂標準(Convergencecriterion);在Save按鈕中可以選擇保存樣本的聚類結果(Clustermembership)和各樣本距各自中心點的距離(Distancefromclustercenter);在Options按鈕中可以選擇輸出初始類中心點、方差分析表等結果,讀者可以根據實際情況來選擇。點擊“OK”得到聚類結果如下:2022/12/14中國人民大學六西格瑪質量管理研究中心21目錄上頁下頁返回結束2022/12/1423目錄上頁下頁返回結束上面介紹的幾種系統(tǒng)聚類方法,并類的原則和步驟基本一致,所不同的是類與類的距離有不同的定義。其實可以把這幾種方法統(tǒng)一起來,有利于在計算機上靈活地選擇更有意義的譜系圖。

2022/12/1424目錄上頁下頁返回結束當然,也可以采用歐氏距離分別用類平均法、最短距離法、最長距離法把31個省市分類。類平均法聚類在SPSS中的操作為:點選“Analyze”→“Classify”→“HierarchicalCluster”,打開HierarchicalClusterAnalysis對話框,將八個聚類指標選入Variables欄中,將表示地區(qū)的變量選入LabelCasesBy欄中,按“Plots”按鈕,在彈出的窗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論