主成分和聚類分析_第1頁
主成分和聚類分析_第2頁
主成分和聚類分析_第3頁
主成分和聚類分析_第4頁
主成分和聚類分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、主成分與聚類分析首先通過SPSS軟件對環(huán)境污染的相應指標進行主成分分析,得到:提取Y1、Y2、Y3和Y4四個主成分,其累積貢獻率已經(jīng)達到,超過80%,代表所有環(huán)境污染指標的絕大部分信息。Y1偏向于解釋工業(yè)氫氧化物排放量,Y2偏向于解釋生活煙塵排放量,Y3偏向于解釋生活廢水排放量,Y4偏向于解釋工業(yè)二氧化硫排放量。然后,根據(jù)主成分分析結(jié)果,用Z=*Y1+*Y2+*Y3+0.06519*Y4計算綜合得分,見下表1。表1環(huán)境污染地區(qū)的主成分綜合得分表序號地區(qū)Z排名序號地區(qū)Z排名1北京517武漢132天津418長沙283石家莊619廣州194太原820南寧245呼和浩特1221???16沈陽1722重

2、慶17長春1623成都208哈爾濱224貴陽189上海325昆明2610南京1526拉薩3011杭州927西安712合肥2128蘭州2313福州2529西寧1114南昌2930銀川2715濟南1031烏魯木齊2216鄭州14最后將環(huán)境污染的綜合得分作為個案進行層次聚類分析,將31個地區(qū)分為5類,如表2。表2 各地區(qū)污染分類分類污染情況地區(qū)1輕度污染??凇⒗_2比較輕度污染合肥、烏魯木齊、福州、南寧、蘭州、,昆明、成都、銀川、南昌、長沙、沈陽、長春、南京、廣州、貴陽、鄭州、武漢、濟南、西寧、呼和浩特3污染情況一般太原、杭州、石家莊、西安4污染比較嚴重北京、天津5污染十分嚴重上海、哈爾濱、重慶主成

3、分分析和聚類分析在SPSS中的操作過程打開SPSS,“文件-打開-數(shù)據(jù)”,選中excel,如下圖結(jié)果。首先將變量標準化,“分析-描述統(tǒng)計-描述”,將變量全部選入對話框,點上“將標準化得分另存為變量(Z)”,結(jié)果如下。在做主成分分析,“分析-降維-因子分析”,將為標準化的變量選入對話框。選擇右側(cè)“描述”,在彈出來對話框中點上“系數(shù)、顯著性水平、KMO和Bartlett的球形度檢驗”,點“繼續(xù)”。選擇右側(cè)“抽取”,在彈出來對話框中將方法改成“主成分”,“基于特征值”改成“0.6”,點“繼續(xù)”。選擇右側(cè)“旋轉(zhuǎn)”,在彈出來對話框中,將方法改成“最大方差法”,點“繼續(xù)”。首先輸出的各自變量的相關(guān)矩陣,由

4、下圖可見,各自變量間存在顯著性相關(guān)。說明有必要進行因子分析。接著輸出的是KMO和Bartlett的檢驗,結(jié)果如下圖,由表可見,KMO是Kaiser-Meyer-Olkin的取樣適當性度量,當KM0越大時,表示變量間的共同因素越多,越適合進行因子分析,此處KMO大于,表示可進行因子分析。此外,Bartlett球形檢驗的近似卡方分布為(自由度為45)達到顯著,代表有共同因素存在,適合進行因素分析。同時,Bartlett球度檢驗給出的相伴概率為,小于顯著性水平,故適合進行因子分析。隨后輸出的解釋的總方差,由下圖可見,主成分個數(shù)為4時,累積貢獻率已經(jīng)達到82.037%,超過80%。故本次因子分析中提取

5、4個因子,我們分別稱之為F1,F(xiàn)2,F(xiàn)3,F(xiàn)4。在下面的成分矩陣圖中可以看出,F(xiàn)1主要是和工業(yè)氫氧化物排放量有關(guān),F(xiàn)2主要和生活煙塵排放量有關(guān),F(xiàn)3主要和生活廢水排放量有關(guān),F(xiàn)4主要和工業(yè)二氧化硫排放量有關(guān)。隨后將成分矩陣表中的系數(shù)復制到數(shù)據(jù)窗口,并將變量名命名為a1,a2,a3,a4。再在數(shù)據(jù)窗口點擊“轉(zhuǎn)換-計算變量”,將目標變量t1=a1/SQRT(4.323)。(括號內(nèi)為對應主成分的初始特征值),依次算出t2,t3,t4。則可知道Y1=0.382*Z工業(yè)廢水排放量*Z工業(yè)化學需氧量排放量*Z工業(yè)二氧化硫排放量*Z工業(yè)煙塵排放量*工業(yè)氫氧化物排放量*Z生活廢水排放量+0.357*Z生活化學需氧量排放量+0.320*Z生活二氧化硫排放量+0.136*Z生活煙塵排放量+0.261*Z生活氫氧化物排放量,依次依據(jù)t2,t3,t4得到Y(jié)2,Y3,Y4。再依據(jù)Z=0.43226*Y1+0.21911*Y2+0.10380*Y3+0.06519*Y4得到綜合得分,見表1。、然后做層次聚類分析,“分析-分類-系統(tǒng)-系統(tǒng)聚類”,在彈出來對話框把綜合得分選入變量欄,在右側(cè)“繪制”中點上“樹狀圖”,點確定。如下圖。依據(jù)下面的樹狀圖,可將序號12,31,13,20,28,25,23,30,14,18,6,7,10,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論