用SPSS進(jìn)行主成分分析_第1頁
用SPSS進(jìn)行主成分分析_第2頁
用SPSS進(jìn)行主成分分析_第3頁
用SPSS進(jìn)行主成分分析_第4頁
用SPSS進(jìn)行主成分分析_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、一、引言主成分分析和因子分析在社會經(jīng)濟(jì)統(tǒng)計綜合評價中是兩個常被使用的統(tǒng)計分析方法。現(xiàn)在SPSSSAS等統(tǒng)計軟件使用越來越普遍,但SPSS并未像SAS一樣,將主成分分析與因子分析作為兩個獨立的方法并列處理注:主成分分析與因子分析二者是又有著區(qū)別與聯(lián)系,最主要的不同在于它們的數(shù)學(xué)模型的構(gòu)建上,具體區(qū)別請見參考文獻(xiàn)2,而是根據(jù)二者之間的關(guān)系有機(jī)地將主成分分析嵌入到因子分析之中,這樣雖然簡化了分析程序,卻為主成分分析的計算帶來不便。且國內(nèi)許多SPSS教程并沒有詳細(xì)講解如果應(yīng)用SPSS進(jìn)行主成分分析,如何使用SPSS對主成分分析進(jìn)行計算呢?為使讀者能夠正確使用SPSS軟件進(jìn)行主成分分析,本文將通過一個實

2、例來詳細(xì)介紹如何用SPSS做主成分分析。接下來先簡單介紹主成分分析原理與模型,以便讀者對主成分分析有個大致的了解。二、主成分分析原理和模型1(一)主分成分析原理主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如P個指標(biāo)),重新組合成一組新的互相無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來P個指標(biāo)作線性組合,作為新的綜合指標(biāo)。最經(jīng)典的做法就是用Fl(選取的第一個線性組合,即第一個綜合指標(biāo))的方差來表達(dá),即Var(F1)越大,表示Fi包含的信息越多。因此在所有的線性組合中選取的Fi應(yīng)該是方差最大的,故稱Fi為第一主成分。如果第一主成分不足以代表原來P個指標(biāo)的信息,再考慮選取F2即選第二個

3、線性組合,為了有效地反映原來信息,F(xiàn)i已有的信息就不需要再出現(xiàn)再F2中,用數(shù)學(xué)語言表達(dá)就是要求Cov(Fi,F2)=0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,第P個主成分。(二)主成分分析數(shù)學(xué)模型F2=ai2ZX+a22Z%,+a4Fp=aimZXi+a2mZX2+amZXp其中aii,a2i,pi(jFi,沏X的協(xié)方差陣2的特征值多對應(yīng)的特征向量,ZXi,ZX2,ZXp原始變量經(jīng)過標(biāo)準(zhǔn)化處理的值,因為在實際應(yīng)用中,往往存在指標(biāo)的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數(shù)據(jù)標(biāo)準(zhǔn)化,本文所采用的數(shù)據(jù)就存在量綱影響注:本文指的數(shù)據(jù)標(biāo)準(zhǔn)化是指Z標(biāo)準(zhǔn)化。A=(aij)pxm=

4、(ai,a2,知,),Rai=入iai,R為相關(guān)系數(shù)矩陣,入、ai是相應(yīng)的特征值和單位特征向量,入n2>->p>0。進(jìn)行主成分分析主要步驟如下:i.指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)化(SPSS軟件自動執(zhí)行);2.指標(biāo)之間的相關(guān)性判定;3. 確定主成分個數(shù)m;4. 主成分Fi表達(dá)式;5. 主成分Fi命名;主成分與綜合主成分(評彳)值。三、對沿海10個省市經(jīng)濟(jì)綜合指標(biāo)進(jìn)行主成分分析(一)指標(biāo)選取原則本文所選取的數(shù)據(jù)來自中國統(tǒng)計年鑒2003»中2002年的統(tǒng)計數(shù)據(jù),在沿海10省市經(jīng)濟(jì)狀況主要指標(biāo)體系中選取了10個指標(biāo):X1GDPX2人士勻GDPX3農(nóng)業(yè)增加值X4工業(yè)增加值X5第二產(chǎn)業(yè)增加值X

5、6固定資產(chǎn)投資X7基本建設(shè)投資X8國內(nèi)生產(chǎn)總值占全國比重()X9海關(guān)出口總額X10地方財政收入圖表1沿海10個省市經(jīng)濟(jì)數(shù)據(jù)地區(qū)GDP人均GDP農(nóng)業(yè)增加值工業(yè)增加值第二產(chǎn)業(yè)增加值固定資產(chǎn)投資基本建設(shè)投資社會消費品零售總額海關(guān)出口總額地方財政收入遼寧5458.21300014883.31376.22258.41315.95292258.4123.7399.7山東105501164313903502.538512288.71070.73181.9211.1610.2河北6076.69047950.21406.72092.61161.6597.11968.345.9302.3天津2022.622068

6、83.9822.8960703.7361.9941.4115.7171.8江蘇10636143971122.63536.33967.223201141.33215.8384.7643.7上海5408.84062786.22196.22755.81970.2779.32035.2320.5709浙江7670165706802356.530652296.61180.62877.5294.2566.9福建4682135106631047.11859964.5397.91663.3173.7272.911770150301023.94224.64793.63022.91275.55013.61843.

7、71202廣西2437.25062591.4367995.7542.2352.71025.515.1186.7(二)主成分分析在SPSS中的具體操作步驟運用SPSS統(tǒng)計分析軟件Factor過程對沿海10個省市經(jīng)濟(jì)綜合指標(biāo)進(jìn)行主成分分析。具體操作步驟如下:1. AnalyzeaDataReductionFFactorAnB竭isFactorAnalysis對話框2. 把XiXio選入Variables框3. Descriptives:CorrelationMatrix框組中選中Coefficients,然后點擊Continue,返回FactorAnalysis對話框4. 點擊“OK”圖表2Fac

8、torAnalyze對話中1與Descriptives子對話框.r峪田£的3匕”廣日畢血£4dQdniWWWr婕TMQE廠y*0vdBfldfeiYI-汕ec即SPSS在調(diào)用FactorAnalyze過程進(jìn)行分析時,SPSS會自動對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,所以在得到計算結(jié)果后指的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量,但SPSS不會直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives過程進(jìn)行計算。圖表3相關(guān)系數(shù)矩陣人為砌聳Pw如驚工業(yè)事m也國引雷產(chǎn)枚寢S*4ttttl社曾清中國手笆自如雄吳*口由一ttA0WI.W09MJO幻W$及923WIOT且M人電面

9、T31蝴一,1U3儂前帕1穌我生曲燦玲-0)3-1?11.000-.1J3通知,.媾IW01J.12J必H業(yè)腳匐曲M7LB門驍1.000那購9i9.935.TO5臍&黑二產(chǎn)業(yè)用國總919m-J030硼1A00曬Wt例71491!固定,盧根費靖JH確W3帆10009fl9部MX外4事上健立恨傅g期H116卡器M0郵1ItM蒯d制合社金由受星零告百中HlW01?的咖】碗期9»島養(yǎng)出口名澳J«WJtl-innw.714.7176N顏i.m雨心開時就收人釉5m叫wsVI3934州83100圖表4方差分解主成分提取分析表TotalVarianceEjlainedMithl音中

10、而嶼ExfndSnSumsofSgudLoadingsTsui%afVirimwCumulate惴T而惴ofVmmceCm皿囪如$L7.220n.su7.210理加572,2052L23512.34664.5511.2351234664,5513的8砂53.31S4,5475耶598,7865.0S5部4沔川6.021.211998501012,11999.9K8.002.01899.9889D01,013100.(W10.000.000100.000EstrajctiatLMe由第1:Pi訕甲虹Cob平on修正癡型?it.圖表5初始因子載荷矩陣ComponentMatrix*Componen

11、t12GDP5491S5人均GDP112-824農(nóng)業(yè)增加值-.109.577工業(yè)增加值,978-.005第三產(chǎn)業(yè)增加值.070固定資產(chǎn)投資,983-J68基本建設(shè)投資347-.024社會消費品零售總額,977.176海關(guān)出口總額.800-051地方財政收入.954-.126ExtrActianMethod;PmuripAlComponentAnalysis.32匚qequrn由extrafted.從圖表3可知GD*工業(yè)增加值,第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會消費品零售總額、地方財政收入這幾個指標(biāo)存在著極其顯著的關(guān)系,與海關(guān)出口總額存在著顯著關(guān)系??梢娫S多變量之間直接的相關(guān)性比較

12、強(qiáng),證明他們存在信息上的重疊。主成分個數(shù)提取原則為主成分對應(yīng)的特征值大于1的前m個主成分。注:特征值在某種程度上可以被看成是表示主成分影響力度大小的指標(biāo),如果特征值小于1,說明該主成分的解釋力度還不如直接引入一個原變量的平均解釋力度大,因此一般可以用特征值大于1作為納入標(biāo)準(zhǔn)。通過圖表4(方差分解主成分提取分析)可知,提取2個主成分,即m=2,從圖表5(初始因子載荷矩陣)可知GDR工業(yè)增加值、第三產(chǎn)業(yè)增加值、固定資產(chǎn)投資、基本建設(shè)投資、社會消費品零售總額、海關(guān)出口總額、地方財政收入在第一主成分上有較高載荷,說明第一主成分基本反映了這些指標(biāo)的信息;人均GD環(huán)口農(nóng)業(yè)增加值指標(biāo)在第二主成分上有較高載荷

13、,說明第二主成分基本反映了人均GD濟(jì)口農(nóng)業(yè)增加值兩個指標(biāo)的信息。所以提取兩個主成分是可以基本反映全部指標(biāo)的信息,所以決定用兩個新變量來代替原來的十個變量。但這兩個新變量的表達(dá)還不能從輸出窗口中直接得到,因為"ComponentMatrix”是指初始因子載荷矩陣,每一個載荷量表示主成分與對應(yīng)變量的相關(guān)系數(shù)。用圖表5(主成分載荷矩陣)中的數(shù)據(jù)除以主成分相對應(yīng)的特征值開平方根便得到兩個主成分中每個指標(biāo)所對應(yīng)的系數(shù)2。將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入(可用復(fù)制粘貼的方法)到數(shù)據(jù)編輯窗口(為變量B1、B2),然后利用aTransformaComputeVariable:在ComputeVar

14、iable對話框中輸入“A1=B1/SQR(7.22)”注:第二主成分SQ所的括號中填1.235,即可得到特征向量A1(見圖表6)。同理,可得到特征向量A2。將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表達(dá)式注:因本例只是為了說明如何在SPSS進(jìn)行主成分分析,故在此不對提取的主成分進(jìn)行命名,有興趣的讀者可自行命名:Fi=0.353ZXi+0.042ZX2-0.041ZX3+0.364ZX4+0.367ZX5+0.366ZX6+0.352ZX7+0.364ZX8+0.298ZX9+0.355ZXi0F2=0.175ZXi-0.741ZX2+0.609ZX3-0.004ZX4+0.0

15、63ZX5-0.061ZX6-0.022ZX7+0.158ZX8-0.046ZX9-0.115ZX10圖表6ComputeVariable對話框前文提到SPS8自動對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,但不會直接給出,需要我們自己另外算,我們可以通過AnalyzeaDescriptiveStatisticsaDescriptives對話框來實現(xiàn):彈出Descriptives對話框后,把XX10選入Variables框,在Savestandardizedvaluesasvariables前的方框打上鉤,點擊“OK,經(jīng)標(biāo)準(zhǔn)化的數(shù)據(jù)會自動填入數(shù)據(jù)窗口中,并以Z開頭命名。圖表7Descriptives對話框以每個主成分所

16、對應(yīng)的特征值占所提取主成分總的特征值之和的比例作為權(quán)重計算主成分綜合模型:即可得到主成分綜合模型:F=0.327ZXi-0.072ZX2+0.054ZX3+0.310ZX4+0.323ZX5+0.304ZX6+0.297ZX7+0.334ZX8+0.248ZX9+0.286ZXi0根據(jù)主成分綜合模型即可計算綜合主成分值,并對其按綜合主成分值進(jìn)行排序,即可對各地區(qū)進(jìn)行綜合評價比較,結(jié)果見圖表8。圖表8綜合主成分值城巾第一主成分F1排名第二主成分F2排名綜合主成分F排名5.2310.1164.481江蘇2.2520.2351.962山東1.9630.5021.753浙江1.164-0.1980.964上海0.305-2.3610-0.095遼寧-1.2461.961-0.786河北-1.3570.414-1.107福建-1.978-0.077-1.708天津-3.049-1.019-2.749廣西-3.29100.413-2.7510對得出的綜合主成分(評價)值,我們可用實際結(jié)果、經(jīng)驗與原始數(shù)據(jù)做聚類分析進(jìn)行檢驗,對有爭議的結(jié)果,可用原始數(shù)據(jù)做判別分析解決爭議,具體評價與檢驗本文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論