SPSS軟件進行主成分分析的應用例子_第1頁
SPSS軟件進行主成分分析的應用例子_第2頁
SPSS軟件進行主成分分析的應用例子_第3頁
SPSS軟件進行主成分分析的應用例子_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、SPSS 軟件進行主成分分析的應用例子 2002年16家上市公司4項指標的數(shù)據(jù)5見表2,定量綜合贏利能力分 析如下:表2 2002年16家上市公司4項指標的數(shù)據(jù)公司銷售凈利率(X)資產(chǎn)凈利率(X2)凈資產(chǎn)收益率(X,)銷售毛利率(X4)歌華有線 五糧液? 用友軟件 太太藥業(yè) 浙江陽光 煙臺萬華 方正科技 紅河光明 貴州茅臺 中鐵二局 紅星發(fā)展 伊利股份 青島海爾 湖北宜化 雅戈爾? 福建南紙731.主成分分析的做法第一,將EXCEL中的原始數(shù)據(jù)導入到 SPSS軟件中;注意:導入Spss的數(shù)據(jù)不能岀現(xiàn)空缺的現(xiàn)象,如岀現(xiàn)可用0補齊。第二,對四個指標進行標準化處理;【1】“分析” | “描述統(tǒng)計”

2、| “描述”?!?】彈出“描述統(tǒng)計”對話框,首先將準備標準化的變量移入變量組 中,此時,最重要的一步就是勾選“將標準化得分另存為變量”,最后點 擊確定?!?】返回SPSS的“數(shù)據(jù)視圖”,此時就可以看到新增了標準化后數(shù) 據(jù)的字段。所做工作:a.原始數(shù)據(jù)的標準化處理數(shù)據(jù)標準化主要功能就是消除變量間的量綱關系,從而使數(shù)據(jù)具有可比性,可以舉個簡單的例子,一個百分制的變量與一個5分值的變量在一起怎么比較?只有通過數(shù)據(jù)標準化,都把它們標準到同一個標準時才具有可比性,一般標準化采用的是Z標準化,即均值為 0,方差為1,當然也有其他標準化,比如 0-1標準化等等,可根據(jù)自己的研究目的進行選擇,這里介紹怎么進行

3、數(shù) 據(jù)的Z標準化。所的結(jié)論:標準化后的所有指標數(shù)據(jù)。SPSS在調(diào)用Factor Analyze過程進行分析時,SPSS會自動對原始數(shù)據(jù)進行標準化處理 ,所 以在得到計算結(jié)果后的變量都是指經(jīng)過標準化處理后的變量,但SPSS并不直接給岀標準化后的數(shù)據(jù),如需要得到標準化數(shù)據(jù),則需調(diào)用Descriptives過程進行計算。第三,并把標準化后的數(shù)據(jù)保存在數(shù)據(jù)編輯窗口中然后利用SPSS的factor過程對數(shù)據(jù)進行因子分析(指標之間的相關性判定略)?!?】“分析”| “降維” | “因子分析”選項卡,將要進行分析的變量選入“變量”列表;【2】設置“描述”,勾選“原始分析結(jié)果”和“KMO與 Bartlett

4、球形度檢驗”復選框;【3】設置“抽取”,勾選“碎石圖”復選框;【4】設置“旋轉(zhuǎn)”,勾選“最大方差法”復選框;【5】設置“得分”,勾選“保存為變量”和“因子得分系數(shù)”復選框; 【6】查看分析結(jié)果。所做工作:a. 查看KMO和Bartlett的檢驗KMO直接近值越接近于1,意味著變量間的相關性越強,原有變量越適合作因子分析; Bartlett球度度檢驗的Sig值越小于顯著水平,越說明變量之間存在相關關系。所的結(jié)論:符合因子分析的條件,可以進行因子分析,并進一步完成主成分分析。注意:(Kaiser-Meyer-Olkin)KMC統(tǒng)計量是取值在0和1之間。當所有變量間的簡單相關系數(shù)平方和遠遠大于偏相關

5、系數(shù)平 方和時,KMO值接近值越接近于 1,意味著變量間的相關性越強,原有變量越適合作因子分析;當 所有變量間的簡單相關系數(shù)平方和接近0時,KMO直接近值越接近于 0,意味著變量間的相關性越弱,原有變量越不適合作因子分析。Kaiser給岀了常用的kmo度量標準:以上表示非常適合;表示適合;表示一般;表示不太適 合;以下表示極不適合。球度檢驗:巴特利特球度檢驗的統(tǒng)計量是根據(jù)相關系數(shù)矩陣的行列式得到的,如果該值較大,且其對應 的相伴概率值小于用戶心中的顯著性水平,那么應該拒絕零假設,認為相關系數(shù)矩陣不可能是單 位陣,即原始變量之間存在相關性,適合于做主成份分析;相反,如果該統(tǒng)計量比較小,且其相 對

6、應的相伴概率大于顯著性水平,則不能拒絕零假設,認為相關系數(shù)矩陣可能是單位陣,不宜于 做因子分析。Bartlett球度檢驗的原假設為相關系數(shù)矩陣為單位矩陣,Sig值為小于顯著水平,因此拒絕原假設,說明變量之間存在相關關系,適合做因子分析。所做工作:b. 全部解釋方差或者解釋的總方差(Total Varianee Explained)初始特征根(Initial Eigenvalues)大于1,并且累計百分比達到 80%85%以上。查看相關系數(shù)矩陣的特征根及方差貢獻率見表3,由于前2個主成分貢獻率85%結(jié)合表4中變量不岀現(xiàn)丟失,所以提取的主成分個數(shù)m=2所的結(jié)論:初始特征根:入1=入2 =主成分貢獻

7、率:r1= r 2=注意:主成分的數(shù)目可以根據(jù)相關系數(shù)矩陣的特征根來判定,如前所說,相關系數(shù)矩陣的特征根剛 好等于主成分的方差,而方差是變量數(shù)據(jù)蘊涵信息的重要判據(jù)之一。根據(jù)入值決定主成分數(shù)目的 準則有三:1. 只取入>1的特征根對應的主成分從Total Varianee Explained表中可見,第一、第二和第三個主成分對應的入值都大于1 ,這意味著這三個主成分得分的方差都大于1。本例正是根據(jù)這條準則提取主成分的。2. 累計百分比達到80%85%以上的入值對應的主成分在Total Varianee Explained 表可以看岀,前三個主成分對應的入值累計百分比達到%這暗示只要選取三個

8、主成分,信息量就夠了。3. 根據(jù)特征根變化的突變點決定主成分的數(shù)量從特征根分布的折線圖(Scree Plot )上可以看到,第 4個入值是一個明顯的折點,這暗示 選取的主成分數(shù)目應有 p<4。那么,究竟是 3個還是4個呢?根據(jù)前面兩條準則,選3個大致合適(但小有問題)。第四,計算特征向量矩陣(主成分表達式的系數(shù))【1】將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入(可用復制粘貼的方法)到數(shù) 據(jù)編輯窗口(為變量V1、V2);F1=VdSQR(入 1)【2】然后利用“轉(zhuǎn)換” | “計算變量”,打開“計算變量”對話框,在“目 標變量”文本框中輸入“ R”,然后在數(shù)字表達式中輸入“ V1/SQR(入1)”

9、注:入 1=,即可得到特征向量F1;【3】然后利用“轉(zhuǎn)換” | “計算變量”,打開“計算變量”對話框,在“目 標變量”文本框中輸入“ F2”,然后在數(shù)字表達式中輸入“ M/SQR(入2)” 注:入 1=,即可得到特征向量F2;【4】最后得到特征向量矩陣(主成分表達式的系數(shù))。所做工作:a.成分矩陣或者初始因子載荷矩陣( Component Matrix )初始因子載荷矩陣見上圖,通過初始因子載荷矩陣還不能得出主成分的表達式,還需要把初 始因子載荷矩陣中的每列的系數(shù)(主成分的載荷)除以其相應主成分的特征根的平方根后才能得 到主成分系數(shù)向量(主成分的得岀系數(shù)); 所的結(jié)論:1. 用于計算主成分表達

10、式系數(shù)的初始因子載荷矩陣中每個指標的載荷。2. 計算后,得到的主成分表達式的系數(shù)矩陣。注意:1. 主成分表達式的系數(shù)提取岀來的全部主成分可以基本反映全部指標的信息,但這些新變量(主成分)的表達卻不能從輸出窗口中直接得到,即:主成分中每個指標所對應的系數(shù)不是初始因子載荷矩陣中的對應指標 的載荷,因為"Component Matrix "是指初始因子載荷矩陣,每一個載荷量表示主成分與對應變 量的相關系數(shù)。2. 主成分表達式系數(shù)的計算方法初始因子載荷矩陣或主成分載荷矩陣(Compo nent Matrix)中的數(shù)據(jù)除以主成分相對應的特征根(或特征值)開平方根便得到兩個主成分中每個

11、指標所對應的系數(shù)。F1=V1/SQR(入 1)3. 主成分的指標劃分與命名初始因子載荷矩陣或主成分載荷矩陣(Comp onent Matrix)中每列表示相應主成分與對應變量 的相關系數(shù),每個主成分所反映的原始指標各有不同,為進一步明確每個主成分側(cè)重反應的具體 原始指標,需要對原始指標在每個主成分上的載荷進行比較,其中載荷越大,其對應的主成分反 映該原始指標的信息量越大,反之亦然;如果某一原始指標在幾個主成分的載荷絕對值不相上下, 歸類比較含混,導致主成分的原始指標劃分不清。說明有必要作進一步的因子分析。從Component Matrix即主成分載荷表中可以看岀,哪一原始指標在哪一主成分上載荷

12、絕對值 較大,亦即與該主成分的相關系數(shù)較高【注:相關分為正負相關】。第五,計算主成分得分矩陣(主成分得分)【1】將得到的特征向量與標準化后白勺數(shù)圳.相乘,然后就可以得出主成分函 數(shù)的表達式;Zi= F ii*zX 1+ F i2*zX 2+ F i3*zX3+ F i4*zX 4Z2= F 2i*ZX i+ F 22*ZX 2+ F 23*ZX3+ F 24*zX 4?(其中,zXi 為標準化后的數(shù)據(jù))【2】然后利用“轉(zhuǎn)換” I “計算變量”,打開“計算變量”對話框,在“目 標變量”文本框中輸入“ Zi”,然后在數(shù)字表達式中輸入“* Z (銷售凈利率)+*Z (資 產(chǎn)凈利率)+*Z (凈資產(chǎn)收

13、益率)+*Z (銷售毛利率)”注:Fi=,” ,即可得到特征向量 乙;【3】同理注:F2=,,可得到特征向量乙;【4】求出i6家上市公司的主成分值。所做工作:a.對原始數(shù)據(jù)標準化后的數(shù)據(jù)標準化后的數(shù)據(jù);所的結(jié)論:i.用于計算主成分表達式系數(shù)的初始因子載荷矩陣中每個指標的載荷。注意:i.特征向量矩陣載荷的用運乙=F ii*zXi+ F i2*zX2+ F i3*zX3+ F i4*zX4Z2= F 2i*ZXi+ F 22*zX2+ F 23*zX3+ F 24*zX4?(其中,ZX 為標準化后的數(shù)據(jù))第六,最后利用主成分函數(shù)、綜合主成分公式:I i I將得到的特征向量與標準化后的數(shù)據(jù)相乘,然后就可以得出主成分表 達式;Z=r i*Zi+r 2*Z2【2】然后利用“轉(zhuǎn)換” | “計算變量”,打開“計算變量”對話框,在“目 標變量”文本框中輸入“ Z”,然后在數(shù)字表達式中輸入“ ri*Zi+r2*Z2” 注:r i=, r 2=,即可得到綜合主成分;【3】綜合主成分(贏利能力)值。所做工作:a.對原始數(shù)據(jù)標準化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論