SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第1頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第2頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第3頁
SPSS軟件進(jìn)行主成分分析的應(yīng)用例子_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、SPSS 軟件進(jìn)行主成分分析的應(yīng)用例子 2002年16家上市公司4項(xiàng)指標(biāo)的數(shù)據(jù)5見表2,定量綜合贏利能力分 析如下:表2 2002年16家上市公司4項(xiàng)指標(biāo)的數(shù)據(jù)公司銷售凈利率(X)資產(chǎn)凈利率(X2)凈資產(chǎn)收益率(X,)銷售毛利率(X4)歌華有線 五糧液? 用友軟件 太太藥業(yè) 浙江陽光 煙臺(tái)萬華 方正科技 紅河光明 貴州茅臺(tái) 中鐵二局 紅星發(fā)展 伊利股份 青島海爾 湖北宜化 雅戈?duì)枺?福建南紙731.主成分分析的做法第一,將EXCEL中的原始數(shù)據(jù)導(dǎo)入到 SPSS軟件中;注意:導(dǎo)入Spss的數(shù)據(jù)不能岀現(xiàn)空缺的現(xiàn)象,如岀現(xiàn)可用0補(bǔ)齊。第二,對(duì)四個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理;【1】“分析” | “描述統(tǒng)計(jì)”

2、| “描述”?!?】彈出“描述統(tǒng)計(jì)”對(duì)話框,首先將準(zhǔn)備標(biāo)準(zhǔn)化的變量移入變量組 中,此時(shí),最重要的一步就是勾選“將標(biāo)準(zhǔn)化得分另存為變量”,最后點(diǎn) 擊確定?!?】返回SPSS的“數(shù)據(jù)視圖”,此時(shí)就可以看到新增了標(biāo)準(zhǔn)化后數(shù) 據(jù)的字段。所做工作:a.原始數(shù)據(jù)的標(biāo)準(zhǔn)化處理數(shù)據(jù)標(biāo)準(zhǔn)化主要功能就是消除變量間的量綱關(guān)系,從而使數(shù)據(jù)具有可比性,可以舉個(gè)簡單的例子,一個(gè)百分制的變量與一個(gè)5分值的變量在一起怎么比較?只有通過數(shù)據(jù)標(biāo)準(zhǔn)化,都把它們標(biāo)準(zhǔn)到同一個(gè)標(biāo)準(zhǔn)時(shí)才具有可比性,一般標(biāo)準(zhǔn)化采用的是Z標(biāo)準(zhǔn)化,即均值為 0,方差為1,當(dāng)然也有其他標(biāo)準(zhǔn)化,比如 0-1標(biāo)準(zhǔn)化等等,可根據(jù)自己的研究目的進(jìn)行選擇,這里介紹怎么進(jìn)行

3、數(shù) 據(jù)的Z標(biāo)準(zhǔn)化。所的結(jié)論:標(biāo)準(zhǔn)化后的所有指標(biāo)數(shù)據(jù)。SPSS在調(diào)用Factor Analyze過程進(jìn)行分析時(shí),SPSS會(huì)自動(dòng)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理 ,所 以在得到計(jì)算結(jié)果后的變量都是指經(jīng)過標(biāo)準(zhǔn)化處理后的變量,但SPSS并不直接給岀標(biāo)準(zhǔn)化后的數(shù)據(jù),如需要得到標(biāo)準(zhǔn)化數(shù)據(jù),則需調(diào)用Descriptives過程進(jìn)行計(jì)算。第三,并把標(biāo)準(zhǔn)化后的數(shù)據(jù)保存在數(shù)據(jù)編輯窗口中然后利用SPSS的factor過程對(duì)數(shù)據(jù)進(jìn)行因子分析(指標(biāo)之間的相關(guān)性判定略)?!?】“分析”| “降維” | “因子分析”選項(xiàng)卡,將要進(jìn)行分析的變量選入“變量”列表;【2】設(shè)置“描述”,勾選“原始分析結(jié)果”和“KMO與 Bartlett

4、球形度檢驗(yàn)”復(fù)選框;【3】設(shè)置“抽取”,勾選“碎石圖”復(fù)選框;【4】設(shè)置“旋轉(zhuǎn)”,勾選“最大方差法”復(fù)選框;【5】設(shè)置“得分”,勾選“保存為變量”和“因子得分系數(shù)”復(fù)選框; 【6】查看分析結(jié)果。所做工作:a. 查看KMO和Bartlett的檢驗(yàn)KMO直接近值越接近于1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析; Bartlett球度度檢驗(yàn)的Sig值越小于顯著水平,越說明變量之間存在相關(guān)關(guān)系。所的結(jié)論:符合因子分析的條件,可以進(jìn)行因子分析,并進(jìn)一步完成主成分分析。注意:(Kaiser-Meyer-Olkin)KMC統(tǒng)計(jì)量是取值在0和1之間。當(dāng)所有變量間的簡單相關(guān)系數(shù)平方和遠(yuǎn)遠(yuǎn)大于偏相關(guān)

5、系數(shù)平 方和時(shí),KMO值接近值越接近于 1,意味著變量間的相關(guān)性越強(qiáng),原有變量越適合作因子分析;當(dāng) 所有變量間的簡單相關(guān)系數(shù)平方和接近0時(shí),KMO直接近值越接近于 0,意味著變量間的相關(guān)性越弱,原有變量越不適合作因子分析。Kaiser給岀了常用的kmo度量標(biāo)準(zhǔn):以上表示非常適合;表示適合;表示一般;表示不太適 合;以下表示極不適合。球度檢驗(yàn):巴特利特球度檢驗(yàn)的統(tǒng)計(jì)量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到的,如果該值較大,且其對(duì)應(yīng) 的相伴概率值小于用戶心中的顯著性水平,那么應(yīng)該拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣不可能是單 位陣,即原始變量之間存在相關(guān)性,適合于做主成份分析;相反,如果該統(tǒng)計(jì)量比較小,且其相 對(duì)

6、應(yīng)的相伴概率大于顯著性水平,則不能拒絕零假設(shè),認(rèn)為相關(guān)系數(shù)矩陣可能是單位陣,不宜于 做因子分析。Bartlett球度檢驗(yàn)的原假設(shè)為相關(guān)系數(shù)矩陣為單位矩陣,Sig值為小于顯著水平,因此拒絕原假設(shè),說明變量之間存在相關(guān)關(guān)系,適合做因子分析。所做工作:b. 全部解釋方差或者解釋的總方差(Total Varianee Explained)初始特征根(Initial Eigenvalues)大于1,并且累計(jì)百分比達(dá)到 80%85%以上。查看相關(guān)系數(shù)矩陣的特征根及方差貢獻(xiàn)率見表3,由于前2個(gè)主成分貢獻(xiàn)率85%結(jié)合表4中變量不岀現(xiàn)丟失,所以提取的主成分個(gè)數(shù)m=2所的結(jié)論:初始特征根:入1=入2 =主成分貢獻(xiàn)

7、率:r1= r 2=注意:主成分的數(shù)目可以根據(jù)相關(guān)系數(shù)矩陣的特征根來判定,如前所說,相關(guān)系數(shù)矩陣的特征根剛 好等于主成分的方差,而方差是變量數(shù)據(jù)蘊(yùn)涵信息的重要判據(jù)之一。根據(jù)入值決定主成分?jǐn)?shù)目的 準(zhǔn)則有三:1. 只取入>1的特征根對(duì)應(yīng)的主成分從Total Varianee Explained表中可見,第一、第二和第三個(gè)主成分對(duì)應(yīng)的入值都大于1 ,這意味著這三個(gè)主成分得分的方差都大于1。本例正是根據(jù)這條準(zhǔn)則提取主成分的。2. 累計(jì)百分比達(dá)到80%85%以上的入值對(duì)應(yīng)的主成分在Total Varianee Explained 表可以看岀,前三個(gè)主成分對(duì)應(yīng)的入值累計(jì)百分比達(dá)到%這暗示只要選取三個(gè)

8、主成分,信息量就夠了。3. 根據(jù)特征根變化的突變點(diǎn)決定主成分的數(shù)量從特征根分布的折線圖(Scree Plot )上可以看到,第 4個(gè)入值是一個(gè)明顯的折點(diǎn),這暗示 選取的主成分?jǐn)?shù)目應(yīng)有 p<4。那么,究竟是 3個(gè)還是4個(gè)呢?根據(jù)前面兩條準(zhǔn)則,選3個(gè)大致合適(但小有問題)。第四,計(jì)算特征向量矩陣(主成分表達(dá)式的系數(shù))【1】將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入(可用復(fù)制粘貼的方法)到數(shù) 據(jù)編輯窗口(為變量V1、V2);F1=VdSQR(入 1)【2】然后利用“轉(zhuǎn)換” | “計(jì)算變量”,打開“計(jì)算變量”對(duì)話框,在“目 標(biāo)變量”文本框中輸入“ R”,然后在數(shù)字表達(dá)式中輸入“ V1/SQR(入1)”

9、注:入 1=,即可得到特征向量F1;【3】然后利用“轉(zhuǎn)換” | “計(jì)算變量”,打開“計(jì)算變量”對(duì)話框,在“目 標(biāo)變量”文本框中輸入“ F2”,然后在數(shù)字表達(dá)式中輸入“ M/SQR(入2)” 注:入 1=,即可得到特征向量F2;【4】最后得到特征向量矩陣(主成分表達(dá)式的系數(shù))。所做工作:a.成分矩陣或者初始因子載荷矩陣( Component Matrix )初始因子載荷矩陣見上圖,通過初始因子載荷矩陣還不能得出主成分的表達(dá)式,還需要把初 始因子載荷矩陣中的每列的系數(shù)(主成分的載荷)除以其相應(yīng)主成分的特征根的平方根后才能得 到主成分系數(shù)向量(主成分的得岀系數(shù)); 所的結(jié)論:1. 用于計(jì)算主成分表達(dá)

10、式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。2. 計(jì)算后,得到的主成分表達(dá)式的系數(shù)矩陣。注意:1. 主成分表達(dá)式的系數(shù)提取岀來的全部主成分可以基本反映全部指標(biāo)的信息,但這些新變量(主成分)的表達(dá)卻不能從輸出窗口中直接得到,即:主成分中每個(gè)指標(biāo)所對(duì)應(yīng)的系數(shù)不是初始因子載荷矩陣中的對(duì)應(yīng)指標(biāo) 的載荷,因?yàn)?quot;Component Matrix "是指初始因子載荷矩陣,每一個(gè)載荷量表示主成分與對(duì)應(yīng)變 量的相關(guān)系數(shù)。2. 主成分表達(dá)式系數(shù)的計(jì)算方法初始因子載荷矩陣或主成分載荷矩陣(Compo nent Matrix)中的數(shù)據(jù)除以主成分相對(duì)應(yīng)的特征根(或特征值)開平方根便得到兩個(gè)主成分中每個(gè)

11、指標(biāo)所對(duì)應(yīng)的系數(shù)。F1=V1/SQR(入 1)3. 主成分的指標(biāo)劃分與命名初始因子載荷矩陣或主成分載荷矩陣(Comp onent Matrix)中每列表示相應(yīng)主成分與對(duì)應(yīng)變量 的相關(guān)系數(shù),每個(gè)主成分所反映的原始指標(biāo)各有不同,為進(jìn)一步明確每個(gè)主成分側(cè)重反應(yīng)的具體 原始指標(biāo),需要對(duì)原始指標(biāo)在每個(gè)主成分上的載荷進(jìn)行比較,其中載荷越大,其對(duì)應(yīng)的主成分反 映該原始指標(biāo)的信息量越大,反之亦然;如果某一原始指標(biāo)在幾個(gè)主成分的載荷絕對(duì)值不相上下, 歸類比較含混,導(dǎo)致主成分的原始指標(biāo)劃分不清。說明有必要作進(jìn)一步的因子分析。從Component Matrix即主成分載荷表中可以看岀,哪一原始指標(biāo)在哪一主成分上載荷

12、絕對(duì)值 較大,亦即與該主成分的相關(guān)系數(shù)較高【注:相關(guān)分為正負(fù)相關(guān)】。第五,計(jì)算主成分得分矩陣(主成分得分)【1】將得到的特征向量與標(biāo)準(zhǔn)化后白勺數(shù)圳.相乘,然后就可以得出主成分函 數(shù)的表達(dá)式;Zi= F ii*zX 1+ F i2*zX 2+ F i3*zX3+ F i4*zX 4Z2= F 2i*ZX i+ F 22*ZX 2+ F 23*ZX3+ F 24*zX 4?(其中,zXi 為標(biāo)準(zhǔn)化后的數(shù)據(jù))【2】然后利用“轉(zhuǎn)換” I “計(jì)算變量”,打開“計(jì)算變量”對(duì)話框,在“目 標(biāo)變量”文本框中輸入“ Zi”,然后在數(shù)字表達(dá)式中輸入“* Z (銷售凈利率)+*Z (資 產(chǎn)凈利率)+*Z (凈資產(chǎn)收

13、益率)+*Z (銷售毛利率)”注:Fi=,” ,即可得到特征向量 乙;【3】同理注:F2=,,可得到特征向量乙;【4】求出i6家上市公司的主成分值。所做工作:a.對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù);所的結(jié)論:i.用于計(jì)算主成分表達(dá)式系數(shù)的初始因子載荷矩陣中每個(gè)指標(biāo)的載荷。注意:i.特征向量矩陣載荷的用運(yùn)乙=F ii*zXi+ F i2*zX2+ F i3*zX3+ F i4*zX4Z2= F 2i*ZXi+ F 22*zX2+ F 23*zX3+ F 24*zX4?(其中,ZX 為標(biāo)準(zhǔn)化后的數(shù)據(jù))第六,最后利用主成分函數(shù)、綜合主成分公式:I i I將得到的特征向量與標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,然后就可以得出主成分表 達(dá)式;Z=r i*Zi+r 2*Z2【2】然后利用“轉(zhuǎn)換” | “計(jì)算變量”,打開“計(jì)算變量”對(duì)話框,在“目 標(biāo)變量”文本框中輸入“ Z”,然后在數(shù)字表達(dá)式中輸入“ ri*Zi+r2*Z2” 注:r i=, r 2=,即可得到綜合主成分;【3】綜合主成分(贏利能力)值。所做工作:a.對(duì)原始數(shù)據(jù)標(biāo)準(zhǔn)化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論