方法:因子分析法_第1頁
方法:因子分析法_第2頁
方法:因子分析法_第3頁
方法:因子分析法_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、.因子分析基礎(chǔ)理論知識1 概念因子分析 (Factor analysis):就是用少數(shù)幾個因子來描述許多指標(biāo)或因素之間的聯(lián)系,以較少幾個因子來反映原資料的大部分信息的統(tǒng)計學(xué)分析方法。從數(shù)學(xué)角度來看,主成分分析是一種化繁為簡的降維處理技術(shù)。主成分分析 ( Principal component analysis):是因子分析的一個特例,是使用最多的因子提取方法。它通過坐標(biāo)變換手段,將原有的多個相關(guān)變量,做線性變化, 轉(zhuǎn)換為另外一組不相關(guān)的變量。 選取前面幾個方差最大的主成分,這樣達(dá)到了因子分析較少變量個數(shù)的目的,同時又能與較少的變量反映原有變量的絕大部分的信息。兩者關(guān)系 :主成分分析( PCA

2、)和因子分析( FA )是兩種把變量維數(shù)降低以便于描述、理解和分析的方法,而實際上主成分分析可以說是因子分析的一個特例。2 特點(diǎn)( 1)因子變量的數(shù)量遠(yuǎn)少于原有的指標(biāo)變量的數(shù)量,因而對因子變量的分析能夠減少分析中的工作量。( 2)因子變量不是對原始變量的取舍,而是根據(jù)原始變量的信息進(jìn)行重新組構(gòu),它能夠反映原有變量大部分的信息。( 3)因子變量之間不存在顯著的線性相關(guān)關(guān)系,對變量的分析比較方便,但原始部分變量之間多存在較顯著的相關(guān)關(guān)系。( 4)因子變量具有命名解釋性,即該變量是對某些原始變量信息的綜合和反映。在保證數(shù)據(jù)信息丟失最少的原則下,對高維變量空間進(jìn)行降維處理 (即通過因子分析或主成分分析

3、)。顯然,在一個低維空間解釋系統(tǒng)要比在高維系統(tǒng)容易的多。3 類型根據(jù)研究對象的不同,把因子分析分為R 型和 Q 型兩種。當(dāng)研究對象是變量時,屬于R 型因子分析;當(dāng)研究對象是樣品時,屬于Q 型因子分析。但有的因子分析方法兼有R 型和 Q 型因子分析的一些特點(diǎn),如因子分析中的對應(yīng)分析方法,有的學(xué)者稱之為雙重型因子分析,以示與其他兩類的區(qū)別。4 分析原理假定:有 n 個地理樣本,每個樣本共有p 個變量,構(gòu)成一個n× p 階的地理數(shù)據(jù)矩陣:x11x12x1px21x22x2 pXxn1xn2xnp.當(dāng) p 較大時, 在 p 維空間中考察問題比較麻煩。這就需要進(jìn)行降維處理,即用較少幾個綜合指標(biāo)

4、代替原來指標(biāo),而且使這些綜合指標(biāo)既能盡量多地反映原來指標(biāo)所反映的信息,同時它們之間又是彼此獨(dú)立的。線性組合:記x1,x2, , xp 為原變量指標(biāo),z1, z2, , zm( m p)為新變量指標(biāo)(主成分),則其線性組合為:z1l11 x1 l12 x2l1 p x pz2l 21 x1 l22 x2l2 p x pzmlm1 x1 l m2 x2l mp xpLij 是原變量在各主成分上的載荷z1l11 x1l12 x2l1 p x pz2l 21 x1l22 x2l2 p x pzmlm1 x1 l m2 x2l mp xp無論是哪一種因子分析方法, 其相應(yīng)的因子解都不是唯一的, 主因子解

5、僅僅是無數(shù)因子解中之一。zi 與 zj 相互無關(guān);z1 是 x1,x2, , xp 的一切線性組合中方差最大者,z2 是與 z1 不相關(guān)的x1,x2, 的所有線性組合中方差最大者。則,新變量指標(biāo)z1, z2, 分別稱為原變量指標(biāo)的第一,第二, 主成分。Z 為因子變量或公共因子,可以理解為在高維空間中互相垂直的m 個坐標(biāo)軸。主成分分析實質(zhì)就是確定原來變量xj (j=1 ,2 , , p)在各主成分zi( i=1 , 2, ,m)上的荷載lij 。從數(shù)學(xué)上容易知道,從數(shù)學(xué)上也可以證明,它們分別是相關(guān)矩陣的m 個較大的特征值所對應(yīng)的特征向量。5 分析步驟5.1確定待分析的原有若干變量是否適合進(jìn)行因子

6、分析( 第一步 )因子分析是從眾多的原始變量中重構(gòu)少數(shù)幾個具有代表意義的因子變量的過程。其潛在的要求:原有變量之間要具有比較強(qiáng)的相關(guān)性。因此,因子分析需要先進(jìn)行相關(guān)分析,計算原始變量之間的相關(guān)系數(shù)矩陣。 如果相關(guān)系數(shù)矩陣在進(jìn)行統(tǒng)計檢驗時, 大部分相關(guān)系數(shù)均小于 0.3 且未通過檢驗,則這些原始變量就不太適合進(jìn)行因子分析。.r11r12r1 pRr 21r 22r2 pr p 1r p 2r ppn( xki xi )( xkjx j )rijk 1nnxi ) 2x j )2( xki( xkjk 1k 1進(jìn)行原始變量的相關(guān)分析之前,需要對輸入的原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化計算(一般采用標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化方法

7、,標(biāo)準(zhǔn)化后的數(shù)據(jù)均值為0,方差為1)。SPSS在因子分析中還提供了幾種判定是否適合因子分析的檢驗方法。主要有以下3 種:巴特利特球形檢驗(Bartlett Test of Sphericity )反映象相關(guān)矩陣檢驗(Anti-image correlation matrix )KMO ( Kaiser-Meyer-Olkin )檢驗( 1)巴特利特球形檢驗該檢驗以變量的相關(guān)系數(shù)矩陣作為出發(fā)點(diǎn),它的零假設(shè)H0 為相關(guān)系數(shù)矩陣是一個單位陣,即相關(guān)系數(shù)矩陣對角線上的所有元素都為1,而所有非對角線上的元素都為0,也即原始變量兩兩之間不相關(guān)。巴特利特球形檢驗的統(tǒng)計量是根據(jù)相關(guān)系數(shù)矩陣的行列式得到。如果該

8、值較大, 且其對應(yīng)的相伴概率值小于用戶指定的顯著性水平,那么就應(yīng)拒絕零假設(shè)H0,認(rèn)為相關(guān)系數(shù)不可能是單位陣,也即原始變量間存在相關(guān)性。( 2)反映象相關(guān)矩陣檢驗該檢驗以變量的偏相關(guān)系數(shù)矩陣作為出發(fā)點(diǎn), 將偏相關(guān)系數(shù)矩陣的每個元素取反, 得到反映象相關(guān)矩陣。偏相關(guān)系數(shù)是在控制了其他變量影響的條件下計算出來的相關(guān)系數(shù), 如果變量之間存在較多的重疊影響,那么偏相關(guān)系數(shù)就會較小,這些變量越適合進(jìn)行因子分析。( 3) KMO ( Kaiser-Meyer-Olkin )檢驗該檢驗的統(tǒng)計量用于比較變量之間的簡單相關(guān)和偏相關(guān)系數(shù)。KMO 值介于 0-1,越接近 1,表明所有變量之間簡單相關(guān)系數(shù)平方和遠(yuǎn)大于偏

9、相關(guān)系數(shù)平方和,越適合因子分析。其中, Kaiser 給出一個 KMO 檢驗標(biāo)準(zhǔn): KMO>0.9 ,非常適合; 0.8<KMO<0.9 ,適合; 0.7<KMO<0.8 ,一般; 0.6<KMO<0.7 ,不太適合; KMO<0.5 ,不適合。5.2構(gòu)造因子變量因子分析中有很多確定因子變量的方法, 如基于主成分模型的主成分分析和基于因子分析模型的主軸因子法、極大似然法、最小二乘法等。前者應(yīng)用最為廣泛。主成分分析法(Principal component analysis ):該方法通過坐標(biāo)變換,將原有變量作線性變化,轉(zhuǎn)換為另外一組不相關(guān)的變量Z

10、i (主.成分)。求相關(guān)系數(shù)矩陣的特征根i ( 1, 2, p>0) 和相應(yīng)的標(biāo)準(zhǔn)正交的特征向量li;根據(jù)相關(guān)系數(shù)矩陣的特征根,即公共因子 Zj 的方差貢獻(xiàn)(等于因子載荷矩陣 L 中第 j 列各元素的平方和),計算公共因子 Zj 的方差貢獻(xiàn)率與累積貢獻(xiàn)率。pi(i 1,2, , p)kik1k(i 1,2, , p)pk 1kk 1主成分分析是在一個多維坐標(biāo)軸中,將原始變量組成的坐標(biāo)系進(jìn)行平移變換,使得新的坐標(biāo)原點(diǎn)和數(shù)據(jù)群點(diǎn)的重心重合。新坐標(biāo)第一軸與數(shù)據(jù)變化最大方向?qū)?yīng)。通過計算特征根(方差貢獻(xiàn)) 和方差貢獻(xiàn)率與累積方差貢獻(xiàn)率等指標(biāo), 來判斷選取公共因子的數(shù)量和公共因子(主成分)所能代表

11、的原始變量信息。公共因子個數(shù)的確定準(zhǔn)則: 1)根據(jù)特征值的大小來確定,一般取大于 1 的特征值對應(yīng)的幾個公共因子 /主成分。 2 )根據(jù)因子的累積方差貢獻(xiàn)率來確定,一般取累計貢獻(xiàn)率達(dá)85-95%的特征值所對應(yīng)的第一、第二、 、第 m(m p)個主成分。也有學(xué)者認(rèn)為累積方差貢獻(xiàn)率應(yīng)在 80以上。5.3因子變量的命名解釋因子變量的命名解釋是因子分析的另一個核心問題。經(jīng)過主成分分析得到的公共因子Z1,Z2,Zm 是對原有變量的綜合。在實際的應(yīng)用分析中,主要通過對載荷矩陣進(jìn)行分析,得到因子變量和原有變量之間的關(guān)系, 從而對新的因子變量進(jìn)行命名。 利用因子旋轉(zhuǎn)方法能使因子變量更具有可解釋性。aiji l

12、ij (i , j1,2, p)a11a12.a1ml111l122 a21a21.a2 ml 211l212A. . . .a p1a p1.apml p11l p 12.l1mm.l2mm.l pmmx1a11z1a12z2a1p zpz1l11x1l12 x2l1 p xpx2a21z1a22 z2a2 p zpz2l 21x1l 22 x2l 2 p xpxmam1z1 am 2 z2amp zpzm l m1 x1 lm 2 x2lmp xp計算主成分載荷,構(gòu)建載荷矩陣A 。載荷矩陣A 中某一行表示原有變量Xi 與公共因子的相關(guān)關(guān)系。載荷矩陣A 中某一列表示某一個公共因子能夠解釋的原

13、有變量Xi 的信息量。有時因子載荷矩陣的解釋性不太好, 通常需要進(jìn)行因子旋轉(zhuǎn), 使原有因子變量更具有可解釋性。因子旋轉(zhuǎn)的主要方法:正交旋轉(zhuǎn)、斜交旋轉(zhuǎn)。.a11a12.a1ml111l122 a21a21.a2 ml 211l212A. . . .a p1a p1.apml p11l p 12.l1mm.l2 mm.l pmm正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)是因子旋轉(zhuǎn)的兩類方法。 前者由于保持了坐標(biāo)軸的正交性, 因此使用最多。正交旋轉(zhuǎn)的方法很多,其中以方差最大化法最為常用。方差最大正交旋轉(zhuǎn)(varimax orthogonal rotation )基本思想:使公共因子的相對負(fù)荷的方差之和最大, 且保持原公共因

14、子的正交性和公共方差總和不變。 可使每個因子上的具有最大載荷的變量數(shù)最小,因此可以簡化對因子的解釋。斜交旋轉(zhuǎn)( oblique rotation )因子斜交旋轉(zhuǎn)后,各因子負(fù)荷發(fā)生了變化,出現(xiàn)了兩極分化。 各因子間不再相互獨(dú)立, 而是彼此相關(guān)。 各因子對各變量的貢獻(xiàn)的總和也發(fā)生了改變。因子旋轉(zhuǎn)的目的是使因子負(fù)荷兩極分化,要么接近于0,要么接近于1。從而使原有因子變量更具有可解釋性。5.4計算因子變量得分因子變量確定以后,對于每一個樣本數(shù)據(jù),我們希望得到它們在不同因子上的具體數(shù)據(jù)值,即因子得分。估計因子得分的方法主要有:回歸法、Bartlette 法等。計算因子得分應(yīng)首先將因子變量表示為原始變量的線性組合。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論