怎樣用做主成分分析和因子分析

上傳人：卓*** IP屬地：廣東上傳時間：2023-05-16 格式：PPT 頁數(shù)：108 大?。?.29MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩103頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

關(guān)于怎樣用做主成分分析和因子分析第1頁，課件共108頁，創(chuàng)作于2023年2月2

主成分分析（principalcomponentsanalysis，簡稱PCA）是由霍特林（Hotelling）于1933年首先提出的。它通過投影的方法，實現(xiàn)數(shù)據(jù)的降維，在損失較少數(shù)據(jù)信息的基礎(chǔ)上把多個指標轉(zhuǎn)化為幾個有代表意義的綜合指標。13.1主成分分析第2頁，課件共108頁，創(chuàng)作于2023年2月313.1.1主成分分析的基本思想

假如對某一問題的研究涉及p個指標，記為X1，X2,…,Xp，由這p個隨機變量構(gòu)成的隨機向量為X=(X1,X2,…,Xp)，設(shè)X的均值向量為，協(xié)方差矩陣為。設(shè)Y=(Y1,Y2,…,Yp)為對X進行線性變換得到的合成隨機向量，即

（13.1.1）設(shè)i=(i1,i2,…,ip)，(),A=(1,

2,…,p)，則有（13.1.2）第3頁，課件共108頁，創(chuàng)作于2023年2月4且

（13.1.3）由式（13.1.1）和式（13.1.2）可以看出，可以對原始變量進行任意的線性變換，不同線性變換得到的合成變量Y的統(tǒng)計特征顯然是不一樣的。每個Yi應(yīng)盡可能多地反映p個原始變量的信息，通常用方差來度量“信息”，Yi的方差越大表示它所包含的信息越多。由式（13.1.3）可以看出將系數(shù)向量i擴大任意倍數(shù)會使Yi的方差無限增大，為了消除這種不確定性，增加約束條件：第4頁，課件共108頁，創(chuàng)作于2023年2月5

為了有效地反映原始變量的信息，Y的不同分量包含的信息不應(yīng)重疊。綜上所述，式（13.1.1）的線性變換需要滿足下面的約束：

(1)，即，i=1,2,…,p。

(2)Y1在滿足約束(1)即的情況下，方差最大；Y2是在滿足約束(1)，且與Y1不相關(guān)的條件下，其方差達到最大；……；Yp是在滿足約束(1)，且與Y1，Y2，…，Yp-1不相關(guān)的條件下，在各種線性組合中方差達到最大者。滿足上述約束得到的合成變量Y1,Y2,…,Yp分別稱為原始變量的第一主成分、第二主成分、…、第p主成分，而且各成分方差在總方差中占的比重依次遞減。在實際研究工作中，僅挑選前幾個方差較大的主成分，以達到簡化系統(tǒng)結(jié)構(gòu)的目的。第5頁，課件共108頁，創(chuàng)作于2023年2月613.1.2總體主成分求解及其性質(zhì)

13.1.1節(jié)中提到主成分分析的基本思想是考慮合成變量的方差大小及其對原始變量波動(方差)的貢獻大小，而對于原始隨機變量X1，X2，…，Xp，其協(xié)方差矩陣或相關(guān)矩陣正是對各變量離散程度和相關(guān)程度的度量。在實際求解主成分時，一般從原始變量的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析出發(fā)。第6頁，課件共108頁，創(chuàng)作于2023年2月7

1．從協(xié)方差矩陣出發(fā)求解主成分設(shè)1是任意p1向量，求解主成份就是在約束條件下，求X的線性函數(shù)使其方差達到最大，即達到最大，且，其中是隨機變量向量X=(X1,X2,…,Xp)的協(xié)方差矩陣。設(shè)1≥2≥…≥p

≥0為的特征值，e1,e2,…,ep為矩陣各特征值對應(yīng)的標準正交特征向量，則對于任意的ei

和ej，有（13.1.4）且（13.1.5）第7頁，課件共108頁，創(chuàng)作于2023年2月8因此

（13.1.6）當1=e1時有

（13.1.7）此時達到最大值為1。同理有并且（13.1.8）第8頁，課件共108頁，創(chuàng)作于2023年2月9

由上述推導得（13.1.9）可見Y1,Y2,…,Yp即為原始變量的p個主成份。因此，主成分的求解轉(zhuǎn)變?yōu)榍骕1,X2,…,Xp協(xié)方差矩陣的特征值和特征向量的問題。

第9頁，課件共108頁，創(chuàng)作于2023年2月10２．主成份的性質(zhì)

性質(zhì)1

Y的協(xié)方差矩陣為對角陣，即（13.1.10）性質(zhì)2

設(shè)=(ij)p×p是隨機變量向量X的協(xié)方差矩陣，可得即

第10頁，課件共108頁，創(chuàng)作于2023年2月11

由此可見，主成分分析是把

p個隨機變量的總方差分解為p個不相關(guān)隨機變量的方差之和1

＋2

＋…＋P，則總方差中屬于第i個主成分（被第i個主成分所解釋）的比例為（13.1.12）稱為第i個主成分的貢獻度。定義

（13.1.13）稱為前m個主成分的累積貢獻度，衡量了前m個主成份對原始變量的解釋程度。第11頁，課件共108頁，創(chuàng)作于2023年2月12

性質(zhì)3記第k個主成分Yk與原始變量Xi的相關(guān)系數(shù)為r(Yk，Xi)，稱為因子載荷，或者因子負荷量，則有

（13.1.14）第12頁，課件共108頁，創(chuàng)作于2023年2月133．從相關(guān)矩陣出發(fā)求解主成分在實際應(yīng)用時，為了消除原始變量量綱的影響，通常將數(shù)據(jù)標準化?？紤]下面的標準化變化，令（13.1.15）其中i，ii分別表示隨機變量Xi的期望與方差，則

第13頁，課件共108頁，創(chuàng)作于2023年2月14

原始變量的相關(guān)矩陣就是原始變量標準化后的協(xié)方差矩陣，因此，由相關(guān)矩陣求主成分的過程與由協(xié)方差矩陣求主成分的過程是一致的。如果仍然采用（λi，ei）表示相關(guān)矩陣R對應(yīng)的特征值和標準正交特征向量，根據(jù)式（13.1.9）有：

（13.1.17）由相關(guān)矩陣求得的主成分仍然滿足性質(zhì)1～3。性質(zhì)3可以進一步表示為：（13.1.18）第14頁，課件共108頁，創(chuàng)作于2023年2月1513.1.3樣本的主成分1．樣本統(tǒng)計量在實際工作中，我們通常無法獲得總體的協(xié)方差矩陣和相關(guān)矩陣R。因此，需要采用樣本數(shù)據(jù)來估計。設(shè)從均值向量為，協(xié)方差矩陣為的p維總體中得到的n個樣本，且樣本數(shù)據(jù)矩陣為（13.1.19）第15頁，課件共108頁，創(chuàng)作于2023年2月16則樣本協(xié)方差矩陣為：

（13.1.20）其中:

（13.1.21）樣本相關(guān)矩陣為：

（13.1.22）樣本協(xié)方差矩陣S是總體協(xié)方差矩陣的無偏估計量，樣本相關(guān)矩陣是總體相關(guān)矩陣R的估計量。第16頁，課件共108頁，創(chuàng)作于2023年2月172．樣本主成份及其性質(zhì)由于采用相關(guān)矩陣和協(xié)方差矩陣求解主成分的過程基本一致，因此本節(jié)僅介紹基于樣本相關(guān)矩陣求解主成分的過程。設(shè)樣本相關(guān)矩陣的特征值為，且與特征值相對應(yīng)的標準正交特征向量為，根據(jù)式（13.1.17）第i個樣本主成分可表示為：

（13.1.23）而且（13.1.24）（13.1.25）

第17頁，課件共108頁，創(chuàng)作于2023年2月18且由式（13.1.16）和性質(zhì)2可得（13.1.26）則第i個樣本主成分的貢獻度為，前m個樣本主成份的累計貢獻度為另外（13.1.27）第18頁，課件共108頁，創(chuàng)作于2023年2月193．主成份個數(shù)的確定主成分分析的目的之一是減少變量的個數(shù)，但是對于應(yīng)保留多少個主成分沒有確切的回答。通常需要綜合考慮樣本總方差的量、特征值的相對大小以及各成分對現(xiàn)實的闡述。一般所取m使得累積貢獻率達到85%以上為宜。另一個比較常用的可視的方法是碎石圖，首先將特征值按照從大到小的順序進行排列，碎石圖是特征值與相應(yīng)序號i的（i，）圖形，其中橫軸表示序號，縱軸表示特征值。為了確定主成分的合適個數(shù)，選擇碎石圖斜率變化較大的拐彎點，通常在此序號之后的特征值取值比較小，則此序號作為主成分的個數(shù)。例如，圖13.1所示的碎石圖在i=2處拐彎，則m選擇2。第三個經(jīng)驗的判斷方法是只保留那些方差大于1的主成分。第19頁，課件共108頁，創(chuàng)作于2023年2月20例13.1宏觀經(jīng)濟景氣波動的主成分分析

本例從一批對景氣變動敏感，有代表的指標中篩選出5個反應(yīng)宏觀經(jīng)濟波動的一致指標組：工業(yè)增加值增速（iva）、工業(yè)行業(yè)產(chǎn)品銷售收入增速（sr）、固定資產(chǎn)投資增速（if）、發(fā)電量增速（elec）和貨幣供應(yīng)量M1增速（m1），樣本區(qū)間從1998年1月～2006年12月，為了消除季節(jié)性因素和不規(guī)則因素，采用X-12方法進行季節(jié)調(diào)整。常用的方法是美國商務(wù)部采用的計算合成指數(shù)CI的方法。特別的，本例利用主成分分析降維的思想，提取主成分（PCA），并與合成指數(shù)CI的結(jié)果進行比較。第20頁，課件共108頁，創(chuàng)作于2023年2月2113.3.1EViews軟件中主成分分析的計算

本節(jié)以例13.1的數(shù)據(jù)為例，介紹EViews軟件中主成分分析的實現(xiàn)過程。首先將所涉及的變量建成一個組(g1)，選擇組菜單的View/PrincipalComponents...，出現(xiàn)如圖13.6所示的窗口。在窗口中有兩個切換鈕：第一個鈕標著Components，第二個鈕標著Calculation，控制著組中各序列離差矩陣的計算和估計。默認的，EViews完成主成分分析使用普通的（Pearson）相關(guān)矩陣，也可以在這個菜單下重新設(shè)定主成分的計算。第21頁，課件共108頁，創(chuàng)作于2023年2月221．Components選擇紐

Components按鈕用于設(shè)定顯示主成分和保存方差的特征值和特征向量。在Display對話框中可以以表的形式顯示特征值和特征向量，或者按照特征值的大小以線性圖的形式顯示，或者是載荷、得分的散點圖，或者兩個都顯示（biplot）。選擇不同的顯示方式，對話框中其余的內(nèi)容也會發(fā)生相應(yīng)的改變。第22頁，課件共108頁，創(chuàng)作于2023年2月23圖13.6主成分估計對話框(1)第23頁，課件共108頁，創(chuàng)作于2023年2月24第24頁，課件共108頁，創(chuàng)作于2023年2月25

表頭描述了觀測值的樣本區(qū)間、計算離差矩陣的方法以及保留成分的個數(shù)（在這個例子中顯示了所有的5個主成分）。表的第一部分概括了特征值（Value）、相應(yīng)特征值與后一項的差（Difference）、對總方差的累積解釋比例（CumulativeProportion）等等。由于上述結(jié)果的計算采用相關(guān)矩陣，所以5個特征值之和等于5。第一個成分占總方差的72.94%，第二個成分占總方差的19.22%。前兩個成分占總方差的92.16%。表的第二部分描述了線性組合的系數(shù)，第一個主成分（標為“PC1”）大約等于所有5個一致指標的線性組合，它可以解釋為一般的經(jīng)濟景氣指數(shù)。輸出的第三部分表示計算的相關(guān)矩陣。第25頁，課件共108頁，創(chuàng)作于2023年2月26第1主成分第2主成分第3主成分第4主成分第5主成分特征向量固定資產(chǎn)投資增速（if）0.449-0.3670.6960.2000.374工業(yè)增加值增速（iva）0.510-0.153-0.0780.312-0.783貨幣供應(yīng)量增速（m1r）0.2040.9130.2850.2080.009產(chǎn)品銷售收入增速（sr）0.4900.023-0.6540.2930.496發(fā)電量增速（elec）0.5080.088-0.020-0.857-0.026特征值3.6030.9880.2700.0870.051貢獻率0.7210.1970.0540.0180.01累積貢獻率0.7210.9180.9720.9901.000表13.1一致指標組的主成分分析結(jié)果

第26頁，課件共108頁，創(chuàng)作于2023年2月27

由表13.1可以看出，第1主成分的貢獻率為72.1%，已能較好地反映5個一致指標的總體變動情況，而且根據(jù)它們的特征值可以發(fā)現(xiàn)第2個特征值開始明顯變小(小于1)，碎石圖出現(xiàn)明顯的拐彎，同時為了討論方便，僅選擇m=1，提取第一個主成分反映經(jīng)濟變動。表13.1中已經(jīng)給出對應(yīng)的特征向量，根據(jù)式（13.1.23）可以得到對應(yīng)的主成分序列。

第27頁，課件共108頁，創(chuàng)作于2023年2月28圖13.7主成分估計對話框（2）

如果在主對話框的Display部分選擇Eigenvaluesplots，則顯示按順序排列的特征值的線性圖（碎石圖）。在對話框的下面將發(fā)生改變，可以選擇顯示特征值（碎石圖）、特征值的差、方差累積貢獻率其中之一，或是全部。如圖13.7所示可以選擇任意的復(fù)選框。默認的EViews僅顯示特征值排序的碎石圖。第28頁，課件共108頁，創(chuàng)作于2023年2月29第29頁，課件共108頁，創(chuàng)作于2023年2月30圖13.8主成分估計對話框（3）

變量載荷圖（Variableloadingsplot）給出對應(yīng)主成分的變量載荷系數(shù)，從圖中可以看出如何根據(jù)原始變量合成新的主成分；成分得分圖（Componentscoresplot）顯示對應(yīng)于樣本區(qū)間內(nèi)的觀測值成分的得分值；biplot(Biplots(scores&loadings))則表示在一個圖中同時顯示載荷系數(shù)和得分值。

第30頁，課件共108頁，創(chuàng)作于2023年2月31第31頁，課件共108頁，創(chuàng)作于2023年2月32圖13.10計算得分序列的設(shè)置對話框

2.Calculation選擇鈕在Type下拉菜單中選擇使用相關(guān)(Correlation)還是協(xié)方差(Covariance)矩陣。在Method下拉菜單中選擇計算方法：Ordinary,Ordinary(uncentered),Spearmanrank-orderorKendall’stau-a,orKendall’stau-b。在該對話框中，還可以設(shè)定計算使用的觀測值樣本。

第32頁，課件共108頁，創(chuàng)作于2023年2月33圖13.9保存得分序列的對話框3．保存得分序列如果想保存主成分得分序列，直接從組（Group）菜單中選擇Proc/MakePrincipalComponents...，則出現(xiàn)圖13.9所示的對話框。第33頁，課件共108頁，創(chuàng)作于2023年2月34

第一個選項是Scaling，用于選擇得分序列和載荷計算的權(quán)重。有4個選項：Normalizeloadings，Normalizescores，Symmetricweights和Userloadingweight，默認的Normalizeloadings，表示標準化載荷，使得所有觀測值得分對特征值有標準的比例；選擇Normalizescores，所有變量標準化為1；選擇Symmetricweights，將會有對稱的權(quán)重；選擇Userloadingweight，可以用戶自己定義權(quán)重。然后需要輸入得分序列的名稱，在例13.1中，我們輸入第一主成分的名字“PAC1”，用于保存第一個主成分。也可以根據(jù)需要保存對應(yīng)得分的載荷、特征值和特征向量。第34頁，課件共108頁，創(chuàng)作于2023年2月35

圖13.2中的實線給出了由主成分分析的第一主成分表示的一致景氣指數(shù)（PCA），虛線給出的是由國際上常用的美國商務(wù)部計算合成指數(shù)的方法給出的一致合成指數(shù)（CI），可以發(fā)現(xiàn)二者的變化趨勢和轉(zhuǎn)折點幾乎完全相同，只是波動的幅度略有差異。進一步表明：PCA指數(shù)不僅能夠反映景氣波動的變化趨勢和峰谷的轉(zhuǎn)折點，而且還能反映波動的幅度。

圖13.2第一主成分(PCA，左坐標),一致合成指數(shù)(CI，右坐標)第35頁，課件共108頁，創(chuàng)作于2023年2月3613.2因子分析

因子分析（factoranalysis，簡稱FA）是主成分分析的推廣，相對于主成分分析，因子分析更側(cè)重于解釋被觀測變量之間的相關(guān)關(guān)系或協(xié)方差之間的結(jié)構(gòu)。因子分析的思想源于1904年查爾斯·斯皮爾曼（CharlesSpearman）對學生考試成績的研究。研究多指標問題時常常會發(fā)現(xiàn)，這些指標相關(guān)性形成的背景原因是各種各樣的，其中共同的原因稱為公共因子；每一個變量也含有其特定的原因，成為特定（特殊）因子。因子分析的實質(zhì)就是用幾個潛在的但不能觀察的互不相關(guān)的隨機變量去描述許多變量之間的相關(guān)關(guān)系（或者協(xié)方差關(guān)系），這些隨機變量被稱為因子。為了使得這些因子能很好的替代原始數(shù)據(jù)，需要對這些因子給出合理的解釋。同時為了使用這些因子，還需要對提取結(jié)果進行評價。第36頁，課件共108頁，創(chuàng)作于2023年2月37

因此，可以簡單將因子分析的目標概括為以下幾方面：（1）首先考慮是否存在較少的不相關(guān)的隨機變量可用于描述原始變量之間的關(guān)系；（2）如果存在公共因子，那么究竟應(yīng)該選擇幾個；（3）對提取的公共因子的含義進行解釋；（4）評價每一個原始變量與公共因子之間的關(guān)系；（5）可以將這些公共因子用于其他的統(tǒng)計分析。本節(jié)將從這幾個角度給出詳細的介紹。需要注意的是因子分析從一系列高度相關(guān)的原始變量矩陣X=(X1,X2,…,Xp)中提取少數(shù)幾個不相關(guān)的因子，所以如果原始變量之間不相關(guān)則沒有必要進行因子分析。在實際研究和應(yīng)用中，為了消除觀察值之間由于量綱的差異而造成的影響，需要將觀測值按照式（13.1.15）進行標準化處理。本節(jié)的討論都是基于標準化后的序列，為了方便，把標準化后的隨機變量矩陣仍記為Z=(Z1,Z

2,…,Zp)。

第37頁，課件共108頁，創(chuàng)作于2023年2月3813.2.1基本的因子分析模型

假如對某一問題的研究涉及p個指標，且這p個指標之間存在較強的相關(guān)性，則基本的因子模型可以表示為（13.2.1）稱式（13.2.1）中F1,F2,…,Fm為公共因子，1,2,…,p

表示特殊因子，其中包含了隨機誤差，i

只與第i個變量Zi有關(guān)，

lij稱為第i個變量Zi

在第j個因子Fj上的載荷（因子載荷），由其構(gòu)成的矩陣L稱為因子載荷矩陣。第38頁，課件共108頁，創(chuàng)作于2023年2月39

式（13.2.1）進一步可以表示為下面的矩陣形式（13.2.2）其中，F(xiàn)=(F1,F2,…,Fm)；

=(1,2,…,p)。注意式（13.2.1）中的F1,F2,…,Fm

是不可觀測的隨機變量，因此，必須對隨機變量F和

做一些假定，使得模型具有特定的且能驗證的協(xié)方差結(jié)構(gòu)。

第39頁，課件共108頁，創(chuàng)作于2023年2月40假設(shè)（13.2.3）

（13.2.4）且F與獨立，即

（13.2.5）滿足式（13.2.3）～式（13.2.5）假定的模型（13.2.1）（或（13.2.2））稱為正交因子模型。第40頁，課件共108頁，創(chuàng)作于2023年2月4113.2.2正交因子模型的性質(zhì)

1．正交因子模型的協(xié)方差結(jié)構(gòu)假定隨機變量Z的協(xié)方差矩陣為Σ，則有

(13.2.6)(13.2.7)第41頁，課件共108頁，創(chuàng)作于2023年2月422．因子載荷lij的意義

由式（13.2.7）可得（13.2.8）由于假定Zi

和Fj都是方差為1的隨機變量，因此lij即為變量Zi

與因子Fj的相關(guān)系數(shù)。第42頁，課件共108頁，創(chuàng)作于2023年2月433．共同度與公因子的方差貢獻由式（13.2.6）可得令

則有

(13.2.9)其中hi2

反映了公共因子對

方差的貢獻，稱為共性方差，或者變量共同度。i稱為特殊方差，或者剩余方差。第43頁，課件共108頁，創(chuàng)作于2023年2月44

式（13.2.9）表明，hi2接近1時，i接近0，說明Zi

包含的幾乎全部信息都可以被公因子解釋；當hi2

接近0時，表明公共因子對的影響不大，主要由特殊因子描述。因此，hi2也反映了變量Zi對公共因子的依賴程度。與此類似，矩陣L的第j列元素反映了第j個因子Fj

對所有變量Z的影響，記為

(13.2.10)稱為公共因子Fj

對原始變量向量Z的方差貢獻，是衡量公共因子相對重要性的一個尺度，其值越大反映Fj

對原始變量向量Z的方差貢獻也越大。第44頁，課件共108頁，創(chuàng)作于2023年2月4513.2.3因子載荷的估計方法

因子分析的首要步驟是先確定因子載荷，或估計得到因子載荷矩陣L，注意在式（13.2.1）和式（13.2.2）中的F1,F2,…,Fm是不可觀測的隨機變量，因此因子載荷矩陣L的估計方法都比較復(fù)雜，常用的方法有極大似然法、主成分法、迭代主成分方法、最小二乘法、因子提取法等。第45頁，課件共108頁，創(chuàng)作于2023年2月461．極大似然法

如果假設(shè)公共因子F和特殊因子ε服從正態(tài)分布，即F～Nm(0,I)，～Np(0,)，X1,X2,…,Xp的均值為=(1,

2,…,

，則觀測值X1,X2,…,Xp為來自正態(tài)總體Np(,)的樣本，可以采用極大似然法估計因子載荷矩陣和特殊方差，似然函數(shù)是

和

的函數(shù)L(,

)。由于

，因此似然函數(shù)可以更清楚地表示為L(

,L,

)，記(,L,

)的估計量為

，則有

（13.2.11）第46頁，課件共108頁，創(chuàng)作于2023年2月472．主成分方法用主成分法確定因子載荷，就是對隨機變量進行主成分分析，把前面幾個主成分作為原始公共因子。其具體過程如下，設(shè)有p個變量Z=(Z1,Z2,…,Zp)，可以求得從大到小排序的p個主成分Y1，Y2，…，Yp，根據(jù)13.1節(jié)的內(nèi)容可知，原始變量與主成分之間存在如下的關(guān)系：

（13.2.13）第47頁，課件共108頁，創(chuàng)作于2023年2月48

由于A=(1,,…,p)=(e1,e2,…,ep)

為正交矩陣，則有

(13.2.14)如果在式（13.2.13）中僅取前m個主成分，把其余的p-m個主成分用特殊因子i代替，則式（13.2.13）可以表示為

（13.2.15）式（13.2.15）與式（13.2.1）的形式一致，Yi表示主成分，因此相互獨立。第48頁，課件共108頁，創(chuàng)作于2023年2月49

為了使Yi符合式（13.2.3）假設(shè)的公共因子，需要將主成分Yi的方差轉(zhuǎn)變?yōu)?。由13.1節(jié)的介紹可知，主成分方差為特征根i，只需要將Yi除以標準差即可，令，（13.2.16）則式（13.2.15）轉(zhuǎn)變?yōu)椋海?3.2.17）式（13.2.15）已與式（13.2.1）不僅在形式上一致，而且完全符合式（13.2.3）～式（13.2.5）的假設(shè)。由此就得到因子載荷矩陣和一組初始公共因子。第49頁，課件共108頁，創(chuàng)作于2023年2月503．迭代主成分方法（IteratedPrincipalFactors）

迭代主成分方法也叫主因子法，或主軸因子方法，是對主成分法的一種修正。首先對原始變量進行標準化處理，其相關(guān)矩陣與協(xié)方差矩陣一致，使其因子模型滿足式（13.2.1），根據(jù)式（13.2.6）有

(13.2.18)令

(13.2.19)稱R*為調(diào)整相關(guān)矩陣，或約相關(guān)矩陣。不妨設(shè)特殊因子i的方差的初始估計為i*，則有hi*2=1-i*

，且相應(yīng)的樣本相關(guān)矩陣為，則對應(yīng)的約相關(guān)矩陣為

(13.2.20)第50頁，課件共108頁，創(chuàng)作于2023年2月51

設(shè)的前m個特征值依次為1*≥2*≥…≥m*≥0，相應(yīng)的正交單位特征向量為e1*,e2*,…,em*，則對應(yīng)的因子載荷矩陣L的解為

(13.2.21）根據(jù)式（13.2.21）和式（13.2.18），可以進一步得到特殊因子方差的最終估計量為

,(13.2.22)如果希望得到擬合程度更好的解，則可以采用迭代的方法，即利用式（13.2.22）得到的特殊因子方差估計量帶入式（13.2.20）重復(fù)上述步驟，直到所求解比較穩(wěn)定為止。第51頁，課件共108頁，創(chuàng)作于2023年2月52下面介紹幾種求特殊因子方差和公共因子方差初始估計的幾種常用方法：

（1）復(fù)合相關(guān)系數(shù)（squaredmultiplecorrelations，簡稱SMC）方法SMC是比較常用的一種方法，令

，其中rii是

的第i個對角元素，此時公共因子方差的估計值為

它表示Xi與其他p-1個解釋變量之間的復(fù)相關(guān)系數(shù)。

（2）最大相關(guān)系數(shù)方法（maxabsolutecorrelation）

最大相關(guān)系數(shù)方法是用第i個變量Xi與其他變量相關(guān)系數(shù)絕對值的最大值來估計，即令

，其中rij表示第i個變量Xi與第j個變量Xj的相關(guān)系數(shù)。第52頁，課件共108頁，創(chuàng)作于2023年2月53

（3）對角線比例方法（fractionofdiagonals）

該方法使用相關(guān)矩陣（或協(xié)方差矩陣）對角線元素的固定比例。特殊的可以取

=1，此時結(jié)果等同于主成分求解得到的結(jié)果。

（4）分塊的協(xié)方差矩陣估計方法（partitionedcovariance，簡稱PACE）由于第3種方法PACE的估計量是非迭代的，因此，比較適合為迭代估計方法提供初值。

（5）特殊的直接取

，則i*=0，此時得到的

也是一個主成分解。第53頁，課件共108頁，創(chuàng)作于2023年2月5413.2.4因子數(shù)目的確定方法及檢驗

上述求解過程中重要的是如何確定公因子數(shù)目m，這是因子分析中最重要的一步。本小節(jié)將列出其中幾種常用的方法

1．因子數(shù)目的確定方法(1)最小特征值（Kaiser-GuttmanMinimumEigenvalue）Kaiser-Guttman規(guī)則也叫做“特征值大于1”方法，是最常用的一種方法。只需要計算離差矩陣（相關(guān)矩陣、協(xié)方差矩陣）的特征值，特征值超過平均值的個數(shù)作為因子個數(shù)。特別地，對于相關(guān)矩陣，特征值的均值為1，所以通常取特征值大于1的數(shù)作為公因子數(shù)。第54頁，課件共108頁，創(chuàng)作于2023年2月55(2)總方差比例（FractionofTotalVariance）選擇公因子個數(shù)m使得前m個特征值的和超過公因子總方差的某一門限值。這種方法多用于主成分分析方法，比較典型的是這些成分構(gòu)成總方差的95%（Jackson,1993）。(3)MAP方法（MinimumAveragePartial）Velicer(1976)

提出的最小平均偏相關(guān)(簡稱MAP)方法原理是：給定m個成分（m=0，1，…，p-1），計算偏相關(guān)系數(shù)平方的平均值，應(yīng)保留因子的個數(shù)是使得平均值最小化的個數(shù)第55頁，課件共108頁，創(chuàng)作于2023年2月56(4)分割線段（BrokenStick）分割線段模型的基本原理是：首先，計算離差矩陣中第j個最大特征值對方差的貢獻度，然后計算從分割線段分布得到的相應(yīng)的期望值

。當前者超過后者時，所對應(yīng)的j即為應(yīng)該保留的因子個數(shù)（Jackson,1993）。(5)平行分析（ParallelAnalysis）平行分析模擬使用的數(shù)據(jù)與原始數(shù)據(jù)有著相同方差和觀測值個數(shù)，是由隨機生成器生成的獨立隨機變量數(shù)據(jù)集。計算模擬數(shù)據(jù)的Pearson協(xié)方差和相關(guān)矩陣及其特征值。只要原始數(shù)據(jù)的特征值超過模擬數(shù)據(jù)的對應(yīng)值，相應(yīng)的個數(shù)將作為保留因子數(shù)第56頁，課件共108頁，創(chuàng)作于2023年2月572．公共因子個數(shù)的大樣本檢驗采用極大似然估計模型時，假設(shè)公共因子和特殊因子均服從正態(tài)分布，而正態(tài)分布的假定，可以幫助我們構(gòu)造模型充分性的檢驗。設(shè)提取m個公共因子的模型成立，則檢驗m個公共因子的充分性等價于檢驗

（13.2.27）對應(yīng)的備擇假設(shè)H1為Σ是任意其他的正定矩陣。第57頁，課件共108頁，創(chuàng)作于2023年2月58在原假設(shè)成立的條件下可以構(gòu)造下面的似然比統(tǒng)計量

（13.2.28）其中Sn表示協(xié)方差矩陣的極大似然估計；

，其中

和

分別表示L和

的極大似然估計量，而

是

的極大似然估計量。式（13.2.28）的統(tǒng)計量服從2分布。特別的，Bartlett在1954年證明了-2ln抽樣分布的

2近似可以用多重因子（n-1-(2p+4m+5)/6）代替式（13.2.28）中的n。第58頁，課件共108頁，創(chuàng)作于2023年2月59利用Bartlett修正，只要n和n-p大，若

（13.2.29）則在顯著性水平

下拒絕原假設(shè)H0，認為m個因子是不充分的。式（13.2.29）表示的2統(tǒng)計量也稱為Bartlett2統(tǒng)計量。由于式（13.2.29）中的自由度必須大于0，進一步化簡可以得到

（13.2.30）在選擇m時，必須根據(jù)上述方法進行判斷模型的充分性。第59頁，課件共108頁，創(chuàng)作于2023年2月60例13.2紐約股票交易所股票收益率的因子分析（1）曾有學者研究了紐約票股交易所的5只股票（阿萊德化學（allied）、杜邦(dupont)、聯(lián)合碳化物(union)、埃克森(exxon)和德士古(texaco)）從1975年1月到1976年12月期間周回報率之間的關(guān)系（數(shù)據(jù)見本章附錄）。周回報率定義為（本周五收盤價-上周五收盤價）/上周五收盤價，如有拆股或支付股息時進行相應(yīng)調(diào)整。連續(xù)100周的觀測值表現(xiàn)出獨立同分布，但是各股之間的回報率受總體經(jīng)濟狀況的影響，也存在相關(guān)關(guān)系。表13.2給出各指標的相關(guān)矩陣。第60頁，課件共108頁，創(chuàng)作于2023年2月61表13.2各指標的相關(guān)矩陣allieddupontunionexxontexacoallied1.000.580.510.390.46dupont0.581.000.600.390.32union0.510.601.000.440.43exxon0.390.390.441.000.52texaco0.460.320.430.521.00從表13.2可以看出各股收益率之間存在一定的相關(guān)性，本例采用因子分析計算其因子載荷矩陣、公共方差、剩余方差以及相應(yīng)的貢獻度。第61頁，課件共108頁，創(chuàng)作于2023年2月6213.3.2因子分析的實現(xiàn)

EViews中因子分析的實現(xiàn)是通過因子對象完成的。從工作文件的窗口選擇Object/NewObject，選中Factor；或者選中相應(yīng)的序列，單擊右鍵，選擇Open/asFactor...；或者打開一個已經(jīng)存在的組對象，選擇Proc/MakeFactor...；或者在命令窗口輸入關(guān)鍵詞factor，都會彈出圖13.12所示的因子分析設(shè)定對話框。從圖中可以看出，因子設(shè)定對話框也包含兩個切換鈕：Data和Estimation。第62頁，課件共108頁，創(chuàng)作于2023年2月63圖13.12因子設(shè)定對話框第63頁，課件共108頁，創(chuàng)作于2023年2月641．Estimation選擇鈕Estimation標簽用于控制主要的估計設(shè)置（圖13.11），其中主要包括估計方法、因子個數(shù)設(shè)定、初始貢獻率以及其他屬性4個方面的設(shè)置。(1)估計方法（Method）在Method的下拉菜單中，EViews提供了多種估計方法：極大似然估計法、廣義最小二乘法、不加權(quán)最小二乘法、主成分分析法、迭代主成分分析法以及非迭代的分區(qū)協(xié)方差估計方法（PACE）。選擇不同的方法，在右邊的屬性部分將會顯示不同的設(shè)置。第64頁，課件共108頁，創(chuàng)作于2023年2月65(2)因子數(shù)（Numberoffactors）EViews提供了很多的方法選擇因子數(shù)，各種方法的簡要概括可參考13.2.4節(jié)的介紹。默認的，EViews使用Velicer的minimumaveragepartial（MAP）方法。實證模擬結(jié)果表明：MAP和平行分析方法比起其他常用的方法來更精確?？梢愿鶕?jù)需要選擇不同的方法，但是頁面也會發(fā)生相應(yīng)的改變。(3)公共方差的初值

（InitialCommunalities）大部分估計方法都需要公共方差的原始估計。例如，對主成分估計方法，初始的公共方差是構(gòu)建估計的基礎(chǔ)。在EViews中可以從Initialcommunalities的下拉菜單中選擇不同的方法。第65頁，課件共108頁，創(chuàng)作于2023年2月66(4)估計選項（Opition）

估計屬性主要包括對迭代控制、scaling、隨機數(shù)生成器以及Heywood情況的選擇和設(shè)置。選中Scaleestimatestomatchobservedvariances復(fù)選框，可控制剩余方差和公共方差之和等于離差矩陣的對角元素。在迭代主因子估計的過程中，可能會遇到被估計公因子方差暗含至少一個剩余方差小于等于0，這種情況就是通常所說的Heywood情況。當EViews在計算中遇到Heywood情況時，有幾種方法是可選擇的。默認的，EViews將停止迭代，并給出最后的估計(Stopandreportfinal)，同時指出結(jié)果可能是不適合的；或者EViews報告前一次的迭代結(jié)果（Stopandreportlast）；或者結(jié)果為0，繼續(xù)（Settozero,continue）；或者忽略負的方差，繼續(xù)（Ignoreandcontinue）。

第66頁，課件共108頁，創(chuàng)作于2023年2月672．Data選擇鈕點擊Data按鈕，出現(xiàn)圖13.13所示的窗口，該窗口分為兩部分——協(xié)方差設(shè)置和協(xié)方差屬性。圖13.13

因子分析的數(shù)據(jù)設(shè)定對話框第67頁，課件共108頁，創(chuàng)作于2023年2月68(1)類型（Type）

協(xié)方差設(shè)置的第一項是Type下拉菜單，主要用于確定因子分析是基于協(xié)方差矩陣還是相關(guān)矩陣，或者采用用戶已經(jīng)根據(jù)相關(guān)測量方法定義的矩陣（User-matrix）(2)方法（Method）

可以用Method下拉菜單設(shè)定計算相關(guān)矩陣（或協(xié)方差矩陣）的方法：普通Pearson協(xié)方差、非中心協(xié)方差、斯皮爾曼秩協(xié)方差（Spearmanrank-ordercovariances）和Kendall’stau（肯德爾）相關(guān)測量。第68頁，課件共108頁，創(chuàng)作于2023年2月69(3)變量（Variables）在該框中應(yīng)列出用于因子分析的序列名稱，或包含這些序列的組名。(4)樣本（Sample）該項主要用于設(shè)定用于分析的觀測值的樣本，同時表明是否希望樣本是均衡的。默認的，如果遇到缺失數(shù)據(jù)，EViews將刪除相關(guān)變量中的缺失數(shù)據(jù)。第69頁，課件共108頁，創(chuàng)作于2023年2月70(5)偏相關(guān)或偏協(xié)方差（Partialing）偏相關(guān)和偏協(xié)方差可用于一對變量的分析，只需在相應(yīng)的編輯框中列出變量名稱。偏協(xié)方差或偏相關(guān)的分析不支持因子得分的計算，在這種選擇下要計算因子得分，同樣也需要使用用戶設(shè)定矩陣估計模型。(6)權(quán)重（Weighting）當選擇使用加權(quán)方法時，將會提示需要輸入權(quán)重序列的名稱。有5種不同的權(quán)重選擇：頻率、方差、標準偏差、比例方差和比例標準偏差。(7)自由度修正可以選擇使用極大似然估計量或者自由度修正規(guī)則計算協(xié)方差。默認的，EViews計算（沒有自由度修正的）ML估計的協(xié)方差。第70頁，課件共108頁，創(chuàng)作于2023年2月71(8)用戶設(shè)定矩陣如果在Type下拉菜單中選擇User-matrix，對話框?qū)l(fā)生改變。依次輸入矩陣名稱，這個矩陣應(yīng)該是方陣，并且是對稱的，但是對稱不是必須的；然后輸入一個標量表示觀測值的數(shù)，或者一個矩陣，它包含表示觀測值數(shù)目的一對數(shù)；最后，列名（C）主要是為結(jié)果提供標簽，如果不填寫此項，變量將以“V1”,“V2”…的形式顯示，不需要為所有的列提供名字，默認地名字將按照提供的順序被替代。第71頁，課件共108頁，創(chuàng)作于2023年2月72

下面給出例13.2采用主成分方法求解m=2時的結(jié)果，因子個數(shù)設(shè)置為2，其他選項都采用默認設(shè)置，其結(jié)果如下：公共方差

，剩余方差=1-0.50=0.50。其它相對應(yīng)的公共方差和剩余方差以此類推。從表13.3中可以發(fā)現(xiàn)所有股票都高度依賴于F

1，且載荷都差不多相等，可稱之為市場因子，代表總的經(jīng)濟條件。而在因子F

2上，化學類股票在此因子上均有負載荷，石油類股票在此因子上有正的載荷，表明因子F2將不同行業(yè)股票加以區(qū)分，稱為行業(yè)因子。第72頁，課件共108頁，創(chuàng)作于2023年2月73同時比較極大似然估計和主成分估計的結(jié)果可以發(fā)現(xiàn)：同樣在因子F1上有大的正的載荷，稱為市場因子；而因子F2的結(jié)果與主成分分析載荷的符號正好相反，同樣也是區(qū)分了行業(yè)，因此也稱為行業(yè)因子。我們需要進一步通過因子旋轉(zhuǎn)才能發(fā)現(xiàn)有用的因子模式。第73頁，課件共108頁，創(chuàng)作于2023年2月例13.3影響我國物價波動多因素的因子分析（1）

隨著我國市場化程度的深化以及經(jīng)濟全球化進程的加快，我國物價的波動不僅反映了國內(nèi)市場中總供給和總需求的矛盾，而且受國際經(jīng)濟的影響，尤其是國際市場價格的影響也越來越大。受國內(nèi)經(jīng)濟波動、居民收入及財富變化、生產(chǎn)成本價格上漲、國際石油、糧食等原材料價格的影響使得我國物價的波動變得極其復(fù)雜。由于物價的波動不是取決于某一種因素，或某幾個指標，而是受多方面因素的影響，此時簡單的多元回歸分析已經(jīng)無法滿足分析的需要。本例選擇15個經(jīng)濟變量，采用因子分析方法分析各因素對物價波動的影響，樣本區(qū)間為2000年1季度~2008年3季度。采用主成分方法（PrincipalFactors）求解，按照特征根大于1的準則，選取因子數(shù)目

m=4，求解結(jié)果如表13.5。第74頁，課件共108頁，創(chuàng)作于2023年2月剩余方差指標名稱F1載荷li1F2載荷li2F3載荷li3F4載荷li4剩余方差CPI居民消費價格指數(shù)(CPI)0.84-0.150.39-0.150.09成本因素原材料、燃料、動力購進價格指數(shù)0.79-0.54-0.17-0.140.03工業(yè)品出廠價格指數(shù)0.82-0.51-0.08-0.140.04農(nóng)副產(chǎn)品類購進價格指數(shù)0.76-0.21-0.21-0.010.34商品房銷售價格指數(shù)0.910.12-0.06-0.180.11工業(yè)企業(yè)成本費用利潤率0.870.24-0.180.060.16需求因素全部從業(yè)人員人均報酬增速0.270.370.77-0.130.19城鎮(zhèn)家庭人均可支配收入增速0.610.410.59-0.050.11貨幣因素外匯儲備同比增速0.480.58-0.46-0.230.17貨幣乘數(shù)0.440.44-0.560.310.20M2增速0.220.76-0.19-0.190.30GDP增長率0.830.300.000.400.06國際因素G7工業(yè)品出廠價格指數(shù)0.67-0.560.19-0.130.19G7支出法GDP同比增速0.19-0.50-0.180.620.31股價指數(shù)上證收盤綜合指數(shù)同比增速00.790.12特征值6.352.862.091.58貢獻率(%)42.3319.0813.9210.56累計貢獻率(%)42.3361.4175.3385.89表13.5影響物價波動多因素的因子分析結(jié)果第75頁，課件共108頁，創(chuàng)作于2023年2月從表13.5中可以看出：4個公因子對原始變量方差的累計貢獻率為85.89%，可見通過因子分析實現(xiàn)了將15維數(shù)據(jù)變量降至4維的目的。采用表13.5的信息還可以得到各變量對應(yīng)的公共方差和剩余方差，如對于第一個變量，=1-0.91=0.09。其它變量相對應(yīng)的公共方差和剩余方差以此類推。同時，通過表13.5各公因子的載荷可以看出：代表成本因素的各上游價格指數(shù)在公因子F1上有較高的載荷，可稱為成本因子；而代表居民需求增長的兩個收入變量在公因子F3上有較高的載荷，可稱為需求因子；而表示貨幣因素的3個變量在公因子F2上有較高的載荷，可稱為貨幣因子；而代表財富變化的股票指數(shù)在公因子F4上有較高的載荷，稱為財富因子。但還有一些變量的載荷并不是很明確，我們可以通過因子旋轉(zhuǎn)得到實際意義更加明確的因子模式。第76頁，課件共108頁，創(chuàng)作于2023年2月7713.2.5因子旋轉(zhuǎn)

因子分析的目的不僅是求出公共因子，更重要的是知道每個公共因子的實際意義，以便對所研究的問題作出進一步的分析。公共因子是否容易解釋，很大程度上取決于因子載荷矩陣L的元素結(jié)構(gòu)。假設(shè)因子載荷矩陣L是基于相關(guān)矩陣得到的，則其所有元素均在-1到1之間，如果L的所有元素都接近0或±1，公共因子的含義就容易解釋了，否則公因子含義將含糊不清。第77頁，課件共108頁，創(chuàng)作于2023年2月78設(shè)L是通過某種方法估計得到的因子載荷矩陣，令

且

(13.2.31)

(13.2.32)式（13.2.31）和式（13.2.32）表明因子載荷矩陣是不唯一的，對一任意正交陣T，

也是一個因子載荷矩陣。因此，實際中求得一個載荷矩陣

之后，可通過右乘正交陣T，使

更具有實際意義，這種變換載荷矩陣的方法稱為因子軸旋轉(zhuǎn)。因子的旋轉(zhuǎn)方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)。正交旋轉(zhuǎn)與斜交旋轉(zhuǎn)區(qū)別就在于：正交旋轉(zhuǎn)得到的新公共因子仍然是相互獨立的，但斜交旋轉(zhuǎn)則放寬了這一限制。第78頁，課件共108頁，創(chuàng)作于2023年2月79正交矩陣T

的不同選取法構(gòu)成了正交旋轉(zhuǎn)的各種不同方法，如最大方差旋轉(zhuǎn)法（Varimax）、全體旋轉(zhuǎn)（變量和因子同時旋轉(zhuǎn)，Equamax）、四分旋轉(zhuǎn)（Quartimax）等。最常采用的是最大方差旋轉(zhuǎn)法，其旋轉(zhuǎn)目的是使得因子載荷矩陣的元素取值盡可能地向兩極分化，部分元素取盡可能大的值，部分元素盡量接近零值。本節(jié)主要介紹最大方差旋轉(zhuǎn)法，其基本思想如下：第79頁，課件共108頁，創(chuàng)作于2023年2月80先考慮兩個因子（m=2）的平面正交旋轉(zhuǎn)，設(shè)因子載荷矩陣為

（13.2.33）取正交矩陣為其中

表示坐標平面上因子軸旋轉(zhuǎn)的角度，則

（13.2.34）

第80頁，課件共108頁，創(chuàng)作于2023年2月81當公共因子個數(shù)大于2時，可以逐次對每兩個進行上述的旋轉(zhuǎn)，如果存在m個公共因子，則需要進行

次變換，這樣就完成一輪旋轉(zhuǎn)。如果旋轉(zhuǎn)完畢，并不能認為已經(jīng)達到預(yù)期的效果，可以在第一輪所得結(jié)果基礎(chǔ)上繼續(xù)上述旋轉(zhuǎn)過程，可得第二輪旋轉(zhuǎn)結(jié)果。每一次旋轉(zhuǎn)以后，所得載荷矩陣各列平方的相對方差之和總會比上一次有所增加，而另一方面由于載荷矩陣每一個元素的絕對值均不大于1，因此，其方差最終一定會收斂于某一個極限。實際中，通常經(jīng)過若干次旋轉(zhuǎn)以后，如果總方差改變不大，則可以停止旋轉(zhuǎn)。第81頁，課件共108頁，創(chuàng)作于2023年2月8213.3.3因子旋轉(zhuǎn)的操作為了使得因子具有實際的意義，可以對初始回歸的結(jié)果進行因子旋轉(zhuǎn)。在EViews中簡單地點擊因子對象工具條中的Rotate按鈕，或者選擇Proc/Rotate...，都可以調(diào)用FactorRotation對話框，如圖13.14。圖13.14因子旋轉(zhuǎn)設(shè)定對話框第82頁，課件共108頁，創(chuàng)作于2023年2月83Type和Method下拉菜單可用于設(shè)定基本的選轉(zhuǎn)類型和方法，其中的一些方法，可能需要輸入一些參數(shù)值。默認的，在旋轉(zhuǎn)前，EViews不列出載荷權(quán)重。為了標準化數(shù)據(jù)，可以點擊Rowweight下拉菜單選擇Kaiser或者Cureton-Mulaik。另外，如果沒有旋轉(zhuǎn)載荷，EViews自動使用單位矩陣作為旋轉(zhuǎn)迭代的初值。也可以在Startingvalues下拉菜單中選擇合適的方式，如Random或User-specified。如果已經(jīng)完成一次旋轉(zhuǎn)，也可以使用已經(jīng)存在的結(jié)果作為下一次旋轉(zhuǎn)的初值。設(shè)置完畢單擊OK即可。EViews的估計結(jié)果將列出旋轉(zhuǎn)的載荷、因子相關(guān)關(guān)系、因子旋轉(zhuǎn)矩陣、旋轉(zhuǎn)后的載荷矩陣和旋轉(zhuǎn)目標函數(shù)值。EViews會把結(jié)果保存在因子對象中，從因子對象中選擇View/RotationResults，可以隨時查看旋轉(zhuǎn)結(jié)果的輸出表。第83頁，課件共108頁，創(chuàng)作于2023年2月84例13.4紐約股票交易所股票收益率的因子分析（2）從因子旋轉(zhuǎn)后結(jié)果可以看出石油股票（德士古和?？松┰谝蜃覨1有較高的載荷，而化學股票（阿萊德化學、杜邦、聯(lián)合碳化物）在因子

F2有較高的載荷。進一步表明正交化的因子旋轉(zhuǎn)將行業(yè)區(qū)分開，因子

代表引起石油股票波動的獨特的經(jīng)濟力量，因子F2代表引起化學股票波動的獨特的經(jīng)濟力量。在例13.3中表示一般市場因子的

F1被破壞了。第84頁，課件共108頁，創(chuàng)作于2023年2月例13.5影響我國物價波動多因素的因子分析（2）

本例對例13.3的結(jié)果采用方差最大化的正交旋轉(zhuǎn)方法進行因子旋轉(zhuǎn)，希望得到更好的結(jié)果，本例進行了兩次旋轉(zhuǎn)以后，總方差變化不大，結(jié)束旋轉(zhuǎn)。旋轉(zhuǎn)后的公共因子記為（i=1，2，…，4），相應(yīng)的載荷記為，其結(jié)果如表13.7所示。第85頁，課件共108頁，創(chuàng)作于2023年2月指標名稱F1載荷li1F2載荷li2F3載荷li3F4載荷li4CPI居民消費價格指數(shù)(CPI)0.770.080.540.12成本因素原材料、燃料、動力購進價格指數(shù)0.970.10-0.100.01工業(yè)品出廠價格指數(shù)0.970.0080.000.04農(nóng)副產(chǎn)品類購進價格指數(shù)0.730.33-0.030.13商品房銷售價格指數(shù)0.690.550.320.03工業(yè)企業(yè)成本費用利潤率0.540.670.210.24需求因素全部從業(yè)人員人均報酬增速-0.01-0.040.900.09城鎮(zhèn)家庭人均可支配收入增速60.22貨幣因素外匯儲備同比增速0.110.880.08-0.18貨幣乘數(shù)0.060.81-0.200.30M2增速-0.230.730.29-0.16GDP增長率0.410.590.290.58國際因素G7工業(yè)品出廠價格指數(shù)0.87-6G7支出法GDP同比增速0.33-0.16-0.460.59股價指數(shù)上證收盤綜合指數(shù)同比增速-0.070.020.290.89表13.7影響物價波動多因素的因子分析旋轉(zhuǎn)后的結(jié)果

第86頁，課件共108頁，創(chuàng)作于2023年2月從表13.7旋轉(zhuǎn)后的各公因子的載荷可以看出各因子所代表的意義更明確：代表成本因素的各上游價格指數(shù)和G7_PPI的變化在公因子F1上有較高的載荷，可稱

F1為成本因子，同時也表明我國價格的變化，尤其是原材料類價格的變化和國際PPI的變化有較高的相關(guān)性；而代表居民需求增長的兩個收入變量在公因子F3上有最高的載荷，可稱

F3為需求因子；而表示包括GDP增長率在內(nèi)的貨幣因素在公因子F2上的載荷都是最大的，可稱

F2為貨幣因子；而代表財富變化的股票指數(shù)和表示國際經(jīng)濟形勢的G7_GDP指數(shù)同比增速在公因子F4上載荷最大，稱為財富因子和國際經(jīng)濟因子。通過觀察旋轉(zhuǎn)后的因子載荷，可以發(fā)現(xiàn)各因子所代表實際意義更明確。本例主要考察物價波動，通過觀察可以發(fā)現(xiàn)CPI在各公因子的載荷分別為0.77、0.08、0.54和0.12，可見代表成本和需求變動的因子和對CPI變化的解釋能力是最強。第87頁，課件共108頁，創(chuàng)作于2023年2月8813.2.6因子得分前面介紹了如何獲得公共因子和估計因子載荷矩陣，但有時候需要把公共因子表示成原始變量的線性組合，對每個樣本計算公共因子的估計值，也就是求因子得分，因子得分可以作為進一步分析的原始數(shù)據(jù)。例如：對學生的各科成績進行分析，可發(fā)現(xiàn)依賴于兩個因子——全面智力和適應(yīng)開閉卷的能力，實際中我們不僅僅希望歸納出影響學生成績的因子，而且希望知道每一個學生對這兩種能力作出什么評價，或者說他在這兩個公共因子上應(yīng)打多少分。這就需要求解個體在公共因子上的得分。下面介紹兩種常用的因子得分估計方法。第88頁，課件共108頁，創(chuàng)作于2023年2月891．加權(quán)最小二乘法對于因子模型

（13.2.40）因子載荷矩陣L及特殊因子方差陣是已知的，可以假定特殊因子

是誤差。如果var(i)

對于i

…,

不全相等，巴特萊特（Bartlett，1937）建議采用加權(quán)最小二乘法。采用誤差方差的倒數(shù)作為權(quán)系數(shù)，則誤差平方的加權(quán)和可以表示為：

（13.2.41）第89頁，課件共108頁，創(chuàng)作于2023年2月90選擇F的估計值使得式（13.2.41）最小化，其解為：

（13.2.42）當采用極大似然法求解因子載荷矩陣時，需要滿足唯一性條件：

LL是對角矩陣。若對原載荷矩陣改用旋轉(zhuǎn)后的載荷矩陣L*=LT，則相應(yīng)的因子得分可表示為

。如果采用主成分分析方法估計因子載荷矩陣，習慣上采用未加權(quán)的最小二乘過程生成因子得分，則因子得分為

（13.2.43）第90頁，課件共108頁，創(chuàng)作于2023年2月912．回歸法仍然考慮因子模型（13.2.2）

（13.2.44）假設(shè)原始變量已標準化。在因子模型中也可以反過來將公共因子表示為變量的線性組合，建立公因子F

對變量Z

的回歸方程：

（13.2.45）令

則B

是需要估計的回歸系數(shù)，但是Fj

是不可觀測的。第91頁，課件共108頁，創(chuàng)作于2023年2月92由因子載荷的意義有：

（13.2.46）即

則有

，其中R為樣本相關(guān)矩陣，于是公共因子的估計為：

（13.2.47）由樣本計算相關(guān)矩陣，并估計因子載荷矩陣即可求得因子得分的估計值。第92頁，課件共108頁，創(chuàng)作于2023年2月933．因子得分的評價由于因子的不確定性，使得大量學者關(guān)注模型估計結(jié)果評價的問題。Gorsuch(1983)

和

Grice(2001)

給出了關(guān)于下述測量方法的詳細討論。

（1）不確定性指標（IndeterminacyIndices）度量不確定性的指標可以分為截然不同的兩類。第一類指標測量每一個因子和被觀測變量之間的多元相關(guān)系數(shù)r和它的平方r2。多元相關(guān)系數(shù)的平方是矩陣P=

-1

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

怎樣用做主成分分析和因子分析

文檔簡介

溫馨提示

最新文檔

評論

怎樣用做主成分分析和因子分析

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔