主成分與因子分析_第1頁
主成分與因子分析_第2頁
主成分與因子分析_第3頁
主成分與因子分析_第4頁
主成分與因子分析_第5頁
已閱讀5頁,還剩102頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

統(tǒng)計分析方法1主成分分析

因子分析2

第一部分

主成分分析3我們經(jīng)常遇到有很多變量的數(shù)據(jù)。在如此多的變量之中,有很多是相關的。人們希望能夠找出它們的少數(shù)“代表”(綜合指標)來對它們進行描述。4下面介紹兩種把變量維數(shù)降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。5主成分法的基本思想考慮二維情形,即只有兩個變量,它們由橫坐標和縱坐標所代表;因此每個觀測值都有相應于這兩個坐標軸的兩個坐標值;這些數(shù)據(jù)大致分布于一個橢圓形的區(qū)域中,如下圖所示:67這個橢圓有一個長軸和一個短軸。在短軸方向上,數(shù)據(jù)變化很少;在極端的情況,短軸如果退化成一點,那只有在長軸的方向才能夠解釋這些點的變化了;這樣,由二維到一維的降維就自然完成了。8如果長軸變量代表了數(shù)據(jù)包含的大部分信息,就用該變量代替原先的兩個變量(舍去次要的一維),降維就完成了。橢圓(球)的長短軸相差得越大,降維效果越好。9主成分法的數(shù)學模型10對原變量x1,x2等變換為y1,y2,

y3等使得y1方差最大,y2次之等等;y1,y2,y3等相互獨立。11可以寫成向量形式:y1=a’x問題:在a’a=1的條件下,求a使y1方差最大:

D(y1)=a’D(x)a其中:D(x)為x的方差協(xié)方差矩陣。當x為標準化后的變量向量,則D(x)為相關系數(shù)矩陣R。y1的方差為:D(y1)=a’Ra12實際使用過程中,先將變量標準化運用拉格朗日乘子法求約束條件下的極值:令得:可見:a為R的特征向量,λ為R的特征值。此時,

D(y1)=a’Ra=a’λa=λa’a=λ于是:第一主成分y1的方差為最大特征值。13結論(以y1為例)原變量相關系數(shù)矩陣的最大特征值即為y1的方差,原變量相關系數(shù)矩陣的最大特征值對應的特征向量。14第二部分

因子分析15一、因子分析的作用因子分析的作用主要有兩個:1.數(shù)據(jù)簡化可為進一步應用其他統(tǒng)計方法(如相關分析、回歸方法、判別分析法等)提供便利條件。2.尋求變量的基本結構16二、因子分析的基本步驟1.計算所有變量的相關矩陣,根據(jù)計算結果判斷應用因子分析方法是否合適。如果各變量獨立性較強,則不適合。2.提取因子。該步要確定求因子解的方法,和提取因子的個數(shù)。3.進行因子旋轉,對旋轉后的新因子作出實際意義解釋。4.計算因子值。即每個Case的各因子值(稱為因子得分值)17三、因子分析法的基本操作Analyze→DataReduction→Factor…

打開FactorAnalysis對話框將參與因子分析的變量依次選入Variables框中

分別對“Extraction”,“Rotation”,“Scores”等項進行設置.單擊“OK”即可18“Extraction”對話框選項Method:Principalcomponents(主成分分析,系統(tǒng)默認)Unweightedleastsquare(普通最小二乘法)Generalizedleastsquares(廣義最小二乘法)Maximumlikelihood(最大似然法)PrincipalAxisfactoring(主軸因子法)Alpha(α因子提取法)Image(映像分析法)19Extract:決定提取因子的個數(shù)Eigenvalueover:指定要提取因子的最小特征值,系統(tǒng)默認值為1Numberoffactors:直接指定提取的因子個數(shù)。20Display:指定與初始因子有關的輸出項Unrotatedfactorsolution:顯示未旋轉的因子解Screeplot:顯示碎石圖,用于決定因子提取個數(shù)。21“Rotation”對話框選項Method:選擇因子旋轉方法None(不進行旋轉)Varimax(方差最大法)Equamax(等量最大法)Quartimax(四次方最大法)DirectOblimin(斜交旋轉)22Display:指定輸出選項Rotatedsolution:顯示旋轉后的因子解Loadingplots:顯示因子載荷圖23“Scores”對話框選項Method:指定計算因子值方法Regression:回歸法Bartlett:巴特利特法Anderson-Rubin:安德森—魯賓法24Saveasvariables:將因子值作為新變量保存在數(shù)據(jù)文件中。25例1對公司業(yè)績評價,選取了11個指標。(詳見“因子分析”數(shù)據(jù)文件)本例目的:將11個指標進行簡化綜合2627全部有關變量28判斷“是否適合作因子分析”請進行以下操作………….293031輸出“碎石圖”請作以下操作………..323334進行因子旋轉(一般都需要)否則所得因子無法命名(缺乏實際經(jīng)濟意義)操作……….3536該選項(方差最大法)最常用37計算因子得分操作…………..383940要求因子載荷系數(shù)按大小順序排列操作……….41424344輸出結果:相關系數(shù)矩陣用于判斷是否作因子分析如果存在大量的接近零的相關系數(shù),則不適合作因子分析。45KMO指標大于0.7時,適合作因子分析。

0.6以上,作因子分析還可以

0.6以上,不太適合作因子分析Bartlett球度檢驗顯著時(P-值較低),則表明適合作因子分析。46共同度表明將11個變量簡化為3個因子后,對X1變量的解釋能力為86.2%,對X2的解釋能力為76.3%,等等。47特征值及方差貢獻率和累計方差貢獻率旋轉前,第1個因子對原11個變量的解釋能力為39.35%旋轉前,前3個因子對原11個變量的解釋能力為86.50%旋轉后,前3個因子對原11個變量的解釋能力為86.50%48該圖用于分析提取幾個公因子較為適當。方法:保留下降速度較快特征值對應的因子。4950總資產收益率=0.981·F1–0.015·F2+0.019·F3

凈資產收益率=0.976·F1–0.013·F2+0.028·F3

營業(yè)收益率=0.973·F1–0.035·F2+0.047·F3………..

旋轉后的因子載荷的含義(以前三行為例)51因子載荷系數(shù)的含義以前述第一個式子為例:總資產收益率=0.981·F1–0.015·F2+0.019·F3

總資產收益率與F1

(因子1)的相關系數(shù)為0.981總資產收益率與F2

(因子2)的相關系數(shù)為-0.015總資產收益率與F3

(因子3)的相關系數(shù)為0.01952因子的命名知道了因子載荷的含義后,我們就可以發(fā)現(xiàn)各因子的實際經(jīng)濟意義,并據(jù)此對各因子進行命名。53對因子1(F1)的命名總資產收益率=0.981·F1–0.015·F2+0.019·F3

凈資產收益率=0.976·F1–0.013·F2+0.028·F3

營業(yè)收益率=0.973·F1–0.035·F2+0.047·F3

凈利潤=0.873·F1–0.012·F2+0.032·F3

凈利潤率=0.747·F1–0.035·F2+0.183·F3主營業(yè)務收入增長率=–0.058·F1+0.987·F2+0.183·F3

固定資產增長率=–0.058·F1+0.986·F2+0.012·F3

總資產增長率=–0.055·F1+0.986·F2+0.005·F3

稅后利潤增長率=0.062·F1+0.809·F2+0.145·F3

主營業(yè)務收入=0.032·F1+0.124·F2+0.919·F3

凈資產=0.147·F1+0.004·F2+0.895·F354對因子1(F1)的命名總資產收益率=0.981·F1–0.015·F2+0.019·F3

凈資產收益率=0.976·F1–0.013·F2+0.028·F3

營業(yè)收益率=0.973·F1–0.035·F2+0.047·F3

凈利潤=0.873·F1–0.012·F2+0.032·F3

凈利潤率=0.747·F1–0.035·F2+0.183·F3主營業(yè)務收入增長率=–0.058·F1+0.987·F2+0.183·F3

固定資產增長率=–0.058·F1+0.986·F2+0.012·F3

總資產增長率=–0.055·F1+0.986·F2+0.005·F3

稅后利潤增長率=0.062·F1+0.809·F2+0.145·F3

主營業(yè)務收入=0.032·F1+0.124·F2+0.919·F3

凈資產=0.147·F1+0.004·F2+0.895·F3與因子1相關的指標有:總資產收益率凈資產收益率營業(yè)收益率凈利潤凈利潤率這些指標都屬于盈利能力指標,由此可知,因子1反映盈利能力,因此因子1可以命名為“盈利能力因子”55對因子2(F2)的命名總資產收益率=0.981·F1–0.015·F2+0.019·F3

凈資產收益率=0.976·F1–0.013·F2+0.028·F3

營業(yè)收益率=0.973·F1–0.035·F2+0.047·F3

凈利潤=0.873·F1–0.012·F2+0.032·F3

凈利潤率=0.747·F1–0.035·F2+0.183·F3

主營業(yè)務收入增長率=–0.058·F1+0.987·F2+0.183·F3

固定資產增長率=–0.058·F1+0.986·F2+0.012·F3

總資產增長率=–0.055·F1+0.986·F2+0.005·F3

稅后利潤增長率=0.062·F1+0.809·F2+0.145·F3

主營業(yè)務收入=0.032·F1+0.124·F2+0.919·F3

凈資產=0.147·F1+0.004·F2+0.895·F3與因子2相關的指標有:主營業(yè)務收入增長率、固定資產增長率總資產增長率、稅后利潤增長率這些指標都屬于“成長性”指標,由此可知,因子2反映“成長性”,因此因子2可以命名為“成長性因子”56對因子3(F3)的命名總資產收益率=0.981·F1–0.015·F2+0.019·F3

凈資產收益率=0.976·F1–0.013·F2+0.028·F3

營業(yè)收益率=0.973·F1–0.035·F2+0.047·F3

凈利潤=0.873·F1–0.012·F2+0.032·F3

凈利潤率=0.747·F1–0.035·F2+0.183·F3主營業(yè)務收入增長率=–0.058·F1+0.987·F2+0.183·F3

固定資產增長率=–0.058·F1+0.986·F2+0.012·F3

總資產增長率=–0.055·F1+0.986·F2+0.005·F3

稅后利潤增長率=0.062·F1+0.809·F2+0.145·F3

主營業(yè)務收入=0.032·F1+0.124·F2+0.919·F3

凈資產=0.147·F1+0.004·F2+0.895·F3與因子2相關的指標有:主營業(yè)務收入、凈資產這些指標都屬于“公司規(guī)?!敝笜耍纱丝芍?,因子3反映“公司規(guī)?!?,因此因子3可以命名為“公司規(guī)模因子”57因子命名(總結)因子1:盈利能力因子因子2:成長性因子因子3:公司規(guī)模因子58對公司業(yè)績衡量的原指標(11個)現(xiàn)在可以用三個新的業(yè)績綜合指標

盈利能力(F1)、成長性(F2)、公司規(guī)模(F3)表示。原來的11個指標可以舍棄各公司上述三個綜合指標值(稱為因子得分)以在原始數(shù)據(jù)文件中(見下頁)。至此,因子分析以達到“濃縮數(shù)據(jù)”或“精簡變量”的目的。59因子得分(部分數(shù)據(jù))60例2:運用因子分析建立綜合評價模型運用上例數(shù)據(jù)61基本操作同前與上例有所不同之處:計算因子得分操作增加以下選項……..626364輸出結果:與上例相比增加了因子得分系數(shù)矩陣:65F1=-0.049主營業(yè)務收入+0.211凈利潤–0.021凈資產+0.234營業(yè)收益率+0.236凈資產收益率+0.238總資產收益率+0.17凈利潤率+0.005總資產增長率+0.004主營營業(yè)收入增長率+0.021稅后利潤增長率+0.004固定資產增長率同樣可以寫出F2和F3的表達式66建立總業(yè)績評價指標利用上例結論,我們將原來的11個業(yè)績評價指標簡化為三個綜合業(yè)績指標:盈利能力F1、成長性F2、公司規(guī)模F3下面,我們通過對這三個綜合指標進行加權平均,得到業(yè)績評價總指標S?;舅悸?,確定各綜合指標的權重W1、

W2、

W3,用于反映F1、F2、F3的重要程度。繼而得到業(yè)績評價的總指標

S=W1*F1+W2*F2+W3*F367用于反映F1、F2、F3的重要程度的權重W1、

W2、

W3確定方法68各因子的方差貢獻率代表該因子的“信息含量”,為使各權重系數(shù)之和為1,因此有:W1=38.35/86.5=0.44W2=32.65/86.5=0.38W3=15.51/86.5=0.1869最終我們得到業(yè)績評價的總指標

S=0.44*F1+0.38*F2+0.18*F3S=0.44*FAC1_1+0.38*FAC2_1+0.18*FAC3_1該指標的優(yōu)點:權重是客觀的,非主觀的。70計算每個公司總業(yè)績指標值操作方法如下:見下頁。717273在原數(shù)據(jù)文件中得到各公司總業(yè)績指標值S7475依據(jù)各公司總業(yè)績指標值,可對所有公司的業(yè)績進行綜合排名,方法如下:767778這時,各公司已按總業(yè)績指標值從高到低的順序排列。79因子分析進一步舉例因子分析在上市公司投資價值綜合評價中的應用80指標選取——19個指標凈資產利潤率--X1總資產利潤率--X2每股收益--X3每股凈資產--X4主營業(yè)利潤率--X5市盈率--X6市凈率--X7股價--X881存貨周轉率--X9應收帳款周轉率--X10總資產周轉率--X11流動比率--X12速動比率--X13資產負債率--X1482利保障倍數(shù)--X15利潤增長率--X16主營業(yè)務利潤率增長率--X17每股收益增長率--X18總資產增長率--X1983數(shù)據(jù)選取選取1997年水泥行業(yè)13家上市公司:廣西虎威、大同水泥、新疆屯河、河北威遠、冀東水泥、江西水泥、尖鋒集團、祁連山、福建水泥、云南保山、四川金頂、天鵝股份、華新水泥841997年度水泥行業(yè)投資價值評價指標85共同度表明將19個變量簡化為五個因子后,對X1變量的解釋能力為96.5%,對X2的解釋能力為98.3%,等等。86特征值及方差貢獻率和累計方差貢獻率旋轉前,第1個因子對原19個變量的解釋能力為34.43%旋轉前,前5個因子對原19個變量的解釋能力為86.13%旋轉后前五個因子對原19個變量的解釋能力為86.13%87旋轉前的因子結構不夠簡化,不易于對因子作出實際意義的解釋。為了得到結果更好的因子載荷陣,初始因子實行旋轉。88啊旋轉后的因子載荷陣89第一公因子F1在指標X1,X2,X3,X10,X16和X18上有較大的載荷,這些是從凈資產利潤率、總資產利潤率、每股收益率、應收賬款周轉率、利潤增長率和每股收益增長率6個方面來反映公司投資價值的,因此可稱公因子F1為獲利能力因子。90第二公因子F2在X12、X13、X14、X17上有較大的載荷,這些是從流動比率、速動比率、資產負債率、主營業(yè)務利潤率增長率四個方面來反映公司投資價值的,因此可稱F2為負債經(jīng)營程度與財務杠桿效應因子。91第三公因子F3在X9、X11、X15、X19上有較大的載荷,這些是從存貨周轉率、總資產周轉率、利息保障倍數(shù)、總資產增長率來反映公司投資價值的,因此可稱F3為經(jīng)營與償債能力。92第四公因子F4在X5、X7、X8上有較大的載荷,這些是從主營業(yè)務利潤率、市凈率、股價來反映公司投資價值的,綜合反映了市場對公司資產創(chuàng)利能力的認可程度,因此稱F4為資產價值因子。93第五公因子F5在X6(市盈率)上有較大的載荷,反映了市場對公司前景的即時評價,因此稱F5為市場景氣因子。94通過以上因子分析可知,影響本例各公司投資價值的主要指標由原來的19個,可濃縮成以下五個綜合因素:1.獲利能力因素;2.資本結構與財務杠桿因素;3.經(jīng)營與償債能力因素;4.資產價值因素;5.市場景氣因素。95因子分析模型96

Fj為公共因子,每個公共因子是對模型中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論