應(yīng)用多元統(tǒng)計(jì)分析(第六版)課件-第八章因子分析_第1頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析(第六版)課件-第八章因子分析_第2頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析(第六版)課件-第八章因子分析_第3頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析(第六版)課件-第八章因子分析_第4頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析(第六版)課件-第八章因子分析_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章因子分析§8.1引言§8.2正交因子模型§8.3參數(shù)估計(jì)§8.4因子旋轉(zhuǎn)§8.5因子得分1§8.1引言

(本身作為目的的)主成分分析的成功需滿足如下兩點(diǎn): (1)前(少數(shù))幾個(gè)主成分具有較高的累計(jì)貢獻(xiàn)率; (通常較易得到滿足) (2)對(duì)主成分給出符合實(shí)際背景和意義的解釋。 (往往正是主成分分析的困難之處)因子分析的目的和用途與主成分分析類似,它也是一種降維方法。因子往往比主成分更易得到解釋。2因子分析起源于20世紀(jì)初,K.皮爾遜(Pearson)和C.斯皮爾曼(Spearman)等學(xué)者為定義和測(cè)定智力所作的努力,主要是由對(duì)心理測(cè)量學(xué)有興趣的科學(xué)家們培育和發(fā)展了因子分析。因子分析與主成分分析主要有如下一些區(qū)別:(1)主成分分析涉及的只是一般的變量變換,它不能作為一個(gè)模型來(lái)描述,本質(zhì)上幾乎不需要任何假定;而因子分析需要構(gòu)造一個(gè)因子模型,并伴有幾個(gè)關(guān)鍵性的假定。(2)主成分是原始變量的線性組合;而在因子分析中,原始變量是因子的線性組合,但因子卻一般不能表示為原始變量的線性組合。34(3)在主成分分析中,強(qiáng)調(diào)的是用少數(shù)幾個(gè)主成分解釋總方差;而在因子分析中,強(qiáng)調(diào)的是用少數(shù)幾個(gè)因子去描述協(xié)方差或相關(guān)系數(shù)。(4)主成分的解是唯一的(除非含有相同的特征值或特征向量為相反符號(hào));而因子的解可以有很多,表現(xiàn)得較為靈活(主要體現(xiàn)在因子旋轉(zhuǎn)上),這種靈活性使得變量在降維之后更易得到解釋,這是因子分析比(需對(duì)主成分作出解釋的)主成分分析有更廣泛應(yīng)用的一個(gè)重要原因。(5)主成分不會(huì)因其提取個(gè)數(shù)的改變而變化,但因子往往會(huì)隨模型中因子個(gè)數(shù)的不同而變化。5例8.1.1林登(Linden)根據(jù)他收集的來(lái)自139名運(yùn)動(dòng)員的比賽數(shù)據(jù),對(duì)第二次世界大戰(zhàn)以來(lái)奧林匹克十項(xiàng)全能比賽的得分作了因子分析研究。這十個(gè)全能項(xiàng)目是: x1:100米跑

x6:110米跨欄 x2:跳遠(yuǎn)

x7:鐵餅 x3:鉛球

x8:撐桿跳高 x4:跳高

x9:標(biāo)槍 x5:400米跑

x10:1500米跑經(jīng)標(biāo)準(zhǔn)化后所作的因子分析表明,十項(xiàng)得分基本上可歸結(jié)于他們的爆發(fā)性臂力強(qiáng)度、短跑速度、爆發(fā)性腿部強(qiáng)度和跑的耐力這四個(gè)方面,每一方面都稱為一個(gè)因子。十項(xiàng)得分與這四個(gè)因子之間的關(guān)系可以描述為如下的因子模型:xi=μi+ai1f1+ai2f2+ai3f3+ai4f4+εi,i=1,2,?,10其中f1,f2,f3,f4表示四個(gè)因子,稱為公共因子,aij稱為xi在因6子fj上的載荷,μi是xi的均值,εi是xi不能被四個(gè)公共因子解釋的部分,稱之為特殊因子。例8.1.3公司老板對(duì)48名應(yīng)聘者進(jìn)行面試,并給出他們?cè)?5個(gè)方面所得的分?jǐn)?shù),這15個(gè)方面是: x1:申請(qǐng)書的形式

x9:經(jīng)驗(yàn) x2:外貌

x10:積極性 x3:專業(yè)能力

x11:抱負(fù) x4:討人喜歡

x12:理解能力 x5:自信心

x13:潛力 x6:精明

x14:交際能力 x7:誠(chéng)實(shí)

x15:適應(yīng)性 x8:推銷能力通過(guò)因子分析,這15個(gè)方面可以歸結(jié)為應(yīng)聘者的進(jìn)取能干、經(jīng)驗(yàn)、討人喜歡的程度、專業(yè)能力和外貌這五個(gè)因子。7§8.2正交因子模型一、數(shù)學(xué)模型二、正交因子模型的性質(zhì)三、因子載荷矩陣的統(tǒng)計(jì)意義8一、數(shù)學(xué)模型設(shè)有p維可觀測(cè)的隨機(jī)向量,其均值為,協(xié)差陣為Σ=(σij)。因子分析的一般模型為

其中f1,f2,?,fm為公共因子,ε1,ε2,?,εp為特殊因子,它們都是不可觀測(cè)的隨機(jī)變量。公共因子出現(xiàn)在每一個(gè)原始變量的表達(dá)式中,可理解為原始變量共同具有的公共因素。上式可用矩陣表示為x=μ+Af+??9

式中為公共因子向量,為特殊因子向量,稱為因子載荷矩陣。通常假定該假定和上述關(guān)系式構(gòu)成了正交因子模型。由上述假定可以看出,公共因子彼此不相關(guān)且具有單位方差,特殊因子也彼此不相關(guān)且和公共因子也不相關(guān)。10二、正交因子模型的性質(zhì)(一)x的協(xié)差陣Σ的分解(二)模型不受單位的影響(三)因子載荷是不唯一的11(一)x的協(xié)差陣Σ的分解Σ=V(Af+ε)=V(Af)+V(ε)=

AV(f)A′+V(ε)=AA′+D如果A只有少數(shù)幾列,則上述分解式揭示了Σ的一個(gè)簡(jiǎn)單結(jié)構(gòu)。由于D是對(duì)角矩陣,故Σ的非對(duì)角線元素可由A的元素確定,即因子載荷完全決定了原始變量之間的協(xié)方差,具體有如果x為各分量已標(biāo)準(zhǔn)化了的隨機(jī)向量,則Σ就是相關(guān)陣R,即有R=AA′+D

相應(yīng)地有12例8.2.1設(shè)隨機(jī)向量x=(x1,x2,x3,x4)′的協(xié)方差矩陣為

則Σ可分解為Σ=AA′+D

其中13若取A=

Σ1/2,D=0,則有分解式Σ=Σ1/2Σ1/2+0

此時(shí)m=p,沒有達(dá)到降維目的,故所作的因子分析沒有意義。出于降維的需要,我們常常希望m要比p小得多,這樣前述Σ的分解式通常只能近似成立,即有Σ≈AA′+D

近似程度越好,表明因子模型擬合得越佳。在因子數(shù)m的選擇上,我們既希望m盡可能小又希望因子模型的擬合盡可能好,而這兩個(gè)目標(biāo)是彼此矛盾的,實(shí)踐中我們應(yīng)確定一個(gè)折中、合理的m。

14(二)模型不受單位的影響將x的單位作變化,通常是作一變換x*=Cx,這里C=diag(c1,c2,?,cp),ci>0,i=1,2,?,p,于是x*=Cμ+CAf+Cε

令μ*=Cμ,A*=CA,ε*=Cε,則有x*=μ*+A*f+ε*

這個(gè)模型能滿足類似于前述因子模型的假定,即15其中

因此,單位變換后新的模型仍為正交因子模型。16(三)因子載荷是不唯一的設(shè)T為任一m×m正交矩陣,令A(yù)*=AT,f*=T′f,則模型能表示為x=μ+A*f*+ε

因?yàn)? E(f*)=T′E(f)=0 V(f*)=T′V(f)T=T′T=ICov(f*,ε)=E(f*ε′)=T′E(fε′)=0

所以仍滿足模型條件。Σ也可分解為Σ=A*A*′+D因此,因子載荷矩陣A不是唯一的,在實(shí)際應(yīng)用中常常利用這一點(diǎn),通過(guò)因子的旋轉(zhuǎn)(見稍后的§8.4),使得新的因子有更好的實(shí)際意義。17三、因子載荷矩陣的統(tǒng)計(jì)意義(一)A的元素(二)A的行元素平方和(三)A的列元素平方和(四)A的元素平方和18(一)A的元素

若x為各分量已標(biāo)準(zhǔn)化了的隨機(jī)向量,則

19(二)A的行元素平方和 xi=μi+ai1f1+ai2f2+?+aimfm+εi

于是20反映了公共因子對(duì)xi的影響,可以看成是公共因子f1,f2,?,fm對(duì)xi的方差貢獻(xiàn),稱為共性方差;而是特殊因子εi對(duì)xi的方差貢獻(xiàn),稱為特殊方差。當(dāng)x為各分量已標(biāo)準(zhǔn)化了的隨機(jī)向量時(shí),σii=1,此時(shí)有21(三)A的列元素平方和

其中

反映了公共因子fj對(duì)x1,x2,?,xp的影響,是衡量公共因子fj重要性的一個(gè)尺度,可視為公共因子fj對(duì)x1,x2,?,xp的總方差貢獻(xiàn)。

22fj所解釋的總方差的比例(或稱貢獻(xiàn)率)為

,如果各原始變量已作了標(biāo)準(zhǔn)化,則該比例就簡(jiǎn)化為

。23(四)A的元素平方和A的元素平方和為或這是f1,f2,?,fm對(duì)總方差的累計(jì)貢獻(xiàn),f1,f2,?,fm所解釋的總方差的累計(jì)比例(或稱累計(jì)貢獻(xiàn)率)為24對(duì)于標(biāo)準(zhǔn)化了的原始變量可簡(jiǎn)化為在正交因子模型中雖然因子f1,f2,?,fm可100%地解釋原始變量之間的所有協(xié)方差或相關(guān)系數(shù),但并不能保證這些因子一定能解釋x1,x2,?,xp總方差的多大比例。理論上該比例可以是較低的,甚至很低。25例8.2.2

對(duì)例8.2.1作如下修改,用D*=bD替代D,用Σ*=Σ+(b?1)D替代Σ,A仍保持不變,其中常數(shù)b>0,則x

=(x1,x2,x3,x4)′的協(xié)方差矩陣Σ*可分解為Σ*=AA′+D*

于是,兩個(gè)因子f1和f2所解釋總方差的累計(jì)比例為可見,b越大(小),該累計(jì)比例就越小(大)。如取b=165,則累計(jì)比例就只有10%,當(dāng)然這屬于較極端的情況,實(shí)際應(yīng)用中對(duì)于擬合得這么好的因子模型,這么低的累計(jì)比例幾乎不會(huì)出現(xiàn)。26盡管如上所述,但在因子分析的許多實(shí)踐中,因子模型在擬合得好的同時(shí),公共因子所解釋的總方差的累計(jì)比例往往也是較高的。正因如此,因子分析常常如同主成分分析那樣用于分析樣品之間的差異性。在此種應(yīng)用中,公共因子所解釋的總方差的累計(jì)比例需要達(dá)到一個(gè)較高的水平。27§8.3參數(shù)估計(jì)一、主成分法二、主因子法三、極大似然法28一、主成分法設(shè)樣本協(xié)方差矩陣S的特征值依次為

,相應(yīng)的正交單位特征向量為

。選取相對(duì)較小的因子數(shù)m

,并使得累計(jì)貢獻(xiàn)率

達(dá)到一個(gè)較高的百分比,則S可近似分解如下:

其中

為p×m矩陣,

,i=1,2,?,p。這里的

就是因子模型的一個(gè)主成分解。29對(duì)主成分解,當(dāng)因子數(shù)增加時(shí),原來(lái)因子的估計(jì)載荷并不變,fj對(duì)x的總方差貢獻(xiàn)仍為

。主成分法與主成分分析有著很相似的名稱,兩者很容易混淆。雖然第j個(gè)因子與第j個(gè)主成分的解釋完全相同,但主成分法與主成分分析本質(zhì)上卻是兩個(gè)不同的概念。主成分法是因子分析中的一種參數(shù)估計(jì)方法,它并不計(jì)算任何主成分,且旋轉(zhuǎn)后的因子解釋一般就與主成分明顯不同了。稱

為殘差矩陣。對(duì)于主成分解,有當(dāng)p個(gè)原始變量的單位不同,或雖單位相同,但各變量的數(shù)值變異性相差較大時(shí),我們應(yīng)首先對(duì)原始變量作標(biāo)準(zhǔn)化變換,也就是從出發(fā)求解。30例8.3.1在例7.3.2中,分別取m=1和m=2,用主成分法估計(jì)的因子載荷和共性方差列于表8.3.1。表8.3.1 當(dāng)m=1和m=2時(shí)的主成分解變

量m=1m=2因子載荷共性方差因子載荷共性方差f1

f1

f2:100米0.8170.6680.8170.5310.950

:200米0.8670.7520.8670.4320.939:400米0.9150.8380.9150.2330.892:800米0.9490.9000.9490.0120.900:1500米0.9590.9200.959-0.1310.938:5000米0.9380.8790.938-0.2920.965:10000米0.9440.8910.944-0.2870.973:馬拉松0.8800.7740.880-0.4110.943所解釋的總方差的累計(jì)比例0.8280.8280.93831主成分解的近似關(guān)系式主成分解的因子解釋與主成分的解釋完全相同。因子f1代表在徑賽項(xiàng)目上的總體實(shí)力,可稱為強(qiáng)弱因子;因子f2反映了(短跑)速度與耐力的對(duì)比。32二、主因子法假定原始向量x的各分量已作了標(biāo)準(zhǔn)化變換。如果隨機(jī)向量x滿足正交因子模型,則有R=AA′+D令 R*=R?D=AA′

則稱R*為x的約相關(guān)矩陣。R*中的對(duì)角線元素是

,而不是1,非對(duì)角線元素和R中是完全一樣的,并且R*也是一個(gè)非負(fù)定矩陣。33設(shè)

是特殊方差

的一個(gè)合適的初始估計(jì),則約相關(guān)矩陣可估計(jì)為

其中

的初始估計(jì)。又設(shè)

的前m個(gè)特征值依次為

,相應(yīng)的正交單位特征向量為

,則A的主因子解為

34

由此我們可以重新估計(jì)特殊方差,

的最終估計(jì)為

如果我們希望求得擬合程度更好的解,則可以采用迭代的方法,即利用上式中的

再作為特殊方差的初始估計(jì),重復(fù)上述步驟,直至解穩(wěn)定為止。該估計(jì)方法稱為迭代主因子法。35特殊(或共性)方差的常用初始估計(jì)方法(1)取

,其中rii是

的第i個(gè)對(duì)角線元素,此時(shí)共性方差的估計(jì)為

,它是xi和其他p?1個(gè)變量間樣本復(fù)相關(guān)系數(shù)的平方,該初始估計(jì)方法最為常用,但一般要求滿秩。(2)取

,此時(shí)

。(3)取

,此時(shí)

,得到的

是一個(gè)主成分解。36例8.3.2在例7.3.2中,取m=2,為求得主因子解,選用xi與其他七個(gè)變量的復(fù)相關(guān)系數(shù)平方作為

的初始估計(jì)值。計(jì)算得

于是約相關(guān)矩陣為37 的特征值為

起特征值已接近于0,故取m=2,相應(yīng)的計(jì)算結(jié)果列于表8.3.2。38表8.3.2 當(dāng)m=2時(shí)的主因子解變

量因子載荷共性方差f1f2

:100米0.8070.4960.897

:200米0.8580.4120.906

:400米0.8900.2160.856

:800米0.9390.0240.881

:1500米0.956?0.1140.926

:5000米0.938?0.2820.960

:10000米0.946?0.2810.974

:馬拉松0.874?0.3780.907所解釋的總方差的累計(jì)比例0.8160.91439三、極大似然法設(shè)f~Nm(0,I),ε~Np(0,D),且相互獨(dú)立,則必有x~Np(μ,Σ)。由樣本x1,x2,?,xn計(jì)算得到的似然函數(shù)是μ和Σ的函數(shù)L(μ,Σ)。由于Σ=AA′+D,故似然函數(shù)可更清楚地表示為L(zhǎng)(μ,A,D)。記(μ,A,D)的極大似然估計(jì)為(),即有可以證明,

,而

滿足以下方程組:40

其中

。由于A的解是不唯一

的,故為了得到唯一解,可附加計(jì)算上方便的唯一性條件:A′D?1A是對(duì)角矩陣

上述方程組中的

一般可用迭代方法解得。對(duì)極大似然解,各因子所解釋的總方差的比例未必像主成分解及主因子解那樣依次遞減。還有,當(dāng)因子數(shù)增加時(shí),原來(lái)因子的估計(jì)載荷及對(duì)x的貢獻(xiàn)將發(fā)生變化,這也與主成分解及主因子解不同。例8.3.3在例7.3.2中,取m=2,極大似然法的計(jì)算結(jié)果列于表8.3.3。

的初始估計(jì)值與例8.3.2相同。41表8.3.3 當(dāng)m=2時(shí)的極大似然解變

量因子載荷共性方差f1f2

:100米0.731?0.6200.919

:200米0.792?0.5450.924

:400米0.855?0.3430.849

:800米0.916?0.1610.865

:1500米0.958?0.0260.918

:5000米0.9720.1440.966

:10000米0.9810.1430.982

:馬拉松0.9230.2490.914所解釋的總方差的累計(jì)比例0.8010.91742§8.4因子旋轉(zhuǎn)因子的解釋帶有一定的主觀性,我們常常通過(guò)旋轉(zhuǎn)因子的方法來(lái)減少這種主觀性且使之更易解釋。因子是否易于解釋,很大程度上取決于因子載荷矩陣A的元素結(jié)構(gòu)。假設(shè)A是從R出發(fā)求得的,則有|aij|≤1。如果A的所有元素都接近0或±1,則模型的因子就易于解釋。這時(shí)可將x1,x2,?,xp分成m個(gè)部分,分別對(duì)應(yīng)f1,?,fm,這是一種使因子解釋大為簡(jiǎn)化的理想情形,稱之為簡(jiǎn)單結(jié)構(gòu)。反之,如果A的元素多數(shù)居中,不大不小,則對(duì)模型的因子往往就不易作出解釋,此時(shí)應(yīng)考慮進(jìn)行因子旋轉(zhuǎn),使得旋轉(zhuǎn)之后的載荷矩陣在每一列上元素的絕對(duì)值盡量地大小拉開,也就是盡可能多地使其中的一些元素接近于0,另一些元素接近于±1。43因子旋轉(zhuǎn)方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)兩類,本章只討論正交旋轉(zhuǎn)。正交旋轉(zhuǎn):f*=T′f,相應(yīng)地有A*=AT。記因A*′=T′A′,即

故幾何上,考慮由在m個(gè)因子f1,f2,?,fm上的載荷構(gòu)成的m維坐標(biāo)系,于是ai是

在該坐標(biāo)系下的一個(gè)坐標(biāo)點(diǎn)。p個(gè)坐標(biāo)點(diǎn)a1,a2,?,ap經(jīng)正交旋轉(zhuǎn)后轉(zhuǎn)換為新坐標(biāo)點(diǎn)

,顯然這p個(gè)點(diǎn)的幾何結(jié)構(gòu)仍保持不變。

44

可見,因子正交旋轉(zhuǎn)不改變共性方差,且共性方差為上述坐標(biāo)點(diǎn)到原點(diǎn)的平方(歐氏)距離。 A*A*′=ATT′A′=AA′由此得tr(A*A*′)=tr(AA′),從而正交旋轉(zhuǎn)不改變m個(gè)因子的累計(jì)貢獻(xiàn)率。經(jīng)正交旋轉(zhuǎn)后的殘差矩陣

,仍保持不變。例8.4.1

對(duì)十個(gè)變量從R出發(fā)進(jìn)行因子分析,選取兩個(gè)因子f1和f2。圖8.4.1中有這十個(gè)變量的坐標(biāo)點(diǎn),橫軸f1和縱軸f2分別表示變量在因子f1和f2上的載荷,坐標(biāo)旋轉(zhuǎn)后的

軸和

軸的意思類似。旋轉(zhuǎn)后的因子載荷顯然具有簡(jiǎn)單結(jié)構(gòu),其旋轉(zhuǎn)角度可在該圖中用目測(cè)法加以(主觀)確定。4546圖8.4.1旋轉(zhuǎn)后具有簡(jiǎn)單結(jié)構(gòu)的因子載荷圖對(duì)m=2時(shí)的一般情形,設(shè)按逆時(shí)針旋轉(zhuǎn)的角度為θ(如其值為負(fù),則實(shí)為按順時(shí)針),則旋轉(zhuǎn)前后的因子載荷有如下關(guān)系式:當(dāng)因子數(shù)m>2時(shí),我們一般就無(wú)法通過(guò)目測(cè)確定旋轉(zhuǎn),此時(shí)需要通過(guò)一種算法來(lái)給出正交矩陣T,不同的算法構(gòu)成了正交旋轉(zhuǎn)的各種不同方法,在這些方法中使用最普遍的是最大方差旋轉(zhuǎn)法。令47其中

,則A*的第j列元素平方的相對(duì)方差可定義為所謂最大方差旋轉(zhuǎn)法就是選擇正交矩陣T,使得A*所有m個(gè)列元素平方的相對(duì)方差之和V=

V1+V2+?+Vm達(dá)到最大。例8.4.2在例8.3.1至例8.3.3中分別使用最大方差旋轉(zhuǎn)法,旋轉(zhuǎn)后的因子載荷矩陣列于表8.4.1。48表8.4.1 旋轉(zhuǎn)后的因子載荷估計(jì)變

量主成分主因子極大似然

:100米0.2740.9350.2870.9030.2880.914

:200米0.3760.8930.3810.8720.3790.883

:400米0.5430.7730.5410.7510.5410.746

:800米0.7120.6270.6950.6310.6890.624

:1500米0.8130.5250.7990.5370.7970.532

:5000米0.9020.3890.8950.3990.8990.397

:10000米0.9030.3970.9000.4050.9060.402

:馬拉松0.9360.2610.9090.2840.9140.281所解釋的總方差的累計(jì)比例0.5230.9380.5100.9140.5120.91749三種方法的因子載荷估計(jì)經(jīng)因子旋轉(zhuǎn)之后給出了大致相同的結(jié)果,

在因子

上的載荷依次增大,在因子

上的載荷依次減小,可稱

為耐力因子,稱

為(短跑)速度因子。將主成分解的

在圖8.4.2中用點(diǎn)表示,在點(diǎn)上標(biāo)出相應(yīng)變量的序號(hào)。使用最大方差旋轉(zhuǎn)法后,因子按順時(shí)針?lè)较蛐D(zhuǎn)了40.6°(θ=?40.6°),點(diǎn)i在新坐標(biāo)系下的坐標(biāo)為旋轉(zhuǎn)后的因子載荷配對(duì)

。50圖8.4.2主成分解的因子旋轉(zhuǎn)51例8.4.3對(duì)例6.3.7中的八個(gè)變量進(jìn)行因子分析,主成分解、主因子解和極大似然解的因子載荷見表8.4.2。這三種解的結(jié)果相近,f1都可稱為(身材)大小因子,f2也都可稱為形狀因子(或胖瘦因子)。52表8.4.2

m=2時(shí)的因子載荷估計(jì)變

量主成分主因子極大似然f1f2f1f2f1f2

:身高0.859-0.3720.857-0.3170.880-0.238

:手臂長(zhǎng)0.842-0.4410.846-0.3980.873-0.360

:上肢長(zhǎng)0.813-0.4590.810-0.4020.846-0.344

:下肢長(zhǎng)0.840-0.3950.832-0.3350.855-0.264

:體重0.7580.5250.7280.5370.7050.643

:頸圍0.6740.5330.6270.4940.5890.538

:胸圍0.6170.5800.5670.5160.5270.554

:胸寬0.6710.4180.6070.3600.5740.365所解釋的總方差的累計(jì)比例0.5840.8060.5510.7340.5540.74453表8.4.3

旋轉(zhuǎn)后的因子載荷估計(jì)變

量主成分主因子極大似然

:身高0.9000.2600.8700.2790.8630.293

:手臂長(zhǎng)0.9300.1950.9110.2090.9260.187

:上肢長(zhǎng)0.9190.1640.8850.1830.8940.185

:下肢長(zhǎng)0.8990.2290.8620.2500.8570.258

:體重0.2510.8870.2420.8720.2270.927

:頸圍0.1810.8400.1880.7760.1890.775

:胸圍0.1070.8400.1280.7560.1290.753

:胸寬0.2510.7500.2550.6580.2730.623所解釋的總方差的累計(jì)比例0.4370.8060.4100.7340.4140.74454經(jīng)最大方差旋轉(zhuǎn)法旋轉(zhuǎn)后的表8.4.3顯示,三種方法的因子載荷也都很相似,并都呈現(xiàn)出幾乎相同的簡(jiǎn)單結(jié)構(gòu),以致因子的解釋也都相同。

可稱為(身材)縱向(或長(zhǎng)度)因子;

可稱為(身材)橫向(或?qū)挾然驀龋┮蜃?。比較因子旋轉(zhuǎn)前后的因子解釋,應(yīng)該說(shuō)旋轉(zhuǎn)后的因子不如旋轉(zhuǎn)前的因子有更符合實(shí)際需要的解釋。單從這一點(diǎn)來(lái)看,所作的因子旋轉(zhuǎn)并不是很成功。不過(guò),旋轉(zhuǎn)后因子載荷所呈現(xiàn)出的簡(jiǎn)單結(jié)構(gòu)卻可以很好地被用來(lái)對(duì)變量進(jìn)行聚類。以上三種解都可將所有八個(gè)變量分為與

關(guān)系密切的

和與

關(guān)系密切的

兩類,這與

例6.3.7中的各聚類方法得到的結(jié)果相同。55例8.4.4滬市604家上市公司2001年財(cái)務(wù)報(bào)表中有這樣十個(gè)主要財(cái)務(wù)指標(biāo)(數(shù)據(jù)可從前言中提及的作者網(wǎng)頁(yè)上下載): x1:主營(yíng)業(yè)務(wù)收入(元) x6:每股凈資產(chǎn)(元) x2:主營(yíng)業(yè)務(wù)利潤(rùn)(元) x7:凈資產(chǎn)收益率(%) x3:利潤(rùn)總額(元) x8:總資產(chǎn)收益率(%) x4:凈利潤(rùn)(元) x9:資產(chǎn)總計(jì)(元) x5:每股收益(元) x10:股本

上述十個(gè)指標(biāo)的樣本相關(guān)矩陣列于表8.4.3。56從相關(guān)矩陣出發(fā),選擇主成分法,相關(guān)陣的前三個(gè)特征值為

累計(jì)貢獻(xiàn)率為83.82%,取因子數(shù)m=3,相應(yīng)結(jié)果列于表8.4.5。表8.4.4

十個(gè)財(cái)務(wù)指標(biāo)的樣本相關(guān)矩陣x1x2x3x4x5x6x7x8x9x10x11.000x20.7231.000x30.4270.7431.000x40.4070.6970.9821.000x50.1710.3250.5390.5591.000x60.1490.2280.2840.2740.5851.000x70.0960.1770.3620.4020.7760.2181.000x80.0660.2040.4550.5000.8490.2900.8331.000x90.7480.7680.5740.5670.1250.1380.0670.0581.000x100.6220.6190.4850.5000.002-0.0660.0330.0510.8611.00057表8.4.5

m=3時(shí)的主成分解變量因子載荷共性方差f1f2f3:主營(yíng)業(yè)務(wù)收入0.659?0.4720.1210.672:主營(yíng)業(yè)務(wù)利潤(rùn)0.835?0.3460.0970.826:利潤(rùn)總額0.8860.003?0.0370.786:凈利潤(rùn)0.8880.037?0.0820.796:每股收益0.6660.6920.1090.934

:每股凈資產(chǎn)0.3910.3670.8140.951

:凈資產(chǎn)收益率0.5270.670?0.3250.832

:總資產(chǎn)收益率0.5810.703?0.2600.899

:資產(chǎn)總計(jì)0.747?0.5640.0190.877

:股本0.636?0.596?0.2190.808所解釋的總方差的累計(jì)比例0.4880.7450.83858表8.4.6

旋轉(zhuǎn)后的因子載荷估計(jì)變量因子載荷共性方差:主營(yíng)業(yè)務(wù)收入0.809-0.0290.1290.672:主營(yíng)業(yè)務(wù)利潤(rùn)0.8740.1710.1820.826:利潤(rùn)總額0.7060.5090.1670.786:凈利潤(rùn)0.6880.5520.1350.796:每股收益0.1150.8490.4470.934

:每股凈資產(chǎn)0.0820.1990.9510.951

:凈資產(chǎn)收益率0.0220.9120.0040.832

:總資產(chǎn)收益率0.0450.9430.0870.899

:資產(chǎn)總計(jì)0.936-0.0120.0280.877

:股本0.869-0.013-0.2280.808所解釋的總方差的累計(jì)比例0.4040.7120.83859§8.5因子得分回歸法相比加權(quán)最小二乘法有著更高的估計(jì)精度,因而在實(shí)際應(yīng)用中,回歸法應(yīng)用得最為廣泛。一、加權(quán)最小二乘法二、回歸法*三、兩種因子得分方法的比較60一、加權(quán)最小二乘法

采用類似于回歸分析中加權(quán)最小二乘估計(jì)的想法將 估計(jì)為

稱為巴特萊特(Bartlett,1937)因子得分。在實(shí)際應(yīng)用中,用估計(jì)值分別代替上述公式中的μ,A和D,并將樣品xj的數(shù)據(jù)代入,便可得到相應(yīng)的因子得分61二、回歸法在正交因子模型中,假設(shè)服從(m+p)元正態(tài)分布,用回歸預(yù)測(cè)方法可將 估計(jì)為

稱為湯姆森(Thompson,1951)因子得分。

在實(shí)際應(yīng)用中,可用

分別代替上式中的μ,A,Σ來(lái)求得因子得分。樣品xj的因子得分62例8.5.1在例8.4.4中,用回歸法得到的因子得分為

其中

為xi的標(biāo)準(zhǔn)化值,i=1,2,?,p,經(jīng)計(jì)算:63序號(hào)股票名稱序號(hào)股票名稱1上海石化8.580-2.704-2.168?????2東方航空7.446-2.089-1.861595康美藥業(yè)-0.7010.2311.6243兗州煤碳6.9241.513-0.044596潛江制藥-0.706-0.4302.0854馬鋼股份6.175-1.251-2.804597瀏陽(yáng)花炮-0.7090.1460.6555寧滬高速5.3410.835-2.220598浪潮軟件-0.7131.625-1.3136廣州控股4.1012.5960.640599兆維科技-0.7282.511-1.3667青島海爾4.0220.9543.160600PT農(nóng)商社-0

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論