




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
Chp.8因子分析
(FactorAnalysis)概述因子分析的基本原理初始因子矩陣及其計算方法因子旋轉(zhuǎn)
因子計量Chp.8因子分析8.1概述
在科學(xué)研究中,需要對反映事物的多個變量進行大量的觀測,收集大量數(shù)據(jù)以便進行分析尋找規(guī)律。多變量大樣本在提供豐富信息的同時,一定程度上也增加了數(shù)據(jù)采集的工作量,更重要的是在大多數(shù)情況下,許多變量之間可能存在相關(guān)性而增加了問題分析的復(fù)雜性,對分析帶來不便。如果分別分析每個指標(biāo),分析又可能是孤立的,而不是綜合的。盲目減少指標(biāo)會損失很多信息,容易產(chǎn)生錯誤的結(jié)論。出路:找到一種方法,在減少分析指標(biāo)的同時,盡量減少原指標(biāo)包含信息的損失,對所收集的資料作全面的分析。由于各變量間存在一定的相關(guān)關(guān)系,因此有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息。因子分析就是從多個變量指標(biāo)中選擇出少數(shù)幾個綜合變量指標(biāo)的一種降維的多元統(tǒng)計分析方法。
Chp.8因子分析8.1概述
固定資產(chǎn)利稅率資金利稅率銷售收入利稅率資金利稅率固定資產(chǎn)產(chǎn)值率流動資金周轉(zhuǎn)天數(shù)萬元產(chǎn)值能耗全員勞動生產(chǎn)率觀測變量盈利能力產(chǎn)值能耗資金和人力利用公共因子Chp.8因子分析8.1概述
2.問題的延伸
①用三個組合比用5個元素研究碳酸巖合理,易于解釋。②可以把C、O、Ca、Mg、Si看成原始變量,把CaCO3、MgCO3、SiO2看成是原始變量的組合,它們是新變量(公共因子),更反映事物的本質(zhì)。③從多個變量(5個)減少為少數(shù)變量(3個)有利于研究。Chp.8因子分析8.1概述
④新變量的組合可表示為:Fj=βj1x1+βj2x2+…+βjpxp→
F1(CaCO3)=β11Ca+β12C+β13O+β14Mg+β15SiF2(MgCO3)=β21Ca+β22C+β23O+β24Mg+β25SiF3(SiO2)=β31Ca+β32C+β33O+β34Mg+β35Si⑤反過來,也可用三個組合表示原始變量,來研究組合與原始變量的關(guān)系:Zj=aj1F1+aj2F2+…+ajmFm+αjUj
如對Si,可用Si=a51F1+a52F2+a53F3
Chp.8因子分析8.1概述
⑥因子分析的任務(wù),就是分析、表征事物的屬性與其影響因素之間的數(shù)據(jù)結(jié)構(gòu)和關(guān)系,達到簡化問題、突出事物本質(zhì)的目的。Chp.8因子分析8.1概述
從數(shù)學(xué)角度而言,因子分析是一種尋找潛在支配因子的模型分析方法,其實質(zhì)就是一種降維的多元統(tǒng)計方法。其特點包括:3.因子分析的基本思想
①通過數(shù)學(xué)方法把數(shù)目較多的原始變量進行變換,找到一些新變量(組合);②新變量較原始變量數(shù)目少得多,且使原來復(fù)雜的關(guān)系相對簡單化,有助于了解自然現(xiàn)象的規(guī)律,在變量多、數(shù)據(jù)量大時更具優(yōu)點。③少數(shù)組合能盡量反映原來多變量的信息,它們又彼此正交,便于對變量進行分類解釋。
Chp.8因子分析8.1概述
有兩種主要的分析方法:①R型因子分析:研究變量之間的相互關(guān)系,通過對變量間的相關(guān)系數(shù)陣的內(nèi)部結(jié)構(gòu)的研究,找出控制著所有變量的幾個主成分,所以又稱主成分分析(PrincipalComponentAnalysis)。②Q型因子分析:研究樣品間的相關(guān)關(guān)系,通過對樣品間的相似系數(shù)陣的內(nèi)部結(jié)構(gòu)的研究,找出控制著所有樣品的幾個主要因素,所以又稱主因素分析。
4.因子分析的主要方法
Chp.8因子分析8.1概述
①歸納綜合地質(zhì)現(xiàn)象,剔除原始觀測值中重復(fù)的成分,用更簡練的形式描述地質(zhì)現(xiàn)象。②用于研究諸如成因、成巖、共生組合、指示元素等地質(zhì)問題。5.因子分析的地質(zhì)學(xué)用途
Chp.8因子分析8.2因子分析的基本原理
①設(shè)有N個樣品,每個樣品有n個變量(x1,…,xn),它們有m個綜合因子,記為F1,F2,…,Fm(m<=n)1.主因子(主成分、主因素)的幾何意義F1F2②為了方便,現(xiàn)設(shè)有兩個變量x1,x2
對于二元正態(tài)分布變量,N個點的散布點大致為一橢圓,若在橢圓長軸方向取坐標(biāo)F1,短軸方向取F2,相當(dāng)于作了一個坐標(biāo)變換(x1→F1,x2→F2)Chp.8因子分析8.2因子分析的基本原理
變換后的坐標(biāo)有如下性質(zhì):?。㎞個樣品點的坐標(biāo)F1,F(xiàn)2的相關(guān)性→0ⅱ)N個點的波動(方差)大部分可以歸結(jié)為F1軸上的波動,而F2上波動趨近于0。ⅲ)F1,F(xiàn)2為x1,x2的綜合因子
X1=a11F1+a12F2X2=a21F1+a22F21.主因子(主成分、主因素)的幾何意義當(dāng)圖中橢圓很扁平時,可只考慮F1上的波動,忽略F2上的波動,這樣,二維可以降為一維。Chp.8因子分析8.2因子分析的基本原理
③把兩個變量推廣到n個變量(x1,x2,…,xn),將它們綜合成m個綜合因子時,則原始變量:
Zj=aj1F1+aj2F2+…+ajmFm+αjUj
而綜合因子:F1=β11x1+β12x2+…+β1nxnF2=β21x1+β22x2+…+β2nxn……………Fm=βm1x1+βm2x2+…+βmnxn而且要求:βk12+βk22+…+βkn2=11.主因子(主成分、主因素)的幾何意義Chp.8因子分析8.2因子分析的基本原理
①信息(或方差)的分解各變量的統(tǒng)計信息來源于方差,可以把n個變量提供的信息分解為:2.因子模型(因子分析的數(shù)學(xué)模型)1)由所有變量共同具有的少數(shù)幾個因子構(gòu)成的部分,即所謂公共因素部分—公共因子(m個,且m<=n);2)每個變量獨自具有的因素,即所謂獨特因素部分—唯一因子。
因子分析的基本任務(wù)是將以上兩部分分開。
Chp.8因子分析8.2因子分析的基本原理
②n個變量的R型因子分析模型(主成分分析模型)將變量用若干個因子(公共因子、唯一因子)表示的模型,稱為因子模型。
其中最簡單的為線性模型,主成分分析中每一變量Zj由下列線性組合表示:
Z1=a11F1+a12F2+…+a1mFm+α1U1Z2=a21F1+a22F2+…+a2mFm+α2U2……………
…Zn=an1F1+an2F2+…+anmFm+αnUn2.因子模型(因子分析的數(shù)學(xué)模型)Chp.8因子分析8.2因子分析的基本原理
③n個樣品的Q型因子分析模型(主因素分析模型)xi=ai1F1+ai2F2+…+aimFm+αiUi④向量Zj可以由m個互不相關(guān)的獨立因子F1,F2,…,Fm和Uj表示,這個線性表示(一組線性方程)叫因子模型。2.因子模型(因子分析的數(shù)學(xué)模型)Chp.8因子分析8.2因子分析的基本原理
2.因子模型(因子分析的數(shù)學(xué)模型)⑤主成分分析因子模型中的符號意義4)當(dāng)我們把變量Zj看成是m維空間中的一個向量時,則因子負(fù)荷ajp(p=1,2,…,m)表示變量Zj在坐標(biāo)軸Fp上的坐標(biāo);5)αj為唯一因子系數(shù),下標(biāo)j表示變量序號;6)從幾何角度看,找主因子就是在n維空間中尋找橢球體的主軸問題;從數(shù)學(xué)角度看,則是從n個變量x1,x2,…,xn的相關(guān)矩陣中找出p個較大特征值對應(yīng)的特征向量。
Chp.8因子分析8.2因子分析的基本原理
2.因子模型(因子分析的數(shù)學(xué)模型)⑥因子模型的矩陣形式:Z=A?F+αU矩陣A:因子負(fù)荷陣,求解A陣是因子分析中關(guān)鍵的一步;矩陣Z:標(biāo)準(zhǔn)化后的觀測值陣;矩陣F:公因子陣;矩陣U:唯一因子陣。Chp.8因子分析8.2因子分析的基本原理
2.因子模型(因子分析的數(shù)學(xué)模型)⑦因子模型的幾點說明1)在正交條件下,ajp就是第j個變量(j=1,2,…,n)與第n個公因子(p=1,2,…,m)的相關(guān)系數(shù);2)一個變量Zj的總方差由三部分組成:a)公因子方差(hj2):全部公因子(F1,…,Fm)對變量Zj的總方差所作的貢獻;b)誤差因子方差(cj2);c)特殊因子方差(bj2);由于標(biāo)準(zhǔn)化后的方差為1,故有:hj2+bj2+cj2=1
Chp.8因子分析8.2因子分析的基本原理
2.因子模型(因子分析的數(shù)學(xué)模型)⑦因子模型的幾點說明4)因子負(fù)荷矩陣A中各列元素的平方和稱為公因子Fp的方差貢獻。
Sp表示:同一公因子Fp對諸變量所提供的方差的總和,它是衡量公因子相對重要性的標(biāo)志;Chp.8因子分析8.2因子分析的基本原理
2.因子模型(因子分析的數(shù)學(xué)模型)⑦因子模型的幾點說明5)對一個因子模型的解釋
a)F1反映了Cu、Ag礦化;
b)F2反映了Ni、Co礦化(另一期礦化);
c)Cu的hj2=0.942+0.022+(-0.02)2=0.884,說明三個公因子說明了Cu變差的88.4%;
d)公因子方差hj2的分析為選擇公共因子數(shù)提供了依據(jù),一般hj2≥80%即可認(rèn)為所選因子數(shù)對變量Zj已滿足,否則再補加公因子,如Ag的hj2=0.3245,顯然不夠(對于Ag三個公因子不夠)。Chp.8因子分析8.3初始因子矩陣及其計算方法
2.主成分的主要性質(zhì)(R型)④R陣全部特征值之和等于階數(shù);⑤對于全部n個變量,若第t個因子的ajt與第s個因子的ajs的乘積之和等于0,說明因子t與s正交。Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法①計算相關(guān)矩陣(以5個樣,3個變量為例)首先,對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化:Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法①計算相關(guān)矩陣其次,計算相關(guān)系數(shù):例如:=0.916Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法②求特征值及特征向量1)R的特征方程為:|R-λi|=0,即:解此方程得:
λ1=2.87,λ2=0.128,λ3=0.002說明:λ1+λ2+λ3=3,等于變量個數(shù)。Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法②求特征值及特征向量2)計算特征向量,通過下列矩陣方程求出:RX-λX=0X即為特征向量
將λ1=2.87代入,解得:X1λ1=0.586,X2λ1=0.564,X3λ1=0.581同樣,求得:X1λ2=0.317,X2λ2=-0.820,X3λ2=0.476由于λ3=0.002太小,從略。Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法②求特征值及特征向量3)按一定的標(biāo)準(zhǔn)選取特征值變量Zj,它所涉及的公因子個數(shù)稱為該變量的“復(fù)雜性”;選取合理的公因子個數(shù),關(guān)鍵在于合理選其公因子方差hj2;選取的原則是:a)根據(jù)特征值在特征值總數(shù)中所占的比例,比值越大,說明變化性越多,一般取0.8~0.9,在本題中,∑λi=3,(λ1+λ2)/∑λi=(2.87+0.128)/3≈100%,即選兩個Fp即可;b)另一種方法:選取特征值λi>1的即可。
Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法②求特征值及特征向量4)計算因子負(fù)荷αjp為第p個特征值對應(yīng)的第j個特征向量對應(yīng)λ1=2.87:
對應(yīng)λ2=0.128:于是,初始因子矩陣Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法②求特征值及特征向量5)公因子方差h12=a112+a122=0.9932+0.1122=0.999h22=0.998h32=0.9976)公因子Fp的方差貢獻S1=0.9932+0.9552+0.9842=2.87=λ1S2=0.1132+(-0.293)2+0.1702=0.128=λ2Chp.8因子分析8.3初始因子矩陣及其計算方法
3.求初始因子陣A的方法②求特征值及特征向量7)給出正交因子模型FpajiXjF1F2hj2X10.9930.1130.999X20.955-0.2930.998X30.9840.1700.997Sp2.870.128
Chp.8因子分析8.4因子旋轉(zhuǎn)1.概述建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出主因子解后,各個主因子的典型代表變量不很突出,還需要進行因子旋轉(zhuǎn),以便得到比較滿意的主因子。Chp.8因子分析8.4因子旋轉(zhuǎn)1.概述進行因子旋轉(zhuǎn),就是要使因子載荷矩陣中因子載荷向0和1兩個方向分化,使大的載荷更大,小的載荷更小。如有兩個變量x1,x2,在F1,F2上的投影值相似,當(dāng)把F1,F2旋轉(zhuǎn)為FⅠ,F(xiàn)Ⅱ后,就變得清晰了。Chp.8因子分析8.4因子旋轉(zhuǎn)1.概述因子旋轉(zhuǎn)過程中,如果因子對應(yīng)軸相互正交,則稱為正交旋轉(zhuǎn);旋轉(zhuǎn)的方法有很多,正交旋轉(zhuǎn)(orthogonalrotation)和斜交旋轉(zhuǎn)(obliquerotation)是因子旋轉(zhuǎn)的兩類方法。最常用的方法是最大方差正交旋轉(zhuǎn)法(Varimax)。如果因子對應(yīng)軸相互間不是正交的,則稱為斜交旋轉(zhuǎn)。常用的斜交旋轉(zhuǎn)方法有Promax法等。Chp.8因子分析8.4因子旋轉(zhuǎn)2.判斷因子解好壞的Thurstone簡單結(jié)構(gòu)準(zhǔn)則①每一因子Fp僅有少數(shù)研究對象(變量、樣品)在它上面有高值(或集中分布);②任一研究對象(變量、樣品)只能在極少數(shù)因子上有高值(不計正負(fù))。即:每一變量盡可能只與一個因子有關(guān),因子負(fù)荷ajp盡可能趨于0、+1、-1。Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例
煤炭中除常量元素外,還含有多種潛在毒害元素,如Hg、Se、Pb、Cd、As、Zn、Sb和Ti等。煤在燃燒過程中,這些元素呈氣態(tài)或吸附在煙氣中細(xì)小顆粒物中呈氣溶膠態(tài),并能通過各種煙氣污染控制設(shè)施而釋放到大氣環(huán)境中,成為大氣環(huán)境的主要污染源。為了了解和有效地控制煤炭使用過程引起的這些潛在毒害元素的環(huán)境污染程度,不僅要弄清煤中這些元素的分布規(guī)律,更重要的是要弄清這些元素在煤中的賦存狀態(tài)。
Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例
只有As、Fe比較理想!Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例
對比:
旋轉(zhuǎn)前:初始因子解難以對各因子作出合理的解釋。旋轉(zhuǎn)后:F1中As、Hg、Sb、Fe、S等有高的因子載荷;F2與Se和Zn有較大的相關(guān)性;F3中Cd有較高的因子載荷;F4中只有Pb有較高的因子載荷;F5只與Ti相關(guān)。Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例
煤層中As、Hg、Sb、Fe主要賦存于次生黃鐵礦中;
Zn和Se主要賦存于閃鋅礦中;
Pb以方鉛礦形式存在于煤中;從元素地球化學(xué)性質(zhì)上講,Cd應(yīng)賦存于閃鋅礦中,但由于其在煤中的含量較低,造成分析數(shù)據(jù)的誤差較大,從而掩蓋了它與Zn之間的相關(guān)關(guān)系;煤中Ti的賦存狀態(tài)較為復(fù)雜。Chp.8因子分析8.5因子計量(FactorScore)1.計量的目的
因子分析有兩大任務(wù):①將變量表示為公因子的線性組合(因子解)Zj=aj1F1+aj2F2+…+ajmFm因子模型建立后,一個重要的作用是應(yīng)用它去評價每個樣品在整個模型中的地位,即進行綜合評價。
由此,引出了因子分析的第二項任務(wù):
Chp.8因子分析8.5因子計量(FactorScore)1.計量的目的
②把公因子用變量的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教師自我評估與發(fā)展計劃
- 探索閱讀與藝術(shù)融合的展示活動計劃
- 重癥監(jiān)護室工作總結(jié)與改進措施計劃
- 星際冒險學(xué)校宇航社團計劃
- 律師行業(yè)個人發(fā)展計劃
- 不同安全事件處理的經(jīng)驗總結(jié)計劃
- 非遺體驗游的策劃藝術(shù)西安全新路線的創(chuàng)新實踐
- 創(chuàng)新住院部管理模式的工作計劃
- 手術(shù)室安全管理體系的建設(shè)與實踐計劃
- 跨境貿(mào)易物流風(fēng)險管理及優(yōu)化方案探討
- 校園安全隱患排查培訓(xùn)
- 《化妝品包裝材料相容性試驗評估指南》
- 無人機行業(yè)調(diào)查研究報告
- 2022版藝術(shù)新課標(biāo)解讀心得(課件)小學(xué)美術(shù)
- 四川政采評審專家入庫考試基礎(chǔ)題復(fù)習(xí)試題
- 鋰離子電池失效分析及后果PFMEA-電子表格版
- 2024解析:第十九章生活用電-基礎(chǔ)練(解析版)
- 《中小學(xué)校園食品安全和膳食經(jīng)費管理工作指引》專題知識培訓(xùn)
- 青海省西寧市2023-2024學(xué)年高一上學(xué)期物理期末試卷(含答案)
- 《金融市場與金融工具》課程教學(xué)大綱
- 高維數(shù)據(jù)分析新理論
評論
0/150
提交評論