Chp8因子分析課件_第1頁
Chp8因子分析課件_第2頁
Chp8因子分析課件_第3頁
Chp8因子分析課件_第4頁
Chp8因子分析課件_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

Chp.8因子分析

(FactorAnalysis)概述因子分析的基本原理初始因子矩陣及其計算方法因子旋轉(zhuǎn)

因子計量Chp.8因子分析8.1概述

在科學(xué)研究中,需要對反映事物的多個變量進行大量的觀測,收集大量數(shù)據(jù)以便進行分析尋找規(guī)律。多變量大樣本在提供豐富信息的同時,一定程度上也增加了數(shù)據(jù)采集的工作量,更重要的是在大多數(shù)情況下,許多變量之間可能存在相關(guān)性而增加了問題分析的復(fù)雜性,對分析帶來不便。如果分別分析每個指標(biāo),分析又可能是孤立的,而不是綜合的。盲目減少指標(biāo)會損失很多信息,容易產(chǎn)生錯誤的結(jié)論。出路:找到一種方法,在減少分析指標(biāo)的同時,盡量減少原指標(biāo)包含信息的損失,對所收集的資料作全面的分析。由于各變量間存在一定的相關(guān)關(guān)系,因此有可能用較少的綜合指標(biāo)分別綜合存在于各變量中的各類信息。因子分析就是從多個變量指標(biāo)中選擇出少數(shù)幾個綜合變量指標(biāo)的一種降維的多元統(tǒng)計分析方法。

Chp.8因子分析8.1概述

固定資產(chǎn)利稅率資金利稅率銷售收入利稅率資金利稅率固定資產(chǎn)產(chǎn)值率流動資金周轉(zhuǎn)天數(shù)萬元產(chǎn)值能耗全員勞動生產(chǎn)率觀測變量盈利能力產(chǎn)值能耗資金和人力利用公共因子Chp.8因子分析8.1概述

2.問題的延伸

①用三個組合比用5個元素研究碳酸巖合理,易于解釋。②可以把C、O、Ca、Mg、Si看成原始變量,把CaCO3、MgCO3、SiO2看成是原始變量的組合,它們是新變量(公共因子),更反映事物的本質(zhì)。③從多個變量(5個)減少為少數(shù)變量(3個)有利于研究。Chp.8因子分析8.1概述

④新變量的組合可表示為:Fj=βj1x1+βj2x2+…+βjpxp→

F1(CaCO3)=β11Ca+β12C+β13O+β14Mg+β15SiF2(MgCO3)=β21Ca+β22C+β23O+β24Mg+β25SiF3(SiO2)=β31Ca+β32C+β33O+β34Mg+β35Si⑤反過來,也可用三個組合表示原始變量,來研究組合與原始變量的關(guān)系:Zj=aj1F1+aj2F2+…+ajmFm+αjUj

如對Si,可用Si=a51F1+a52F2+a53F3

Chp.8因子分析8.1概述

⑥因子分析的任務(wù),就是分析、表征事物的屬性與其影響因素之間的數(shù)據(jù)結(jié)構(gòu)和關(guān)系,達到簡化問題、突出事物本質(zhì)的目的。Chp.8因子分析8.1概述

從數(shù)學(xué)角度而言,因子分析是一種尋找潛在支配因子的模型分析方法,其實質(zhì)就是一種降維的多元統(tǒng)計方法。其特點包括:3.因子分析的基本思想

①通過數(shù)學(xué)方法把數(shù)目較多的原始變量進行變換,找到一些新變量(組合);②新變量較原始變量數(shù)目少得多,且使原來復(fù)雜的關(guān)系相對簡單化,有助于了解自然現(xiàn)象的規(guī)律,在變量多、數(shù)據(jù)量大時更具優(yōu)點。③少數(shù)組合能盡量反映原來多變量的信息,它們又彼此正交,便于對變量進行分類解釋。

Chp.8因子分析8.1概述

有兩種主要的分析方法:①R型因子分析:研究變量之間的相互關(guān)系,通過對變量間的相關(guān)系數(shù)陣的內(nèi)部結(jié)構(gòu)的研究,找出控制著所有變量的幾個主成分,所以又稱主成分分析(PrincipalComponentAnalysis)。②Q型因子分析:研究樣品間的相關(guān)關(guān)系,通過對樣品間的相似系數(shù)陣的內(nèi)部結(jié)構(gòu)的研究,找出控制著所有樣品的幾個主要因素,所以又稱主因素分析。

4.因子分析的主要方法

Chp.8因子分析8.1概述

①歸納綜合地質(zhì)現(xiàn)象,剔除原始觀測值中重復(fù)的成分,用更簡練的形式描述地質(zhì)現(xiàn)象。②用于研究諸如成因、成巖、共生組合、指示元素等地質(zhì)問題。5.因子分析的地質(zhì)學(xué)用途

Chp.8因子分析8.2因子分析的基本原理

①設(shè)有N個樣品,每個樣品有n個變量(x1,…,xn),它們有m個綜合因子,記為F1,F2,…,Fm(m<=n)1.主因子(主成分、主因素)的幾何意義F1F2②為了方便,現(xiàn)設(shè)有兩個變量x1,x2

對于二元正態(tài)分布變量,N個點的散布點大致為一橢圓,若在橢圓長軸方向取坐標(biāo)F1,短軸方向取F2,相當(dāng)于作了一個坐標(biāo)變換(x1→F1,x2→F2)Chp.8因子分析8.2因子分析的基本原理

變換后的坐標(biāo)有如下性質(zhì):?。㎞個樣品點的坐標(biāo)F1,F(xiàn)2的相關(guān)性→0ⅱ)N個點的波動(方差)大部分可以歸結(jié)為F1軸上的波動,而F2上波動趨近于0。ⅲ)F1,F(xiàn)2為x1,x2的綜合因子

X1=a11F1+a12F2X2=a21F1+a22F21.主因子(主成分、主因素)的幾何意義當(dāng)圖中橢圓很扁平時,可只考慮F1上的波動,忽略F2上的波動,這樣,二維可以降為一維。Chp.8因子分析8.2因子分析的基本原理

③把兩個變量推廣到n個變量(x1,x2,…,xn),將它們綜合成m個綜合因子時,則原始變量:

Zj=aj1F1+aj2F2+…+ajmFm+αjUj

而綜合因子:F1=β11x1+β12x2+…+β1nxnF2=β21x1+β22x2+…+β2nxn……………Fm=βm1x1+βm2x2+…+βmnxn而且要求:βk12+βk22+…+βkn2=11.主因子(主成分、主因素)的幾何意義Chp.8因子分析8.2因子分析的基本原理

①信息(或方差)的分解各變量的統(tǒng)計信息來源于方差,可以把n個變量提供的信息分解為:2.因子模型(因子分析的數(shù)學(xué)模型)1)由所有變量共同具有的少數(shù)幾個因子構(gòu)成的部分,即所謂公共因素部分—公共因子(m個,且m<=n);2)每個變量獨自具有的因素,即所謂獨特因素部分—唯一因子。

因子分析的基本任務(wù)是將以上兩部分分開。

Chp.8因子分析8.2因子分析的基本原理

②n個變量的R型因子分析模型(主成分分析模型)將變量用若干個因子(公共因子、唯一因子)表示的模型,稱為因子模型。

其中最簡單的為線性模型,主成分分析中每一變量Zj由下列線性組合表示:

Z1=a11F1+a12F2+…+a1mFm+α1U1Z2=a21F1+a22F2+…+a2mFm+α2U2……………

…Zn=an1F1+an2F2+…+anmFm+αnUn2.因子模型(因子分析的數(shù)學(xué)模型)Chp.8因子分析8.2因子分析的基本原理

③n個樣品的Q型因子分析模型(主因素分析模型)xi=ai1F1+ai2F2+…+aimFm+αiUi④向量Zj可以由m個互不相關(guān)的獨立因子F1,F2,…,Fm和Uj表示,這個線性表示(一組線性方程)叫因子模型。2.因子模型(因子分析的數(shù)學(xué)模型)Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的數(shù)學(xué)模型)⑤主成分分析因子模型中的符號意義4)當(dāng)我們把變量Zj看成是m維空間中的一個向量時,則因子負(fù)荷ajp(p=1,2,…,m)表示變量Zj在坐標(biāo)軸Fp上的坐標(biāo);5)αj為唯一因子系數(shù),下標(biāo)j表示變量序號;6)從幾何角度看,找主因子就是在n維空間中尋找橢球體的主軸問題;從數(shù)學(xué)角度看,則是從n個變量x1,x2,…,xn的相關(guān)矩陣中找出p個較大特征值對應(yīng)的特征向量。

Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的數(shù)學(xué)模型)⑥因子模型的矩陣形式:Z=A?F+αU矩陣A:因子負(fù)荷陣,求解A陣是因子分析中關(guān)鍵的一步;矩陣Z:標(biāo)準(zhǔn)化后的觀測值陣;矩陣F:公因子陣;矩陣U:唯一因子陣。Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的數(shù)學(xué)模型)⑦因子模型的幾點說明1)在正交條件下,ajp就是第j個變量(j=1,2,…,n)與第n個公因子(p=1,2,…,m)的相關(guān)系數(shù);2)一個變量Zj的總方差由三部分組成:a)公因子方差(hj2):全部公因子(F1,…,Fm)對變量Zj的總方差所作的貢獻;b)誤差因子方差(cj2);c)特殊因子方差(bj2);由于標(biāo)準(zhǔn)化后的方差為1,故有:hj2+bj2+cj2=1

Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的數(shù)學(xué)模型)⑦因子模型的幾點說明4)因子負(fù)荷矩陣A中各列元素的平方和稱為公因子Fp的方差貢獻。

Sp表示:同一公因子Fp對諸變量所提供的方差的總和,它是衡量公因子相對重要性的標(biāo)志;Chp.8因子分析8.2因子分析的基本原理

2.因子模型(因子分析的數(shù)學(xué)模型)⑦因子模型的幾點說明5)對一個因子模型的解釋

a)F1反映了Cu、Ag礦化;

b)F2反映了Ni、Co礦化(另一期礦化);

c)Cu的hj2=0.942+0.022+(-0.02)2=0.884,說明三個公因子說明了Cu變差的88.4%;

d)公因子方差hj2的分析為選擇公共因子數(shù)提供了依據(jù),一般hj2≥80%即可認(rèn)為所選因子數(shù)對變量Zj已滿足,否則再補加公因子,如Ag的hj2=0.3245,顯然不夠(對于Ag三個公因子不夠)。Chp.8因子分析8.3初始因子矩陣及其計算方法

2.主成分的主要性質(zhì)(R型)④R陣全部特征值之和等于階數(shù);⑤對于全部n個變量,若第t個因子的ajt與第s個因子的ajs的乘積之和等于0,說明因子t與s正交。Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法①計算相關(guān)矩陣(以5個樣,3個變量為例)首先,對原始數(shù)據(jù)進行標(biāo)準(zhǔn)化:Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法①計算相關(guān)矩陣其次,計算相關(guān)系數(shù):例如:=0.916Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法②求特征值及特征向量1)R的特征方程為:|R-λi|=0,即:解此方程得:

λ1=2.87,λ2=0.128,λ3=0.002說明:λ1+λ2+λ3=3,等于變量個數(shù)。Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法②求特征值及特征向量2)計算特征向量,通過下列矩陣方程求出:RX-λX=0X即為特征向量

將λ1=2.87代入,解得:X1λ1=0.586,X2λ1=0.564,X3λ1=0.581同樣,求得:X1λ2=0.317,X2λ2=-0.820,X3λ2=0.476由于λ3=0.002太小,從略。Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法②求特征值及特征向量3)按一定的標(biāo)準(zhǔn)選取特征值變量Zj,它所涉及的公因子個數(shù)稱為該變量的“復(fù)雜性”;選取合理的公因子個數(shù),關(guān)鍵在于合理選其公因子方差hj2;選取的原則是:a)根據(jù)特征值在特征值總數(shù)中所占的比例,比值越大,說明變化性越多,一般取0.8~0.9,在本題中,∑λi=3,(λ1+λ2)/∑λi=(2.87+0.128)/3≈100%,即選兩個Fp即可;b)另一種方法:選取特征值λi>1的即可。

Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法②求特征值及特征向量4)計算因子負(fù)荷αjp為第p個特征值對應(yīng)的第j個特征向量對應(yīng)λ1=2.87:

對應(yīng)λ2=0.128:于是,初始因子矩陣Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法②求特征值及特征向量5)公因子方差h12=a112+a122=0.9932+0.1122=0.999h22=0.998h32=0.9976)公因子Fp的方差貢獻S1=0.9932+0.9552+0.9842=2.87=λ1S2=0.1132+(-0.293)2+0.1702=0.128=λ2Chp.8因子分析8.3初始因子矩陣及其計算方法

3.求初始因子陣A的方法②求特征值及特征向量7)給出正交因子模型FpajiXjF1F2hj2X10.9930.1130.999X20.955-0.2930.998X30.9840.1700.997Sp2.870.128

Chp.8因子分析8.4因子旋轉(zhuǎn)1.概述建立因子分析模型的目的不僅是找出主因子,更重要的是知道每個主因子的意義,以便對實際問題進行分析。如果求出主因子解后,各個主因子的典型代表變量不很突出,還需要進行因子旋轉(zhuǎn),以便得到比較滿意的主因子。Chp.8因子分析8.4因子旋轉(zhuǎn)1.概述進行因子旋轉(zhuǎn),就是要使因子載荷矩陣中因子載荷向0和1兩個方向分化,使大的載荷更大,小的載荷更小。如有兩個變量x1,x2,在F1,F2上的投影值相似,當(dāng)把F1,F2旋轉(zhuǎn)為FⅠ,F(xiàn)Ⅱ后,就變得清晰了。Chp.8因子分析8.4因子旋轉(zhuǎn)1.概述因子旋轉(zhuǎn)過程中,如果因子對應(yīng)軸相互正交,則稱為正交旋轉(zhuǎn);旋轉(zhuǎn)的方法有很多,正交旋轉(zhuǎn)(orthogonalrotation)和斜交旋轉(zhuǎn)(obliquerotation)是因子旋轉(zhuǎn)的兩類方法。最常用的方法是最大方差正交旋轉(zhuǎn)法(Varimax)。如果因子對應(yīng)軸相互間不是正交的,則稱為斜交旋轉(zhuǎn)。常用的斜交旋轉(zhuǎn)方法有Promax法等。Chp.8因子分析8.4因子旋轉(zhuǎn)2.判斷因子解好壞的Thurstone簡單結(jié)構(gòu)準(zhǔn)則①每一因子Fp僅有少數(shù)研究對象(變量、樣品)在它上面有高值(或集中分布);②任一研究對象(變量、樣品)只能在極少數(shù)因子上有高值(不計正負(fù))。即:每一變量盡可能只與一個因子有關(guān),因子負(fù)荷ajp盡可能趨于0、+1、-1。Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例

煤炭中除常量元素外,還含有多種潛在毒害元素,如Hg、Se、Pb、Cd、As、Zn、Sb和Ti等。煤在燃燒過程中,這些元素呈氣態(tài)或吸附在煙氣中細(xì)小顆粒物中呈氣溶膠態(tài),并能通過各種煙氣污染控制設(shè)施而釋放到大氣環(huán)境中,成為大氣環(huán)境的主要污染源。為了了解和有效地控制煤炭使用過程引起的這些潛在毒害元素的環(huán)境污染程度,不僅要弄清煤中這些元素的分布規(guī)律,更重要的是要弄清這些元素在煤中的賦存狀態(tài)。

Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例

只有As、Fe比較理想!Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例

對比:

旋轉(zhuǎn)前:初始因子解難以對各因子作出合理的解釋。旋轉(zhuǎn)后:F1中As、Hg、Sb、Fe、S等有高的因子載荷;F2與Se和Zn有較大的相關(guān)性;F3中Cd有較高的因子載荷;F4中只有Pb有較高的因子載荷;F5只與Ti相關(guān)。Chp.8因子分析8.4因子旋轉(zhuǎn)3.簡單示例

煤層中As、Hg、Sb、Fe主要賦存于次生黃鐵礦中;

Zn和Se主要賦存于閃鋅礦中;

Pb以方鉛礦形式存在于煤中;從元素地球化學(xué)性質(zhì)上講,Cd應(yīng)賦存于閃鋅礦中,但由于其在煤中的含量較低,造成分析數(shù)據(jù)的誤差較大,從而掩蓋了它與Zn之間的相關(guān)關(guān)系;煤中Ti的賦存狀態(tài)較為復(fù)雜。Chp.8因子分析8.5因子計量(FactorScore)1.計量的目的

因子分析有兩大任務(wù):①將變量表示為公因子的線性組合(因子解)Zj=aj1F1+aj2F2+…+ajmFm因子模型建立后,一個重要的作用是應(yīng)用它去評價每個樣品在整個模型中的地位,即進行綜合評價。

由此,引出了因子分析的第二項任務(wù):

Chp.8因子分析8.5因子計量(FactorScore)1.計量的目的

②把公因子用變量的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論