數(shù)學(xué)在地學(xué)中的應(yīng)用課件-第9章-因子分析-1109-v2-有注解_第1頁
數(shù)學(xué)在地學(xué)中的應(yīng)用課件-第9章-因子分析-1109-v2-有注解_第2頁
數(shù)學(xué)在地學(xué)中的應(yīng)用課件-第9章-因子分析-1109-v2-有注解_第3頁
數(shù)學(xué)在地學(xué)中的應(yīng)用課件-第9章-因子分析-1109-v2-有注解_第4頁
數(shù)學(xué)在地學(xué)中的應(yīng)用課件-第9章-因子分析-1109-v2-有注解_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

《數(shù)學(xué)在地學(xué)中的應(yīng)用》第九章

因子分析FactorAnalysis趙潔遙感與地學(xué)信息教研室提綱第一節(jié)引言第二節(jié)主成分分析第三節(jié)因子分析第四節(jié)對應(yīng)分析第一節(jié)引言一、因子分析的基本概念1.定義:研究變量之間相關(guān)關(guān)系、樣品間相似關(guān)系、變量與樣品間成因聯(lián)系以及探索它們之間產(chǎn)生上述關(guān)系之內(nèi)在原因的一些多元統(tǒng)計分析方法的總稱。數(shù)學(xué)上,利用降維的思想,由研究原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部依賴關(guān)系出發(fā),把一些具有錯綜復(fù)雜關(guān)系的多個變量歸結(jié)為少數(shù)幾個綜合因子的一種多元統(tǒng)計分析方法。2.發(fā)展:1901年P(guān)earson發(fā)表主成分分析文章;1904年Spearman發(fā)表的對學(xué)生考試成績分析的文章,被認(rèn)為是因子分析的開始;1957年Krumbein(克倫賓)把該方法引入沉積學(xué)研究中;Imbrie對因子分析在地質(zhì)學(xué)中的應(yīng)用和發(fā)展做了大量工作。如今,因子分析已成為地質(zhì)學(xué)等領(lǐng)域中傳播最快、應(yīng)用最廣的多元統(tǒng)計方法之一。3.因子分析的意義如此多的地質(zhì)變量中,很多是相關(guān)的。換句話說,每個變量都會提供一定的信息,但其重要程度與側(cè)重點(diǎn)不同,然而有些變量所提供的信息是重疊的,造成信息的冗余。期望:用少數(shù)“代表”來對相關(guān)變量進(jìn)行描述。因子分析利用相關(guān)性來對所涉及的變量加以“改造”和“組合”。用為數(shù)較少的、互不相關(guān)(或基本不相關(guān))的新變量來“代表”原來多個變量所提供的信息。通過對新變量的分析達(dá)到合理分析和數(shù)據(jù)解釋的目的。壓縮原始數(shù)據(jù)指示成因推理方向分解疊加的地質(zhì)過程4.因子分析典型應(yīng)用C、O、Mg、Ca、Si新變量較原始變量數(shù)量減少了復(fù)雜關(guān)系相對簡單化反映事物內(nèi)在聯(lián)系5.信息大小的度量方法從統(tǒng)計分析角度看,一個指標(biāo)(看作隨機(jī)變量)或一串?dāng)?shù)據(jù)所包含的信息,可以用差異的大小——方差來度量。方差越大,所包含的信息量就越大;方差越小,所包含的信息量就越小。6.數(shù)學(xué)模型主成分分析將高維數(shù)據(jù)進(jìn)行壓縮的技術(shù),把數(shù)目較多的變量做線性組合,組合成幾個主要的新變量——主成分,代表原有變量變化的主要信息。因子分析降低數(shù)據(jù)維度,探索不易觀測或不能觀測的潛在因素,用有限個隱含變量來解釋原始變量之間相關(guān)關(guān)系的技術(shù)。地質(zhì)上,通過分析觀測數(shù)據(jù)來建立一個成因系統(tǒng),把原來具有一定相關(guān)聯(lián)系的地質(zhì)變量,轉(zhuǎn)換為少數(shù)由原始變量組合而成的新變量——因子,用它們來代替原始變量,各因子之間基本獨(dú)立。R型因子分析——研究變量之間的成因分類Q型因子分析——研究樣品之間的成因分類對應(yīng)分析(R-Q型)在R型和Q型因子分析的基礎(chǔ)上發(fā)展起來的,能夠揭示變量與樣品之間雙重關(guān)系的一種多元統(tǒng)計方法。R型因子分析——研究變量之間的成因分類相關(guān)性度量:變量間的方差-協(xié)方差、相關(guān)系數(shù)R型因子分析是主成分分析的發(fā)展Q型因子分析——研究樣品之間的成因分類相關(guān)性度量:夾角余弦和各種距離系數(shù)主成分分析與因子分析不同。主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分;因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。第二節(jié)主成分分析一、主成分分析1.主成分分析的構(gòu)成構(gòu)造關(guān)于原始變量的適當(dāng)?shù)木€性組合,形成幾個新變量(即所謂的主成分),它們是我們用來代替原始變量進(jìn)行資料解釋的綜合性指標(biāo)。2.主成分特點(diǎn):每個新變量都是各原始變量的線性組合;新變量的數(shù)目小于或等于原始變量的個數(shù);新變量保留了原始變量所包含的所有信息,絕大部分信息集中在前幾個主成分中;新變量之間互不相關(guān),即各自含有的信息不重疊。3.主成分分析的幾何意義方差越大,所包含的信息量就越大我們的期望:用盡可能少的新變量反映盡可能多的信息且:Var(y1)>Var(y2)>…>Var(yp)

正交矩陣,即ATA=E因此,得到的PC1、PC2是線性無關(guān)的,且PC1具有最大方差正角表示逆時針旋轉(zhuǎn)3.主成分分析方法地球化學(xué)遙感古生物巖石礦床環(huán)境地理……

因子載荷:主成分與原始變量Xi的相關(guān)系數(shù)Eigenvactor(特征向量):主成分指示的坐標(biāo)軸Eigenvalue(特征值):主成分的方差PC1PC2PCpλ1

λ2

λpScores:Output:1:計算圖像矩陣的相關(guān)系數(shù)矩陣或協(xié)方差矩陣R2:計算R的特征值矩陣和特征向量矩陣3:計算變換矩陣矩陣的特征值和特征向量原始圖像前10個特征值前20個特征值前50個特征值100個特征值100行×100列對圖像矩陣做特征值分解實(shí)質(zhì)上是提取圖像特征,特征向量對應(yīng)著提取出來的一個個特征(100個特征)特征值來表示這些特征在圖像中的重要性(100個特征值)在線性代數(shù)中,矩陣乘法對應(yīng)了一個變換,也就是把任意一個向量r變換成另一個方向或長度大多不同的新向量(在這個變換過程中,原向量主要發(fā)生旋轉(zhuǎn)、伸縮的變化)。如果矩陣u對于該向量r只發(fā)生伸縮變換,而不對向量產(chǎn)生旋轉(zhuǎn)的效果,則矩陣u稱為r向量的特征向量,伸縮的比例就是特征值。特征值大于1,特征向量拉伸;0<特征值<1,特征向量收縮;特征值<0,特征向量反向。ru=λuPC1PC2PCpλ1

λ2

λpScores:4.主成分的性質(zhì)特征向量的性質(zhì):

Y=U’X, U’U=I主成分系數(shù)向量是單位向量各主成分之間線性無關(guān)(坐標(biāo)軸垂直)各主成分按方差大小順序排列系統(tǒng)的總方差不變(所有主成分所表示的信息量=原始數(shù)據(jù)信息量)前k個主成分的累計方差貢獻(xiàn)率一般取80%,85%。

同一列平方和[X變量不同]

同一行平方和[Y變量不同]⑥5.主成分計算步驟對原始數(shù)據(jù)進(jìn)行預(yù)處理,如標(biāo)準(zhǔn)化、對數(shù)化變換;計算各變量間的協(xié)方差矩陣C或相關(guān)系數(shù)矩陣R;對C或R求解特征向量矩陣和特征值,并按照特征值大小進(jìn)行排序,得到主成分;計算前m個特征值所占的累計百分比,一般按累計貢獻(xiàn)率大于80%或85%(根據(jù)實(shí)際應(yīng)用需要),或特征值≥1(Kaiser’srule,1960)來確定需要保留的主成分個數(shù)m;計算各個樣品在m個主成分上的得分,第i個樣品的第j個主成分得分為:i=1,2,…,n;j=1,2,…,m利用前m個主成分做地質(zhì)解釋或利用樣品在主成分上的得分對樣品進(jìn)行分類。

例:位于西藏改則縣的多龍礦集區(qū)是班公湖—怒江結(jié)合帶最重要的斑巖型銅-金產(chǎn)地。研究應(yīng)用水系沉積物地球化學(xué)數(shù)據(jù)(Cu、Pb、Zn、Cr、Ni、Mn、Ag、Sn、W、Mo、As、Sb、Bi、Hg和Au)進(jìn)行成礦預(yù)測(劉向沖等,2017,西藏多龍礦集區(qū)水洗沉積物地球化學(xué)數(shù)據(jù)定量分析與解釋)例:殼斗科化石屬種眾多,該科葉片化石鑒定師古植物學(xué)研究的難點(diǎn)之一。研究對57個樣本在葉片化石上觀察的22個性狀特征進(jìn)行降維處理,應(yīng)用PCA方法壓縮10個主要性狀特征,仍可實(shí)現(xiàn)殼斗科化石植物的準(zhǔn)確鑒定(賈慧等,2017,主成分分析法在殼斗科植物化石鑒定中的應(yīng)用)聚類分析——9個類第三節(jié)因子分析一、因子分析的數(shù)學(xué)模型1.因子構(gòu)成公共因子:不可直接觀測但客觀存在的公共影響因素,即各變量(或樣品)中共同出現(xiàn)的因子,是相互獨(dú)立的理論變量,可以將其理解為p維空間中相互垂直的坐標(biāo)軸;特殊因子:與指標(biāo)相關(guān)的特殊影響因素,為單一變量中特有的因子,它們與各公共因子之間是相互獨(dú)立的。每一個原始變量(樣品)都可以表示為公共因子的線性函數(shù)與特殊因子之和,即:式中,F(xiàn)1,

F2,…,

Fm稱為公共因子,εi稱為變量(或樣品)Xi的特殊因子。主成分分析:PCi=u1iX1+u2i

X2+…+upiXp主成分與R型因子分析的區(qū)別是:主成分是原始變量的線性組合因子分析是原始變量(或樣品)是公共因子和特殊因子的線性組合;X=AF+εX=AF+ε系數(shù)矩陣(因子載荷矩陣)觀測變量公共因子特殊因子也稱為因子載荷矩陣,矩陣中的aij表示第i個變量(或樣品)在第j個因子軸上的載荷。如果把Xi視為p為空間上的一個向量,則aij則是Xi在Fj軸上的投影。2.因子分析所要滿足的條件:關(guān)于公共因子F:F=(F1,F2,

…,Fm)’是不可測的向量,地質(zhì)上應(yīng)有較為明確的意義;m<p或m<n,公共因子的數(shù)目小于等于原始變量的數(shù)目p或原始樣品數(shù)n,實(shí)現(xiàn)數(shù)據(jù)降維;其均值向量E(F)=0;協(xié)方差矩陣Cov(F)為單位矩陣,則各個公共因子不相關(guān)(相互獨(dú)立)關(guān)于特殊因子:Cov(F,ε)=0,即公共因子與特殊因子之間是相互獨(dú)立的;且ε

的均值向量E(ε)=0ε的協(xié)方差矩陣是對角矩陣,則各個特殊因子不相關(guān),方差不要求相等

關(guān)于因子載荷矩陣:由因子模型:可得Xi與Fj的協(xié)方差為Cov(Xi,Fj)=aij。對于標(biāo)準(zhǔn)化的原始數(shù)據(jù),Xi與Fj的標(biāo)準(zhǔn)差均為1,則有:即:對于標(biāo)準(zhǔn)化的Xi,協(xié)方差矩陣=相關(guān)系數(shù)矩陣=A。A表示了Xi對于Fi的依賴程度,絕對值越大,密切性越高反映了變量Xi對公共因子Fj的相對重要性。變量共同度關(guān)于因子載荷矩陣:對于標(biāo)準(zhǔn)化的Xi,協(xié)方差矩陣=相關(guān)系數(shù)矩陣=A。A表示了Xi對于Fi的依賴程度,絕對值越大,密切性越高反映了變量Xi對公共因子Fj的相對重要性。

矩陣A的第i行元素的平方和(i=1,2,…p),為變量Xi的共同度,描述了全部公因子對某變量Xi的影響程度。矩陣A的第j列元素的平方和

,(j=1,2,…m),為公因子Fj對所有變量X的貢獻(xiàn),描述了同一公因子對各變量所貢獻(xiàn)方差的總和,是衡量每一個公因子相對重要性的指標(biāo)。

矩陣A中不同兩行i,j對應(yīng)元素乘積之和

二、因子分析的任務(wù)因子分析就是尋找這些公共因子的模型分析方法,它是在主成分的基礎(chǔ)上構(gòu)筑若干意義較為明確的公因子,以它們?yōu)榭蚣芊纸庠兞?,以此考察原變量間的聯(lián)系與區(qū)別。三、因子分析類型1.Q型:X1,X2,…,Xn表示的是n個樣品2.R型:X1,X2,…,Xp表示的是p個變量。R型因子分析是從主成分分析發(fā)展而來。四、因子載荷的求解已知,變量X的協(xié)方差矩陣Σ可以分解為如下形式:由于D(F)=I,得到Σ=AA’+D(ε)。當(dāng)X為標(biāo)準(zhǔn)化后的數(shù)據(jù)時,Σ就是相關(guān)系數(shù)矩陣R,故R=AA’+D(ε)。此時,R*=AA’

=

R-D(ε)稱為X的約相關(guān)陣。則R*=(r*ij)p×p,且R*中主對角線的元素為變量Xi的共同度hi2,非對角線上的元素與R一樣。由于嚴(yán)格估計hi2是非常困難的,實(shí)際應(yīng)用中用R代替R*,即構(gòu)建R=AA’去確定因子載荷矩陣A。由于滿足R=AA’的解很多,因子載荷矩陣A不唯一。目前使用得比較普遍的是主因子法和極大似然法來得到因子解。X=AF+ε(1-λ)3-2.3464(1-λ)+1.3799=0例:表中為某巖體中3中元素含量的觀測結(jié)果,試建立其R型因子模型。(李克慶等,2015,數(shù)學(xué)地質(zhì))對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理

計算各變量相關(guān)系數(shù)

求R的特征值和特征向量

λ1=2.7683,λ2=0.1552,λ3=0.0795說明:λ1+λ2+λ3=3,等于變量個數(shù)求R的特征值計算特征向量(求解RX–λX=0)

將λ1=2.7683代入x1λ1

=0.573,x2λ1=0.581,x3λ1=0.578

將λ2=0.1522代入x1λ2=0.311,x2λ2=0.215,x3λ2=-0.553λ3太小,忽略例:表中為某巖體中3中元素含量的觀測結(jié)果,試建立其R型因子模型。(李克慶等,2015,數(shù)學(xué)地質(zhì))按一定標(biāo)準(zhǔn)選取因子

選取前兩個公因子計算因子載荷

對應(yīng)于λ1=2.7683的因子載荷為:

對應(yīng)于λ2=0.1522的因子載荷為:

初始因子載荷矩陣計算變量共同度(公因子方差)

公因子方差貢獻(xiàn)

因子載荷矩陣及因子模型Q型因子分析Q型因子分析從樣品間的相似系數(shù)出發(fā),尋找制約樣品相似性的m個綜合變量Fi

(i=1,2,…,m)來表達(dá):預(yù)處理步驟:極差標(biāo)準(zhǔn)化(處理數(shù)據(jù)量綱問題)模標(biāo)準(zhǔn)化(用每一樣品向量/X的相應(yīng)列,該方法不改變樣品中各個變量之間的比例關(guān)系,因此樣品之間的相似系數(shù)仍保持不變)。Q型因子分析與R型因子分析有相似的主因子解:x1=a11F1+a12F2+…+a1mFmx2=a21F1+a22F2+…+a2mFm……………xn=an1F1+an2F2+…+anmFm

五、因子旋轉(zhuǎn)進(jìn)行因子分析的主要目的是尋找具有地質(zhì)內(nèi)涵的公因子,以便對實(shí)際問題進(jìn)行分析。如果求出的主因子解后,各個主因子的“典型變量”不很突出,還需要進(jìn)行因子旋轉(zhuǎn)。方差最大正交旋轉(zhuǎn)示意圖該方法使載荷值向0、1兩極分化常用因子旋轉(zhuǎn)方法方差最大正交旋轉(zhuǎn)——因子軸相互正交旋轉(zhuǎn)準(zhǔn)則:因子載荷值的方差達(dá)到最大保持原公因子的正交性和變量共同度(即全部公因子對某變量的影響程度)不變旋轉(zhuǎn)效果:公因子方差貢獻(xiàn)發(fā)生變化;每個變量僅在一個公共因子上有較大的載荷,而在其余公共因子上的載荷變小,使得每個因子上具有最大載荷的變量數(shù)減小——簡化對因子的解釋。斜交旋轉(zhuǎn)——因子軸相互不正交因子斜交旋轉(zhuǎn)后,各因子負(fù)荷發(fā)生了較大變化,出現(xiàn)了兩極分化。各因子間不再相互獨(dú)立,而彼此相關(guān)。各因子對各變量的貢獻(xiàn)的總和也發(fā)生了改變。適用于大數(shù)據(jù)集的因子分析。F1F1F2F2Factor1 Factor2 x1 0.5 0.5x2 0.7 0.7x3 -0.6 0.6x4 -0.5 -0.5

21342134正交旋轉(zhuǎn)及樣品點(diǎn)投影Factor1 Factor2 x1 0 0.6x2 0 0.9x3 -0.9 0x4 0 -0.9

六、因子得分1.定義:因子分析模型X=AF+ε中,如果不考慮特殊因子ε的影響,當(dāng)m=p且A可逆的時候,我們可以非常方便地從每個樣品的指標(biāo)取值X計算出其在因子F

上的相應(yīng)取值(投影):F=A-1X,也就是該樣品在因子F

上的得分情況,簡稱該樣品的因子得分。2.因子得分函數(shù)F=A-1X,或?qū)懗蒄j=bj1x1+bj2x2+…+bjpxp(j=1,2,…,m)的形式,稱為因子得分函數(shù)。實(shí)際應(yīng)用中,在做因子分析時,通常要求m<p(即因子得分方程個數(shù)少于變量個數(shù))。因此不能精確計算因子的得分情況,只能對因子得分進(jìn)行估計。3.因子得分的估計估計因子得分的方法很多,常用的有加權(quán)最小二乘法、回歸法等。Thomson(湯姆森)回歸法,該方法基于Bayes思想導(dǎo)出,得到的因子得分是有偏的,但計算結(jié)果誤差較小。該方法構(gòu)建如下回歸方程:根據(jù)因子分析的假設(shè),變量和公共因子都已經(jīng)進(jìn)行了標(biāo)準(zhǔn)化,所以常數(shù)項bj0=0。得到因子得分估計式為:式中R是X的相關(guān)系數(shù)矩陣。

(j=1,2,…,m)

七、因子分析步驟收集整理原始數(shù)據(jù)矩陣;對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;求解p個變量之間的相關(guān)系數(shù),形成相關(guān)系數(shù)矩陣R(R型因子分析)或求解n個樣品之間的相似系數(shù),形成相似系數(shù)矩陣Q(Q型因子分析);求出R或Q的特征根

λi(λ1≥

λ2≥…≥

λp>0)及特征向量;確定公因子數(shù)目m(按前m個特征值之和占特征值總和的百分比來確定,一般>80%或85%,或特征值≥1);求出因子載荷矩陣A=[aij]=;計算公因子共同度是否接近于1,這說明了公因子是否已取得了變量xij的絕大部分信息;必要時,對載荷矩陣A進(jìn)行旋轉(zhuǎn),以求能更好的解釋公共因子;計算因子得分并進(jìn)行解釋。

結(jié)

構(gòu)

(載

荷)F1F2F3F4Ni0.6029-0.2808-0.0675-0.0067Co0.0221-0.73500.12210.1822Cu-0.0323-0.7822-0.0988-0.0228Cr0.76580.1654-0.0018-0.0201Ti-0.62480.1410-0.21280.1015B0.0252-0.02070.0543-0.7173Sn0.62840.1713-0.21870.0573Mn-0.33380.0472-0.20400.4210Pb0.10820.0841-0.0078-0.7243Zn-0.01750.25760.70480.0950S-0.0471-0.7978-0.0682-0.0673As-0.0173-0.10750.7064-0.0622例:對化探元素應(yīng)用主成分分析研究元素的地球化學(xué)共生組合以評價異常的成因。在某地Ni礦的成礦地段取了693個巖石樣品,分析Ni、Co……等12個元素,通過R型因子分析得出主因子載荷列于表解釋:第一主因子(F1)由Ni、Cr、Sn組成,代表巖漿作用期活動的元素;第二主因子(F2)由Co、Cu、S組成,應(yīng)是后期硫化物階段的產(chǎn)物;第三主因子(F3)由As、Zn組成,是典型的熱液作用;第四主因子(F4)由B、Pb組成為蛇紋巖化產(chǎn)物,與礦化無關(guān)。例:盤縣動物群是一多門類生物共存、保存完整、數(shù)量豐富、高度分異的海生脊椎動物群。研究收集了35個碳酸鹽巖樣品和4個凝灰?guī)r樣品,測定了14種稀土元素及10個元素的氧化物含量數(shù)據(jù)應(yīng)用因子分析研究剖面沉積物化學(xué)組分的含量變化規(guī)律和相互關(guān)系。(唐賓,2007,貴州中三疊世盤縣動物群產(chǎn)出地層剖面樣品元素地球化學(xué)數(shù)據(jù)因子分析及其環(huán)境演化意義)F1:陸源物質(zhì)的特征因子,方差貢獻(xiàn)率70.6%;F2:火山源物質(zhì)特征因子,方差貢獻(xiàn)率15.3%;F3:成巖作用;F4:生物源作用特征因子;F5:自生沉積作用特征因子CaO:生物作用受陸源物質(zhì)和火山物質(zhì)加入的抑制;Eu:既有陸源、火山源,也受生物作用影響。影響剖面沉積物化學(xué)組分的因素主要是??大量研究表明,海洋沉積物中的Al2O3、SiO2主要來自于陸源物質(zhì);Ca主要來源于生物;Fe主要為火山(熱液)源;Mn則是典型的自生元素;MgO在碳酸鹽巖成巖過程中受影響較大;稀土元素特征反映其物源的地球化學(xué)元素含量的特征,在沉積過程中受黏土吸附作用影響較大第四節(jié)對應(yīng)分析一、對應(yīng)分析的概念R、Q型因子分析的作用:簡化研究系統(tǒng),在低維空間研究變量的成因聯(lián)系和樣品的空間分布。存在不足:割裂了樣品和變量之間的聯(lián)系;Q型因子分析計算工作量大;變量和樣品尺度不同,影響認(rèn)識地質(zhì)規(guī)律。對應(yīng)分析:在同一空間內(nèi),對變量和樣品進(jìn)行劃類,由此即可研究樣品的分布規(guī)律,又可通過變量對樣品進(jìn)行地質(zhì)解釋。可提供信息:變量間的關(guān)系——臨近變量相關(guān)性高,提高地質(zhì)認(rèn)識;樣品間的關(guān)系——臨近樣品相似性高,同種地質(zhì)作用產(chǎn)物;變量與樣品關(guān)系——同一類型的樣品點(diǎn)被臨近的變量所表征,換句話說,同類樣品點(diǎn)為其臨近變量所指示的地質(zhì)作用下的產(chǎn)物;直觀地進(jìn)行分類及地質(zhì)推斷對應(yīng)分析的應(yīng)用條件:在對數(shù)據(jù)作對應(yīng)分析之前,需要先了解因素間是否獨(dú)立。如果因素之間相互獨(dú)立,則沒有必要進(jìn)行對應(yīng)分析檢驗(yàn)因素A和因素B是否獨(dú)立?H0:因素A和因素B間獨(dú)立H1:因素A和因素B不獨(dú)立二維列聯(lián)表

時,拒絕H0;當(dāng)原假設(shè)為H0時,χ2服從自由度為(n-1)(p-1)的χ2分布最后分別對行剖面點(diǎn)集和列剖面點(diǎn)集做主成分分析,以判斷兩個變量的聯(lián)系情況。因素BB1B2…Bpxi·因素AA1x11x12…x1px1·A2x21x22…x2px2·………………Anxn1xn2…xnpxn·x·jx·1x·2…x·px··設(shè)數(shù)據(jù)矩陣X=(xij)n×p,對數(shù)據(jù)矩陣X做概率變換的概率矩陣P=(pij)=xij/x..對概率矩陣做標(biāo)準(zhǔn)化變換可得過渡矩陣Z=(zij)

因素BB1B2…Bppi·因素AA1p11p12…p1pp1·A2p21p22…p2pp2·………………Anpn1pn2…pnppn·p·jp·1p·2…p·pp··

因素BB1B2…Bp因素AA1z11z12…z1pA2z21z22…z2p……………Anzn1zn2…znp變量的協(xié)方差矩陣:A=Z’Z樣品的協(xié)方差矩陣:B=ZZ’定理:設(shè)Z=Z’Z,B=ZZ’,λi是A的非零特征根,ei為A的特征向量,則有:(1)A與B的所有非零特征根相等;(2)B的非零特征根λi所對應(yīng)的特征向量為z’ei二、對應(yīng)分析步驟例:某地鉀鹽礦床鹽泉水化學(xué)數(shù)據(jù)做對應(yīng)分析,以了解樣品和變量之間的關(guān)系,做出合理的分類,查明各巖泉的成因聯(lián)系。(李克慶,2015,數(shù)學(xué)地質(zhì))樣號x1x2x3x4x5x6x7Σ鹽(g·L-1)Br·103/ClK·103/Σ鹽K·103/ClNa/KBr·102/ClэNa/эClxi.111.8350.48014.36025.21025.2100.8100.98078.885245.5960.52613.85024.04026.0100.9100.960111.89233.5250.08624.40049.30011.3006.8200.85096.28143.6810.37013.57025.12026.0000.8201.01070.571548.2870.38614.50025.90023.3202.1800.930115.503617.9560.2809.75017.05037.2000.4640.98083.6877.3700.50618.60034.28010.6908.8000.56080.80684.2330.3403.8007.10088.2001.1100.970105.75396.4220.1904.7009.10073.2000.7401.03095.3821016.2340.3903.1005.400121.5000.4201.000148.0441110.5850.4202.4004.700135.6000.8700.980155.5551223.5350.2302.6004.600141.8000.3101.020174.095135.3890.1202.8006.200111.2001.1401.070127.91914283.1490.1481.7632.968215.8600.0140.980504.88215316.6040.3171.4532.432263.4100.2490.980585.44516307.3100.1731.6272.729235.7000.2140.990548.74317322.5150.3121.3822.320282.2100.0241.000609.76318254.5800.2970.8991.476410.3000.2390.930668.72119304.0920.2830.7891.357438.3600.1931.010746.08420202.4460.0420.7411.266309.7700.2900.990515.545x.j2195.3445.896137.084252.5482986.8426.61719.225623.549對原始數(shù)據(jù)矩陣X分別求行和、列和、總和

計算規(guī)格化的概率矩陣P=(pij)=(xij/x..)計算過渡矩陣Z=(zij)

按A=Z’Z計算變量點(diǎn)協(xié)方差矩陣進(jìn)行R型因子分析第一主因子:K/Cl(x4)、K/Σ鹽(x3)、Mg/Cl(x6)——鉀鹽結(jié)晶階段的標(biāo)志第二主因子:Σ鹽(礦化度)(x1)、Na/K(x5)——石鹽沉積階段的標(biāo)志。礦化度高,表示溶液濃縮程度高,有利于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論