主成分分析法_第1頁
主成分分析法_第2頁
主成分分析法_第3頁
主成分分析法_第4頁
主成分分析法_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第四節(jié) 主成分分析方法 地理環(huán)境是多要素的復雜系統(tǒng),在我們進行地理系統(tǒng)分析時,多變量問題是經(jīng)常會遇到的。變量太多,無疑會增加分析問題的難度與復雜性,而且在許多實際問題中,多個變量之間是具有一定的相關關系的。因此,我們就會很自然地想到,能否在各個變量之間相關關系研究的基礎上,用較少的新變量代替原來較多的變量,而且使這些較少的新變量盡可能多地保留原來較多的變量所反映的信息?事實上,這種想法是可以實現(xiàn)的,本節(jié)擬介紹的主成分分析方法就是綜合處理這種問題的一種強有力的方法。第一節(jié) 主成分分析方法的原理主成分分析是把原來多個變量化為少數(shù)幾個綜合指標的一種統(tǒng)計分析方法,從數(shù)學角度來看,這是一種降維處理技術。

2、假定有n個地理樣本,每個樣本共有p個變量描述,這樣就構成了一個np階的地理數(shù)據(jù)矩陣:如何從這么多變量的數(shù)據(jù)中抓住地理事物的內(nèi)在規(guī)律性呢?要解決這一問題,自然要在p維空間中加以考察,這是比較麻煩的。為了克服這一困難,就需要進行降維處理,即用較少的幾個綜合指標來代替原來較多的變量指標,而且使這些較少的綜合指標既能盡量多地反映原來較多指標所反映的信息,同時它們之間又是彼此獨立的。那么,這些綜合指標(即新變量)應如何選取呢?顯然,其最簡單的形式就是取原來變量指標的線性組合,適當調整組合系數(shù),使新的變量指標之間相互獨立且代表性最好。如果記原來的變量指標為x1,x2,xp,它們的綜合指標新變量指標為x1,

3、x2,zm(mp)。則在(2)式中,系數(shù)lij由下列原則來決定:(1)zi與zj(ij;i,j=1,2,m)相互無關;(2)z1是x1,x2,xp的一切線性組合中方差最大者;z2是與z1不相關的x1,x2,xp的所有線性組合中方差最大者;zm是與z1,z2,zm-1都不相關的x1,x2,xp的所有線性組合中方差最大者。這樣決定的新變量指標z1,z2,zm分別稱為原變量指標x1,x2,xp的第一,第二,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,zm的方差依次遞減。在實際問題的分析中,常挑選前幾個最大的主成分,這樣既減少了變量的數(shù)目,又抓住了主要矛盾,簡化了變量之間的關系。從以上分

4、析可以看出,找主成分就是確定原來變量xj(j=1,2,p)在諸主成分zi(i=1,2,m)上的載荷lij(i=1,2,m;j=1,2,p),從數(shù)學上容易知道,它們分別是x1,x2,xp的相關矩陣的m個較大的特征值所對應的特征向量。第二節(jié) 主成分分析的解法主成分分析的計算步驟通過上述主成分分析的基本原理的介紹,我們可以把主成分分析計算步驟歸納如下:(1)計算相關系數(shù)矩陣在公式(3)中,rij(i,j=1,2,p)為原來變量xi與xj的相關系數(shù),其計算公式為因為R是實對稱矩陣(即rij=rji),所以只需計算其上三角元素或下三角元素即可。(2)計算特征值與特征向量首先解特征方程I-R=0求出特征值

5、i(i=1,2,p),并使其按大小順序排列,即12,p0;然后分別求出對應于特征值i的特征向量ei(i=1,2,p)。(3)計算主成分貢獻率及累計貢獻率一般取累計貢獻率達85-95的特征值1,2,m所對應的第一,第二,第m(mp)個主成分。(4)計算主成分載荷由此可以進一步計算主成分得分:第三節(jié) 主成分分析應用實例主成分分析實例對于某區(qū)域地貌-水文系統(tǒng),其57個流域盆地的九項地理要素:x1為流域盆地總高度(m)x2為流域盆地山口的海拔高度(m),x3為流域盆地周長(m),x4為河道總長度(km),x5為河表2-14 某57個流域盆地地理要素數(shù)據(jù)道總數(shù),x6為平均分叉率,x7為河谷最大坡度(度)

6、,x8為河源數(shù)及x9為流域盆地面積(km2)的原始數(shù)據(jù)如表2-14所示。張超先生(1984)曾用這些地理要素的原始數(shù)據(jù)對該區(qū)域地貌-水文系統(tǒng)作了主成分分析。下面,我們將其作為主成分分析方法在地理學研究中的一個應用實例介紹給讀者,以供參考。表2-15相關系數(shù)矩陣(1)首先將表2-14中的原始數(shù)據(jù)作標準化處理,由公式(4)計算得相關系數(shù)矩陣(見表2-15)。(2)由相關系數(shù)矩陣計算特征值,以及各個主成分的貢獻率與累計貢獻率(見表2-16)。由表2-16可知,第一,第二,第三主成分的累計貢獻率已高達86.5,故只需求出第一,第二,第三主成分z1,z2,z3即可。表2-16 特征值及主成分貢獻率(3)

7、對于特征值1=5.043,2=1.746,3=0.997分別求出其特征向量e1,e2,e3,并計算各變量x1,x2,x9在各主成分上的載荷得到主成分載荷矩陣(見表2-17)。表2-17 主成分載荷矩陣從表2-17可以看出,第一主成分z1與x1,x3,x4,x5,x8,x9有較大的正相關,這是由于這六個地理要素與流域盆地的規(guī)模有關,因此第一主成分可以被認為是流域盆地規(guī)模的代表:第二主成分z2與x2有較大的正相關,與x7有較大的負相關,而這兩個地理要素是與流域切割程度有關的,因此第二主成分可以被認為是流域侵蝕狀況的代表;第三主成分z3與x6有較大的正相關,而地理要素x6是流域比較獨立的特性河系形態(tài)的表征,因此,第三主成成可以被認為是代表河系形態(tài)的主成分。以上分析結果表明,根據(jù)主成分載荷,該區(qū)域地貌-水文系統(tǒng)的九項地理要素可以被歸為三類,即流域盆地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論