第5章多元統(tǒng)計分析第四版-_第1頁
第5章多元統(tǒng)計分析第四版-_第2頁
第5章多元統(tǒng)計分析第四版-_第3頁
第5章多元統(tǒng)計分析第四版-_第4頁
第5章多元統(tǒng)計分析第四版-_第5頁
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第5章

主成分分析7/1/20211中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束主成分分析(principal

components

analysis)也稱主分分析,最早可追溯到K.Pearson于1901年開創(chuàng)的非隨機(jī)變量的多元轉(zhuǎn)化分析;是由霍特林(Hotelling)于1933年推廣到隨機(jī)變量。主成分分析是利用降維的思想,在損失很少信息的前提下把多個指標(biāo)轉(zhuǎn)化為幾個綜合指標(biāo)的多元統(tǒng)計方法。通常把轉(zhuǎn)化生成的綜合指標(biāo)稱之為主成分,其中每個主成分都是原始變量的線性組合,且各個主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。這樣在研究復(fù)雜問題時就可以只考慮少數(shù)幾個主成分而不至于損失太多信息,從而更容易抓住主要矛盾,揭示事物內(nèi)部變量之間的規(guī)律性,同時使問題得到簡化,提高分析效率。第5章

主成分分析7/1/20212中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.1

主成分分析的基本原理§5.2

總體主成分及其性質(zhì)§5.3

樣本主成分的導(dǎo)出§5.4

有關(guān)問題的討論§5.5

主成分分析步驟及框圖§5.6

主成分分析的上機(jī)實現(xiàn)§5.1

主成分分析的基本原理7/1/20213中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.1.1

主成分分析的基本思想§5.1.2

主成分分析的基本理論§

5.1.3主成分分析的幾何意義§5.1.1

主成分分析的基本思想7/1/20214中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束在對某一事物進(jìn)行實證研究中,為了更全面、準(zhǔn)確地反映出事物的特征及其發(fā)展規(guī)律,人們往往要考慮與其有關(guān)系的多個指標(biāo),這些指標(biāo)在多元統(tǒng)計中也稱為變量。這樣就產(chǎn)生了如下問題:一方面人們?yōu)榱吮苊膺z漏重要的信息而考慮盡可能多的指標(biāo),而另一方面隨著考慮指標(biāo)的增多增加了問題的復(fù)雜性,同時由于各指標(biāo)均是對同一事物的反映,不可避免地造成信息的大量重疊,這種信息的重疊有時甚至?xí)⑹挛锏恼嬲卣髋c內(nèi)在規(guī)律?;谏鲜鰡栴},人們就希望在定量研究中涉及的變量較少,而得到的信息量又較多。主成分分析正是研究如何通過原來變量的少數(shù)幾個線性組合來解釋原來變量絕大多數(shù)信息的一種多元統(tǒng)計方法?!?.1.1

主成分分析的基本思想7/1/20215中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束既然研究某一問題涉及的眾多變量之間有一定的相關(guān)性,就必然存在著起支配作用的共同因素,根據(jù)這一點,通過對原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線性組合形成幾個綜合指標(biāo)(主成分),在保留原始變量主要信息的前提下起到降維與簡化問題的作用,使得在研究復(fù)雜問題時更容易抓住主要矛盾。一般地說,利用主成分分析得到的主成分與原始變量之間有如下基本關(guān)系:每一個主成分都是各原始變量的線性組合主成分的數(shù)目大大少于原始變量的數(shù)目§5.1.1

主成分分析的基本思想7/1/20216中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束主成分保留了原始變量絕大多數(shù)信息各主成分之間互不相關(guān)通過主成分分析,可以從事物之間錯綜復(fù)雜的關(guān)系中找出一些主要成分,從而能有效利用大量統(tǒng)計數(shù)據(jù)進(jìn)行定量分析,揭示變量之間的內(nèi)在關(guān)系,得到對事物特征及其發(fā)展規(guī)律的一些深層次的啟發(fā),把研究工作引向深入?!?.1.2

主成分分析的基本理論設(shè)對某一事物的研究涉及個

指標(biāo),分別用示,這個

指標(biāo)構(gòu)成的

維隨機(jī)向量為表。設(shè)隨機(jī)向量的均值為,協(xié)方差矩陣為。對進(jìn)行線性變換,可以形成新的綜合變量,用表示,也就是說,新的綜合變量可以由原來的變量線性表示,即滿足下式:(5.1)7/1/20217中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.1.2

主成分分析的基本理論由于可以任意地對原始變量進(jìn)行上述線性變換,由不同的線性變換得到的綜合變量

的統(tǒng)計特性也不盡相同。因此為了取得較好的效果,我們總是希望

的方差盡可能大且各

之間互相獨立,由于=而對任給的常數(shù)

,有7/1/20218中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.1.2

主成分分析的基本理論因此對

不加限制時,可使

任意增大,問題將變得沒有意義。我們將線性變換約束在下面的原則之下:,1.2.的一切滿足原則1的線性組合中方差最不相關(guān)的

所有線性組合中方差最3.是大者;是與大者;…,是與

都不相關(guān)的

的所有線性組合中方差最大者。7/1/20219中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.1.2

主成分分析的基本理論基于以上三條原則決定的綜合變量

分別稱為原始變量的第一、第二、…、第

個主成分。其中,各綜合變量在總方差中占的比重依次遞減,在實際研究工作中,通常只挑選前幾個方差最大的主成分,從而達(dá)到簡化系統(tǒng)結(jié)構(gòu),抓住問題實質(zhì)的目的。7/1/202110中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.1.3

主成分分析的幾何意義由第一節(jié)的介紹我們知道,在處理涉及多個指標(biāo)問題的時候,為了提高分析的效率,可以不直接對

個指標(biāo)構(gòu)成的

維隨機(jī)向量

進(jìn)行分析,而是先對向量

進(jìn)行線性變換,形成少數(shù)幾個新的綜合變量

,使得各綜合變量之間相互獨立且能解釋原始變量盡可能多的信息,這樣在以損失很少部分信息為代價的前提下,達(dá)到簡化數(shù)據(jù)結(jié)構(gòu),提高分析效率的目的。這一節(jié),我們著重討論主成分分析的幾何意義,為了方便,我們僅在二維空間中討論主成分的幾何意義,所得結(jié)論可以很容易地擴(kuò)展到多維的情況。7/1/202111中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束設(shè)有

個樣品,每個樣品有兩個觀測變量

,這樣,在由變量

組成的坐標(biāo)空間中,個樣品點散布的情況如帶狀,見圖5-1。圖5-17/1/202112中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束由圖可以看出這

個樣品無論沿

軸方向還是沿有較大的離散性,其離散程度可以分別用觀測變量軸方向均的方差和的方差定量地表示,顯然,若只考慮和中的任何一個,原始數(shù)據(jù)中的信息均會有較大的損失。我們的目的是考慮和的線性組合,使得原始樣品數(shù)據(jù)可以由新的變量和來刻畫。在幾何上表示就是將坐標(biāo)軸按逆時針方向旋轉(zhuǎn)角度,得到新坐標(biāo)軸和,坐標(biāo)旋轉(zhuǎn)公式如下:7/1/202113中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束其矩陣形式為:其中,為旋轉(zhuǎn)變換矩陣,由上式可知它是正交陣,即滿足7/1/202114中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束經(jīng)過這樣的旋轉(zhuǎn)之后,個樣品點在軸上的離散程度最大,變量代表了原始數(shù)據(jù)絕大部分信息,這樣,有時在研究實際問題時,即使不考慮變量也無損大局。因此,經(jīng)過上述旋轉(zhuǎn)變換就可以把原始數(shù)據(jù)的信息集中到軸上,對數(shù)據(jù)中包含的信息起到了濃縮的作用。主成分分析的目的就是找出轉(zhuǎn)換矩陣,而主成分分析的作用與幾何意義也就很明了了。7/1/202115中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.2

總體主成分及其性質(zhì)由上面的討論可知,求解主成分的過程就是求滿足三條原則的原始變量

的線性組合的過程。本節(jié)先從總體出發(fā),介紹求解主成分的一般方法及主成分的性質(zhì),然后介紹樣本主成分的導(dǎo)出。7/1/202116中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束主成分分析的基本思想就是在保留原始變量盡可能多的信息的前提下達(dá)到降維的目的,從而簡化問題的復(fù)雜性并抓住問題的主要矛盾。而這里對于隨機(jī)變量而言,其協(xié)方差矩陣或相關(guān)矩陣正是對各變量離散程度與變量之間的相關(guān)程度的信息的反應(yīng),而相關(guān)矩陣不過是將原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣。我們所說的保留原始變量盡可能多的信息,也就是指的生成的較少的綜合變量(主成分)的方差和盡可能接近原始變量方差的總和。因此在實際求解主成分的時候,總是從原始變量的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析入手。一般地說,從原始變量的協(xié)方差矩陣出發(fā)求得的主成分與從原始變量的相關(guān)矩陣出發(fā)求得的主成分是不同的。下面我們分別就協(xié)方差矩陣與相關(guān)矩陣進(jìn)行討論。7/1/202117中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.2.1從協(xié)方差矩陣出發(fā)求解主成分引理:設(shè)矩陣

,將排列,不妨設(shè)的特征值

依大小順序,

矩陣各特征值對應(yīng)的標(biāo)準(zhǔn)正交特征向量,則對任意向量,有:(5.2)7/1/202118中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束證明:由引論理論知,對于任意常向量

,有:又

為標(biāo)準(zhǔn)正交特征向量,于是:此時:(5.3)結(jié)論:

設(shè)隨機(jī)向量的協(xié)方差矩陣為

,為

的特征值,

為矩陣

各特征值對應(yīng)的標(biāo)準(zhǔn)正交特征向量,則第

i個主成分為:7/1/202119中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束且:令

,則有類似的,有7/1/202120中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束由以上結(jié)論,我們把

的協(xié)方差矩陣

的非零特分別征值

對應(yīng)的標(biāo)準(zhǔn)化特征向量作為系數(shù)向量,分別稱為隨機(jī)向量

的第一主成分、第二主成分、…、第

主成分。

的分量主成依次是

的第一主成分、第二主成分、…、第分的充分必要條件是:,即

階正交陣;的分量之間互不相關(guān);的

個分量是按方差由大到小排列。7/1/202121中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.2.2

主成分的性質(zhì)性質(zhì)1

的協(xié)方差陣為對角陣

。這一性質(zhì)可由上述結(jié)論容易得到,證明略。性質(zhì)2

,有證明:記則有

于是7/1/202122中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束定義

5.1

為第

個主成分

的方差貢獻(xiàn)率,稱

為主成分

的累積貢獻(xiàn)率。由此進(jìn)一步可知,主成分分析是把個隨機(jī)變量的總方差分解為個不相關(guān)的隨機(jī)變量的方差之和,使第一主成分的方差達(dá)到最大,第一主成分是以變化最大的方向向量各分量為系數(shù)的原始變量的線性函數(shù),最大方差為

。

表明了

的方差在全部方差中的比值,稱

為第一主成分的貢獻(xiàn)率。這個值越大,表明

這個新變量綜合也即由

的差異來解釋隨機(jī)向量信息的能力越強,的差異的能力越強。7/1/202123中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束正因如此,才把

稱為

的主成分。進(jìn)而我們就更清楚為什么主成分的名次是按特征根

取值的大小排序的。進(jìn)行主成分分析的目的之一是為了減少變量的個數(shù),所以一般不會取

個主成分,而是取

個主成分,取多少比較合適,這是一個很實際的問題,通常以所取

使得累積貢獻(xiàn)率達(dá)到85%以上為宜,即(5.4)這樣,既能使損失信息不太多,又達(dá)到減少變量,簡化問題的目的。另外,選取主成分還可根據(jù)特征值的變化來確定。圖5-2為SPSS統(tǒng)計軟件生成的碎石圖。7/1/202124中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束圖5-2由圖5-2可知,第二個及第三個特征值變化的趨勢已經(jīng)開始趨于平穩(wěn),所以,取前兩個或是前三個主成分是比較合適的。這種方法確定的主成分個數(shù)與按累積貢獻(xiàn)率確定的主成分個數(shù)往往是一致的。在實際應(yīng)用中有些研究工作者習(xí)慣于保留特征值大于1的那些主成分,但這種方法缺乏完善的理論支持。在大多數(shù)情況下,當(dāng)

時即可使所選主成分保持信息總量的比重達(dá)到85%以上。7/1/202125中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束定義5.2

個主成分

與原始變量

的相關(guān)系數(shù)

稱做因子負(fù)荷量。因子負(fù)荷量是主成分解釋中非常重要的解釋依據(jù),因子負(fù)荷量的絕對值大小刻畫了該主成分的主要意義及其成因。在下一章因子分析中還將對因子負(fù)荷量的統(tǒng)計意義給出更詳細(xì)的解釋。由下面的性質(zhì)我們可以看到因子負(fù)荷量與系數(shù)向量成正比。性質(zhì)37/1/202126中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束(5.5)§5.3.1

總體主成分由性質(zhì)3知因子負(fù)荷量

與向量系數(shù)

成正比,與

的標(biāo)準(zhǔn)差成反比關(guān)系,因此,絕不能將因子負(fù)荷量與向量系數(shù)混為一談。在解釋主成分的成因或是第個變量對第個主成分的重要性時,應(yīng)當(dāng)根據(jù)因子負(fù)荷量而不能僅僅根據(jù)

的變換系數(shù)

。7/1/202127中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束性質(zhì)4(5.6)證明:由性質(zhì)3有(5.7)性質(zhì)5證明:因為

向量是隨機(jī)向量

的線性組合,因此

也可以精確表示成的全相關(guān)系數(shù)的平方和等于1,而因為的線性組合。由回歸分析知識知,

與之間互不相關(guān),所以

的全相關(guān)系數(shù)的平方和也就是

,因此,性質(zhì)5成立。7/1/202128中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束的全相關(guān)系數(shù)平方和稱定義5.3

與前

個主成分為對原始變量

的方差貢獻(xiàn)率

,即(5.8)這一定義說明了前

個主成分提取了原始變量

的信息,由此我們可以判斷我們提取的主成分說明原始變量的能力。7/1/202129中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.2.3從相關(guān)陣出發(fā)求解主成分考慮如下的數(shù)學(xué)變換:令:其中,與分別表示變量的期望與方差。于是有令:于是,對原始變量進(jìn)行標(biāo)準(zhǔn)化:7/1/202130中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束經(jīng)過上述標(biāo)準(zhǔn)化后,顯然有由于上面的變換過程,原始變量

的相關(guān)陣實際上就是對原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣,因此,由相關(guān)矩陣求主成分的過程與主成分個數(shù)的確定準(zhǔn)則實際上是與由協(xié)方差矩陣出發(fā)求主成分的過程與主成分個數(shù)的確定準(zhǔn)則是相一致的,在此不再贅述。仍用

分別表示相關(guān)陣

的特征值與對應(yīng)的標(biāo)準(zhǔn)正交特征向量,此時,求得的主成分與原始變量的關(guān)系式為:(5.9)7/1/202131中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.2.4由相關(guān)陣求主成分時主成分性質(zhì)的簡單形式由相關(guān)陣出發(fā)所求得主成分依然具有上面所述的各種性質(zhì),不同的是在形式上要簡單,這是由相關(guān)陣的特性決定的。我們將由相關(guān)陣得到的主成分的性質(zhì)總結(jié)如下:1.

的協(xié)方差矩陣為對角陣

;3.第

個主成分的方差占總方差的比例,即第

個主成分的方差貢獻(xiàn)率為

,前

個主成分的累積方差貢獻(xiàn)率為

;7/1/202132中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.3

樣本主成分的導(dǎo)出記在實際研究工作中,總體協(xié)方差陣與相關(guān)陣通常是未知的,于是需要通過樣本數(shù)據(jù)來估計。設(shè)有個樣品,每個樣品有個指標(biāo),這樣共得到個數(shù)據(jù),原始資料矩陣如下:7/1/202133中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束為樣本協(xié)方差矩陣,作為總體協(xié)方差陣

的無偏估計,

是樣本相關(guān)矩陣,為總體相關(guān)矩陣的估計。由前面的討論知,若原始資料

陣是經(jīng)過標(biāo)準(zhǔn)化處理的,則由矩陣

求得的協(xié)方差陣就是相關(guān)矩陣,即與完全相同。因為由協(xié)方差矩陣求解主成分的過程與同相關(guān)矩陣出發(fā)求解主成分的過程是一致的,下面我們僅介紹由相關(guān)陣

出發(fā)求解主成分。根據(jù)總體主成分的定義,主成分

的協(xié)方差是:其中

為對角陣7/1/202134中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束假定資料矩陣X為已標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣,則可由相關(guān)矩陣代替協(xié)方差矩陣,于是上式可表示為7/1/202135中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束因為

為正定矩陣,所以其特征根都是非負(fù)實數(shù),將它們依大小順序排列為

,則相對于,其相應(yīng)的特征向量記的方差為:同理有即對于有最大方差,有次大方差,……,并且,協(xié)方差為:7/1/202136中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束由此可知新的綜合變量(主成分)且

的方差為

,則彼此不相關(guān),并分別稱為第一、第二、……、第

個主成分。由上述求主成分的過程可知,主成分在幾何圖形中的方向?qū)嶋H上就是

的特征向量的方向,主成分的方差貢獻(xiàn)就等于R的相應(yīng)特征值。這樣,我們在利用樣本數(shù)據(jù)求解主成分的過程實際上就轉(zhuǎn)化為求相關(guān)陣或協(xié)方差陣的特征值和特征向量的過程。7/1/202137中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.47/1/202138中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束有關(guān)問題的討論§5.4.1關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分§5.4.2主成分分析不要求數(shù)據(jù)來自于正態(tài)總體§5.4.3主成分分析與重疊信息§5.4.17/1/202139中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分由前面的討論可知求解主成分的過程實際就是對矩陣結(jié)構(gòu)進(jìn)行分析的過程,也就是求解特征值的過程。在實際分析過程中我們可以從原始數(shù)據(jù)的協(xié)方差矩陣出發(fā),也可以從原始數(shù)據(jù)的相關(guān)矩陣出發(fā),其求主成分的過程是一致的。但是,從協(xié)方差陣出發(fā)和從相關(guān)陣出發(fā)所求得的主成分一般來說是有差別的,而且這種差別有時候還很大?!?.4.17/1/202140中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分一般而言,對于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),我們不直接由其協(xié)方差矩陣出發(fā)進(jìn)行主成分分析,而應(yīng)該考慮將數(shù)據(jù)標(biāo)準(zhǔn)化。比如,在對上市公司的財務(wù)狀況進(jìn)行分析時,常常會涉及到利潤總額、市盈率、每股凈利率等指標(biāo),其中利潤總額取值常常從幾十萬到上百萬,市盈率取值一般從五到六、七十之間,而每股凈利率在1以下,不同指標(biāo)取值范圍相差很大,這時若是直接從協(xié)方差矩陣入手進(jìn)行主成分分析,明顯利潤總額的作用將起到重要支配作用,而其它兩個指標(biāo)的作用很難在主成分中體現(xiàn)出來,此時應(yīng)該考慮對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理?!?.4.17/1/202141中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分但是,對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后傾向于各個指標(biāo)的作用在主成分的構(gòu)成中相等。由上面的例子我們看到,對于取值范圍相差不大或是度量相同的指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理后,其主成分分析的結(jié)果仍與由協(xié)方差陣出發(fā)求得的結(jié)果有較大區(qū)別。其原因是由于對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的過程實際上也就是抹殺原始變量離散程度差異的過程,標(biāo)準(zhǔn)化后的各變量方差相等均為1,而實際上方差也是對數(shù)據(jù)信息的重要概括形式,也就是說,對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后抹殺了一部分重要信息,因此才使得標(biāo)準(zhǔn)化后各變量在對主成分構(gòu)成中的作用趨于相等。由此看來,對同度量或是取值范圍在同量級的數(shù)據(jù),還是直接從協(xié)方差矩陣求解主成分為宜。§5.4.17/1/202142中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分對于從什么出發(fā)求解主成分,現(xiàn)在還沒有一個定論,但是我們應(yīng)該看到,不考慮實際情況就對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理或者直接從原始變量的相關(guān)矩陣出發(fā)求解主成分是有其不足之處的,這一點一定要引起注意。建議在實際工作中分別從不同角度出發(fā)求解主成分并研究其結(jié)果的差別,看看是否發(fā)生明顯差異且這種差異產(chǎn)生的原因在何處,以確定用哪種結(jié)果更為可信?!?.4.2

主成分分析不要求數(shù)據(jù)來自于正態(tài)總體7/1/202143中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束由上面的討論可知,無論是從原始變量協(xié)方差矩陣出發(fā)求解主成分,還

是從相關(guān)矩陣出發(fā)求解主成分,均沒有涉及到總體分布的問題。也就是說,

與很多多元統(tǒng)計方法不同,主成分分析不要求數(shù)據(jù)來自于正態(tài)總體。實際上,主成分分析就是對矩陣結(jié)構(gòu)的分析,其中主要用到的技術(shù)是矩陣運算的技術(shù)

及矩陣對角化和矩陣的譜分解技術(shù)。我們知道,對多元隨機(jī)變量而言,其協(xié)

方差矩陣或是其相關(guān)矩陣均是非負(fù)定的,這樣,我們就可以按照求解主成分

的步驟求出其特征值、標(biāo)準(zhǔn)正交特征向量,進(jìn)而求出主成分,達(dá)到縮減數(shù)據(jù)

維數(shù)的目的。同時,由主成分分析的幾何意義可以看到,對來自多元正態(tài)總

體的數(shù)據(jù),我們得到了合理的幾何解釋,即主成分就是按數(shù)據(jù)離散程度最大

的方向進(jìn)行坐標(biāo)軸旋轉(zhuǎn)。主成分分析的這一特性大大擴(kuò)展了其應(yīng)用范圍,對多維數(shù)據(jù),只要是涉及降維的處理,我們都可以嘗試用主成分分析,而不用花太多精力考慮其分布情況?!?.4.3主成分分析與重疊信息7/1/202144中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束首先應(yīng)當(dāng)認(rèn)識到主成分分析方法適用于變量之間存在較強相關(guān)性的數(shù)據(jù),如果原始數(shù)據(jù)相關(guān)性較弱,運用主成分分析后不能起到很好的降維作用,即所得的各個主成分濃縮原始變量信息的能力差別不大。一般認(rèn)為當(dāng)原始數(shù)據(jù)大部分變量的相關(guān)系數(shù)都小于0.3時,運用主成分分析不會取得很好的效果。很多研究工作者在運用主成分分析方法時,都或多或少存在著對主成分分析去除原始變量重疊信息的期望,這樣,在實際工作中初始就可以把與某一研究問題相關(guān)而可能得到的變量(指標(biāo))都納入分析過程,再用少數(shù)幾個主成分濃縮這些有用信息(假定已剔除了重疊信息),然后對主成分進(jìn)行深入分析。在對待重疊信息方面,生成的新的綜合變量(主成分)是有效剔除了原始變量中的重疊信息,還是僅僅按原來的模式將原始信息中的絕大部分用幾個不相關(guān)的新變量表示出來,這一點還值得討論?!?.4.3主成分分析與重疊信息為說明這個問題,我們有必要再回顧一下主成分的求解過程,我們僅就從協(xié)方差矩陣出發(fā)求主成分的過程予以說明,對相關(guān)陣有類似的情況。對于維指標(biāo)的情況,我們得到其協(xié)方差矩陣如下:現(xiàn)在考慮一種極端情況,即有兩個指標(biāo)完全相關(guān),不妨設(shè)第一個指標(biāo)在進(jìn)行主成分分析時考慮了兩次。則協(xié)方差矩陣變?yōu)椋?/1/202145中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.4.3主成分分析與重疊信息此時進(jìn)行主成分分析的時候?qū)嶋H上是由

維矩陣

進(jìn)行。

的行列式的值為零但仍滿足非負(fù)定,只不過其最小的特征值為0,由而是變?yōu)槌霭l(fā)求解主成分,其方差總和不再是,也就是說,第一個指標(biāo)在分析過程中起到了加倍的作用,其重疊信息完全象其他指標(biāo)提供的信息一樣在起作用。7/1/202146中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束7/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心47目錄 上頁

下頁

返回

結(jié)束§5.4.3主成分分析與重疊信息這樣求得的主成分已經(jīng)與沒有第一個指標(biāo)重疊信息時不一樣了,因為主成分方差的總和已經(jīng)變?yōu)?/p>

而不是

,每個主成分解釋方差的比例也相應(yīng)發(fā)生變化,而整個分析過程沒有對重疊信息作任何特殊處理。也就是說,由于對第一個指標(biāo)羅列了兩次,其在生成的主成分構(gòu)成中也起到了加倍的作用。這一點是尤其應(yīng)該引起注意的,這意味著主成分分析對重疊信息的剔除是無能為力的,同時主成分分析還損失了一部分信息。對此文獻(xiàn)[4]舉例進(jìn)行了說明。這就告訴我們在實際工作中,在選取初始變量進(jìn)入分析時應(yīng)該小心,對原始變量存在多重共線性的問題,在應(yīng)用主成分分析方法時一定要慎重。應(yīng)該考慮所選取的初始變量是否合適,是否真實地反映了事物的本來面目,如果是出于避免遺漏某些信息而特意選取了過多的存在重疊信息的變量時,就要特別注意應(yīng)用主成分分析所得到的結(jié)果?!?.4.3主成分分析與重疊信息如果所得到的樣本協(xié)方差矩陣(或是相關(guān)陣)最小的特征值接近于0,那么就有(5.10)進(jìn)而推出(5.11)7/1/202148中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束這就意味著,中心化以后的原始變量之間存在著多重共線性,即原始變量存在著不可忽視的重疊信息。因此,在進(jìn)行主成分分析得出協(xié)方差陣或是相關(guān)陣發(fā)現(xiàn)最小特征根接近于零時,應(yīng)該注意對主成分的解釋,或者考慮對最初納入分析的指標(biāo)進(jìn)行篩選,由此可以看出,雖然主成分分析不能有效地剔除重疊信息,但它至少可以發(fā)現(xiàn)原始變量是否存在著重疊信息,這對我們減少分析中的失誤是有幫助的?!?.5

主成分分析步驟及框圖7/1/202149中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.5.1主成分分析步驟§5.5.2主成分分析的邏輯框圖§5.5.17/1/202150中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束主成分分析步驟由上面討論大體上已經(jīng)可以明了進(jìn)行主成分分析的步驟,對此進(jìn)行歸納如下:根據(jù)研究問題選取初始分析變量;根據(jù)初始變量特性判斷由協(xié)方差陣求主成分還是由相關(guān) 陣求主成分;求協(xié)差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量;判斷是否存在明顯的多重共線性,若存在,則回到第一 步;得到主成分的表達(dá)式并確定主成分個數(shù),選取主成分;結(jié)合主成分對研究問題進(jìn)行分析并深入研究。§5.5.2主成分分析的邏輯框圖特征值標(biāo)準(zhǔn)正交特征向量是否有接近0的情況是其他處理否主成分對主成分進(jìn)行分析深入分析選擇初始變量度量或取值范圍相同?否對比(否)分析相關(guān)陣是分析協(xié)方差陣主成分分析的邏輯框圖見圖5-3:7/1/202151中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束§5.6主成分分析的上機(jī)實現(xiàn)7/1/202152中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束SPSS軟件FACTOR模塊提供了主成分分析的功能。下面先以

SPSS軟件包自帶的數(shù)據(jù)Employee

data.sav為例介紹主成分分析的上機(jī)實現(xiàn)方法,在SPSS軟件的安裝目錄下可以找到該數(shù)據(jù)集;然后,我們舉一個實際的例子介紹主成分分析的具體應(yīng)用。【例5.1】數(shù)據(jù)集Employee

data為Midwestern銀行在1969-1971年之間雇員情況的數(shù)據(jù),共包括474條觀測及如下10個變量:Id(觀測號)sGender(性別)sBdate(出生日期)s

Educ(受教育程度(年數(shù)))sJobcat(工作種類)sSalary(目前年薪)sSalbegin(開始受聘時的年薪)sJobtime(受雇時間(月))sPrevexp(受雇以前的工作時間(月))sMinority(是否少數(shù)民族)。下面我們用主成分分析方法處理該數(shù)據(jù),以期用少數(shù)變量來描述該地區(qū)居民的雇傭情況。進(jìn)入SPSS軟件,打開數(shù)據(jù)集Employeedata.sav。依次點選Analyze→Data

Reduction→Factor….進(jìn)入FactorAnalysis(因子分析)對話框。(在SPSS軟件中,主成分分析與因子分析均在FactorAnalysis模塊中完成。此時,數(shù)據(jù)集Employeedata.sav中的變量名均已顯示在左邊的窗口中,依次選中變量educ、salary、salbegin、jobtime、prevexp并點向右的箭頭按鈕,這五個變量便進(jìn)入variables窗口(此時若選中variables窗口中的變量,則窗口左側(cè)的箭頭按鈕即轉(zhuǎn)向左側(cè),點此按鈕即可剔除所選中變量)。點擊右側(cè)的OK按鈕,即可得到如下輸出結(jié)果5-1。7/1/202153中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束輸出結(jié)果5-1(2)輸出結(jié)果5-1(1)7/1/202154中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束輸出結(jié)果5-1(3)7/1/202155中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束其中Communalities給出了該次分析從每個原始變量中提取的信息,表格下面的注示表明,該次分析是用Factor

analysis模塊默認(rèn)的信息提取方法即主成分分析完成的??梢钥吹匠芙逃潭刃畔p失較大外,主成分幾乎包含了各個原始變量至少90%的信息。Total

Variance

Explained表則顯示了各主成分解釋原始變量總方差的情況,SPSS默認(rèn)保留特征根大于1的主成分,在本例中看到當(dāng)保留3個主成分為宜,這3個主成分集中了原始5個變量信息的90.66%,可見效果是比較好的。實際上,主成分解釋總方差的百分比也可以由Communalities表中計算得出,即(0.896+0.916+0.999+0.968+0.754)/5=90.66%。Component

Matrix表中給出了標(biāo)準(zhǔn)化原始變量用求得的主成分線性表示的近似表達(dá)式,我們以表中Current

Salary一行為例,不妨用

來表示各個主成分,則由Component

Matrix表可以得到:標(biāo)準(zhǔn)化的salary7/1/202156中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束在上面的主成分分析中,SPSS默認(rèn)是從相關(guān)陣出發(fā)求解主成分,且默認(rèn)保留特征根大于1的主成分,實際上,對主成分的個數(shù)我們可以自己確定,方法為:進(jìn)入FactorAnalysis對話框并選擇好變量之后,點擊Extraction選項,在彈出的對話框中有一個Extract選擇框,默認(rèn)是選擇Eigenvaluesover1也就是保留特征根大于1的主成分,我們可以輸入別的數(shù)值來改變SPSS軟件保留特征根的大??;另外,還可以選擇NumberofFactors選項直接確定主成分的個數(shù)。在實際進(jìn)行主成分分析時可以先按照默認(rèn)設(shè)置做一次主成分,然后根據(jù)輸出結(jié)果確定應(yīng)保留主成分的個數(shù),用該方法進(jìn)行設(shè)定后重新分析。因為我們上面的結(jié)果是默認(rèn)從相關(guān)陣出發(fā)得到的,而由相關(guān)陣出發(fā)求得的主成分其性質(zhì)有簡單的表達(dá)形式,我們可以方便地加以驗證。7/1/202157中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束由Component

Matrix中的結(jié)果可以得到:=第一主成分的方差,這就驗證了性質(zhì)4。又有:這恰好與Communalities表中三個主成分提取salary變量的信息相等。我們重做一遍主成分分析,此次將5個主成分全部保留,得到Component

Matrix表如輸出結(jié)果5-2:7/1/202158中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束輸出結(jié)果5-2可以看到前三個主成分的相應(yīng)結(jié)果與輸出結(jié)果5-1中的對應(yīng)部分結(jié)果是一致的。對上表中結(jié)果有如下關(guān)系式:7/1/202159中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束這就驗證了性質(zhì)5。由此表還可以得到標(biāo)準(zhǔn)化原始變量用各主成分線性表示的精確的表達(dá)式,以仍以Current

Salary為例,有:標(biāo)準(zhǔn)化的salary7/1/202160中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束7/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心62目錄 上頁

下頁

返回

結(jié)束例5.2在企業(yè)經(jīng)濟(jì)效益的評價中,設(shè)計的指標(biāo)往往很多。為了簡化系統(tǒng)結(jié)構(gòu),抓住經(jīng)濟(jì)效益評價中的主要問題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。在對我國部分省、市、自治區(qū)獨立核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益評價中,涉及到9項指標(biāo),原始數(shù)據(jù)見表5-1,即樣品數(shù)n=28,變量數(shù)p=9。中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束63100元固定100元100元工業(yè)100固定資產(chǎn)資產(chǎn)原值資金實總產(chǎn)值實100元銷售收每噸標(biāo)準(zhǔn)煤每千瓦時電全員勞動生100元流動原值實現(xiàn)值實現(xiàn)利稅現(xiàn)利稅現(xiàn)利稅(入實現(xiàn)利稅實現(xiàn)工業(yè)產(chǎn)力實現(xiàn)工業(yè)產(chǎn)率(元/人資金實現(xiàn)產(chǎn)(%)(%)(%)%)(%)值(元)產(chǎn)值(元).年)值(元)北京(1

)119

.

2930

.

9829

.

9225

.

9715

.

4821783

.

4121006296

.

7天津(2

)143

.

9831

.

5930

.

2121

.

9412

.

2928524

.

2920254363

.

1河北(3

)94

.

817

.

217

.

9518

.

149

.

3711672

.

0312607322

.

2山西(4

)65

.

811

.

0811

.

0612

.

1516

.

848

.

821

.

6510166284

.

7內(nèi)蒙(5

)54

.

799

.

249

.

5416

.

866

.

278941

.

87564225

.

4遼寧(6

)94

.

5121

.

1222

.

8322

.

3511

.

2814162

.

3613

.

386311

.

7吉林(7

)80

.

4913

.

3613

.

7616

.

67

.

1413062

.

079400274

.

1黑龍江(8

)75

.

8615

.

8216

.

6720

.

8610

.

3712672

.

269830267上海(9

)187

.

7945

.

939

.

7724

.

4415

.

0943464

.

1131246418

.

6江蘇(10

)205

.

9627

.

6522

.

5813

.

427

.

8132024

.

6923377407

.

2浙江(11

)207

.

4633

.

0625

.

7815

.

949

.

2838114

.

1922054385

.

5安徽(12

)110

.

7820

.

720

.

1218

.

696

.

614682

.

2312578341

.

1福建(13

)7/1/2021

122

.

7622

.

5219

.

9318

.

348

.

3522002

.

6312164301

.

2表5-17/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心64江西(14

)94

.

9414

.

714

.

1815

.

496

.

6916692

.

2410463274

.

4山東(15

)117

.

5821

.

9320

.

8918

.

659

.

118202

.

817829331

.

1河南(16

)85

.

9817

.

317

.

1820

.

127

.

6713061

.

8911247276

.

5湖北(17

)103

.

9619

.

518

.

4818

.

779

.

1618292

.

7515745308

.

9湖南(18

)104

.

0321

.

4721

.

2820

.

638

.

7212721

.

9813161309廣東(19

)136

.

4423

.

6420

.

8317

.

337

.

8529593

.

7116259334廣西(20

)100

.

7222

.

0420

.

921

.

889

.

6717322

.

1312441296

.

4四川(21

)84

.

7314

.

3514

.

1716

.

937

.

9613102

.

3411703242

.

5貴州(22

)59

.

0514

.

4814

.

3524

.

538

.

0910681

.

329710206

.

7云南(23

)73

.

7221

.

9122

.

729

.

729

.

3814471

.

9412517295

.

8陜西(24

)78

.

0213

.

1312

.

5716

.

839

.

1917312

.

0811369220

.

3甘肅(25

)59

.

6214

.

0716

.

2423

.

5911

.

349261

.

1313084246

.

8青海(26

)51

.

668

.

328

.

2616

.

117

.

0510551

.

319246176

.

49寧夏(27

)52

.

958

.

258

.

8215

.

576

.

588341

.

1210406245

.

4新疆(28

)60

.

2911

.

2613

.

1418

.

688

.

3910412

.

910983266目錄 上頁

下頁

返回

結(jié)束續(xù)表5-27/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心65目錄 上頁

下頁

返回

結(jié)束0

.

4235231

.

3384051

.

5902821

.

6875562

.

2396340

.

4819710

.

9547461

.

2603710

.

0488050

.

9951991

.

4096491

.

6314530

.

6672281

.

0658731

.

1887581

.

8553941

.

1338441

.

200166-

0

.

14352-

0

.

271-

0

.

10906-

0

.

29487-

0

.

00854-

0

.

57821-

0

.

45763-

0

.

152790

.

49097-

0

.

81499-

0

.

98577-

1

.

08721-

1

.

811432

.

740046-

1

.

79273-

0

.

84655-

0

.

56349-

0

.

15927-

1

.

06992-

1

.

20067-

1

.

303-

0

.

61894-

1

.

14919-

0

.

86449-

0

.

69303-

1

.

00129-

1

.

18752-

0

.

150240

.

1868270

.

5837370

.

7710330

.

694243-

0

.

3171-

0

.

11989-

2

.

27170

.

308902-

0

.

47486-

0

.

71949-

0

.

7039-

0

.

68477-

0

.

82907-

0

.

43245-

0

.

4167-

0

.

69238-

0

.

34307-

0

.

58206-

0

.

43218-

0

.

290780

.

393790

.

359408-

0

.

47334-

0

.

22224-

0

.

62003-

0

.

466192

.

0095833

.

0809562

.

9886561

.

3001862

.

0961332

.

7554331

.

6711712

.

9832842

.

1625242

.

4302940

.

9494850

.

548246-

1

.

48989-

0

.

582541

.

5557832

.

264781

.

6592991

.

9648512

.

4650251

.

5813351

.

002539-

0

.

85187-

0

.

041662

.

1944081

.

7530481

.

43671

.

5885780

.

2264810

.

1377740

.

199007-

0

.

15562-

1

.

02776-

0

.

26257-

0

.

25294-

0

.

157670

.

8186910

.

5038680

.

3503370

.

172033-

0

.

24423-

0

.

383850

.

5050410

.

156444-

0

.

227320

.

126834-

0

.

14028-

0

.

56298-

0

.

64428-

0

.

9658-

0

.

99465-

0

.

05179-

0

.

24271-

0

.

51352-

0

.

337870

.

3839290

.

2814290

.

308322-

0

.

16574-

0

.

107890

.

1065570

.

3304330

.

725830

.

645294標(biāo)準(zhǔn)化數(shù)據(jù)表7/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心66目錄 上頁

下頁

返回

結(jié)束-

0

.

34774-

0

.

25932-

0

.

218380

.

206435-

0

.

63406-

0

.

43245-

0

.

60092-

0

.

38161-

0

.

301460

.

068569-

0

.

00238-

0

.

03382-

0

.

13536-

0

.

085810

.

1159940

.

279260

.

375190

.

2603510

.

070190

.

2277050

.

3636890

.

335558-

0

.

24771-

0

.

4681-

0

.

50881-

0

.

059580

.

2620850

.

8206170

.

4811450

.

299804-

0

.

49995-

0

.

567831

.

3009631

.

2617850

.

4616730

.

695579-

0

.

006450

.

2942770

.

3097410

.

6520370

.

1018430

.

014276-

0

.

35529-

0

.

180720

.

043603-

0

.

37669-

0

.

60386-

0

.

6457-

0

.

60122-

0

.

52735-

0

.

42825-

0

.

14036-

0

.

30489-

0

.

89101-

0

.

97128-

0

.

58868-

0

.

620141

.

322972-

0

.

47952-

0

.

68202-

1

.

18429-

0

.

64022-

1

.

51177-

0

.

631610

.

2790930

.

5652822

.

636993-

0

.

00486-

0

.

28459-

0

.

54975-

0

.

167930

.

033199-

0

.

53205-

0

.

74635-

0

.

87284-

0

.

62654-

0

.

074770

.

013227-

0

.

40646-

0

.

36109-

1

.

27595-

0

.

95809-

0

.

63656-

0

.

351821

.

084980

.

71632-

0

.

83093-

1

.

37875-

0

.

07253-

0

.

81645-

1

.

14239-

1

.

30812-

1

.

48472-

0

.

80883-

0

.

86219-

0

.

69566-

1

.

19453-

0

.

71829-

2

.

03561-

1

.

11252-

1

.

3163-

1

.

40522-

0

.

94555-

1

.

03512-

0

.

92741-

1

.

38899-

0

.

52311-

0

.

84073-

0

.

94257-

0

.

96475-

0

.

79192-

0

.

15815-

0

.

36913-

0

.

710340

.

432779-

0

.

42603-

0

.

483537/1/206721

中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁返回結(jié)束將表數(shù)據(jù)導(dǎo)入spss軟件,依次點選Analyze-Data

Reduction-Factor進(jìn)入Factor

Analysis對話框。(在spss中,主成分分析因子分析均在Factor

Analysis模塊中完成。)如圖5-4所示:圖5-4此時,數(shù)據(jù)集5-5.sav中的變量名均顯示在對話框左邊的窗口中,選擇變量x1,x2,x3,x4,x5,x6,x7,x8,x9進(jìn)入

variables窗口中,操作如圖5-5所示:圖5-57/1/202168中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束圖5-5點擊descriptives按鈕,在彈出的對話框中,在correlationmatrix中選擇coefficients?;氐皆瓕υ捒螯c擊右側(cè)的Ok,即可得到輸出結(jié)果5-4和輸出結(jié)果5-5。7/1/202169中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束輸出結(jié)果5-47/1/202170中國人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁

下頁

返回

結(jié)束7/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心71目錄 上頁

下頁

返回

結(jié)束輸出結(jié)果5-5由輸出結(jié)果5-4看到,前面2個主成分 、的方差和占全部方差的比例為84.7%。我們就選取為第一主成分,為第二主成分,且這兩個主成分之方差和占全部方差的84.7%,即基本上保留了原來標(biāo)的信息,這樣由原來的9個指標(biāo)轉(zhuǎn)化為2個新指標(biāo),起到了降維的作用。7/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心72目錄 上頁

下頁

返回

結(jié)束Spss軟件得到主成分系數(shù)矩陣如下:(5.12)5.35.5.2由圖5-4可看出,分布在第一象限的是上海、北京、天津、廣西這4個省,這四個省、市、自治區(qū)的經(jīng)濟(jì)效益在全國來說屬于比較好的,其中上海的經(jīng)濟(jì)效益最好。分布在第四象限的江蘇、浙江、安徽、福建、山東、湖北、廣東七個省、市、自治區(qū)。因為第四象限的主要特征是第一主成分,第一主成分占信息總量的比重最大,所以這七個省的經(jīng)濟(jì)效益也算比較好。分布在第二象限和第三象限的地區(qū)可屬同一類,經(jīng)濟(jì)效益較差。7/1/2021中國人民大學(xué)六西格瑪質(zhì)量管理研究中心76目錄 上頁

下頁

返回

結(jié)束例5.3

全國重點水泥企業(yè)經(jīng)濟(jì)效益綜合評價例。利用主成分綜合評價全國重點水泥企業(yè)的經(jīng)濟(jì)效益。原始數(shù)據(jù)(數(shù)據(jù)來自1984年中國統(tǒng)計年鑒)見表5-5。中國人民大學(xué)六西格瑪質(zhì)量管理研究中心77目錄 上頁

下頁

返回

結(jié)束廠家編號及指標(biāo)固定資產(chǎn)利稅率資金利稅率銷售收入利稅率資金利潤率固定資產(chǎn)產(chǎn)值率流動資金周轉(zhuǎn)天數(shù)萬元產(chǎn)值能耗全員勞動生產(chǎn)率1琉璃河16

.6826

.7531

.8418

.453

.255528

.831

.752邯鄲19

.727

.5632

.9419

.259

.825532

.922

.873大同15

.223

.432

.9816

.2446

.786541

.691

.534哈爾濱7

.298

.9721

.34

.7634

.396239

.281

.635華新29

.4556

.4940

.7443

.6875

.326926

.682

.146湘鄉(xiāng)32

.9342

.7847

.9833

.8766

.465032

.872

.67柳州25

.3937

.8236

.7627

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論