版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第5章
主成分分析7/1/20211中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束主成分分析(principal
components
analysis)也稱(chēng)主分分析,最早可追溯到K.Pearson于1901年開(kāi)創(chuàng)的非隨機(jī)變量的多元轉(zhuǎn)化分析;是由霍特林(Hotelling)于1933年推廣到隨機(jī)變量。主成分分析是利用降維的思想,在損失很少信息的前提下把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。通常把轉(zhuǎn)化生成的綜合指標(biāo)稱(chēng)之為主成分,其中每個(gè)主成分都是原始變量的線(xiàn)性組合,且各個(gè)主成分之間互不相關(guān),這就使得主成分比原始變量具有某些更優(yōu)越的性能。這樣在研究復(fù)雜問(wèn)題時(shí)就可以只考慮少數(shù)幾個(gè)主成分而不至于損失太多信息,從而更容易抓住主要矛盾,揭示事物內(nèi)部變量之間的規(guī)律性,同時(shí)使問(wèn)題得到簡(jiǎn)化,提高分析效率。第5章
主成分分析7/1/20212中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.1
主成分分析的基本原理§5.2
總體主成分及其性質(zhì)§5.3
樣本主成分的導(dǎo)出§5.4
有關(guān)問(wèn)題的討論§5.5
主成分分析步驟及框圖§5.6
主成分分析的上機(jī)實(shí)現(xiàn)§5.1
主成分分析的基本原理7/1/20213中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.1.1
主成分分析的基本思想§5.1.2
主成分分析的基本理論§
5.1.3主成分分析的幾何意義§5.1.1
主成分分析的基本思想7/1/20214中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束在對(duì)某一事物進(jìn)行實(shí)證研究中,為了更全面、準(zhǔn)確地反映出事物的特征及其發(fā)展規(guī)律,人們往往要考慮與其有關(guān)系的多個(gè)指標(biāo),這些指標(biāo)在多元統(tǒng)計(jì)中也稱(chēng)為變量。這樣就產(chǎn)生了如下問(wèn)題:一方面人們?yōu)榱吮苊膺z漏重要的信息而考慮盡可能多的指標(biāo),而另一方面隨著考慮指標(biāo)的增多增加了問(wèn)題的復(fù)雜性,同時(shí)由于各指標(biāo)均是對(duì)同一事物的反映,不可避免地造成信息的大量重疊,這種信息的重疊有時(shí)甚至?xí)⑹挛锏恼嬲卣髋c內(nèi)在規(guī)律?;谏鲜鰡?wèn)題,人們就希望在定量研究中涉及的變量較少,而得到的信息量又較多。主成分分析正是研究如何通過(guò)原來(lái)變量的少數(shù)幾個(gè)線(xiàn)性組合來(lái)解釋原來(lái)變量絕大多數(shù)信息的一種多元統(tǒng)計(jì)方法?!?.1.1
主成分分析的基本思想7/1/20215中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束既然研究某一問(wèn)題涉及的眾多變量之間有一定的相關(guān)性,就必然存在著起支配作用的共同因素,根據(jù)這一點(diǎn),通過(guò)對(duì)原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線(xiàn)性組合形成幾個(gè)綜合指標(biāo)(主成分),在保留原始變量主要信息的前提下起到降維與簡(jiǎn)化問(wèn)題的作用,使得在研究復(fù)雜問(wèn)題時(shí)更容易抓住主要矛盾。一般地說(shuō),利用主成分分析得到的主成分與原始變量之間有如下基本關(guān)系:每一個(gè)主成分都是各原始變量的線(xiàn)性組合主成分的數(shù)目大大少于原始變量的數(shù)目§5.1.1
主成分分析的基本思想7/1/20216中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束主成分保留了原始變量絕大多數(shù)信息各主成分之間互不相關(guān)通過(guò)主成分分析,可以從事物之間錯(cuò)綜復(fù)雜的關(guān)系中找出一些主要成分,從而能有效利用大量統(tǒng)計(jì)數(shù)據(jù)進(jìn)行定量分析,揭示變量之間的內(nèi)在關(guān)系,得到對(duì)事物特征及其發(fā)展規(guī)律的一些深層次的啟發(fā),把研究工作引向深入。§5.1.2
主成分分析的基本理論設(shè)對(duì)某一事物的研究涉及個(gè)
指標(biāo),分別用示,這個(gè)
指標(biāo)構(gòu)成的
維隨機(jī)向量為表。設(shè)隨機(jī)向量的均值為,協(xié)方差矩陣為。對(duì)進(jìn)行線(xiàn)性變換,可以形成新的綜合變量,用表示,也就是說(shuō),新的綜合變量可以由原來(lái)的變量線(xiàn)性表示,即滿(mǎn)足下式:(5.1)7/1/20217中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.1.2
主成分分析的基本理論由于可以任意地對(duì)原始變量進(jìn)行上述線(xiàn)性變換,由不同的線(xiàn)性變換得到的綜合變量
的統(tǒng)計(jì)特性也不盡相同。因此為了取得較好的效果,我們總是希望
的方差盡可能大且各
之間互相獨(dú)立,由于=而對(duì)任給的常數(shù)
,有7/1/20218中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.1.2
主成分分析的基本理論因此對(duì)
不加限制時(shí),可使
任意增大,問(wèn)題將變得沒(méi)有意義。我們將線(xiàn)性變換約束在下面的原則之下:,1.2.的一切滿(mǎn)足原則1的線(xiàn)性組合中方差最不相關(guān)的
所有線(xiàn)性組合中方差最3.是大者;是與大者;…,是與
都不相關(guān)的
的所有線(xiàn)性組合中方差最大者。7/1/20219中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.1.2
主成分分析的基本理論基于以上三條原則決定的綜合變量
分別稱(chēng)為原始變量的第一、第二、…、第
個(gè)主成分。其中,各綜合變量在總方差中占的比重依次遞減,在實(shí)際研究工作中,通常只挑選前幾個(gè)方差最大的主成分,從而達(dá)到簡(jiǎn)化系統(tǒng)結(jié)構(gòu),抓住問(wèn)題實(shí)質(zhì)的目的。7/1/202110中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.1.3
主成分分析的幾何意義由第一節(jié)的介紹我們知道,在處理涉及多個(gè)指標(biāo)問(wèn)題的時(shí)候,為了提高分析的效率,可以不直接對(duì)
個(gè)指標(biāo)構(gòu)成的
維隨機(jī)向量
進(jìn)行分析,而是先對(duì)向量
進(jìn)行線(xiàn)性變換,形成少數(shù)幾個(gè)新的綜合變量
,使得各綜合變量之間相互獨(dú)立且能解釋原始變量盡可能多的信息,這樣在以損失很少部分信息為代價(jià)的前提下,達(dá)到簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu),提高分析效率的目的。這一節(jié),我們著重討論主成分分析的幾何意義,為了方便,我們僅在二維空間中討論主成分的幾何意義,所得結(jié)論可以很容易地?cái)U(kuò)展到多維的情況。7/1/202111中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束設(shè)有
個(gè)樣品,每個(gè)樣品有兩個(gè)觀測(cè)變量
,這樣,在由變量
組成的坐標(biāo)空間中,個(gè)樣品點(diǎn)散布的情況如帶狀,見(jiàn)圖5-1。圖5-17/1/202112中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束由圖可以看出這
個(gè)樣品無(wú)論沿
軸方向還是沿有較大的離散性,其離散程度可以分別用觀測(cè)變量軸方向均的方差和的方差定量地表示,顯然,若只考慮和中的任何一個(gè),原始數(shù)據(jù)中的信息均會(huì)有較大的損失。我們的目的是考慮和的線(xiàn)性組合,使得原始樣品數(shù)據(jù)可以由新的變量和來(lái)刻畫(huà)。在幾何上表示就是將坐標(biāo)軸按逆時(shí)針?lè)较蛐D(zhuǎn)角度,得到新坐標(biāo)軸和,坐標(biāo)旋轉(zhuǎn)公式如下:7/1/202113中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束其矩陣形式為:其中,為旋轉(zhuǎn)變換矩陣,由上式可知它是正交陣,即滿(mǎn)足7/1/202114中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束經(jīng)過(guò)這樣的旋轉(zhuǎn)之后,個(gè)樣品點(diǎn)在軸上的離散程度最大,變量代表了原始數(shù)據(jù)絕大部分信息,這樣,有時(shí)在研究實(shí)際問(wèn)題時(shí),即使不考慮變量也無(wú)損大局。因此,經(jīng)過(guò)上述旋轉(zhuǎn)變換就可以把原始數(shù)據(jù)的信息集中到軸上,對(duì)數(shù)據(jù)中包含的信息起到了濃縮的作用。主成分分析的目的就是找出轉(zhuǎn)換矩陣,而主成分分析的作用與幾何意義也就很明了了。7/1/202115中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.2
總體主成分及其性質(zhì)由上面的討論可知,求解主成分的過(guò)程就是求滿(mǎn)足三條原則的原始變量
的線(xiàn)性組合的過(guò)程。本節(jié)先從總體出發(fā),介紹求解主成分的一般方法及主成分的性質(zhì),然后介紹樣本主成分的導(dǎo)出。7/1/202116中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束主成分分析的基本思想就是在保留原始變量盡可能多的信息的前提下達(dá)到降維的目的,從而簡(jiǎn)化問(wèn)題的復(fù)雜性并抓住問(wèn)題的主要矛盾。而這里對(duì)于隨機(jī)變量而言,其協(xié)方差矩陣或相關(guān)矩陣正是對(duì)各變量離散程度與變量之間的相關(guān)程度的信息的反應(yīng),而相關(guān)矩陣不過(guò)是將原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣。我們所說(shuō)的保留原始變量盡可能多的信息,也就是指的生成的較少的綜合變量(主成分)的方差和盡可能接近原始變量方差的總和。因此在實(shí)際求解主成分的時(shí)候,總是從原始變量的協(xié)方差矩陣或相關(guān)矩陣的結(jié)構(gòu)分析入手。一般地說(shuō),從原始變量的協(xié)方差矩陣出發(fā)求得的主成分與從原始變量的相關(guān)矩陣出發(fā)求得的主成分是不同的。下面我們分別就協(xié)方差矩陣與相關(guān)矩陣進(jìn)行討論。7/1/202117中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.2.1從協(xié)方差矩陣出發(fā)求解主成分引理:設(shè)矩陣
,將排列,不妨設(shè)的特征值
依大小順序,
為
矩陣各特征值對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量,則對(duì)任意向量,有:(5.2)7/1/202118中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束證明:由引論理論知,對(duì)于任意常向量
,有:又
為標(biāo)準(zhǔn)正交特征向量,于是:此時(shí):(5.3)結(jié)論:
設(shè)隨機(jī)向量的協(xié)方差矩陣為
,為
的特征值,
為矩陣
各特征值對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量,則第
i個(gè)主成分為:7/1/202119中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束且:令
,則有類(lèi)似的,有7/1/202120中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束由以上結(jié)論,我們把
的協(xié)方差矩陣
的非零特分別征值
對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量作為系數(shù)向量,分別稱(chēng)為隨機(jī)向量
的第一主成分、第二主成分、…、第
主成分。
的分量主成依次是
的第一主成分、第二主成分、…、第分的充分必要條件是:,即
為
階正交陣;的分量之間互不相關(guān);的
個(gè)分量是按方差由大到小排列。7/1/202121中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.2.2
主成分的性質(zhì)性質(zhì)1
的協(xié)方差陣為對(duì)角陣
。這一性質(zhì)可由上述結(jié)論容易得到,證明略。性質(zhì)2
記
,有證明:記則有
于是7/1/202122中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束定義
5.1
稱(chēng)
為第
個(gè)主成分
的方差貢獻(xiàn)率,稱(chēng)
為主成分
的累積貢獻(xiàn)率。由此進(jìn)一步可知,主成分分析是把個(gè)隨機(jī)變量的總方差分解為個(gè)不相關(guān)的隨機(jī)變量的方差之和,使第一主成分的方差達(dá)到最大,第一主成分是以變化最大的方向向量各分量為系數(shù)的原始變量的線(xiàn)性函數(shù),最大方差為
。
表明了
的方差在全部方差中的比值,稱(chēng)
為第一主成分的貢獻(xiàn)率。這個(gè)值越大,表明
這個(gè)新變量綜合也即由
的差異來(lái)解釋隨機(jī)向量信息的能力越強(qiáng),的差異的能力越強(qiáng)。7/1/202123中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束正因如此,才把
稱(chēng)為
的主成分。進(jìn)而我們就更清楚為什么主成分的名次是按特征根
取值的大小排序的。進(jìn)行主成分分析的目的之一是為了減少變量的個(gè)數(shù),所以一般不會(huì)取
個(gè)主成分,而是取
個(gè)主成分,取多少比較合適,這是一個(gè)很實(shí)際的問(wèn)題,通常以所取
使得累積貢獻(xiàn)率達(dá)到85%以上為宜,即(5.4)這樣,既能使損失信息不太多,又達(dá)到減少變量,簡(jiǎn)化問(wèn)題的目的。另外,選取主成分還可根據(jù)特征值的變化來(lái)確定。圖5-2為SPSS統(tǒng)計(jì)軟件生成的碎石圖。7/1/202124中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束圖5-2由圖5-2可知,第二個(gè)及第三個(gè)特征值變化的趨勢(shì)已經(jīng)開(kāi)始趨于平穩(wěn),所以,取前兩個(gè)或是前三個(gè)主成分是比較合適的。這種方法確定的主成分個(gè)數(shù)與按累積貢獻(xiàn)率確定的主成分個(gè)數(shù)往往是一致的。在實(shí)際應(yīng)用中有些研究工作者習(xí)慣于保留特征值大于1的那些主成分,但這種方法缺乏完善的理論支持。在大多數(shù)情況下,當(dāng)
時(shí)即可使所選主成分保持信息總量的比重達(dá)到85%以上。7/1/202125中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束定義5.2
第
個(gè)主成分
與原始變量
的相關(guān)系數(shù)
稱(chēng)做因子負(fù)荷量。因子負(fù)荷量是主成分解釋中非常重要的解釋依據(jù),因子負(fù)荷量的絕對(duì)值大小刻畫(huà)了該主成分的主要意義及其成因。在下一章因子分析中還將對(duì)因子負(fù)荷量的統(tǒng)計(jì)意義給出更詳細(xì)的解釋。由下面的性質(zhì)我們可以看到因子負(fù)荷量與系數(shù)向量成正比。性質(zhì)37/1/202126中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束(5.5)§5.3.1
總體主成分由性質(zhì)3知因子負(fù)荷量
與向量系數(shù)
成正比,與
的標(biāo)準(zhǔn)差成反比關(guān)系,因此,絕不能將因子負(fù)荷量與向量系數(shù)混為一談。在解釋主成分的成因或是第個(gè)變量對(duì)第個(gè)主成分的重要性時(shí),應(yīng)當(dāng)根據(jù)因子負(fù)荷量而不能僅僅根據(jù)
與
的變換系數(shù)
。7/1/202127中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束性質(zhì)4(5.6)證明:由性質(zhì)3有(5.7)性質(zhì)5證明:因?yàn)?/p>
向量是隨機(jī)向量
的線(xiàn)性組合,因此
也可以精確表示成的全相關(guān)系數(shù)的平方和等于1,而因?yàn)榈木€(xiàn)性組合。由回歸分析知識(shí)知,
與之間互不相關(guān),所以
與
的全相關(guān)系數(shù)的平方和也就是
,因此,性質(zhì)5成立。7/1/202128中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束的全相關(guān)系數(shù)平方和稱(chēng)定義5.3
與前
個(gè)主成分為對(duì)原始變量
的方差貢獻(xiàn)率
,即(5.8)這一定義說(shuō)明了前
個(gè)主成分提取了原始變量
中
的信息,由此我們可以判斷我們提取的主成分說(shuō)明原始變量的能力。7/1/202129中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.2.3從相關(guān)陣出發(fā)求解主成分考慮如下的數(shù)學(xué)變換:令:其中,與分別表示變量的期望與方差。于是有令:于是,對(duì)原始變量進(jìn)行標(biāo)準(zhǔn)化:7/1/202130中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束經(jīng)過(guò)上述標(biāo)準(zhǔn)化后,顯然有由于上面的變換過(guò)程,原始變量
的相關(guān)陣實(shí)際上就是對(duì)原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣,因此,由相關(guān)矩陣求主成分的過(guò)程與主成分個(gè)數(shù)的確定準(zhǔn)則實(shí)際上是與由協(xié)方差矩陣出發(fā)求主成分的過(guò)程與主成分個(gè)數(shù)的確定準(zhǔn)則是相一致的,在此不再贅述。仍用
分別表示相關(guān)陣
的特征值與對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量,此時(shí),求得的主成分與原始變量的關(guān)系式為:(5.9)7/1/202131中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.2.4由相關(guān)陣求主成分時(shí)主成分性質(zhì)的簡(jiǎn)單形式由相關(guān)陣出發(fā)所求得主成分依然具有上面所述的各種性質(zhì),不同的是在形式上要簡(jiǎn)單,這是由相關(guān)陣的特性決定的。我們將由相關(guān)陣得到的主成分的性質(zhì)總結(jié)如下:1.
的協(xié)方差矩陣為對(duì)角陣
;3.第
個(gè)主成分的方差占總方差的比例,即第
個(gè)主成分的方差貢獻(xiàn)率為
,前
個(gè)主成分的累積方差貢獻(xiàn)率為
;7/1/202132中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.3
樣本主成分的導(dǎo)出記在實(shí)際研究工作中,總體協(xié)方差陣與相關(guān)陣通常是未知的,于是需要通過(guò)樣本數(shù)據(jù)來(lái)估計(jì)。設(shè)有個(gè)樣品,每個(gè)樣品有個(gè)指標(biāo),這樣共得到個(gè)數(shù)據(jù),原始資料矩陣如下:7/1/202133中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束為樣本協(xié)方差矩陣,作為總體協(xié)方差陣
的無(wú)偏估計(jì),
是樣本相關(guān)矩陣,為總體相關(guān)矩陣的估計(jì)。由前面的討論知,若原始資料
陣是經(jīng)過(guò)標(biāo)準(zhǔn)化處理的,則由矩陣
求得的協(xié)方差陣就是相關(guān)矩陣,即與完全相同。因?yàn)橛蓞f(xié)方差矩陣求解主成分的過(guò)程與同相關(guān)矩陣出發(fā)求解主成分的過(guò)程是一致的,下面我們僅介紹由相關(guān)陣
出發(fā)求解主成分。根據(jù)總體主成分的定義,主成分
的協(xié)方差是:其中
為對(duì)角陣7/1/202134中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束假定資料矩陣X為已標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣,則可由相關(guān)矩陣代替協(xié)方差矩陣,于是上式可表示為7/1/202135中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束因?yàn)?/p>
為正定矩陣,所以其特征根都是非負(fù)實(shí)數(shù),將它們依大小順序排列為
,則相對(duì)于,其相應(yīng)的特征向量記的方差為:同理有即對(duì)于有最大方差,有次大方差,……,并且,協(xié)方差為:7/1/202136中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束由此可知新的綜合變量(主成分)且
的方差為
,則彼此不相關(guān),并分別稱(chēng)為第一、第二、……、第
個(gè)主成分。由上述求主成分的過(guò)程可知,主成分在幾何圖形中的方向?qū)嶋H上就是
的特征向量的方向,主成分的方差貢獻(xiàn)就等于R的相應(yīng)特征值。這樣,我們?cè)诶脴颖緮?shù)據(jù)求解主成分的過(guò)程實(shí)際上就轉(zhuǎn)化為求相關(guān)陣或協(xié)方差陣的特征值和特征向量的過(guò)程。7/1/202137中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.47/1/202138中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束有關(guān)問(wèn)題的討論§5.4.1關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分§5.4.2主成分分析不要求數(shù)據(jù)來(lái)自于正態(tài)總體§5.4.3主成分分析與重疊信息§5.4.17/1/202139中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分由前面的討論可知求解主成分的過(guò)程實(shí)際就是對(duì)矩陣結(jié)構(gòu)進(jìn)行分析的過(guò)程,也就是求解特征值的過(guò)程。在實(shí)際分析過(guò)程中我們可以從原始數(shù)據(jù)的協(xié)方差矩陣出發(fā),也可以從原始數(shù)據(jù)的相關(guān)矩陣出發(fā),其求主成分的過(guò)程是一致的。但是,從協(xié)方差陣出發(fā)和從相關(guān)陣出發(fā)所求得的主成分一般來(lái)說(shuō)是有差別的,而且這種差別有時(shí)候還很大?!?.4.17/1/202140中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分一般而言,對(duì)于度量單位不同的指標(biāo)或是取值范圍彼此差異非常大的指標(biāo),我們不直接由其協(xié)方差矩陣出發(fā)進(jìn)行主成分分析,而應(yīng)該考慮將數(shù)據(jù)標(biāo)準(zhǔn)化。比如,在對(duì)上市公司的財(cái)務(wù)狀況進(jìn)行分析時(shí),常常會(huì)涉及到利潤(rùn)總額、市盈率、每股凈利率等指標(biāo),其中利潤(rùn)總額取值常常從幾十萬(wàn)到上百萬(wàn),市盈率取值一般從五到六、七十之間,而每股凈利率在1以下,不同指標(biāo)取值范圍相差很大,這時(shí)若是直接從協(xié)方差矩陣入手進(jìn)行主成分分析,明顯利潤(rùn)總額的作用將起到重要支配作用,而其它兩個(gè)指標(biāo)的作用很難在主成分中體現(xiàn)出來(lái),此時(shí)應(yīng)該考慮對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理?!?.4.17/1/202141中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分但是,對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后傾向于各個(gè)指標(biāo)的作用在主成分的構(gòu)成中相等。由上面的例子我們看到,對(duì)于取值范圍相差不大或是度量相同的指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理后,其主成分分析的結(jié)果仍與由協(xié)方差陣出發(fā)求得的結(jié)果有較大區(qū)別。其原因是由于對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的過(guò)程實(shí)際上也就是抹殺原始變量離散程度差異的過(guò)程,標(biāo)準(zhǔn)化后的各變量方差相等均為1,而實(shí)際上方差也是對(duì)數(shù)據(jù)信息的重要概括形式,也就是說(shuō),對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后抹殺了一部分重要信息,因此才使得標(biāo)準(zhǔn)化后各變量在對(duì)主成分構(gòu)成中的作用趨于相等。由此看來(lái),對(duì)同度量或是取值范圍在同量級(jí)的數(shù)據(jù),還是直接從協(xié)方差矩陣求解主成分為宜?!?.4.17/1/202142中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束關(guān)于由協(xié)方差矩陣或相關(guān)矩陣出發(fā)求解主成分對(duì)于從什么出發(fā)求解主成分,現(xiàn)在還沒(méi)有一個(gè)定論,但是我們應(yīng)該看到,不考慮實(shí)際情況就對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理或者直接從原始變量的相關(guān)矩陣出發(fā)求解主成分是有其不足之處的,這一點(diǎn)一定要引起注意。建議在實(shí)際工作中分別從不同角度出發(fā)求解主成分并研究其結(jié)果的差別,看看是否發(fā)生明顯差異且這種差異產(chǎn)生的原因在何處,以確定用哪種結(jié)果更為可信。§5.4.2
主成分分析不要求數(shù)據(jù)來(lái)自于正態(tài)總體7/1/202143中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束由上面的討論可知,無(wú)論是從原始變量協(xié)方差矩陣出發(fā)求解主成分,還
是從相關(guān)矩陣出發(fā)求解主成分,均沒(méi)有涉及到總體分布的問(wèn)題。也就是說(shuō),
與很多多元統(tǒng)計(jì)方法不同,主成分分析不要求數(shù)據(jù)來(lái)自于正態(tài)總體。實(shí)際上,主成分分析就是對(duì)矩陣結(jié)構(gòu)的分析,其中主要用到的技術(shù)是矩陣運(yùn)算的技術(shù)
及矩陣對(duì)角化和矩陣的譜分解技術(shù)。我們知道,對(duì)多元隨機(jī)變量而言,其協(xié)
方差矩陣或是其相關(guān)矩陣均是非負(fù)定的,這樣,我們就可以按照求解主成分
的步驟求出其特征值、標(biāo)準(zhǔn)正交特征向量,進(jìn)而求出主成分,達(dá)到縮減數(shù)據(jù)
維數(shù)的目的。同時(shí),由主成分分析的幾何意義可以看到,對(duì)來(lái)自多元正態(tài)總
體的數(shù)據(jù),我們得到了合理的幾何解釋?zhuān)粗鞒煞志褪前磾?shù)據(jù)離散程度最大
的方向進(jìn)行坐標(biāo)軸旋轉(zhuǎn)。主成分分析的這一特性大大擴(kuò)展了其應(yīng)用范圍,對(duì)多維數(shù)據(jù),只要是涉及降維的處理,我們都可以嘗試用主成分分析,而不用花太多精力考慮其分布情況。§5.4.3主成分分析與重疊信息7/1/202144中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束首先應(yīng)當(dāng)認(rèn)識(shí)到主成分分析方法適用于變量之間存在較強(qiáng)相關(guān)性的數(shù)據(jù),如果原始數(shù)據(jù)相關(guān)性較弱,運(yùn)用主成分分析后不能起到很好的降維作用,即所得的各個(gè)主成分濃縮原始變量信息的能力差別不大。一般認(rèn)為當(dāng)原始數(shù)據(jù)大部分變量的相關(guān)系數(shù)都小于0.3時(shí),運(yùn)用主成分分析不會(huì)取得很好的效果。很多研究工作者在運(yùn)用主成分分析方法時(shí),都或多或少存在著對(duì)主成分分析去除原始變量重疊信息的期望,這樣,在實(shí)際工作中初始就可以把與某一研究問(wèn)題相關(guān)而可能得到的變量(指標(biāo))都納入分析過(guò)程,再用少數(shù)幾個(gè)主成分濃縮這些有用信息(假定已剔除了重疊信息),然后對(duì)主成分進(jìn)行深入分析。在對(duì)待重疊信息方面,生成的新的綜合變量(主成分)是有效剔除了原始變量中的重疊信息,還是僅僅按原來(lái)的模式將原始信息中的絕大部分用幾個(gè)不相關(guān)的新變量表示出來(lái),這一點(diǎn)還值得討論?!?.4.3主成分分析與重疊信息為說(shuō)明這個(gè)問(wèn)題,我們有必要再回顧一下主成分的求解過(guò)程,我們僅就從協(xié)方差矩陣出發(fā)求主成分的過(guò)程予以說(shuō)明,對(duì)相關(guān)陣有類(lèi)似的情況。對(duì)于維指標(biāo)的情況,我們得到其協(xié)方差矩陣如下:現(xiàn)在考慮一種極端情況,即有兩個(gè)指標(biāo)完全相關(guān),不妨設(shè)第一個(gè)指標(biāo)在進(jìn)行主成分分析時(shí)考慮了兩次。則協(xié)方差矩陣變?yōu)椋?/1/202145中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.4.3主成分分析與重疊信息此時(shí)進(jìn)行主成分分析的時(shí)候?qū)嶋H上是由
維矩陣
進(jìn)行。
的行列式的值為零但仍滿(mǎn)足非負(fù)定,只不過(guò)其最小的特征值為0,由而是變?yōu)槌霭l(fā)求解主成分,其方差總和不再是,也就是說(shuō),第一個(gè)指標(biāo)在分析過(guò)程中起到了加倍的作用,其重疊信息完全象其他指標(biāo)提供的信息一樣在起作用。7/1/202146中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束7/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心47目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.4.3主成分分析與重疊信息這樣求得的主成分已經(jīng)與沒(méi)有第一個(gè)指標(biāo)重疊信息時(shí)不一樣了,因?yàn)橹鞒煞址讲畹目偤鸵呀?jīng)變?yōu)?/p>
而不是
,每個(gè)主成分解釋方差的比例也相應(yīng)發(fā)生變化,而整個(gè)分析過(guò)程沒(méi)有對(duì)重疊信息作任何特殊處理。也就是說(shuō),由于對(duì)第一個(gè)指標(biāo)羅列了兩次,其在生成的主成分構(gòu)成中也起到了加倍的作用。這一點(diǎn)是尤其應(yīng)該引起注意的,這意味著主成分分析對(duì)重疊信息的剔除是無(wú)能為力的,同時(shí)主成分分析還損失了一部分信息。對(duì)此文獻(xiàn)[4]舉例進(jìn)行了說(shuō)明。這就告訴我們?cè)趯?shí)際工作中,在選取初始變量進(jìn)入分析時(shí)應(yīng)該小心,對(duì)原始變量存在多重共線(xiàn)性的問(wèn)題,在應(yīng)用主成分分析方法時(shí)一定要慎重。應(yīng)該考慮所選取的初始變量是否合適,是否真實(shí)地反映了事物的本來(lái)面目,如果是出于避免遺漏某些信息而特意選取了過(guò)多的存在重疊信息的變量時(shí),就要特別注意應(yīng)用主成分分析所得到的結(jié)果?!?.4.3主成分分析與重疊信息如果所得到的樣本協(xié)方差矩陣(或是相關(guān)陣)最小的特征值接近于0,那么就有(5.10)進(jìn)而推出(5.11)7/1/202148中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束這就意味著,中心化以后的原始變量之間存在著多重共線(xiàn)性,即原始變量存在著不可忽視的重疊信息。因此,在進(jìn)行主成分分析得出協(xié)方差陣或是相關(guān)陣發(fā)現(xiàn)最小特征根接近于零時(shí),應(yīng)該注意對(duì)主成分的解釋?zhuān)蛘呖紤]對(duì)最初納入分析的指標(biāo)進(jìn)行篩選,由此可以看出,雖然主成分分析不能有效地剔除重疊信息,但它至少可以發(fā)現(xiàn)原始變量是否存在著重疊信息,這對(duì)我們減少分析中的失誤是有幫助的?!?.5
主成分分析步驟及框圖7/1/202149中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.5.1主成分分析步驟§5.5.2主成分分析的邏輯框圖§5.5.17/1/202150中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束主成分分析步驟由上面討論大體上已經(jīng)可以明了進(jìn)行主成分分析的步驟,對(duì)此進(jìn)行歸納如下:根據(jù)研究問(wèn)題選取初始分析變量;根據(jù)初始變量特性判斷由協(xié)方差陣求主成分還是由相關(guān) 陣求主成分;求協(xié)差陣或相關(guān)陣的特征根與相應(yīng)標(biāo)準(zhǔn)特征向量;判斷是否存在明顯的多重共線(xiàn)性,若存在,則回到第一 步;得到主成分的表達(dá)式并確定主成分個(gè)數(shù),選取主成分;結(jié)合主成分對(duì)研究問(wèn)題進(jìn)行分析并深入研究?!?.5.2主成分分析的邏輯框圖特征值標(biāo)準(zhǔn)正交特征向量是否有接近0的情況是其他處理否主成分對(duì)主成分進(jìn)行分析深入分析選擇初始變量度量或取值范圍相同?否對(duì)比(否)分析相關(guān)陣是分析協(xié)方差陣主成分分析的邏輯框圖見(jiàn)圖5-3:7/1/202151中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束§5.6主成分分析的上機(jī)實(shí)現(xiàn)7/1/202152中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束SPSS軟件FACTOR模塊提供了主成分分析的功能。下面先以
SPSS軟件包自帶的數(shù)據(jù)Employee
data.sav為例介紹主成分分析的上機(jī)實(shí)現(xiàn)方法,在SPSS軟件的安裝目錄下可以找到該數(shù)據(jù)集;然后,我們舉一個(gè)實(shí)際的例子介紹主成分分析的具體應(yīng)用?!纠?.1】數(shù)據(jù)集Employee
data為Midwestern銀行在1969-1971年之間雇員情況的數(shù)據(jù),共包括474條觀測(cè)及如下10個(gè)變量:Id(觀測(cè)號(hào))sGender(性別)sBdate(出生日期)s
Educ(受教育程度(年數(shù)))sJobcat(工作種類(lèi))sSalary(目前年薪)sSalbegin(開(kāi)始受聘時(shí)的年薪)sJobtime(受雇時(shí)間(月))sPrevexp(受雇以前的工作時(shí)間(月))sMinority(是否少數(shù)民族)。下面我們用主成分分析方法處理該數(shù)據(jù),以期用少數(shù)變量來(lái)描述該地區(qū)居民的雇傭情況。進(jìn)入SPSS軟件,打開(kāi)數(shù)據(jù)集Employeedata.sav。依次點(diǎn)選Analyze→Data
Reduction→Factor….進(jìn)入FactorAnalysis(因子分析)對(duì)話(huà)框。(在SPSS軟件中,主成分分析與因子分析均在FactorAnalysis模塊中完成。此時(shí),數(shù)據(jù)集Employeedata.sav中的變量名均已顯示在左邊的窗口中,依次選中變量educ、salary、salbegin、jobtime、prevexp并點(diǎn)向右的箭頭按鈕,這五個(gè)變量便進(jìn)入variables窗口(此時(shí)若選中variables窗口中的變量,則窗口左側(cè)的箭頭按鈕即轉(zhuǎn)向左側(cè),點(diǎn)此按鈕即可剔除所選中變量)。點(diǎn)擊右側(cè)的OK按鈕,即可得到如下輸出結(jié)果5-1。7/1/202153中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束輸出結(jié)果5-1(2)輸出結(jié)果5-1(1)7/1/202154中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束輸出結(jié)果5-1(3)7/1/202155中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束其中Communalities給出了該次分析從每個(gè)原始變量中提取的信息,表格下面的注示表明,該次分析是用Factor
analysis模塊默認(rèn)的信息提取方法即主成分分析完成的??梢钥吹匠芙逃潭刃畔p失較大外,主成分幾乎包含了各個(gè)原始變量至少90%的信息。Total
Variance
Explained表則顯示了各主成分解釋原始變量總方差的情況,SPSS默認(rèn)保留特征根大于1的主成分,在本例中看到當(dāng)保留3個(gè)主成分為宜,這3個(gè)主成分集中了原始5個(gè)變量信息的90.66%,可見(jiàn)效果是比較好的。實(shí)際上,主成分解釋總方差的百分比也可以由Communalities表中計(jì)算得出,即(0.896+0.916+0.999+0.968+0.754)/5=90.66%。Component
Matrix表中給出了標(biāo)準(zhǔn)化原始變量用求得的主成分線(xiàn)性表示的近似表達(dá)式,我們以表中Current
Salary一行為例,不妨用
來(lái)表示各個(gè)主成分,則由Component
Matrix表可以得到:標(biāo)準(zhǔn)化的salary7/1/202156中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束在上面的主成分分析中,SPSS默認(rèn)是從相關(guān)陣出發(fā)求解主成分,且默認(rèn)保留特征根大于1的主成分,實(shí)際上,對(duì)主成分的個(gè)數(shù)我們可以自己確定,方法為:進(jìn)入FactorAnalysis對(duì)話(huà)框并選擇好變量之后,點(diǎn)擊Extraction選項(xiàng),在彈出的對(duì)話(huà)框中有一個(gè)Extract選擇框,默認(rèn)是選擇Eigenvaluesover1也就是保留特征根大于1的主成分,我們可以輸入別的數(shù)值來(lái)改變SPSS軟件保留特征根的大??;另外,還可以選擇NumberofFactors選項(xiàng)直接確定主成分的個(gè)數(shù)。在實(shí)際進(jìn)行主成分分析時(shí)可以先按照默認(rèn)設(shè)置做一次主成分,然后根據(jù)輸出結(jié)果確定應(yīng)保留主成分的個(gè)數(shù),用該方法進(jìn)行設(shè)定后重新分析。因?yàn)槲覀兩厦娴慕Y(jié)果是默認(rèn)從相關(guān)陣出發(fā)得到的,而由相關(guān)陣出發(fā)求得的主成分其性質(zhì)有簡(jiǎn)單的表達(dá)形式,我們可以方便地加以驗(yàn)證。7/1/202157中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束由Component
Matrix中的結(jié)果可以得到:=第一主成分的方差,這就驗(yàn)證了性質(zhì)4。又有:這恰好與Communalities表中三個(gè)主成分提取salary變量的信息相等。我們重做一遍主成分分析,此次將5個(gè)主成分全部保留,得到Component
Matrix表如輸出結(jié)果5-2:7/1/202158中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束輸出結(jié)果5-2可以看到前三個(gè)主成分的相應(yīng)結(jié)果與輸出結(jié)果5-1中的對(duì)應(yīng)部分結(jié)果是一致的。對(duì)上表中結(jié)果有如下關(guān)系式:7/1/202159中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束這就驗(yàn)證了性質(zhì)5。由此表還可以得到標(biāo)準(zhǔn)化原始變量用各主成分線(xiàn)性表示的精確的表達(dá)式,以仍以Current
Salary為例,有:標(biāo)準(zhǔn)化的salary7/1/202160中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束7/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心62目錄 上頁(yè)
下頁(yè)
返回
結(jié)束例5.2在企業(yè)經(jīng)濟(jì)效益的評(píng)價(jià)中,設(shè)計(jì)的指標(biāo)往往很多。為了簡(jiǎn)化系統(tǒng)結(jié)構(gòu),抓住經(jīng)濟(jì)效益評(píng)價(jià)中的主要問(wèn)題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。在對(duì)我國(guó)部分省、市、自治區(qū)獨(dú)立核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益評(píng)價(jià)中,涉及到9項(xiàng)指標(biāo),原始數(shù)據(jù)見(jiàn)表5-1,即樣品數(shù)n=28,變量數(shù)p=9。中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束63100元固定100元100元工業(yè)100固定資產(chǎn)資產(chǎn)原值資金實(shí)總產(chǎn)值實(shí)100元銷(xiāo)售收每噸標(biāo)準(zhǔn)煤每千瓦時(shí)電全員勞動(dòng)生100元流動(dòng)原值實(shí)現(xiàn)值實(shí)現(xiàn)利稅現(xiàn)利稅現(xiàn)利稅(入實(shí)現(xiàn)利稅實(shí)現(xiàn)工業(yè)產(chǎn)力實(shí)現(xiàn)工業(yè)產(chǎn)率(元/人資金實(shí)現(xiàn)產(chǎn)(%)(%)(%)%)(%)值(元)產(chǎn)值(元).年)值(元)北京(1
)119
.
2930
.
9829
.
9225
.
9715
.
4821783
.
4121006296
.
7天津(2
)143
.
9831
.
5930
.
2121
.
9412
.
2928524
.
2920254363
.
1河北(3
)94
.
817
.
217
.
9518
.
149
.
3711672
.
0312607322
.
2山西(4
)65
.
811
.
0811
.
0612
.
1516
.
848
.
821
.
6510166284
.
7內(nèi)蒙(5
)54
.
799
.
249
.
5416
.
866
.
278941
.
87564225
.
4遼寧(6
)94
.
5121
.
1222
.
8322
.
3511
.
2814162
.
3613
.
386311
.
7吉林(7
)80
.
4913
.
3613
.
7616
.
67
.
1413062
.
079400274
.
1黑龍江(8
)75
.
8615
.
8216
.
6720
.
8610
.
3712672
.
269830267上海(9
)187
.
7945
.
939
.
7724
.
4415
.
0943464
.
1131246418
.
6江蘇(10
)205
.
9627
.
6522
.
5813
.
427
.
8132024
.
6923377407
.
2浙江(11
)207
.
4633
.
0625
.
7815
.
949
.
2838114
.
1922054385
.
5安徽(12
)110
.
7820
.
720
.
1218
.
696
.
614682
.
2312578341
.
1福建(13
)7/1/2021
122
.
7622
.
5219
.
9318
.
348
.
3522002
.
6312164301
.
2表5-17/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心64江西(14
)94
.
9414
.
714
.
1815
.
496
.
6916692
.
2410463274
.
4山東(15
)117
.
5821
.
9320
.
8918
.
659
.
118202
.
817829331
.
1河南(16
)85
.
9817
.
317
.
1820
.
127
.
6713061
.
8911247276
.
5湖北(17
)103
.
9619
.
518
.
4818
.
779
.
1618292
.
7515745308
.
9湖南(18
)104
.
0321
.
4721
.
2820
.
638
.
7212721
.
9813161309廣東(19
)136
.
4423
.
6420
.
8317
.
337
.
8529593
.
7116259334廣西(20
)100
.
7222
.
0420
.
921
.
889
.
6717322
.
1312441296
.
4四川(21
)84
.
7314
.
3514
.
1716
.
937
.
9613102
.
3411703242
.
5貴州(22
)59
.
0514
.
4814
.
3524
.
538
.
0910681
.
329710206
.
7云南(23
)73
.
7221
.
9122
.
729
.
729
.
3814471
.
9412517295
.
8陜西(24
)78
.
0213
.
1312
.
5716
.
839
.
1917312
.
0811369220
.
3甘肅(25
)59
.
6214
.
0716
.
2423
.
5911
.
349261
.
1313084246
.
8青海(26
)51
.
668
.
328
.
2616
.
117
.
0510551
.
319246176
.
49寧夏(27
)52
.
958
.
258
.
8215
.
576
.
588341
.
1210406245
.
4新疆(28
)60
.
2911
.
2613
.
1418
.
688
.
3910412
.
910983266目錄 上頁(yè)
下頁(yè)
返回
結(jié)束續(xù)表5-27/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心65目錄 上頁(yè)
下頁(yè)
返回
結(jié)束0
.
4235231
.
3384051
.
5902821
.
6875562
.
2396340
.
4819710
.
9547461
.
2603710
.
0488050
.
9951991
.
4096491
.
6314530
.
6672281
.
0658731
.
1887581
.
8553941
.
1338441
.
200166-
0
.
14352-
0
.
271-
0
.
10906-
0
.
29487-
0
.
00854-
0
.
57821-
0
.
45763-
0
.
152790
.
49097-
0
.
81499-
0
.
98577-
1
.
08721-
1
.
811432
.
740046-
1
.
79273-
0
.
84655-
0
.
56349-
0
.
15927-
1
.
06992-
1
.
20067-
1
.
303-
0
.
61894-
1
.
14919-
0
.
86449-
0
.
69303-
1
.
00129-
1
.
18752-
0
.
150240
.
1868270
.
5837370
.
7710330
.
694243-
0
.
3171-
0
.
11989-
2
.
27170
.
308902-
0
.
47486-
0
.
71949-
0
.
7039-
0
.
68477-
0
.
82907-
0
.
43245-
0
.
4167-
0
.
69238-
0
.
34307-
0
.
58206-
0
.
43218-
0
.
290780
.
393790
.
359408-
0
.
47334-
0
.
22224-
0
.
62003-
0
.
466192
.
0095833
.
0809562
.
9886561
.
3001862
.
0961332
.
7554331
.
6711712
.
9832842
.
1625242
.
4302940
.
9494850
.
548246-
1
.
48989-
0
.
582541
.
5557832
.
264781
.
6592991
.
9648512
.
4650251
.
5813351
.
002539-
0
.
85187-
0
.
041662
.
1944081
.
7530481
.
43671
.
5885780
.
2264810
.
1377740
.
199007-
0
.
15562-
1
.
02776-
0
.
26257-
0
.
25294-
0
.
157670
.
8186910
.
5038680
.
3503370
.
172033-
0
.
24423-
0
.
383850
.
5050410
.
156444-
0
.
227320
.
126834-
0
.
14028-
0
.
56298-
0
.
64428-
0
.
9658-
0
.
99465-
0
.
05179-
0
.
24271-
0
.
51352-
0
.
337870
.
3839290
.
2814290
.
308322-
0
.
16574-
0
.
107890
.
1065570
.
3304330
.
725830
.
645294標(biāo)準(zhǔn)化數(shù)據(jù)表7/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心66目錄 上頁(yè)
下頁(yè)
返回
結(jié)束-
0
.
34774-
0
.
25932-
0
.
218380
.
206435-
0
.
63406-
0
.
43245-
0
.
60092-
0
.
38161-
0
.
301460
.
068569-
0
.
00238-
0
.
03382-
0
.
13536-
0
.
085810
.
1159940
.
279260
.
375190
.
2603510
.
070190
.
2277050
.
3636890
.
335558-
0
.
24771-
0
.
4681-
0
.
50881-
0
.
059580
.
2620850
.
8206170
.
4811450
.
299804-
0
.
49995-
0
.
567831
.
3009631
.
2617850
.
4616730
.
695579-
0
.
006450
.
2942770
.
3097410
.
6520370
.
1018430
.
014276-
0
.
35529-
0
.
180720
.
043603-
0
.
37669-
0
.
60386-
0
.
6457-
0
.
60122-
0
.
52735-
0
.
42825-
0
.
14036-
0
.
30489-
0
.
89101-
0
.
97128-
0
.
58868-
0
.
620141
.
322972-
0
.
47952-
0
.
68202-
1
.
18429-
0
.
64022-
1
.
51177-
0
.
631610
.
2790930
.
5652822
.
636993-
0
.
00486-
0
.
28459-
0
.
54975-
0
.
167930
.
033199-
0
.
53205-
0
.
74635-
0
.
87284-
0
.
62654-
0
.
074770
.
013227-
0
.
40646-
0
.
36109-
1
.
27595-
0
.
95809-
0
.
63656-
0
.
351821
.
084980
.
71632-
0
.
83093-
1
.
37875-
0
.
07253-
0
.
81645-
1
.
14239-
1
.
30812-
1
.
48472-
0
.
80883-
0
.
86219-
0
.
69566-
1
.
19453-
0
.
71829-
2
.
03561-
1
.
11252-
1
.
3163-
1
.
40522-
0
.
94555-
1
.
03512-
0
.
92741-
1
.
38899-
0
.
52311-
0
.
84073-
0
.
94257-
0
.
96475-
0
.
79192-
0
.
15815-
0
.
36913-
0
.
710340
.
432779-
0
.
42603-
0
.
483537/1/206721
中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)返回結(jié)束將表數(shù)據(jù)導(dǎo)入spss軟件,依次點(diǎn)選Analyze-Data
Reduction-Factor進(jìn)入Factor
Analysis對(duì)話(huà)框。(在spss中,主成分分析因子分析均在Factor
Analysis模塊中完成。)如圖5-4所示:圖5-4此時(shí),數(shù)據(jù)集5-5.sav中的變量名均顯示在對(duì)話(huà)框左邊的窗口中,選擇變量x1,x2,x3,x4,x5,x6,x7,x8,x9進(jìn)入
variables窗口中,操作如圖5-5所示:圖5-57/1/202168中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束圖5-5點(diǎn)擊descriptives按鈕,在彈出的對(duì)話(huà)框中,在correlationmatrix中選擇coefficients?;氐皆瓕?duì)話(huà)框點(diǎn)擊右側(cè)的Ok,即可得到輸出結(jié)果5-4和輸出結(jié)果5-5。7/1/202169中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束輸出結(jié)果5-47/1/202170中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心目錄 上頁(yè)
下頁(yè)
返回
結(jié)束7/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心71目錄 上頁(yè)
下頁(yè)
返回
結(jié)束輸出結(jié)果5-5由輸出結(jié)果5-4看到,前面2個(gè)主成分 、的方差和占全部方差的比例為84.7%。我們就選取為第一主成分,為第二主成分,且這兩個(gè)主成分之方差和占全部方差的84.7%,即基本上保留了原來(lái)標(biāo)的信息,這樣由原來(lái)的9個(gè)指標(biāo)轉(zhuǎn)化為2個(gè)新指標(biāo),起到了降維的作用。7/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心72目錄 上頁(yè)
下頁(yè)
返回
結(jié)束Spss軟件得到主成分系數(shù)矩陣如下:(5.12)5.35.5.2由圖5-4可看出,分布在第一象限的是上海、北京、天津、廣西這4個(gè)省,這四個(gè)省、市、自治區(qū)的經(jīng)濟(jì)效益在全國(guó)來(lái)說(shuō)屬于比較好的,其中上海的經(jīng)濟(jì)效益最好。分布在第四象限的江蘇、浙江、安徽、福建、山東、湖北、廣東七個(gè)省、市、自治區(qū)。因?yàn)榈谒南笙薜闹饕卣魇堑谝恢鞒煞?,第一主成分占信息總量的比重最大,所以這七個(gè)省的經(jīng)濟(jì)效益也算比較好。分布在第二象限和第三象限的地區(qū)可屬同一類(lèi),經(jīng)濟(jì)效益較差。7/1/2021中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心76目錄 上頁(yè)
下頁(yè)
返回
結(jié)束例5.3
全國(guó)重點(diǎn)水泥企業(yè)經(jīng)濟(jì)效益綜合評(píng)價(jià)例。利用主成分綜合評(píng)價(jià)全國(guó)重點(diǎn)水泥企業(yè)的經(jīng)濟(jì)效益。原始數(shù)據(jù)(數(shù)據(jù)來(lái)自1984年中國(guó)統(tǒng)計(jì)年鑒)見(jiàn)表5-5。中國(guó)人民大學(xué)六西格瑪質(zhì)量管理研究中心77目錄 上頁(yè)
下頁(yè)
返回
結(jié)束廠(chǎng)家編號(hào)及指標(biāo)固定資產(chǎn)利稅率資金利稅率銷(xiāo)售收入利稅率資金利潤(rùn)率固定資產(chǎn)產(chǎn)值率流動(dòng)資金周轉(zhuǎn)天數(shù)萬(wàn)元產(chǎn)值能耗全員勞動(dòng)生產(chǎn)率1琉璃河16
.6826
.7531
.8418
.453
.255528
.831
.752邯鄲19
.727
.5632
.9419
.259
.825532
.922
.873大同15
.223
.432
.9816
.2446
.786541
.691
.534哈爾濱7
.298
.9721
.34
.7634
.396239
.281
.635華新29
.4556
.4940
.7443
.6875
.326926
.682
.146湘鄉(xiāng)32
.9342
.7847
.9833
.8766
.465032
.872
.67柳州25
.3937
.8236
.7627
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 稅務(wù)培訓(xùn)與技能提升
- 桑拿會(huì)所前臺(tái)服務(wù)心得
- 餐具行業(yè)設(shè)計(jì)理念培訓(xùn)體會(huì)
- 園林綠化單位衛(wèi)生整治方案
- 2024年認(rèn)識(shí)電的教案6篇
- 2024年秋天的懷念教案(15篇)
- 《民族國(guó)家的興起》課件
- 農(nóng)村自建房貼瓷磚合同(2篇)
- 中國(guó)液晶材料行業(yè)市場(chǎng)全景評(píng)估及投資方向研究報(bào)告
- 2025有關(guān)寫(xiě)樹(shù)木買(mǎi)賣(mài)合同范本
- 【MOOC】工程材料學(xué)-華中科技大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 銀行貸款保證合同范本
- 《汽車(chē)膠粘劑》課件
- 手繪pop教學(xué)課件
- 2024腦血管病指南
- 2022年海南公務(wù)員考試申論試題(B卷)
- 企業(yè)三年?duì)I銷(xiāo)規(guī)劃
- 教師資格考試高中歷史面試試題及解答參考
- 2024年社區(qū)工作者考試試題庫(kù)
- 工廠(chǎng)設(shè)備工程師年終總結(jié)
- 福建省廈門(mén)市2024-2025學(xué)年新人教版九年級(jí)語(yǔ)文上學(xué)期期末質(zhì)量檢測(cè)試題
評(píng)論
0/150
提交評(píng)論