樣本的主成分應(yīng)用例子_第1頁
樣本的主成分應(yīng)用例子_第2頁
樣本的主成分應(yīng)用例子_第3頁
樣本的主成分應(yīng)用例子_第4頁
樣本的主成分應(yīng)用例子_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第七章§7.2樣本的主成分

應(yīng)用例子7.2.1

例7.2.1

學(xué)生身體各指標的主成分分析.

隨機抽取30名某年級中學(xué)生,測量其身高(X1)、體重(X2)、胸圍(X3)和坐高(X4),數(shù)據(jù)見書中P277表7.4(或以下SAS程序的數(shù)據(jù)行).試對中學(xué)生身體指標數(shù)據(jù)做主成分分析.

(1)以下SAS程序首先生成包括30名學(xué)生身體指標數(shù)據(jù)的SAS數(shù)據(jù)集d721(其中變量NUMBER記錄識別學(xué)生的序號),然后調(diào)用SAS/STA軟件中的PRINCOMP過程進行主成分分析.2第七章§7.2樣本的主成分

例7.2.1的輸出結(jié)果

學(xué)生身體指標數(shù)據(jù)的描述統(tǒng)計量和相關(guān)陣3第七章§7.2樣本的主成分

例7.2.1的輸出結(jié)果

輸出7.2.1相關(guān)陣的特征值和特征向量4第七章§7.2樣本的主成分

例7.2.1的結(jié)果分析

PRINCOMP過程由相關(guān)陣出發(fā)進行主成分分析.由輸出7.2.1中相關(guān)陣的特征值可以看出,第一主成分的貢獻率已高達88.53%;且前二個主成分的累計貢獻率已達96.36%.因此只須用兩個主成分就能很好地概括這組數(shù)據(jù).

另由第三和四個特征值近似為0,可以得出這4個標準化后的身體指標變量(Xi*,i=1,2,3,4)有近似的線性關(guān)系(即所謂共線性),如

0.505747X1*

-0.690844X2*

+0.461488X3*-0.232343X4*≈c(常數(shù)).5第七章§7.2樣本的主成分

例7.2.1的結(jié)果分析

由最大的兩個特征值對應(yīng)的特征向量可以寫出第一和第二主成分:

Z1=0.4970X1*+0.5146X2*+0.4809X3*+0.5069X4*

Z2=-0.5432X1*+0.2102X2*

+0.7246X3*-0.3683X4*

第一和第二主成分都是標準化后變量Xi*(i=1,2,3,4)的線性組合,且組合系數(shù)就是特征向量的分量.6第七章§7.2樣本的主成分

例7.2.1的結(jié)果分析

利用特征向量各分量的值可以對各主成分進行解釋.

第一大特征值對應(yīng)的第一個特征向量的各個分量值均在0.5附近,且都是正值,它反映學(xué)生身材的魁梧程度.身體高大的學(xué)生,他的4個部位的尺寸都比較大;而身體矮小的學(xué)生,他的4個部位的尺寸都比較小.因此我們稱第一主成分為大小因子.7第七章§7.2樣本的主成分

例7.2.1的結(jié)果分析

第二大特征值對應(yīng)的特征向量中第一(即身高X1的系數(shù))和第四個分量(即坐高X4的系數(shù))為負值,而第二(即體重X2的系數(shù))和第三個分量(即胸圍X3的系數(shù))為正值,它反映學(xué)生的胖瘦情況,故稱第二主成分為胖瘦因子.

8第七章§7.2樣本的主成分

例7.2.1的輸出結(jié)果

輸出7.2.2第二主成分得分對第一主成分得分的散布圖9第七章§7.2樣本的主成分

例7.2.1的結(jié)果分析

輸出7.2.2是PLOT過程產(chǎn)生的輸出圖形,從圖中可以直觀地看出,按學(xué)生的身體指標尺寸,這30名學(xué)生大約應(yīng)分成三組(以第一主成分得分值為-1和2為分界點).

每一組包括哪幾名學(xué)生由每個散點旁邊的序號可以得知.更詳細的信息可從PRINT過程產(chǎn)生的輸出數(shù)據(jù)列表中得到.

10第七章§7.2樣本的主成分

例7.2.1的輸出結(jié)果

按第一主成分得分排序后的主成分得分和原始數(shù)據(jù)11第七章§7.2樣本的主成分

例7.2.1的結(jié)果分析

以上輸出列表中把30個觀測按第一主成分從小到大重新排序后的輸出結(jié)果.從這里可以得到分為三組時各組學(xué)生的更多的信息如下:G1={11,15,29,10,28,6,24,14,2,27,18}G2={4,30,22,1,16,26,23,21,8,9,7,17}G3={20,13,19,12,5,3,25}

若考慮用Z1,Z2進行聚類,這就是主成分聚類方法.12第七章§7.3主成分分析的應(yīng)用

主成分分析方法把p維數(shù)據(jù)簡化為m(m

p)維數(shù)據(jù)后,進一步地可用于變量的分類,樣品的分類,對樣品進行排序或?qū)ο到y(tǒng)進行評估,以及主成分回歸,主成分聚類,多維正態(tài)數(shù)據(jù)的主成分檢驗等方面。13第七章§7.3主成分分析的應(yīng)用

指標(變量)分類

考察m維空間的p個點Qi,其坐標為

Qi=(

i1,

i2,...,

im)(i=1,2,…,p).按距離最近準則對p個點進行分類.

當(dāng)m=2時,p個點可在平面上點出來,利用散布圖可直觀地給出指標的分類.14第七章§7.3主成分分析的應(yīng)用

指標(變量)分類---例子7.3.1

例7.3.1

服裝定型分類問題

為解決服裝定型分類問題,對128個成年男子的身材進行測量,每人各測得16項指標:身高(X1)、坐高(X2)、胸圍(X3)、頭高(X4)、褲長(X5)、下檔(X6)、手長(X7)、領(lǐng)圍(X8)、前胸(X9)、后背(X10)、肩厚(X11)、肩寬(X12)、袖長(X13)、肋圍(X14)、腰圍(X15)和腿肚(X16).16項指標的相關(guān)陣R見表7.5(因相關(guān)陣為對稱陣,只給出相關(guān)陣的上三角部分).試從相關(guān)陣R出發(fā)用PRINCOMP過程進行主成分分.15第七章§7.3主成分分析的應(yīng)用

指標(變量)分類---例子7.3.1

16第七章§7.3主成分分析的應(yīng)用

指標(變量)分類---例子7.3.1的輸出結(jié)果

17第七章§7.3主成分分析的應(yīng)用

指標(變量)分類---例子7.3.1的輸出結(jié)果

18第七章§7.3主成分分析的應(yīng)用

指標(變量)分類---例子7.3.1的結(jié)果分析

1.前三個主成分說明的方差比例已在70%以上;2.由最大特征值對應(yīng)的特征向量(即列標題為

PRIN1的列)可得出第一主成分:

PRINT1=0.3446X1+0.2662X2+…+0.1634X16各指標的系數(shù)都為正,數(shù)值均在0.1至0.3之間.這個主成分一般稱為魁梧因子(或大小因子);3.由次大特征值對應(yīng)的特征向量(即列標題為

PRIN2的列)可得出第二主成分:

PRINT2=-0.1968X1-0.1473X2+0.3137X3+…+0.3599X1619第七章§7.3主成分分析的應(yīng)用

指標(變量)分類---例子7.3.1的結(jié)果分析

各指標的系數(shù)有正有負,負系數(shù)對應(yīng)的變量

(X1,X2等)都是反映人體高低的變量;正系數(shù)對應(yīng)的變量(X3,X1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論