




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第十章典型相關(guān)分析Canonical Correlation Analysis 1. 兩個隨機變量Y與X 簡單相關(guān)系數(shù)2. 一個隨機變量Y與一組隨機變量X1,X2, Xp 多重相關(guān)(復(fù)相關(guān)系數(shù))3. 一組隨機變量Y1,Y2,Yq與另一組隨機變量X1,X2,Xp 典型相關(guān)系數(shù)何時采用典型相關(guān)分析 典型相關(guān)是簡單相關(guān)、多重相關(guān)的推廣;或者說簡單相關(guān)系數(shù)、復(fù)相關(guān)系數(shù)是典型相關(guān)系數(shù)的特例。 典型相關(guān)是研究兩組變量之間相關(guān)性的一種統(tǒng)計分析方法.也是一種降維技術(shù). 由Hotelling (1935, 1936)最早提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)
2、和 Mardia, Kent, and Bibby (1979) 推動了它的應(yīng)用。 什么是典型相關(guān)分析?典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計分析方法它借用主成分分析降維的思想,分別對兩組變量提取主成分,且使兩組變量提取的主成分之間的相關(guān)程度達(dá)到最大,而從同一組內(nèi)部提取的各主成分之間互不相關(guān),用從兩組之間分別提取的主成分的相關(guān)性來描述兩組變量整體的線性相關(guān)關(guān)系典型相關(guān)關(guān)系研究兩組變量之間整體的線性相關(guān)關(guān)系,它是將每一組變量作為一個整體來進(jìn)行研究而不是分析每一組變量內(nèi)部的各個變量所研究的兩組變量可以是一組為自變量,而另一組變量為因變量;兩組變量也可以是同等的地位,但典型相關(guān)關(guān)系要求
3、兩組變量都至少是間隔尺度 通常情況下,為了研究兩組變量 的相關(guān)關(guān)系,可以用最原始的方法,分別計算兩組變量之間的全部相關(guān)系數(shù),一共有pq個簡單相關(guān)系數(shù),這樣又煩瑣又不能抓住問題的本質(zhì)。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個線性組合,討論線性組合之間的相關(guān)關(guān)系,則更簡捷。 在解決實際問題中,這種方法有廣泛的應(yīng)用。如,在工廠里常常要研究產(chǎn)品的q個質(zhì)量指標(biāo) 和p個原材料的指標(biāo) 之間的相關(guān)關(guān)系;也可以是采用典型相關(guān)分析來解決的問題。如果能夠采用類似于主成分的思想,分別找出兩組變量的線性組合既可以使變量個數(shù)簡化,又可以達(dá)到分析相關(guān)性的目的。例 家庭特征與家庭消費之間的關(guān)系 為了了解家
4、庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣Y2Y3Y1X2X1 典型相關(guān)分析的思想: 首先分別在每組變量中找出第一對線性組合,使其具有最大相關(guān)性, 然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對本身具有次大的相關(guān)性。 V2和W2與V1和W1相互獨立,但V2和
5、W2相關(guān).如此繼續(xù)下去,直至進(jìn)行到 r 步,兩組變量的相關(guān)性被提取完為止. R min(p,q),可以得到 r 組變量.典型相關(guān)的數(shù)學(xué)描述 一般地,假設(shè)有一組變量X1,Xp與Y1,Yq ,我們要研究這兩組變量的相關(guān)關(guān)系,如何給兩組變量之間的相關(guān)性以數(shù)量的描述? 當(dāng) p=q=1 時,就是研究兩個變量 X 與 Y 之間的相關(guān)關(guān)系.相關(guān)系數(shù)就是最常見的度量,其定義為 當(dāng) p1 , q=1(或 q1, p=1) 時, p維隨機向量設(shè) 則稱為Y與X1,Xp的全相關(guān)系數(shù),全相關(guān)系數(shù)用于度量一個隨機變量Y與一組隨機向量X1,Xp的相關(guān)關(guān)系. 當(dāng) p , q 1時, 利用主成分分析的思想,可以把多個變量與多個
6、變量之間的相關(guān)化為兩個新的綜合變量之間的相關(guān).也就是 求 和 ,使得新的綜合變量和之間有最大可能的相關(guān),基于這個思想就產(chǎn)生了典型相關(guān)分析.10.1 總體典型相關(guān)設(shè) 及 為隨機向量,我們用X 和 Y 的線性組合 和 之間的相關(guān)性來研究兩組隨機變量X 和 Y 之間的相關(guān)性.我們希望找到 和 ,使 最大.由相關(guān)系數(shù)的定義易得出對任意的常數(shù) e , f , c 和 d ,均有這說明使得相關(guān)系數(shù)最大的 并不唯一.故求綜合變量常限定 , .于是有以下定義.定義10.1.1 設(shè) p+q 維隨機向量 的均值向量為0,協(xié)方差陣 0(不妨設(shè)pq).如果存在 和 使得則稱 是X,Y的第一組(對)典型相關(guān)變量,它們之
7、間的相關(guān)系數(shù)稱為第一個典型相關(guān)系數(shù).則稱 是X,Y的第 k 組(對)典型相關(guān)變量,它們之間的相關(guān)系數(shù)稱為第 k 個典型相關(guān)系數(shù) (k=2,p).如果存在使得典型相關(guān)變量的解法設(shè)隨機向量其中 (不妨設(shè)pq);E(Z)=0;以及D(Z)= =1. 第一對典型相關(guān)變量的求法令 則 V , W 的相關(guān)系數(shù)求第一對典型相關(guān)變量就等價于求 和使用拉格朗日乘子法,令(其中1和2為拉格朗日乘子)為求 的極大值,對上式分別關(guān)于 , 求偏導(dǎo),并令其為零,得(10.1.1)再分別用 左乘方程(10.1.1)def得則方程組(10.1.1)等價于(10.1.2)則方程組(10.1.2)有非零解的充要條件是(10.1.
8、3)該方程的左端是 的p+q次多項式.求解 的高次方程(10.1.3),把求得的最大的 代回方程組(10.1.2),再求得 和 ,從而得出第一對典型相關(guān)變量. 具體計算時,因的高次方程(10.1.3)不易解;將其代入方程組(10.1.2)后還需求解(p+q)階方程.為了計算上的簡便,常作以下變換:用1222-1左乘方程組(10.1.2)的第二項,得()將上()式代入方程組(10.1.2)得第一式得:即再用11-1左乘上式得: 的特征根是 ,相應(yīng)的特征向量為將 左乘(10.1.2)的第一式,并將第二式代入,得()再用22-1左乘()式得: 的特征根是 ,相應(yīng)的特征向量為故求解方程(10.1.3)
9、等價于求解方程組(10.1.4):(10.1.4)由于110,220,故 11-1 0 , 22-1 0. 結(jié)論: 2既是M1又是M2的特征根,和是相應(yīng)于M1和M2的特征向量。 至此,典型相關(guān)分析轉(zhuǎn)化為求M1和M2特征根和特征向量的問題。 第一對典型變量提取了原始變量X與Y之間相關(guān)的主要部分,如果這部分還不能足以解釋原始變量,可以在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù)。 在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù).設(shè)第二對典型變量為:求第二對典型相關(guān)變量就等價于求2和2,使2. 典型相關(guān)變量的一般求法定理10.1.1 設(shè) (不妨設(shè)pq);E(Z)=0,D(Z)= =
10、,其中記并設(shè) p 階方陣 的特征值依次為而l1,lp為相應(yīng)的單位正交特征向量.令為X 和Y 的第 k 對典型相關(guān)變量.k為第k個典型相關(guān)系數(shù).例 家庭特征與家庭消費之間的關(guān)系 為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣典型相關(guān)分析典型相關(guān)系數(shù)調(diào)整典型相關(guān)系數(shù)近似方差典型相關(guān)系數(shù)的平方
11、10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X組典型變量的系數(shù)V1V2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)W1W2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956典型變量的性質(zhì)1、同一組的典型變量之間互不相關(guān)因為特征向量之間是正交的.故X組的典型變量之間是相互獨立的:Y組的典型變量之間是相互獨立的:2、不同組的典型變量之間相關(guān)性不同組內(nèi)一對典型變量之間的相關(guān)系數(shù)為同對則協(xié)方差為 ,不同對則為
12、零。3、 Vi , Wi 的均值為0,方差為1.例 家庭特征與家庭消費之間的關(guān)系 為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣典型相關(guān)分析典型相關(guān)系數(shù)調(diào)整典型相關(guān)系數(shù)近似方差典型相關(guān)系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.186
13、6380.0096510.034919X組典型變量的系數(shù)V1V2X1(就餐)0.7689-1.4787X2(電影)0.27211.6443Y組典型變量的系數(shù)W1W2Y1(年齡)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956典型變量的結(jié)構(gòu)(相關(guān)系數(shù))V1V2X10.9866-0.1632X20.88720.4614W1W2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型變量的結(jié)構(gòu)(相關(guān)系數(shù))W1W2X10.6787-0.0305X20.61040.0862V1V2Y10.28970.1582Y20.67
14、57-0.0206Y30.35390.0563 兩個反映消費的指標(biāo)與第一對典型變量中V1的相關(guān)系數(shù)分別為0.9866和0.8872,可以看出V1可以作為消費特性的指標(biāo),第一對典型變量中V1與Y2之間的相關(guān)系數(shù)為0.9822,可見典型變量V1主要代表了了家庭收入, V1和 W1的相關(guān)系數(shù)為0.6879,這就說明家庭的消費與一個家庭的收入之間其關(guān)系是很密切的; 第二對典型變量中V2與X2的相關(guān)系數(shù)為0.4614,可以看出V2可以作為文化消費特性的指標(biāo),第二對典型變量中W2與Y1和Y3之間的分別相關(guān)系數(shù)為0.8464和0.3013,可見典型變量W2主要代表了家庭成員的年齡特征和教育程度, V2和 W
15、2的相關(guān)系數(shù)為0.1869,說明文化消費與年齡和受教育程度之間的有關(guān)。求解典型相關(guān)系數(shù)的步驟求X,Y 變量組的相關(guān)陣R=求矩陣A、B 可以證明A、B有相同的非零特征根3. 求A或B的i (相關(guān)平方)與Cov(Vi,Wi),i1,m4. 求A、B關(guān)于i的特征根向量即變量系數(shù)典型相關(guān)系數(shù)計算實例已知X、Y 的相關(guān)陣R=試求X、Y 的典型相關(guān)變量和典型相關(guān)系數(shù).Cov(X)R11Cov(Y)R22Cov(Y,X)R21Cov(X,Y)R121. 求矩陣A、BA(66)矩陣0.5298 0.4586 0.3053 0.3986 -0.2919 -0.1778 -0.0912 -0.0701 -0.16
16、69 -0.1939 -0.0007 -0.0168 0.2274 0.2739 0.5489 0.0840 0.5238 0.4468 0.0966 0.0376 0.0510 0.3877 -0.2523 -0.1759 -0.0915 -0.0979 -0.0669 -0.0377 0.0061 -0.0806 0.0949 0.1421 0.1757 -0.0210 0.2171 0.3142 B(55)矩陣0.2611 -0.0560 -0.0337 -0.0551 -0.0312 -0.0053 0.5572 0.1009 0.0034 -0.0543 -0.0632 -0.084
17、3 0.0859 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 0.1490 -0.1052 0.1390 0.3531 0.2912 0.5573 2. 求矩陣A、B的(相關(guān)系數(shù)的平方)A、B有相同的非零特征值B矩陣求(典型相關(guān)系數(shù)的平方)0.2611-0.0560 -0.0337 -0.0551 -0.0312 -0.0053 0.5572- 0.1009 0.0034 -0.0543 -0.0632 -0.0843 0.0859 - 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 - 0.1490 -0.1
18、052 0.1390 0.3531 0.2912 0.5573 - 5個與典型相關(guān)系數(shù)1 0.76432 0.5436 3 0.2611 40.1256 50.0220 3. 求A、B關(guān)于i的變量系數(shù)(求解第1典型變量系數(shù))求解第2典型變量系數(shù)求解第5典型變量系數(shù) 5組(標(biāo)準(zhǔn)化)典型變量系數(shù)(X)V1V2V3V4V5X10.5852 -1.1443 0.7823 0.0352 -0.8298 X2-0.2175 0.0189 0.6032 0.1289 1.5590 X30.5288 1.6213 -0.7370 -0.4066 -1.1704 X40.1890 -0.9874 -0.7753
19、 0.1229 0.6988 X5-0.1193 -0.0626 -0.2509 -0.5860 1.0488 X60.1948 0.8108 0.1467 0.9523 -0.5140 5組(標(biāo)準(zhǔn)化)典型變量系數(shù)(X)由標(biāo)準(zhǔn)化典型變量系數(shù)獲得原變量X對應(yīng)的粗典型變量系數(shù)粗典型變量系數(shù)可由標(biāo)準(zhǔn)典型變量系數(shù)與相應(yīng)的標(biāo)準(zhǔn)差之比獲得。5組(標(biāo)準(zhǔn)化)典型變量系數(shù)(Y)W1W2W3W4W5Y1-0.0838 -0.1325 1.0807 0.3750 -0.0376 Y2-0.0878 1.2688 0.0701 0.2476 -0.3342 Y30.2147 -0.3301 0.2218 -1.086
20、3 1.4100 Y40.2920 -0.2392 -0.5765 1.3368 -0.2942 Y50.7607 -0.2995 0.6532 -0.0017 -0.6905 典型相關(guān)系數(shù)的特點 兩變量組的變量單位改變,典型相關(guān)系數(shù)不變,但典型變量系數(shù)改變 (無論原變量標(biāo)準(zhǔn)化與否,獲得的典型相關(guān)系數(shù)不變).第一對典則相關(guān)系數(shù)較兩組變量間任一個簡單相關(guān)系數(shù)或復(fù)相關(guān)系數(shù)之絕對值都大,即R1max(|Cov(Xi,Yj)|) 或 R1max(|Cov(X,Yj)|) , R1max(|Cov(Xi,Y)|)10.2 樣本典型相關(guān)系數(shù) 在實際應(yīng)用中,總體的協(xié)方差矩陣常常是未知的,類似于其他的統(tǒng)計分析
21、方法,需要從總體中抽出一個樣本,根據(jù)樣本對總體的協(xié)方差或相關(guān)系數(shù)矩陣進(jìn)行估計,然后利用估計得到的協(xié)方差或相關(guān)系數(shù)矩陣進(jìn)行分析.由于估計中抽樣誤差的存在,所以估計以后還需要進(jìn)行有關(guān)的假設(shè)檢驗.已知總體 Z 的 n 次觀測數(shù)據(jù)為:于是樣本數(shù)據(jù)陣為若假定ZNp+q( , ),則協(xié)方差陣 的最大似然估計為其中令 S矩陣也稱為樣本協(xié)方差陣.設(shè) ,11為p階矩陣.將S相應(yīng)剖分為顯然,Sij(i,j=1,2)是ij的無偏估計.下面我們將從樣本協(xié)方差陣S出發(fā),來討論兩組變量間的相關(guān)關(guān)系.一、樣本典型相關(guān)變量和典型相關(guān)系數(shù)計算 S 的特征根和特征向量 求M1和 M2的特征根 ,對應(yīng)的特征向量 .則特征向量構(gòu)成典
22、型變量的系數(shù),特征根為典型變量相關(guān)系數(shù)的平方,二、典型相關(guān)系數(shù)的顯著性檢驗全部總體典型相關(guān)系數(shù)均為0部分總體典型相關(guān)系數(shù)為0 典型相關(guān)分析是否恰當(dāng),應(yīng)該取決于兩組原變量之間是否相關(guān),如果兩組變量之間毫無相關(guān)性而言,則不應(yīng)該作典型相關(guān)分析.用樣本來估計總體的典型相關(guān)系數(shù)是否有誤,需要進(jìn)行檢驗.(一) 整體檢驗檢驗的統(tǒng)計量:(似然比統(tǒng)計量)所以,兩邊同時求行列式,有事實上 由于 所以若M的特征根為 ,則(I-M)的特征根為(1-).根據(jù)矩陣行列式與特征根的關(guān)系,可得:在原假設(shè)為真的情況下,檢驗的統(tǒng)計量 近似服從自由度為pq的2分布.在給定的顯著性水平下,如果22 (pq),則拒絕原假設(shè),認(rèn)為至少有
23、一對典型變量之間的相關(guān)性顯著.(二)部分總體典型相關(guān)系數(shù)為零的檢驗 當(dāng)否定H0時,表明X,Y相關(guān),進(jìn)而可得出至少第一個相關(guān)系數(shù)10,相應(yīng)的第一對典型相關(guān)變量V1,W1可能已經(jīng)提取了兩組變量相關(guān)關(guān)系的絕大部分信息.兩組變量余下的部分可認(rèn)為不相關(guān),這時k0(k=2,p).因此在否定H0后,有必要再檢驗H0(k):k=0(k=2,p),即第k個及以后的所有典型相關(guān)系數(shù)均為0(k=2,3,p).檢驗的統(tǒng)計量 近似服從自由度為(p-k+1)(q-k+1)的2分布.在給定的顯著性水平下,如果22 (p-k+1)(q-k+1),則拒絕原假設(shè)H0(k),即第k個典型相關(guān)系數(shù)顯著的不等于0.否則認(rèn)為k=0.對H
24、0(k) 從k=2開始逐個檢驗,知道某個k0,使 相容時為止.這時說明第k0個及以后的所有典型相關(guān)系數(shù)均為0 .(三)樣本典型變量的得分值 假設(shè)經(jīng)檢驗,有r(rp)個典型相關(guān)系數(shù)顯著不等于0 ,這時可得 r 對典型相關(guān)變量(Vi , Wi)(i=1,r).將樣品代入第 i 對典型變量中,令稱(vti,wti)為第i個樣品Z(t)的第i對樣本典型變量的得分值.與原變量間的相關(guān)程度和典型變量系數(shù)有關(guān).典型變量與原變量的親疏關(guān)系 原變量與自已的典型變量、 原變量與對方的典型變量之 間的相關(guān)系數(shù). 1985年中國28 省市城市男生(1922歲)的調(diào)查數(shù)據(jù)。記形態(tài)指標(biāo):身高(cm)、坐高、體重(kg)、
25、胸圍、肩寬、盆骨寬分別為X1,X2,X6;機能指標(biāo):脈搏(次/分)、收縮壓(mmHg) 、舒張壓(變音)、舒張壓(消音)、肺活量(ml)分別為Y1,Y2,Y5?,F(xiàn)欲研究這兩組變量之間的相關(guān)性。 簡單相關(guān)系數(shù)矩陣 原變量在典型變量上的負(fù)荷(即原變量與典型變量間的相關(guān)系數(shù))V1V2V3V4V5W1W2W3W4W5身 高X10.9050-0.08060.3777-0.14870.08870.7912 -0.0594 0.1930-0.0527 0.0132 坐 高X20.86160.01120.4152-0.03600.24120.7532 0.0083 0.2121-0.0128 0.0357 體
26、 重X30.93610.1655-0.0471-0.2933-0.02470.8184 0.1220 -0.0240-0.1039 -0.0037 胸 圍X40.6958-0.3189-0.53820.31910.13540.6083 -0.2351 -0.27500.1131 0.0201 肩 寬X50.13560.5329-0.0321-0.23760.73890.1185 0.3929 -0.0164-0.0842 0.1095 骨盆寬X60.24330.4412-0.04050.74780.39080.2127 0.3253 -0.02070.2650 0.0579 脈 搏Y1-0.3
27、610 -0.0625 0.3757 0.1605 0.0410 -0.4130 -0.0848 0.7353 0.4530 0.2764 收縮壓Y20.3963 0.6232 0.0495 0.0508 0.0332 0.4533 0.8452 0.0968 0.1433 0.2240 舒張壓(音變)Y30.5801 0.1568 0.0378 0.0287 0.1050 0.6636 0.2127 0.0740 0.0810 0.7087 舒張壓(消音)Y40.5003 0.0296 -0.0837 0.2339 0.0677 0.5723 0.0401 -0.1638 0.6600 0.
28、4565 肺活量Y50.7994 0.0094 0.0685 -0.0743 -0.0473 0.9144 0.0128 0.1341 -0.2098 -0.3190 負(fù)荷矩陣的表達(dá)左上角的矩陣 X1=0.9050V1-0.0806V2+0.3777V3-0.1487V4+0.0887V5 X2=0.8616V1+0.0112V2+0.4152V3-0.0360V4+0.2412V5X6右下角的矩陣 Y1= -0.4130 W1-0.0848W2+0.7353W3+0.4530W4+0.2764W5 Y2=0.4533W1+0.8452W2+0.0968W3+0.1433W4+0.2240W5
29、.Y5各典型變量的意義解釋VWCov(V,W)1身高、坐高、體重、胸圍舒張壓、肺活量0.87422肩寬收縮壓0.73733胸圍(-)脈搏0.51054骨盆寬舒張壓(消音)0.35425肩寬舒張壓(音變)0.1510 等于該變量與自己這方典型變量的相關(guān)系數(shù)與典型相關(guān)系數(shù)的乘積 原變量與對方典型變量的相關(guān)原變量與對方典型變量的相關(guān) 右上角和左下角反映了原變量和對方的典型變量間關(guān)系,為利用對方的典型變量來預(yù)測原變量(回歸)提供依據(jù) 職業(yè)滿意度典型相關(guān)分析 某調(diào)查公司從一個大型零售公司隨機調(diào)查了784人,測量了5個職業(yè)特性指標(biāo)和7個職業(yè)滿意變量。討論 兩組指標(biāo)之間是否相聯(lián)系。X組: Y組:X1用戶反饋
30、 Y1主管滿意度X2任務(wù)重要性 Y2事業(yè)前景滿意度X3任務(wù)多樣性 Y3財政滿意度X4任務(wù)特殊性 Y4工作強度滿意度X5自主權(quán) Y5公司地位滿意度 Y6工作滿意度 Y7總體滿意度X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.19
31、0.210.290.16X50.510.530.570.571.000.380.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.28
32、1.000.350.59Y60.370.350.370.290.360.370.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.00 Canonical Correlation AnalysisAdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardErrorCanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.055
33、88730.119186.0.0098580.01420540.072228.0.0099480.00521750.057270.0.0099680.003280V1V2V3V4V5X10.42170.3429-0.8577-0.78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X組的典型變量W1W2W3W4W5Y10.4252-0.08800.491
34、8-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.40440.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y 組的典型變量V1V2V3V4V5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20190.002
35、10.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246W1W2W3W4W5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.24
36、16-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始變量與本組典型變量之間的相關(guān)系數(shù)W1W2W3W4W5X10.45920.0258-0.0578-0.01780.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071V1V2V3V4V5Y10.41880.01050.0405-0.0093-0.0193Y20.35
37、650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.02560.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始變量與對應(yīng)組典型變量之間的相關(guān)系數(shù) 可以看出,所有五個表示職業(yè)特性的變量與V1有大致相同的相關(guān)系數(shù), V1視為形容職業(yè)特性的指標(biāo)。第一對典型變量的第二個成員W1與Y1,Y2,Y5,Y6有較大的相關(guān)系數(shù),說
38、明W1主要代表了主管滿意度,事業(yè)前景滿意度,公司地位滿意度和工種滿意度。而V1和W1之間的相關(guān)系數(shù)0.5537。V1和W1解釋的本組原始變量的比率:X組的原始變量被V1到V5解釋了100%Y組的原始變量被W1到W5解釋了80.3%X組的原始變量被V1到V4解釋了90.81%Y組的原始變量被W1到W4解釋了69.72%10.3典型變量的冗余分析(Canonical Redundancy Analysis) 該方法由Stewart and Love 1968; Cooley and Lohnes 1971; van den Wollenberg 1977)發(fā)展。 以原變量與典型變量間相關(guān)為基礎(chǔ)。
39、通過計算X、Y變量組由自己的典型變量解釋與由對方的典型變量解釋的方差百分比與累計百分比,反映由典型變量預(yù)測原變量的程度。典型變量編號X1,X2,X3,X4,X5,X6被V1,V2,V5解釋 典型相關(guān)系數(shù)的平方被W1,W2,W5解釋百分比累計百分比百分比累計百分比10.4999 0.4999 0.7643 0.3821 0.3821 20.1024 0.6023 0.5436 0.0557 0.4377 30.1016 0.7039 0.2611 0.0265 0.4643 40.1378 0.8417 0.1256 0.0173 0.4816 50.1306 0.9724 0.0220 0.0
40、029 0.4844 X原變量的相關(guān)被典型變量解釋的百分比典型變量編號Y1,Y2,Y3,Y4,Y5被W1,W2,W5解釋 典型相關(guān)系數(shù)平方被V,V2,V5解釋百分比累計百分比百分比累計百分比10.3960 0.3960 0.7643 0.30270.302720.1537 0.5497 0.5436 0.08360.386230.1201 0.6698 0.2611 0.03130.417640.1424 0.8122 0.1256 0.01790.435550.1878 1.0000 0.0220 0.00410.4396Y原變量的相關(guān)被典型變量解釋的百分比 V1,V2,V5并沒有完全概括
41、X 變量的全部信息(97.24),而W1,W2,W5 卻概括了 Y 變量的全部信息(100); W1,W2,W5中僅蘊含 X 變量信息的48.44%,而V1,V2,V5中僅蘊含 Y 變量信息的43.96%。實例冗余分析的解釋SPSS進(jìn)行典型相關(guān)分析無直接菜單點擊可借用Analyze General Linear Model Multivariate可采用File New Syntax Canonical Correlation.sps(注意修改相應(yīng)的兩組變量的變量名) 在SPSS中可以有兩種方法來擬合典型相關(guān)分析,第一種是采用Manova過程來擬合,第二種是采用專門提供的宏程序來擬合,后者在使
42、用上非常簡單,而輸出的結(jié)果又非常詳細(xì),因此這里只對其進(jìn)行介紹.該程序名為“Canonical correlation.sps”,就放在SPSS的安裝路徑之中,調(diào)用方式如下:INCLUDE SPSS所在路徑Canonical correlation.sps.CANCORR SET1=第一組變量的列表 /SET2=第二組變量的列表. 在程序中首先應(yīng)當(dāng)使用INCLUDE命令讀入典型相關(guān)分析的宏程序,然后使用CANCORR名稱調(diào)用典型相關(guān)分析.注意INCLUDE語句只需運行一次,隨后在關(guān)閉SPSS前,宏程序會一直駐留內(nèi)存,以后重復(fù)分析時只需要運行CANCORR命令即可.注意最后的“.”表示整個語句結(jié)束
43、,不能遺漏.例題: 課后習(xí)題十中的(10-5) 某學(xué)校研究學(xué)生的體質(zhì)與運動能力的關(guān)系,對38名學(xué)生的體質(zhì)情況,每人測試了7項指標(biāo):X1(反復(fù)橫蕩的次數(shù))、X2(縱跳高度)、X3(背力)、X4(握力)、X5(踏臺升降指數(shù))、X6(立姿體前屈)、X7(臥姿上體后仰);對運動能力情況每人測試了5項指標(biāo):X8(50米跑)、X9(1000米長跑)、X10(投擲)、X11(懸垂次數(shù))、X12(持久走).試對這兩組數(shù)據(jù)進(jìn)行典型相關(guān)分析.INCLUDE C:program filesspss13Canonical correlation.sps.CANCORR SET1=X1 to X7 /SET2=X8 t
44、o X12.選擇菜單Run All,運行上述程序,即可得到典型相關(guān)分析的結(jié)果.因結(jié)果輸出內(nèi)容較多,下面將對其加以解釋.由體質(zhì)測試指標(biāo)的內(nèi)部相關(guān)系數(shù)看,各指標(biāo)間的相關(guān)系數(shù)較小,即指標(biāo)間沒有多大的重復(fù).如果兩個指標(biāo)的相關(guān)系數(shù)很大,可能這兩個指標(biāo)反映的是同一個方面,可以考慮合并.兩組變量間的相關(guān)系數(shù)運動能力測試指標(biāo)間的相關(guān)系數(shù)也比較類似.體質(zhì)情況和運動能力之間的相關(guān)性系數(shù),從二者的直接相關(guān)系數(shù)看,X9(1000米長跑)和X2(縱跳高度)之間有關(guān)聯(lián)程度較大,相關(guān)系數(shù)為0.6111,而其他體質(zhì)情況指標(biāo)和運動能力指標(biāo)間的直接關(guān)聯(lián)似乎不大,更多的可能是綜合影響.但是由于變量之間的交互作用,因此這個簡單相關(guān)系
45、數(shù)矩陣只能作為參考,不能真正反映兩組變量間的實質(zhì)聯(lián)系.典型相關(guān)系數(shù)及顯著性檢驗典型相關(guān)系數(shù).第一典型相關(guān)系數(shù)為0.851,第二典型相關(guān)系數(shù)為0.720,均比體質(zhì)指標(biāo)和運動能力指標(biāo)兩組間的任一個相關(guān)系數(shù)都大,即綜合的典型相關(guān)分析效果較好于簡單相關(guān)分析.由于此處的典型相關(guān)系數(shù)都是從樣本數(shù)據(jù)算得的,和簡單相關(guān)系數(shù)一樣,這里也有必要進(jìn)行其總體系數(shù)是否為0的假設(shè)檢驗.此處采用的是2檢驗,零假設(shè)為對應(yīng)的典型相關(guān)系數(shù)為0.由表知,第一典型相關(guān)系數(shù)和第二典型相關(guān)系數(shù)的顯著性概率(Sig.)為0.000和0.006,在=0.05的情況下,否定典型相關(guān)系數(shù)為零的假設(shè),說明這兩對典型變量間的相關(guān)性是顯著的.從以上的分析結(jié)果可知,體質(zhì)情況測試指標(biāo)和運動能力測試指標(biāo)相關(guān)性的研究可以轉(zhuǎn)化為研究第一對典型相關(guān)變量之間的關(guān)系以及第二對典型相關(guān)變量之間的關(guān)系.典型變量的系數(shù)此結(jié)果為輸出的原始變量(Raw Canonical Coefficients)和標(biāo)準(zhǔn)化變量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人債務(wù)轉(zhuǎn)讓協(xié)議書
- 鄭州二手房購房合同二零二五年
- 2025企業(yè)租賃合同范本格式
- 2025年證券經(jīng)紀(jì)代理與營業(yè)部服務(wù)項目發(fā)展計劃
- 舞蹈教師聘用合同范文二零二五年
- 住宅水電安裝合同樣本
- 代辦營業(yè)執(zhí)照合同樣本
- 倉儲分揀勞務(wù)外包合同樣本
- 公廁維修內(nèi)容合同樣本
- 2025光伏電站支架工程鋼結(jié)構(gòu)施工合同
- 生理衛(wèi)生教學(xué)【青春期男生性教育】走向成熟課件
- 人工呼吸的三種方式和操作方法課件
- 項目基坑坍塌事故專項應(yīng)急預(yù)案桌面演練腳本
- 危險化學(xué)品MSDS(氮氣)
- 無創(chuàng)通氣常用模式與參數(shù)調(diào)節(jié)
- 清遠(yuǎn)市城市樹木修剪技術(shù)指引(試行)
- GB∕T 8427-2019 紡織品 色牢度試驗 耐人造光色牢度:氙弧
- 退休人員實行社區(qū)管理申請書
- 廣州國際文化中心詳細(xì)勘察報告正文-171229end
- 全國同等學(xué)力工商管理大綱重點整理
- 機耕道監(jiān)理實施細(xì)則完整
評論
0/150
提交評論