版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、典型相關(guān)分析1 一、什么是典型相關(guān)分析及基本思想 通常情況下,為了研究兩組變量 的相關(guān)關(guān)系,可以用最原始的方法,分別計算兩組變量之間的全部相關(guān)系數(shù),一共有pq個簡單相關(guān)系數(shù),這樣又煩瑣又不能抓住問題的本質(zhì)。如果能夠采用類似于主成分的思想,分別找出兩組變量的各自的某個線性組合,討論線性組合之間的相關(guān)關(guān)系,則更簡捷。2 在解決實際問題中,這種方法有廣泛的應(yīng)用。如,在工廠里常常要研究產(chǎn)品的q個質(zhì)量指標P個原材料的指標 之間的相關(guān)關(guān)系;也可以是采用典型相關(guān)分析來解決的問題。如果能夠采用類似于主成分的思想,分別找出兩組變量的線性組合既可以使變量個數(shù)簡化,又可以達到分析相關(guān)性的目的。3例 家庭特征與家庭消
2、費之間的關(guān)系 為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。4X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣5y2y3y1x2x16 典型相關(guān)分析的思想: 首先分別在每組變量中找出第一對線性組合,使其具有最大相關(guān)性,然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對本身具有次大的相關(guān)性。如此下去,直至
3、兩組變量的相關(guān)性被提取完為止。 7 u2和v2與u1和v1相互獨立,但u2和v2相關(guān)。如此繼續(xù)下去,直至進行到r步,rmin(p,q),可以得到r組變量。從而達到降維的目的。8二、典型相關(guān)的數(shù)學(xué)描述 (一)想法 考慮兩組變量的向量 其協(xié)方差陣為 其中11是第一組變量的協(xié)方差矩陣;22是第二組變量的協(xié)方差矩陣;12 和21是X和Y的其協(xié)方差矩陣。9 如果我們記兩組變量的第一對線性組合為: 其中: 所以,典型相關(guān)分析就是求1和1,使二者的相關(guān)系數(shù)達到最大。10(二)典型相關(guān)系數(shù)和典型變量的求法 在約束條件下,求1和1,使uv達到最大。 根據(jù)數(shù)學(xué)分析中條件極值的求法,引入Lagrange乘數(shù),求極值
4、問題,則可以轉(zhuǎn)化為求 的極大值,其中和是 Lagrange乘數(shù)。11 將上面的3式分別左乘 和 12將 左乘(3)的第二式,得 并將第一式代入,得 的特征根是 ,相應(yīng)的特征向量為13將 左乘(3)的第一式,并將第二式代入,得 的特征根是 ,相應(yīng)的特征向量為14引理:AB和BA有相同的非零特征根.A和A有相同的非零特征根.則 和有相同的非零特征根。15 結(jié)論: 既是M1又是M2的特征根, 和 是相應(yīng)于M1和M2的特征向量。 至此,典型相關(guān)分析轉(zhuǎn)化為求M1和M2特征根和特征向量的問題。 第一對典型變量提取了原始變量X與Y之間相關(guān)的主要部分,如果這部分還不能足以解釋原始變量,可以在剩余的相關(guān)中再求出
5、第二對典型變量和他們的典型相關(guān)系數(shù)。16 在剩余的相關(guān)中再求出第二對典型變量和他們的典型相關(guān)系數(shù)。設(shè)第二對典型變量為:在約束條件: 17 求使 達到最大的 和 。18例 家庭特征與家庭消費之間的關(guān)系 為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。19X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00變量間的相關(guān)系數(shù)矩陣20典型相關(guān)分析典型相關(guān)系數(shù)調(diào)整典型相
6、關(guān)系數(shù)近似方差典型相關(guān)系數(shù)的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491921X組典型變量的系數(shù)U1U2X10.7689-1.4787X20.27211.6443Y組典型變量的系數(shù)V1V2Y10.04911.0003Y20.8975-0.5837Y30.19000.295622三、典型變量的性質(zhì)1、同一組的典型變量之間互不相關(guān) 即X組的典型變量之間是相互互不相關(guān):即Y組的典型變量之間是互不相關(guān):232、不同組的典型變量之間相關(guān)性 不同組內(nèi)典型變量之間的相關(guān)系數(shù)為:24同對則協(xié)方差為i ,不同對則為零。25
7、3、原始變量與典型變量之間的相關(guān)系數(shù)原始變量相關(guān)系數(shù)矩陣 x典型變量系數(shù)矩陣26y典型變量系數(shù)矩陣272829典型變量的結(jié)構(gòu)U1U2X10.9866-0.1632X20.88720.4614V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.301330典型變量的結(jié)構(gòu)V1V2X10.6787-0.0305X20.61040.0862U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056331 兩個反映消費的指標與第一對典型變量中u1的相關(guān)系數(shù)分別為0.9866和0.8872,可以看出u1可以作為消費特性的指標,第一對典型變
8、量中v1與Y2之間的相關(guān)系數(shù)為0.9822,可見典型變量v1主要代表了了家庭收入, u1和 v1的相關(guān)系數(shù)為0.6879,這就說明家庭的消費與一個家庭的收入之間其關(guān)系是很密切的;第二對典型變量中u2與x2的相關(guān)系數(shù)為0.4614,可以看出u2可以作為文化消費特性的指標,第二對典型變量中v2與Y1和Y3之間的分別相關(guān)系數(shù)為0.8464和0.3013,可見典型變量v2主要代表了家庭成員的年齡特征和教育程度, u2和 v2的相關(guān)系數(shù)為0.1869,說明文化消費與年齡和受教育程度之間的有關(guān)。324、各組原始變量被典型變量所解釋的方差X組原始變量被ui解釋的方差比例X組原始變量被vi解釋的方差比例y組原
9、始變量被ui解釋的方差比例y組原始變量被vi解釋的方差比例33 被典型變量解釋的X組原始變量的方差被本組的典型變量解釋被對方Y(jié)組典型變量解釋比例累計比例典型相關(guān)系數(shù)平方比例累計比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.420834 被典型變量解釋的Y組原始變量的方差被本組的典型變量解釋被對方X組典型變量解釋比例累計比例典型相關(guān)系數(shù)平方比例累計比例1 0.46890.46890.47330.22190.22192 0.27310.74200.03490.00950.231535五、樣本典型相關(guān)系數(shù) 在實際應(yīng)用中,總體的
10、協(xié)方差矩陣常常是未知的,類似于其他的統(tǒng)計分析方法,需要從總體中抽出一個樣本,根據(jù)樣本對總體的協(xié)方差或相關(guān)系數(shù)矩陣進行估計,然后利用估計得到的協(xié)方差或相關(guān)系數(shù)矩陣進行分析。由于估計中抽樣誤差的存在,所以估計以后還需要進行有關(guān)的假設(shè)檢驗。36 1、假設(shè)有X組和Y組變量,樣本容量為n。假設(shè)( X1, Y1), ( X2, Y2), ( Xn, Yn),觀測值矩陣為:3738 2、計算特征根和特征向量 求M1和 M2的特征根 ,對應(yīng)的特征向量 。則特征向量構(gòu)成典型變量的系數(shù),特征根為典型變量相關(guān)系數(shù)的平方。39六、典型相關(guān)系數(shù)的檢驗典型相關(guān)分析是否恰當,應(yīng)該取決于兩組原變量之間是否相關(guān),如果兩組變量之
11、間毫無相關(guān)性而言,則不應(yīng)該作典型相關(guān)分析。用樣本來估計總體的典型相關(guān)系數(shù)是否有誤,需要進行檢驗。檢驗的統(tǒng)計量:(一)整體檢驗40所以,兩邊同時求行列式,有4142 由于 所以若M的特征根為 ,則(l-M)的特征根為(1-)。根據(jù)矩陣行列式與特征根的關(guān)系,可得:43 在原假設(shè)為真的情況下,檢驗的統(tǒng)計量 近似服從自由度為pq的2分布。在給定的顯著性水平下,如果22 (pq),則拒絕原假設(shè),認為至少第一對典型變量之間的相關(guān)性顯著。再檢驗下一對典型變量之間的相關(guān)性。直至相關(guān)性不顯著為止。對兩組變量x和y進行典型相關(guān)分析,采用的也是一種降維技術(shù)。我們希望使用盡可能少的典型變量對數(shù),為此需要對一些較小的典
12、型相關(guān)系數(shù)是否為零進行假設(shè)檢驗。H0經(jīng)檢驗被拒絕,則應(yīng)進一步檢驗假設(shè)。 44(二)部分總體典型相關(guān)系數(shù)為零的檢驗 H0:P2Pr0 Hl:P2,P3,Pr至少有一個不為零。若原假設(shè)H0被接受,則認為只有第一對典型變量是有用的;若原假設(shè)H0被拒絕,則認為第二對典型變量也是有用的,并進一步檢驗假設(shè): H0:P3Pr0 H1:P3,Pr至少有一個不為零。 如此進行下去.直至對某個k,H0:P(k十1)PM0H1:P(k+1),,Pm至少有一個不為零。45檢驗的統(tǒng)計量近似服從自由度為(p-k)(q-k)的2分布。在給定的顯著性水平下,如果22 (p-k)(q-k),則拒絕原假設(shè),認為至少第k+1對典型
13、變量之間的相關(guān)性顯著。46 H0: 當前和后面的典型相關(guān)系數(shù)均為零 H1: 至少當前的典型相關(guān)系數(shù)為零LikelihoodRatioApprox FNum DFDen DFPr F 10.508334981341.2346199900.0001 20.96508130180.838299960.0001可見,前面兩對典型變量的相關(guān)性是很強的。47職業(yè)滿意度典型相關(guān)分析 某調(diào)查公司從一個大型零售公司隨機調(diào)查了784人,測量了5個職業(yè)特性指標和7個職業(yè)滿意變量。討論 兩組指標之間是否相聯(lián)系。X組: Y組:X1用戶反饋 Y1主管滿意度X2任務(wù)重要性 Y2事業(yè)前景滿意度X3任務(wù)多樣性 Y3財政滿意度X
14、4任務(wù)特殊性 Y4工作強度滿意度X5自主權(quán) Y5公司地位滿意度 Y6工作滿意度 Y7總體滿意度48X1X2X3X4X5Y1Y2Y3Y4Y5Y6Y7X11.000.490.530.490.510.330.320.200.190.300.370.21X20.491.000.570.460.530.300.210.160.080.270.350.20X30.530.571.000.480.570.310.230.140.070.240.370.18X40.490.460.481.000.570.240.220.120.190.210.290.16X50.510.530.570.571.000.380
15、.320.170.230.320.360.27Y10.330.300.310.240.381.000.430.270.240.340.370.40Y20.320.210.230.220.320.431.000.330.260.540.320.58Y30.200.160.140.120.170.270.331.000.250.460.290.45Y40.190.080.070.190.230.240.260.251.000.280.300.27Y50.300.270.240.210.320.340.540.460.281.000.350.59Y60.370.350.370.290.360.370
16、.320.290.300.351.000.31Y70.210.200.180.160.270.400.580.450.270.590.311.0049 Canonical Correlation AnalysisAdjustedCanonicalCorrelationApproxCanonicalCorrelationSquaredStandardErrorCanonicalCorrelation10.5537060.5530730.0069340.30659120.2364040.2346890.0094420.05588730.119186.0.0098580.01420540.07222
17、8.0.0099480.00521750.057270.0.0099680.00328050LikelihoodRatioApprox FNum DFDen DFPrF10.63988477134.42373542018.150.000120.9228094133.82422434848.670.000130.9774354115.26341527578.390.000140.9915203010.65798199820.000150.9967201510.9600399920.0001當前和后面的典型相關(guān)系數(shù)均為零的檢驗51U1U2U3U4U5X10.42170.3429-0.8577-0.
18、78840.0308X20.19511-0.66830.4434-0.26910.9832X30.1676-0.8532-0.25920.4688-0.9141X4-0.02290.3561-0.42311.04230.5244X50.45970.72870.9799-0.1682-0.4392X組的典型變量52V1V2V3V4V5Y10.4252-0.08800.4918-0.1284-0.4823Y20.20890.4363-0.7832-0.3405-0.7499Y3-0.0359-0.0929-0.4778-0.60590.3457Y40.02350.9260-0.00650.4044
19、0.3116Y50.2902-0.10110.2831-0.44690.7030Y60.5157-0.5543-0.41250.68760.1796Y7-0.1101-0.03170.92850.2739-0.0141Y組的典型變量53U1U2U3U4U5X10.82930.1093-0.4853-0.24690.0611X20.7304-0.43660.20010.00210.4857X30.7533-0.4661-0.10560.3020-0.3360X40.61600.2225-0.20530.66140.3026X50.86060.26600.38860.1484-0.1246V1V2
20、V3V4V5Y10.75640.04460.3395-0.1294-0.3370Y20.64390.3582-0.1717-0.3530-0.3335Y30.38720.0373-0.1767-0.53480.4148Y40.37720.7919-0.00540.28860.3341Y50.65320.10840.2092-0.43760.4346Y60.8040-0.2416-0.23480.40520.1964Y70.50240.16280.4933-0.18900.0678原始變量與本組典型變量之間的相關(guān)系數(shù)54V1V2V3V4V5X10.45920.0258-0.0578-0.0178
21、0.0035X20.4044-0.10320.02390.00020.0278X30.4171-0.1102-0.01260.0218-0.0192X40.34110.0526-0.02450.04780.0173X50.47650.06290.04630.0107-0.0071U1U2U3U4U5Y10.41880.01050.0405-0.0093-0.0193Y20.35650.0847-0.0205-0.0255-0.0191Y30.21440.0088-0.0211-0.03860.0238Y40.20880.1872-0.00060.02080.0191Y50.36170.0256
22、0.0249-0.03160.0249Y60.4452-0.0571-0.02800.02930.0112Y70.27820.03850.0588-0.01360.0039原始變量與對應(yīng)組典型變量之間的相關(guān)系數(shù)55 可以看出,所有五個表示職業(yè)特性的變量與u1有大致相同的相關(guān)系數(shù), u1視為形容職業(yè)特性的指標。第一對典型變量的第二個成員v1與Y1,Y2,Y5,Y6有較大的相關(guān)系數(shù),說明v1主要代表了主管滿意度,事業(yè)前景滿意度,公司地位滿意度和工種滿意度。而u1和v1之間的相關(guān)系數(shù)0.5537。56 Canonical Redundancy Analysis Raw Variance of the
23、 VAR Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Cumulative Proportion Proportion Proportion Proportion 1 0.5818 0.5818 0.1784 0.1784 2 0.1080 0.6898 0.0060 0.1844 3 0.0960 0.7858 0.0014 0.1858 4 0.1223 0.9081 0.0006 0.1864 5 0.0919 1.0000 0.0003
24、0.1867 Raw Variance of the WITH Variables Explained by Their Own The Opposite Canonical Variables Canonical Variables Cumulative Cumulative Proportion Proportion Proportion Proportion 1 0.3721 0.3721 0.1141 0.1141 2 0.1222 0.4943 0.0068 0.1209 3 0.0740 0.5683 0.0011 0.1220 4 0.1289 0.6972 0.0007 0.1
25、226 5 0.1058 0.8030 0.0003 0.123057u1和v1解釋的本組原始變量的比率:X組的原始變量被u1到u5解釋了100%Y組的原始變量被v1到v5解釋了80.3%X組的原始變量被u1到u4解釋了90.81%Y組的原始變量被v1到v4解釋了69.72%58房地產(chǎn)指標典型相關(guān)分析報告 在對房地產(chǎn)指標的典型相關(guān)分析中建立了如下的指標體系:X1:開發(fā)公司個數(shù)(個) X2:年平均職工人數(shù)(人)X3:自開始建設(shè)至本年底累計完成投資X4:本年完成投資 X5:施工房屋面積(萬平方米)Y1:經(jīng)營總收入 Y2:土地轉(zhuǎn)讓收入Y3:商品房屋銷售收入 Y4:房屋出租收入Y5:經(jīng)營稅金及附加 Y
26、6:營業(yè)利潤Y7:竣工房屋面積(萬平方米)Y8:竣工房屋價值(萬元)其中,X1-X5是反映房地產(chǎn)投入的變量,Y1-Y8是反映房地產(chǎn)產(chǎn)出的變量。數(shù)據(jù)來源于1999中國統(tǒng)計年鑒,選取了全國30個省市自治區(qū)的相應(yīng)指標值(西藏和新疆兩自治區(qū)因數(shù)據(jù)不全而刪除59序號典型相關(guān)系數(shù) 典 型 變 量10.998716U1=-0.1769X1+0.0639X2+0.7264X3+0.3633X4+0.0053X5V1=2.5217Y1+0.1720Y2-1.7370Y3-0.1993Y4-0.0886Y5-0.3747Y6-0.1016Y7+0.6610Y820.980640U2=0.3319X1+0.0785
27、X2-3.3077X3+1.8943X4+1.2047X5V2=-2.0308Y1-0.2555Y2+0.3219Y3+0.4304Y4+1.4052Y5+0.4774Y6+2.0697Y7-1.8594Y830.916191U3=-1.1339X1-3.1176X2+1.2803X3-3.9436X4+6.7392X5V3=0.3990Y1-0.6098Y2-0.7852Y3-2.0872Y4+4.2927Y5-0.6167Y6-1.6135Y7+0.5071Y840.757332U4=1.4478X1-1.7250X2-4.4766X3+8.1918X4+3.5963X5V4=-8.053
28、1Y1-0.9941Y2-1.6221Y3-1.3311Y4+5.1584Y5+1.6818Y6-0.9464Y7+6.4783Y850.739978U5=-3.7387X1+2.3073X2-2.0488X3+1.8063X4+1.4170X5V5=4.7208Y1-0.3733Y2-4.4002Y3+3.1983Y4-4.2877Y5-1.8271Y6+1.5460Y8+0.9555Y960第一對典型變量中,U1主要受自開始建設(shè)至本年底累計完成投資影響,V1主要受經(jīng)營總收入和商品房屋銷售收入影響;第二對典型變量中,U2主要受自開始建設(shè)至本年底累計完成投資、本年完成投資和施工房屋面積影響,V
29、2主要受經(jīng)營稅金及附加、竣工房屋面積和竣工房屋價值影響:第三對典型變量中,U3受各個指標影響都較大,V4主要受房屋出租收入、經(jīng)營稅金及附加和竣工房屋面積的影響;第四對典型變量中,U4主要受本年完成投資的影響,V4主要受經(jīng)營總收入和工房屋價值的影響。第五對典型變量中,U5主要受開發(fā)公司個數(shù)影響,V4主要受經(jīng)營總收入、商品房屋銷售收入、房屋出租收入和經(jīng)營稅金及附加影響。但注意到,第一對典型變量的方差貢獻率已達92.20%,故保留第一對典型變量用作分析,從而達到降維的目的。 總的來說,房地產(chǎn)的投入變量主要受自開始建設(shè)至本年底累計完成投資影響,產(chǎn)出變量集中在經(jīng)營總收入和商品房屋銷售收入上。累計完成投資額與經(jīng)營總收入,特別是商品房屋銷售收入高度相關(guān)。61 典型相關(guān)分析的基本思想:首先分別在每組變量中找出第一對線性組合,使其具有最大相關(guān)性,然后再在每組變量中找出第二對線性組合,使其分別與本組內(nèi)的第一線性組合不相關(guān),第二對本身具有最大相關(guān)性。如此下去,直至兩組變量的相關(guān)性被提取完為止。本例想利用我國1999年城鎮(zhèn)居民的家庭收入來源和消費性支出的數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 破局之作新車發(fā)布
- 農(nóng)業(yè)智變探秘
- 農(nóng)學(xué)專業(yè)技能解析
- 2024年版:勞動合同解除協(xié)議書
- 揭秘社科統(tǒng)計
- 多方合作項目協(xié)議書
- 2024年版建筑項目中介服務(wù)協(xié)議范本版B版
- 貨架銷售合同
- 干掛石材合同書
- 個人養(yǎng)豬場所有權(quán)變更合同版B版
- 社區(qū)依法執(zhí)業(yè)培訓(xùn)課件
- 可口可樂火炬營銷案例分析
- 赤峰市松山區(qū)王府鎮(zhèn)水泉溝礦泉水2024年度礦山地質(zhì)環(huán)境治理計劃書
- 某年機關(guān)老干部工作總結(jié)
- 股骨干骨折(骨科)
- 租房定金協(xié)議電子版本
- 胸心外科細化標準
- 飛機拆解管理手冊
- 農(nóng)村文化建設(shè)培訓(xùn)
- 教科版六年級下冊科學(xué)第一單元《小小工程師》教材分析及全部教案(定稿;共7課時)
- 身心靈療愈行業(yè)報告
評論
0/150
提交評論