對(duì)應(yīng)分析和列聯(lián)表 (2)_第1頁
對(duì)應(yīng)分析和列聯(lián)表 (2)_第2頁
對(duì)應(yīng)分析和列聯(lián)表 (2)_第3頁
對(duì)應(yīng)分析和列聯(lián)表 (2)_第4頁
對(duì)應(yīng)分析和列聯(lián)表 (2)_第5頁
已閱讀5頁,還剩28頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第12章 列聯(lián)表和對(duì)應(yīng)分析列聯(lián)表中兩個(gè)變量的獨(dú)立性檢驗(yàn)對(duì)應(yīng)分析1學(xué)習(xí)目標(biāo)列聯(lián)表中兩個(gè)變量獨(dú)立性檢驗(yàn)的原理和軟件結(jié)果解釋 對(duì)應(yīng)分析的基本原理和軟件結(jié)果分析22中央財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院 33.1.2 列聯(lián)表(Contingency table )如果對(duì)數(shù)據(jù)同時(shí)根據(jù)兩個(gè)變量分組,匯總得到的結(jié)果稱為列聯(lián)表。列聯(lián)表反映的是兩個(gè)變量的聯(lián)合分布,可以用來分析兩個(gè)變量之間的關(guān)系。也稱為交叉分組表(Cross tabulation)。列聯(lián)表一般根據(jù)兩個(gè)定性變量進(jìn)行編制,如果是定量變量則需要先對(duì)單個(gè)變量進(jìn)行分組。列聯(lián)表中的數(shù)字為交叉單元格中的頻數(shù)或頻率。以列聯(lián)表為基礎(chǔ)可以對(duì)兩個(gè)變量之間的關(guān)系進(jìn)行多種統(tǒng)計(jì)檢驗(yàn)。3中央財(cái)

2、經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院 4列聯(lián)表舉例市場(chǎng)營銷專業(yè)的男生有10人。4【例12.1】美國的General Social Survey55二維列聯(lián)表中的兩個(gè)變量是否相互獨(dú)立 : c2檢驗(yàn)H0:婚姻狀況和幸福狀況這兩個(gè)變量相互獨(dú)立;H1:婚姻狀況和幸福狀況不相互獨(dú)立。與單個(gè)變量的c2檢驗(yàn)類似66基本原理行變量和列變量相互獨(dú)立時(shí),每個(gè)單元格頻數(shù)的期望值 為如果期望頻數(shù)和觀測(cè)頻數(shù)相差不大,則零假設(shè)可能是正確的;如果二者差別很大,則零假設(shè)可能不成立。 77檢驗(yàn)統(tǒng)計(jì)量在零假設(shè)成立時(shí),該統(tǒng)計(jì)量近似服從自由度為(r-1)(s-1)的c2分布。當(dāng)該統(tǒng)計(jì)量的值很大(或p值很小)時(shí),就可以拒絕零假設(shè),認(rèn)為這兩個(gè)變量不相互獨(dú)立。

3、88SPSS操作“分析”“描述統(tǒng)計(jì)”“交叉表”,把“婚姻狀況”設(shè)為行變量,把“幸福狀況”設(shè)為列變量。接下來單擊“統(tǒng)計(jì)量”,在彈出的對(duì)話框中選中“卡方”,單擊“繼續(xù)”;選擇“單元格”,選中彈出對(duì)話框中的“期望值”,單擊“繼續(xù)”返回前一個(gè)是對(duì)話框,單擊“確定”99SPSS操作1010結(jié)果分析1111結(jié)果分析c2統(tǒng)計(jì)量的值為225.274,相應(yīng)的p值為0.000。由于p值遠(yuǎn)遠(yuǎn)小于通常使用的顯著性水平,因此檢驗(yàn)的結(jié)論是拒絕原假設(shè),不能認(rèn)為婚姻狀況和幸福狀況相互獨(dú)立。1212精確結(jié)果當(dāng)每個(gè)單元格的期望頻數(shù)都大于5時(shí)檢驗(yàn)統(tǒng)計(jì)量近似服從c2分布。在不滿足這一條件時(shí),需要把部分單元格合并,或者使用精確檢驗(yàn)。在

4、圖12-1的對(duì)話框中選擇“精確”,進(jìn)行相應(yīng)的設(shè)置后可以得出精確的檢驗(yàn)結(jié)果。這時(shí)所涉及的不是c2分布,而是超幾何分布。由于樣本很大時(shí)超幾何分布計(jì)算比較慢甚至無法計(jì)算,因此在大樣本時(shí)通常使用c2統(tǒng)計(jì)量。1313對(duì)應(yīng)分析 對(duì)應(yīng)分析是一種描述性、探索性的數(shù)據(jù)分析方法,通常用于列聯(lián)表的分析,以便用圖形的方法觀察行變量和列變量取值之間的對(duì)應(yīng)關(guān)系。對(duì)應(yīng)分析可以按照相同的刻度同時(shí)對(duì)列聯(lián)表中的行變量和列變量進(jìn)行降維,用較少的維度(一般選用二維或三維)來代表數(shù)據(jù)表中的行變量和列變量,從而在同一個(gè)空間中用圖形方法顯示行變量和列變量類別之間的關(guān)系。 1414對(duì)應(yīng)分析圖的繪制在表12-1的列聯(lián)表中,把3個(gè)幸福狀況的取值

5、看作3維空間中的坐標(biāo),我們可以把5個(gè)婚姻狀況在3維空間中表示出來。如果使用因子分析的方法對(duì)3個(gè)幸福狀況進(jìn)行降維(同時(shí)最大限度地保留原始信息),則我們能夠在2維甚至1維空間上把5個(gè)點(diǎn)表示出來。把表中婚姻狀況的取值看作5維空間的坐標(biāo)值,使用因子分析的方法進(jìn)行降維,也可以把3個(gè)幸福狀況在低維空間中表示出來。1515對(duì)應(yīng)分析圖的繪制如果能夠保證兩個(gè)因子分析中采用相同的刻度,則可以在同一個(gè)坐標(biāo)系中把幸福狀況的3個(gè)點(diǎn)和婚姻狀況的5個(gè)點(diǎn)繪制出來,通過圖形觀察兩個(gè)變量取值之間的關(guān)系。按上述方法得到的圖形稱為對(duì)應(yīng)分析圖。1616對(duì)應(yīng)分析圖的繪制為了保證對(duì)行和列進(jìn)行因子分析的結(jié)果之間的對(duì)應(yīng)關(guān)系,在進(jìn)行對(duì)應(yīng)分析時(shí)并

6、不是根據(jù)列聯(lián)表中的頻數(shù)直接進(jìn)行因子分析的而是先計(jì)算相應(yīng)的頻率,再進(jìn)行必要的變量變換,之后再用與因子分析類似的方法進(jìn)行降維。1717對(duì)應(yīng)分析圖的分析在對(duì)應(yīng)分析圖中,如果同一變量的不同類別在某個(gè)方向上靠得較近,則說明這些類別在該維度上區(qū)別不大;落在圖形中大致相同區(qū)域的不同變量的分類點(diǎn)彼此之間有聯(lián)系。1818對(duì)應(yīng)分析的軟件操作 選擇“分析”“降維”“對(duì)應(yīng)分析”,把“婚姻狀況”設(shè)為行變量;在彈出的對(duì)話框中單擊“定義范圍”,最小值設(shè)為1,最大值設(shè)為5,單擊“更新”、“繼續(xù)”;然后把“幸福狀況”設(shè)為列變量,再通過“定義范圍”對(duì)話框定義其取值范圍為1-3;最后單擊“確定” 1919對(duì)應(yīng)分析的軟件操作2020

7、對(duì)應(yīng)分析結(jié)果的解釋 2121對(duì)應(yīng)分析結(jié)果的解釋“慣量”類似于因子分析中特征值對(duì)應(yīng)的方差;“慣量比例”一欄中,“解釋”的慣量比例類似于因子分析中的方差貢獻(xiàn)率,“累積”的慣量比例類似于因子分析中的累積方差貢獻(xiàn)率,這幾個(gè)指標(biāo)反映了每個(gè)維度的因子重要性和解釋能力。表中的“卡方”是關(guān)于列聯(lián)表行列獨(dú)立性檢驗(yàn)結(jié)果,自由度為(5-1)(3-1)=8。p值很小說明列聯(lián)表的行與列之間有較強(qiáng)的相關(guān)性。 2222 行變量(婚姻狀況)各水平的坐標(biāo) 2323行變量(婚姻狀況)各水平的坐標(biāo)“質(zhì)量”對(duì)應(yīng)的英文為“Mass”,譯為“密度”更為確切,反映的是每種婚姻狀況的人數(shù)比例。表中給出了婚姻狀況5個(gè)水平的坐標(biāo):已婚 (-0.

8、531, -0.016),喪偶(0.437, -0.660),離異 (0.535, 0.168),喪偶 (0.041, 0.979),未婚 (0.389, 0.257)。 2424列變量(幸福狀況)的坐標(biāo) 2525對(duì)應(yīng)分析圖 2626對(duì)應(yīng)分析圖的解釋“婚姻狀況”和“幸福狀況”取值之間的對(duì)應(yīng)關(guān)系:“已婚”和“非常幸?!弊罱咏?;“離異”、“未婚”和“比較幸?!北容^接近;“喪偶”、“分居”和“不太幸?!北容^接近。 2727對(duì)應(yīng)分析的一點(diǎn)說明對(duì)應(yīng)分析是一種探索性的描述統(tǒng)計(jì)方法,并不能保證所有的對(duì)應(yīng)分析結(jié)果中兩個(gè)變量的取值之間都有如此明確的對(duì)應(yīng)關(guān)系。 2828例2 (課后習(xí)題)2929軟件操作在SPSS軟件中錄入數(shù)據(jù)時(shí),數(shù)據(jù)文件中應(yīng)該有三個(gè)變量:頭發(fā)顏色、眼睛顏色和頻數(shù),并在SPSS中選擇“數(shù)據(jù)”“加權(quán)個(gè)案”,把“頻數(shù)”變量指定為權(quán)數(shù) 。3030數(shù)據(jù)表3131對(duì)應(yīng)分析結(jié)果從表中卡方檢驗(yàn)的結(jié)果看兩個(gè)變量不相互獨(dú)立3232小結(jié)在列聯(lián)表中,如果行變量和列變量相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論