第7章-列聯(lián)分析說(shuō)課材料課件_第1頁(yè)
第7章-列聯(lián)分析說(shuō)課材料課件_第2頁(yè)
第7章-列聯(lián)分析說(shuō)課材料課件_第3頁(yè)
第7章-列聯(lián)分析說(shuō)課材料課件_第4頁(yè)
第7章-列聯(lián)分析說(shuō)課材料課件_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章分類(lèi)變量的推斷7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)

7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)

7.3兩個(gè)分類(lèi)變量的相關(guān)性度量

第7章分類(lèi)變量的推斷7.1一個(gè)分類(lèi)變量的擬合1性別與是否逃課有關(guān)系嗎?讀完四年大學(xué),一次課也沒(méi)有逃過(guò),這樣的學(xué)生恐怕不多。3名同學(xué)就逃課問(wèn)題做了一次調(diào)查。調(diào)查的對(duì)象是財(cái)政金融學(xué)院的大一,大二,大三本科生。樣本的抽取方式是分層抽樣與簡(jiǎn)單隨機(jī)抽樣結(jié)合,先根據(jù)年級(jí)劃分層次,然后對(duì)各個(gè)班級(jí)簡(jiǎn)單隨機(jī)抽樣,共抽取150名學(xué)生組成一個(gè)樣本,并對(duì)每個(gè)學(xué)生采用問(wèn)卷調(diào)查。問(wèn)卷內(nèi)容包括每周逃課次數(shù)、所逃課程的類(lèi)型(選修課、專(zhuān)業(yè)課等等)和逃課原因等。調(diào)查得到的男女學(xué)生逃課情況的匯總表如下:2014-12-9性別與是否逃課有關(guān)系嗎?讀完四年大學(xué),一次課也沒(méi)有逃過(guò),這2性別與是否逃課有關(guān)系嗎?這里涉及到兩個(gè)分類(lèi)變量,一個(gè)是逃課情況,一個(gè)是性別。根據(jù)上面的數(shù)據(jù),你認(rèn)為性別與逃課與否有關(guān)系嗎?如何來(lái)檢驗(yàn)兩個(gè)分類(lèi)變量之間是否存在關(guān)系呢?2014-12-9性別與是否逃課有關(guān)系嗎?這里涉及到兩個(gè)分類(lèi)變量,一個(gè)是逃課情37.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)

7.1.1期望頻數(shù)相等

7.1.2期望頻數(shù)不等

第7章分類(lèi)變量的推斷7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)第7章分類(lèi)變量4利用Pearson-2統(tǒng)計(jì)量來(lái)判斷某個(gè)分類(lèi)變量各類(lèi)別的觀(guān)察頻數(shù)分布與某一理論分布或期望分布是否一致的檢驗(yàn)方法。比如,各月份的產(chǎn)品銷(xiāo)售量是否符合均勻分布;不同地區(qū)的離婚率是否有顯著差異;也稱(chēng)為一致性檢驗(yàn)(testofhomogeneity)。2014-12-9什么是擬合優(yōu)度檢驗(yàn)?

(goodnessoffittest)利用Pearson-2統(tǒng)計(jì)量來(lái)判斷某個(gè)分類(lèi)變量各類(lèi)別的觀(guān)察57.1.1期望頻數(shù)相等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)7.1.1期望頻數(shù)相等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度6【例7-1】為研究消費(fèi)者對(duì)不同品牌的牛奶是否有明顯偏好,一家調(diào)查公司抽樣調(diào)查了500個(gè)消費(fèi)者對(duì)4個(gè)品牌的偏好情況,得到的結(jié)果如下表所示。檢驗(yàn)消費(fèi)者對(duì)牛奶品牌的偏好是否有顯著差異(=0.05)。2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)【例7-1】為研究消費(fèi)者對(duì)不同品牌的牛奶是否有明顯偏好,一家7擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第1步:提出假設(shè)

H0:觀(guān)察頻數(shù)與期望頻數(shù)無(wú)顯著差異(無(wú)明顯偏好)H1

:觀(guān)察頻數(shù)與期望頻數(shù)有顯著差異(有明顯偏好)第2步:計(jì)算2統(tǒng)計(jì)量2014-12-9自由度df=類(lèi)別個(gè)數(shù)-1擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第1步:提出假設(shè)2014-128擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)2統(tǒng)計(jì)量計(jì)算表2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)2統(tǒng)計(jì)量計(jì)算表2014-19擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第3步:做出決策由于自由度=4-1=3,利用Excel的【CHIDIST】函數(shù)計(jì)算的統(tǒng)計(jì)量的P值(右尾概率)為6.22366E-12,由于P值接近于0。故拒絕原假設(shè),表明消費(fèi)者對(duì)牛奶品牌的偏好有顯著差異。2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第3步:做出決策2014-1210擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)相等)

第1步:先指定“頻數(shù)”變量。點(diǎn)擊【數(shù)據(jù)】→【加權(quán)個(gè)案】,選擇

【加權(quán)個(gè)案(W)】,將“頻數(shù)”(本例為人數(shù))

選入【頻數(shù)變量】,點(diǎn)擊【確定】;

第2步:選擇菜單:【分析】→【非參數(shù)檢驗(yàn)】→【舊對(duì)話(huà)框】→【卡方】,進(jìn)入主對(duì)話(huà)框;第3步:將頻數(shù)變量選入(本例為人數(shù))【檢驗(yàn)變量列表】,點(diǎn)擊【確定】。2014-12-9擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)相等)第1步:先指定11擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.Sig.)即為P值。由于P值接近于0。拒絕原假設(shè),表明消費(fèi)者對(duì)牛奶品牌的偏好有顯著差異。擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.127.1.2期望頻數(shù)不等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)7.1.2期望頻數(shù)不等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度13【例7-2】一項(xiàng)針對(duì)全國(guó)的房地產(chǎn)價(jià)格調(diào)查表明,城鎮(zhèn)居民對(duì)房?jī)r(jià)表示非常不滿(mǎn)意的占15%,不滿(mǎn)意的占45%,一般的占25%,滿(mǎn)意的占9%,非常滿(mǎn)意的占6%。為研究一線(xiàn)大城市的居民對(duì)房地產(chǎn)價(jià)格的滿(mǎn)意程度,一家研究機(jī)構(gòu)在某城市抽樣調(diào)查300人,其中的一個(gè)問(wèn)題是:“您對(duì)目前的住房?jī)r(jià)格是否滿(mǎn)意?”調(diào)查共設(shè)非常不滿(mǎn)意、不滿(mǎn)意、一般、滿(mǎn)意、非常滿(mǎn)意5個(gè)選項(xiàng)。調(diào)查結(jié)果的頻數(shù)分布如下表所示。檢驗(yàn)該城市居民對(duì)房屋價(jià)格滿(mǎn)意度評(píng)價(jià)的頻數(shù)與全國(guó)的調(diào)查頻數(shù)是否一致2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)【例7-2】一項(xiàng)針對(duì)全國(guó)的房地產(chǎn)價(jià)格調(diào)查表明,城鎮(zhèn)居民對(duì)房?jī)r(jià)14擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第1步:提出假設(shè)

H0:該城市居民對(duì)房屋價(jià)格的評(píng)價(jià)頻數(shù)與全國(guó)的評(píng)價(jià)頻數(shù)無(wú)顯著差異

H1

:該城市居民對(duì)房屋價(jià)格的評(píng)價(jià)頻數(shù)與全國(guó)的評(píng)價(jià)頻數(shù)有顯著差異第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)量2014-12-9自由度df=類(lèi)別個(gè)數(shù)-1擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第1步:提出假設(shè)2014-1215擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)期望頻數(shù)計(jì)算表2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)期望頻數(shù)計(jì)算表2014-12-16擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)2統(tǒng)計(jì)量計(jì)算表2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)2統(tǒng)計(jì)量計(jì)算表2014-117擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第3步:做出決策由于自由度=5-1=4,利用Excel的【CHIDIST】函數(shù)計(jì)算的統(tǒng)計(jì)量的P值(右尾概率)為0.102662,由于P>0.05。不拒絕原假設(shè),沒(méi)有證據(jù)表明該城市居民對(duì)房屋價(jià)格滿(mǎn)意度的評(píng)價(jià)與全國(guó)有顯著差異。2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第3步:做出決策2014-1218擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)不等)第1步:先指定“頻數(shù)”變量【同前】;第2步:選擇菜單:【分析】→【非參數(shù)檢驗(yàn)】→【卡方】,進(jìn)入主對(duì)話(huà)框;第3步:將頻數(shù)變量選入【檢驗(yàn)變量列表】;第4步:在【期望值】下選擇【值】,并將相應(yīng)的期望比例(本例為全國(guó)的調(diào)查比例)依次輸入到框內(nèi)并點(diǎn)擊【添加】;(每次只能輸入1個(gè),并點(diǎn)擊【添加】,然后在輸入另一個(gè),再點(diǎn)擊【添加】…)點(diǎn)擊【確定】。2014-12-9擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)不等)第1步:先指定“19擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.Sig.)即為P值。由于P>0.05。不拒絕原假設(shè),沒(méi)有證據(jù)表明該城市居民對(duì)房屋價(jià)格滿(mǎn)意度的評(píng)價(jià)與全國(guó)有顯著差異。擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.207.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)

7.2.1列聯(lián)表與2獨(dú)立性檢驗(yàn)

7.2.2應(yīng)用2檢驗(yàn)應(yīng)注意的問(wèn)題第7章分類(lèi)變量的推斷7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)第7章分類(lèi)變量的217.2.1列聯(lián)表與2獨(dú)立性檢驗(yàn)

7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)7.2.1列聯(lián)表與2獨(dú)立性檢驗(yàn)7.2兩個(gè)分類(lèi)變22研究?jī)蓚€(gè)分類(lèi)變量時(shí),每個(gè)變量有多個(gè)類(lèi)別,通常將兩個(gè)變量多個(gè)類(lèi)別的頻數(shù)用交叉表的形式表示出來(lái);一個(gè)變量放在行(row)的位置,稱(chēng)為行變量,其類(lèi)別數(shù)(行數(shù))用r表示;另一個(gè)變量放在列(column)的位置,稱(chēng)為列變量,其類(lèi)別數(shù)(列數(shù))用c表示;這種由兩個(gè)或兩個(gè)以上分類(lèi)變量交叉分類(lèi)的頻數(shù)分布表稱(chēng)為列聯(lián)表(contingencytable);一個(gè)由r行和c列組成的列聯(lián)表也稱(chēng)為rc列聯(lián)表;例如,本章開(kāi)頭的案例中,行變量“逃課情況”有兩個(gè)類(lèi)別,列變量“性別”也有兩個(gè)類(lèi)別,這就是一個(gè)22列聯(lián)表。2014-12-9什么是獨(dú)立性檢驗(yàn)?

(testofindependence)研究?jī)蓚€(gè)分類(lèi)變量時(shí),每個(gè)變量有多個(gè)類(lèi)別,通常將兩個(gè)變量多個(gè)類(lèi)23對(duì)列聯(lián)表中的兩個(gè)分類(lèi)變量進(jìn)行分析,通常是判斷兩個(gè)變量是否獨(dú)立;該檢驗(yàn)的原假設(shè)是:兩個(gè)變量獨(dú)立(無(wú)關(guān))如果原假設(shè)被拒絕,則表明兩個(gè)變量不獨(dú)立,或者說(shuō)兩個(gè)變量相關(guān);獨(dú)立性檢驗(yàn)的統(tǒng)計(jì)量為:2014-12-9什么是獨(dú)立性檢驗(yàn)?

(testofindependence)自由度df=(r-1)(c-1)對(duì)列聯(lián)表中的兩個(gè)分類(lèi)變量進(jìn)行分析,通常是判斷兩個(gè)變量是否獨(dú)立24【例7-3】利用本章開(kāi)頭關(guān)于學(xué)生逃課情況調(diào)查的數(shù)據(jù),如下表所示,檢驗(yàn)性別與逃課情況是否獨(dú)立。2014-12-92獨(dú)立性檢驗(yàn)

(例題分析)【例7-3】利用本章開(kāi)頭關(guān)于學(xué)生逃課情況調(diào)查的數(shù)據(jù),如下表所252獨(dú)立性檢驗(yàn)

(例題分析)第1步:提出假設(shè)

H0:性別與是否逃課獨(dú)立

H1

:性別與是否逃課不獨(dú)立第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)量2014-12-9RT為給定單元格所在行的合計(jì)頻數(shù);CT為給定單元格所在列的合計(jì)頻數(shù);n為樣本量。2獨(dú)立性檢驗(yàn)

(例題分析)第1步:提出假設(shè)2014-12262獨(dú)立性檢驗(yàn)

(例題分析)第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)量2014-12-92獨(dú)立性檢驗(yàn)

(例題分析)第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)272獨(dú)立性檢驗(yàn)

(例題分析)第3步:做出決策由于自由度=(2-1)(2-1)=1,利用Excel的【CHIDIST】函數(shù)計(jì)算的統(tǒng)計(jì)量的P值(右尾概率)為0.159372,由于P>0.05。不拒絕原假設(shè),可以認(rèn)為性別與逃課情況獨(dú)立。2014-12-92獨(dú)立性檢驗(yàn)

(例題分析)第3步:做出決策2014-12282獨(dú)立性檢驗(yàn)第1步:選擇【分析】→【描述統(tǒng)計(jì)-交叉表】,進(jìn)入主對(duì)話(huà)框;第2步:將行變量(本例為“逃課情況”)選入【行(s)】,將列變量(本例為“性別”)選入【列(s)】(行列可以互換);第3步:點(diǎn)擊【統(tǒng)計(jì)量】并選中【Chi-square卡方統(tǒng)計(jì)量】;點(diǎn)擊【繼續(xù)】返回主對(duì)話(huà)框;點(diǎn)擊【單元格】,在【計(jì)數(shù)】下選中【期望值】;點(diǎn)擊【繼續(xù)】返回主對(duì)話(huà)框,點(diǎn)擊【確定】。2014-12-92獨(dú)立性檢驗(yàn)第1步:選擇【分析】→【描述統(tǒng)計(jì)-交叉表】,292獨(dú)立性檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.Sig.)即為P值。由于P>0.05。不拒絕原假設(shè),可以認(rèn)為性別與逃課情況獨(dú)立。2獨(dú)立性檢驗(yàn)2014-12-9近似的顯著性水平(Asym307.2.22檢驗(yàn)應(yīng)注意的問(wèn)題7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)7.2.22檢驗(yàn)應(yīng)注意的問(wèn)題7.2兩個(gè)分類(lèi)變31在應(yīng)用2檢驗(yàn)時(shí),要求樣本量應(yīng)足夠大,特別是每個(gè)單元格的期望頻數(shù)不能太小,否則應(yīng)用應(yīng)檢驗(yàn)可能會(huì)得出錯(cuò)誤的結(jié)論;從2統(tǒng)計(jì)量的公式可以看出,期望頻數(shù)在公式的分母上,如果某個(gè)單元格的期望頻數(shù)過(guò)小,統(tǒng)計(jì)量的值就會(huì)變大,從而導(dǎo)致拒絕原假設(shè);應(yīng)用2檢驗(yàn)時(shí)對(duì)單元格的期望頻數(shù)有以下要求:如果僅有兩個(gè)單元格,單元格的最小期望頻數(shù)不應(yīng)小于5。否則不能進(jìn)行2檢驗(yàn);單元格在兩個(gè)以上時(shí),期望頻數(shù)小于5的單元格不能超過(guò)總格子數(shù)的20%,否則不能進(jìn)行2檢驗(yàn);如果出現(xiàn)期望頻數(shù)小于5的單元格超過(guò)20%,可以采取合并類(lèi)別的辦法來(lái)解決這一問(wèn)題。2014-12-9應(yīng)用2檢驗(yàn)應(yīng)注意的問(wèn)題在應(yīng)用2檢驗(yàn)時(shí),要求樣本量應(yīng)足夠大,特別是每個(gè)單元格的期望327.3兩個(gè)分類(lèi)變量的相關(guān)性度量

7.3.1系數(shù)和Cramer’sV系數(shù)

7.3.2列聯(lián)系數(shù)第7章分類(lèi)變量的推斷7.3兩個(gè)分類(lèi)變量的相關(guān)性度量第7章分類(lèi)變量的337.3.1系數(shù)和Cramer’sV系數(shù)7.3兩個(gè)分類(lèi)變量的相關(guān)性測(cè)量7.3.1系數(shù)和Cramer’sV系數(shù)7.334主要用于22列聯(lián)表的相關(guān)性測(cè)量;計(jì)算公式為:例7—3的計(jì)算結(jié)果,得到的性別與逃課情況兩個(gè)變量之間的系數(shù)為0.114891。由于很小,表明性別與逃課情況不存在相關(guān)關(guān)系。這與獨(dú)立性檢驗(yàn)的結(jié)論是一致的。2014-12-9系數(shù)

(

coefficient)主要用于22列聯(lián)表的相關(guān)性測(cè)量;2014-12-9系數(shù)35由Cramer提出,計(jì)算公式為:Cramer’sV系數(shù)的取值范圍總是在0~1之間當(dāng)兩個(gè)變量獨(dú)立時(shí),V=0;當(dāng)兩個(gè)變量完全相關(guān)時(shí),V=1;如果列聯(lián)表的行數(shù)或列數(shù)中有一個(gè)為2,Cramer’sV系數(shù)就等于系數(shù);例如,根據(jù)例7—3的計(jì)算結(jié)果,得到的性別與逃課情況兩個(gè)變量之間的Cramer’sV系數(shù)與系數(shù)一致。2014-12-9Cramer’sV系數(shù)

(Cramer’sVcoefficient)由Cramer提出,計(jì)算公式為:2014-12-9Cram367.3.2列聯(lián)系數(shù)7.3兩個(gè)分類(lèi)變量的相關(guān)性測(cè)量7.3.2列聯(lián)系數(shù)7.3兩個(gè)分類(lèi)變量的相關(guān)性測(cè)量37主要用于大于22列聯(lián)表的相關(guān)性測(cè)量,用C表示;計(jì)算公式為:聯(lián)系數(shù)不可能大于1:當(dāng)兩個(gè)變量獨(dú)立時(shí),C=0;但即使兩個(gè)變量完全相關(guān),列聯(lián)系數(shù)也不可能等于1。2014-12-9列聯(lián)系數(shù)

(contingencycoefficient)主要用于大于22列聯(lián)表的相關(guān)性測(cè)量,用C表示;2014-138使用SPSS進(jìn)行獨(dú)立性檢驗(yàn)時(shí),點(diǎn)擊【統(tǒng)計(jì)量】,并在【名義】標(biāo)簽下選中【相依系數(shù)/列聯(lián)系數(shù)】和【PhiandCramer’sV】即可;根據(jù)例7—10中的數(shù)據(jù)計(jì)算的性別與逃課情況之間的3個(gè)系數(shù)如下:2014-12-9相關(guān)性測(cè)量

(SPSS應(yīng)用)使用SPSS進(jìn)行獨(dú)立性檢驗(yàn)時(shí),點(diǎn)擊【統(tǒng)計(jì)量】,并在【名義】標(biāo)39本章小節(jié)一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)應(yīng)用2檢驗(yàn)應(yīng)注意的問(wèn)題兩個(gè)分類(lèi)變量的相關(guān)性度量

2014-12-9本章小節(jié)一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)2014-12-940平時(shí)作業(yè)6P1327.3、7.4、7.5、7.6平時(shí)作業(yè)6P13241第7章分類(lèi)變量的推斷7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)

7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)

7.3兩個(gè)分類(lèi)變量的相關(guān)性度量

第7章分類(lèi)變量的推斷7.1一個(gè)分類(lèi)變量的擬合42性別與是否逃課有關(guān)系嗎?讀完四年大學(xué),一次課也沒(méi)有逃過(guò),這樣的學(xué)生恐怕不多。3名同學(xué)就逃課問(wèn)題做了一次調(diào)查。調(diào)查的對(duì)象是財(cái)政金融學(xué)院的大一,大二,大三本科生。樣本的抽取方式是分層抽樣與簡(jiǎn)單隨機(jī)抽樣結(jié)合,先根據(jù)年級(jí)劃分層次,然后對(duì)各個(gè)班級(jí)簡(jiǎn)單隨機(jī)抽樣,共抽取150名學(xué)生組成一個(gè)樣本,并對(duì)每個(gè)學(xué)生采用問(wèn)卷調(diào)查。問(wèn)卷內(nèi)容包括每周逃課次數(shù)、所逃課程的類(lèi)型(選修課、專(zhuān)業(yè)課等等)和逃課原因等。調(diào)查得到的男女學(xué)生逃課情況的匯總表如下:2014-12-9性別與是否逃課有關(guān)系嗎?讀完四年大學(xué),一次課也沒(méi)有逃過(guò),這43性別與是否逃課有關(guān)系嗎?這里涉及到兩個(gè)分類(lèi)變量,一個(gè)是逃課情況,一個(gè)是性別。根據(jù)上面的數(shù)據(jù),你認(rèn)為性別與逃課與否有關(guān)系嗎?如何來(lái)檢驗(yàn)兩個(gè)分類(lèi)變量之間是否存在關(guān)系呢?2014-12-9性別與是否逃課有關(guān)系嗎?這里涉及到兩個(gè)分類(lèi)變量,一個(gè)是逃課情447.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)

7.1.1期望頻數(shù)相等

7.1.2期望頻數(shù)不等

第7章分類(lèi)變量的推斷7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)第7章分類(lèi)變量45利用Pearson-2統(tǒng)計(jì)量來(lái)判斷某個(gè)分類(lèi)變量各類(lèi)別的觀(guān)察頻數(shù)分布與某一理論分布或期望分布是否一致的檢驗(yàn)方法。比如,各月份的產(chǎn)品銷(xiāo)售量是否符合均勻分布;不同地區(qū)的離婚率是否有顯著差異;也稱(chēng)為一致性檢驗(yàn)(testofhomogeneity)。2014-12-9什么是擬合優(yōu)度檢驗(yàn)?

(goodnessoffittest)利用Pearson-2統(tǒng)計(jì)量來(lái)判斷某個(gè)分類(lèi)變量各類(lèi)別的觀(guān)察467.1.1期望頻數(shù)相等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)7.1.1期望頻數(shù)相等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度47【例7-1】為研究消費(fèi)者對(duì)不同品牌的牛奶是否有明顯偏好,一家調(diào)查公司抽樣調(diào)查了500個(gè)消費(fèi)者對(duì)4個(gè)品牌的偏好情況,得到的結(jié)果如下表所示。檢驗(yàn)消費(fèi)者對(duì)牛奶品牌的偏好是否有顯著差異(=0.05)。2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)【例7-1】為研究消費(fèi)者對(duì)不同品牌的牛奶是否有明顯偏好,一家48擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第1步:提出假設(shè)

H0:觀(guān)察頻數(shù)與期望頻數(shù)無(wú)顯著差異(無(wú)明顯偏好)H1

:觀(guān)察頻數(shù)與期望頻數(shù)有顯著差異(有明顯偏好)第2步:計(jì)算2統(tǒng)計(jì)量2014-12-9自由度df=類(lèi)別個(gè)數(shù)-1擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第1步:提出假設(shè)2014-1249擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)2統(tǒng)計(jì)量計(jì)算表2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)2統(tǒng)計(jì)量計(jì)算表2014-150擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第3步:做出決策由于自由度=4-1=3,利用Excel的【CHIDIST】函數(shù)計(jì)算的統(tǒng)計(jì)量的P值(右尾概率)為6.22366E-12,由于P值接近于0。故拒絕原假設(shè),表明消費(fèi)者對(duì)牛奶品牌的偏好有顯著差異。2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)相等)第3步:做出決策2014-1251擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)相等)

第1步:先指定“頻數(shù)”變量。點(diǎn)擊【數(shù)據(jù)】→【加權(quán)個(gè)案】,選擇

【加權(quán)個(gè)案(W)】,將“頻數(shù)”(本例為人數(shù))

選入【頻數(shù)變量】,點(diǎn)擊【確定】;

第2步:選擇菜單:【分析】→【非參數(shù)檢驗(yàn)】→【舊對(duì)話(huà)框】→【卡方】,進(jìn)入主對(duì)話(huà)框;第3步:將頻數(shù)變量選入(本例為人數(shù))【檢驗(yàn)變量列表】,點(diǎn)擊【確定】。2014-12-9擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)相等)第1步:先指定52擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.Sig.)即為P值。由于P值接近于0。拒絕原假設(shè),表明消費(fèi)者對(duì)牛奶品牌的偏好有顯著差異。擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.537.1.2期望頻數(shù)不等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度檢驗(yàn)7.1.2期望頻數(shù)不等7.1一個(gè)分類(lèi)變量的擬合優(yōu)度54【例7-2】一項(xiàng)針對(duì)全國(guó)的房地產(chǎn)價(jià)格調(diào)查表明,城鎮(zhèn)居民對(duì)房?jī)r(jià)表示非常不滿(mǎn)意的占15%,不滿(mǎn)意的占45%,一般的占25%,滿(mǎn)意的占9%,非常滿(mǎn)意的占6%。為研究一線(xiàn)大城市的居民對(duì)房地產(chǎn)價(jià)格的滿(mǎn)意程度,一家研究機(jī)構(gòu)在某城市抽樣調(diào)查300人,其中的一個(gè)問(wèn)題是:“您對(duì)目前的住房?jī)r(jià)格是否滿(mǎn)意?”調(diào)查共設(shè)非常不滿(mǎn)意、不滿(mǎn)意、一般、滿(mǎn)意、非常滿(mǎn)意5個(gè)選項(xiàng)。調(diào)查結(jié)果的頻數(shù)分布如下表所示。檢驗(yàn)該城市居民對(duì)房屋價(jià)格滿(mǎn)意度評(píng)價(jià)的頻數(shù)與全國(guó)的調(diào)查頻數(shù)是否一致2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)【例7-2】一項(xiàng)針對(duì)全國(guó)的房地產(chǎn)價(jià)格調(diào)查表明,城鎮(zhèn)居民對(duì)房?jī)r(jià)55擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第1步:提出假設(shè)

H0:該城市居民對(duì)房屋價(jià)格的評(píng)價(jià)頻數(shù)與全國(guó)的評(píng)價(jià)頻數(shù)無(wú)顯著差異

H1

:該城市居民對(duì)房屋價(jià)格的評(píng)價(jià)頻數(shù)與全國(guó)的評(píng)價(jià)頻數(shù)有顯著差異第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)量2014-12-9自由度df=類(lèi)別個(gè)數(shù)-1擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第1步:提出假設(shè)2014-1256擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)期望頻數(shù)計(jì)算表2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)期望頻數(shù)計(jì)算表2014-12-57擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)2統(tǒng)計(jì)量計(jì)算表2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)2統(tǒng)計(jì)量計(jì)算表2014-158擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第3步:做出決策由于自由度=5-1=4,利用Excel的【CHIDIST】函數(shù)計(jì)算的統(tǒng)計(jì)量的P值(右尾概率)為0.102662,由于P>0.05。不拒絕原假設(shè),沒(méi)有證據(jù)表明該城市居民對(duì)房屋價(jià)格滿(mǎn)意度的評(píng)價(jià)與全國(guó)有顯著差異。2014-12-9擬合優(yōu)度檢驗(yàn)

(期望頻數(shù)不等)第3步:做出決策2014-1259擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)不等)第1步:先指定“頻數(shù)”變量【同前】;第2步:選擇菜單:【分析】→【非參數(shù)檢驗(yàn)】→【卡方】,進(jìn)入主對(duì)話(huà)框;第3步:將頻數(shù)變量選入【檢驗(yàn)變量列表】;第4步:在【期望值】下選擇【值】,并將相應(yīng)的期望比例(本例為全國(guó)的調(diào)查比例)依次輸入到框內(nèi)并點(diǎn)擊【添加】;(每次只能輸入1個(gè),并點(diǎn)擊【添加】,然后在輸入另一個(gè),再點(diǎn)擊【添加】…)點(diǎn)擊【確定】。2014-12-9擬合優(yōu)度檢驗(yàn)

(使用SPSS—期望頻數(shù)不等)第1步:先指定“60擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.Sig.)即為P值。由于P>0.05。不拒絕原假設(shè),沒(méi)有證據(jù)表明該城市居民對(duì)房屋價(jià)格滿(mǎn)意度的評(píng)價(jià)與全國(guó)有顯著差異。擬合優(yōu)度檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.617.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)

7.2.1列聯(lián)表與2獨(dú)立性檢驗(yàn)

7.2.2應(yīng)用2檢驗(yàn)應(yīng)注意的問(wèn)題第7章分類(lèi)變量的推斷7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)第7章分類(lèi)變量的627.2.1列聯(lián)表與2獨(dú)立性檢驗(yàn)

7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)7.2.1列聯(lián)表與2獨(dú)立性檢驗(yàn)7.2兩個(gè)分類(lèi)變63研究?jī)蓚€(gè)分類(lèi)變量時(shí),每個(gè)變量有多個(gè)類(lèi)別,通常將兩個(gè)變量多個(gè)類(lèi)別的頻數(shù)用交叉表的形式表示出來(lái);一個(gè)變量放在行(row)的位置,稱(chēng)為行變量,其類(lèi)別數(shù)(行數(shù))用r表示;另一個(gè)變量放在列(column)的位置,稱(chēng)為列變量,其類(lèi)別數(shù)(列數(shù))用c表示;這種由兩個(gè)或兩個(gè)以上分類(lèi)變量交叉分類(lèi)的頻數(shù)分布表稱(chēng)為列聯(lián)表(contingencytable);一個(gè)由r行和c列組成的列聯(lián)表也稱(chēng)為rc列聯(lián)表;例如,本章開(kāi)頭的案例中,行變量“逃課情況”有兩個(gè)類(lèi)別,列變量“性別”也有兩個(gè)類(lèi)別,這就是一個(gè)22列聯(lián)表。2014-12-9什么是獨(dú)立性檢驗(yàn)?

(testofindependence)研究?jī)蓚€(gè)分類(lèi)變量時(shí),每個(gè)變量有多個(gè)類(lèi)別,通常將兩個(gè)變量多個(gè)類(lèi)64對(duì)列聯(lián)表中的兩個(gè)分類(lèi)變量進(jìn)行分析,通常是判斷兩個(gè)變量是否獨(dú)立;該檢驗(yàn)的原假設(shè)是:兩個(gè)變量獨(dú)立(無(wú)關(guān))如果原假設(shè)被拒絕,則表明兩個(gè)變量不獨(dú)立,或者說(shuō)兩個(gè)變量相關(guān);獨(dú)立性檢驗(yàn)的統(tǒng)計(jì)量為:2014-12-9什么是獨(dú)立性檢驗(yàn)?

(testofindependence)自由度df=(r-1)(c-1)對(duì)列聯(lián)表中的兩個(gè)分類(lèi)變量進(jìn)行分析,通常是判斷兩個(gè)變量是否獨(dú)立65【例7-3】利用本章開(kāi)頭關(guān)于學(xué)生逃課情況調(diào)查的數(shù)據(jù),如下表所示,檢驗(yàn)性別與逃課情況是否獨(dú)立。2014-12-92獨(dú)立性檢驗(yàn)

(例題分析)【例7-3】利用本章開(kāi)頭關(guān)于學(xué)生逃課情況調(diào)查的數(shù)據(jù),如下表所662獨(dú)立性檢驗(yàn)

(例題分析)第1步:提出假設(shè)

H0:性別與是否逃課獨(dú)立

H1

:性別與是否逃課不獨(dú)立第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)量2014-12-9RT為給定單元格所在行的合計(jì)頻數(shù);CT為給定單元格所在列的合計(jì)頻數(shù);n為樣本量。2獨(dú)立性檢驗(yàn)

(例題分析)第1步:提出假設(shè)2014-12672獨(dú)立性檢驗(yàn)

(例題分析)第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)量2014-12-92獨(dú)立性檢驗(yàn)

(例題分析)第2步:計(jì)算期望頻數(shù)和2統(tǒng)計(jì)682獨(dú)立性檢驗(yàn)

(例題分析)第3步:做出決策由于自由度=(2-1)(2-1)=1,利用Excel的【CHIDIST】函數(shù)計(jì)算的統(tǒng)計(jì)量的P值(右尾概率)為0.159372,由于P>0.05。不拒絕原假設(shè),可以認(rèn)為性別與逃課情況獨(dú)立。2014-12-92獨(dú)立性檢驗(yàn)

(例題分析)第3步:做出決策2014-12692獨(dú)立性檢驗(yàn)第1步:選擇【分析】→【描述統(tǒng)計(jì)-交叉表】,進(jìn)入主對(duì)話(huà)框;第2步:將行變量(本例為“逃課情況”)選入【行(s)】,將列變量(本例為“性別”)選入【列(s)】(行列可以互換);第3步:點(diǎn)擊【統(tǒng)計(jì)量】并選中【Chi-square卡方統(tǒng)計(jì)量】;點(diǎn)擊【繼續(xù)】返回主對(duì)話(huà)框;點(diǎn)擊【單元格】,在【計(jì)數(shù)】下選中【期望值】;點(diǎn)擊【繼續(xù)】返回主對(duì)話(huà)框,點(diǎn)擊【確定】。2014-12-92獨(dú)立性檢驗(yàn)第1步:選擇【分析】→【描述統(tǒng)計(jì)-交叉表】,702獨(dú)立性檢驗(yàn)2014-12-9近似的顯著性水平(Asymp.Sig.)即為P值。由于P>0.05。不拒絕原假設(shè),可以認(rèn)為性別與逃課情況獨(dú)立。2獨(dú)立性檢驗(yàn)2014-12-9近似的顯著性水平(Asym717.2.22檢驗(yàn)應(yīng)注意的問(wèn)題7.2兩個(gè)分類(lèi)變量的獨(dú)立性檢驗(yàn)7.2.22檢驗(yàn)應(yīng)注意的問(wèn)題7.2兩個(gè)分類(lèi)變72在應(yīng)用2檢驗(yàn)時(shí),要求樣本量應(yīng)足夠大,特別是每個(gè)單元格的期望頻數(shù)不能太小,否則應(yīng)用應(yīng)檢驗(yàn)可能會(huì)得出錯(cuò)誤的結(jié)論;從2統(tǒng)計(jì)量的公式可以看出,期望頻數(shù)在公式的分母上,如果某個(gè)單元格的期望頻數(shù)過(guò)小,統(tǒng)計(jì)量的值就會(huì)變大,從而導(dǎo)致拒絕原假設(shè);應(yīng)用2檢驗(yàn)時(shí)對(duì)單元格的期望頻數(shù)有以下要求:如果僅有兩個(gè)單元格,單元格的最小期望頻數(shù)不應(yīng)小于5。否則不能進(jìn)行2檢驗(yàn);單元格在兩個(gè)以上時(shí),期望頻數(shù)小于5的單元格不能超

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論