第 分類變量的推斷_第1頁
第 分類變量的推斷_第2頁
第 分類變量的推斷_第3頁
第 分類變量的推斷_第4頁
第 分類變量的推斷_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

會計學1第分類變量的推斷第7章分類變量的推斷7.1一個分類變量的擬合優(yōu)度檢驗

7.2兩個分類變量的獨立性檢驗

7.3兩個分類變量的相關性度量

c2test第1頁/共43頁2021-6-20學習目標一個分類變量的擬合優(yōu)度檢驗兩個分類變量的獨立性檢驗應用2檢驗應注意的問題兩個分類變量的相關性度量

用SPSS進行2檢驗第2頁/共43頁2021-6-20性別與是否逃課有關系嗎?讀完四年大學,一次課也沒有逃過,這樣的學生恐怕不多2004年5月,中國人民大學財政金融學院的3名學生就逃課問題做了一次調(diào)查。調(diào)查的對象是財政金融學院的大一,大二,大三本科生。樣本的抽取方式是分層抽樣與簡單隨機抽樣結(jié)合,先根據(jù)年級劃分層次,然后對各個班級簡單隨機抽樣,共抽取150名學生組成一個樣本,并對每個學生采用問卷調(diào)查。問卷內(nèi)容包括每周逃課次數(shù)、所逃課程的類型(選修課、專業(yè)課等等)和逃課原因等。調(diào)查得到的男女學生逃課情況的匯總表如下第3頁/共43頁2021-6-20性別與是否逃課有關系嗎?這里涉及到兩個分類變量,一個是逃課情況,一個是性別根據(jù)上面的數(shù)據(jù),你認為性別與逃課與否有關系嗎?如何來檢驗兩個分類變量之間是否存在關系呢?學完本章內(nèi)容就很容易解決這樣的問題第4頁/共43頁7.1一個分類變量的擬合優(yōu)度檢驗

7.1.1期望頻數(shù)相等

7.1.2期望頻數(shù)不等

第7章分類變量的推斷第5頁/共43頁2021-6-20利用Pearson-2統(tǒng)計量來判斷某個分類變量各類別的觀察頻數(shù)分布與某一理論分布或期望分布是否一致的檢驗方法比如,各月份的產(chǎn)品銷售量是否符合均勻分布不同地區(qū)的離婚率是否有顯著差異也稱為一致性檢驗(testofhomogeneity)該檢驗也可用于判斷各類別的觀察頻數(shù)分布是否符合泊松分布或正態(tài)分布等什么是擬合優(yōu)度檢驗?

(goodnessoffittest)第6頁/共43頁7.1.1期望頻數(shù)相等7.1一個分類變量的擬合優(yōu)度檢驗第7頁/共43頁2021-6-20【例7-1】為研究消費者對不同品牌的牛奶是否有明顯偏好,一家調(diào)查公司抽樣調(diào)查了500個消費者對4個品牌的偏好情況,得到的結(jié)果如下表所示。檢驗消費者對牛奶品牌的偏好是否有顯著差異(=0.05)擬合優(yōu)度檢驗

(期望頻數(shù)相等)第8頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)相等)第1步:提出假設

H0:觀察頻數(shù)與期望頻數(shù)無顯著差異(無明顯偏好)H1

:觀察頻數(shù)與期望頻數(shù)有顯著差異(有明顯偏好)第2步:計算2統(tǒng)計量自由度df=類別個數(shù)-1第9頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)相等)2統(tǒng)計量計算表第10頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)相等)第3步:做出決策由于自由度=4-1=3,利用Excel的【CHIDIST】函數(shù)計算的統(tǒng)計量的P值(右尾概率)為6.22366E-12,由于P值接近于0。拒絕原假設,表明消費者對牛奶品牌的偏好有顯著差異第11頁/共43頁2021-6-20擬合優(yōu)度檢驗

(使用SPSS—期望頻數(shù)相等)

第1步:先指定“頻數(shù)”變量點擊【Data】→【W(wǎng)eight-Cases】,選擇

【W(wǎng)eightcasesby】,將“頻數(shù)”(本例為人數(shù))

選入【FrequencyVariable】,點擊【OK】

第2步:選擇菜單:【Analyze】→【NonparametricTest】→【ChiSquare】,進入主對話框第3步:將頻數(shù)變量選入(本例為人數(shù))【TestVariableList】。點擊【OK】用SPSS進行檢驗SPSS第12頁/共43頁2021-6-20擬合優(yōu)度檢驗

(使用SPSS)近似的顯著性水平(Asymp.Sig.)即為P值。由于P值接近于0。拒絕原假設,表明消費者對牛奶品牌的偏好有顯著差異第13頁/共43頁7.1.2期望頻數(shù)不等7.1一個分類變量的擬合優(yōu)度檢驗第14頁/共43頁2021-6-20【例7-2】一項針對全國的房地產(chǎn)價格調(diào)查表明,城鎮(zhèn)居民對房價表示非常不滿意的占15%,不滿意的占45%,一般的占25%,滿意的占9%,非常滿意的占6%。為研究一線大城市的居民對房地產(chǎn)價格的滿意程度,一家研究機構在某城市抽樣調(diào)查300人,其中的一個問題是:“您對目前的住房價格是否滿意?”調(diào)查共設非常不滿意、不滿意、一般、滿意、非常滿意5個選項。調(diào)查結(jié)果的頻數(shù)分布如下表所示。檢驗該城市居民對房屋價格滿意度評價的頻數(shù)與全國的調(diào)查頻數(shù)是否一致擬合優(yōu)度檢驗

(期望頻數(shù)不等)第15頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)不等)第1步:提出假設

H0:該城市居民對房屋價格的評價頻數(shù)與全國的評價頻數(shù)無顯著差異

H1

:該城市居民對房屋價格的評價頻數(shù)與全國的評價頻數(shù)有顯著差異第2步:計算期望頻數(shù)和2統(tǒng)計量自由度df=類別個數(shù)-1第16頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)不等)期望頻數(shù)計算表第17頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)不等)2統(tǒng)計量計算表第18頁/共43頁2021-6-20擬合優(yōu)度檢驗

(期望頻數(shù)不等)第3步:做出決策由于自由度=5-1=4,利用Excel的【CHIDIST】函數(shù)計算的統(tǒng)計量的P值(右尾概率)為0.102662,由于P>0.05。不拒絕原假設,沒有證據(jù)表明該城市居民對房屋價格滿意度的評價與全國有顯著差異第19頁/共43頁2021-6-20擬合優(yōu)度檢驗

(使用SPSS—期望頻數(shù)不等)第1步:先指定“頻數(shù)”變量第2步:選擇菜單:【Analyze】→【NonparametricTest】→【ChiSquare】,進入主對話框第3步:將頻數(shù)變量選入【TestVariableList】第4步:在【ExpectedValues】下選擇【Values】,并將相應的期望比例(本例為全國的調(diào)查比例)

依次輸入到框內(nèi)并點擊【Add】(每次只能輸入1個,并點擊【Add】,然后在輸入另一個,再點擊【Add】…)。點擊【OK】用SPSS進行檢驗SPSS第20頁/共43頁2021-6-20擬合優(yōu)度檢驗

(使用SPSS)近似的顯著性水平(Asymp.Sig.)即為P值。由于P>0.05。不拒絕原假設,沒有證據(jù)表明該城市居民對房屋價格滿意度的評價與全國有顯著差異第21頁/共43頁7.2兩個分類變量的獨立性檢驗

7.2.1列聯(lián)表與2獨立性檢驗

7.2.2應用2檢驗應注意的問題第7章分類變量的推斷第22頁/共43頁7.2.1列聯(lián)表與2獨立性檢驗

7.2兩個分類變量的獨立性檢驗第23頁/共43頁2021-6-20研究兩個分類變量時,每個變量有多個類別,通常將兩個變量多個類別的頻數(shù)用交叉表的形式表示出來一個變量放在行(row)的位置,稱為行變量,其類別數(shù)(行數(shù))用r表示另一個變量放在列(column)的位置,稱為列變量,其類別數(shù)(列數(shù))用c表示這種由兩個或兩個以上分類變量交叉分類的頻數(shù)分布表稱為列聯(lián)表(contingencytable)一個由r行和c列組成的列聯(lián)表也稱為rc列聯(lián)表例如,本章開頭的案例中,行變量“逃課情況”有兩個類別,列變量“性別”也有兩個類別,這就是一個22列聯(lián)表什么是獨立性檢驗?

(testofindependence)第24頁/共43頁2021-6-20對列聯(lián)表中的兩個分類變量進行分析,通常是判斷兩個變量是否獨立該檢驗的原假設是:兩個變量獨立(無關)如果原假設被拒絕,則表明兩個變量不獨立,或者說兩個變量相關獨立性檢驗的統(tǒng)計量為什么是獨立性檢驗?

(testofindependence)自由度df=(r-1)(c-1)第25頁/共43頁2021-6-20【例7-3】利用本章開頭關于學生逃課情況調(diào)查的數(shù)據(jù),如下表所示。檢驗性別與逃課情況是否獨立2獨立性檢驗

(例題分析)第26頁/共43頁2021-6-202獨立性檢驗

(例題分析)第1步:提出假設

H0:性別與是否逃課獨立

H1

:性別與是否逃課不獨立第2步:計算期望頻數(shù)和2統(tǒng)計量RT為給定單元格所在行的合計頻數(shù);CT為給定單元格所在列的合計頻數(shù);n為樣本量第27頁/共43頁2021-6-202獨立性檢驗

(例題分析)第2步:計算期望頻數(shù)和2統(tǒng)計量第28頁/共43頁2021-6-202獨立性檢驗

(例題分析)第3步:做出決策由于自由度=(2-1)(2-1)=1,利用Excel的【CHIDIST】函數(shù)計算的統(tǒng)計量的P值(右尾概率)為0.159372,由于P>0.05。不拒絕原假設,可以認為性別與逃課情況獨立第29頁/共43頁2021-6-202獨立性檢驗

(使用SPSS)@將列聯(lián)表中的數(shù)據(jù)轉(zhuǎn)換為原始數(shù)據(jù)形式

第1步:選擇【Analyze】→【DescriptiveStatistics-

Crosstabs】,進入主對話框第2步:將行變量(本例為“逃課情況”)選入【Row(s)】,將列變量(本例為“性別”)選入【Column(s)】(行列可以互換)第3步:點擊【Statistics】并選中【Chi-square】;點擊

【Continue】返回主對話框點擊【Cells】,在【Counts】下選中【Expected】,點擊【Continue】返回主對話框。點擊【OK】用SPSS進行檢驗SPSS第30頁/共43頁2021-6-202獨立性檢驗

(使用SPSS)近似的顯著性水平(Asymp.Sig.)即為P值。由于P>0.05。不拒絕原假設,可以認為性別與逃課情況獨立第31頁/共43頁7.2.2應用2檢驗應注意的問題7.2兩個分類變量的獨立性檢驗第32頁/共43頁2021-6-20在應用2檢驗時,要求樣本量應足夠大,特別是每個單元格的期望頻數(shù)不能太小,否則應用應檢驗可能會得出錯誤的結(jié)論從2統(tǒng)計量的公式可以看出,期望頻數(shù)在公式的分母上,如果某個單元格的期望頻數(shù)過小,統(tǒng)計量的值就會變大,從而導致拒絕原假設應用2檢驗時對單元格的期望頻數(shù)有以下要求如果僅有兩個單元格,單元格的最小期望頻數(shù)不應小于5。否則不能進行2檢驗單元格在兩個以上時,期望頻數(shù)小于5的單元格不能超過總格子數(shù)的20%,否則不能進行2檢驗如果出現(xiàn)期望頻數(shù)小于5的單元格超過20%,可以采取合并類別的辦法來解決這一問題應用2檢驗應注意的問題第33頁/共43頁7.3兩個分類變量的相關性度量

7.3.1系數(shù)和Cramer’sV系數(shù)

7.3.2列聯(lián)系數(shù)第7章分類變量的推斷第34頁/共43頁7.3.1系數(shù)和Cramer’sV系數(shù)7.3兩個分類變量的相關性測量第35頁/共43頁2021-6-20主要用于22列聯(lián)表的相關性測量計算公式為例7—3的計算結(jié)果,得到的性別與逃課情況兩個變量之間的系數(shù)為0.114891。由于很小,表明性別與逃課情況不存在相關關系。這與獨立性檢驗的結(jié)論是一致的系數(shù)

(

coefficient)第36頁/共43頁2021-6-20由Cramer提出,計算公式為Cramer’sV系數(shù)的取值范圍總是在0~1之間當兩個變量獨立時,V=0;當兩個變量完全相關時,V=1如果列聯(lián)表的行數(shù)或列數(shù)中有一個為2,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論