卡方檢驗(yàn)課件_第1頁(yè)
卡方檢驗(yàn)課件_第2頁(yè)
卡方檢驗(yàn)課件_第3頁(yè)
卡方檢驗(yàn)課件_第4頁(yè)
卡方檢驗(yàn)課件_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

心理統(tǒng)計(jì)黃華hhsky@126.com.心理統(tǒng)計(jì)黃華.1Ch17:卡方分析date200909.Ch17:卡方分析date.217卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表單因素

檢驗(yàn):配合度檢驗(yàn)雙因素

檢驗(yàn):一致性和獨(dú)立性相關(guān)樣本的

檢驗(yàn)

檢驗(yàn)SPSS操作.17卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表.3Review:品質(zhì)變量和數(shù)量變量(ch02)變量定量的(Quantitative)離散的(Discrete)連續(xù)的(Continuous)定性的(Qualitative)有序的(Ordinal)分類(lèi)的(Categorical).Review:品質(zhì)變量和數(shù)量變量(ch02)變量定量的(Qu4品質(zhì)數(shù)據(jù)品質(zhì)變量的結(jié)果表現(xiàn)為類(lèi)別,各類(lèi)別用符號(hào)或數(shù)字代碼來(lái)測(cè)度例如:性別(男,女)用1跟2來(lái)表示使用定類(lèi)或定序尺度你吸煙嗎?1.是;2.否你贊成還是反對(duì)這一改革方案?1.贊成;2.反對(duì)對(duì)品質(zhì)數(shù)據(jù)的描述和分析通常使用列聯(lián)表.品質(zhì)數(shù)據(jù)品質(zhì)變量的結(jié)果表現(xiàn)為類(lèi)別,各類(lèi)別用符號(hào)或數(shù)字代碼來(lái)測(cè)5列聯(lián)表由兩個(gè)以上的變量進(jìn)行交叉分類(lèi)的頻數(shù)分布表行變量的類(lèi)別用r

表示,ri

表示第i

個(gè)類(lèi)別列變量的類(lèi)別用c

表示,cj

表示第j

個(gè)類(lèi)別每種組合的觀察頻數(shù)用fij

表示一個(gè)

r行c

列的列聯(lián)表稱為r

c

列聯(lián)表nf12+f22f11+f21合計(jì)f21+f22f22f21i=2f11+f12合計(jì)f12j=1j=1f11i=1列(cj)行(ri)列.列聯(lián)表由兩個(gè)以上的變量進(jìn)行交叉分類(lèi)的頻數(shù)分布表nf12+f6列聯(lián)表:案例你在一個(gè)集團(tuán)公司擔(dān)任HR助理,本公司在四個(gè)不同的地區(qū)設(shè)有分公司,現(xiàn)HR部門(mén)欲進(jìn)行一項(xiàng)改革,此項(xiàng)改革可能涉及到各分公司的利益,故采用抽樣調(diào)查方式,從四個(gè)分公司共抽取420個(gè)樣本單位(人),了解職工對(duì)此項(xiàng)改革的看法,調(diào)查結(jié)果如下表。問(wèn):不同的分公司的員工對(duì)方案的態(tài)度有差異嗎?一分公司二分公司三分公司四分公司合計(jì)贊成68755779279反對(duì)32753331141合計(jì)10012090110420.列聯(lián)表:案例你在一個(gè)集團(tuán)公司擔(dān)任HR助理,本公司在四個(gè)不同的7觀察值的分布邊緣分布行邊緣分布行觀察值的合計(jì)數(shù)的分布例如,贊成改革方案的共有279人,反對(duì)改革方案的141人列邊緣分布列觀察值的合計(jì)數(shù)的分布例如,四個(gè)分公司接受調(diào)查的人數(shù)分別為100人……110人條件分布與條件頻數(shù)變量X條件下變量Y的分布,或變量Y條件下變量X的分布。每個(gè)具體的觀察值稱為條件頻數(shù).觀察值的分布邊緣分布.8觀察值的分布一分公司二分公司三分公司四分公司合計(jì)贊成68755779279反對(duì)32753331141合計(jì)10012090110420列邊緣分布行邊緣分布條件頻數(shù).觀察值的分布一分公司二分公司三分公司四分公司合計(jì)贊成68759期望頻數(shù)假定行變量和列變量是獨(dú)立的一個(gè)實(shí)際頻數(shù)fij的期望頻數(shù)eij

,是總頻數(shù)n乘以該實(shí)際頻數(shù)fij落入第i行和第j列的概率,即例如,第1行和第1列的實(shí)際頻數(shù)為f11,它落在第1行的概率估計(jì)值為該行的頻數(shù)之和r1除以總頻數(shù)的個(gè)數(shù)n,即r1/n;它落在第1列的概率的估計(jì)值為該列的頻數(shù)之和c1除以總頻數(shù)的個(gè)數(shù)n

,即c1/n。根據(jù)概率乘法公式,該頻數(shù)落在第1行和第1列的概率應(yīng)為本案例中:.期望頻數(shù)假定行變量和列變量是獨(dú)立的.10期望頻數(shù)的分布根據(jù)上述公式計(jì)算的前例的期望頻數(shù)一分公司二分公司三分公司四分公司贊成實(shí)際頻數(shù)68755779期望頻數(shù)66806073反對(duì)實(shí)際頻數(shù)32753331期望頻數(shù)34403037.期望頻數(shù)的分布根據(jù)上述公式計(jì)算的前例的期望頻數(shù)一分公司二分公11列聯(lián)表的分析:

檢驗(yàn)用于檢驗(yàn)列聯(lián)表中變量之間是否存在顯著性差異,或者用于檢驗(yàn)變量之間是否獨(dú)立。計(jì)算公式為.列聯(lián)表的分析:檢驗(yàn)用于檢驗(yàn)列聯(lián)表中變量之間是否存在顯1217卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表單因素

檢驗(yàn):配合度檢驗(yàn)雙因素

檢驗(yàn):一致性和獨(dú)立性相關(guān)樣本的

檢驗(yàn)

檢驗(yàn)SPSS操作.17卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表.13單因素

檢驗(yàn):配合度檢驗(yàn)卡方配適(配合)度檢定(TheChi-SqaureGoodness-of-FitTest)檢定資料的次數(shù)分布是否合乎某種特定的分布;我們經(jīng)常想要知道樣本在某些性質(zhì)上的比例分布是否與總體相同,例如肇慶市居民的年齡分布是否與全廣東的人口年齡分布相同?民意測(cè)驗(yàn)調(diào)查的樣本中,受訪者的教育程度分布是否能正確反映廣東人口的教育分布?此類(lèi)問(wèn)題涉及到單因素的配合度的檢驗(yàn)。H0:總體在某性質(zhì)上呈現(xiàn)某種比例分布H1:總體不為某種比例分布.單因素檢驗(yàn):配合度檢驗(yàn)卡方配適(配合)度檢定(The14案例美國(guó)商業(yè)司以收入來(lái)將家戶分類(lèi)。人口統(tǒng)計(jì)數(shù)據(jù)顯示美國(guó)的家庭收入有下列的分布:Joliet市的市長(zhǎng)想要知道該市的收入分布是否與全美國(guó)的情況相當(dāng):在Joliet市中抽取200戶人家來(lái)驗(yàn)證上述假設(shè),并算出每層級(jí)收入中,實(shí)際上觀察到的次數(shù)分布(observedfrequencies)分別為55,65,72,8。問(wèn):該市的收入分布是否與全美國(guó)的情況相當(dāng).案例美國(guó)商業(yè)司以收入來(lái)將家戶分類(lèi)。人口統(tǒng)計(jì)數(shù)據(jù)顯示美國(guó)的家庭15解答思路H0:p1=.2,p2=.3,p3=.4,p4=.1H1:H0中至少有一個(gè)比例不正確;如果我們的虛擬假設(shè)為真,則200戶預(yù)期的分布為下表:將實(shí)際上觀察到的次數(shù)分布與預(yù)期的分布作比較,如果兩個(gè)次數(shù)十分接近,則虛擬假設(shè)為真的機(jī)率很大,但如果兩者差距很大,則我們虛擬假設(shè)為真的機(jī)率不高。.解答思路H0:p1=.2,p2=.3,p3=.4,p416解答思路cont.如何知道兩組數(shù)字的差距是否夠大?為了檢驗(yàn)兩者的差距是否很大,我們以一個(gè)簡(jiǎn)要的指標(biāo)來(lái)衡量,即

統(tǒng)計(jì)量。.解答思路cont.如何知道兩組數(shù)字的差距是否夠大?.17解答思路cont.Criticalvalue=11.34.解答思路cont.Criticalvalue=11.318配合度檢驗(yàn):總結(jié)由上述的討論可知,卡方配合度檢驗(yàn)的步驟為:(1)對(duì)于總體的分布作了一些假設(shè);(2)然后找出在假設(shè)為真的前提下,我們預(yù)期得到的樣本分布;(3)比較實(shí)際觀察到的分布與預(yù)期分布之間是否一致,以此來(lái)驗(yàn)證我們對(duì)于總體分布的假設(shè)是否合理。我們可以用配合度檢驗(yàn)來(lái)檢驗(yàn)隨機(jī)變量X是否具有某種概率分布.配合度檢驗(yàn):總結(jié)由上述的討論可知,卡方配合度檢驗(yàn)的步驟為:.19練習(xí)1995美國(guó)暴力犯罪的類(lèi)型分布500件95年以來(lái)犯罪的隨機(jī)樣本請(qǐng)問(wèn)暴力犯罪型態(tài)從1995以來(lái)是否已經(jīng)發(fā)生變化?.練習(xí)1995美國(guó)暴力犯罪的類(lèi)型分布500件95年以來(lái)犯罪的隨20練習(xí)答案.練習(xí)答案.2117卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表單因素

檢驗(yàn):配合度檢驗(yàn)雙因素

檢驗(yàn):一致性和獨(dú)立性相關(guān)樣本的

檢驗(yàn)

檢驗(yàn)SPSS操作.17卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表.22雙因素

檢驗(yàn):獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn):檢驗(yàn)列聯(lián)表中的行變量與列變量之間是否獨(dú)立,或判斷兩個(gè)因素之間是否存在關(guān)聯(lián)。檢驗(yàn)的步驟為提出假設(shè)H0:行變量與列變量獨(dú)立H1:行變量與列變量不獨(dú)立計(jì)算檢驗(yàn)的統(tǒng)計(jì)量進(jìn)行決策根據(jù)顯著性水平和自由度(r-1)(c-1)查出臨界值

2若2

2,拒絕H0;若2<

2,接受H0.雙因素檢驗(yàn):獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn):檢驗(yàn)列聯(lián)表中的行變量23獨(dú)立性檢驗(yàn):案例一批學(xué)生來(lái)自三個(gè)不同的學(xué)區(qū),學(xué)生數(shù)理能力被分成ABC三個(gè)不同等級(jí)。從這批學(xué)生中隨機(jī)抽取500個(gè)進(jìn)行檢驗(yàn),結(jié)果如下表。檢驗(yàn)各學(xué)區(qū)與數(shù)理能力之間是否存在依賴關(guān)系(

0.05)ABC合計(jì)地區(qū)甲526424140乙605952171丙506574189合計(jì)162188150500.獨(dú)立性檢驗(yàn):案例一批學(xué)生來(lái)自三個(gè)不同的學(xué)區(qū),學(xué)生數(shù)理能力被分24獨(dú)立性檢驗(yàn):案例提出假設(shè)H0:地區(qū)與原料等級(jí)之間獨(dú)立H1:地區(qū)與原料等級(jí)之間不獨(dú)立計(jì)算檢驗(yàn)的統(tǒng)計(jì)量根據(jù)顯著性水平=0.05和自由度(3-1)(3-1)=4查出相應(yīng)的臨界值

2=9.488。由于2=19.82>

2=9.448,拒絕H0.獨(dú)立性檢驗(yàn):案例提出假設(shè).25練習(xí)某學(xué)校對(duì)學(xué)生的課外活動(dòng)內(nèi)容進(jìn)行調(diào)查,結(jié)果如表所示。問(wèn)學(xué)生性別與他們選擇的活動(dòng)之間是否存在關(guān)聯(lián)?.練習(xí)某學(xué)校對(duì)學(xué)生的課外活動(dòng)內(nèi)容進(jìn)行調(diào)查,結(jié)果如表所示。問(wèn)學(xué)生26一致性(同質(zhì)性)檢驗(yàn)一致性檢驗(yàn):判斷幾次重復(fù)試驗(yàn)的結(jié)果是否相同。獨(dú)立性檢驗(yàn)關(guān)注的是列鏈表兩個(gè)因素之間是否存在關(guān)聯(lián),在一致性檢驗(yàn)中,其中一個(gè)因素反映的是幾個(gè)重復(fù)試驗(yàn),它關(guān)注的是這幾個(gè)重復(fù)試驗(yàn)的結(jié)果有無(wú)顯著差異。實(shí)際上兩者沒(méi)有本質(zhì)差異,雙因素卡方檢驗(yàn)往往既可以理解為一致性檢驗(yàn),也可以理解為獨(dú)立性檢驗(yàn)。數(shù)據(jù)結(jié)構(gòu)、統(tǒng)計(jì)量和計(jì)算/檢驗(yàn)過(guò)程與獨(dú)立性檢驗(yàn)相同。(略).一致性(同質(zhì)性)檢驗(yàn)一致性檢驗(yàn):判斷幾次重復(fù)試驗(yàn)的結(jié)果是否相27練習(xí):一致性檢驗(yàn)對(duì)男/女性進(jìn)行職業(yè)觀調(diào)查,在問(wèn)及“面臨事業(yè)與家庭的兩難決策時(shí),你愿意將事業(yè)還是家庭放在第一位”時(shí),79位被調(diào)查的男人中有51位選擇了事業(yè),而68位女性受訪者中45位選擇了家庭。對(duì)于這個(gè)觀點(diǎn)的態(tài)度與性別有關(guān)系嗎?請(qǐng)嘗試用今天的知識(shí)問(wèn)答。(H0:兩種性別的受訪者的態(tài)度一致/相同)如果將H0設(shè)定為:性別與受訪者的態(tài)度有關(guān)嗎?則為獨(dú)立性檢驗(yàn)。并請(qǐng)思考還有其他的解決辦法嗎?.練習(xí):一致性檢驗(yàn)對(duì)男/女性進(jìn)行職業(yè)觀調(diào)查,在問(wèn)及“面臨事業(yè)與282×2的

檢驗(yàn)在雙因素卡方檢驗(yàn)中,兩個(gè)因素都只有兩個(gè)水平,就成為一個(gè)2×2的卡方檢驗(yàn)。每種處理只產(chǎn)生兩種相互對(duì)立的結(jié)果,如生與死,支持與反對(duì),通過(guò)與不通過(guò),陽(yáng)性與陰性,等等。獨(dú)立樣本的情況,如下表所示:.2×2的檢驗(yàn)在雙因素卡方檢驗(yàn)中,兩個(gè)因素都只有兩個(gè)水平,29基本思想概括若H0成立,則四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T之差異純系抽樣誤差所致,故一般不會(huì)很大,

2值也就不會(huì)很大;在一次隨機(jī)試驗(yàn)中,出現(xiàn)大的

2值的概率P是很小的。因此,若根據(jù)實(shí)際樣本資料求得一個(gè)很小的P,且P≤

(檢驗(yàn)水準(zhǔn)),根據(jù)小概率原理,就有理由懷疑H0的真實(shí)性,因而拒絕它;若P>

,則沒(méi)有理由拒絕H0(其實(shí)思路跟前述的卡方檢驗(yàn)思想一致).基本思想概括若H0成立,則四個(gè)格子的實(shí)際頻數(shù)A與理論頻數(shù)T之30獨(dú)立樣本:四格表專(zhuān)用公式

2檢驗(yàn)的條件:n≥40且所有T≥5

2校正的條件:n≥40但有l(wèi)≤T<5當(dāng)n和T過(guò)小,如T<1或n<40時(shí)因近似程度太差,不宜用

2檢驗(yàn),而應(yīng)改用確切概率法。專(zhuān)用公式和矯正公式如下所示:.獨(dú)立樣本:四格表專(zhuān)用公式2檢驗(yàn)的條件:n≥40且所有31案例你打算研究在心理咨詢中認(rèn)知療法與行為療法的效果。你對(duì)兩種療法的結(jié)果進(jìn)行了對(duì)比,數(shù)據(jù)如下。問(wèn):兩種療法之間導(dǎo)致的心理障礙緩解率有差異嗎?.案例你打算研究在心理咨詢中認(rèn)知療法與行為療法的效果。你對(duì)兩種32案例:解答過(guò)程H0:p1=p2;(兩個(gè)療法的緩解率沒(méi)有差異)

H1:p1

p2。

=0.05。

本例a格的理論頻數(shù)最小,T11=12

16/41=4.68<5,n>40,故考慮用校正公式計(jì)算

2值。按df=1查附表3,

2界值表,得P>0.05,按

=0.05水準(zhǔn)不拒絕H0,差異無(wú)統(tǒng)計(jì)學(xué)意義。故根據(jù)本資料尚不能認(rèn)為兩種療法的總體緩解率有差別。.案例:解答過(guò)程H0:p1=p2;(兩個(gè)療法的緩解率沒(méi)有差異)33練習(xí)你對(duì)學(xué)校男生與女生的幸福感有興趣,于是你去作隨機(jī)抽樣調(diào)查,認(rèn)為幸福的人和不幸福的人的分布如下。請(qǐng)問(wèn):男生與女生之間幸福水平存在差異嗎?.練習(xí)你對(duì)學(xué)校男生與女生的幸福感有興趣,于是你去作隨機(jī)抽樣調(diào)查3417卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表單因素

檢驗(yàn):配合度檢驗(yàn)雙因素

檢驗(yàn):一致性和獨(dú)立性相關(guān)樣本的

檢驗(yàn)

檢驗(yàn)SPSS操作.17卡方分析品質(zhì)數(shù)據(jù)及其整理:列聯(lián)表.35相關(guān)樣本的

檢驗(yàn)相關(guān)樣本四格表資料

2檢驗(yàn)的目的是通過(guò)對(duì)單一樣本或配對(duì)樣本數(shù)據(jù)的分析,推斷兩種處理的結(jié)果有無(wú)差別。對(duì)同一樣本分別用甲、乙兩種方法處理,配對(duì)設(shè)計(jì)是常用的設(shè)計(jì)方法之一,二分類(lèi)結(jié)果資料的配對(duì)研究常用于比較兩種實(shí)驗(yàn)處理方法、比如兩種教學(xué)方法的差別。.相關(guān)樣本的檢驗(yàn)相關(guān)樣本四格表資料2檢驗(yàn)的目的是通過(guò)對(duì)單36相關(guān)樣本2*2

2檢驗(yàn)的應(yīng)用當(dāng)b+c>40時(shí):直接計(jì)算

2當(dāng)20<b+c≤40時(shí):計(jì)算

2C(矯正值)當(dāng)b+c≤20時(shí):計(jì)算確切概率(略).相關(guān)樣本2*22檢驗(yàn)的應(yīng)用當(dāng)b+c>40時(shí):直接計(jì)算237案例一家俱樂(lè)部想了解觀看主場(chǎng)比賽是否導(dǎo)致公眾對(duì)其支持態(tài)度的改變。隨機(jī)選取了239名觀看比賽的球迷進(jìn)行賽前賽后的調(diào)查,結(jié)果如下。問(wèn),比賽是否會(huì)影響球迷對(duì)球隊(duì)的態(tài)度。.案例一家俱樂(lè)部想了解觀看主場(chǎng)比賽是否導(dǎo)致公眾對(duì)其支持態(tài)度的改38案例:解答過(guò)程H0:觀看比賽前后球迷對(duì)球隊(duì)的支持不變,即總體B=C;H1:觀看比賽前后球迷對(duì)球隊(duì)的支持改變,即總體B

C。

=0.05。計(jì)算統(tǒng)計(jì)量(20<b+c≤40:計(jì)算

2C)按df=1查

2界值表,P<0.005。在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論