版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十四講:卡方檢驗(yàn)及SPSS分析
Chi-SquareTest
卡方檢驗(yàn)類型擬合良度檢驗(yàn):用來(lái)檢驗(yàn)一個(gè)因素多項(xiàng)分類的實(shí)際觀測(cè)次數(shù)與理論次數(shù)是否一致獨(dú)立性檢驗(yàn):雙向分類變量之間彼此相關(guān)還是相互獨(dú)立?如:學(xué)習(xí)成績(jī):優(yōu)、良、中、差與性別的關(guān)系主要內(nèi)容第一節(jié)四格表資料的檢驗(yàn)第二節(jié)配對(duì)四格表資料的檢驗(yàn)第三節(jié)四格表資料的Fisher確切概率法第四節(jié)行×列表資料的檢驗(yàn)第五節(jié)多個(gè)樣本率間的多重比較
χ2檢驗(yàn)(chi-squaretest)是專門用于計(jì)數(shù)數(shù)據(jù)的統(tǒng)計(jì)方法。由于這類數(shù)據(jù)在整理時(shí),常常以列聯(lián)表(contingencytable)或交叉表(crosstabulation)呈現(xiàn),因此這種分析方法又被稱為列聯(lián)表分析或交叉表分析。一.χ2檢驗(yàn)及其特點(diǎn)1.χ2分布χ2分布是統(tǒng)計(jì)學(xué)中應(yīng)用較多的一種抽樣分布。χ2值是從同一總體中隨機(jī)抽取的無(wú)限多個(gè)容量為n的樣本數(shù)據(jù)的平方和或標(biāo)準(zhǔn)分?jǐn)?shù)的平方和,即或此時(shí)χ2分布的自由度為df=n。如果正態(tài)總體的平均數(shù)未知,需要用樣本平均數(shù)作為總體平均數(shù)的估計(jì)值,這時(shí)公式變?yōu)椋?/p>
此時(shí),χ2分布的自由度為df=n-1。χ2分布曲線相對(duì)頻數(shù)圖15-1幾種不同自由度的χ2分布曲線(α=0.05)n=1n=4n=10n=20χ2顯而易見(jiàn),χ2檢驗(yàn)主要應(yīng)用的是右側(cè)概率。2.χ2分布的特點(diǎn)
⑴.χ2分布呈正偏態(tài),曲線的右側(cè)無(wú)限延伸,但不與基線相交。⑵.χ2值都是正值。⑶.χ2分布的和也是χ2分布。⑷.χ2分布隨自由度的變化而不同。自由度越小,曲線偏斜度越大;自由度越大,分布形態(tài)越趨于對(duì)稱。3.χ2檢驗(yàn)χ2檢驗(yàn)用于對(duì)點(diǎn)計(jì)而來(lái)的離散型數(shù)據(jù)資料進(jìn)行假設(shè)檢驗(yàn),對(duì)總體的分布不做要求,也不對(duì)總體參數(shù)進(jìn)行推論。χ2檢驗(yàn)主要是對(duì)總體的數(shù)據(jù)分布進(jìn)行假設(shè)檢驗(yàn),因此屬于自由分布的非參數(shù)檢驗(yàn)。χ2檢驗(yàn)是對(duì)由樣本得來(lái)的實(shí)際頻數(shù)與理論頻數(shù)的分布是否有顯著性差異所進(jìn)行的檢驗(yàn)。其計(jì)算公式為:這一公式是根據(jù)1899年統(tǒng)計(jì)學(xué)家皮爾遜推導(dǎo)的配合適度的理論公式而來(lái)。這是與前述χ2分布非常近似的次數(shù)分布。當(dāng)fe越大時(shí),其接近的越好。(15.1)二.單向表的χ2檢驗(yàn)
(配合度檢驗(yàn))把實(shí)得的點(diǎn)計(jì)數(shù)據(jù)只按一種分類標(biāo)準(zhǔn)編制成表就是單向表。對(duì)單向表的數(shù)據(jù)所進(jìn)行的χ2檢驗(yàn),稱為單向表的χ2檢驗(yàn),也稱為配合度檢驗(yàn)(goodnessoffittest)。1.單向表χ2檢驗(yàn)的計(jì)算公式單向表中只有一個(gè)變量,被按一定標(biāo)準(zhǔn)分為k組。單向表χ2檢驗(yàn)中,χ2值的計(jì)算公式可采用(15.1)式,自由度為df=k-1。2.單向表χ2檢驗(yàn)中理論頻數(shù)的計(jì)算兩種情形各類別理論頻數(shù)相等各類別理論頻數(shù)符合一定的比例計(jì)算要點(diǎn)將總頻數(shù)平均分到幾個(gè)類別將總頻數(shù)按已知比例分到幾個(gè)類別3.χ2檢驗(yàn)的計(jì)算表15-1單向表χ2檢驗(yàn)計(jì)算表分組Ⅰ分組Ⅱ分組Ⅲ總和χ2
例1:隨機(jī)抽取60名學(xué)生,詢問(wèn)他們?cè)诟咧惺欠裥枰睦矸挚?,贊成分科?9人,反對(duì)分科的21人,問(wèn)他們對(duì)分科的意見(jiàn)是否有顯著差異?解:1.提出假設(shè)H0:學(xué)生對(duì)分科的意見(jiàn)沒(méi)有顯著差異H1:學(xué)生對(duì)分科的意見(jiàn)有顯著差異2.選擇檢驗(yàn)統(tǒng)計(jì)量并計(jì)算對(duì)點(diǎn)計(jì)數(shù)據(jù)進(jìn)行差異檢驗(yàn),可選擇χ2檢驗(yàn)計(jì)算表15-2學(xué)生對(duì)分科意見(jiàn)的χ2檢驗(yàn)計(jì)算表贊成39309812.7反對(duì)2130-9812.7總和60605.4自由度為:df=k-1=13.統(tǒng)計(jì)決斷查χ2值表,當(dāng)df=1時(shí)計(jì)算結(jié)果為:χ2=5.4*3.84<χ2=5.4<6.63,則0.05>P>0.01結(jié)論:學(xué)生對(duì)高中文理分科的態(tài)度有顯著差異。表15-3χ2檢驗(yàn)統(tǒng)計(jì)決斷規(guī)則χ2與臨界值比較P值顯著性檢驗(yàn)結(jié)果χ2
<
P>0.05不顯著保留H0,拒絕H1
≤χ2<
0.05≥P>0.01顯著*在0.05顯著性水平拒絕H0,接受H1χ2
≥
P≤0.01極其顯著**在0.01顯著性水平拒絕H0,接受H1例2:大學(xué)某系54位老年教師中,健康狀況屬于好的有15人,中等的有23人,差的有16人。問(wèn)該校老年教師健康狀況好、中、差的人數(shù)比例是否為1:2:1?1.提出假設(shè)H0:健康狀況好、中、差的人數(shù)比例是1:2:1H1:健康狀況好、中、差的人數(shù)比例不是1:2:12.計(jì)算表15-4老年教師健康狀況的χ2檢驗(yàn)計(jì)算表好1513.51.52.250.167中2327.0-4.016.00.593差1613.52.56.250.463總和54541.223.結(jié)論查χ2值表,當(dāng)df=k-1=2時(shí)計(jì)算結(jié)果為:χ2=1.22χ2=1.22<5.99,則P>0.05結(jié)論:理論頻數(shù)與實(shí)際頻數(shù)差異不顯著,表明該校老年教師健康狀況的人數(shù)比例是1:2:1。4.χ2的連續(xù)性校正當(dāng)df=1時(shí),其中只要有一個(gè)組的理論頻數(shù)小于5,就要運(yùn)用亞茨(Yates)連續(xù)性校正法,計(jì)算公式為:(15.2)
之所以要進(jìn)行連續(xù)性校正,是因?yàn)橛牲c(diǎn)計(jì)數(shù)據(jù)求得的χ2值是間斷數(shù)列,當(dāng)df=1,fe<5時(shí),其間斷性尤其明顯。而χ2值表上的理論值是用連續(xù)量表表示的,其χ2分布是一條連續(xù)的光滑曲線。為了對(duì)連續(xù)的χ2曲線作較好的估計(jì),需要在每個(gè)小于理論頻數(shù)的實(shí)際頻數(shù)上加0.5,而在大于理論頻數(shù)的實(shí)際頻數(shù)上減去0.5。例3:歷年優(yōu)秀學(xué)生干部中男女比例為2:8,今年優(yōu)秀學(xué)生干部中有3個(gè)男生,7個(gè)女生。問(wèn)今年優(yōu)秀學(xué)生干部的性別比例與往年是否有顯著差異?1.提出假設(shè)H0:今年優(yōu)秀學(xué)生干部的性別比例與往年沒(méi)有顯著差異H1:今年優(yōu)秀學(xué)生干部的性別比例與往年有顯著差異2.計(jì)算表15-5學(xué)生干部性別比例的χ2檢驗(yàn)計(jì)算表男3210.50.250.125女78-10.50.250.031總和10100.156自由度為:df=k-1=13.統(tǒng)計(jì)決斷查χ2值表,當(dāng)df=1時(shí)計(jì)算結(jié)果為:χ2=0.156χ2=0.156<3.84,則P>0.05結(jié)論:優(yōu)秀學(xué)生干部中的性別比例與往年一樣。思考:為什么只有df=1時(shí)需要校正?三.頻數(shù)分布正態(tài)性的χ2檢驗(yàn)實(shí)際應(yīng)用中,常常需要對(duì)一組數(shù)據(jù)的分布是否符合正態(tài)的情況進(jìn)行檢驗(yàn)。除了用累積分布曲線的形狀和皮爾遜的經(jīng)驗(yàn)公式進(jìn)行大致判斷之外,對(duì)實(shí)際頻數(shù)分布與理論頻數(shù)的分布是否一致的χ2檢驗(yàn)是對(duì)數(shù)據(jù)分布形態(tài)進(jìn)行檢驗(yàn)的比較精確和可靠的方法。頻數(shù)分布正態(tài)性檢驗(yàn)的基本思路將待檢驗(yàn)的一組數(shù)據(jù)列成次數(shù)分布表。根據(jù)次數(shù)分布表的分組界限,計(jì)算出該組數(shù)據(jù)正態(tài)分布情況下的理論頻數(shù)。對(duì)實(shí)際頻數(shù)與理論頻數(shù)是否一致進(jìn)行χ2檢驗(yàn)。思考:如何計(jì)算各組的理論頻數(shù)?頻數(shù)分布正態(tài)性檢驗(yàn)的計(jì)算要點(diǎn)⑴.將次數(shù)分布表中各分組區(qū)間的上、下限轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)Z值;⑵.根據(jù)各組上、下限Z值查表,尋找Z=0至各組上、下限Z值之間的面積;⑶.求各組的面積(即概率)。計(jì)算中應(yīng)注意Z值的正、負(fù)號(hào)。⑷.將各組的面積與總頻數(shù)相乘,求出各組的理論頻數(shù)。計(jì)算理論頻數(shù)時(shí),兩端若有任何一組的理論頻數(shù)小于5,需要將這組的理論頻數(shù)與相鄰組的理論頻數(shù)合并。如果合并后仍然小于5,可再合并,直至大于5為止。⑸.根據(jù)計(jì)算出的理論頻數(shù)與表中的實(shí)際頻數(shù),計(jì)算各組的χ2值,并將各組χ2值相加,得到最終的χ2值。(注意:自由度為df=k-3
)獨(dú)立性檢驗(yàn)不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965由列聯(lián)表可以粗略估計(jì)出,在不吸煙者中,有0.54%患有肺癌;在吸煙者中,有2.28%患有肺癌。因此,直觀上可以得到結(jié)論:吸煙者和不吸煙者患肺癌的可能性存在差異.與表格相比,三維柱形圖和二維條形圖能更直觀地反映出相關(guān)數(shù)據(jù)的總體狀況.為調(diào)查吸煙是否對(duì)患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人):吸煙與患肺癌列聯(lián)表(列出兩個(gè)分類變量的頻數(shù)表):不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)98749199651、列聯(lián)表2、等高條形圖不吸煙吸煙患肺癌比例不患肺癌比例上面我們通過(guò)分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計(jì)觀點(diǎn)來(lái)考察這個(gè)問(wèn)題.現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”,為此先假設(shè):H0:吸煙與患肺癌沒(méi)有關(guān)系不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d把數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表:不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng).|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng).不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d吸煙與患肺癌的列聯(lián)表:如果“吸煙與患肺癌沒(méi)有關(guān)系”,則在吸煙者中不患肺癌的比例應(yīng)該與不吸煙者中相應(yīng)的比例應(yīng)差不多,即|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng).為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量若H0成立,即“吸煙與患肺癌沒(méi)有關(guān)系”,則K2應(yīng)很小.由列聯(lián)表中數(shù)據(jù),利用公式(1)計(jì)算得K2的觀測(cè)值為:(1)其中n=a+b+c+d為樣本容量.在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率:也就是說(shuō),在H0成立的情況下,對(duì)隨機(jī)變量K2進(jìn)行多次觀測(cè),觀測(cè)值超過(guò)6.635的頻率約為0.01,是一個(gè)小概率事件.現(xiàn)在K2的觀測(cè)值為56.632,遠(yuǎn)遠(yuǎn)大于6.635,所以有理由斷定H0不成立,即認(rèn)為“吸煙與患肺癌有關(guān)系”
但這種判斷會(huì)犯錯(cuò)誤,犯錯(cuò)誤的概率不會(huì)超過(guò)0.01,即我們有99%的把握認(rèn)為“吸煙與患肺癌有關(guān)系”.利用隨機(jī)變量K2來(lái)確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).獨(dú)立性檢驗(yàn):如果,就判斷H0不成立;否則就判斷H0成立.獨(dú)立性檢驗(yàn)的基本思想:類似于數(shù)學(xué)上的反證法,對(duì)“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信程度的判斷:(1)假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個(gè)分類變量沒(méi)有關(guān)系”成立.(2)在假設(shè)條件下,計(jì)算構(gòu)造的隨機(jī)變量K2,如果由觀測(cè)數(shù)據(jù)計(jì)算得到的K2很大,則在一定程度上說(shuō)明假設(shè)不合理.(3)根據(jù)隨機(jī)變量K2的含義,可以通過(guò)(2)式評(píng)價(jià)假設(shè)不合理的程度,由實(shí)際計(jì)算出的k>6.635,說(shuō)明假設(shè)不合理的程度約為99%,即“兩個(gè)分類有關(guān)系”這一結(jié)論成立的可信程度約為99%.y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:例1在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有214人禿頂;而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂。分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷禿頂與患心臟病是否有關(guān)系?你所得的結(jié)論在什么范圍內(nèi)有效?解:根據(jù)題目所給數(shù)據(jù)得到如下列聯(lián)表1-13:患心臟病不患心臟病總計(jì)禿頂214175389不禿頂4515971048總計(jì)6657721437根據(jù)聯(lián)表1-13中的數(shù)據(jù),得到所以有99%的把握認(rèn)為“禿頂患心臟病有關(guān)”。因?yàn)檫@組數(shù)據(jù)來(lái)自住院的病人,因此所得到的結(jié)論適合住院的病人群體.例2為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下聯(lián)表:喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程總計(jì)男3785122女35143178總計(jì)72228300
由表中數(shù)據(jù)計(jì)算K2的觀測(cè)值k≈4.513。在多大程度上可以認(rèn)為高中生的性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系?為什么?而我們所得到的K2的觀測(cè)值k≈4.513超過(guò)3.841,這就意味著“性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系”這一結(jié)論錯(cuò)誤的可能性約為0.05(或小于0.05)
,即有95%(或大于95%)的把握認(rèn)為“性別與是否喜歡數(shù)學(xué)課程之間有關(guān)系”。解:在假設(shè)“性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系”的前提下K2應(yīng)該很小,并且2010年(19)(本小題12分)為調(diào)查某地區(qū)老人是否需要志愿者提供幫助,用簡(jiǎn)單隨機(jī)抽樣方法從該地區(qū)調(diào)查了500位老年人,結(jié)果如下:是否需要志愿性別男女需要4030不需要160270估計(jì)該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例2.能否有99%的把握認(rèn)為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關(guān)?3.根據(jù)(2)的結(jié)論,能否提供更好的調(diào)查方法來(lái)估計(jì)該地區(qū)老年人,需要志愿幫助的老年人的比例?說(shuō)明理由(19)解:(1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要幫助的老年人的比例的估算值為(2)。由于9.967>6.635,所以有99%的把握認(rèn)為該地區(qū)的老年人是否需要幫助與性別有關(guān)。
(III)由(II)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時(shí),先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法比采用簡(jiǎn)單隨機(jī)抽樣方法更好.SPSS統(tǒng)計(jì)分析交叉表(Crosstabs)過(guò)程 (一)四格表(fourfolddata)資料的x2檢驗(yàn) (二)配對(duì)(paireddata)資料的x2檢驗(yàn) (三)R×C表資料的x2檢驗(yàn) (四)兩分類變量有無(wú)關(guān)聯(lián)分析及列聯(lián)系數(shù)C卡方(Chi-Square)過(guò)程 (五)擬合問(wèn)題-比較樣本與已知總體的分布第一節(jié)
四格表資料的檢驗(yàn)
x2testoffourfolddata
目的:推斷兩個(gè)總體率(構(gòu)成比)是否有差別(和率的u檢驗(yàn)等價(jià))要求:兩樣本的兩分類個(gè)體數(shù)排列成四格表資料
值計(jì)算
Pearson卡方值:自由度:一、檢驗(yàn)的基本思想
分布實(shí)例分析例7-1
某院欲比較異梨醇口服液(試驗(yàn)組)和氫氯噻嗪+地塞米松(對(duì)照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機(jī)分為兩組,結(jié)果見(jiàn)表7-1。問(wèn)兩組降低顱內(nèi)壓的總體有效率有無(wú)差別?表7-1兩組降低顱內(nèi)壓有效率的比較
檢驗(yàn)基本步驟
計(jì)算理論頻數(shù):計(jì)算統(tǒng)計(jì)量
建立檢驗(yàn)假設(shè)
:兩總體陽(yáng)性率相等
:兩總體陽(yáng)性率不等H0
H1
值的校正四格表檢驗(yàn)的條件:
1)2)3)校正公式:
SPSS操作過(guò)程①建立數(shù)據(jù)文件:chis01.sav
數(shù)據(jù)格式:包括4行3列的頻數(shù)格式,3個(gè)變量即行變量(group)、列變量(effect)和頻數(shù)變量(freq)。②說(shuō)明頻數(shù)變量:數(shù)據(jù)加權(quán)個(gè)案
DataWeightCases③x2檢驗(yàn):從菜單選擇分析描述統(tǒng)計(jì)
交叉表
Analyze
DescriptiveStatisticsCrosstabs結(jié)合例7-1數(shù)據(jù)(chis01.sav)演示操作過(guò)程。分類數(shù)據(jù)錄入格式頻數(shù)格式:用數(shù)據(jù)
加權(quán)個(gè)案(WeightCases)過(guò)程以指明反映頻數(shù)的變量。枚舉格式:交叉表(Crosstabs)過(guò)程Crosstabs過(guò)程用于對(duì)分類資料和有序分類資料進(jìn)行統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷。該過(guò)程可以產(chǎn)生2維至n維列聯(lián)表,并計(jì)算相應(yīng)的百分?jǐn)?shù)指標(biāo)。統(tǒng)計(jì)推斷包括了常用的x2檢驗(yàn)、Kappa值,分層X(jué)2(X2M-H),以及四格表資料的確切概率(Fisher’sExactTest)值。Crosstabs過(guò)程祥解界面說(shuō)明-[行Rows框]用于選擇行×列表中的行變量。-[列Columns框]用于選擇行×列表中的列變量。-[層Layer框]指定分層變量,即控制變量。如果要指定不同的分層變量做分析,則將其選入Layer框,并用Previous和Next鈕設(shè)為不同層。-[Displayclusteredbarcharts復(fù)選框]:顯示復(fù)式條圖-[Suppresstable復(fù)選框]:不在輸出結(jié)果中給出行×列表。Crosstabs過(guò)程祥解界面說(shuō)明精確(Exact)子對(duì)話框:針對(duì)2×2以上的行×列表設(shè)計(jì)計(jì)算確切概率的方法。統(tǒng)計(jì)量(Statistics)子對(duì)話框:用于定義所需計(jì)算的統(tǒng)計(jì)量-Chi-square復(fù)選框:計(jì)算pearson卡方值,對(duì)四格表資料自動(dòng)給出校正卡方檢驗(yàn)和確切概率法結(jié)果。-Correlations復(fù)選框:計(jì)算行列變量的pearson相關(guān)系數(shù)和Spearman等級(jí)相關(guān)系數(shù)。Crosstabs過(guò)程祥解界面說(shuō)明-Kappa復(fù)選框:計(jì)算Kappa值,即內(nèi)部一致性系數(shù),介于0~0.7071之間;-Risk復(fù)選框:計(jì)算比數(shù)比OR值、RR值;-McNemanr復(fù)選框:進(jìn)行配對(duì)卡方檢驗(yàn)的McNemanr檢驗(yàn)(一種非參數(shù)檢驗(yàn))-Cochran’sandMantel-Haenszelstatistics復(fù)選框:計(jì)算X2M-H統(tǒng)計(jì)量、X2CMH,可在下方輸出H0假設(shè)的OR值,默認(rèn)為1。Crosstabs過(guò)程祥解界面說(shuō)明單元格(Cells)子對(duì)話框:用于定義列聯(lián)表單元格中需要計(jì)算的指標(biāo)。-Counts復(fù)選框:是否輸出實(shí)際觀察數(shù)(Observed)和理論頻數(shù)(Expected)-Percentages復(fù)選框:是否輸出行百分?jǐn)?shù)(Row)、列百分?jǐn)?shù)(Column)以及合計(jì)百分?jǐn)?shù)(Total)-Residuals復(fù)選框:選擇殘差的顯示方式格式(Format)子對(duì)話框:用于選擇行變量是升序還是降序排列。SPSS結(jié)果輸出SPSS結(jié)果輸出(續(xù))結(jié)論:x2=12.857,df=1,雙側(cè)P<0.01,按照α=0.05檢驗(yàn)水準(zhǔn),可認(rèn)為兩組總體有效率差異顯著,即試驗(yàn)組的療效優(yōu)于對(duì)照組。結(jié)果中的其他檢驗(yàn)方法連續(xù)性校正的卡方檢驗(yàn)ContinuityCorrectionFisher’s確切概率法Fisher’sExactTest似然比卡方LikelihoodRatio線性相關(guān)性檢驗(yàn)Linear-by-LinearAssociation:僅用于當(dāng)兩變量均為等級(jí)變量的資料。注意檢查樣本例數(shù)n和理論頻數(shù)T是否滿足條件:N≥40且理論頻數(shù)T≥5。第二節(jié)
配對(duì)四格表資料的檢驗(yàn)
x2testofpairedfourfolddata
例7-3
某實(shí)驗(yàn)室分別用乳膠凝集法和免疫熒光法對(duì)58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進(jìn)行測(cè)定,結(jié)果見(jiàn)表7-3。問(wèn)兩種方法的檢測(cè)結(jié)果有無(wú)差別?實(shí)例分析
表7-3兩種方法的檢測(cè)結(jié)果
上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言,兩種處理的結(jié)果不外乎有四種可能:①兩種檢測(cè)方法皆為陽(yáng)性數(shù)(a);②兩種檢測(cè)方法皆為陰性數(shù)(d);③免疫熒光法為陽(yáng)性,乳膠凝集法為陰性數(shù)(b);④乳膠凝集法為陽(yáng)性,免疫熒光法為陰性數(shù)(c)。其中,a,d為兩法觀察結(jié)果一致的兩種情況,
b,c為兩法觀察結(jié)果不一致的兩種情況。檢驗(yàn)統(tǒng)計(jì)量為注意:
本法一般用于樣本含量不太大的資料。因?yàn)樗鼉H考慮了兩法結(jié)果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a,d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對(duì)較小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義往往也不大。檢驗(yàn)步驟:SPSS操作過(guò)程①建立數(shù)據(jù)文件:chis03.sav
數(shù)據(jù)格式:包括4行3列的頻數(shù)格式,三個(gè)變量分別為行變量、列變量和頻數(shù)變量。②說(shuō)明頻數(shù)變量:數(shù)據(jù)加權(quán)個(gè)案
DataWeightCases③x2檢驗(yàn):從菜單選擇分析描述統(tǒng)計(jì)
交叉表
Analyze
DescriptiveStatisticsCrosstabs統(tǒng)計(jì)量Statistics:√McNemar√Kappa一致性檢驗(yàn):計(jì)算Kappa系數(shù)Kappa系數(shù):為吻合度測(cè)量(measureofagreement)系數(shù),用以測(cè)量?jī)蓚€(gè)觀測(cè)者或兩觀測(cè)設(shè)備之間的吻合程度,取值在-1至+1之間,取值越大,說(shuō)明吻合程度越高。該系數(shù)利用了列聯(lián)表的全部信息,包括表格中的數(shù)據(jù)a和d。Kappa≥0.75一致性好
0.75>Kappa≥0.4一致性一般
Kappa<0.4一致性較差SPSS結(jié)果輸出結(jié)論:配對(duì)x2檢驗(yàn)的P<0.05,可以認(rèn)為兩種方法的檢測(cè)結(jié)果差別顯著,免疫熒光法的總體陽(yáng)性檢出率要高于乳膠凝集法;對(duì)兩種檢測(cè)方法的一致性檢驗(yàn)Kappa=0.455,P<0.01,說(shuō)明兩種方法的吻合度有統(tǒng)計(jì)學(xué)意義,但吻合度一般。第四節(jié)
行×列表資料的檢驗(yàn)
testofR×Ctable行×列表資料①
多個(gè)樣本率比較時(shí),有R行2列,稱為R×2表;②
兩個(gè)樣本的構(gòu)成比比較時(shí),有2行C列,稱2×C表;③
多個(gè)樣本的構(gòu)成比比較,以及雙向無(wú)序分類資料關(guān)聯(lián)性檢驗(yàn)時(shí),稱為R×C表。檢驗(yàn)統(tǒng)計(jì)量一、多個(gè)樣本率的比較
例7-6
某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見(jiàn)表7-8。問(wèn)三種療法的有效率有無(wú)差別?表7-8三種療法有效率的比較檢驗(yàn)步驟:SPSS操作過(guò)程(行×列表卡方檢驗(yàn))①建立數(shù)據(jù)文件:chis02.sav(例7-6數(shù)據(jù)) 數(shù)據(jù)格式:包括6行3列的頻數(shù)格式,3個(gè)變量分別為行變量、列變量和頻數(shù)變量。②說(shuō)明頻數(shù)變量:數(shù)據(jù)加權(quán)個(gè)案
DataWeightCases③x2檢驗(yàn):從菜單選擇分析描述統(tǒng)計(jì)
交叉表
Analyze
DescriptiveStatisticsCrosstabs結(jié)合例7-6數(shù)據(jù)(chis02.sav)演示操作及界面。SPSS結(jié)果輸出SPSS結(jié)果輸出(續(xù))結(jié)論:按α=0.05檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,可以認(rèn)為三種療法治療周圍性面神經(jīng)麻痹的總體有效率有差別。
二、樣本構(gòu)成比的比較
例7-7
某醫(yī)師在研究血管緊張素I轉(zhuǎn)化酶(ACE)基因I/D多態(tài)(分3型)與2型糖尿病腎病(DN)的關(guān)系時(shí),將249例2型糖尿病患者按有無(wú)糖尿病腎病分為兩組,資料見(jiàn)表7-9。問(wèn)兩組2型糖尿病患者的ACE基因型總體分布有無(wú)差別?表7-9DN組與無(wú)DN組2型糖尿病患者ACE基因型分布的比較檢驗(yàn)步驟三、雙向無(wú)序分類資料的關(guān)聯(lián)性檢驗(yàn)
表中兩個(gè)分類變量皆為無(wú)序分類變量的行列表資料,又稱為雙向無(wú)序表資料。注意:雙向無(wú)序分類資料為兩個(gè)或多個(gè)樣本,做差別檢驗(yàn)(例7-7);若為單樣本,做關(guān)聯(lián)性檢驗(yàn)(例7-8)。例7-8
測(cè)得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問(wèn)兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?
表7-10某地5801人的血型
(單樣本,做關(guān)聯(lián)性檢驗(yàn))
表7-10資料,可用行×列表資料檢驗(yàn)來(lái)推斷兩個(gè)分類變量之間有無(wú)關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計(jì)算Pearson列聯(lián)系數(shù)C進(jìn)一步分析關(guān)系的密切程度:
列聯(lián)系數(shù)C取值范圍在0~0.7071之間。0表示完全獨(dú)立;0.7071表示完全相關(guān)。檢驗(yàn)步驟由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。SPSS操作過(guò)程①建立數(shù)據(jù)文件:chis04.sav
數(shù)據(jù)格式:包括12行3列的頻數(shù)格式,三個(gè)變量分別為行變量、列變量和頻數(shù)變量。②說(shuō)明頻數(shù)變量:數(shù)據(jù)加權(quán)個(gè)案
DataWeightCases③x2檢驗(yàn):從菜單選擇分析描述統(tǒng)計(jì)
交叉表
Analyze
DescriptiveStatisticsCrosstabs統(tǒng)計(jì)量Statistics:√Chi-square
名義√相依系數(shù)ContingencycoefficientSPSS輸出結(jié)果1.行列表中的各格T≥1,并且1≤T<5的格子數(shù)不宜超過(guò)格子總數(shù)的1/5,否則可能產(chǎn)生偏性。處理方法有三種:
(1)增大樣本含量以達(dá)到增大理論頻數(shù)的目的(首選)。(2)根據(jù)專業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。如:不同年齡組可以合并,但不同血型就不能合并。
(3)改用雙向無(wú)序R×C表的Fisher確切概率法。四、行×列表資料檢驗(yàn)的注意事項(xiàng)第五節(jié)
多個(gè)樣本率間的多重比較
Multiplecomparisonofsamplerates
一、基本思想(卡方分割法)
因分析目的不同,k個(gè)樣本率兩兩比較的次數(shù)不同,故重新規(guī)定的檢驗(yàn)水準(zhǔn)的估計(jì)方法亦不同。通常有兩種情況:
例7-9
對(duì)例7-6中表7-8的資料進(jìn)行兩兩比較,以推斷是否任兩種療法治療周圍性面神經(jīng)麻痹的有效率均有差別?檢驗(yàn)步驟本例為3個(gè)實(shí)驗(yàn)組間的兩兩比較
表7-12三種療法有效率的兩兩比較
例7-10
以例7-6表7-8資料中的藥物治療組為對(duì)照組,物理療法組與外用膏藥組為試驗(yàn)組,試分析兩試驗(yàn)組與對(duì)照組的總體有效率有無(wú)差別?
本例為各實(shí)驗(yàn)組與同一對(duì)照組的比較第三節(jié)
四格表資料的Fisher確切概率法Fisherprobabilitiesinfourfolddata
(一)適用條件①T<1或n<40②P≈
(二)基本思想(超幾何分布)
在四格表周邊合計(jì)不變的條件下,直接計(jì)算表內(nèi)四個(gè)數(shù)據(jù)的各種組合之概率。找出的所有表格并將概率求和,若這些表
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 銀行資金調(diào)配指南
- 防水工程維護(hù)設(shè)計(jì)合同
- 環(huán)保設(shè)施三方施工合同
- 醫(yī)療保健中心租賃合同模板
- 2024年資產(chǎn)托管經(jīng)營(yíng)合同3篇
- 2024年防水工程培訓(xùn)分包協(xié)議3篇
- 山東省農(nóng)業(yè)設(shè)施裝修工程合同模板
- 2025油漆采購(gòu)合同2
- 2025年度環(huán)境風(fēng)險(xiǎn)評(píng)估與監(jiān)測(cè)合同書模板
- 2024年度工程貸款擔(dān)保合同3篇
- 北京市西城區(qū)2022-2023學(xué)年三年級(jí)上學(xué)期英語(yǔ)期末試卷(含聽力音頻)
- 電動(dòng)托盤搬運(yùn)車操作規(guī)程范文(2篇)
- 教育部中國(guó)特色學(xué)徒制課題:基于中國(guó)特色學(xué)徒制的“金教師”團(tuán)隊(duì)建設(shè)研究
- 【MOOC】輪滑高級(jí)教程-東北大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 2024年醫(yī)院副院長(zhǎng)工作總結(jié)范文(2篇)
- 【MOOC】診斷學(xué)-山東大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 周1530安全教育記錄
- 建筑工程管理與實(shí)務(wù)二級(jí)建造師考試試卷及解答參考
- 中國(guó)非遺文化魚燈介紹2
- 村集體經(jīng)濟(jì)入股分紅協(xié)議書
- 人體寄生蟲表格總結(jié)超全(原蟲部分)
評(píng)論
0/150
提交評(píng)論