第07章卡方檢驗(yàn)(正式)_第1頁
第07章卡方檢驗(yàn)(正式)_第2頁
第07章卡方檢驗(yàn)(正式)_第3頁
第07章卡方檢驗(yàn)(正式)_第4頁
第07章卡方檢驗(yàn)(正式)_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、華中科技大學(xué)公衛(wèi)學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)系12檢驗(yàn)Chi-squared test第第7章章蔣紅衛(wèi)蔣紅衛(wèi)Email: JHWCCC21CN.COM23概念回顧概念回顧p在總體率為在總體率為的二項(xiàng)分布總體中做的二項(xiàng)分布總體中做n1和和n2抽抽樣樣,樣本率樣本率p1和和p2與與的差別的差別,稱為稱為率抽樣誤差率抽樣誤差。p在總體率為在總體率為1和和2的不同總體中抽樣,得的不同總體中抽樣,得p1和和p2,在,在n5,可通過率的,可通過率的u檢驗(yàn)推斷是檢驗(yàn)推斷是否否1=2。p二項(xiàng)分布的兩個(gè)樣本率的檢驗(yàn)同樣可用二項(xiàng)分布的兩個(gè)樣本率的檢驗(yàn)同樣可用2檢檢驗(yàn)驗(yàn)。 u2121ppSpp 4 目的:目的: 推斷兩個(gè)總

2、體率或構(gòu)成比之間有無差別推斷兩個(gè)總體率或構(gòu)成比之間有無差別 多個(gè)總體率或構(gòu)成比之間有無差別多個(gè)總體率或構(gòu)成比之間有無差別 多個(gè)樣本率的多重比較多個(gè)樣本率的多重比較 兩個(gè)分類變量之間有無關(guān)聯(lián)性兩個(gè)分類變量之間有無關(guān)聯(lián)性 頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。 檢驗(yàn)統(tǒng)計(jì)量:檢驗(yàn)統(tǒng)計(jì)量:2 應(yīng)用:應(yīng)用:計(jì)數(shù)資料計(jì)數(shù)資料5基本概念基本概念例例1 某院比較異梨醇(試驗(yàn)組)和氫氯塞嗪某院比較異梨醇(試驗(yàn)組)和氫氯塞嗪(對照組)降低顱內(nèi)壓的療效,將(對照組)降低顱內(nèi)壓的療效,將200名患者名患者隨機(jī)分為兩組,試驗(yàn)組隨機(jī)分為兩組,試驗(yàn)組104例中有效的例中有效的99例例,對對照組照組96例中有效的例

3、中有效的78例例,問兩種藥物對降低顱問兩種藥物對降低顱內(nèi)壓療效有無差別?內(nèi)壓療效有無差別?6表表 200名顱內(nèi)高壓患者治療情況名顱內(nèi)高壓患者治療情況編號編號年齡年齡性別性別治療組治療組 舒張壓舒張壓體溫體溫療效療效137男A11.2737.5有效245女B12.5337.0有效343男A10.9336.5有效459女B14.6737.8無效20054男B16.8037.6無效如何整理此類資料?如何整理此類資料?如何分析此類資料?如何分析此類資料?7四格表(四格表(fourfold table)資料的基本形式)資料的基本形式 實(shí)際頻數(shù)實(shí)際頻數(shù)(actual frequency)是指各分類是指各分

4、類實(shí)際發(fā)生或未發(fā)生計(jì)數(shù)值,記為實(shí)際發(fā)生或未發(fā)生計(jì)數(shù)值,記為A。a=99b=5104c=75d=219617426200單元格單元格8NnnTCRRC 理論頻數(shù)理論頻數(shù)(theoretical frequency)是指按是指按某某H0假設(shè)計(jì)算各分類理論上的發(fā)生或未假設(shè)計(jì)算各分類理論上的發(fā)生或未發(fā)生計(jì)數(shù)值,記為發(fā)生計(jì)數(shù)值,記為T。式中,TRC 為第R 行C 列的理論頻數(shù) nR 為相應(yīng)的行合計(jì) nC 為相應(yīng)的列合計(jì)療法療法有效人數(shù)有效人數(shù)無效人數(shù)無效人數(shù)合計(jì)合計(jì)有效率有效率試驗(yàn)組試驗(yàn)組99(99(90.4890.48) )5(5(13.5213.52) )10410495.295.2對照組對照組75

5、(75(83.5283.52) ) 21(21(12.4812.48) )969678.178.1合計(jì)合計(jì)174174262620020087.087.09p殘差殘差 設(shè)設(shè)A代表某個(gè)類別的觀察頻數(shù),代表某個(gè)類別的觀察頻數(shù),T代表基于代表基于H0計(jì)算出的期望頻數(shù),計(jì)算出的期望頻數(shù),A與與T之差之差(A-T)被被稱為殘差稱為殘差p殘差可以表示某一個(gè)類別觀察值和理論值的殘差可以表示某一個(gè)類別觀察值和理論值的偏離程度,但殘差有正有負(fù),相加后會(huì)彼此偏離程度,但殘差有正有負(fù),相加后會(huì)彼此抵消,總和仍然為抵消,總和仍然為0。為此可以將殘差平方后。為此可以將殘差平方后求和,以表示樣本總的偏離無效假設(shè)的程度求和

6、,以表示樣本總的偏離無效假設(shè)的程度p類似于方差的計(jì)算思想,類似于方差的計(jì)算思想,22)()0()(TATAXxi 10Pearson 2檢驗(yàn)的基本公式檢驗(yàn)的基本公式p殘差大小是一個(gè)相對的概念,殘差大小是一個(gè)相對的概念,相對于期望頻數(shù)為相對于期望頻數(shù)為10時(shí),時(shí),20的殘差非常大;可相對于期的殘差非常大;可相對于期望頻數(shù)為望頻數(shù)為1000時(shí)時(shí)20就很小了。就很小了。因此又將殘差平方除以期望因此又將殘差平方除以期望頻數(shù)再求和,以標(biāo)準(zhǔn)化觀察頻數(shù)再求和,以標(biāo)準(zhǔn)化觀察頻數(shù)與期望頻數(shù)的差別。頻數(shù)與期望頻數(shù)的差別。p卡方統(tǒng)計(jì)量,卡方統(tǒng)計(jì)量,1900年由英國年由英國統(tǒng)計(jì)學(xué)家統(tǒng)計(jì)學(xué)家K. Pearson首次提出

7、。首次提出。Karl Pearson (1857 1936)1)(1()(22 列列數(shù)數(shù)行行數(shù)數(shù) TTA11p從卡方的計(jì)算公式可見,當(dāng)觀察頻數(shù)與期從卡方的計(jì)算公式可見,當(dāng)觀察頻數(shù)與期望頻數(shù)望頻數(shù)完全一致完全一致時(shí),時(shí),卡方值為卡方值為0;p觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小差異越小,卡方值越小卡方值越??;p反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的者之間的差異越大差異越大,卡方值越大卡方值越大。p當(dāng)然,卡方值的大小也當(dāng)然,卡方值的大小也和自由度有關(guān)和自由度有關(guān)p檢驗(yàn)的自由度取決于可以檢驗(yàn)的自由度取決于可以自由取

8、值的格子自由取值的格子數(shù)目數(shù)目,而不是樣本含量,而不是樣本含量n。p理論上,在理論上,在n40時(shí)下式值與時(shí)下式值與2分布近似,分布近似,在理論數(shù)在理論數(shù)5,近似程度較好。,近似程度較好。12l連續(xù)型分布:正態(tài)分布(連續(xù)型分布:正態(tài)分布(Normal distribution),學(xué)生氏),學(xué)生氏t分布分布(Students t-distribution),F(xiàn)分布分布(F distribution)l另一個(gè)同樣重要的分布另一個(gè)同樣重要的分布2卡方分布卡方分布(Chi-squared distribution)。l此分布在此分布在1875年,首先由年,首先由F. Helmet所提出,所提出,而且是由

9、正態(tài)分布演變而來的,即標(biāo)準(zhǔn)正態(tài)而且是由正態(tài)分布演變而來的,即標(biāo)準(zhǔn)正態(tài)分布分布Z值之平方而得值之平方而得2分布分布13設(shè)設(shè)Xi為來自正態(tài)總體的連續(xù)性變量。為來自正態(tài)總體的連續(xù)性變量。 iiXu21222)( iXui212212)(nniiniXui 稱為自由度稱為自由度df=n的卡方值。的卡方值。顯然,卡方分布具有可加性。顯然,卡方分布具有可加性。142/)12/(2222)2/(21)( ef3.847.8112.59P P0.050.05的臨界值的臨界值2分布的概率密度函數(shù)曲線分布的概率密度函數(shù)曲線152220.05,10.05/21.96u當(dāng)當(dāng)=1時(shí)時(shí),16第二節(jié)22表卡方檢驗(yàn)17兩組樣

10、本率比較的設(shè)計(jì)分類:兩組樣本率比較的設(shè)計(jì)分類:1.兩組兩組(獨(dú)立獨(dú)立) 樣本率的比較樣本率的比較 組間數(shù)據(jù)是相互獨(dú)立組間數(shù)據(jù)是相互獨(dú)立,非配對設(shè)計(jì)。非配對設(shè)計(jì)。 22表卡方檢驗(yàn)表卡方檢驗(yàn)2.配對設(shè)計(jì)兩組樣本率的比較配對設(shè)計(jì)兩組樣本率的比較 組間數(shù)據(jù)是相關(guān)的,配對設(shè)計(jì)。組間數(shù)據(jù)是相關(guān)的,配對設(shè)計(jì)。 配對四格表卡方檢驗(yàn)配對四格表卡方檢驗(yàn)18兩組(不配對)樣本率的比較兩組(不配對)樣本率的比較1)四格表形式)四格表形式2)四格表不配對資料檢驗(yàn)的專用公式)四格表不配對資料檢驗(yàn)的專用公式二者結(jié)果等二者結(jié)果等價(jià)價(jià)各組樣各組樣本例數(shù)本例數(shù)是固定是固定的的組別組別陽性數(shù)陽性數(shù)陰性數(shù)陰性數(shù)合計(jì)合計(jì)率率%甲組甲組

11、a ab ba+b=na+b=n1 1a/na/n1 1乙組乙組c cd dc+d=nc+d=n2 2c/nc/n2 2合計(jì)合計(jì)a+ca+cb+db+dN N(a+c)/N(a+c)/N)()()()(dbdccabaNbcad 22 TTA22)( 19例例1(續(xù))(續(xù))2086.122617496104200)7552199(22 H0:1=2 即試驗(yàn)組與對照組降低顱內(nèi)壓的即試驗(yàn)組與對照組降低顱內(nèi)壓的總體有效率相等總體有效率相等H1:12=0.05。以以=1查附表查附表8的的2界值表得界值表得P 40 ,此時(shí)有,此時(shí)有 1 T 5時(shí),需計(jì)算時(shí),需計(jì)算Yates連續(xù)性校正連續(xù)性校正 2值值

12、T 1,或,或n40時(shí),應(yīng)改用時(shí),應(yīng)改用Fisher確切概率確切概率法直接計(jì)算概率法直接計(jì)算概率24(1) 校正公式的條件:校正公式的條件: 1T5,同時(shí)同時(shí)N40,用校正公式計(jì)算用校正公式計(jì)算(2) 連續(xù)校正連續(xù)校正(continuity correction)公式:公式:(3) 當(dāng)當(dāng)T1,或或N0.05。按。按=0.05檢驗(yàn)水準(zhǔn),不拒絕檢驗(yàn)水準(zhǔn),不拒絕H0,無統(tǒng)計(jì)學(xué)意,無統(tǒng)計(jì)學(xué)意義,尚不能認(rèn)為兩種藥物治療腦血管疾病的義,尚不能認(rèn)為兩種藥物治療腦血管疾病的有效率不等。有效率不等。 28正方觀點(diǎn)正方觀點(diǎn): 卡方統(tǒng)計(jì)量抽樣分布的連續(xù)性和平滑性得卡方統(tǒng)計(jì)量抽樣分布的連續(xù)性和平滑性得到改善,可以降低

13、到改善,可以降低I I類錯(cuò)誤的概率;類錯(cuò)誤的概率; 校正結(jié)果更接近于校正結(jié)果更接近于FisherFisher確切概率法;確切概率法; 校正是有條件的。校正是有條件的。反方觀點(diǎn)反方觀點(diǎn): 經(jīng)連續(xù)性校正后,經(jīng)連續(xù)性校正后,P P值有過分保守之嫌;值有過分保守之嫌; 連續(xù)性校正卡方檢驗(yàn)的連續(xù)性校正卡方檢驗(yàn)的P P值與值與FisherFisher確切確切概率法的概率法的P P值沒有可比性,這是因?yàn)橹禌]有可比性,這是因?yàn)镕isherFisher確切概率法建立在四格表確切概率法建立在四格表雙邊固定雙邊固定的假定下,的假定下,而實(shí)際資料則是而實(shí)際資料則是單邊固定單邊固定的四格表。的四格表。29 就應(yīng)用而言,

14、無論是否經(jīng)過連續(xù)性校正,就應(yīng)用而言,無論是否經(jīng)過連續(xù)性校正,若兩種檢驗(yàn)的結(jié)果一致,無須在此問題若兩種檢驗(yàn)的結(jié)果一致,無須在此問題上糾纏。但是,當(dāng)兩種檢驗(yàn)結(jié)果相互矛上糾纏。但是,當(dāng)兩種檢驗(yàn)結(jié)果相互矛盾時(shí),如例盾時(shí),如例2,就需要謹(jǐn)慎解釋結(jié)果了。,就需要謹(jǐn)慎解釋結(jié)果了。 為客觀起見,建議將兩種結(jié)論同時(shí)報(bào)告為客觀起見,建議將兩種結(jié)論同時(shí)報(bào)告出來,以便他人判斷。當(dāng)然,如果兩種出來,以便他人判斷。當(dāng)然,如果兩種結(jié)論一致,如均為結(jié)論一致,如均為有或無統(tǒng)計(jì)學(xué)意義有或無統(tǒng)計(jì)學(xué)意義,則只報(bào)道非連續(xù)性檢驗(yàn)的結(jié)果即可。則只報(bào)道非連續(xù)性檢驗(yàn)的結(jié)果即可。30 配對設(shè)計(jì):通常為配對設(shè)計(jì):通常為同源配對同源配對。對同一觀察

15、。對同一觀察對象分別用兩種方法處理,觀察其陽性與對象分別用兩種方法處理,觀察其陽性與陰性結(jié)果。陰性結(jié)果。 基本用途:常用于比較基本用途:常用于比較兩種檢驗(yàn)方法兩種檢驗(yàn)方法或或兩兩種培養(yǎng)基種培養(yǎng)基的陽性率是否有差別。的陽性率是否有差別。 數(shù)據(jù)形式:數(shù)據(jù)形式:配對四格表形式配對四格表形式。31例例3 3 某實(shí)驗(yàn)室采用兩種方法對某實(shí)驗(yàn)室采用兩種方法對5858名可疑名可疑紅斑狼瘡患者的血清抗體進(jìn)行測定,問:紅斑狼瘡患者的血清抗體進(jìn)行測定,問:兩方法測定結(jié)果陽性檢出率是否有差別?兩方法測定結(jié)果陽性檢出率是否有差別?測定結(jié)果為:陽性、陰性(共測定結(jié)果為:陽性、陰性(共116116標(biāo)本,標(biāo)本,5858對)對

16、) 方法(方法(X X)乳膠凝集法乳膠凝集法 免疫熒光法免疫熒光法 對子例數(shù)對子例數(shù) 1111 3333 2 2 1212結(jié)結(jié)果果32 上述配對設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對子而言,上述配對設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對子而言,兩種處理的結(jié)果不外乎有兩種處理的結(jié)果不外乎有四種可能四種可能: :兩種檢測方法皆為陽性數(shù)兩種檢測方法皆為陽性數(shù)( (a a) );兩種檢測方法皆為陰性數(shù)兩種檢測方法皆為陰性數(shù)( (d d) );免疫熒光法為陽性,乳膠凝集法為免疫熒光法為陽性,乳膠凝集法為 陰性數(shù)陰性數(shù)( (b b) );乳膠凝集法為陽性,免疫熒光法為乳膠凝集法為陽性,免疫熒光法為 陰性數(shù)陰性數(shù)( (c c) )。其中,其中

17、,a a, , d d 為兩法觀察結(jié)果一致的兩種情況,為兩法觀察結(jié)果一致的兩種情況, b b, , c c為兩法觀察結(jié)果不一致的兩種情況。為兩法觀察結(jié)果不一致的兩種情況。33 34 按照配對設(shè)計(jì)的思路進(jìn)行分析,則首先應(yīng)按照配對設(shè)計(jì)的思路進(jìn)行分析,則首先應(yīng)當(dāng)求出當(dāng)求出各對的差值各對的差值,然后考察樣本中差值,然后考察樣本中差值的分布是否按照的分布是否按照HH0 0假設(shè)的情況假設(shè)的情況對稱分布。對稱分布。 按此分析思路,最終可整理出如前所列的按此分析思路,最終可整理出如前所列的配對四格表。配對四格表。 主對角線主對角線上兩種檢驗(yàn)方法的結(jié)論上兩種檢驗(yàn)方法的結(jié)論相同相同,對,對問題的解答問題的解答不會(huì)

18、不會(huì)有任何貢獻(xiàn)有任何貢獻(xiàn) 斜對角線斜對角線上兩種檢驗(yàn)方法的結(jié)論上兩種檢驗(yàn)方法的結(jié)論不相同不相同,顯示顯示了檢驗(yàn)方法間的差異了檢驗(yàn)方法間的差異3536H0:b=c =(12+2)/2=7( (兩法總體兩法總體陽性陽性率相等率相等) )H1:b c (兩方法總體兩方法總體陽性陽性率不等)率不等) =0.05本例本例b+c=12+2=1440,用校正公式,用校正公式本例本例2=5.793.84,P0.05。在。在=0.05水準(zhǔn)水準(zhǔn),拒絕,拒絕HH0 0,接受,接受HH1 1,有統(tǒng)計(jì)學(xué)意義。認(rèn)為,有統(tǒng)計(jì)學(xué)意義。認(rèn)為兩方法的檢測率不同,乳膠凝集法的陽性檢兩方法的檢測率不同,乳膠凝集法的陽性檢測率測率22

19、.41%低于免疫檢測率低于免疫檢測率39.66%。179521212121222 ,.)()(cbcb37McNemarMcNemar檢驗(yàn)檢驗(yàn)只會(huì)利用非主對角線單元格只會(huì)利用非主對角線單元格上上的信息,即它只關(guān)心的信息,即它只關(guān)心兩者不一致兩者不一致的評價(jià)情況,的評價(jià)情況,用于比較兩個(gè)評價(jià)者間存在怎樣的傾向。因此用于比較兩個(gè)評價(jià)者間存在怎樣的傾向。因此,對于一致性較好的大樣本數(shù)據(jù),對于一致性較好的大樣本數(shù)據(jù),McNemarMcNemar檢驗(yàn)可能會(huì)失去實(shí)用價(jià)值。檢驗(yàn)可能會(huì)失去實(shí)用價(jià)值。例如對例如對1 1萬個(gè)案例進(jìn)行一致性評價(jià),萬個(gè)案例進(jìn)行一致性評價(jià),99959995個(gè)個(gè)都是完全一致的,在主對角線

20、上,另有都是完全一致的,在主對角線上,另有5 5個(gè)分個(gè)分布在左下的三角區(qū),顯然,此時(shí)一致性相當(dāng)?shù)牟荚谧笙碌娜菂^(qū),顯然,此時(shí)一致性相當(dāng)?shù)暮谩5绻褂煤?。但如果使用McNemarMcNemar檢驗(yàn),此時(shí)反而會(huì)檢驗(yàn),此時(shí)反而會(huì)得出兩種評價(jià)有差異的結(jié)論來。得出兩種評價(jià)有差異的結(jié)論來。1053810539超幾何分布超幾何分布 (非(非 2檢驗(yàn)檢驗(yàn) 的范疇)的范疇)40n,或1T, 或P時(shí), 10540例例4 4 某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒某醫(yī)師為研究乙肝免疫球蛋白預(yù)防胎兒宮內(nèi)感染宮內(nèi)感染HBVHBV的效果,將的效果,將3333例例HBsAgHBsAg陽性孕陽性孕婦隨機(jī)分為預(yù)防注射組和非預(yù)防組

21、,結(jié)果見表婦隨機(jī)分為預(yù)防注射組和非預(yù)防組,結(jié)果見表7-47-4。問兩組新生兒的。問兩組新生兒的HBVHBV總體感染率有無差總體感染率有無差別?別? 1054142 在四格表周邊合計(jì)數(shù)固定不變的條件下,在四格表周邊合計(jì)數(shù)固定不變的條件下,計(jì)算表內(nèi)計(jì)算表內(nèi)4 4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概率率Pi;再按檢驗(yàn)假設(shè)用單側(cè)或雙側(cè)的累計(jì)概;再按檢驗(yàn)假設(shè)用單側(cè)或雙側(cè)的累計(jì)概率率P,依據(jù)所取的檢驗(yàn)水準(zhǔn),依據(jù)所取的檢驗(yàn)水準(zhǔn)做出推斷。做出推斷。 43 (1) (2) (3) (4) (5) 0 22 1 21 2 20 3 19 4 18 9 2 8 3 7 4 6 5 5 6 a

22、d-bc= -198 ad-bc= -165 ad-bc= -132 ad-bc =-99 ad-bc= -66 (6) (7) (8) (9) (10) 5 17 6 16 7 15 8 14 9 13 4 7 3 8 2 9 1 10 0 11 ad-bc= -33 ad-bc=0 ad-bc=33 ad-bc=66 ad-bc= 99 1 1各組合概率各組合概率Pi的計(jì)算的計(jì)算 在四格表周邊合計(jì)在四格表周邊合計(jì)數(shù)不變的條件下,表內(nèi)數(shù)不變的條件下,表內(nèi)4 4個(gè)實(shí)際頻數(shù)個(gè)實(shí)際頻數(shù) a,b,c,d 變變動(dòng)的組合數(shù)共有動(dòng)的組合數(shù)共有“周邊合計(jì)中最小數(shù)周邊合計(jì)中最小數(shù)+1+1”個(gè)。個(gè)。如例如例7-

23、47-4,表內(nèi),表內(nèi)4 4個(gè)實(shí)際頻數(shù)變動(dòng)的組合數(shù)共個(gè)實(shí)際頻數(shù)變動(dòng)的組合數(shù)共有有9+1=109+1=10個(gè),依次為:個(gè),依次為:44各組合的概率各組合的概率P Pi i服從超幾何分布,其和為服從超幾何分布,其和為1 1。計(jì)算公式為計(jì)算公式為() ()!()!()! ! ! ! !iabcdacbdPa b c d n!45 2 2累計(jì)概率的計(jì)算累計(jì)概率的計(jì)算 ( ( 單、雙側(cè)單、雙側(cè)檢驗(yàn)不同檢驗(yàn)不同) )464748495051例例5 5 某單位研究膽囊腺癌、腺瘤的某單位研究膽囊腺癌、腺瘤的P P5353基基因表達(dá),對同期手術(shù)切除的膽囊腺癌、因表達(dá),對同期手術(shù)切除的膽囊腺癌、腺瘤標(biāo)本各腺瘤標(biāo)本各

24、1010份,用免疫組化法檢測份,用免疫組化法檢測P P5353基因,資料見表基因,資料見表7-67-6。問膽囊腺癌和。問膽囊腺癌和膽囊腺瘤的膽囊腺瘤的P P5353基因表達(dá)陽性率有無差基因表達(dá)陽性率有無差別?別?52530H:21,1H:21,05. 0 本例本例 a+b+c+d=10,由表,由表7-77-7可看出,四格表內(nèi)各可看出,四格表內(nèi)各種組合以種組合以i=4和和i=5的組合為中心呈的組合為中心呈對稱分布對稱分布。 *為現(xiàn)有樣本54(1 1)計(jì)算現(xiàn)有樣本的)計(jì)算現(xiàn)有樣本的DD* *和和P P* *及各組合下四格表的及各組合下四格表的D Di i。 本例本例DD* *=50=50,P P*

25、 *=0.02708978=0.02708978。(2 2)計(jì)算滿足)計(jì)算滿足DDi i5050條件的各組合下四格表的概率條件的各組合下四格表的概率P Pi i。(3 3)計(jì)算同時(shí)滿足)計(jì)算同時(shí)滿足DDi i5050和和P Pi iP P* *條件的四格表的累條件的四格表的累 計(jì)概率。本例為計(jì)概率。本例為P P7 7和和P P8 8,(4 4)計(jì)算雙側(cè)累計(jì)概率)計(jì)算雙側(cè)累計(jì)概率P P。 P P0.050.05,按,按 =0.05=0.05檢驗(yàn)水準(zhǔn)不拒絕檢驗(yàn)水準(zhǔn)不拒絕H H0 0,尚不,尚不能認(rèn)為膽囊腺癌與膽囊腺瘤的能認(rèn)為膽囊腺癌與膽囊腺瘤的P P5353基因表達(dá)陽性率不等基因表達(dá)陽性率不等。0

26、286. 000154799. 002708978. 087 PP057. 0)(287 PPP5556 確切概率法的原理具有確切概率法的原理具有通用性通用性,對于四格表,對于四格表以外的情況也適用,如行乘列表、配對、配以外的情況也適用,如行乘列表、配對、配伍表格均可伍表格均可 對于較大的行乘列表,確切概率法的對于較大的行乘列表,確切概率法的計(jì)算量計(jì)算量將很大將很大,有可能超出硬件系統(tǒng)可以支持的范,有可能超出硬件系統(tǒng)可以支持的范圍圍 此時(shí)可以采用計(jì)算統(tǒng)計(jì)學(xué)中的此時(shí)可以采用計(jì)算統(tǒng)計(jì)學(xué)中的其他統(tǒng)計(jì)計(jì)算其他統(tǒng)計(jì)計(jì)算技術(shù)技術(shù)加以解決,如加以解決,如BootstrapBootstrap方法等方法等57當(dāng)

27、比較組行或列分類數(shù)當(dāng)比較組行或列分類數(shù)2 2,稱為行,稱為行列表,即列表,即R RC C表。表。研究者感興趣的問題有研究者感興趣的問題有:( :(2檢驗(yàn)的目的)檢驗(yàn)的目的)1.1.多組多組( (獨(dú)立樣本獨(dú)立樣本) )樣本率樣本率差別有無統(tǒng)計(jì)意義差別有無統(tǒng)計(jì)意義? ?2.2.兩組兩組( (獨(dú)立樣本獨(dú)立樣本) )構(gòu)成比構(gòu)成比( (分布分布) )有無統(tǒng)計(jì)意義有無統(tǒng)計(jì)意義? ?3.3.兩個(gè)分類變量分布兩個(gè)分類變量分布是否獨(dú)立是否獨(dú)立( (有關(guān)聯(lián)有關(guān)聯(lián))?)?58自由度自由度=(行數(shù)(行數(shù)-1)(列數(shù)(列數(shù)-1)等價(jià)等價(jià))1(22 CRnnAN TTA22)( 59療法療法有效有效無效無效合計(jì)合計(jì)有效率

28、有效率%物理組物理組199199(186.2186.2)7 720620696.696.6藥物組藥物組164164181818218290.190.1外用組外用組118118262614414481.981.9合計(jì)合計(jì)481481515153253290.490.4 例例6 6 某醫(yī)師研究物理療法、藥物治療和外用膏藥三某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見下表。種療法治療周圍性面神經(jīng)麻痹的療效,資料見下表。問三種療法的有效率有無差別?問三種療法的有效率有無差別? 表表7-8 7-8 三種療法有效率的比較三種療法有效率的比較60HH0 0: 1 1= =

29、 2 2 = = 3 3 =90.4=90.4(三(三組總體組總體有效有效率相等)率相等)HH1 1:三:三組總體率不等或不全等組總體率不等或不全等=0.05=0.052222199726532(.1)21.04206 481206 51144 5122220.05,20.01,221.045.99,21.049.21結(jié)論結(jié)論: :在在=0.05=0.05水準(zhǔn),拒絕水準(zhǔn),拒絕H0H0,P P0.01,0.01,認(rèn)為認(rèn)為三組療法有效率不等或不全等。三組療法有效率不等或不全等。注意注意: :此結(jié)果不能得到各兩兩組比較的結(jié)論。此結(jié)果不能得到各兩兩組比較的結(jié)論。21213 )( 04.21)15114

30、426.512067481206199(5322222 21. 904.21,99. 504.2122,01. 0222,05. 02 61二、兩組和多組構(gòu)成比的比較二、兩組和多組構(gòu)成比的比較例例7 7 某醫(yī)師在研究血管緊張素某醫(yī)師在研究血管緊張素I I轉(zhuǎn)化酶轉(zhuǎn)化酶(ACE)(ACE)基因基因I/DI/D多態(tài)(分多態(tài)(分3 3型)與型)與2 2型糖尿病腎病型糖尿病腎病(DN)(DN)的關(guān)系時(shí),將的關(guān)系時(shí),將249249例例2 2型糖尿病患者按有無糖尿病腎病分為兩組,型糖尿病患者按有無糖尿病腎病分為兩組,資料見表資料見表7-97-9。問兩組。問兩組2 2型糖尿病患者的型糖尿病患者的ACEACE基

31、因型基因型總體分布有無差別?總體分布有無差別?糖尿病糖尿病ACEACE基因型基因型合計(jì)合計(jì)DDDDIDIDI II I有腎病有腎病42(37.8)42(37.8)48(43.3)48(43.3)21(18.9)21(18.9)111111無腎病無腎病30(21.7)30(21.7)75(52.2)75(52.2)36(26.1)36(26.1)138138合計(jì)合計(jì)72(28.9)72(28.9)120(48.2)120(48.2)57(22.9)57(22.9)249249表表9 9 兩組兩組型糖尿病患者型糖尿病患者ACEACE基因分布比較基因分布比較6263三、雙向無序分類資料的關(guān)聯(lián)性檢驗(yàn)三

32、、雙向無序分類資料的關(guān)聯(lián)性檢驗(yàn) R RC C表中兩個(gè)分類變量皆為無序分類變量表中兩個(gè)分類變量皆為無序分類變量的行的行列表資料,又稱為雙向無序列表資料,又稱為雙向無序R RC C表資料。表資料。目的:目的:檢驗(yàn)兩事物分類檢驗(yàn)兩事物分類( (行分類和列分類行分類和列分類) )是否是否獨(dú)立獨(dú)立, ,從而說明兩事物分類是否有關(guān)系。從而說明兩事物分類是否有關(guān)系。 需要注意的是需要注意的是: :雙向無序分類資料為兩個(gè)或多個(gè)樣本,做差雙向無序分類資料為兩個(gè)或多個(gè)樣本,做差別檢驗(yàn)(例別檢驗(yàn)(例7 7););若為單樣本,做關(guān)聯(lián)性檢驗(yàn)。若為單樣本,做關(guān)聯(lián)性檢驗(yàn)。64統(tǒng)計(jì)分析統(tǒng)計(jì)分析:1.1.回答兩事物的分類回答兩

33、事物的分類是否獨(dú)立是否獨(dú)立( (有關(guān)系有關(guān)系) ) Pearson 2檢驗(yàn)檢驗(yàn)2.2.如有關(guān)如有關(guān), ,關(guān)系關(guān)系密切程度密切程度如何如何, ,度量指標(biāo)度量指標(biāo): : 列聯(lián)系數(shù)列聯(lián)系數(shù)(Contingency coefficient)(Contingency coefficient)列聯(lián)系數(shù)列聯(lián)系數(shù)C C取值范圍在取值范圍在0 01 1之間。愈接近于之間。愈接近于0 0,關(guān)系愈不密切;愈接近于關(guān)系愈不密切;愈接近于1 1,關(guān)系愈密切。,關(guān)系愈密切。 )(122 CRnnAN 22 nC65兩事物獨(dú)立的兩事物獨(dú)立的假定假定: : 行或列各分類的構(gòu)成比相同行或列各分類的構(gòu)成比相同, ,或在或在 A

34、A事物不同事物不同水平下水平下,B,B事物不同分類的作用事物不同分類的作用( (構(gòu)成構(gòu)成) )相等相等. .高血壓高血壓(B)(B)RHRH血型血型(A)(A)RHRH血型血型(A)(A)+ +- -+ +- -有有50(50)50(50)50(50)50(50)0(50)0(50)100(50)100(50)無無50(50)50(50)50(50)50(50)100(50)100(50)0(50)0(50)合計(jì)合計(jì)10010010010010010010010066例例 8 8 測得某地測得某地58015801人的人的ABOABO血型和血型和MNMN血型結(jié)血型結(jié)果如表果如表7-107-10,

35、問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?表表10 10 某地某地58015801人的血型人的血型 67 H0:兩種血型系統(tǒng)分類無關(guān)聯(lián):兩種血型系統(tǒng)分類無關(guān)聯(lián) (即(即行或行或列列構(gòu)成比構(gòu)成比相等)相等) H1:兩種血型系統(tǒng)分類有關(guān)聯(lián):兩種血型系統(tǒng)分類有關(guān)聯(lián) (即(即行或行或列列構(gòu)成比不構(gòu)成比不等)等) =0.0561314162131268434832145118234315801222 )(.).( 1883016213580116213. C結(jié)論結(jié)論:兩種血型系統(tǒng)分類有關(guān)聯(lián)。列聯(lián)系數(shù)兩種血型系統(tǒng)分類有關(guān)聯(lián)。列聯(lián)系數(shù)為為0.1883。兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,。兩種血

36、型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。但關(guān)系不太密切。 68當(dāng)比較組當(dāng)比較組k3時(shí),時(shí),2值有統(tǒng)計(jì)意義,可分解值有統(tǒng)計(jì)意義,可分解多個(gè)四格表了解各樣本率兩兩間的差別。多個(gè)四格表了解各樣本率兩兩間的差別。要進(jìn)一步推斷哪兩兩總體率有差別,若直接要進(jìn)一步推斷哪兩兩總體率有差別,若直接用四格表資料的用四格表資料的 檢驗(yàn)進(jìn)行多重比較,將會(huì)加檢驗(yàn)進(jìn)行多重比較,將會(huì)加大犯大犯類錯(cuò)誤的概率。類錯(cuò)誤的概率。多重比較的方法:多重比較的方法:2分割法;分割法;ScheffeScheffe可信區(qū)間法;可信區(qū)間法;SNKSNK法。法。69檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)年齡組年齡組 治愈治愈 好轉(zhuǎn)好轉(zhuǎn) 無效無效組組1 1組組2 2組組

37、k k年齡組年齡組 治愈治愈 好轉(zhuǎn)好轉(zhuǎn) 無效無效組組1 1組組2 2年齡組年齡組 治愈治愈 好轉(zhuǎn)好轉(zhuǎn) 無效無效組組1 1組組3 3年齡組年齡組 治愈治愈 好轉(zhuǎn)好轉(zhuǎn) 無效無效組組1 1組組k k其目的是保證檢驗(yàn)假設(shè)中其目的是保證檢驗(yàn)假設(shè)中I I型錯(cuò)誤型錯(cuò)誤的概率不變。的概率不變。因分析目的不同,主要有兩類多重比較形式:因分析目的不同,主要有兩類多重比較形式:多個(gè)實(shí)驗(yàn)組間的兩兩比較多個(gè)實(shí)驗(yàn)組間的兩兩比較實(shí)驗(yàn)組與同一個(gè)對照組的比較實(shí)驗(yàn)組與同一個(gè)對照組的比較檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)70分析目的為分析目的為k k個(gè)實(shí)驗(yàn)組間,任意兩個(gè)率均進(jìn)個(gè)實(shí)驗(yàn)組間,任意兩個(gè)率均進(jìn)行比較時(shí),須進(jìn)行行比較時(shí),須進(jìn)行k(k-1)/2

38、次獨(dú)立的四格表次獨(dú)立的四格表 檢驗(yàn),再加上總的行檢驗(yàn),再加上總的行列表資料的列表資料的 檢驗(yàn),檢驗(yàn),共共 k(k-1)/2+1次檢驗(yàn)假設(shè)。次檢驗(yàn)假設(shè)。故檢驗(yàn)水準(zhǔn)故檢驗(yàn)水準(zhǔn)用下式估計(jì)用下式估計(jì)0125. 012)13(305. 0,12)1( 本本例例kk71分析目的為各實(shí)驗(yàn)組與同一個(gè)對照組的比較分析目的為各實(shí)驗(yàn)組與同一個(gè)對照組的比較,而各實(shí)驗(yàn)組間不須比較。,而各實(shí)驗(yàn)組間不須比較。檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)用下式估計(jì)用下式估計(jì))1(2 k 722P2P2P6.240.012507.480.006258.210.004176.960.008337.880.005008.490.003587.240.0071

39、48.050.004558.730.003132 P2 P2 P73 例例9 9 對例對例6 6的資料進(jìn)行兩兩比較,以推斷的資料進(jìn)行兩兩比較,以推斷是否任兩種療法治療周圍性面神經(jīng)麻痹的有效是否任兩種療法治療周圍性面神經(jīng)麻痹的有效率均有差別?率均有差別? 1=2, 即任意兩對比組的總體有效率相等即任意兩對比組的總體有效率相等 12,即任意兩對比組的總體有效率不等,即任意兩對比組的總體有效率不等 =0.05 本例為本例為3 3個(gè)實(shí)驗(yàn)組間的兩兩比較個(gè)實(shí)驗(yàn)組間的兩兩比較 0125. 012)13(305. 0 74拒絕拒絕HH0 0,接收接收HH1 1拒絕拒絕HH0 0,接收接收HH1 1不拒絕不拒絕

40、HH0 075 例例10 10 對例對例6 6資料的藥物治療組為對照組,資料的藥物治療組為對照組,物理療法組與外用膏藥組為試驗(yàn)組,試分析兩物理療法組與外用膏藥組為試驗(yàn)組,試分析兩試驗(yàn)組與對照組的總體有效率有無差別?試驗(yàn)組與對照組的總體有效率有無差別? T=C, 即各試驗(yàn)組與對照組的總體有效率即各試驗(yàn)組與對照組的總體有效率相等相等 TC,即各試驗(yàn)組與對照組的總體有效率,即各試驗(yàn)組與對照組的總體有效率不等不等 =0.05 本例為各實(shí)驗(yàn)組與同一對照組的比較本例為各實(shí)驗(yàn)組與同一對照組的比較0125. 0)13(205. 0 76 物理療法組與藥物治療組比較:物理療法組與藥物治療組比較:2=6.76,

41、P0.0125, 按按=0.0125檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn), , 物理療法組與藥物物理療法組與藥物治療組拒絕治療組拒絕H0,H0,接受接受H1H1,可認(rèn)為物理療法組,可認(rèn)為物理療法組與藥物治療組的總體有效率有差別;與藥物治療組的總體有效率有差別; 外用膏藥組與藥物治療組不拒絕外用膏藥組與藥物治療組不拒絕H0H0,尚,尚不能認(rèn)為兩總體有效率有差別。不能認(rèn)為兩總體有效率有差別。 結(jié)合例結(jié)合例7 7資料,物理療法的有效率高于藥資料,物理療法的有效率高于藥物治療。物治療。77基本公式基本公式不配對四不配對四格表和校格表和校正公式正公式配對四格配對四格表公式表公式一一 . . 公式公式TTA22)( )()()()(22dbdccabaNbcad )()()()2/(22dbdccabaNNbcad cbcb 22)1( 78p目的目的: : 比較組間率和構(gòu)比較組間率和構(gòu)成比的差別成比的差別

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論