分類變量的假設(shè)檢驗(yàn)_第1頁
分類變量的假設(shè)檢驗(yàn)_第2頁
分類變量的假設(shè)檢驗(yàn)_第3頁
分類變量的假設(shè)檢驗(yàn)_第4頁
分類變量的假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

分類變量的假設(shè)檢驗(yàn)(hypothesistestforcategoricalvariable)北京大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系82801619康曉平2014.3.17表7.1兩組工人的骨質(zhì)增生發(fā)生率比較組別骨質(zhì)增生合計發(fā)生率(%)發(fā)生未發(fā)生井下礦工井上工人18(14.2)a9(12.8)c22(25.8)b27(23.2)d40(a+b)36(c+d)45.025.0合計27(a+c)49(b+d)76(n)35.5表7.6兩種方法的細(xì)菌培養(yǎng)結(jié)果比較A法B法合計++37(a)2(b)399(c)27(d)36合計462975

..結(jié)果方法+

合計陽性率Aab75a/75Bcd75c/75.表7.9避孕措施與避孕措施來源之間的關(guān)系避孕措施避孕措施來源合計醫(yī)務(wù)人員推薦自己選擇他人推薦避孕環(huán)口服藥安全套其它424108145911762032111023458117345945392529238合計7686926442104內(nèi)容

一、成組設(shè)計四格表資料的2檢驗(yàn)

二、成組設(shè)計四格表資料確切概率法三、配對設(shè)計四格表資料的2檢驗(yàn)四、RC列聯(lián)表資料的2檢驗(yàn)五、單向有序分類變量的秩和檢驗(yàn)六、頻數(shù)分布的擬合優(yōu)度2檢驗(yàn)

表7.1兩組工人的骨質(zhì)增生發(fā)生率比較組別骨質(zhì)增生合計發(fā)生率(%)發(fā)生未發(fā)生井下礦工井上工人18(14.2)a9(12.8)c22(25.8)b27(23.2)d40(a+b)36(c+d)45.025.0合計27(a+c)49(b+d)76(n)35.5(O-E)2

2=---------------

E2檢驗(yàn)的基本思想:2值反映了觀察頻數(shù)與期望頻數(shù)吻合的程度(或差別的程度)。觀察頻數(shù)與期望頻數(shù)的吻合程度越好,即兩者差別越小,2值越小。

檢驗(yàn)步驟:1.建立假設(shè)和確定檢驗(yàn)水平無效假設(shè):Ho:1=

2=35.5%備擇假設(shè):H1:1

2,

=0.05

一、成組四格表資料

2.計算理論數(shù)(E)

井下礦工E11=40×35.5%=14.2

E12

=40-14.2=25.8

井上工人E21=36×35.5%=12.8

E22=36-12.8=23.2選擇適當(dāng)公式計算2值(1)E5,n

40時,用基本公式(O-E)2

2=---------------

E(2)1≤

E<5,n40時,用校正公式

(|O-

E|-0.5)2

2

=-----------------------

E(3)若n<

40,或E

<

1時,需用Fisher確切概率法

(a+b)!(c+d)!(a+c)!(b+d)!

p=-------------------------------

a!b!c!d!n!

選擇適當(dāng)公式計算2值

本題,n=76,最小E=12.8確定P值

=(行數(shù)-1)×(列數(shù)-1)=(2-1)×(2-1)=1查2界值表20.05(1)=3.8423.84,P0.05差別無統(tǒng)計學(xué)意義23.84,P0.05差別有統(tǒng)計學(xué)意義26.63,P0.01差別有統(tǒng)計學(xué)意義本題2=3.3093.84,則P0.05

兩樣本率差別無統(tǒng)計學(xué)意義判斷結(jié)果不拒絕Ho,故還不能認(rèn)為兩組工人骨質(zhì)疏松的總體發(fā)生率有不同。也可以用SPSS軟件中的crosstabs程序計算,統(tǒng)計結(jié)果可以給出近似的概率P值.SPSS運(yùn)行結(jié)果見表7.2

表.兩療法對小兒單純性消化不良治愈率比較─────────────────────────

療法治愈數(shù)未愈數(shù)合計治愈率(%)─────────────────────────

甲2673378.79

乙3623894.74──────────────────────────

合計6297187.32

──────────────────────────

P>0.05二、成組設(shè)計四格表資料的確切概率法例7.5將23名精神抑郁癥患者隨機(jī)分到兩組,分別用兩種藥物治療,問兩種藥物的治療效果是否不同。表7.4兩種藥物治療精神抑郁癥的效果分組有效無效合計有效率%甲藥7(a)5(b)1258.3乙藥3(c)8(d)1127.3合計10132343.5基本思想是:在四格表邊緣合計固定不變的條件下,直接計算表內(nèi)四個格子數(shù)據(jù)的各種組合的概率,根據(jù)檢驗(yàn)所需的單側(cè)或雙側(cè)計算累計概率,與檢驗(yàn)水準(zhǔn)比較,作出是否拒絕H0的結(jié)論。

表7.4兩種藥物治療精神抑郁癥的效果分組有效無效合計有效率%甲藥7(a)5(b)1258.3乙藥3(c)8(d)1127.3合計10132343.5H0

:兩種藥物治療效果相等,即1=2H1

:兩種藥物治療效果不等,即1

2=0.05

甲藥組中恰好有x例有效的概率為:甲藥組的12例病人中恰好有7例有效的概率為四格表序號有效無效p1p2p1–p2P173580.5830.2730.3100.114224282490.6670.1820.4850.0237973913100.7500.0910.6590.00211541002110.8330.0000.8330.000058564670.5000.3640.136-655760.4170.455-0.038-746850.3330.545-0.212-837940.2500.636-0.3860.0634589281030.1670.727-0.5600.00951910191120.0830.818-0.7350.000577110101210.0000.909-0.9090.000001表7.5各種組合的四格表計算的確切概率

本例的研究目的是甲乙兩種藥物的治療效果何者為優(yōu),所以用雙側(cè)檢驗(yàn)。將表7.5中

p1–p2

0.310的8個四格表的P值相加,得累計概率P=0.214。按

=0.05水準(zhǔn)不拒絕無效假設(shè),兩組藥物療效的差別無統(tǒng)計學(xué)意義,尚不能認(rèn)為兩藥治療精神抑郁癥的效果不同。三、配對設(shè)計四格表資料的2檢驗(yàn)表7.6兩種方法的細(xì)菌培養(yǎng)結(jié)果比較A法B法合計++37(a)2(b)399(c)27(d)36合計462975

其研究目的是為檢驗(yàn)兩種處理方法的總體陽性率A與B是否有差別,而兩種處理的樣本陽性率及其差值分別為pA=(a+b)/n,pB=(a+c)/n,

pA

pB

=(bc)/n

。兩樣本陽性率差值pA

pB的大小完全是由b與c決定.H0

:兩種方法的細(xì)菌培養(yǎng)陽性率相同,即B=CH1

:兩種方法的細(xì)菌培養(yǎng)陽性率不同,即BC=0.05本例b+c=2+9=1140,用校正公式(7.9)計算2值查2界值表,20.05,1=3.84,P>0.05,按

=0.05水準(zhǔn)不拒絕H0,差別無統(tǒng)計學(xué)意義,故還不能認(rèn)為乳膠凝聚法和常規(guī)培養(yǎng)法對乳制品的細(xì)菌培養(yǎng)陽性率不同。在SPSS統(tǒng)計軟件crosstabs對話框中,選擇statistics-----McNemar就可得到McNemar檢驗(yàn)的直接概率P=0.065,結(jié)果與公式計算一樣。四、

RC列聯(lián)表資料的2檢驗(yàn)

多個獨(dú)立樣本率的比較(R2表),兩個或多個獨(dú)立樣本構(gòu)成比的比較(2

C表或R

C表),單個樣本資料的兩個無序分類變量間有無關(guān)聯(lián)性的統(tǒng)計推斷(R

C表)。

表7.7某省三個地區(qū)花生的黃曲霉毒素B1污染率比較

調(diào)查地區(qū)

受檢樣品未污染污染合計污染率(%)甲乙丙63082314329441179.331.827.3合計44408447.6H0:三個地區(qū)花生的黃曲霉毒素B1污染率相等,即π1=π2=π3H1:三個地區(qū)花生的黃曲霉毒素B1污染率不等或不全相等

α=0.05υ=(3-1)(2-1)=2

查附表7(2界值表),本例2=17.907>10.60,

故P<0.005,按α=0.05水準(zhǔn)拒絕H0,接受H1

,三個樣本率的差別有統(tǒng)計學(xué)意義,

故認(rèn)為三個地區(qū)花生的黃曲霉毒素B1污染率不等或不全相等,有地區(qū)性差異。

多個樣本率比較的2分割法作兩兩比較時,為減小一類錯誤發(fā)生的概率,必須重新規(guī)定檢驗(yàn)水準(zhǔn)’。

K為參加檢驗(yàn)的組數(shù),上例K=3,估計值為:

三組污染率的兩兩比較

1.甲-乙地區(qū)比較

2

15.7773P=0.0001,

兩個樣本率的差別有統(tǒng)計學(xué)意義。

2.甲-丙地區(qū)比較

:2

9.493P=0.002,

兩個樣本率的差別有統(tǒng)計學(xué)意義。

3.乙-丙地區(qū)比較:

2

0.85P=0.770,

兩個樣本率的差別無統(tǒng)計學(xué)意義。表7.8比較兩種疾病患者首選醫(yī)療機(jī)構(gòu)就診的頻數(shù)分布疾病分組調(diào)查人數(shù)

首次就診人數(shù)(%)

精神綜合中醫(yī)個體無照病院醫(yī)院診所診所診所情感性精神障礙48(100.0)15(31.3)11(22.9)8(16.7)10(20.8)4(8.3)精神發(fā)育遲滯67(100.0)13(19.4)3(4.5)19(28.4)12(17.9)20(29.9)合計1152814272224H0:兩種疾病患者首選醫(yī)療機(jī)構(gòu)就診的頻數(shù)分布相同H1:兩種疾病患者首選醫(yī)療機(jī)構(gòu)就診的頻數(shù)分布不同表7.9避孕措施與避孕措施來源之間的關(guān)系避孕措施避孕措施來源合計醫(yī)務(wù)人員推薦自己選擇他人推薦避孕環(huán)口服藥安全套其它424108145911762032111023458117345945392529238合計7686926442104H0:采用何種避孕措施與其來源無關(guān)聯(lián)H1:采用何種避孕措施與其來源有關(guān)聯(lián)

查附表7(2界值表),本例2=189.8>12.59,P<0.05,按α=0.05水準(zhǔn),拒絕H0,接受H1,兩變量的關(guān)聯(lián)性有統(tǒng)計學(xué)意義,

認(rèn)為育齡婦女采用的避孕措施與其來源有關(guān)聯(lián)。

除關(guān)聯(lián)性檢驗(yàn)外,用于說明兩個變量之間關(guān)系的密切程度,則需計算關(guān)聯(lián)系數(shù)(contingencycoefficient,符號C),

計算公式為結(jié)合2檢驗(yàn)結(jié)果可知,雖然該地育齡婦女采用的避孕措施與其來源有關(guān)聯(lián),但關(guān)聯(lián)系數(shù)顯示兩變量關(guān)聯(lián)的密切程度并不大。用SPSS統(tǒng)計軟件的crosstabs程序可以作兩個無序分類變量的關(guān)聯(lián)檢驗(yàn),并通過點(diǎn)擊statistics----nominal----contingencycoefficient得到關(guān)聯(lián)系數(shù)。

R×C列聯(lián)表2檢驗(yàn)的注意事項(xiàng)1.R×C列聯(lián)表2檢驗(yàn)對理論頻數(shù)有要求。2.多個樣本率比較的2檢驗(yàn),若結(jié)論拒絕無效假設(shè),只能認(rèn)為各總體率之間總的來說不同,但不能說明它們彼此之間都不同,或某兩者之間有差別。要解決此問題,可用2分割法。3.關(guān)于單向有序資料(等級資料)的統(tǒng)計處理。若比較組間在度量上(程度)的差異宜用秩和檢驗(yàn)。五、單向有序分類變量的秩和檢驗(yàn)

單向有序分類變量是指列聯(lián)表中的分組變量的取值是無序分類的,而結(jié)局變量的取值是有序的。例如,正常人和慢性支氣管炎病人痰液中某種白細(xì)胞的檢查結(jié)果被劃分為“-、+、++、+++”四個等級.

表7.11正常人和慢性支氣管炎病人痰液的白細(xì)胞結(jié)果比較結(jié)果(1)人數(shù)合計(4)秩次范圍(5)平均秩次(6)秩和T1(7)=(2)(6)秩和T2(8)=(3)(6)正常人(2)病人(3)-115161~168.593.542.5+10182817~4430.5305.0549.0++3161945~6354.0162.0864.0+++05564~6866.00330.0合計244468——T1=560.5T2=1785.5建立檢驗(yàn)假設(shè)H0:兩組痰液中此類白細(xì)胞總體分布相同H1:兩組痰液中此類白細(xì)胞總體分布不同=0.05(4)確定P值和作出統(tǒng)計結(jié)論查附表1(Z界值表),雙側(cè)Z0.05/2=1.96,本例Zc=3.6217>1.96,故P<0.05。按α=0.05水平拒絕H0,接受H1,認(rèn)為正常人和慢性支氣管炎病人痰液此類白細(xì)胞的檢查結(jié)果不同。

用SPSS統(tǒng)計軟件中的nonparametrictests----2IndependentSamples---Mann-WhitneyU

做秩和檢驗(yàn)得到Z統(tǒng)計量。

表11.12三種藥物治療單純性慢性支氣管炎療效療效(1)藥物合計(5)A(2)B(3)C(4)治愈175325顯效51111779好轉(zhuǎn)335247132無效7242657合計1089293293H0:三個總體有相同分布(三種藥物的療效相同)H1:三個總體的分布不同或不全相同

(三種藥物的療效不同或不全相同)=0.05用SPSS統(tǒng)計軟件中的nonparametrictests-------KIndependentSamples-------Kruskal-WallisH做秩和檢驗(yàn)得到Hc統(tǒng)計量。表7.10Poisson分布的擬合與檢驗(yàn)單位容積內(nèi)細(xì)菌數(shù)X(1)觀察頻數(shù)O(2)

/X(

=2.49

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論