中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué)第五講計數(shù)資料與卡方檢驗2_第1頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué)第五講計數(shù)資料與卡方檢驗2_第2頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué)第五講計數(shù)資料與卡方檢驗2_第3頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué)第五講計數(shù)資料與卡方檢驗2_第4頁
中國醫(yī)科大學(xué)研究生醫(yī)學(xué)統(tǒng)計學(xué)第五講計數(shù)資料與卡方檢驗2_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計數(shù)資料常見的數(shù)據(jù)形式是絕對數(shù),如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。絕對數(shù):只能表示某事物在某時、某地發(fā)生的實際水平。相對數(shù):便于相互比較與分析。第一頁,共66頁。

例:甲、乙兩地麻疹流行,甲地發(fā)病300人絕對數(shù)乙地發(fā)病250人甲>乙但不能據(jù)此確定甲地麻疹流行較為嚴重,需考慮易感人數(shù)。若甲地易感人數(shù)3000人乙地易感人數(shù)1000人則甲地麻疹發(fā)病率=300/3000=10%

乙地麻疹發(fā)病率=250/1000=25%

相對數(shù)乙>甲第二頁,共66頁。

常用的相對數(shù)指標有比、比例和率三種。

1.兩個有關(guān)指標之比稱為比(ratio),或稱相對比;2.當比的分子是分母的一部分時,稱為比例(proportion),或稱結(jié)構(gòu)相對數(shù)。

3.當比例與時間有關(guān)系時稱為率(rate),或稱為強度相對數(shù)。第三頁,共66頁。第一節(jié)常用相對數(shù)

一、率(強度相對數(shù))

率(rate)是表示某種現(xiàn)象發(fā)生的頻率和強度,常以百分率(%),千分率(‰),萬分率(1/萬),十萬分率(1/10萬)等表示,計算公式為:

第四頁,共66頁。例1某企業(yè)2003年有2839名職工,該企業(yè)每年都對職工進行體檢,這一年新發(fā)生高血壓患者5例,高血壓發(fā)病率為:5/2839×1000‰=1.76‰。比例基數(shù)的選擇主要依據(jù)習(xí)慣用法或使計算結(jié)果保留一位或二位整數(shù),以便閱讀。第五頁,共66頁。

二、構(gòu)成比(結(jié)構(gòu)相對數(shù))

構(gòu)成比(Constituentratio)表示事物內(nèi)部各個組成部分所占整體的比重,通常以100%為比例基數(shù),以百分比表示,計算公式如下:

第六頁,共66頁。例2某醫(yī)院1990年和1998年住院病人死于五種疾病的人數(shù)見下表。第七頁,共66頁。

特點:(1)同一事物的各個組成部分的構(gòu)成比之和應(yīng)為100%。(2)事物內(nèi)部各組成部分之間呈此消彼長的關(guān)系。第八頁,共66頁。

三、相對比

相對比(ratio),是兩個有關(guān)的指標之比,用以描述兩者的對比水平。兩個指標可以是絕對數(shù)、相對數(shù)或平均數(shù);可以性質(zhì)相同,也可以性質(zhì)不同。

第九頁,共66頁。(一)結(jié)構(gòu)相對數(shù)不能代替強度相對數(shù)

構(gòu)成比只能說明某事物內(nèi)部各組成部分的比重和分布,不能說明這事物某一部分發(fā)生的強度與頻率。

第二節(jié)應(yīng)用相對數(shù)的注意事項第十頁,共66頁。

(二)計算相對數(shù)應(yīng)有足夠數(shù)量分母過小時相對數(shù)不穩(wěn)定。在觀察例數(shù)較小時,直接用絕對數(shù)表示。如“5例中4例有效”,而不要寫有效率為80%,以免引起誤解。第十一頁,共66頁。

(三)正確計算合計率

不能簡單地由各組率相加或平均而得,而應(yīng)用合計的有關(guān)實際數(shù)字進行計算。例如用某療法治療肝炎,甲醫(yī)院治療150人,治愈30人,治愈率為20%;乙醫(yī)院治療100人,治愈30人,治愈率為30%。兩個醫(yī)院合計治愈率應(yīng)該是[(30+30)/(150+100)]×100%=24%。若算為20%+30%。50%或(20%+30%)/2=25%,則是錯的。第十二頁,共66頁。

(四)注意資料的可比性用以比較的資料應(yīng)是同質(zhì)的,除了要比較的處理因素外,其它條件應(yīng)基本相同。對于不同時期、地區(qū)、條件下的資料應(yīng)注意是否齊同。第十三頁,共66頁。(五)對比不同時期資料應(yīng)注意客觀條件是否相同

例如,疾病報告制度完善和資料完整的地區(qū)或年份,發(fā)病率可以“升高”;居民因醫(yī)療普及,就診機會增加,或診斷技術(shù)提高,也會引起發(fā)病率“升高”。因此在分析討論時,應(yīng)根據(jù)各方面情形全面考慮,慎重對待。第十四頁,共66頁。

(六)樣本率(或構(gòu)成比)的抽樣誤差不能僅憑數(shù)字表面相差大小下結(jié)論,而應(yīng)進行樣本率(或構(gòu)成比)差別的假設(shè)檢驗。第十五頁,共66頁。

χ2檢驗

第十六頁,共66頁。

χ2檢驗在分類資料中的應(yīng)用:(1)推斷兩個(或多個)總體率或構(gòu)成比之間有無差別(2)多個樣本率間多重比較(3)兩個分類變量之間有無關(guān)聯(lián)性(4)多維列聯(lián)表的分析(5)頻數(shù)分布擬合優(yōu)度的χ2檢驗

第十七頁,共66頁。第一節(jié)四格表資料的χ2檢驗

χ2檢驗的基本思想:是檢驗實際頻數(shù)和理論頻數(shù)的差別是否由抽樣誤差所引起的。第十八頁,共66頁。

一、χ2檢驗的統(tǒng)計量基本公式為:

應(yīng)用條件:n≥40,且T≥5,其中第十九頁,共66頁。處理有效無效合計ABacbda+bc+d合計a+cb+dn=a+b+c+d第二十頁,共66頁。

表7-1兩組降低顱內(nèi)壓有效率的比較第二十一頁,共66頁。

χ2值的含義:反映了實際頻數(shù)與理論頻數(shù)的吻合程度。

χ2值理論上是非負值。(即χ2≥0)χ2檢驗判別準則:

若χ2<χ20.05(ν),則P>0.05,不拒絕無效假設(shè)H0;若χ2≥χ20.05(ν),則P<0.05,拒絕無效假設(shè)H0,接受H1

。第二十二頁,共66頁。表1常用χ2值界值表

第二十三頁,共66頁。第二十四頁,共66頁。

χ2分布的參數(shù):自由度。其計算公式為:ν=(行數(shù)-1)(列數(shù)-1)

=(R-1)(C-1)

第二十五頁,共66頁。第二十六頁,共66頁。例7-1某院欲比較異梨醇口服液(試驗組)和氫氯噻嗪+地塞米松(對照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機分為兩組,結(jié)果見表7-1。問兩組降低顱內(nèi)壓的總體有效率有無差別?

第二十七頁,共66頁。表7-1兩組降低顱內(nèi)壓有效率的比較

H0:π1=π2=pc=(a+c)/np1=a/(a+b)=99/104

p2=c/(c+d)=75/96

pc=(a+c)/n=174/200

T11=(a+b)(a+c)/n=(a+b)pc=104×174/200

T21=(c+d)(a+c)/n=(c+d)pc=96×174/200

第二十八頁,共66頁。表7-1內(nèi)只有4個數(shù)是該表的基本數(shù)據(jù),其余數(shù)據(jù)都是由這4個基本數(shù)據(jù)推算出來的,稱為四格表(fourfoldtable)資料。第二十九頁,共66頁。

χ2檢驗的檢驗步驟H0:π1=π2H1:π1≠π2α=0.05;以υ=1查χ2界值表得P<0.05。按α=0.05檢驗水準拒絕Ho,接受H1,可以認為兩組降低顱內(nèi)壓總體有效率不等。

第三十頁,共66頁。

二、四格表資料χ2檢驗專用公式:(n≥40且所有的T≥5)

l

第三十一頁,共66頁。

三、四格表資料χ2檢驗的連續(xù)性校正:

(n≥40且某一個理論數(shù)1≤T<5)校正公式分別為:

例如:例7-2就是利用此公式進行的計算第三十二頁,共66頁。例7-2某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷酯治療腦血管疾病的療效,將78例腦血管疾病患者隨機分為兩組,結(jié)果見表7-2。問兩種藥物治療腦血管疾病的有效率是否相等?表7-2兩種藥物治療腦血管疾病有效率的比較

第三十三頁,共66頁。H0:π1=π2H1:π1≠π2α=0.05n=78,但有一個格子的理論頻數(shù)為4.67,可用四格表資料X2檢驗的校正公式(7-5)或公式(7-6)。本例用公式(7-6)計算校正X2值

第三十四頁,共66頁。υ=1,查X2界值表得0.05<P<0.10。按α=0.05檢驗水準不拒絕Ho,尚不能認為兩種藥物治療腦血管疾病的有效率不等。本資料若不校正時,X2=4.35,P<0.05,結(jié)論與之相反。第三十五頁,共66頁。最小理論頻數(shù)TRC的判斷:R行與C列中,行合計數(shù)中的最小值與列合計數(shù)中的最小值所對應(yīng)格子的理論頻數(shù)最小。如本例,第2行與第2列所對應(yīng)的格子理論頻數(shù)最小(4.67)。

第三十六頁,共66頁。第二節(jié)配對設(shè)計的四格表資料的χ2檢驗

(一)配對四格表形式

BA乙種屬性甲種屬性+-合計

+aba+b-cdc+d

合計a+cb+dn=a+b+c+d第三十七頁,共66頁。a,d:兩法觀察結(jié)果一致的兩種情況,b,

c:

兩法觀察結(jié)果不一致的兩種情況。第三十八頁,共66頁。若兩種處理方法無差別,總體:B=C。因抽樣誤差不可避免,樣本往往b≠c,需進行假設(shè)檢驗

(McNemartest

),檢驗統(tǒng)計量為。第三十九頁,共66頁。例7-3某實驗室分別用乳膠凝集法和免疫熒光法對58名可疑系統(tǒng)紅斑狼瘡患者血清中抗核抗體進行測定,結(jié)果見表7-3。問兩種方法的檢測結(jié)果有無差別?

第四十頁,共66頁。表7-3兩種方法的檢測結(jié)果

第四十一頁,共66頁。(二)計算公式

1.b+c≥40時

2.b+c<40時

第四十二頁,共66頁。H0:總體B=C=(b+c)/2H1:總體B≠C=+[b-(b+c)/2]2

(b+c)/2[c-(b+c)/2]2

(b+c)/2=+

[(b-c)/2]2

(b+c)/2

[(c-b)/2]2

(b+c)/2=

(b-c)2/2

(b+c)/2

第四十三頁,共66頁。H0:總體B=CH1:總體B≠Cα=0.05b+c=12+2=14<40。

=1,查界值表得P<0.05。按α=0.05檢驗水準,拒絕H0,接受H1,可以認為兩種方法的檢測結(jié)果不同。第四十四頁,共66頁。第三節(jié)四格表的Fisher確切概率法提出直接計算有利于拒絕H0的概率,以作出檢驗判斷。Fisher確切概率法并非χ2檢驗的范疇。但在實際應(yīng)用中常用它作為四格表資料假設(shè)檢驗的補充

2.適用條件:(1)n<40

(2)T<1

(3)P≈α

第四十五頁,共66頁。第四節(jié)行×列表資料的χ2檢驗

行×列表資料的χ2檢驗用于:多個樣本率的比較、兩個或多個構(gòu)成比的比較、以及雙向無序分類資料的關(guān)聯(lián)性檢驗

第四十六頁,共66頁。一、多個樣本率的比較(例7-6)二、兩個或多個構(gòu)成比的比較(例7-7)三、雙向無序分類資料的關(guān)聯(lián)性檢驗(例7-8)

對一個樣本(或稱一組觀察對象)按照兩種分類變量的取值,排列成二維的表,χ2檢驗可用于分析兩分類變量的關(guān)系。第四十七頁,共66頁。一、多個樣本率的比較例7-6某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經(jīng)麻痹的療效,資料見表7-8。問三種療法的有效率有無差別?第四十八頁,共66頁。表7-8三種療法有效率的比較第四十九頁,共66頁。H0:π1=π2=π3,即三種療法治療周圍性面神經(jīng)麻痹的有效率相等H1:三種療法治療周圍性面神經(jīng)麻痹的有效率不全相等α=0.05=21.04,=2,查界值表得P<0.005。按α=0.05水準,拒絕H0,接受H1,可認為三種療法治療周圍性面神經(jīng)麻痹的有效率有差別。

第五十頁,共66頁。二、樣本構(gòu)成比的比較例7-7某醫(yī)師在研究血管緊張素I轉(zhuǎn)化酶(ACE)基因I/D多態(tài)與2型糖尿病腎病(DN)的關(guān)系時,將249例2型糖尿病患者按有無糖尿病腎病分為兩組,資料見表7-9,問兩組2型糖尿病患者的ACE基因型總體分布有無差別?第五十一頁,共66頁。表7-9DN組與無DN組2型糖尿病患者ACE基因型分布的比較

第五十二頁,共66頁。H0:兩組2型糖尿病患者ACE基因型的總體構(gòu)成比相同H1:兩組2型糖尿病患者ACE基因型的總體構(gòu)成比不同α=0.05查界值表得0.01<P<0.025。按α=0.05水準,拒絕H0,接受H1,可認為DN組與無DN組的2型糖尿病患者的ACE基因型分布不同。

第五十三頁,共66頁。三、雙向無序分類資料的關(guān)聯(lián)性檢驗

兩個無序分類變量的行×列表資料,稱雙向無序R×C表資料。行×列表資料檢驗:推斷兩個無序分類變量之間有無關(guān)系/關(guān)聯(lián)。若有關(guān)系,想進一步分析關(guān)系的密切程度,可計算Pearson列聯(lián)系數(shù)C。第五十四頁,共66頁。表7-10某地5801人的血型第五十五頁,共66頁。:行×列表資料的值n:樣本含量Pearson列聯(lián)系數(shù)

C

:0~10

完全獨立;1

完全相關(guān);愈接近0,關(guān)系愈不密切;愈接近1,關(guān)系愈密切。第五十六頁,共66頁。例7-8測得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?H0:兩種血型系統(tǒng)間無關(guān)聯(lián)H1:兩種血型系統(tǒng)間有關(guān)聯(lián)α=0.05第五十七頁,共66頁。查界值表得P<0.005。按α=0.05水準,拒絕H0,接受H1,可以認為兩種血型系統(tǒng)間有關(guān)聯(lián),可進一步計算Pearson列聯(lián)系數(shù),以分析其關(guān)系密切程度。

第五十八頁,共66頁??梢姡瑑煞N血型系統(tǒng)間雖然有關(guān)聯(lián)性,但列聯(lián)系數(shù)C數(shù)值較小,雖然有統(tǒng)計學(xué)意義,可認為關(guān)系不太密切。第五十九頁,共66頁。行×列表χ2檢驗時的注意事項1.不宜有1/5以上的理論頻數(shù)小于5或有1個格子的理論頻數(shù)小于1。解決的辦法有三種:

(1)增加樣本量。

(2)性質(zhì)相近鄰行或鄰列合或刪去理論數(shù)太小的行或列。

(3)改用雙向無序R×C表的Fisher確切概率法。第六十頁,共66頁。

2.當多個樣本率(或構(gòu)成比)比較的χ2檢驗,結(jié)論為拒絕檢驗假設(shè),只能認為各總體率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論