第五講卡方檢驗_第1頁
第五講卡方檢驗_第2頁
第五講卡方檢驗_第3頁
第五講卡方檢驗_第4頁
第五講卡方檢驗_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2/6/20231第五講卡方檢驗周虹公共衛(wèi)生學(xué)院婦女與兒童青少年衛(wèi)生學(xué)系2/6/20232基本內(nèi)容

統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)數(shù)值變量頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標(biāo)準(zhǔn)誤均數(shù)可信區(qū)間tZF檢驗秩和檢驗直線相關(guān)與回歸偏相關(guān)多元線性回歸因子分析分類變量相對數(shù)(率、比)率的可信區(qū)間2檢驗Logistic回歸主要內(nèi)容一、分類變量概述二、分類變量的統(tǒng)計描述相對數(shù)應(yīng)用相對數(shù)的注意事項動態(tài)數(shù)列率的標(biāo)準(zhǔn)化三、分類變量的統(tǒng)計推斷率的標(biāo)準(zhǔn)誤和可信區(qū)間2檢驗2/6/20234

x2檢驗(Chi-squaretest)是一種假設(shè)檢驗方法與其他假設(shè)檢驗的原理相同統(tǒng)計量服從x2分布

(一)成組設(shè)計四格表資料的x2

檢驗

(二)配對設(shè)計四格表資料的x2

檢驗

(三)行x列表x2

檢驗

(四)趨勢x2

檢驗2/6/20235什么是成組設(shè)計四格表資料?

兩個獨立樣本的率或構(gòu)成比資料例1:某醫(yī)生想觀察一種新藥對流感的預(yù)防效果,進(jìn)行了如下的研究,問此藥是否有效?(一)成組設(shè)計四格表資料的χ2檢驗2/6/20236四格表的一般形式理論頻數(shù)E計算公式為:

NR:所在的行合計,NC:所在的列合計SPSS練習(xí)加權(quán)數(shù)據(jù)庫的建立:分類變量進(jìn)行樣本率的比較時,如果沒有原始數(shù)據(jù)庫,只有每種分類變量的樣本數(shù)和某現(xiàn)象的陽性數(shù),可在SPSS軟件中建立數(shù)據(jù)庫;用加權(quán)變量的方法建立數(shù)據(jù)庫甲組乙組陽性aba+b陰性cdc+da+cb+dN+/-組cases+甲a+乙b-甲c-乙d+/-組Weight11a12b21c22dSPSS程序:DataWeightCasesWeightcasesby選入

FrequencyvariableOK8四格表卡方檢驗與配對卡方檢驗數(shù)據(jù)庫格式組+/-Weight11a12b21c22d甲法乙法Weight11a12b21c22d9數(shù)據(jù)處理:Data---WeightCases并進(jìn)行樣本率的比較。練習(xí):實習(xí)六中練習(xí)6.1和6.2數(shù)據(jù)建立數(shù)據(jù)庫。102/6/202311實際頻數(shù)(O,observed)和理論頻數(shù)(E,expected)

實際頻數(shù)是指調(diào)查或?qū)嶒灥脕淼臄?shù)值,在例1中,四格表中的四個基本數(shù)據(jù)都是實際頻數(shù)。

理論頻數(shù)是根據(jù)假設(shè)檢驗來確定的。也就是H0成立時,計算出的格子中的數(shù)。本題中假設(shè)實驗組和對照組發(fā)病率相同,這樣可以算出總的患病率:

那么:實驗組的理論發(fā)病人數(shù)為對照組的理論發(fā)病人數(shù)為…因此,四個格子的理論頻數(shù)為:208024961.

x2

檢驗的基本思想148630902/6/202312x2檢驗的基本公式:▲O:表示實際頻數(shù),即實際觀察到的例數(shù)?!?/p>

E:理論頻數(shù),即如果假設(shè)檢驗成立,應(yīng)該觀察到的例數(shù)?!?/p>

:求和符號,所有格子的值之和▲自由度:=(R-1)x(C-1)

R行數(shù),C列數(shù)

注意:反映的格子數(shù),而不是例數(shù)。2/6/202313χ2檢驗假設(shè)兩組率相同,(O-E)2/E應(yīng)該很小。如果實際頻數(shù)和理論頻數(shù)相差的很大,χ2值也越大。當(dāng)χ2值比規(guī)定的界值還大時,被認(rèn)為是小概率事件,就拒絕H0,認(rèn)為兩組率不相同。因為χ2值是對每個格子的(O-E)2/E求和,所以格子數(shù)越多,χ2值也越大。即使O和E相差很小,如果格子數(shù)多的話,總和也會很大。這就引出了自由度的概念,用以消除不同格子數(shù)的影響。

x2檢驗的原理:2/6/202314χ2分布規(guī)律:χ2分布的圖形是不對稱的,而且只有正值。其形狀和自由度有關(guān),自由度越大,則圖形右移。隨著自由度的增加,分布的偏斜程度趨于緩解,逐漸顯露出對稱性。隨著自由度的繼續(xù)增大,χ2分布將趨近于對稱的正態(tài)分布。2/6/2023152/6/202316自由度一定時,P值越小,x2值越大,反比關(guān)系。=1時,P=0.05,x2=3.84P=0.01,x2=6.63當(dāng)P值一定時,自由度越大,x2越大。

P=0.05時,=1,x2=3.84

=2,x2=5.99

2/6/2023172.成組四格表的專用公式

該公式從x2基本公式推導(dǎo)而來,計算較為簡單,結(jié)果相同。abcd2/6/2023183.成組四格表χ2檢驗計算公式的適用條件(1)當(dāng)實驗對象總個數(shù)n>40,且所有格子的理論頻數(shù)E≥5時,可用χ2檢驗基本公式或?qū)S霉接嬎悝?值。

(2)當(dāng)n>40,但有任一格子的理論頻數(shù)E僅滿足1<E<5時,需用校正公式:

或:

(3)當(dāng)n≤40,或有任一格子E≤1時,不能計算χ2值,而需用Fisher確切概率計算法。2/6/202319成組四格表x2

檢驗的SPSS計算程序AnalyzeDescriptivestatisticscrosstabs2/6/2023202/6/2023212/6/2023224.檢驗步驟例1:①建立檢驗假設(shè)

H0:兩組發(fā)病率相同,都等于合計率,即π1=π2H1:兩組發(fā)病率不同,即π1≠π2②確定顯著性水平α=0.05。③計算統(tǒng)計量

n=220>40,所有格子E>5,所以不用校正:χ2=4.125④確定p值

p=0.042<0.05。⑤判斷結(jié)果:

因為p<0.05,所以在α=0.05的水平上拒絕檢驗假設(shè)H0,接受H1,可以認(rèn)為兩組發(fā)病率不同,該新藥對預(yù)防流感有效。2/6/202323例2.某醫(yī)師用甲、乙兩療法治療小兒單純性消化不良,結(jié)果如下。試比較兩種療法效果有無差異。

甲乙兩種方法治療小兒單純性消化不良效果療法痊愈數(shù)未愈數(shù)合計甲26(28.82)7(4.18)33乙36(33.18)2(4.82)38合計629712/6/202324作業(yè)1某縣為了解農(nóng)村兒童低出生體重的發(fā)生率。在婦幼保健院測量了263名農(nóng)村戶籍兒童出生體重,其中低出生體重為22名,試估計該縣農(nóng)村兒童低出生體重發(fā)生率的95%可信區(qū)間?25分類變量的統(tǒng)計推斷作業(yè)2我國城市兒童巨大兒(出生體重大于等于4000克)的發(fā)生率為6.5%。某醫(yī)院測量了336名兒童出生體重數(shù)據(jù)(出生體重-率.sav),請問該醫(yī)院調(diào)查的兒童巨大兒發(fā)生率是否高于我國城市兒童?男孩和女孩巨大兒發(fā)生率有無差別?26分類變量的統(tǒng)計推斷2/6/202327(二)配對設(shè)計四格表資料的2檢驗例3.有93份咽喉涂抹標(biāo)本,每份標(biāo)本分別接種在甲乙兩種培養(yǎng)基上,觀察其生長情況,結(jié)果如下表,請問兩種培養(yǎng)基的效果是否不同?甲乙兩種培養(yǎng)基的生長情況乙培養(yǎng)法甲培養(yǎng)法合計陽性陰性陽性371047陰性192746合計5637932/6/202328

配對資料:是同一研究對象用不同的方法進(jìn)行實驗或調(diào)查,也就是說,這28份標(biāo)本既進(jìn)行了甲種方法的培養(yǎng),又進(jìn)行了乙種方法的培養(yǎng)。

我們要研究的是兩種培養(yǎng)基有什么不同?

所以a和d格子里的數(shù)對研究沒有多大意義,只要b和c的標(biāo)本份數(shù)相差不大,就可以認(rèn)為兩種培養(yǎng)基效果相同。2/6/202329配對四格表資料χ2檢驗的公式:當(dāng)b+c>40時,或

當(dāng)b+c≤40時,用校正公式:

或2/6/202330配對四格表2檢驗的SPSS計算程序ANALYZEnonparametrictest2relatedsamplestestpairsMcnemar2/6/202331例3:檢驗步驟第一步:建立假設(shè)H0:B=C=b+c/2

H1:

B?C

第二步:確定顯著性水平=0.05第三步:計算統(tǒng)計量:b+c40時,校正公式:

x2

=(|O-E|-0.5)2/E或x2=(lb-cl-1)2/b+c自由度:=(2-1)x(2-1)=1第四步:確定P值第五步:判斷結(jié)果2/6/202332(三)行x列表x2

檢驗

四格表是指只有2行2列,當(dāng)行數(shù)或列數(shù)超過2時,統(tǒng)稱為行x列表。行x列表x2

檢驗是對多個樣本率(或構(gòu)成比)的檢驗。

基本公式:x2

=(O-E)2/E專用公式:自由度:=(R-1)x(C-1)適用條件:表中不宜有1/5以上格子的理論頻數(shù)小于5,或有一個格子的理論頻數(shù)小于1。2/6/202333例4.為了解花生黃曲霉素污染,隨機(jī)觀察了三個地區(qū),結(jié)果見下表。試問這三個地區(qū)花生的黃曲霉素污染率是否不同?

三個地區(qū)花生的黃曲霉素污染情況調(diào)查地區(qū)受檢樣品合計污染率(%)未污染污染甲6232979.3乙30144431.8丙831127.3合計44408447.62/6/2023342/6/202335初次分娩時的年齡疾病狀態(tài)<2020~2425~2930~34≥35總計乳腺癌320120610114632203220對照組142244322893109340610246總計174256383904155662613466乳腺癌%0.1840.2140.2590.2980.3510.239例5.初次分娩年齡與乳腺癌的關(guān)聯(lián)性2/6/2023362/6/202337H0:乳腺癌患者與非患者的初次分娩年齡構(gòu)成相同

(初次分娩時的年齡與乳腺癌無關(guān))H1:乳腺癌患者與非患者的初次分娩年齡構(gòu)成不同

(初次分娩時的年齡與乳腺癌有關(guān))α=0.05自由度ν=(R-1)×(C-1)=(2-1)(5-1)=4χ2

0.01,4=13.28,χ2=130.2>13.28,p<0.01

所以拒絕檢驗假設(shè)H0,接受H1,認(rèn)為初次分娩時的年齡與乳腺癌的發(fā)生有關(guān)聯(lián)。2/6/202338行×列表χ2檢驗下結(jié)論時應(yīng)注意:1.三組(或三組以上)樣本率經(jīng)χ2檢驗,差異有顯著性,只說明三組比例數(shù)不同或不全相同,不能確定是哪兩個比例數(shù)不同。2/6/2023392.行×列表χ2檢驗時,如果有一個格子的理論數(shù)小于1,或者有1/5以上的格子的理論數(shù)小于5,可以將理論數(shù)小于5的組別與相鄰的組合并,再進(jìn)行χ2檢驗,否則會得到錯誤結(jié)果

解決辦法χ2分割法2/6/202340例4.為了解花生黃曲霉素污染,隨機(jī)觀察了三個地區(qū),結(jié)果見下表。試問這三個地區(qū)花生的黃曲霉素污染率是否不同?

三個地區(qū)花生的黃曲霉素污染情況調(diào)查地區(qū)受檢樣品合計污染率(%)未污染污染甲6232979.3乙30144431.8丙831127.3合計44408447.62/6/2023412/6/202342比較地區(qū)未污染數(shù)污染數(shù)合計污染率(%)χ2值P1乙30144431.80.09>0.05丙831127.3合計3817552乙+丙38175530.917.83<0.05甲6232979.3χ2分割計算表2/6/202343初次分娩時的年齡疾病狀態(tài)<2020~2425~2930~34≥35總計乳腺癌320120610114632203220對照組142244322893109340610246總計174256383904155662613466乳腺癌%0.1840.2140.2590.2980.3510.239例5.初次分娩年齡與乳腺癌的關(guān)聯(lián)性(四)趨勢x2檢驗2/6/2023442/6/202345

例5:行x列表x2檢驗結(jié)論是,5個年齡組中至少有2個年齡組的乳腺癌的構(gòu)成不同。

進(jìn)一步——關(guān)聯(lián)的性質(zhì)?(趨勢χ2檢驗)當(dāng)某因素是按自然順序的等級分層或者在連續(xù)性資料等級化后再分層的情況下,可采用趨勢χ2檢驗以分析比例是否隨分層等級而變化的趨勢

。

2/6/202346步驟:

假設(shè)共有k組,當(dāng)組號i增加時,對應(yīng)的Pi是否有增加(或減少)的傾向性。對應(yīng)于第i組構(gòu)建一個記分變量Si:k個組的記分常選1,2,3,……k2/6/202347H0:P1,P2,……Pk之間沒有傾向性H1:P1,P2,……Pk隨記分變量S1,S2,……Sk

的增加而增加(或減少),即Pi=α+βSi成立。

檢驗的統(tǒng)計量為:υ=12/6/202348χ2=128.8,p<0.001

所以拒絕檢驗假設(shè)H0,認(rèn)為隨著初次分娩的年齡增加,乳腺癌的比例上升。表11.8避孕措施與避孕措施來源之間的關(guān)系避孕措施避孕措施來源合計醫(yī)務(wù)人員推薦自己選擇他人推薦避孕環(huán)口服藥安全套其它424108145911762032111023458117345945392529238合計7686926442104H0:采用何種避孕措施與其來源無關(guān)聯(lián)H1:采用何種避孕措施與其來源有關(guān)聯(lián)

查附表18(2界值表),本例2=189.8>12.59

P<0.05,按α=0.05水準(zhǔn),拒絕H0,接受H1,兩變量的關(guān)聯(lián)性有統(tǒng)計學(xué)意義,

認(rèn)為育齡婦女采用的避孕措施與其來源有關(guān)聯(lián)

除關(guān)聯(lián)性檢驗外,用于說明兩個變量之間關(guān)系的密切程度,需計算關(guān)聯(lián)系數(shù)(contingencycoefficient,符號C),

計算公式為結(jié)合2檢驗結(jié)果可知,雖然該地育齡婦女采用的避孕措施與其來源有關(guān)聯(lián),但關(guān)聯(lián)系數(shù)顯示兩變量關(guān)聯(lián)的密切程度并不大。用SPSS統(tǒng)計軟件的crosstabs程序可以作兩個無序分類變量的關(guān)聯(lián)檢驗,并通過點擊statistics----nominal----contingencycoefficient得到關(guān)聯(lián)系數(shù)。附:四格表資料的確切概率法

四格表資料當(dāng)有理論數(shù)小于1或者總樣本例數(shù)不足40時,不能用卡方檢驗,而要用Fisher確切概率法(Fisherexactprobability)。確切概率法的基本思想

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論