卡方檢驗方法_第1頁
卡方檢驗方法_第2頁
卡方檢驗方法_第3頁
卡方檢驗方法_第4頁
卡方檢驗方法_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

卡方檢驗方法第1頁/共62頁2掌握內(nèi)容:

幾種常見設(shè)計類型資料的卡方檢驗熟悉的內(nèi)容卡方檢驗的適用范圍了解內(nèi)容1.四格表資料的Fisher精確概率法第2頁/共62頁3用樣本信息推論總體特征的過程。包括:參數(shù)估計:

運用統(tǒng)計學原理,用從樣本計算出來的統(tǒng)計指標量,對總體統(tǒng)計指標量進行估計。假設(shè)檢驗:又稱顯著性檢驗,是指由樣本間存在的差別對樣本所代表的總體間是否存在著差別做出判斷。第3頁/共62頁4

統(tǒng)計描述統(tǒng)計推斷應(yīng)用計量資料頻數(shù)分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差、標準誤

tuF檢驗正常值范圍區(qū)間估計計數(shù)資料相對數(shù)及其標準化統(tǒng)計圖表標準誤2檢驗率的區(qū)間估計人口統(tǒng)計疾病統(tǒng)計相關(guān)與回歸rb統(tǒng)計圖表t檢驗

第4頁/共62頁5在總體率為π的二項分布總體中做n1和n2抽樣,樣本率p1和p2與π的差別,稱為率抽樣誤差。已知π0nP>5,n(1-P)>5第5頁/共62頁6例為了解鉛中毒病人是否有尿棕色素增加現(xiàn)象,分別對病人組和對照組的尿液作尿棕色素定性檢查,結(jié)果見下表,問鉛中毒病人與對照人群的尿棕色素陽性率差別有無統(tǒng)計學意義?表兩組人群尿棕色素陽性率比較組別陽性數(shù)陰性數(shù)合計陽性率(%)鉛中毒病人2973680.56對照組9283724.32合計38357352.05第6頁/共62頁7

2檢驗(Chi-squaretest)是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人K.Pearson(1857-1936)于1900年提出的一種具有廣泛用途的統(tǒng)計方法。第7頁/共62頁82檢驗的用途用途較為廣泛的假設(shè)檢驗方法,本章僅介紹用于分類計數(shù)資料的假設(shè)檢驗,用于檢驗兩個(或多個)率或構(gòu)成比之間差別是否有統(tǒng)計學意義,配對2檢驗檢驗配對計數(shù)資料的差異是否有統(tǒng)計學意義。第8頁/共62頁92檢驗的基本思想檢驗實際頻數(shù)(A)和理論頻數(shù)(T)的差別是否由抽樣誤差所引起的。也就是由樣本率(或樣本構(gòu)成比)來推斷總體率或構(gòu)成比。第9頁/共62頁10表7-1兩種藥物治療胃潰瘍有效率的比較目的:推斷是否π1=π2?第10頁/共62頁11本例資料經(jīng)整理成下表形式,即有兩個處理組,每個處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有四個基本數(shù)據(jù),其余數(shù)據(jù)均由此四個數(shù)據(jù)推算出來的,故稱四格表資料。第11頁/共62頁12

表7-1完全隨機設(shè)計兩樣本率比較的四格表處理組屬性合計陽性陰性1A11(T11)A12(T12)n1(固定值)2A21(T21)A22(T22)n2(固定值)合計m1m2n第12頁/共62頁13衡量理論頻數(shù)與實際頻數(shù)的差別ARC是位于R行C列交叉處的實際頻數(shù),TRC是位于R行C列交叉處的理論頻數(shù)。(ARC-TRC

)反映實際頻數(shù)與理論頻數(shù)的差距,除以TRC

為的是考慮相對差距。所以,2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度,2值大,說明實際頻數(shù)與理論頻數(shù)的差距大。2值的大小除了與實際頻數(shù)和理論頻數(shù)的差的大小有關(guān)外,還與它們的行、列數(shù)有關(guān)。即自由度的大小。ν=(行-1)×(列-1)第13頁/共62頁14理論頻數(shù)的計算nR是ARC所在行的合計,nC是ARC所在列的合計,是兩個樣本例數(shù)的合計第14頁/共62頁15

理論頻數(shù)是根據(jù)檢驗假設(shè)且用合并率

來估計而定的。

如本例,無效假設(shè)是A藥組與B藥組的總體有效率相等,均等于合計的陽性率66.67%(110/165)。那么理論上,A藥組的85例中陽性人數(shù)應(yīng)為85(110/165)=56.67,陰性人數(shù)為85(55/165)=28.33;同理,B藥組的80例中陽性人數(shù)應(yīng)為80(110/165)=53.33,陰性人數(shù)為80(55/165)=26.67。第15頁/共62頁16χ2檢驗的基本公式

上述基本公式由Pearson提出,因此軟件上常稱這種檢驗為Peareson卡方檢驗,下面將要介紹的其他卡方檢驗公式都是在此基礎(chǔ)上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的“行×列表”。第16頁/共62頁17

分布是一種連續(xù)型分布(Continuousdistribution),v個相互獨立的標準正態(tài)變量(standardnormalvariable)的平方和稱為變量,其分布即為分布;自由度(degreeoffreedom)為v。第17頁/共62頁18

2分布是一種連續(xù)型分布(Continuousdistribution),v個相互獨立的標準正態(tài)變量(standardnormalvariable)的平方和稱為2

變量,其分布即為2

分布;自由度(degreeoffreedom)為v

。v=1v=4v=6v=9第18頁/共62頁19

2分布的形狀依賴于自由度ν的大?。孩佼斪杂啥圈汀?時,曲線呈“L”型;②隨著ν的增加,曲線逐漸趨于對稱;③當自由度ν→∞時,曲線逼近于正態(tài)曲線。第19頁/共62頁20如果假設(shè)檢驗成立,A與T不應(yīng)該相差太大。理論上可以證明

(A-T)2/T服從x2分布,計算出x2值后,查表判斷這么大的x2是否為小概率事件,以判斷建設(shè)檢驗是否成立。第20頁/共62頁21在υ=1,第21頁/共62頁22自由度一定時,P值越小,x2值越大,反比關(guān)系。當P值一定時,自由度越大,x2越大。

=1時,P=0.05,x2=3.84P=0.01,x2=6.63P=0.05時,=1,x2=3.84

=2,x2=5.99第22頁/共62頁23第一節(jié)四格表資料χ2檢驗B1B2合計A1aba+bA2cdc+d合計a+cb+dn=a+b+c+d一般四格表的基本形式第23頁/共62頁24

表7-1完全隨機設(shè)計兩樣本率比較的四格表處理組屬性合計陽性陰性1A11(T11)A12(T12)n1(固定值)2A21(T21)A22(T22)n2(固定值)合計m1m2n第24頁/共62頁25四格表2檢驗的專用公式n≥40,T≥5第25頁/共62頁

為了不計算理論頻數(shù)T,可由基本公式推導(dǎo)出,直接由各格子的實際頻數(shù)(a、b、c、d)計算卡方值的公式:第26頁/共62頁271.建立檢驗假設(shè)

:,兩總體率不等:,兩總體率相等檢驗統(tǒng)計量χ2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。第27頁/共62頁28

若檢驗假設(shè)H0:π1=π2成立,四個格子的實際頻數(shù)A與理論頻數(shù)T相差不應(yīng)該很大,即統(tǒng)計量χ2

不應(yīng)該很大。如果χ2

值很大,即相對應(yīng)的P值很小,若P≤α,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對立假設(shè)H1,即π1≠π2。第28頁/共62頁292.計算檢驗統(tǒng)計量

(1)當總例數(shù)n≥40且所有格子的理論頻數(shù)T>5時:用檢驗的基本公式或四格表資料檢驗的專用公式;基本公式專用公式第29頁/共62頁30(2)當總例數(shù)n≥40且有一個格子1≤T<5時:用校正公式;或改用四格表資料的Fisher確切概率法。第30頁/共62頁312分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計算得的2統(tǒng)計量的抽樣分布亦呈離散性質(zhì)。為改善2統(tǒng)計量分布的連續(xù)性,則需行連續(xù)性校正(correctionforcontinuity)。2

連續(xù)性校正僅用于ν

=1的四格表資料,當ν≥2

時,一般不作校正。第31頁/共62頁32(3)當n<40,或T<1時,不能用卡方檢驗,改用四格表資料的Fisher確切概率法。第32頁/共62頁333.作出統(tǒng)計結(jié)論以=1查界值表,若,按檢驗水準拒絕,接受,可認為兩總體率不同;若,按檢驗水準不拒絕,尚不能認為兩總體率不同。第33頁/共62頁34自由度ν愈大,χ2值也會愈大;所以只有考慮了自由度ν的影響,χ2值才能正確地反映實際頻數(shù)A和理論頻數(shù)T的吻合程度。檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有兩行兩列,ν=1,即在周邊合計數(shù)固定的情況下,4個基本數(shù)據(jù)當中只有一個可以自由取值。

第34頁/共62頁35

例8.5某藥品檢驗所隨機抽取574名成年人,研究抗生素的耐藥性(資料如表8-11)。問兩種人群的耐藥率是否一致?表8-11

某抗生素的人群耐藥情況用藥史不敏感敏感合計耐藥率(%)曾服該57未服該藥7310617940.78合計25332157444.08第35頁/共62頁36理論頻數(shù)的計算

18021573106174.10220.9078.90100.10

實際數(shù)

理論數(shù)

第36頁/共62頁372檢驗的步驟(1)建立假設(shè)并確定檢驗水準H0:兩種人群對該抗生素的耐藥率相同,即1=2;(兩總體率相等)H1:兩種人群對該抗生素的耐藥率不同,即1≠2;(兩總體不相等)

=0.05第37頁/共62頁38(2)計算檢驗統(tǒng)計量當總例數(shù)n且所有格子的理論頻數(shù)T>5時:用檢驗的基本公式或四格表資料檢驗的專用公式:2==23.12第38頁/共62頁39(3)查2界值表(附表7)確定P值,P>0.05,得出結(jié)論。按0.05水準,不拒絕H0,可以認為兩組人群對該抗生素的耐藥率的差異無統(tǒng)計學意義。第39頁/共62頁40

例2某礦石粉廠生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)即有部分工人患有職業(yè)性皮膚炎。后隨機抽取15名工人穿新防護服,其余仍穿原用的防護服,一個月后檢查兩組工人的皮膚炎患病情況,資料見下表,問兩組的患病率差別有無統(tǒng)計學意義?表穿新舊防護服工人的皮膚炎患病比較防護服種類皮膚炎癥合計陽性數(shù)陰性數(shù)新1(3.84)14(11.16)15舊10(7.16)18(20.84)28合計113243第40頁/共62頁41本例n>40,因有一格子的理論數(shù)<5,因而要用校正2

檢驗。H0:兩組工人皮膚炎總體患病率相等,即1=2H1:兩組工人皮膚炎總體患病率不等,即1≠2α=0.05校正2值為第41頁/共62頁42以=1查界值表,,按檢驗水準不拒絕,接受,尚不能認為穿不同防護服的兩組工人的皮膚炎患病率的差別有統(tǒng)計學意義;注意:本例若不作連續(xù)性校正,則,得,可見兩者是有區(qū)別的。第42頁/共62頁43注意:兩樣本率比較的資料,既可用檢驗也可用檢驗來推斷兩總體率是否有差別,且在不校正的條件下兩種檢驗方法是等價的,對同一份資料有。第43頁/共62頁小結(jié)

T≥5,用四格表專用公式n≥401≤T<5,用連續(xù)性校正公式

T<1,用確切概率法。n<40,用確切概率法。第44頁/共62頁45第三節(jié)配對四格表資料的2檢驗與計量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計和配對設(shè)計一樣,計數(shù)資料推斷兩個總體率(構(gòu)成比)是否有差別也有成組設(shè)計和配對設(shè)計,即四格表資料和配對四格表資料。第45頁/共62頁46

將含量為n的隨機樣本同時按照兩個二項分類的屬性進行交叉分類,形成2行2列的交叉分類表,如表8-6,目的是檢驗兩種屬性間的陽性率是否相同變量1變量2合計陽性陰性陽性ab陰性cd合計(固定值)

表8-6配對四格表資料表第46頁/共62頁47變量1的陽性率-變量2的陽性率=-=可見,兩個變量陽性率的比較只和b、c有關(guān),而與a、d無關(guān)。

變量1的陽性率==變量2的陽性率==第47頁/共62頁48前面是兩個獨立樣本,行合計是事先固定的;而這里的“兩份樣本”互不獨立,樣本量都是n,是固定的,而行合計與列合計卻是事先不確定的。第48頁/共62頁49配對四格表資料的2檢驗的專用公式

b+c>40

b+c≤40第49頁/共62頁50兩種白喉桿菌培養(yǎng)基結(jié)果比較甲培養(yǎng)基乙培養(yǎng)基合計+-+14(a)2(b)16-9(c)3(d)12合計23528配對四格表資料的2檢驗步驟第50頁/共62頁51配對四格表資料的2檢驗步驟1.H0:兩種培養(yǎng)基陽性率相同,總體B=C;

H1:兩種培養(yǎng)基陽性率不同,總體B≠C。 =0.05。

2.計算統(tǒng)計量:2=3.27<3.843.按=0.05水準,不拒絕H0

,可以認為甲乙兩法血清學檢出陽性率無顯著性差異第51頁/共62頁52第四節(jié)行×列表2檢驗第52頁/共62頁53

R×C表的χ2檢驗通用公式第53頁/共62頁54幾種R×C表的檢驗假設(shè)H0第54頁/共62頁551.多個樣本率的比較例某醫(yī)院用3種方案治療急性無黃疸型病毒肝炎254例,觀察結(jié)果見表,問3種療法的有效率是否不同。第55頁/共62頁56檢驗步驟:H0:3種治療方案的有效率相等H1:3種治療方案的有效率不全相等

α=0.05

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論