《卡方檢驗正式》PPT課件.ppt_第1頁
《卡方檢驗正式》PPT課件.ppt_第2頁
《卡方檢驗正式》PPT課件.ppt_第3頁
《卡方檢驗正式》PPT課件.ppt_第4頁
《卡方檢驗正式》PPT課件.ppt_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1,2檢驗Chi-squaredtest,第7章,蔣紅衛(wèi)Email:JHWCCC21CN.COM,2,講課內容:,1.概述基本思想2.22表卡方檢驗3.配對四格表卡方檢驗4.Fisher確切概率檢驗5.RC表卡方檢驗6.多個樣本率的多重比較7.有序分組資料的線性趨勢檢驗,3,概念回顧,在總體率為的二項分布總體中做n1和n2抽樣,樣本率p1和p2與的差別,稱為率抽樣誤差。在總體率為1和2的不同總體中抽樣,得p1和p2,在n5,可通過率的u檢驗推斷是否1=2。二項分布的兩個樣本率的檢驗同樣可用2檢驗。,4,目的:推斷兩個總體率或構成比之間有無差別多個總體率或構成比之間有無差別多個樣本率的多重比較兩個分類變量之間有無關聯(lián)性頻數(shù)分布擬合優(yōu)度的檢驗。檢驗統(tǒng)計量:2應用:計數(shù)資料,5,基本概念,例1某院比較異梨醇(試驗組)和氫氯塞嗪(對照組)降低顱內壓的療效,將200名患者隨機分為兩組,試驗組104例中有效的99例,對照組96例中有效的78例,問兩種藥物對降低顱內壓療效有無差別?,6,表200名顱內高壓患者治療情況,如何整理此類資料?如何分析此類資料?,7,四格表(fourfoldtable)資料的基本形式,實際頻數(shù)(actualfrequency)是指各分類實際發(fā)生或未發(fā)生計數(shù)值,記為A。,單元格,8,理論頻數(shù)(theoreticalfrequency)是指按某H0假設計算各分類理論上的發(fā)生或未發(fā)生計數(shù)值,記為T。,式中,TRC為第R行C列的理論頻數(shù)nR為相應的行合計nC為相應的列合計,9,殘差設A代表某個類別的觀察頻數(shù),T代表基于H0計算出的期望頻數(shù),A與T之差(A-T)被稱為殘差殘差可以表示某一個類別觀察值和理論值的偏離程度,但殘差有正有負,相加后會彼此抵消,總和仍然為0。為此可以將殘差平方后求和,以表示樣本總的偏離無效假設的程度,10,Pearson2檢驗的基本公式,殘差大小是一個相對的概念,相對于期望頻數(shù)為10時,20的殘差非常大;可相對于期望頻數(shù)為1000時20就很小了。因此又將殘差平方除以期望頻數(shù)再求和,以標準化觀察頻數(shù)與期望頻數(shù)的差別。卡方統(tǒng)計量,1900年由英國統(tǒng)計學家K.Pearson首次提出。,KarlPearson(18571936),11,從卡方的計算公式可見,當觀察頻數(shù)與期望頻數(shù)完全一致時,卡方值為0;觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方值越?。环粗?,觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的差異越大,卡方值越大。當然,卡方值的大小也和自由度有關檢驗的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。理論上,在n40時下式值與2分布近似,在理論數(shù)5,近似程度較好。,12,連續(xù)型分布:正態(tài)分布(Normaldistribution),學生氏t分布(Studentst-distribution),F(xiàn)分布(Fdistribution)另一個同樣重要的分布2卡方分布(Chi-squareddistribution)。此分布在1875年,首先由F.Helmet所提出,而且是由正態(tài)分布演變而來的,即標準正態(tài)分布Z值之平方而得,2分布,13,設Xi為來自正態(tài)總體的連續(xù)性變量。,稱為自由度df=n的卡方值。,顯然,卡方分布具有可加性。,14,3.84,7.81,12.59,P0.05的臨界值,2分布的概率密度函數(shù)曲線,15,當=1時,16,第二節(jié)22表卡方檢驗,17,兩組樣本率比較的設計分類:1.兩組(獨立)樣本率的比較組間數(shù)據(jù)是相互獨立,非配對設計。22表卡方檢驗2.配對設計兩組樣本率的比較組間數(shù)據(jù)是相關的,配對設計。配對四格表卡方檢驗,18,兩組(不配對)樣本率的比較,1)四格表形式2)四格表不配對資料檢驗的專用公式,二者結果等價,各組樣本例數(shù)是固定的,19,例1(續(xù)),20,H0:1=2即試驗組與對照組降低顱內壓的總體有效率相等H1:12=0.05。,以=1查附表8的2界值表得P40,此時有1T5時,需計算Yates連續(xù)性校正2值T1,或n40時,應改用Fisher確切概率法直接計算概率,24,(1)校正公式的條件:1T5,同時N40,用校正公式計算(2)連續(xù)校正(continuitycorrection)公式:,(3)當T1,或N0.05。按=0.05檢驗水準,不拒絕H0,無統(tǒng)計學意義,尚不能認為兩種藥物治療腦血管疾病的有效率不等。,28,卡方檢驗的連續(xù)性校正問題,正方觀點:卡方統(tǒng)計量抽樣分布的連續(xù)性和平滑性得到改善,可以降低I類錯誤的概率;校正結果更接近于Fisher確切概率法;校正是有條件的。反方觀點:經連續(xù)性校正后,P值有過分保守之嫌;連續(xù)性校正卡方檢驗的P值與Fisher確切概率法的P值沒有可比性,這是因為Fisher確切概率法建立在四格表雙邊固定的假定下,而實際資料則是單邊固定的四格表。,29,就應用而言,無論是否經過連續(xù)性校正,若兩種檢驗的結果一致,無須在此問題上糾纏。但是,當兩種檢驗結果相互矛盾時,如例2,就需要謹慎解釋結果了。為客觀起見,建議將兩種結論同時報告出來,以便他人判斷。當然,如果兩種結論一致,如均為有或無統(tǒng)計學意義,則只報道非連續(xù)性檢驗的結果即可。,30,第二節(jié)配對設計兩個樣本率的2檢驗(McNemer檢驗),配對設計:通常為同源配對。對同一觀察對象分別用兩種方法處理,觀察其陽性與陰性結果?;居猛荆撼S糜诒容^兩種檢驗方法或兩種培養(yǎng)基的陽性率是否有差別。數(shù)據(jù)形式:配對四格表形式。,31,例3某實驗室采用兩種方法對58名可疑紅斑狼瘡患者的血清抗體進行測定,問:兩方法測定結果陽性檢出率是否有差別?測定結果為:陽性、陰性(共116標本,58對)方法(X)乳膠凝集法免疫熒光法對子例數(shù)1133212,結果,32,上述配對設計實驗中,就每個對子而言,兩種處理的結果不外乎有四種可能:,兩種檢測方法皆為陽性數(shù)(a);兩種檢測方法皆為陰性數(shù)(d);免疫熒光法為陽性,乳膠凝集法為陰性數(shù)(b);乳膠凝集法為陽性,免疫熒光法為陰性數(shù)(c)。,其中,a,d為兩法觀察結果一致的兩種情況,b,c為兩法觀察結果不一致的兩種情況。,33,表兩種方法的檢測結果,34,方法原理,按照配對設計的思路進行分析,則首先應當求出各對的差值,然后考察樣本中差值的分布是否按照H0假設的情況對稱分布。按此分析思路,最終可整理出如前所列的配對四格表。主對角線上兩種檢驗方法的結論相同,對問題的解答不會有任何貢獻斜對角線上兩種檢驗方法的結論不相同,顯示了檢驗方法間的差異,35,配對2檢驗統(tǒng)計量為,36,H0:b=c=(12+2)/2=7(兩法總體陽性率相等)H1:bc(兩方法總體陽性率不等)=0.05本例b+c=12+2=1440,用校正公式本例2=5.793.84,P0.05。在=0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義。認為兩方法的檢測率不同,乳膠凝集法的陽性檢測率22.41%低于免疫檢測率39.66%。,37,注意事項,McNemar檢驗只會利用非主對角線單元格上的信息,即它只關心兩者不一致的評價情況,用于比較兩個評價者間存在怎樣的傾向。因此,對于一致性較好的大樣本數(shù)據(jù),McNemar檢驗可能會失去實用價值。例如對1萬個案例進行一致性評價,9995個都是完全一致的,在主對角線上,另有5個分布在左下的三角區(qū),顯然,此時一致性相當?shù)暮谩5绻褂肕cNemar檢驗,此時反而會得出兩種評價有差異的結論來。,105,38,第三節(jié),四格表資料的Fisher確切概率法,105,39,條件:理論依據(jù):超幾何分布(非2檢驗的范疇),105,40,例4某醫(yī)師為研究乙肝免疫球蛋白預防胎兒宮內感染HBV的效果,將33例HBsAg陽性孕婦隨機分為預防注射組和非預防組,結果見表7-4。問兩組新生兒的HBV總體感染率有無差別?,105,41,表7-4兩組新生兒HBV感染率的比較,42,基本思想,在四格表周邊合計數(shù)固定不變的條件下,計算表內4個實際頻數(shù)變動時的各種組合之概率Pi;再按檢驗假設用單側或雙側的累計概率P,依據(jù)所取的檢驗水準做出推斷。,43,1各組合概率Pi的計算在四格表周邊合計數(shù)不變的條件下,表內4個實際頻數(shù)a,b,c,d變動的組合數(shù)共有“周邊合計中最小數(shù)+1”個。如例7-4,表內4個實際頻數(shù)變動的組合數(shù)共有9+1=10個,依次為:,44,各組合的概率Pi服從超幾何分布,其和為1。,計算公式為,45,2累計概率的計算(單、雙側檢驗不同),46,47,48,檢驗步驟,49,50,表5例4的Fisher確切概率法計算表,51,例5某單位研究膽囊腺癌、腺瘤的P53基因表達,對同期手術切除的膽囊腺癌、腺瘤標本各10份,用免疫組化法檢測P53基因,資料見表7-6。問膽囊腺癌和膽囊腺瘤的P53基因表達陽性率有無差別?,52,表6膽囊腺癌與膽囊腺瘤P53基因表達陽性率的比較,53,本例a+b+c+d=10,由表7-7可看出,四格表內各種組合以i=4和i=5的組合為中心呈對稱分布。,表7例5的Fisher確切概率法計算表,*為現(xiàn)有樣本,54,(1)計算現(xiàn)有樣本的D*和P*及各組合下四格表的Di。本例D*=50,P*=0.02708978。(2)計算滿足Di50條件的各組合下四格表的概率Pi。(3)計算同時滿足Di50和PiP*條件的四格表的累計概率。本例為P7和P8,(4)計算雙側累計概率P。P0.05,按=0.05檢驗水準不拒絕H0,尚不能認為膽囊腺癌與膽囊腺瘤的P53基因表達陽性率不等。,55,56,一點補充,確切概率法的原理具有通用性,對于四格表以外的情況也適用,如行乘列表、配對、配伍表格均可對于較大的行乘列表,確切概率法的計算量將很大,有可能超出硬件系統(tǒng)可以支持的范圍此時可以采用計算統(tǒng)計學中的其他統(tǒng)計計算技術加以解決,如Bootstrap方法等,57,第四節(jié)行列表的2檢驗,當比較組行或列分類數(shù)2,稱為行列表,即RC表。研究者感興趣的問題有:(2檢驗的目的)1.多組(獨立樣本)樣本率差別有無統(tǒng)計意義?2.兩組(獨立樣本)構成比(分布)有無統(tǒng)計意義?3.兩個分類變量分布是否獨立(有關聯(lián))?,58,自由度=(行數(shù)-1)(列數(shù)-1),等價,檢驗統(tǒng)計量,59,例6某醫(yī)師研究物理療法、藥物治療和外用膏藥三種療法治療周圍性面神經麻痹的療效,資料見下表。問三種療法的有效率有無差別?表7-8三種療法有效率的比較,60,H0:1=2=3=90.4(三組總體有效率相等)H1:三組總體率不等或不全等=0.05,結論:在=0.05水準,拒絕H0,P0.01,認為三組療法有效率不等或不全等。注意:此結果不能得到各兩兩組比較的結論。,61,二、兩組和多組構成比的比較,例7某醫(yī)師在研究血管緊張素I轉化酶(ACE)基因I/D多態(tài)(分3型)與2型糖尿病腎病(DN)的關系時,將249例2型糖尿病患者按有無糖尿病腎病分為兩組,資料見表7-9。問兩組2型糖尿病患者的ACE基因型總體分布有無差別?,表9兩組型糖尿病患者ACE基因分布比較,62,63,三、雙向無序分類資料的關聯(lián)性檢驗,RC表中兩個分類變量皆為無序分類變量的行列表資料,又稱為雙向無序RC表資料。目的:檢驗兩事物分類(行分類和列分類)是否獨立,從而說明兩事物分類是否有關系。需要注意的是:雙向無序分類資料為兩個或多個樣本,做差別檢驗(例7);若為單樣本,做關聯(lián)性檢驗。,64,統(tǒng)計分析:1.回答兩事物的分類是否獨立(有關系)Pearson2檢驗2.如有關,關系密切程度如何,度量指標:列聯(lián)系數(shù)(Contingencycoefficient)列聯(lián)系數(shù)C取值范圍在01之間。愈接近于0,關系愈不密切;愈接近于1,關系愈密切。,65,兩分類變量獨立與有關,兩事物獨立的假定:行或列各分類的構成比相同,或在A事物不同水平下,B事物不同分類的作用(構成)相等.,66,例8測得某地5801人的ABO血型和MN血型結果如表7-10,問兩種血型系統(tǒng)之間是否有關聯(lián)?,表10某地5801人的血型,67,H0:兩種血型系統(tǒng)分類無關聯(lián)(即行或列構成比相等)H1:兩種血型系統(tǒng)分類有關聯(lián)(即行或列構成比不等)=0.05,結論:兩種血型系統(tǒng)分類有關聯(lián)。列聯(lián)系數(shù)為0.1883。兩種血型系統(tǒng)間雖然有關聯(lián)性,但關系不太密切。,68,第五節(jié)多組樣本率的兩兩比較的2分割,當比較組k3時,2值有統(tǒng)計意義,可分解多個四格表了解各樣本率兩兩間的差別。要進一步推斷哪兩兩總體率有差別,若直接用四格表資料的檢驗進行多重比較,將會加大犯類錯誤的概率。多重比較的方法:2分割法;Scheffe可信區(qū)間法;SNK法。,69,2分割法基本思想,檢驗水準,其目的是保證檢驗假設中I型錯誤的概率不變。因分析目的不同,主要有兩類多重比較形式:多個實驗組間的兩兩比較實驗組與同一個對照組的比較,檢驗水準,70,多個實驗組間的兩兩比較,分析目的為k個實驗組間,任意兩個率均進行比較時,須進行k(k-1)/2次獨立的四格表檢驗,再加上總的行列表資料的檢驗,共k(k-1)/2+1次檢驗假設。故檢驗水準用下式估計,71,實驗組與同一個對照組的比較,分析目的為各實驗組與同一個對照組的比較,而各實驗組間不須比較。檢驗水準用下式估計,72,表7-11=1時的2界值表(供多個樣本率間的多重比用),73,例9對例6的資料進行兩兩比較,以推斷是否任兩種療法治療周圍性面神經麻痹的有效率均有差別?1=2,即任意兩對比組的總體有效率相等12,即任意兩對比組的總體有效率不等=0.05本例為3個實驗組間的兩兩比較,74,表三種療法有效率的兩兩比較,拒絕H0,接收H1拒絕H0,接收H1不拒絕H0,75,例10對例6資料的藥物治療組為對照組,物理療法組與外用膏藥組為試驗組,試分析兩試驗組與對照組的總體有效率有無差別?T=C,即各試驗組與對照組的總體有效率相等TC,即各試驗組與對照組的總體有效率不等=0.05

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論