定性資料的統(tǒng)計(jì)分析_第1頁(yè)
定性資料的統(tǒng)計(jì)分析_第2頁(yè)
定性資料的統(tǒng)計(jì)分析_第3頁(yè)
定性資料的統(tǒng)計(jì)分析_第4頁(yè)
定性資料的統(tǒng)計(jì)分析_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于定性資料的統(tǒng)計(jì)分析第1頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第七節(jié) 四格表資料的2檢驗(yàn)第2頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三2檢驗(yàn)(chi-square test)是英國(guó)統(tǒng)計(jì)學(xué)家Pearson于1900年提出的一種應(yīng)用范圍很廣的統(tǒng)計(jì)方法。常用來(lái)推斷兩個(gè)及兩個(gè)以上總體率或構(gòu)成比是否有差異。根據(jù)設(shè)計(jì)類(lèi)型的不同,四格表資料的2檢驗(yàn)可分為:完全隨機(jī)設(shè)計(jì)的兩樣本率比較的2檢驗(yàn)配對(duì)設(shè)計(jì)的2檢驗(yàn)。第3頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三一、2檢驗(yàn)的基本思想 u檢驗(yàn)與t檢驗(yàn)的思路相同,是用標(biāo)準(zhǔn)誤作為尺度,去衡量統(tǒng)計(jì)量與總體參數(shù)差別的大小。2檢驗(yàn)(

2、chi-square test)的思路則與u檢驗(yàn)、t檢驗(yàn)不同,卻有著異曲同工之妙。第4頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例、某醫(yī)院腫瘤科3年來(lái)共治療乳腺癌患者n=131例,每例觀(guān)察5年,其中單純手術(shù)治療組觀(guān)察n1=84例,存活x1=57例,聯(lián)合治療組觀(guān)察n2=47例,存活x2=39例。將資料整理成以下形式的分類(lèi)頻數(shù)表。 組別存活數(shù)死亡數(shù)合計(jì)陽(yáng)性率(%)聯(lián)合治療39(a)8(b)47(a+b)83.0單純手術(shù)57(c)27(d)84(c+d)67.9合計(jì)96(a+c)35(b+d)131(n)73.3第5頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三1、四格表的概

3、念 a、b、c、d這四個(gè)格子的頻數(shù)是整個(gè)表的基本數(shù)據(jù),其余數(shù)據(jù)都是從這四個(gè)基本數(shù)據(jù)推算出來(lái)的,通常將這種資料稱(chēng)為四格表資料(22表資料)。四格表資料多用來(lái)比較兩種處理的不同效果,而每種處理只產(chǎn)生兩種相互對(duì)立的結(jié)果。如生存與死亡、有效與無(wú)效、患病與未患病、陽(yáng)性與陰性、檢出與未檢出等。 第6頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三2、建立檢驗(yàn)假設(shè) 當(dāng)兩個(gè)樣本率不等時(shí),可能有兩種原因:差別僅由抽樣誤差所致;兩種處理的效果確有不同,而導(dǎo)致了樣本率的不同。為區(qū)別這兩種情況,分別建立檢驗(yàn)假設(shè):H0:兩總體存活率相等,即1=2;H1:兩總體存活率不等,即12。 = 0.05。 第7頁(yè),共59

4、頁(yè),2022年,5月20日,22點(diǎn)1分,星期三3、H0條件下的理論頻數(shù) H0假設(shè)認(rèn)為,兩個(gè)樣本來(lái)自同一總體,即 “單純組”與 “聯(lián)合組”的存活率相同,差別僅由抽樣誤差所致,則可用合計(jì)存活率 73.3(即96/131)作為總體率的點(diǎn)估計(jì)。H0條件下,單純組理論存活數(shù)應(yīng)為47(96/131) =34.44例,聯(lián)合組理論存活數(shù)應(yīng)為84(96/131) =61.56例;同理,兩組理論死亡數(shù)為12.56例和22.44例。這四個(gè)根據(jù)H0假設(shè)求得的數(shù)據(jù)稱(chēng)為理論頻數(shù)T。 第8頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三理論頻數(shù)T可用公式計(jì)算:式中 TRC表示第R行、第C列的理論頻數(shù),nR為相應(yīng)行的

5、合計(jì),nC為相應(yīng)列的合計(jì),n為總例數(shù)。 第9頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三4、2檢驗(yàn)的思路 如果H0假設(shè)成立,則實(shí)際頻數(shù)A與理論頻數(shù)T應(yīng)該比較接近。如果實(shí)際頻數(shù)與理論頻數(shù)相差較大,超出了抽樣誤差所能解釋的范圍,則可以認(rèn)為H0假設(shè)不成立,即兩樣本對(duì)應(yīng)的總體率不等。 第10頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三實(shí)際頻數(shù)Ai與理論頻數(shù)Ti之間的抽樣誤差,可以用2統(tǒng)計(jì)量表示:2統(tǒng)計(jì)量服從2分布,反映了實(shí)際頻數(shù)A與理論頻數(shù)T吻合的程度。A與T相差越大,則2值就會(huì)越大。第11頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三如果H0假設(shè)成立,則實(shí)際頻數(shù)與理

6、論頻數(shù)之差異純系抽樣誤差所致,故2值不會(huì)很大。即在H0假設(shè)的前提下,一次隨機(jī)試驗(yàn)中,出現(xiàn)較大2值的概率P是很小的。如果手頭樣本求得很小的P,且P ,根據(jù)小概率原理,就有理由懷疑H0的真實(shí)性,故拒絕之;若P,則沒(méi)有理由拒絕H0。 2值與P值的對(duì)應(yīng)關(guān)系可查附表3的2界值表。 第12頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三根據(jù)計(jì)算公式,2值的大小除了和實(shí)際頻數(shù)與理論頻數(shù)的差值|AT|有關(guān)還與格子數(shù)有關(guān),嚴(yán)格的講是和自由度有關(guān)。行列表的自由度,是指在表中周邊合計(jì)數(shù)不變的前提下,基本數(shù)據(jù)可以自由變動(dòng)的格子數(shù)。 四格表中有四個(gè)基本數(shù)據(jù),其中任何一個(gè)數(shù)據(jù)發(fā)生變化,其余三個(gè)數(shù)據(jù)由于受周邊合計(jì)數(shù)

7、的限制,只能隨之相應(yīng)變動(dòng),故其自由度為1 。 =(行數(shù)-1)(列數(shù)-1) 第13頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三二、完全隨機(jī)設(shè)計(jì)的兩樣本率的比較 完全隨機(jī)設(shè)計(jì)的兩個(gè)樣本率比較的目的是推斷兩個(gè)樣本率各自所代表的總體率是否相等。檢驗(yàn)方法可用u檢驗(yàn)或2檢驗(yàn)。 例1、某醫(yī)院腫瘤科3年來(lái)治療乳腺癌患者n=131例,其中單純手術(shù)組觀(guān)察n1=84例,存活x1=57例,聯(lián)合治療組觀(guān)察n2=47例,存活x2=39例,問(wèn)兩組存活率有無(wú)差別? 第14頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三首先將資料整理成四格表形式:第15頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期

8、三第16頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例2、在某項(xiàng)治療牙科術(shù)后疼痛控制的雙盲臨床研究中,將178例患者隨機(jī)分成兩組,A藥組90人,有效人數(shù)為68人。B藥組88人,有效人數(shù)為58人。 第17頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第18頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三三、四格表資料專(zhuān)用公式理論頻數(shù)由四格表中實(shí)際頻數(shù)計(jì)算得來(lái)。對(duì)于四格表資料,可直接用專(zhuān)用公式計(jì)算2值,以簡(jiǎn)化計(jì)算過(guò)程。式中a、b、c、d分別為四格表的四個(gè)實(shí)際頻數(shù)即四格表的基本數(shù)據(jù),總例數(shù)n=abcd。 第19頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三分別

9、將前面的兩個(gè)例子中的基本數(shù)據(jù)代入公式可以得到相同的2值。 39 8 57 27 68 22 58 30第20頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三四、四格表2統(tǒng)計(jì)量的連續(xù)性校正 2分布是一種連續(xù)性分布,附表3中2界值是根據(jù)此連續(xù)性分布的理論公式計(jì)算得到。而兩個(gè)或多個(gè)率比較的原始數(shù)據(jù)卻屬離散型分布資料,是不連續(xù)的。 因此,2檢驗(yàn)公式是一個(gè)近似計(jì)算公式。英國(guó)統(tǒng)計(jì)學(xué)家Yates F認(rèn)為,應(yīng)將實(shí)際頻數(shù)與理論頻數(shù)之差的絕對(duì)值減去0.5作連續(xù)性校正。第21頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三實(shí)際上,2值公式在四格表的基礎(chǔ)數(shù)據(jù)均不太小時(shí),近似程度相當(dāng)高。但是,只要四格表

10、中的有一個(gè)基礎(chǔ)數(shù)據(jù)出現(xiàn)較小值,此時(shí)求得的2值往往偏大,相應(yīng)的P值偏小,從而擴(kuò)大了I型誤差。為校正這種偏差,可采用校正2,用C2表示。其計(jì)算公式為: 第22頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三對(duì)四格表專(zhuān)用公式的校正為:兩者是等價(jià)的,這種校正稱(chēng)為連續(xù)性校正,即Yates校正。 第23頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三分析四格表資料時(shí),不同公式的選擇條件 在分析四格表資料時(shí),需根據(jù)具體情況作出不同處理,一般認(rèn)為:1、當(dāng)n40,且T5時(shí),用基本公式計(jì)算2值; 2、當(dāng)n40,且1T5時(shí),則用2檢驗(yàn)的連續(xù)性校正公式;3、當(dāng)n40,或有T1時(shí),不能用2檢驗(yàn),應(yīng)當(dāng)用四

11、格表的確切概率法。4、當(dāng)2檢驗(yàn)所得P值接近檢驗(yàn)水準(zhǔn) 時(shí),最好使用四格表確切概率法。 第24頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例1、下表資料是單用甘磷酰芥(單純化療組)與復(fù)合使用爭(zhēng)光霉素、環(huán)磷酰胺等藥(復(fù)合化療組)對(duì)淋巴系統(tǒng)腫瘤的療效,問(wèn)兩組患者總體的完全緩解率有無(wú)差別? 第25頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第26頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例2、為觀(guān)察甲、乙兩藥對(duì)治療胃潰瘍的療效,將70名患者隨機(jī)分成兩組,一組30人服用甲藥,另一組40人服用乙藥。結(jié)果見(jiàn)下表。問(wèn)兩種藥物的胃潰瘍治愈率有無(wú)差別?第27頁(yè),共59頁(yè),202

12、2年,5月20日,22點(diǎn)1分,星期三第28頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三五、u檢驗(yàn)與2檢驗(yàn)的關(guān)系事實(shí)上,對(duì)兩樣本率的比較的雙側(cè)檢驗(yàn),u檢驗(yàn)和2檢驗(yàn)是等價(jià)的。即自由度為1的2=u2。因此,兩樣本率的比較,可以用u檢驗(yàn),也可以用2檢驗(yàn)。兩者的應(yīng)用條件是一樣的。但若需進(jìn)行單側(cè)檢驗(yàn),則應(yīng)選用u檢驗(yàn),因?yàn)?檢驗(yàn)理論上本身就是雙側(cè)檢驗(yàn)。第29頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三六、配對(duì)設(shè)計(jì)四格表的卡方檢驗(yàn)配對(duì)設(shè)計(jì)是醫(yī)學(xué)研究中常用的設(shè)計(jì)方法之一,二分類(lèi)結(jié)果資料的配對(duì)研究常用于比較兩種檢驗(yàn)方法、兩種培養(yǎng)方法、兩種提取方法之間的差別。 配對(duì)四格表設(shè)計(jì)的特點(diǎn)是對(duì)同一樣

13、本的每一份檢品分別用甲、乙兩種方法處理,觀(guān)察其陽(yáng)性與陰性例數(shù)。以推斷兩種處理的結(jié)果有無(wú)差別。 第30頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三配對(duì)四格表資料結(jié)果的四種情況兩法均為陽(yáng)性(a)、兩法均為陰性(d)、甲為陽(yáng)性乙為陰性(b)、甲為陰性乙為陽(yáng)性(c)。a、d為兩法結(jié)果相同部分;b、c為結(jié)果不同部分。 這樣的資料稱(chēng)為配對(duì)四格表,其形式與普通四格表類(lèi)似,但內(nèi)容及檢驗(yàn)方法卻不一樣。 第31頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三配對(duì)設(shè)計(jì)的兩個(gè)率的比較配對(duì)2檢驗(yàn)。兩種方法若沒(méi)有差別,則總體B=C。樣本常表現(xiàn)為bc,是由于抽樣誤差的存在,還是兩種方法確有差別,必須進(jìn)行

14、假設(shè)檢驗(yàn)。 a和d兩個(gè)格子在比較有無(wú)差異時(shí)不起作用,而配對(duì)2檢驗(yàn)只檢驗(yàn)結(jié)果不一致的對(duì)子數(shù)b和c之間的差別來(lái)反映兩種方法的差異。第32頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三配對(duì)2檢驗(yàn)計(jì)算公式的應(yīng)用條件1、當(dāng)b+c40時(shí),用非校正公式計(jì)算檢驗(yàn)統(tǒng)計(jì)量: 2、當(dāng)20b+c40 時(shí),用連續(xù)性校正公式來(lái)計(jì)算檢驗(yàn)統(tǒng)計(jì)量:3、當(dāng)b+c20時(shí),用確切概率法計(jì)算。第33頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例1、某研究室用甲、乙兩種血清學(xué)方法檢查410例確診的鼻咽癌患者,得結(jié)果如下表,問(wèn)兩種方法檢出率有無(wú)不同? 第34頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第3

15、5頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例2、用兩種檢驗(yàn)方法對(duì)某食品作沙門(mén)氏菌檢驗(yàn),結(jié)果如下表,試比較兩種方法的陽(yáng)性結(jié)果是否有差別。 第36頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第37頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三注意點(diǎn)資料判斷普通四格表資料完全隨機(jī)設(shè)計(jì)配對(duì)四格表資料配對(duì)設(shè)計(jì)第38頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第八節(jié) 行列表資料的2檢驗(yàn) 第39頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三對(duì)于單變量的計(jì)數(shù)資料,均可通過(guò)行列表形式表達(dá),其基本數(shù)據(jù)有R行C列,簡(jiǎn)稱(chēng)RC表。四格表是最簡(jiǎn)單的一種RC表,即

16、22表。RC表資料卡方檢驗(yàn)可用于多個(gè)樣本率的比較、多個(gè)樣本構(gòu)成比的比較等等。 第40頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三RC表2檢驗(yàn)的通式 式中,A為第R行第C列對(duì)應(yīng)的實(shí)際頻數(shù),nR為第R行的行合計(jì),nC為第C列的列合計(jì),n為總樣本含量。該公式同樣適用于四格表資料,等價(jià)于:第41頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三一、多個(gè)樣本率的比較如果是多個(gè)樣本率進(jìn)行比較時(shí),其基本數(shù)據(jù)有R行2列,構(gòu)成R2表,用以表述R個(gè)樣本率的基本數(shù)據(jù)。R2表的2檢驗(yàn)用于推斷R個(gè)樣本率各自所代表的總體率是否相等。 第42頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例1、某

17、地調(diào)查了19951998四個(gè)年度中小學(xué)女生的貧血狀況,見(jiàn)下表,問(wèn)各年度間學(xué)生貧血率有無(wú)差別? 第43頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第44頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例2、將133例尿路感染患者隨機(jī)分成3組,第1組44例,接受甲方法治療;第2組45例,接受乙方法治療;第3組44例,接受丙方法治療。一個(gè)療程后,結(jié)果如下表,問(wèn)3種治療方法的尿培養(yǎng)陰轉(zhuǎn)率有無(wú)差別? 第45頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三第46頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三Attention:和方差分析一樣,前面例子的結(jié)論只能表明總的

18、來(lái)說(shuō)各組的總體率是有差別的,但不能認(rèn)為任意兩個(gè)組均有差別。需通過(guò)進(jìn)一步作多個(gè)率的兩兩比較,來(lái)明確究竟是哪些組別之間有差別。 第47頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三二、多個(gè)率的多重比較當(dāng)多個(gè)樣本率比較的2檢驗(yàn),結(jié)論為拒絕H0時(shí),只能認(rèn)為各總體率之間總的說(shuō)來(lái)有差別,但不能說(shuō)明它們彼此間都有差別,或某兩者間有差別。若要進(jìn)一步比較哪些率之間有差別,應(yīng)進(jìn)行多重比較。率的多重比較的原理多借鑒于均數(shù)的多重比較,方法較多(如Scheff可信區(qū)間法、 2分割法等等 )。第48頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三Scheff可信區(qū)間法 通過(guò)構(gòu)建要比較的兩樣本率之差的可信

19、區(qū)間來(lái)推斷組間有無(wú)差異。兩率之差的100 (1-)%可信區(qū)間按下式計(jì)算:pA和pB為兩個(gè)比較組的樣本率;nA和nB為兩個(gè)比較組的樣本含量;k為所有的組數(shù)。 第49頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三例、某地調(diào)查了19951998四個(gè)年度中小學(xué)女生的貧血狀況,見(jiàn)下表,問(wèn)各年度間學(xué)生貧血率有無(wú)差別? 第50頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,星期三已知:2=281.6263,P0.005,該地四個(gè)年份中小學(xué)女生貧血檢出率總的說(shuō)來(lái)有差別,需用Scheff可信區(qū)間法進(jìn)一步多重比較。按兩率之差的可信區(qū)間計(jì)算公式來(lái)計(jì)算各可信區(qū)間,如98與97兩年間學(xué)生貧血檢出率之差的95%可信區(qū)間之計(jì)算如下: (-0.0122,0.0364) 第51頁(yè),共59頁(yè),2022年,5月20日,22點(diǎn)1分,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論