定性資料的統(tǒng)計(jì)分析.ppt_第1頁
定性資料的統(tǒng)計(jì)分析.ppt_第2頁
定性資料的統(tǒng)計(jì)分析.ppt_第3頁
定性資料的統(tǒng)計(jì)分析.ppt_第4頁
定性資料的統(tǒng)計(jì)分析.ppt_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、定性資料的統(tǒng)計(jì)分析,定性資料的統(tǒng)計(jì)描述,一、統(tǒng)計(jì)學(xué)指標(biāo) 絕對(duì)數(shù):反應(yīng)實(shí)際水平 相對(duì)數(shù)-兩個(gè)數(shù)值的比,包括: 率 構(gòu)成比 相對(duì)比,(一)率 又稱頻率指標(biāo)或強(qiáng)度指標(biāo),說明某現(xiàn)象或某事物在它可能發(fā)生的范圍內(nèi)實(shí)際發(fā)生的頻率或強(qiáng)度。 常以百分率(%)、千分率()、萬分率(1/萬)、十萬分率(1/10萬)等表示,計(jì)算公式為,疾病及死亡評(píng)價(jià)的常用指標(biāo) (P345),發(fā)病率(incidence rate) 罹患率(attack rate) 患病率(prevalence rate) 感染率 ( infection rate) 續(xù)發(fā)率 ( secondary attack rate) 死亡率(mortality

2、rate) 病死率(fatality rate),(二)構(gòu)成比 構(gòu)成比:表示事物內(nèi)部某一部分觀察單位數(shù)與該事物內(nèi)部各部分觀察單位的總數(shù)之比,用來說明各構(gòu)成部分在總體中所占的比重。 通常以100%為比例基數(shù)。其計(jì)算公式為:,構(gòu)成比有兩個(gè)特點(diǎn): 同一事物的各個(gè)構(gòu)成比的總和應(yīng)等于100%,即各個(gè)分子的總和等于分母。 各構(gòu)成部分之間是相互影響的,呈此消彼長(zhǎng)的關(guān)系。,(三)相對(duì)比 簡(jiǎn)稱比,是兩個(gè)有關(guān)指標(biāo)之比,說明兩指標(biāo)間的比例關(guān)系。計(jì)算公式:,公式中兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù) 兩指標(biāo)可以量綱不同 兩指標(biāo)可以是性質(zhì)相同,如不同時(shí)期死亡率之比;也可以性質(zhì)不同,如醫(yī)院的醫(yī)護(hù)人員數(shù)與病床數(shù)之比。 相對(duì)危

3、險(xiǎn)度:兩個(gè)率之比,流行病研究常用指標(biāo)。,率的比較,兩樣本率的z檢驗(yàn) 檢驗(yàn),兩樣本率的比較,目的在于對(duì)相應(yīng)的兩總體率進(jìn)行統(tǒng)計(jì)推斷。 設(shè)兩樣本率分別為p1和p2,當(dāng)n1與n2均較大,且p1、1-p1及p2、1-p2均不太小,如n1p1、n1(1-p1)及n2p2、n2(1-p2)均大于5時(shí),可利用樣本率的分布近似正態(tài)分布,可采用正態(tài)近似法對(duì)兩總體率作統(tǒng)計(jì)推斷。,兩樣本率的比較,檢驗(yàn)統(tǒng)計(jì)量u/z的計(jì)算公式為:,例7-1 為研究某職業(yè)人群頸椎病發(fā)病的性別差異,今隨機(jī)抽查了該職業(yè)人群男性120人和女性110人,發(fā)現(xiàn)男性中有36人患有頸椎病,女性中有22人患有頸椎病。問該職業(yè)人群頸椎病的發(fā)病是否有性別差異

4、?。,記該職業(yè)人群頸椎病的患病率男性為1,女性為2,其檢驗(yàn)假設(shè)為 H0:1=2 H1:12 a =0.05,本例 n1=120, X1=36, p1=X1/n1=36/120=0.30; n2=110, X2=22, p2=X2/n2=22/110=0.20,查z界值表得0.05P0.10。按 =0.05水準(zhǔn),不拒絕H0,即尚不能認(rèn)為該職業(yè)人群頸椎病的發(fā)病有性別差異。,檢驗(yàn),四格表資料的 檢驗(yàn),目的: 推斷兩個(gè)總體率或構(gòu)成比之間有無差別 多個(gè)總體率或構(gòu)成比之間有無差別 多個(gè)樣本率的多重比較 兩個(gè)分類變量之間有無關(guān)聯(lián)性 頻數(shù)分布擬合優(yōu)度的檢驗(yàn)。 檢驗(yàn)統(tǒng)計(jì)量: 應(yīng)用:計(jì)數(shù)資料,1 檢驗(yàn)的基本思想,

5、例 某院欲比較異梨醇口服液(試驗(yàn)組)和氫氯噻嗪+地塞米松(對(duì)照組)降低顱內(nèi)壓的療效。將200例顱內(nèi)壓增高癥患者隨機(jī)分為兩組,結(jié)果見表7-1。問兩組降低顱內(nèi)壓的總體有效率有無差別?,表7-1 兩組降低顱內(nèi)壓有效率的比較,本例資料經(jīng)整理成圖7-2形式,即有兩個(gè)處理組,每個(gè)處理組的例數(shù)由發(fā)生數(shù)和未發(fā)生數(shù)兩部分組成。表內(nèi)有 四個(gè)基本數(shù)據(jù),其余數(shù)據(jù)均由此四個(gè)數(shù)據(jù)推算出來的,故稱四格表資料。,圖7-2 四格表資料的基本形式,表7-2 兩組降低顱內(nèi)壓有效率的比較,實(shí)際頻數(shù),理論頻數(shù),理論頻數(shù)由下式求得:,式中,TRC 為第R 行C 列的理論頻數(shù) nR 為相應(yīng)的行合計(jì) nC 為相應(yīng)的列合計(jì),理論頻數(shù) 是根據(jù)檢

6、驗(yàn)假設(shè) ,且用合 并率來估計(jì) 而定的。 無效假設(shè)是試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率相等,均等于合計(jì)的有效率87%。那么理論上,試驗(yàn)組的104例顱內(nèi)壓增高癥患者中有效者應(yīng)為104(174/200)=90.48,無效者為104(26/200)=13.52;同理,對(duì)照組的96例顱內(nèi)壓增高癥患者中有效者應(yīng)為96(174/200)=83.52,無效者為96(26/200)=12.48。,若檢驗(yàn)假設(shè)H0:1=2成立,四個(gè)格子的實(shí)際頻數(shù)A 與理論頻數(shù)T 相差不應(yīng)該很大,即統(tǒng)計(jì)量 不應(yīng)該很大。如果上述統(tǒng)計(jì)量值很大,從而懷疑H0的正確性,繼而拒絕H0,接受其對(duì)立假設(shè)H1,即12 。 這個(gè)統(tǒng)計(jì)量就稱為卡方統(tǒng)計(jì)

7、量。,反映實(shí)際頻數(shù)與理論頻數(shù)的吻合程度可用統(tǒng)計(jì)量 來表示,卡方分布: 若k個(gè)隨機(jī)變量,z1,z2,zk,相互獨(dú)立且服從標(biāo)準(zhǔn)正態(tài)分布,則隨機(jī)變量x=z12+z22+zK2被稱為服從自由度為k的卡方分布,記作:,可通過 檢驗(yàn)的基本公式來理解。,式中,A為實(shí)際頻數(shù)(actual frequency), T為理論頻數(shù)(theoretical frequency)。,值的大小還取決于 個(gè)數(shù)的多少(嚴(yán)格地說是自由度的大?。?。自由度愈大, 值也會(huì)愈大;所以只有考慮了自由度的影響, 值才能正確地反映實(shí)際頻數(shù)A和理論頻數(shù)T 的吻合程度。 檢驗(yàn)的自由度取決于可以自由取值的格子數(shù)目,而不是樣本含量n。四格表資料只有

8、兩行兩列, =1,即在周邊合計(jì)數(shù)固定的情況下,4個(gè)基本數(shù)據(jù)當(dāng)中只有一個(gè)可以自由取值。,分布圖形,(1) 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水平。 H0:1=2 即試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率相等 H1:12 即試驗(yàn)組與對(duì)照組降低顱內(nèi)壓的總體有效率不相等 =0.05。,2. 假設(shè)檢驗(yàn)步驟,(2)求檢驗(yàn)統(tǒng)計(jì)量值,3. 四格表資料檢驗(yàn)的專用公式,四格表資料 檢驗(yàn)方法選擇條件:,,卡方檢驗(yàn); ,卡方校正檢驗(yàn); ,F(xiàn)isher確切概率法。,連續(xù)性校正僅用于 的四格表資料,當(dāng) 時(shí),一般不作校正。,4. 四格表資料檢驗(yàn)的校正公式,例7-2 某醫(yī)師欲比較胞磷膽堿與神經(jīng)節(jié)苷酯治療腦血管疾病的療效,將78例腦血管疾病

9、患者隨機(jī)分為兩組,結(jié)果見表7-2。問兩種藥物治療腦血管疾病的有效率是否相等?,表7-2 兩種藥物治療腦血管疾病有效率的比較,本例 ,故用四格表資料 檢驗(yàn)的校正公式,,查 界值表得 P0.05 。按 檢驗(yàn)水準(zhǔn)不拒絕 ,尚不能認(rèn)為兩種藥物治療腦血管疾病的有效率不等。,本資料若不校正時(shí), 結(jié)論與之相反。,配對(duì)四格表資料的 檢驗(yàn),與計(jì)量資料推斷兩總體均數(shù)是否有差別有成組設(shè)計(jì)和配對(duì)設(shè)計(jì)一樣,計(jì)數(shù)資料推斷兩個(gè)總體率(構(gòu)成比)是否有差別也有成組設(shè)計(jì)和配對(duì)設(shè)計(jì),即四格表資料和配對(duì)四格表資料。,例7-3 比較甲乙兩種方法診斷肝癌的差別,共273例肝癌患者。問兩種方法肝癌檢出率有無差別?,甲乙兩種方法273肝癌診

10、斷結(jié)果,上述配對(duì)設(shè)計(jì)實(shí)驗(yàn)中,就每個(gè)對(duì)子而言,兩種處理的結(jié)果不外乎有四種可能:,兩種檢測(cè)方法皆為陽性數(shù)(a); 兩種檢測(cè)方法皆為陰性數(shù)(d); 免疫熒光法為陽性,乳膠凝集法為 陰性數(shù)(b); 乳膠凝集法為陽性,免疫熒光法為 陰性數(shù)(c)。,檢驗(yàn)統(tǒng)計(jì)量: 基本公式 (b+c40),校正公式 (b+c或=40),本例檢驗(yàn)步驟如下:,47,(1)建立檢驗(yàn)假設(shè) H0:總體B=C,即兩種方法肝癌檢出率相同 H1:總體BC,即兩種方法肝癌檢出率不等 =0.05,(2)計(jì)算2值 本例b=17,c=66,b+c40,(3)確定P值及推斷結(jié)論 P0.05,在=0.05的水準(zhǔn)上,拒絕H0,接收H1,差異有統(tǒng)計(jì)學(xué)意義

11、,可以認(rèn)為兩種方法檢測(cè)結(jié)果不同,檢驗(yàn)統(tǒng)計(jì)量為,注意:,本法一般用于樣本含量不太大的資料。因?yàn)樗鼉H考慮了兩法結(jié)果不一致的兩種情況(b, c),而未考慮樣本含量n和兩法結(jié)果一致的兩種情況(a, d)。所以,當(dāng)n很大且a與d的數(shù)值很大(即兩法的一致率較高),b與c的數(shù)值相對(duì)較小時(shí),即便是檢驗(yàn)結(jié)果有統(tǒng)計(jì)學(xué)意義,其實(shí)際意義往往也不大。,52,行列表資料的 檢驗(yàn),行列表資料,53,多個(gè)樣本率比較時(shí),有R行2列,稱為R 2表; 兩個(gè)樣本的構(gòu)成比比較時(shí),有2行C列,稱2C表; 多個(gè)樣本的構(gòu)成比比較,以及雙向無序分類資料關(guān)聯(lián)性檢驗(yàn)時(shí),稱為R C表。,檢驗(yàn)統(tǒng)計(jì)量,54,一、多個(gè)樣本率的比較,案例7-4 135例尿

12、路感染患者隨機(jī)分為3組,每組45例,甲乙丙三種方法。問甲乙丙三種方法陰性轉(zhuǎn)化率有無差別。,三種療法對(duì)尿路感染的治療效果,58,假設(shè)檢驗(yàn)步驟:,2. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量, =(31)(21)=2,3.確定P值,做出推斷結(jié)論 查附表7,可得P0.005,按照a=0.05的水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為三種療法治療尿路感染患者的總體陰轉(zhuǎn)率不等或不全相等,二、樣本構(gòu)成比的比較,62,案例7-5 為了解血型分布與胃癌及消化性潰瘍病的關(guān)系,某單位進(jìn)行了調(diào)查,試比較各組血型構(gòu)成有無差別?,63,假設(shè)檢驗(yàn)步驟,64,1建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn) H0 :胃癌、潰瘍和對(duì)照三個(gè)組的血型總體構(gòu)成比

13、相同 H1 :胃癌、潰瘍和對(duì)照三個(gè)組的血型總體構(gòu)成比相不同或不全相同 =0.05,65,計(jì)算檢驗(yàn)統(tǒng)計(jì)量,66,確定P值,作出推斷結(jié)論 根據(jù) = 6 查 2 界值表,得P 0.05,按=0.05的檢驗(yàn)水準(zhǔn),拒絕H0,接受H 。差異有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為胃癌、潰瘍和對(duì)照三個(gè)組的血型總體構(gòu)成有差異。,R*C表中兩個(gè)分類變量皆為無序分類變量的行 列表資料,又稱為雙向無序 R*C表資料。,三、雙向無序分類資料的關(guān)聯(lián)性檢驗(yàn),例 7-6 測(cè)得某地5801人的ABO血型和MN血型結(jié)果如表7-10,問兩種血型系統(tǒng)之間是否有關(guān)聯(lián)?,表7-6 某地5801人的血型,表7-6資料,可用行列表資料 檢驗(yàn)來推斷兩個(gè)分類變

14、量之間有無關(guān)系(或關(guān)聯(lián));若有關(guān)系,可計(jì)算Pearson列聯(lián)系數(shù)C進(jìn)一步分析關(guān)系的密切程度:,列聯(lián)系數(shù)C取值范圍在01之間。0表示完全獨(dú)立;1表示完全相關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。,檢驗(yàn)步驟,由于列聯(lián)系數(shù)C=0.1883,數(shù)值較小,故認(rèn)為兩種血型系統(tǒng)間雖然有關(guān)聯(lián)性,但關(guān)系不太密切。,四、行列表資料 檢驗(yàn)的注意事項(xiàng),1樣本量 40,行列表中的各格T1,并且1T5的格子數(shù)不宜超過1/5格子總數(shù),73,增大樣本含量以達(dá)到增大理論頻數(shù)的目的,屬首選方法,根據(jù)專業(yè)知識(shí),刪去理論頻數(shù)太小的行或列,或?qū)⒗碚擃l數(shù)太小的行或列與性質(zhì)相近的鄰行或鄰列合并。這樣做會(huì)損失信息及損害樣本的隨機(jī)性。 改用雙向無序RC表的Fisher確切概率法,2. 多個(gè)樣本率比較,若所得統(tǒng)計(jì)推斷為拒絕H0,接受H1時(shí),只能認(rèn)為各總體率之間總的來說有差別,但不能說明任兩個(gè)總體率之間均有差別。要進(jìn)一步推斷哪兩兩總體率之間有差別,需進(jìn)一步做多個(gè)樣本率的多重比較。,行列表資料兩兩比較,R*C或R*

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論