版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第一節(jié)第一節(jié) 率的抽樣誤差及可信區(qū)間率的抽樣誤差及可信區(qū)間第一節(jié)第一節(jié) 率的抽樣誤差與可信區(qū)間率的抽樣誤差與可信區(qū)間第二節(jié)第二節(jié) 率的統(tǒng)計學推斷率的統(tǒng)計學推斷 一、樣本率與總體率比較的一、樣本率與總體率比較的u u 檢驗檢驗 二、兩個樣本率比較的二、兩個樣本率比較的u u 檢驗檢驗第三節(jié)第三節(jié) 卡方檢驗卡方檢驗 一、卡方檢驗的基本思想一、卡方檢驗的基本思想 二、四格表專用公式二、四格表專用公式 三、連續(xù)性校正公式三、連續(xù)性校正公式 四、配對四格表資料的四、配對四格表資料的2 2檢驗檢驗 五、行五、行列(列(R RC C)表資料的)表資料的2 2檢驗檢驗 計數(shù)資料的統(tǒng)計學推斷計數(shù)資料的統(tǒng)計學推斷
2、第一節(jié)第一節(jié) 率的抽樣誤差與可信區(qū)間率的抽樣誤差與可信區(qū)間一、一、 率的抽樣誤差與標準誤率的抽樣誤差與標準誤 樣本率樣本率(p)和總體率和總體率()的差異稱為的差異稱為率的率的 抽樣誤差抽樣誤差(sampling error of rate) ,用,用率的標率的標 準誤準誤(standard error of rate)度量。)度量。np)1 (如果總體率如果總體率未知,用樣本率未知,用樣本率p估計估計nppsp)1( %52. 20252. 0368)625. 01 (625. 0)1 (nppSp標準誤的計算標準誤的計算SP的的意義:意義:反映率的抽樣誤差大小反映率的抽樣誤差大小. . S
3、P小表示率小表示率的抽樣誤差小的抽樣誤差小, ,即樣本率的可靠性大即樣本率的可靠性大. . 二、二、 總體率的可信區(qū)間總體率的可信區(qū)間總體率的可信區(qū)間總體率的可信區(qū)間 (confidence interval of (confidence interval of rate)rate):根據(jù)樣本率推算總體率可能所在的范圍根據(jù)樣本率推算總體率可能所在的范圍 1.1.正態(tài)近似法正態(tài)近似法; ;(1)(1)條件:條件:a. a. n n100(50)100(50) b. b. npnp與與 n(1-p)n(1-p)5 5(2)(2)公式:公式:1)1)總體率總體率95%95%可信區(qū)間為:可信區(qū)間為:P
4、 P1.96S1.96SP P. . 2) 2)總體率總體率99%99%可信區(qū)間為:可信區(qū)間為:P P2.58S2.58SP P 2.2.查表法:查表法: 適用于適用于n50; Pn50; P很接近很接近0 0或或100%100%時時, ,可查百分率的可信可查百分率的可信限表,求得百分率可信限限表,求得百分率可信限第二節(jié)第二節(jié) 率的統(tǒng)計學推斷率的統(tǒng)計學推斷 一、樣本率與總體率比較一、樣本率與總體率比較u檢驗檢驗 二、兩個樣本率的比較二、兩個樣本率的比較u檢驗檢驗u u 檢驗的條件:檢驗的條件:n p 和和n(1- p)均大于均大于5時時 例如,一般高血壓患病率為例如,一般高血壓患病率為13.2
5、6%,13.26%,農(nóng)村抽樣農(nóng)村抽樣p p =43/460=0.0935,=43/460=0.0935,即即0 0=0.1326=0.1326 )1 (0000nppup4727.2460)1326.01(1326.01326.00935.0二、兩個獨立樣本率比較的二、兩個獨立樣本率比較的u u 檢驗檢驗表表5-1 兩種療法的心血管病病死率比較兩種療法的心血管病病死率比較療法死亡生存 合計病死率(%)鹽酸苯乙雙胍26 (X1)178 204(n1) 12.75 (p1)安慰劑 2 (X2) 62 64(n2) 3.13 (p2)合 計 28240 268 10.45 (pc)u 檢驗的條件:檢
6、驗的條件:n1p1 和和n1(1- p1)與與n2p2 和和n2(1- p2)均均 596. 11949. 2)6412041)(1045. 01 (1045. 00313. 01275. 0u2122112121nnpnpnnnXXpc)11)(1 (21212121nnppppSppuccpp 小小 結結 1 1樣本率也有抽樣誤差,率的抽樣誤差的樣本率也有抽樣誤差,率的抽樣誤差的 大小用大小用p p或或S Sp p來衡量。來衡量。 2 2率的分布服從二項分布。率的分布服從二項分布。 當當n n足夠大,足夠大,和和1-1-均不太小,均不太小, 有有nn55和和n n(1-1-)55時,時,
7、近似正態(tài)分布。近似正態(tài)分布。 3 3總體率的可信區(qū)間是用樣本率估計總體總體率的可信區(qū)間是用樣本率估計總體 率的可能范圍。當率的可能范圍。當p p 分布近似正態(tài)分布分布近似正態(tài)分布 時,可用正態(tài)近似法估計率的可信區(qū)間時,可用正態(tài)近似法估計率的可信區(qū)間 4 4根據(jù)正態(tài)近似原理,可進行樣本率與總根據(jù)正態(tài)近似原理,可進行樣本率與總 體率以及兩樣本率比較的體率以及兩樣本率比較的u u 檢驗。檢驗。 率的率的u u 檢驗能解決以下問題嗎?檢驗能解決以下問題嗎? 率的反應為生與死、陽性與陰性、發(fā)生與不率的反應為生與死、陽性與陰性、發(fā)生與不發(fā)生等二分類變量,如果二分類變量為非正反關發(fā)生等二分類變量,如果二分類
8、變量為非正反關系(如治療系(如治療A A、治療、治療B B);反應為多分類,如何進);反應為多分類,如何進行假設檢驗?行假設檢驗? 率的率的u u 檢驗要求:檢驗要求:n n足夠大,且足夠大,且nn55和和 n n(1-1-)55。 如果條件不滿足,如何進行假設檢驗?如果條件不滿足,如何進行假設檢驗? 第三節(jié)第三節(jié) 卡方檢驗卡方檢驗 2檢驗檢驗(Chi-square test)是現(xiàn)代統(tǒng)計學的創(chuàng)始人是現(xiàn)代統(tǒng)計學的創(chuàng)始人之一,英國人之一,英國人K . Pearson(1857-1936)于)于1900年提年提出的一種具有廣泛用途的統(tǒng)計方法,出的一種具有廣泛用途的統(tǒng)計方法,可用于兩個或可用于兩個或多
9、個率間的比較,計數(shù)資料的關聯(lián)度分析,擬合優(yōu)多個率間的比較,計數(shù)資料的關聯(lián)度分析,擬合優(yōu)度檢驗度檢驗等等。等等。 本章僅限于介紹本章僅限于介紹兩個和多個率或構成比比較的兩個和多個率或構成比比較的2檢驗。檢驗。 四格表資料的四格表資料的2檢驗檢驗n什么是四格表資料?凡是兩個率或構成比資什么是四格表資料?凡是兩個率或構成比資料都可以看做四格表資料。舉例料都可以看做四格表資料。舉例。組 別發(fā) 病 人 數(shù) 未 發(fā) 病人數(shù)觀察例數(shù) 發(fā)病率(%)實 驗 組 148610014對 照 組 309012025合計44176220201 48 63 09 0 一、卡方檢驗的基本思想一、卡方檢驗的基本思想 四格表資
10、料的四格表資料的2檢驗檢驗n什么是四格表資料?凡是兩個率或構成比資什么是四格表資料?凡是兩個率或構成比資料都可以看做四格表資料。例料都可以看做四格表資料。例如如組 別發(fā) 病 人 數(shù) 未 發(fā) 病人數(shù)觀察例數(shù) 發(fā)病率(%)實 驗 組 148610014對 照 組 309012025合計44176220201 48 63 09 0組 別陽 性陰 性合計1aba+b2cdc+d合計a+cb+da+b+c+d 四格表的一般形式四格表的一般形式理論頻數(shù)與自由度的計算:理論頻數(shù)與自由度的計算:A是實際頻數(shù),是實際頻數(shù),T是根據(jù)假設檢驗來確定的,是根據(jù)假設檢驗來確定的,當當H0成立時,計算出的格子中的數(shù)。每個
11、格子中的理論成立時,計算出的格子中的數(shù)。每個格子中的理論頻數(shù)計算公式為:頻數(shù)計算公式為:TRC = NR NC /N, NR所在的行合計所在的行合計,NC所在所在的列合計,代入公式中求的列合計,代入公式中求x x2 2值值。療法療法死亡死亡生存生存 合計合計病死率病死率(%)(%)鹽酸苯乙雙胍鹽酸苯乙雙胍26 (26 (a a) )178 (178 (b b) ) 204(204(a a+ +b b) ) 12.75 12.75 ( (p p1 1) )安慰劑安慰劑 2 (2 (c c) ) 62 (62 (d d) ) 64(64(c c+ +d d) ) 3.13 3.13 ( (p p2
12、 2) )合合 計計 28 ( 28 (a+ca+c. .) )240(240(b+db+d. .) ) 268(268(a a+ +b b+ +c c+ +d=nd=n) ) 10.45 10.45 ( (p pc c) )表表5-1 兩種療法的心血管病病死率的比較兩種療法的心血管病病死率的比較nnncolumnrowTCR總例數(shù)合計列合計行)()(a+b)pc=(a+b)(a+c.)/ n =nRnC/n =21.3(a+b)(1-pc)= (a+b)(b+d.)/ n =nRnC/n =182.7(c+d)pc=(c+d)(a+c)/ n =nRnC/n =6.7(c+d)(1-pc)=
13、 (c+d)(b+d.)/ n =nRnC/n =57.3 各種情形下,理論與實際偏離的總和即為卡方值(chi-square value),它服從自由度為的卡方分布。) 1)(1(,1)()(222CRTTATTA1) 12)(12(82. 4)3 .5717 . 617 .18213 .211(7 . 423 .57) 3 .5762(27 . 6) 7 . 62(27 .182) 7 .182178(23 .21) 3 .2126(22v2/) 12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的臨界值的臨界值 2分布分布(chi-square distr
14、ibution) 2分布規(guī)律分布規(guī)律n自由度一定時,自由度一定時,P值越小,值越小, x2值越大。值越大。n當當P 值一定時,自由值一定時,自由 度越大,度越大, x2越大。越大。 =1時,時, P=0.05, x2 =3.84 P=0.01, x2 =6.63 P=0.05時,時, =1, x2 =3.84 =2, x2 =5.99n當自由度取當自由度取1時,時, u2= x2 2檢驗的基本公式檢驗的基本公式) 1)(1(1)()(222CRTTATTA 上述上述基本公式基本公式由由Pearson提出,因此軟提出,因此軟件上常稱這種檢驗為件上常稱這種檢驗為Pearson卡方檢驗??ǚ綑z驗。
15、下下面將要介紹的其他卡方檢驗公式都是在此面將要介紹的其他卡方檢驗公式都是在此基礎上發(fā)展起來的。它不僅適用于四格表基礎上發(fā)展起來的。它不僅適用于四格表資料,也適用于其它的資料,也適用于其它的“行行列表列表”。 二、四格表專用公式二、四格表專用公式 為了不計算理論頻數(shù)為了不計算理論頻數(shù)T, 可由可由基本公式基本公式推導出,直接由推導出,直接由各格子的實際頻數(shù)(各格子的實際頻數(shù)(a、b、c、d)計算卡方值的公式:)計算卡方值的公式:(四格表專用公式)基本公式:;1)()()()()()()()()()()(222222dbcadcbanbcaddcbadbdcdcbadbdcddcbadbbadcb
16、adbbabdcbacabadcbacabaaTTA療法療法死亡死亡生存生存 合計合計病死率病死率(%)(%)鹽酸苯乙雙胍鹽酸苯乙雙胍26 (26 (a a) )178 (178 (b b) ) 204(204(a a+ +b b) ) 12.75 12.75 ( (p p1 1) )安慰劑安慰劑 2 (2 (c c) ) 62 (62 (d d) ) 64(64(c c+ +d d) ) 3.13 3.13 ( (p p2 2) )合合 計計 28 ( 28 (a+ca+c. .) )240(240(b+db+d. .) ) 268(268(a a+ +b b+ +c c+ +d=nd=n)
17、 ) 10.45 10.45 ( (p pc c) )表表5-1 兩種療法的心血管病病死率的比較兩種療法的心血管病病死率的比較021 ,05. 0221021 ,05. 0221 ,05. 0205. 0;84. 3,05. 0;84. 305. 0;84. 31 , 82. 46424028204268)21786226(22HPHPP,即不拒絕則如果即拒絕如果下結論: 2(1) u2 2.194924.82(n40,所有,所有T 5時時)nx2 =(ad-bc)2 xN/(a+b)(c+d)(a+c)(b+d) 該公式從基本公式推導而來,結果相同。計算較為簡單。n適用條件:N40且T 5當
18、不滿足時用校正公式。n適用條件:N40且1 T 5x2 =(|A-T|-0.5)2/T或x2 =(|ad-bc|-n/2)2 xN/(a+b)(c+d)(a+c)(b+d) 三、連續(xù)性校正公式三、連續(xù)性校正公式 2分布是一連續(xù)型分布,而行分布是一連續(xù)型分布,而行列表資料屬離列表資料屬離散 型 分 布 , 對 其 進 行 校 正 稱 為散 型 分 布 , 對 其 進 行 校 正 稱 為 連 續(xù) 性 校 正連 續(xù) 性 校 正(correction for continuity),又稱又稱Yates校正(校正(Yates correction)。)。當當n40,而,而1T5時,用連續(xù)性校正公式時,用
19、連續(xù)性校正公式當當n40或或T1時,用時,用Fisher精確檢驗精確檢驗(Fisher exact test )校正公式校正公式:列表資料)(也適合其它行,TTAc22)5 . 0()()()()2/(22dbcadcbannbcadc表 5-2 兩零售點豬肉表層沙門氏菌帶菌情況檢查結果 沙門氏菌 零售點 陽性 陰性 合計 帶菌率(%) 甲 2(4.17) 26(23.33) 28 7.14 乙 5(2.33) 9(11.67) 14 35.71 合計 7 35 42 16.67 1 , 62. 3357142842) 24262592(22c1 , 49. 5357142842)26592
20、(22四、配對四格表資料的四、配對四格表資料的2檢驗檢驗配對四格表資料的配對四格表資料的2檢驗檢驗也稱也稱McNemar檢驗(檢驗(McNemars test) 1,)(2240ccbcbb時,當H0:b,c來自同一個實驗總體來自同一個實驗總體 (兩種劑量的毒性無差異);(兩種劑量的毒性無差異);H1:b,c來自不同的實驗總體來自不同的實驗總體 (兩種劑量的毒性有差別);(兩種劑量的毒性有差別);=0.05。配對四格表資料的配對四格表資料的2檢驗檢驗也稱也稱McNemar檢驗(檢驗(McNemars test) 1,) 1(2402cbcbcb時,需作連續(xù)性校正, 1,27.4312)1312(22,4015采用連續(xù)性校正本例cb05. 0;84. 321 ,05.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB 12158-2024防止靜電事故通用要求
- 二零二五年度地質災害防治安全承包合同范本2篇
- 2025年度老舊廠房拆除重建項目轉讓合同3篇
- 二零二五版UPS不間斷電源系統(tǒng)在數(shù)據(jù)中心節(jié)能改造中的應用合同3篇
- 二零二五年度食品安全樣本檢驗合同2篇
- 2025年度物業(yè)管理委托合同(住宅小區(qū))3篇
- 三方監(jiān)理服務協(xié)議:2024年度工程監(jiān)管協(xié)議版B版
- 二零二五版公司銷售業(yè)務員合同協(xié)議書含虛擬貨幣交易業(yè)務合作3篇
- 2024年轎車物流服務協(xié)議模板版B版
- 2024煙花爆竹行業(yè)信用風險防范購銷合同管理3篇
- 2025年山東光明電力服務公司招聘筆試參考題庫含答案解析
- 《神經(jīng)發(fā)展障礙 兒童社交溝通障礙康復規(guī)范》
- 詩詞接龍(飛花令)PPT
- 子宮內(nèi)膜癌(課堂PPT)
- 澳大利亞公司法1-30
- 海上試油測試技術0327
- 中國地圖標準版(可編輯顏色)
- 瑪氏銷售常用術語中英對照
- (完整)貓咪上門喂養(yǎng)服務協(xié)議書
- 上海牛津版三年級英語3B期末試卷及答案(共5頁)
- 行為疼痛量表BPS
評論
0/150
提交評論