




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第九章第九章 數(shù)值變量資料的數(shù)值變量資料的統(tǒng)計推斷統(tǒng)計推斷第一節(jié) 均數(shù)的抽樣誤差與總體均數(shù)的估計第二節(jié) 假設(shè)檢驗的基本思想和基本步驟第三節(jié) t檢驗和u檢驗第四節(jié) 方差分析第五節(jié) 假設(shè)檢驗中的兩類錯誤及應(yīng)注意的問題第一節(jié)第一節(jié) 均數(shù)的抽樣誤差與總體均數(shù)的估計均數(shù)的抽樣誤差與總體均數(shù)的估計l均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤lt分布l總體均數(shù)置信區(qū)間的估計 一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤 了解總體特征的最好方法是對總體的每一個體進(jìn)行觀察、試驗,但這在醫(yī)學(xué)研究實際中往往不可行。 對無限總體不可能對所有個體逐一觀察,對有限總體限于人力、財力、物力、時間或個體過多等原因,不可能也沒必要對所有個體逐一研究。 借助抽樣研究
2、。抽樣誤差抽樣誤差l從總體均數(shù) 為155.4cm,標(biāo)準(zhǔn)差 為5.3cm的正態(tài)分布總體中隨機抽樣。樣本大小為30。,nnXS2, 11,X Sn=3033,XS22,XS .從正態(tài)總體從正態(tài)總體 抽樣得到的抽樣得到的1000個樣本均個樣本均數(shù)的頻數(shù)分布數(shù)的頻數(shù)分布(ni=30)2(155.4,5.3 )NMean=155.426 Std=0.966抽樣誤差抽樣誤差l結(jié)果:l各樣本均數(shù)不一定等于總體均數(shù)l樣本均數(shù)間存在差異l樣本均數(shù)的分布規(guī)律:圍繞總體均數(shù)上下波動l樣本均數(shù)的變異:由樣本均數(shù)的標(biāo)準(zhǔn)差描述。 例: 欲了解某地2000年正常成年男性血清總膽固醇的平均水平,隨機抽取該地200名正常成年男
3、性作為樣本。 由于存在個體差異,抽得的樣本均數(shù)不太可能恰好等于總體均數(shù)。 由個體變異和抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異,稱為抽樣誤差。 這些來自同一總體的若干樣本統(tǒng)計量間,也存在抽樣誤差。 在抽樣研究中,抽樣誤差是不可避免的。 由于其產(chǎn)生的根本原因是生物個體的變異性,故抽樣誤差分布具有一定的規(guī)律性。小結(jié):抽樣誤差小結(jié):抽樣誤差l抽樣誤差Sampling error l由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異l來源:l個體變異l抽樣l表現(xiàn)l樣本統(tǒng)計量與總體參數(shù)間的差異l樣本統(tǒng)計量間的差異l樣本均數(shù)的規(guī)律性l隨機的l在概率意義下是有規(guī)律的-抽樣分布l通過大量重復(fù)抽樣,借助頻數(shù)表描述l樣本均數(shù)的
4、變異規(guī)律(抽樣分布)與個體觀察值變異規(guī)律有關(guān)l即使只有一個樣本資料,也可由樣本資料的個體觀察值的變異規(guī)律間接得到樣本均數(shù)的變異規(guī)律抽樣分布抽樣分布例:某市1999年18歲男生身高服從 =167.7cm、 =5.3cm正態(tài)分布,從該N(167.7, 5.32)總體中隨機抽樣。每次 =10人,共有樣本g=100個,得到每個樣本均數(shù) 及標(biāo)準(zhǔn)差 。將上述100個樣本均數(shù)看成新變量值,這100個樣本均數(shù)構(gòu)成一新分布。 jnjSjX樣本均數(shù)抽樣分布具有如下特點:1. 各樣本均數(shù)未必等于總體均數(shù);2. 各樣本均數(shù)間存在差異;3. 樣本均數(shù)圍繞總體均數(shù)(167.7cm)呈正態(tài)分布;4. 樣本均數(shù)變異范圍較原變
5、量變異范圍大大縮小,這100個樣本均數(shù)的均數(shù)為167.69cm、標(biāo)準(zhǔn)差為1.69cm。 在非正態(tài)分布總體中可進(jìn)行類似抽樣。 可得到如下結(jié)論:可得到如下結(jié)論: 若若 服從正態(tài)分布服從正態(tài)分布 則則 服從正態(tài)分布服從正態(tài)分布 若若 不服從正態(tài)分布不服從正態(tài)分布 n n大:則大:則 近似服從正態(tài)分近似服從正態(tài)分布布 n n小:則?。簞t 為非正態(tài)分布為非正態(tài)分布iXjXiXjXjX 的總體均數(shù)為的總體均數(shù)為;而;而 的標(biāo)準(zhǔn)的標(biāo)準(zhǔn)差比原個體值的標(biāo)準(zhǔn)差要小,為區(qū)差比原個體值的標(biāo)準(zhǔn)差要小,為區(qū)別兩者,別兩者, 的標(biāo)準(zhǔn)差用的標(biāo)準(zhǔn)差用 表示。表示。樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱標(biāo)準(zhǔn)誤(stand
6、ard error, SE)(standard error, SE)。樣本均數(shù)的標(biāo)準(zhǔn)差稱均數(shù)的標(biāo)準(zhǔn)誤樣本均數(shù)的標(biāo)準(zhǔn)差稱均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean, SEM)(standard error of mean, SEM),反映樣本均數(shù)間離散程度。反映樣本均數(shù)間離散程度。jXjXXjX可證明均數(shù)標(biāo)準(zhǔn)誤在實際工作中常未知,用S來估計。均數(shù)標(biāo)準(zhǔn)誤估計值 XnXSSn均數(shù)標(biāo)準(zhǔn)誤大小與標(biāo)準(zhǔn)差大小成正比,與樣本含量n的平方根成反比。 減小抽樣誤差的方法減小抽樣誤差的方法增大樣本含量增大樣本含量n ;選擇標(biāo)準(zhǔn)差較小的指標(biāo)。選擇標(biāo)準(zhǔn)差較小的指標(biāo)。標(biāo)準(zhǔn)誤的應(yīng)用標(biāo)準(zhǔn)誤的應(yīng)用表示抽樣誤差的
7、大小,說明樣本均數(shù)推論總體均數(shù)的可表示抽樣誤差的大小,說明樣本均數(shù)推論總體均數(shù)的可靠性。(標(biāo)準(zhǔn)誤越小,可靠性越好;反之,標(biāo)準(zhǔn)靠性。(標(biāo)準(zhǔn)誤越小,可靠性越好;反之,標(biāo)準(zhǔn)誤越大,可靠性越差)誤越大,可靠性越差)估計總體均數(shù)的可信區(qū)間(參數(shù)估計)。估計總體均數(shù)的可信區(qū)間(參數(shù)估計)。用于均數(shù)的假設(shè)檢驗。用于均數(shù)的假設(shè)檢驗。 例:在例8.1中,n=132, 4.653mmol/L,s0.40066mmol/L,請計算標(biāo)準(zhǔn)誤。 (0.03487mmmol/L)x標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的關(guān)系標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的關(guān)系標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 與標(biāo)準(zhǔn)差成正比;與標(biāo)準(zhǔn)差成正比;標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 與樣本含量與樣本含量n的平方根成反比(說明增
8、大樣本含的平方根成反比(說明增大樣本含量可以減少抽樣誤差);量可以減少抽樣誤差);標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的意義不同(標(biāo)準(zhǔn)差反映了變量值的離標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的意義不同(標(biāo)準(zhǔn)差反映了變量值的離散程度,標(biāo)準(zhǔn)誤則反映了均數(shù)的離散程度)。散程度,標(biāo)準(zhǔn)誤則反映了均數(shù)的離散程度)。標(biāo)準(zhǔn)誤的應(yīng)用標(biāo)準(zhǔn)誤的應(yīng)用反映抽樣誤差的大?。颖揪鶖?shù)的離散程度;樣本均數(shù)反映抽樣誤差的大?。颖揪鶖?shù)的離散程度;樣本均數(shù)與總體均數(shù)的接近程度;均數(shù)的代表性如何。)與總體均數(shù)的接近程度;均數(shù)的代表性如何。)用于計算其它統(tǒng)計指標(biāo)(參數(shù)估計、假設(shè)檢驗)。用于計算其它統(tǒng)計指標(biāo)(參數(shù)估計、假設(shè)檢驗)。均數(shù)的標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤的區(qū)別標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤意義描述觀察
9、值的變異程度。其值越小,觀察值的變異程度越小,均數(shù)的代表性越好描述樣本均數(shù)的變異程度,說明抽樣誤差的大小。其值越小,估計總體均數(shù)的可靠性越大計算用途描述資料的頻數(shù)分布狀況,可用于制定醫(yī)學(xué)參考值范圍用于表示抽樣誤差大小、總體均數(shù)的區(qū)間估計和均數(shù)的假設(shè)檢驗等二、二、t t 分布分布(一)(一) t t 分布的概念分布的概念若某一隨機變量若某一隨機變量X X服從總體均數(shù)為服從總體均數(shù)為、總、總體標(biāo)準(zhǔn)差為體標(biāo)準(zhǔn)差為 的正態(tài)分布的正態(tài)分布N(N(, ,2)2)1 ,0(2NXu)1,0(2NXuX 由于樣本均數(shù)服從總體均數(shù)為由于樣本均數(shù)服從總體均數(shù)為、總體標(biāo)、總體標(biāo)準(zhǔn)差為準(zhǔn)差為 的正態(tài)分布的正態(tài)分布N(
10、 N( , ) , ) 2XX, 1XXXtnSSnnmn為計算某一統(tǒng)計量用到的數(shù)據(jù)個數(shù),m為計算該統(tǒng)計量用到其它獨立統(tǒng)計量的個數(shù)。 XXut分布最早由英國統(tǒng)計學(xué)家W.S. Gosset于1908年以“Student”筆名發(fā)表,故又稱Students t-distribution。它的發(fā)現(xiàn),開創(chuàng)了小樣本統(tǒng)計推斷的新紀(jì)元。 總體為N的m個樣本(樣本大小為n)的t值xsxtm個樣本的均數(shù) 標(biāo)準(zhǔn)誤 t值 1x 1xs t1 2x 2xs t2 3x 3xs t3 mx mxs tm t分布的特征:以0為中心的對稱分布;與U分布比,曲線低平;t分布是一簇曲線,形態(tài)與自由度(n-1)有關(guān)。 t分布與標(biāo)準(zhǔn)
11、正態(tài)分布的比較1、二者都是單峰分布,以0為中心左右對稱。2、t分布的峰部較矮而尾部翹得較高說明遠(yuǎn)側(cè)的t值個數(shù)相對較多即尾部面積(概率P值)較大。當(dāng)逐漸增大時,t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布,當(dāng)=時,t分布完全成為標(biāo)準(zhǔn)正態(tài)分布。t 界值表(附表9-1 )t/2,:表示自由度為,雙側(cè)概率P為時t的界值01-12-2-33f(t),05. 0t,05.0tt 界值:界值:自由度的自由度的 t 分布曲線下兩側(cè)尾部面積或單側(cè)尾部面積為指定值分布曲線下兩側(cè)尾部面積或單側(cè)尾部面積為指定值時,橫軸上相應(yīng)的時,橫軸上相應(yīng)的 t 值,值,記為記為 t,。大于。大于或小于或小于某個某個 t 界界值的兩側(cè)尾部面積之和或單
12、側(cè)尾部面積稱為值的兩側(cè)尾部面積之和或單側(cè)尾部面積稱為概率(概率(P) 。 t 界值記法界值記法: t0.05/2,為雙側(cè)為雙側(cè)=0.05 時時的的 t 界值;界值;t0.01/2,為雙側(cè)為雙側(cè)=0.01 時時的的 t 界值。界值。 (u0.05/2=1.96,u0.01/2=2.58) t0.05,為單側(cè)為單側(cè)=0.05 時時的的 t 界值;界值;t0.01,為單側(cè)為單側(cè)=0.01 時時的的 t 界值。界值。 (u0.05=1.645,u0.01=2.326) 05.0Ptt05.0Pttv ,05.0v ,05.0,;, t分布曲線下的面積規(guī)律:中間95%的t值:- t0.05/2, t0.
13、05/2,中間99%的t值:- t0.01/2, t0.01/2,單尾概率:一側(cè)尾部面積雙尾概率:雙側(cè)尾部面積(1)自由度()一定時,p與t成反比;(2)概率(p)一定時,與t成反比;計量資料統(tǒng)計推斷一般包括以下兩個方面:一般包括以下兩個方面: 參數(shù)估計:用樣本指標(biāo)估計總體指標(biāo)參數(shù)估計:用樣本指標(biāo)估計總體指標(biāo) (1) (1)點估計:用樣本均數(shù)直接作為總體均數(shù)的估計值點估計:用樣本均數(shù)直接作為總體均數(shù)的估計值 優(yōu)點優(yōu)點: :簡單簡單 缺點:沒有考慮抽樣誤差缺點:沒有考慮抽樣誤差 (2) (2)區(qū)間估計:常用區(qū)間估計:常用95%95%的可信區(qū)間的可信區(qū)間 假設(shè)檢驗假設(shè)檢驗 三、總體均數(shù)置信區(qū)間的估
14、計三、總體均數(shù)置信區(qū)間的估計 點估計 區(qū)間估計 意義 直接用樣本統(tǒng)計量代替總體均數(shù) 用統(tǒng)計量x和xs確定一個有概率意義的區(qū)間,該區(qū)間具有較大的可信度包含總體均數(shù) 估計方法 以x作為估計值 小樣本(xvstx,xstx,) 大樣本(xsux,xsux) 區(qū)間估計:根據(jù)選定的置信度(或可信度,用概率表示)估計總體參數(shù)所在的范圍。 置信度:估計正確的概率。1- 置信區(qū)間(confidence level, CI): 可信區(qū)間總體均數(shù)的可信區(qū)間 按一定的可信度由樣本均數(shù)計算的總體按一定的可信度由樣本均數(shù)計算的總體均數(shù)可能所在的范圍,這個范圍稱為總體均均數(shù)可能所在的范圍,這個范圍稱為總體均數(shù)的可信區(qū)間。
15、數(shù)的可信區(qū)間。方法:方法:(1) u (1) u 分布法分布法(2) t (2) t 分布法分布法總體均數(shù)的95可信區(qū)間l總體均數(shù)的95可信區(qū)間:從總體中作隨機抽樣,作100次抽樣,每個樣本可算得一個可信區(qū)間,得100個可信區(qū)間,平均有95個可信區(qū)間包括總體均數(shù)(估計正確),只有5個可信區(qū)間不包括總體均數(shù)(估計錯誤)區(qū)間估計公式的推導(dǎo): )()(ttt )()(tsxtx xxstxstx)()( 故小樣本資料的95%CI: (xstx)(05. 0,xstx)(05. 0) 99%CI: (xstx)(01. 0,xstx)(01. 0) 大樣本資料的95%CI: (xsx96. 1,xsx
16、96. 1) 99%CI: (xsx58. 2,xsx58. 2) 區(qū)間估計的準(zhǔn)確度:說對的可能性大小,區(qū)間估計的準(zhǔn)確度:說對的可能性大小, 用用 (1-) 來衡量。來衡量。99%的可信區(qū)間好于的可信區(qū)間好于95%的可信區(qū)間的可信區(qū)間(n, S一定時)一定時) 。區(qū)間估計的精確度:指區(qū)間范圍的寬窄,范圍越寬區(qū)間估計的精確度:指區(qū)間范圍的寬窄,范圍越寬精確度越差。精確度越差。99%的可信區(qū)間差于的可信區(qū)間差于95%的可信區(qū)間的可信區(qū)間(n, S一定時)一定時) 。 準(zhǔn)確度與精確度的關(guān)系:在準(zhǔn)確度確定的情況下,準(zhǔn)確度與精確度的關(guān)系:在準(zhǔn)確度確定的情況下,增加樣本含量可提高精確度。增加樣本含量可提高
17、精確度??尚艆^(qū)間估計的優(yōu)劣可信區(qū)間估計的優(yōu)劣 例:某地抽取正常成年人200名,測得其血清膽固醇均數(shù)為3.64 mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)95%可信區(qū)間。 本例 =3.64、S=1.20、n=200、 =0.0849, =(3.47,3.81)(mmolL) 該地正常成年人血清膽固醇均數(shù)雙側(cè)95%可信區(qū)間為(3.47, 3.81)mmolL。XXS0.05/21.96u3.64 1.96 0.0849, 3.641.96 0.0849 例:隨機抽取某地健康男子18人,測得空腹靜脈血的甘油三酯,均數(shù) 為1.298mmol/L,標(biāo)準(zhǔn)差s為0.663,
18、試估計該地男子空腹靜脈血甘油三酯總體均數(shù)的95置信區(qū)間。 (0.9681.628)x注注意意: (sx96. 1,sx96. 1)與(xsx96. 1,xsx96. 1)的區(qū)別 (sx96. 1,sx96. 1)表示95頻數(shù)分布范圍、正常值范圍; (xsx96. 1,xsx96. 1)表示95可信區(qū)間,該區(qū)間有95的把握包含了總體均數(shù),或總體均數(shù)有95的可能性落在該區(qū)間。 總體均數(shù)可信區(qū)間與參考值范圍的區(qū)別總體均數(shù)可信區(qū)間總體均數(shù)可信區(qū)間參考值范圍參考值范圍含義含義按預(yù)先給定的概率,確定未知參數(shù)按預(yù)先給定的概率,確定未知參數(shù) 的的可能范圍。實際上一次抽樣算得的可信可能范圍。實際上一次抽樣算得的
19、可信區(qū)間要么包含總體均數(shù),要么不包含。區(qū)間要么包含總體均數(shù),要么不包含。95%CI估計錯誤的概率估計錯誤的概率0.05.總體均數(shù)的波動范圍總體均數(shù)的波動范圍“正常人”的解剖,生理,生化某項指標(biāo)的波動范圍。個體值的波動范圍計算計算公式公式 未知:未知: 已知或已知或 未知但未知但n60: 或或正態(tài)分布正態(tài)分布偏態(tài)分布偏態(tài)分布 PX P100X用途用途總體均數(shù)的區(qū)間估計總體均數(shù)的區(qū)間估計絕大多數(shù)絕大多數(shù)(如如95%)觀察對象觀察對象某項指標(biāo)的分布范圍某項指標(biāo)的分布范圍,XXtS XXuXXu SXu S 由樣本信息推斷總體特征,除了參數(shù)估由樣本信息推斷總體特征,除了參數(shù)估計外,還會遇到這樣的問題:
20、計外,還會遇到這樣的問題: 某一樣本均數(shù)是否來自于已知均數(shù)總體?某一樣本均數(shù)是否來自于已知均數(shù)總體?兩個不同樣本均數(shù)是否來自均數(shù)相同的總體兩個不同樣本均數(shù)是否來自均數(shù)相同的總體等?等? 要回答這類問題,更多的是用統(tǒng)計推斷要回答這類問題,更多的是用統(tǒng)計推斷的另一方面的另一方面假設(shè)檢驗假設(shè)檢驗(hypothesis test)(hypothesis test)。第二節(jié)第二節(jié) 假設(shè)檢驗的基本思想和基本步驟假設(shè)檢驗的基本思想和基本步驟觀測到的樣本均數(shù)與總體均數(shù)間或兩樣本均數(shù)間差異的可能原因:1. 總體均數(shù)不同;2. 總體均數(shù)相同,差別由抽樣造成。需要通過統(tǒng)計學(xué)假設(shè)檢驗來判斷。l假設(shè)檢驗的基本思想假設(shè)檢
21、驗的基本思想l l 以一定假設(shè)為前提,通過計算某種以一定假設(shè)為前提,通過計算某種統(tǒng)計量(統(tǒng)計量(t、U、F等)來判斷假設(shè)成立的可等)來判斷假設(shè)成立的可能性大小,如果假設(shè)成立的可能性大,就能性大小,如果假設(shè)成立的可能性大,就接受這個假設(shè);反之,則拒絕這個假設(shè)。接受這個假設(shè);反之,則拒絕這個假設(shè)。假設(shè)檢驗的一般步驟假設(shè)檢驗的一般步驟1.1.建立假設(shè)和設(shè)定檢驗水準(zhǔn)建立假設(shè)和設(shè)定檢驗水準(zhǔn)2.2.無效假設(shè)無效假設(shè)H0H0: ;3.3.備擇假設(shè)備擇假設(shè)H1H1: (雙側(cè)檢驗)(雙側(cè)檢驗) 4.4. 或或 (單側(cè)檢驗)(單側(cè)檢驗)5.5. =0.05=0.056.6. 0000 檢驗水準(zhǔn):過去稱顯著性水準(zhǔn),
22、用表示。是預(yù)先規(guī)定的小概率事件的概率值,為允許結(jié)果出現(xiàn)錯誤的概率,或出現(xiàn)假陽性的概率,常取=0.05或0.01。未未知知總總體體均均數(shù)數(shù) 與與已已知知總總體體均均數(shù)數(shù) 0的的比比較較 目目的的 H0 H1 雙雙側(cè)側(cè)檢檢驗驗 是是否否 0 = 0 0 單單側(cè)側(cè)檢檢驗驗 是是否否 0 是是否否 0 = 0 = 0 0 0 兩兩未未知知總總體體均均數(shù)數(shù) 1與與 2的的比比較較 目目的的 H0 H1 雙雙側(cè)側(cè)檢檢驗驗 是是否否 1 2 1= 2 1 2 單單側(cè)側(cè)檢檢驗驗 是是否否 1 2 是是否否 1 2 1= 2 1= 2 1 2 1 2 2.選擇相應(yīng)統(tǒng)計方法,計算統(tǒng)計量選擇相應(yīng)統(tǒng)計方法,計算統(tǒng)計量
23、3. 兩均數(shù)的差別:兩均數(shù)的差別:t、U檢驗(檢驗(t、U值)值)4. 多個均數(shù)的差別:方差分析(多個均數(shù)的差別:方差分析(F值)值)5. 兩個率的差別:兩個率的差別:2檢驗(檢驗(2值)值)3. 確定確定P值和做出統(tǒng)計推斷值和做出統(tǒng)計推斷 P值是指由值是指由H0所規(guī)定的總體作隨機抽樣,所規(guī)定的總體作隨機抽樣,獲得大于等于和(或)小于等于統(tǒng)計量獲得大于等于和(或)小于等于統(tǒng)計量觀察值的概率。觀察值的概率。0,10,HHH,不拒絕,則,接受,拒絕,則PttPtt若檢驗統(tǒng)計量現(xiàn)有統(tǒng)計量,則P,結(jié)論為按所取的 檢驗水準(zhǔn) ,拒絕 H 0,接受H1,有統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論)??烧J(rèn)為不同或不等(專業(yè)結(jié)論)
24、 若檢驗統(tǒng)計量現(xiàn)有統(tǒng)計量,則P,結(jié)論為按 檢驗水準(zhǔn) ,不拒絕 H 0,無統(tǒng)計學(xué)意義(統(tǒng)計結(jié)論)。尚不能認(rèn)為不同或不等(專業(yè)結(jié)論) 0-1.9601.96095%2.5%2.5%接受域接受域拒絕域拒絕域拒絕域拒絕域假設(shè)檢驗 圖 a 單 側(cè) 檢 驗 ( t 檢 驗 ) 圖 b 雙 側(cè) 檢 驗 ( t 檢 驗 ) )(tf 2/ 2/P 0 t t 不 拒 絕 H0 拒 絕 H0 2/ 2/P t t 拒 絕 H0 )(tf P 0 t t 不 拒 絕 H0 拒 絕 H0 例9.2 某地抽查了26名男性管理人員的空腹血糖,均數(shù) 為4.841mmol/L,標(biāo)準(zhǔn)差s為0.854mmol/L,已知大量調(diào)查
25、的一般健康成年男性空腹靜脈血糖均數(shù)為4.70mmol/L。試問能否認(rèn)為該地抽查的26名健康男性管理人員的空腹血糖均值與一般正常健康成年男性的均值不同?x例例9.21. 建立假設(shè),確定檢驗水準(zhǔn):H0 0 H1 0 0.05 2. 計算檢驗統(tǒng)計量t 值:844. 026/854. 07 . 4841. 4n/Sxsxtx 3. 確定P值,判斷結(jié)果 t0.8440.05 按0.05,不拒絕 H0,不能認(rèn)為健康男性健康管理人員的血糖均數(shù)與一般成年男性的均數(shù)不同。 第三節(jié)第三節(jié) t檢驗和檢驗和u檢驗檢驗l樣本均數(shù)與總體均數(shù)的比較l配對資料的比較l兩個樣本均數(shù)的比較一、小樣本均數(shù)與已知總體均數(shù)比較的一、小
26、樣本均數(shù)與已知總體均數(shù)比較的t t檢驗檢驗 已知的總體均數(shù):一般為理論值、標(biāo)準(zhǔn)值或經(jīng)過大量觀察所得的穩(wěn)定值(0)。 比較的目的:樣本所代表的未知總體均數(shù)與已知的總體均數(shù)0是否不同。 統(tǒng)計量t的計算公式: = n - 10/XtSn例1. 根據(jù)大量調(diào)查,已知健康成年男子脈搏的均數(shù)為72次/分鐘,某護(hù)士在一山區(qū)隨機測量了25名健康成年男子脈搏數(shù),求得其均數(shù)為74.2次/分鐘,標(biāo)準(zhǔn)差為6.5次/分鐘,能否認(rèn)為該山區(qū)成年男子的脈搏數(shù)與一般健康成年男子的脈搏數(shù)不同?建立假設(shè):建立假設(shè): H0:0 H1:0 確定檢驗水準(zhǔn):確定檢驗水準(zhǔn):0.05 計算計算 t值:值: 692. 125/5 . 6722 .
27、74n/sxsxtx,=n-1=25-1=24 確定確定 P 值:值: t1.6920.05。 (t界值表見界值表見 P178) 推斷結(jié)論:推斷結(jié)論:在在0.05 的水準(zhǔn)上, 不拒絕的水準(zhǔn)上, 不拒絕 H0,即根據(jù)本資料,即根據(jù)本資料還不能認(rèn)為此山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子還不能認(rèn)為此山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子不同。不同。 l例2. 已知一般無肝腎疾患的健康人群尿素氮均值為4.882(mmol/L),16名脂肪肝患者的尿素氮(mmol/L)測定值為5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4
28、.37,4.59,5.18,6.96。問脂肪肝患者尿素氮測定值的均數(shù)是否高于健康人?1n,sxtx二、配對資料的二、配對資料的t檢驗檢驗l配對設(shè)計:l同一受試對象處理前后的比較或不同部位測定值的比較,目的是推斷這種處理有無作用(測定值相互獨立);l同一樣品用兩種不同方法測定,目的是比較不同的測試方法之間有無差別;l成對設(shè)計,每個對子中的兩個受試對象分別接受不同處理,目的是推斷兩種處理的效果有無差別。 配對t檢驗實質(zhì)同單樣本t檢驗。 若兩處理效應(yīng)相同,即1=2,則12=0(當(dāng)成已知總體0)。 差值的樣本均數(shù)所代表的未知總體均數(shù)d與已知總體均數(shù)0=0的比較。0, 1dddddddtnSSnSn表
29、1. 10 名矽肺患者克矽平治療前后血紅蛋白含量((g/L) 病人編號 治療前 治療后 差數(shù),d d2 1 140 113 27 729 2 138 150 -12 144 3 140 150 -10 100 4 135 135 0 0 5 135 128 7 49 6 120 100 20 400 7 147 110 37 1369 8 114 120 -6 36 9 138 130 8 64 10 120 123 -3 9 合計 68 2900 建立假設(shè): H0:該藥不影響血紅蛋白的變化,d0 H1:該藥影響血紅蛋白的變化,d0 確定檢驗水準(zhǔn):0.05 計算 t 值: 303. 110/5
30、 .168 . 6n/sds0dtdd 確定 P 值:t1.3030.05 推斷結(jié)論:在0.05 的水準(zhǔn)上,不拒絕 H0,故不能認(rèn)為克矽平治療矽肺患者會引起血紅蛋白的變化。 三、兩個樣本均數(shù)的比較三、兩個樣本均數(shù)的比較l目的:由兩個樣本均數(shù)的差別推斷兩樣本目的:由兩個樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無差別。所代表的總體均數(shù)間有無差別。 1.兩個大樣本均數(shù)的比較(兩組兩個大樣本均數(shù)的比較(兩組n均大于均大于50)2. 3. 4. 222121212221212121nsnsxxssxxsxxuxxxx 例9.5 某地隨機抽取正常男性264名,測得空腹血中膽固醇的均數(shù)為4.404mmo
31、l/L,標(biāo)準(zhǔn)差為1.169mmol/L;隨機抽取正常女性160名,測得空腹血中膽固醇的均數(shù)為4.288mmol/L,標(biāo)準(zhǔn)差為1.106mmol/L,問男、女膽固醇濃度有無差別?2.兩個小樣本均數(shù)的比較兩個小樣本均數(shù)的比較成組資料的樣本例數(shù),各組樣本例數(shù)可相同,也可不同。 2nn,sxxt21xx2121 2121121nnSscxx 211212222112nnsnsnSc 2cS 為合并方差,21xxs為兩均數(shù)差數(shù)的標(biāo)準(zhǔn)誤。 例3. 某克山病地區(qū)抽樣測得11例急性克山病患者和13名健康人的血磷值(mmol/L)如下,問該地急性克山病患者與健康人的血磷值是否不同? 患 者 X1:0.84 1.
32、05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人 X2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 建立假設(shè):建立假設(shè):H0:該地急性克山病患者與健康人的血磷值相同該地急性克山病患者與健康人的血磷值相同,即即12 H1:該地急性克山病患者與健康人的血磷值不同,即該地急性克山病患者與健康人的血磷值不同,即12 確定檢驗水準(zhǔn):確定檢驗水準(zhǔn):0.05 計算計算 t 值:值: 22,522. 21729. 0085. 1521. 12121xxsxxt 確定確定
33、P 值:值:t2.522t0.05,22=2.074,P,說明處理因素有統(tǒng)計,說明處理因素有統(tǒng)計學(xué)意義。學(xué)意義。 用用 F 統(tǒng)計量比較兩個方差的假設(shè)檢驗稱統(tǒng)計量比較兩個方差的假設(shè)檢驗稱為為F檢驗。檢驗。F統(tǒng)計量服從統(tǒng)計量服從F分布,有兩個自由分布,有兩個自由度,即兩個均方相應(yīng)的自由度。度,即兩個均方相應(yīng)的自由度。 總變異的分解總變異的分解組間變異組間變異總變異總變異組內(nèi)變異組內(nèi)變異方差分析應(yīng)用條件1 1、各樣本來自正態(tài)或接近正態(tài)的總體、各樣本來自正態(tài)或接近正態(tài)的總體2 2、各樣本為相互獨立的隨機樣本、各樣本為相互獨立的隨機樣本3 3、各樣本所來自的總體方差相等、各樣本所來自的總體方差相等單因素
34、方差分析也稱完全隨機設(shè)計的方差分析也稱完全隨機設(shè)計的方差分析單因素方差分析lSS總 = SS組間 + SS組內(nèi)l總 = 組間 + 組內(nèi)l總 = N-1 組間=k-1 組內(nèi)=N - k總組內(nèi)組間2222222()SS =() =()SS=() =SS()ijijijijijijijjijiijijijiiiiixxxxNxxxxnn xx單因素方差分析表單因素方差分析表變異來源變異來源SSSS MSMSF FP P總總 N-1 N-1組間組間 K-1 K-1SSSS組間組間/ /組間組間 MS MS組間組間/MS/MS組組內(nèi)內(nèi)組內(nèi)組內(nèi)( (誤差誤差) )SSSS總總-SS-SS組組間間 N-k
35、N-kSSSS組內(nèi)組內(nèi)/ /組內(nèi)組內(nèi)2ijijxC2()ijjiixCn 例例9.7 9.7 隨機抽取隨機抽取50-5950-59歲男性正常者、冠心歲男性正常者、冠心病人、脂肪肝患者病人、脂肪肝患者1111人,測定空腹血糖值見人,測定空腹血糖值見表表9-39-3,試推斷三類人群總體均值是否相同。,試推斷三類人群總體均值是否相同。組內(nèi)組間組間組間組間組間組間組內(nèi)組內(nèi)組內(nèi)組內(nèi)組內(nèi)總MSMSF/SSMS1k,)xx(nSS/SSMSkN,xxSSxxSS2iii2ijiij2ijij 經(jīng)方差分析后各組均數(shù)間的差別有統(tǒng)計學(xué)意義時,只說明幾個組的總體均數(shù)不同或不全相同。若要進(jìn)一步了解哪兩個組間的總體均數(shù)
36、不同,應(yīng)進(jìn)行多個樣本均數(shù)間的兩兩比較又稱多重比較(multiple comparison)。 多個樣本均數(shù)間的兩兩比較不能直接用兩均數(shù)比較的t檢驗,因其會增加類錯誤的概率。多個樣本均數(shù)間的兩兩比較多個樣本均數(shù)間的兩兩比較l為什么不能用t檢驗或U檢驗?l l 如有4個樣本均數(shù),兩兩組合數(shù)為6,若用t檢驗作6次比較,且每次比較的檢驗水準(zhǔn)為0.05,則每次比較不犯類錯誤的概率為(1-0.05)=0.95,6次均不犯類錯誤的概率為0.956,這時總的檢驗水準(zhǔn)為1-0.956=0.26,比0.05大多了,因此多重比較不能用兩樣本均數(shù)比較的t檢驗。l 多個樣本均數(shù)間兩兩比較的方法有:lSNK-q檢驗(適用
37、于任意兩組間的兩兩比較)lLSD-t檢驗(適用于一對或幾對臨床上有特殊意義的兩組間比較)lDunnett-t檢驗(適用于多個實驗組與一個對照組的兩組間比較)多個樣本均數(shù)間兩兩比較的多個樣本均數(shù)間兩兩比較的q檢驗(檢驗(SNK法)法)l首先將所比較的組均數(shù)按從大到小的順序排列,標(biāo)上秩次(均數(shù)序次);均數(shù)5.715.064.61秩次123組別脂肪肝組冠心病組正常組)(誤差BAxxxxBAn1n12MSSSxxqBABA方差分析與方差分析與t t檢驗的關(guān)系檢驗的關(guān)系 當(dāng)比較兩個均數(shù)時,從同一資料算得當(dāng)比較兩個均數(shù)時,從同一資料算得之之 F 值與值與t值有如下關(guān)系:值有如下關(guān)系:F = t2 可見在兩
38、組均數(shù)比較時,方差分析可見在兩組均數(shù)比較時,方差分析與與t檢驗的效果是完全一樣的。檢驗的效果是完全一樣的。假設(shè)檢驗中的兩類錯誤假設(shè)檢驗中的兩類錯誤 假設(shè)檢驗采用小概率反證法的思想,根據(jù)樣本假設(shè)檢驗采用小概率反證法的思想,根據(jù)樣本統(tǒng)計量作出的推斷結(jié)論具有概率性,因此其結(jié)論統(tǒng)計量作出的推斷結(jié)論具有概率性,因此其結(jié)論不可能完全正確,可能發(fā)生下面兩類錯誤不可能完全正確,可能發(fā)生下面兩類錯誤: : 錯誤:拒絕了實際上是成立的錯誤:拒絕了實際上是成立的H0H0,犯,犯“棄真棄真”的的錯誤。其概率大小用錯誤。其概率大小用 表示表示, , 可取單側(cè)亦可可取單側(cè)亦可取雙側(cè)。取雙側(cè)。錯誤:不拒絕實際上是不成立的錯
39、誤:不拒絕實際上是不成立的H0H0,其概率大小,其概率大小用用表示。表示。 只取單側(cè),其大小一般未知,只有只取單側(cè),其大小一般未知,只有在已知兩總體差值在已知兩總體差值, 及及 n n 時,才能估算出時,才能估算出來。來。 第五節(jié)第五節(jié) 假設(shè)檢驗中的兩類錯誤及應(yīng)注意的問題假設(shè)檢驗中的兩類錯誤及應(yīng)注意的問題 可可能能發(fā)發(fā)生生的的兩兩類類錯錯誤誤 假設(shè)檢驗的結(jié)果 客觀實際 拒絕 H0 不拒絕 H0 H0成立 I 型錯誤() 推斷正確(1) H0不成立即 H1成立 推斷正確(1) II 型錯誤() 錯誤與錯誤與錯誤的定義如下表:錯誤的定義如下表: A B D C 判斷正確 (1) 1 0 1 1 判斷錯誤(型錯誤,) 判斷錯誤(型錯誤,) 判斷正確(1) 圖 型錯誤與錯誤的關(guān)系(以單側(cè)檢驗為例)不拒絕H0,假設(shè)檢驗的結(jié)果 拒絕H0 引申的幾個概念:引申的幾個概念:錯誤與錯誤與錯誤的關(guān)系:錯誤的關(guān)系: 愈小,愈小, 愈大;反愈大;反 之之 愈大,愈大, 愈小。若要同時減小愈小。若要同時減小
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中層管理人員能力培訓(xùn)
- 2025下半年心理健康調(diào)查報告
- 內(nèi)科雜病調(diào)理方案
- 污染因子試題及答案
- java面試題及答案大數(shù)據(jù)解決方案
- 電子閱讀面試題及答案
- 英語二級試題及答案
- 2025年金融行業(yè)人工智能倫理風(fēng)險分析與監(jiān)管政策研究
- 交通流量預(yù)測在智慧景區(qū)管理中的應(yīng)用報告
- 電子制造業(yè)2025年工業(yè)污染源達(dá)標(biāo)排放指南報告
- 生產(chǎn)車間5S培訓(xùn)教材
- 課題申報書:AI賦能高校輔導(dǎo)員能力提升的路徑研究
- 【MOOC期末】《中國哲學(xué)》(北京師范大學(xué)) 期末中國大學(xué)慕課答案
- GB/T 18916.65-2024工業(yè)用水定額第65部分:飲料
- 整本書閱讀:《鄉(xiāng)土中國》(考教銜接講義)-2025年高考語文一輪復(fù)習(xí)(新教材新高考)
- 護(hù)理新技術(shù)項目匯報
- DL T596《電力設(shè)備預(yù)防性實驗規(guī)程》知識培訓(xùn)
- DB11T 594.1-2017 地下管線非開挖鋪設(shè)工程施工及驗收技術(shù)規(guī)程 第1部分:水平定向鉆施工
- 2024低空航行系統(tǒng)白皮書:擁抱低空經(jīng)濟安全智慧飛行
- 高中生禁毒教育主題班會教學(xué)課件
- 財政投資項目評審服務(wù)投標(biāo)方案(技術(shù)方案)
評論
0/150
提交評論