醫(yī)學(xué)統(tǒng)計(jì)學(xué)抽樣誤差均數(shù)估計(jì)_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)抽樣誤差均數(shù)估計(jì)_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)抽樣誤差均數(shù)估計(jì)_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)抽樣誤差均數(shù)估計(jì)_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)抽樣誤差均數(shù)估計(jì)_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、抽樣誤差、參數(shù)估計(jì)抽樣誤差、參數(shù)估計(jì)Sampling error and Parameter estimation易洪剛易洪剛Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University主要內(nèi)容主要內(nèi)容n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n 2 分布分布nF分布分布 n參數(shù)估計(jì)參數(shù)估計(jì)1. 抽樣誤差抽樣誤差 Sampling error n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì)了解抽

2、樣誤差的重要性了解抽樣誤差的重要性總體同質(zhì)、個體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣樣本統(tǒng)計(jì)量已知統(tǒng)計(jì)推斷風(fēng) 險(xiǎn)抽樣誤差抽樣誤差nsampling error,sampling variabilityn 由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差別。差別。n 原因:個體變異抽樣原因:個體變異抽樣n 表現(xiàn):表現(xiàn):樣本統(tǒng)計(jì)量與總體參數(shù)間的差別樣本統(tǒng)計(jì)量與總體參數(shù)間的差別不同樣本統(tǒng)計(jì)量間的差別不同樣本統(tǒng)計(jì)量間的差別n 抽樣誤差是不可避免的!抽樣誤差是不可避免的!n 抽樣誤差是有規(guī)律的!抽樣誤差是有規(guī)律的! n假設(shè)一個已知總體,從該總體中抽樣,對每假設(shè)一個已知總

3、體,從該總體中抽樣,對每個樣本計(jì)算樣本統(tǒng)計(jì)量個樣本計(jì)算樣本統(tǒng)計(jì)量(均數(shù)、方差等均數(shù)、方差等),觀察,觀察樣本統(tǒng)計(jì)量的分布規(guī)律樣本統(tǒng)計(jì)量的分布規(guī)律抽樣分布規(guī)律。抽樣分布規(guī)律。q正態(tài)分布總體正態(tài)分布總體q偏三角分布總體偏三角分布總體q均勻分布總體均勻分布總體q指數(shù)分布總體指數(shù)分布總體q雙峰分布總體雙峰分布總體均數(shù)的模擬試驗(yàn)均數(shù)的模擬試驗(yàn)均數(shù)的模擬試驗(yàn)均數(shù)的模擬試驗(yàn)n考察考察:q樣本均數(shù)的均數(shù)樣本均數(shù)的均數(shù)與與總體均數(shù)總體均數(shù)有何關(guān)系?有何關(guān)系?q樣本均數(shù)的標(biāo)準(zhǔn)差樣本均數(shù)的標(biāo)準(zhǔn)差與與總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差有何關(guān)系?有何關(guān)系?q樣本均數(shù)的分布樣本均數(shù)的分布形狀如何?形狀如何?q不同的樣本含量對上述性質(zhì)的

4、影響如何?不同的樣本含量對上述性質(zhì)的影響如何?q 昆明治療羊角風(fēng)昆明治療羊角風(fēng)http:/ 昆明軍海癲癇病醫(yī)院昆明軍海癲癇病醫(yī)院http:/ 昆明治療羊角風(fēng)昆明治療羊角風(fēng)http:/ 昆明癲癇病專科醫(yī)院昆明癲癇病??漆t(yī)院http:/ = 5.0 = 0.5樣本含量樣本含量n =10抽樣次數(shù)抽樣次數(shù)m =100 =5.19 S =0.42x =5.04 S = 0.44x紅細(xì)胞計(jì)數(shù) =5.03 S =0.52xFractionx2.5 2.8 3.1 3.4 3.744.3 4.6 4.9 5.2 5.5 5.8 6.1 6.4 6.777.3 7.6 .3圖圖 正態(tài)分布正態(tài)分布

5、N(5.00,0.502)總體分布總體分布表表4、1 N(5.00,0.502)總總體體中中11個個隨隨機(jī)機(jī)樣樣本本的的數(shù)數(shù)據(jù)據(jù)(n=10)結(jié)論結(jié)論 1n各樣本均數(shù)未必等于總體均數(shù);各樣本均數(shù)未必等于總體均數(shù);n樣本均數(shù)間存在差異;樣本均數(shù)間存在差異; 由抽樣實(shí)驗(yàn)所得的由抽樣實(shí)驗(yàn)所得的100個樣本作出其均數(shù)個樣本作出其均數(shù) 分分布直方圖如圖布直方圖如圖4.1。曲線是對抽樣得到的。曲線是對抽樣得到的100個個 數(shù)據(jù)擬合的分布曲線。數(shù)據(jù)擬合的分布曲線。 XFraction2.5 2.8 3.1 3.4 3.744.3 4.6 4.9 5.2 5.5 5.8 6.1 6.4 6.777.3 7.6

6、..7.8.91圖圖 從正態(tài)分布從正態(tài)分布N(5.00,0.502)總體中抽樣)總體中抽樣樣本均數(shù)的分布樣本均數(shù)的分布 x圖圖 從正態(tài)分布從正態(tài)分布N(5.00,0.502)總體中抽樣)總體中抽樣樣本均數(shù)的分布樣本均數(shù)的分布 Fraction.4.5x結(jié)論結(jié)論2n 的分布很有規(guī)律,圍繞著的分布很有規(guī)律,圍繞著 ,中間多,兩,中間多,兩邊少,左右基本對稱邊少,左右基本對稱; ;n樣本均數(shù)的變異范圍較之原變量的變異范圍樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小;大大縮小;X2.中心極限定理中心極限定理 centr

7、al limit theorem n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì)中心極限定理中心極限定理(central limit theorem) (一)(一)從均數(shù)為從均數(shù)為 、標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為 的正態(tài)總體中,的正態(tài)總體中,獨(dú)立隨機(jī)抽取例數(shù)為獨(dú)立隨機(jī)抽取例數(shù)為n n的樣本,樣本均數(shù)的樣本,樣本均數(shù) 的分布服從正態(tài)分布;的分布服從正態(tài)分布;樣本均數(shù)樣本均數(shù)的均數(shù)為的均數(shù)為 ; ;樣本均數(shù)樣本均數(shù)的的標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為 。X xn 中心極限定理中心極限定理 (二)(二)從非正態(tài)從非正態(tài)(nonnormal)分布總體分布總體(均數(shù)為均數(shù)為,方差為方差為)中

8、隨機(jī)抽樣中隨機(jī)抽樣(每個樣本的含量為每個樣本的含量為n),可,可得無限多個樣本,每個樣本計(jì)算樣本均數(shù),則得無限多個樣本,每個樣本計(jì)算樣本均數(shù),則只要樣本含量足夠大只要樣本含量足夠大(n50),樣本均數(shù)也近似服樣本均數(shù)也近似服從正態(tài)分布。從正態(tài)分布。樣本均數(shù)樣本均數(shù)的均數(shù)為的均數(shù)為 ;樣本均數(shù)樣本均數(shù)的標(biāo)準(zhǔn)差為的標(biāo)準(zhǔn)差為 。 xn 3.標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤 standard error n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì)標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤(standard error)n樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤。樣本均數(shù)的樣本均數(shù)的標(biāo)準(zhǔn)標(biāo)準(zhǔn)

9、差差稱為均數(shù)的標(biāo)準(zhǔn)誤。稱為均數(shù)的標(biāo)準(zhǔn)誤。n均數(shù)的標(biāo)準(zhǔn)誤表示均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的變異度樣本均數(shù)的變異度。n當(dāng)總體標(biāo)準(zhǔn)差未知時,用樣本方差代替,當(dāng)總體標(biāo)準(zhǔn)差未知時,用樣本方差代替,n前者稱為理論標(biāo)準(zhǔn)誤,后者稱為樣本標(biāo)準(zhǔn)誤。前者稱為理論標(biāo)準(zhǔn)誤,后者稱為樣本標(biāo)準(zhǔn)誤。 xn xssn與樣本含量的關(guān)系與樣本含量的關(guān)系nn 越大,越大,均數(shù)的均數(shù)均數(shù)的均數(shù)就越接近總體均數(shù);就越接近總體均數(shù);nn 越大,變異越小,分布越窄;越大,變異越小,分布越窄;n對稱分布接近正態(tài)分布的速度,大于非對稱對稱分布接近正態(tài)分布的速度,大于非對稱分布。分布越偏,接近正態(tài)分布所需樣本含分布。分布越偏,接近正態(tài)分布所需樣本含量

10、就越大。量就越大。與標(biāo)準(zhǔn)差的關(guān)系與標(biāo)準(zhǔn)差的關(guān)系1、意義上、意義上n標(biāo)準(zhǔn)差描述個體值之間的變異,即觀察值間的離散程度;標(biāo)準(zhǔn)差描述個體值之間的變異,即觀察值間的離散程度;n而標(biāo)準(zhǔn)誤是描述統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量和總體而標(biāo)準(zhǔn)誤是描述統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量和總體參數(shù)的接近程度;參數(shù)的接近程度;2、用途上、用途上n標(biāo)準(zhǔn)差常用于表現(xiàn)觀察值的波動范圍;標(biāo)準(zhǔn)差常用于表現(xiàn)觀察值的波動范圍;n標(biāo)準(zhǔn)誤常表示抽樣誤差的大小,估計(jì)總體參數(shù)可信區(qū)間。標(biāo)準(zhǔn)誤常表示抽樣誤差的大小,估計(jì)總體參數(shù)可信區(qū)間。3、與樣本含量、與樣本含量n標(biāo)準(zhǔn)差是隨著樣本含量的增多,逐漸趨于穩(wěn)定。標(biāo)準(zhǔn)差是隨著樣本含量的增多,逐漸趨于穩(wěn)定

11、。n標(biāo)準(zhǔn)誤是隨著樣本含量的增多,逐漸減少。標(biāo)準(zhǔn)誤是隨著樣本含量的增多,逐漸減少。區(qū)別區(qū)別與標(biāo)準(zhǔn)差的關(guān)系與標(biāo)準(zhǔn)差的關(guān)系n首先,標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤都是變異指標(biāo),說明個體首先,標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)誤都是變異指標(biāo),說明個體之間的變異用標(biāo)準(zhǔn)差,說明統(tǒng)計(jì)量之間的變異用之間的變異用標(biāo)準(zhǔn)差,說明統(tǒng)計(jì)量之間的變異用標(biāo)準(zhǔn)誤。標(biāo)準(zhǔn)誤。n其次,當(dāng)樣本含量不變時,標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤亦其次,當(dāng)樣本含量不變時,標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤亦越大,均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。越大,均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。聯(lián)系聯(lián)系4. t分布分布 t-distribution n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì)正

12、態(tài)分布的標(biāo)準(zhǔn)化變化正態(tài)分布的標(biāo)準(zhǔn)化變化n若若 X N(,) , 則則 。 (0,1)XN n因因 ,則則 。 (0,1)XXuN XXN( ,) 從正態(tài)分布總體中1000次抽樣的 u 值的分布(n=4)Fractionu-4-3-2-1012340.0均數(shù)為 0.007559標(biāo)準(zhǔn)差為 1.006294 t 分布的概念分布的概念n實(shí)際工作中,總體方差未知。所以,用樣本實(shí)際工作中,總體方差未知。所以,用樣本方差代替總體方差,方差代替總體方差,n此時此時 的分布如何?的分布如何?XXs 從正態(tài)分布總體中1000次抽樣的 值的分布(n=4)Fractiont-8-6-4-2024680

13、.0.25.3.35均數(shù)為 0.05696標(biāo)準(zhǔn)差為 1.55827 XXs t 分布的概念分布的概念n用樣本方差代替總體方差,此時用樣本方差代替總體方差,此時不服從正態(tài)分布不服從正態(tài)分布。 XXs n1908年,年,W.S.Gosset (1876-1937)以筆名以筆名Student發(fā)表了著名的發(fā)表了著名的t分布,證明了:分布,證明了:n設(shè)從正態(tài)分布設(shè)從正態(tài)分布N( , 2)中隨機(jī)抽取含量為中隨機(jī)抽取含量為n的樣本,的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為樣本均數(shù)和標(biāo)準(zhǔn)差分別為 和和s,設(shè):,設(shè):XXXts則則t值服從自由度為值服從自由度為n-1的的t分布分布(t-distributi

14、on)。t 分布的概念分布的概念(1)nXXtts 記為:記為:圖圖 自由度分別為自由度分別為1、5、時的時的t分布分布t分布圖形分布圖形 f(t) =(標(biāo)準(zhǔn)正態(tài)曲線標(biāo)準(zhǔn)正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.3t分布的特征分布的特征nt分布是一簇曲線,當(dāng)分布是一簇曲線,當(dāng)不同時,曲線形狀不同;不同時,曲線形狀不同;n單峰分布,以單峰分布,以0為中心,左右對稱;為中心,左右對稱;n當(dāng)當(dāng)逼近逼近時,時,t分布逼近分布逼近u分布分布,故標(biāo)準(zhǔn)正態(tài)分布故標(biāo)準(zhǔn)正態(tài)分布是是t分布的特例分布的特例;nt分布曲線下面積是有規(guī)律的。分布曲線下面積是有規(guī)律的。請看演示請看演示t 分布分布t

15、界值表界值表n表上陰影部分,表示表上陰影部分,表示t , 以外的尾部面積占總面積百分?jǐn)?shù),即以外的尾部面積占總面積百分?jǐn)?shù),即概率概率P。n表中數(shù)據(jù)表示表中數(shù)據(jù)表示 與與 確定時相應(yīng)的確定時相應(yīng)的t界值(界值(critical value),常記為),常記為t , 。-t0t抽樣抽樣總體總體樣本樣本t1t2t3t4tn-3tn-2tn-1tn統(tǒng)計(jì)量統(tǒng)計(jì)量分布分布t分布表明,從正態(tài)分布總體中隨機(jī)抽取的樣本,由分布表明,從正態(tài)分布總體中隨機(jī)抽取的樣本,由樣本計(jì)算的樣本計(jì)算的t值接近值接近0的可能性較大,遠(yuǎn)離的可能性較大,遠(yuǎn)離0的可能性的可能性較小。較小。 XXtsn例如,當(dāng)例如,當(dāng) =10,單尾概率,

16、單尾概率 =0.05時,查表時,查表得單尾得單尾t0.05,10=1.812,則:,則:nP(t-1.812)=0.05n或或P(t1.812)=0.05表明:表明:按按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為量為n=11的樣本,則由該樣本計(jì)算的的樣本,則由該樣本計(jì)算的t值大于等于值大于等于1.812的的概率為概率為0.05,或者小于等于,或者小于等于-1.812的概率亦為的概率亦為0.05。-1.81200.050.051.812例如,當(dāng)例如,當(dāng) =10,雙尾概率,雙尾概率 =0.05時,查表得時,查表得雙尾雙尾t0.05,102.228,則:,則:

17、 P(t-2.228)+P(t2.228)0.05或:或:P(-2.228t2.228)=1-0.05=0.95。表明:表明:按按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為量為n=11的樣本,則由該樣本計(jì)算的的樣本,則由該樣本計(jì)算的t值大于等于值大于等于2.228的概率為的概率為0.025,小于等于,小于等于-2.228的概率亦為的概率亦為0.025。-2.22800.0250.0252.228n單尾:單尾:P(t- t , )= ,或,或P(tt , )= n雙尾:雙尾:P(t- t /2, )+P(tt /2, )= , 即即P(-t /2, t t

18、 /2, )=1- -t0tt分布曲線下面積規(guī)律分布曲線下面積規(guī)律5. 2分布分布 chi-distribution n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì) 2 分布分布 n設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 和s,設(shè):n2值服從自由度為n-1的2分布(2-distribution) 222) 1(sn X=4=3=520246810120.00.40.5f(2)=1=2=6 2 分布 請看演示請看演示 2 2 分布分布2分布的特征 n(1) 2分布為一簇單峰正偏態(tài)分布曲線 ;隨的逐漸加大,分

19、布趨于對稱。n(2) 自由度為的2分布,其均數(shù)為,方差為2。n(3) 自由度為的2分布實(shí)際上是個標(biāo)準(zhǔn)正態(tài)分布變量之平方和。 2=u12+ u22+ uv2 3.840.050.0250.0251.96-1.962分布與正態(tài)分布的關(guān)系n(4) 每一自由度下的2分布曲線都有其自身分布規(guī)律。自由度為自由度為1的的 2分布界值分布界值0.040.05n2分布是方差的抽樣分布。 n2分布說明,從正態(tài)分布的總體中隨機(jī)抽樣,所得樣本的方差s2接近于總體方差2的可能性大,遠(yuǎn)離總體方差的可能性小。n即2值接近其均數(shù)n-1的可能性大,遠(yuǎn)離n-1的可能性小。2分布的特征 n自由度

20、10時,20.025,1020.48,20.975,103.25。n從正態(tài)分布的總體中隨機(jī)抽樣,得到的樣本其2值大于等于20.48的概率為0.025,小于等于3.25的概率亦為0.025。nP( 23.25)+P( 220.48)0.05 2分布的特征 n2分布近似描述具有某種屬性的實(shí)際頻數(shù)Ai與理論頻數(shù)Ti之間的抽樣誤差 iiiTTA22)(6. F分布分布 F-distribution n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì)F分布分布 n設(shè)從兩個方差相等的正態(tài)分布設(shè)從兩個方差相等的正態(tài)分布N( 1, 2)和和N( 2, 2)總體中隨機(jī)抽取含量

21、分別為總體中隨機(jī)抽取含量分別為n1和和n2的的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 、s1和和 和和s2。設(shè):設(shè):n則則F值服從自由度為值服從自由度為(n1-1,n2-1)的的F分布分布(F-distribution)。 1X2X2221ssF F分布的特征 n(1) F分布為一簇單峰正偏態(tài)分布曲線,與兩個自由分布為一簇單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。度有關(guān)。 n(2) 若若F服從自由度為服從自由度為( 1, 2)的的F分布,則其倒數(shù)分布,則其倒數(shù)1/F服服從自由度為從自由度為( 2, 1)的的F分布。分布。n(3) 自由度為自由度為( 1, 2)的的F分布,其均數(shù)為

22、分布,其均數(shù)為 2/( 2-2),與,與第一自由度無關(guān)。第一自由度無關(guān)。n(4) 第一自由度第一自由度 11時,時,F(xiàn)分布實(shí)際上是分布實(shí)際上是t分布之平方;分布之平方;第二自由度第二自由度 2時,時,F(xiàn)分布實(shí)際上等于分布實(shí)際上等于 2分布。分布。 請看演示請看演示F分布分布n(5) 每一對自由度下的每一對自由度下的F分布曲線下的面積分分布曲線下的面積分布規(guī)律。布規(guī)律。 PFF分布的特征分布的特征 nF分布表明,從兩個方差相等的正態(tài)分布總體分布表明,從兩個方差相等的正態(tài)分布總體中隨機(jī)抽取含量分別為中隨機(jī)抽取含量分別為n1和和n2的樣本,計(jì)算所的樣本,計(jì)算所得得F值,應(yīng)接近值,應(yīng)接近v2/(v2-

23、2)。nF(0.05;20,20)= 2.12表示,從方差相等的正態(tài)分布表示,從方差相等的正態(tài)分布總體中隨機(jī)抽取總體中隨機(jī)抽取n1=n2=21的樣本,則由兩樣的樣本,則由兩樣本計(jì)算的本計(jì)算的F值大于等于值大于等于2.12的可能性為的可能性為0.025,而小于而小于1/2.12=0.4717的可能性亦為的可能性亦為0.025。 F分布的特征 F分布的特征 樣本統(tǒng)計(jì)量的抽樣分布樣本統(tǒng)計(jì)量的抽樣分布任何一個樣本統(tǒng)計(jì)量均有其分布規(guī)律。任何一個樣本統(tǒng)計(jì)量均有其分布規(guī)律。從正態(tài)分布總體中抽樣:從正態(tài)分布總體中抽樣:n均數(shù)的抽樣分布為正態(tài)分布;均數(shù)的抽樣分布為正態(tài)分布;n樣本方差的分布服從樣本方差的分布服從

24、 2分布;分布;n樣本方差之比服從樣本方差之比服從F分布;分布;nt 值服從值服從 t 分布;分布;n7.參數(shù)估計(jì)參數(shù)估計(jì) Parameter estimation n抽樣誤差抽樣誤差n中心極限定理中心極限定理n標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤n分布分布n參數(shù)估計(jì)參數(shù)估計(jì)1 ) 統(tǒng)計(jì)推斷的思路統(tǒng)計(jì)推斷的思路總體總體個體、個體變異個體、個體變異總體參數(shù)總體參數(shù)未知未知樣本樣本代表性、抽樣誤差代表性、抽樣誤差隨機(jī)隨機(jī)抽樣抽樣樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量已知已知統(tǒng)計(jì)統(tǒng)計(jì) 推斷推斷風(fēng)風(fēng) 險(xiǎn)險(xiǎn)2) 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷(statistical inference)n總體參數(shù)的估計(jì)總體參數(shù)的估計(jì)(parameter estimation

25、)n假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(hypothesis test)3) 參數(shù)的估計(jì)參數(shù)的估計(jì)n點(diǎn)估計(jì)點(diǎn)估計(jì) (point estimation)n區(qū)間估計(jì)區(qū)間估計(jì)(interval estimation)按一定的概率或可信度按一定的概率或可信度(1- )用一個區(qū)間估計(jì)總體參數(shù)用一個區(qū)間估計(jì)總體參數(shù)所在范圍。這個范圍稱作可信度為所在范圍。這個范圍稱作可信度為1- 的可信區(qū)間的可信區(qū)間(confidence interval, CI),又稱置信區(qū)間。,又稱置信區(qū)間?!纠纠?.1】隨機(jī)抽取】隨機(jī)抽取12名口腔癌患者,檢測其發(fā)名口腔癌患者,檢測其發(fā)鋅含量,得鋅含量,得 =253.05 g/g =27.18 g/

26、g 求發(fā)鋅含量總體均數(shù)求發(fā)鋅含量總體均數(shù)95的可信區(qū)間。的可信區(qū)間。XXs4)例題:例題:發(fā)鋅含量t 值的分布值的分布n理論基礎(chǔ):理論基礎(chǔ):t值的抽樣分布值的抽樣分布-2.201 0 2.201v11( 2.2012.201)0.95Pt0.0250.025區(qū)間估計(jì):區(qū)間估計(jì):253.05( 2.2012.201)0.9527.18P ( 2.201 27.18253.052.201 27.18)0.95P (253.052.201 27.18253.052.201 27.18)0.95P (193.23321.87)0.95P ( 2.2012.201)0.95Pt可信區(qū)間可信區(qū)間(conf

27、idence interval):n區(qū)間區(qū)間193.23321.87( g/g)包含了總體均數(shù),包含了總體均數(shù),其可信度其可信度(confidence level)為為95%。n結(jié)論:口腔癌患者發(fā)鋅含量總體均數(shù)為結(jié)論:口腔癌患者發(fā)鋅含量總體均數(shù)為193.23321.87( g/g)(可信度為可信度為95%)。n或:口腔癌患者發(fā)鋅含量總體均數(shù)的或:口腔癌患者發(fā)鋅含量總體均數(shù)的95可可信區(qū)間為:信區(qū)間為: 193.23321.87( g/g)。5)均數(shù)的均數(shù)的(1- )100%可信區(qū)間可信區(qū)間構(gòu)建方法構(gòu)建方法,()1Pttt -t, v 0 t, v 1- /2 /2,()P tt 1)(,ttt

28、P1)(,XXstXstXPXsXt5)均數(shù)的均數(shù)的(1- )100%可信區(qū)間可信區(qū)間構(gòu)建方法構(gòu)建方法5)均數(shù)的均數(shù)的(1- )100%可信區(qū)間可信區(qū)間構(gòu)建方法構(gòu)建方法n均數(shù)的均數(shù)的(1- )100%的可信區(qū)間:的可信區(qū)間:n可信限可信限(confidence limit):,vXXts ,(, )vvXXXtsXts樣本含量較大時,樣本含量較大時,u 值的分布值的分布:0-u u /2 /21- ()=1-Puuu 樣本含量較大時,均數(shù)樣本含量較大時,均數(shù)(1- )100%的可信區(qū)間:的可信區(qū)間:( )=1-XXP XusXus ()=1-Puuu ()=1-XXPuus 此時,均數(shù)的此時,

29、均數(shù)的(1-(1- )100%)100%的可信區(qū)間:的可信區(qū)間:(, )XXXusXus 6 )均數(shù)之差的均數(shù)之差的(1- )100%可信區(qū)間可信區(qū)間例例4.3 轉(zhuǎn)鐵蛋白含量(轉(zhuǎn)鐵蛋白含量(page41)n正常人:正常人:n1=12,n病人:病人:n2=15,問題:兩組平均相差多少?問題:兩組平均相差多少?12271.89, 10.38235.21, 14.39XsXs問題: 正常組 病人組 2?均 數(shù): 235.21ug/dl標(biāo)準(zhǔn)差: 14.39ug/dl 1?均 數(shù): 271.89ug/dl標(biāo)準(zhǔn)差: 10.28ug/dl 1- 2 ?1236.68XX與均數(shù)之差有關(guān)的抽樣分布與均數(shù)之差有關(guān)

30、的抽樣分布 “均數(shù)之差均數(shù)之差”與與“均數(shù)之差的標(biāo)準(zhǔn)誤均數(shù)之差的標(biāo)準(zhǔn)誤”之比,之比,服從自由度服從自由度 = n1+n2 -2的的 t 分布。分布。樣本含量較大時,服從標(biāo)準(zhǔn)正態(tài)分布。樣本含量較大時,服從標(biāo)準(zhǔn)正態(tài)分布。1212122 nnXXXXtts 1212 (0,1)XXXXtNs 合并方差與均數(shù)之差的標(biāo)準(zhǔn)誤合并方差與均數(shù)之差的標(biāo)準(zhǔn)誤n合并方差合并方差(方差的加權(quán)平均方差的加權(quán)平均)n均數(shù)之差的標(biāo)準(zhǔn)誤均數(shù)之差的標(biāo)準(zhǔn)誤222112212(1)(1)2Cnsnssnn 1221211()CXXssnn 21212121)2( ,21)2( ,21 XXnnXXnnstXXstXX,根據(jù)1)(,

31、tttP可得1-2的可信區(qū)間:計(jì)算:則合并方差為:自由度為自由度為 =n1+n2-2=12+15-2=25、 0.05的的t界值為:界值為:t0.05,25=2.060 ,則兩組均數(shù)之差的,則兩組均數(shù)之差的95可信區(qū)間為:可信區(qū)間為:(271.89235.21 ) 2.060 4.95 = 26.48 46.883679.1632151239.141438.1011222cs95. 41511213679.1631121221nnsscXX結(jié)論結(jié)論:n病毒性肝炎患者的血清轉(zhuǎn)鐵蛋白含量較正常病毒性肝炎患者的血清轉(zhuǎn)鐵蛋白含量較正常人平均低人平均低36.68( g/dl),其,其95可信區(qū)間為可信區(qū)

32、間為26.4846.88( g/dl)。 可信區(qū)間可信區(qū)間n均數(shù)均數(shù)n率率n事件數(shù)事件數(shù)n方差方差7) 可信區(qū)間的兩個要素可信區(qū)間的兩個要素n可信度可信度(1- ), 可靠性可靠性q一般取一般取90%,95%。q可人為控制??扇藶榭刂?。n精確性精確性q是指區(qū)間的大小是指區(qū)間的大小(或長短或長短)n兼顧可靠性、精確性兼顧可靠性、精確性影響可信區(qū)間大小的因素影響可信區(qū)間大小的因素,1,1(, )nnssXtXtnn n可信度q可信度越大,區(qū)間越寬可信度越大,區(qū)間越寬n個體變異q變異越大,區(qū)間越寬變異越大,區(qū)間越寬n樣本含量q樣本含量越大,區(qū)間越窄樣本含量越大,區(qū)間越窄8 ) 正確理解可信區(qū)間:正確理解可信區(qū)間:n可信度為可信度為95%的的CI的涵義:的涵義:q每每100個樣本,按同樣方法計(jì)算個樣本,按同樣方法計(jì)算95%的的CI,平均有平均有95%的的CI包含了總體參數(shù)。包含了總體參數(shù)。n這里的這里的95%,指的是方法本身!而不是某個,指的是方法本身!而不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論