第3章抽樣誤差陸ppt課件_第1頁
第3章抽樣誤差陸ppt課件_第2頁
第3章抽樣誤差陸ppt課件_第3頁
第3章抽樣誤差陸ppt課件_第4頁
第3章抽樣誤差陸ppt課件_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章 抽樣誤差Sampling Error易洪剛Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University.主要內(nèi)容抽樣誤差中心極限定理規(guī)范誤分布 2 分布F分布 .1. 抽樣誤差 Sampling Error 抽樣誤差中心極限定理規(guī)范誤統(tǒng)計分布.了解抽樣誤差的重要性總體同質(zhì)、個體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機(jī)抽樣樣本統(tǒng)計量知統(tǒng)計推斷風(fēng) 險.抽樣誤差sampling error,sampling variability 由抽樣引起的樣本統(tǒng)計量與總體參數(shù)間

2、的差別。 緣由:個體變異抽樣 表現(xiàn):樣本統(tǒng)計量與總體參數(shù)間的差別不同樣本統(tǒng)計量間的差別 抽樣誤差是不可防止的! 抽樣誤差是有規(guī)律的! .假設(shè)一個知總體,從該總體中抽樣,對每個樣本計算樣本統(tǒng)計量(均數(shù)、方差等),察看樣本統(tǒng)計量的分布規(guī)律抽樣分布規(guī)律。均數(shù)的模擬實驗.均數(shù)的模擬實驗調(diào)查:樣本均數(shù)的均數(shù)與總體均數(shù)有何關(guān)系?樣本均數(shù)的規(guī)范差與總體規(guī)范差有何關(guān)系?樣本均數(shù)的分布外形如何?不同的樣本含量對上述性質(zhì)的影響如何?.抽樣分布規(guī)律 = 5.0 = 0.5樣本含量n =10抽樣次數(shù)m =100 =5.19 S =0.42 =5.04 S = 0.44紅細(xì)胞計數(shù) =5.03 S =0.52.Fract

3、ionx2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3圖 正態(tài)分布N5.00,0.502總體分布.結(jié)論 1各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)間存在差別;. 由抽樣實驗所得的100個樣本作出其均數(shù)分布直方圖如圖4.1。曲線是對抽樣得到的100個 數(shù)據(jù)擬合的分布曲線。 .Fraction2.52.83.13.43.744.34.64.95.25.55.86.16.46.777.37.67.90.1.2.3.4.5.6.7.8.91圖 從正態(tài)分布N5.00,0.502總體中抽樣樣本均數(shù)的分布 .圖 從正態(tài)分布N5.00,0.

4、502總體中抽樣樣本均數(shù)的分布 Fraction4.14.44.755.35.65.90.1.2.3.4.5.結(jié)論2 的分布很有規(guī)律,圍繞著,中間多,兩邊少,左右根本對稱;樣本均數(shù)的變異范圍較之原變量的變異范圍大大減少;.2.中心極限定理 Central Limit Theorem 抽樣誤差中心極限定理規(guī)范誤分布.中心極限定理(central limit theorem) 一從均數(shù)為、規(guī)范差為 的正態(tài)總體中,獨立隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù) 的分布服從正態(tài)分布;樣本均數(shù)的均數(shù)為 ;樣本均數(shù)的規(guī)范差為 。.不同類型的總體分布,對于統(tǒng)計量分布有何影響?正態(tài)分布總體偏三角分布總體均勻分布總體指數(shù)

5、分布總體雙峰分布總體中心極限定理.中心極限定理 二從非正態(tài)(nonnormal)分布總體(均數(shù)為,方差為)中隨機(jī)抽樣(每個樣本的含量為n),可得無限多個樣本,每個樣本計算樣本均數(shù),那么只需樣本含量足夠大(n50),樣本均數(shù)也近似服從正態(tài)分布。樣本均數(shù)的均數(shù)為 ;樣本均數(shù)的規(guī)范差為 。.3.規(guī)范誤 standard error 抽樣誤差中心極限定理規(guī)范誤分布.規(guī)范誤(standard error)樣本統(tǒng)計量的規(guī)范差稱為規(guī)范誤。樣本均數(shù)的規(guī)范差稱為均數(shù)的規(guī)范誤。均數(shù)的規(guī)范誤表示樣本均數(shù)的變異度。當(dāng)總體規(guī)范差未知時,用樣本規(guī)范差替代,前者稱為實際規(guī)范誤,后者稱為樣本規(guī)范誤。.與規(guī)范差的關(guān)系1、意義上

6、規(guī)范差描畫個體值之間的變異,即察看值間的離散程度;而規(guī)范誤是描畫統(tǒng)計量的抽樣誤差,即樣本統(tǒng)計量和總體參數(shù)的接近程度;2、用途上規(guī)范差常用于表現(xiàn)察看值的動搖范圍;規(guī)范誤常表示抽樣誤差的大小,估計總體參數(shù)可信區(qū)間。3、與樣本含量規(guī)范差是隨著樣本含量的增多,逐漸趨于穩(wěn)定。規(guī)范誤是隨著樣本含量的增多,逐漸減少。區(qū)別.與規(guī)范差的關(guān)系首先,規(guī)范差和規(guī)范誤都是變異目的,闡明個體之間的變異用規(guī)范差,闡明統(tǒng)計量之間的變異用規(guī)范誤。其次,當(dāng)樣本含量不變時,規(guī)范差大,規(guī)范誤亦越大,均數(shù)的規(guī)范誤與規(guī)范差成正比。聯(lián)系.4. t分布 t-distribution 抽樣誤差中心極限定理規(guī)范誤分布.正態(tài)分布的規(guī)范化變化假設(shè)

7、X N(,) , 那么 。 因 ,那么 。 .從正態(tài)分布總體中1000次抽樣的 u 值的分布(n=4)Fractionu-4-3-2-1012340.05.1.15.2均數(shù)為 0.007559規(guī)范差為 1.006294 .t 分布的概念實踐任務(wù)中,總體方差未知。所以,用樣本方差替代總體方差,此時 的分布如何?.從正態(tài)分布總體中1000次抽樣的 值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均數(shù)為 0.05696規(guī)范差為 1.55827 .t 分布的概念用樣本方差替代總體方差,此時不服從正態(tài)分布。.1908年,W.S.Gosset (1876

8、-1937)以筆名Student發(fā)表了著名的t分布,證明了:設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和規(guī)范差分別為 和s,設(shè):那么t值服從自在度為n-1的t分布。t 分布的概念記為:.圖 自在度分別為1、5、時的t分布t分布圖形 f(t) =(規(guī)范正態(tài)曲線) =5 =10.10.2-4-3-2-1012340.3.t分布的特征t分布是一簇曲線,當(dāng)不同時,曲線外形不同;單峰分布,以0為中心,左右對稱;當(dāng)逼近時,t分布逼近u分布,故規(guī)范正態(tài)分布是t分布的特例;t分布曲線下面積是有規(guī)律的。請看演示t 分布.t界值表表上陰影部分,表示t,以外的尾部面積占總面積百分?jǐn)?shù),即概率P。表中數(shù)據(jù)

9、表示與確定時相應(yīng)的t界值critical value,常記為t,。.-t0t抽樣總體樣本t1t2t3t4tn-3tn-2tn-1tn統(tǒng)計量分布t分布闡明,從正態(tài)分布總體中隨機(jī)抽取的樣本,由樣本計算的t值接近0的能夠性較大,遠(yuǎn)離0的能夠性較小。 .例如,當(dāng)=10,單尾概率=0.05時,查表得單尾t0.05,10=1.812,那么:P(t-1.812)=0.05或P(t1.812)=0.05闡明:按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,那么由該樣本計算的t值大于等于1.812的概率為0.05,或者小于等于-1.812的概率亦為0.05。-1.81200.050.051.812

10、.例如,當(dāng)=10,雙尾概率=0.05時,查表得雙尾t0.05,102.228,那么: P(t-2.228)+P(t2.228)0.05或:P(-2.228t2.228)=1-0.05=0.95。闡明:按t分布的規(guī)律,從正態(tài)分布總體中抽取樣本含量為n=11的樣本,那么由該樣本計算的t值大于等于2.228的概率為0.025,小于等于-2.228的概率亦為0.025。-2.22800.0250.0252.228.單尾:P(t- t,)=,或P(tt,)=雙尾:P(t- t/2,)+P(tt/2,)=, 即P(-t/2,t t/2,)=1-t0tt分布曲線下面積規(guī)律.5. 2分布 chi-distri

11、bution 抽樣誤差中心極限定理規(guī)范誤分布. 2 分布 設(shè)從正態(tài)分布N(,2)中隨機(jī)抽取含量為n的樣本,樣本均數(shù)和規(guī)范差分別為 和s,設(shè):2值服從自在度為n-1的2分布(2-distribution) .=4=3=520246810120.00.10.20.30.40.5f(2)=1=2=6 2 分布 請看演示 c2 分布.2分布的特征 (1) 2分布為一簇單峰正偏態(tài)分布曲線 ;隨的逐漸加大,分布趨于對稱。(2) 自在度為的2分布,其均數(shù)為,方差為2。(3) 自在度為的2分布實踐上是個規(guī)范正態(tài)分布變量之平方和。 2=u12+ u22+ uv2 .3.840.050.0250.0251.96-

12、1.962分布與正態(tài)分布的關(guān)系.(4) 每一自在度下的2分布曲線都有其本身分布規(guī)律。自在度為1的2分布界值0.00.10.20.30.40.53.840.05.2分布是方差的抽樣分布。 2分布闡明,從正態(tài)分布的總體中隨機(jī)抽樣,所得樣本的方差s2接近于總體方差2的能夠性大,遠(yuǎn)離總體方差的能夠性小。即2值接近其均數(shù)n-1的能夠性大,遠(yuǎn)離n-1的能夠性小。2分布的特征 .自在度10時,20.025,1020.48,20.975,103.25。從正態(tài)分布的總體中隨機(jī)抽樣,得到的樣本其2值大于等于20.48的概率為0.025,小于等于3.25的概率亦為0.025。P(23.25)+P(220.48)0.

13、05 2分布的特征 .2分布近似描畫具有某種屬性的實踐頻數(shù)Ai與實際頻數(shù)Ti之間的抽樣誤差 2分布的特征 .6. F分布 F-distribution 抽樣誤差中心極限定理規(guī)范誤分布.F分布 設(shè)從兩個方差相等的正態(tài)分布N(1,2)和N(2,2)總體中隨機(jī)抽取含量分別為n1和n2的樣本,樣本均數(shù)和規(guī)范差分別為 、s1和 和s2。設(shè):那么F值服從自在度為(n1-1,n2-1)的F分布(F-distribution)。 .F分布的特征 (1) F分布為一簇單峰正偏態(tài)分布曲線,與兩個自在度有關(guān)。 (2) 假設(shè)F服從自在度為(1,2)的F分布,那么其倒數(shù)1/F服從自在度為(2,1)的F分布。(3) 自在度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自在度無關(guān)。(4) 第一自在度11時,F(xiàn)分布實踐上是t分布之平方;第二自在度2時,F(xiàn)分布實踐上等于2分布。 請看演示F分布.(5) 每一對自在度下的F分布曲線下的面積分布規(guī)律。 PFF分布的特征 .F分布闡明,從兩個方差相等的正態(tài)分布總體中隨機(jī)抽取含量分別為n1和n2的樣本,計算所得F值,應(yīng)接近v2/(v2-2)。F(0.05;20,20)= 2.12

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論