




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、抽樣(chu yn)分布、參數(shù)估計Sampling distribution and Parameter estimation劉麗亞Department of Epidemiology & Biostatistics, School of Public Health Nanjing Medical University共六十三頁抽樣(chu yn)分布(1) t-distribution 抽樣(chu yn)分布參數(shù)估計共六十三頁正態(tài)分布的標(biāo)準(zhǔn)化變化(binhu)若 X N(,) , 則 。 因 ,則 。 共六十三頁從正態(tài)分布總體(zngt)中1000次抽樣的 u 值的分布(n=4)Fract
2、ionu-4-3-2-1012340.05.1.15.2均數(shù)為 0.007559標(biāo)準(zhǔn)差為 1.006294 共六十三頁從正態(tài)分布總體(zngt)中1000次抽樣的 值的分布(n=4)Fractiont-8-6-4-2024680.05.1.15.2.25.3.35均數(shù)為 0.05696標(biāo)準(zhǔn)差為 1.55827 共六十三頁t 分布(fnb)的概念用樣本方差代替總體方差,此時(c sh)不服從正態(tài)分布。共六十三頁t分布(fnb)的特征t分布是一簇曲線,當(dāng)不同時,曲線形狀不同;單峰分布,以0為中心,左右對稱;當(dāng)逼近時,t分布逼近u分布,故標(biāo)準(zhǔn)(biozhn)正態(tài)分布是t分布的特例;t分布曲線下面積是
3、有規(guī)律的。共六十三頁單尾:P(t- t,)=,或P(tt,)=雙尾:P(t- t/2,)+P(tt/2,)=, 即P(-t/2,t t/2,)=1-t0tt分布(fnb)曲線下面積規(guī)律共六十三頁抽樣(chu yn)分布(2) chi-distribution 抽樣(chu yn)分布參數(shù)估計共六十三頁 2 分布(fnb) 設(shè)從正態(tài)分布N(,2)中隨機抽取(chu q)含量為n的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 和s,設(shè):2值服從自由度為n-1的2分布(2-distribution) 共六十三頁=4=3=520246810120.00.10.20.30.40.5f(2)=1=2=6 2 分布(fnb
4、) 共六十三頁2分布(fnb)的特征 (1) 2分布為一簇單峰正偏態(tài)分布曲線 ;隨的逐漸加大,分布趨于對稱(duchn)。(2) 自由度為的2分布,其均數(shù)為,方差為2。(3) 自由度為的2分布實際上是個標(biāo)準(zhǔn)正態(tài)分布變量之平方和。 2=u12+ u22+ uv2 共六十三頁3.840.050.0250.0251.96-1.962分布(fnb)與正態(tài)分布的關(guān)系共六十三頁(4) 每一自由度下的2分布曲線都有其自身(zshn)分布規(guī)律。自由度為1的2分布(fnb)界值0.00.10.20.30.40.53.840.05共六十三頁2分布是方差的抽樣分布。 2分布說明,從正態(tài)分布的總體中隨機抽樣,所得樣本
5、的方差s2接近(jijn)于總體方差2的可能性大,遠(yuǎn)離總體方差的可能性小。即2值接近其均數(shù)n-1的可能性大,遠(yuǎn)離n-1的可能性小。2分布(fnb)的特征 共六十三頁自由度10時,20.025,1020.48,20.975,103.25。從正態(tài)分布的總體中隨機抽樣,得到(d do)的樣本其2值大于等于20.48的概率為0.025,小于等于3.25的概率亦為0.025。P(23.25)+P(220.48)0.05 2分布(fnb)的特征 共六十三頁2分布近似描述具有某種屬性的實際頻數(shù)(pn sh)Ai與理論頻數(shù)Ti之間的抽樣誤差 共六十三頁抽樣(chu yn)分布(3) F-distributio
6、n 抽樣(chu yn)分布參數(shù)估計共六十三頁F分布(fnb) 設(shè)從兩個(lin )方差相等的正態(tài)分布N(1,2)和N(2,2)總體中隨機抽取含量分別為n1和n2的樣本,樣本均數(shù)和標(biāo)準(zhǔn)差分別為 、s1和 和s2。設(shè):則F值服從自由度為(n1-1,n2-1)的F分布(F-distribution)。 共六十三頁F分布(fnb)的特征 (1) F分布為一簇(y c)單峰正偏態(tài)分布曲線,與兩個自由度有關(guān)。 (2) 若F服從自由度為(1,2)的F分布,則其倒數(shù)1/F服從自由度為(2,1)的F分布。(3) 自由度為(1,2)的F分布,其均數(shù)為2/(2-2),與第一自由度無關(guān)。(4) 第一自由度11時,F(xiàn)
7、分布實際上是t分布之平方;第二自由度2時,F(xiàn)分布實際上等于2分布。 共六十三頁(5) 每一對自由度下的F分布(fnb)曲線下的面積分布(fnb)規(guī)律。 PFF分布(fnb)的特征 共六十三頁F分布(fnb)表明,從兩個方差相等的正態(tài)分布(fnb)總體中隨機抽取含量分別為n1和n2的樣本,計算所得F值,應(yīng)接近v2/(v2-2)。F(0.05;20,20)= 2.12表示,從方差相等的正態(tài)分布總體中隨機抽取n1=n2=21的樣本,則由兩樣本計算的F值大于等于2.12的可能性為0.05F分布(fnb)的特征 共六十三頁樣本(yngbn)統(tǒng)計量的抽樣分布任何一個樣本統(tǒng)計量均有其分布(fnb)規(guī)律。從正
8、態(tài)分布總體中抽樣:均數(shù)的抽樣分布為正態(tài)分布;樣本方差的分布服從2分布;樣本方差之比服從F分布;t 值服從 t 分布;共六十三頁參數(shù)估計 Parameter estimation 抽樣(chu yn)分布參數(shù)估計共六十三頁統(tǒng)計推斷(tudun)的思路總體個體、個體變異總體參數(shù)未知樣本代表性、抽樣誤差隨機抽樣樣本統(tǒng)計量已知統(tǒng)計 推斷風(fēng) 險共六十三頁統(tǒng)計(tngj)推斷(statistical inference) 概念:根據(jù)樣本(yngbn)所提供的信息,以一定的概率推斷總體的性質(zhì)??傮w參數(shù)的估計 (parameter estimation)假設(shè)檢驗 (hypothesis test)共六十三頁參
9、數(shù)(cnsh)的估計 概念:由樣本指標(biāo)(統(tǒng)計量)估計總體指標(biāo)(參數(shù)(cnsh))稱為參數(shù)(cnsh)估計點估計 (point estimation)區(qū)間估計(interval estimation)共六十三頁點估計用樣本統(tǒng)計量作為總體(zngt)參數(shù)的估計值簡單易行未考慮抽樣誤差共六十三頁總體:某市2001年所有7歲男童的身高樣本(yngbn):n=120 mean=123.62 s=4.75點估計:本市7歲男童的平均身高為123.62,標(biāo)準(zhǔn)差為4.75點估計共六十三頁均數(shù)率事件(shjin)數(shù)方差區(qū)間(q jin)估計共六十三頁1.區(qū)間(q jin)估計的實質(zhì)假設(shè)某個總體的均數(shù)為,需要找到兩
10、個量A和B,使得在一個比較高的可信度下(如95%),區(qū)間(q jin)(A,B)能包含。即P(AB)=0.95共六十三頁2.可信區(qū)間(q jin)的定義按一定的概率或可信度(1-)用一個區(qū)間估計(gj)總體參數(shù)所在范圍,這個范圍稱作可信度為1-的可信區(qū)間??尚艆^(qū)間(CL, CU )是一開區(qū)間 CL、CU 稱為可信限共六十三頁例題:血紅蛋白(xuhng dnbi)濃度為了解某地 1 歲嬰兒的血紅蛋白濃度,從該地區(qū)隨機抽取 25 名 1 歲嬰兒,測得其血紅蛋白試估計該地區(qū)1歲嬰兒的平均(pngjn)血紅蛋白濃度。 均 數(shù) = 123.7(g/L) 標(biāo)準(zhǔn)差 = 11.9(g/L) 標(biāo)準(zhǔn)誤=11.9/
11、sqrt(25)=2.38共六十三頁t 值的分布(fnb)理論基礎(chǔ):均數(shù)的抽樣(chu yn)分布-2.064 0 2.064v24共六十三頁區(qū)間(q jin)估計共六十三頁可信區(qū)間(q jin)(confidence interval):區(qū)間(q jin)(118.79, 128.61)包含了總體均數(shù),其信度為95%。可信度(1): 95% .結(jié)論:該地區(qū) 1 歲嬰兒的平均血紅蛋白濃度為118.79128.61(g/L)(可信度為95%)。或:該地區(qū) 1 歲嬰兒的平均血紅蛋白濃度的95%可信區(qū)間為118.79128.61(g/L)。共六十三頁3.可信區(qū)間估計(gj)的理論基礎(chǔ) -均數(shù)的抽樣分
12、布-t/2, v 0 t/2, v 1-/2/2共六十三頁4.均數(shù)的可信區(qū)間構(gòu)建方法(fngf) -t分布共六十三頁均數(shù)的(1-)100%的可信區(qū)間(q jin):可信限(confidence limit):可信度:1參考值范圍(fnwi)4.均數(shù)的可信區(qū)間構(gòu)建方法 -t分布共六十三頁0-uu/2/21-4.均數(shù)的可信區(qū)間構(gòu)建(u jin)方法 -u分布共六十三頁樣本含量(hnling)較大時,均數(shù)(1-)100%的可信區(qū)間:此時(c sh),均數(shù)的(1-)100%的可信區(qū)間:共六十三頁5.均數(shù)之差的(1-)100%可信區(qū)間(q jin)例4.3 轉(zhuǎn)鐵蛋白含量(page39)正常人:n1=12
13、,病人:n2=15,問題:兩組平均(pngjn)相差多少?共六十三頁問題(wnt): 正常(zhngchng)組 病人組 2?均 數(shù): 235.21ug/dl標(biāo)準(zhǔn)差: 14.39ug/dl 1?均 數(shù): 271.89ug/dl標(biāo)準(zhǔn)差: 10.28ug/dl 1- 2 ?共六十三頁與均數(shù)之差有關(guān)的抽樣(chu yn)分布 “均數(shù)之差”與“均數(shù)之差的標(biāo)準(zhǔn)誤”之比,服從自由度 = n1+n2 -2的 t 分布(fnb)。樣本含量較大時,服從標(biāo)準(zhǔn)正態(tài)分布。共六十三頁合并(hbng)方差與均數(shù)之差的標(biāo)準(zhǔn)誤合并方差(fn ch)(方差的加權(quán)平均)均數(shù)之差的標(biāo)準(zhǔn)誤共六十三頁根據(jù)(gnj)可得1-2的可信區(qū)間
14、(q jin):共六十三頁計算(j sun):則合并(hbng)方差為:自由度為=n1+n2-2=12+15-2=25、0.05的t界值為:t0.05,25=2.060 ,則兩組均數(shù)之差的95可信區(qū)間為:(271.89235.21 ) 2.060 4.95 = 26.48 46.88共六十三頁結(jié)論(jiln):病毒性肝炎患者的血清轉(zhuǎn)鐵蛋白含量較正常人平均(pngjn)低36.68(g/dl),其95可信區(qū)間為26.4846.88(g/dl)。 共六十三頁6.可信區(qū)間的兩個(lin )要素可信度(1-), 可靠性一般取90%,95%??扇藶?rnwi)控制。精確性是指區(qū)間的大小(或長短)兼顧可靠
15、性、精確性共六十三頁影響可信區(qū)間大小(dxio)的因素可信度可信度越大,區(qū)間越寬個體變異(biny)變異越大,區(qū)間越寬樣本含量樣本含量越大,區(qū)間越窄共六十三頁7.正確理解可信區(qū)間(q jin):可信度為95%的CI的涵義(hn y):每100個樣本,按同樣方法計算95%的CI,平均有95%的CI包含了總體參數(shù)。這里的95%,指的是方法本身!而不是某個區(qū)間!在可信區(qū)間被估計之前,概率是存在的; 在可信區(qū)間被估計之后,就沒有概率了。共六十三頁從N(0,1)中隨機(su j)抽取100個n=10的樣本所估計的100個95%可信區(qū)間 -2 -1 0 1 2 按這種方法構(gòu)建的可信區(qū)間,理論(lln)上平
16、均每100次,有95次可以估計到總體參數(shù)。共六十三頁下列(xili)說法正確嗎?算得(sun d)某95%的可信區(qū)間,則: 總體參數(shù)有95%的可能落在該區(qū)間。 有95%的總體參數(shù)在該區(qū)間內(nèi)。 該區(qū)間包含95%的總體參數(shù)。 該區(qū)間有95%的可能包含總體參數(shù)。 該區(qū)間包含總體參數(shù),可信度為95%。共六十三頁例如,臨床上觀察120例使用(shyng)某生物制劑的患者,其皮疹發(fā)生率2/120=1.67%,則該生物制劑的皮疹發(fā)生率的95可信上限為:即該生物制劑的皮疹(pzhn)發(fā)生率最大為5.2%。 8.單側(cè)可信區(qū)間共六十三頁9 .注意(zh y)區(qū)別:標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤個體變異(biny) 抽樣誤差參考值范
17、圍 可信區(qū)間變量分布 抽樣分布共六十三頁10.可信區(qū)間(q jin)與參考值范圍可信區(qū)間(q jin) 用95%的可信度估計總體均數(shù) 基于t分布(統(tǒng)計量的抽樣分布)參考值范圍 95%的變量值在該范圍內(nèi) 基于正態(tài)分布 共六十三頁練習(xí)(linx) 表示( )A 總體標(biāo)準(zhǔn)差B 樣本標(biāo)準(zhǔn)差C 抽樣分布(fnb)均數(shù)的理論標(biāo)準(zhǔn)差D 抽樣分布均數(shù)的估計標(biāo)準(zhǔn)差C共六十三頁 表示 ( )A 總體(zngt)均數(shù)的離散程度B 總體標(biāo)準(zhǔn)差的離散程度C 樣本均數(shù)的離散程度D 樣本標(biāo)準(zhǔn)差的離散程度C共六十三頁從連續(xù)性變量X中反復(fù)隨機抽樣,隨樣本含量n增大, 將趨于( ) A X的原始(yunsh)分布 B 正態(tài)分布 C 均數(shù)的抽樣分布 D 標(biāo)準(zhǔn)正態(tài)分布D共六十三頁下面關(guān)于標(biāo)準(zhǔn)誤的四種說法中,哪一種最不正確( )A 標(biāo)準(zhǔn)誤是樣本統(tǒng)計量的標(biāo)準(zhǔn)差B 標(biāo)準(zhǔn)誤反映了樣本統(tǒng)計量的變異C 標(biāo)準(zhǔn)誤反映了總體參數(shù)(cnsh)的變異D 標(biāo)準(zhǔn)誤反映了抽樣誤差的大小c共六十三頁61隨著樣本含量的增加,以下說法正確(zhngqu)的是( )A 標(biāo)準(zhǔn)差逐漸變大B 標(biāo)準(zhǔn)誤逐漸變大C 標(biāo)準(zhǔn)差逐漸變小D 標(biāo)準(zhǔn)誤逐漸變小D共六十三頁62可信度1-越大,則總體均數(shù)可信區(qū)間(q jin)( )A 越寬B 越窄C 不變D 還與第二類錯誤有關(guān)A共六十三頁內(nèi)容摘要抽樣分布、參數(shù)估計Sampling distri
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 合同視角下的產(chǎn)品經(jīng)銷三方合作
- 工業(yè)園區(qū)食堂勞務(wù)合同標(biāo)準(zhǔn)版
- 梧州市長洲區(qū)政府綠化工程委托合同
- 隱名投資利益分配合同
- 代理社保業(yè)務(wù)合同合作協(xié)議2025
- 代理合作協(xié)議合同模板
- 搪瓷企業(yè)設(shè)備更新與技術(shù)改造考核試卷
- 旅游客運突發(fā)事件應(yīng)急預(yù)案考核試卷
- 政策性銀行服務(wù)農(nóng)村電商與精準(zhǔn)扶貧考核試卷
- 后勤服務(wù)中的客戶關(guān)系管理測試考核試卷
- 借哪吒精神燃開學(xué)斗志 開學(xué)主題班會課件
- 2025年初中主題班會課件:好習(xí)慣成就好人生
- 學(xué)校教職工代表大會全套會議會務(wù)資料匯編
- 中華人民共和國監(jiān)察法宣貫培訓(xùn)
- 2025年山東傳媒職業(yè)學(xué)院高職單招高職單招英語2016-2024歷年頻考點試題含答案解析
- 2025年春新教科版物理八年級下冊課件 第10章 流體的力現(xiàn)象 1 在流體中運動
- 《中醫(yī)基礎(chǔ)理論》課件-中醫(yī)學(xué)理論體系的基本特點-整體觀念
- 全國職業(yè)院校技能大賽高職組(商務(wù)數(shù)據(jù)分析賽項)備賽試題及答案
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- 課題申報書:“四新”視域下地方高校學(xué)科建設(shè)與人才培養(yǎng)研究
- 施工爆破作業(yè)審批制度范文(2篇)
評論
0/150
提交評論