版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、參數(shù)估計(jì)基礎(chǔ),抽樣分布與抽樣誤差 t分布 總體均數(shù)及總體概率的估計(jì),抽樣研究:用樣本信息推斷總體特征。 常用統(tǒng)計(jì)推斷方法:參數(shù)估計(jì)和假設(shè)檢驗(yàn) 本章: 參數(shù)估計(jì)的基本概念; 樣本統(tǒng)計(jì)量的分布規(guī)律; 總體均數(shù)和總體概率的估計(jì)方法。,第一節(jié) 抽樣分布與抽樣誤差,從總體中隨機(jī)抽取一份樣本,計(jì)算均數(shù)。 這個(gè)均數(shù)不同于總體均數(shù)!為什么? 再?gòu)脑摽傮w中隨機(jī)抽取一份樣本,再計(jì)算均數(shù)。 前后兩個(gè)均數(shù)不等,為什么? -抽樣誤差!,抽樣誤差的概念,定義:由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間、以及樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量之間的差別。 原因:個(gè)體變異隨機(jī)抽樣 表現(xiàn): 樣本統(tǒng)計(jì)量與總體參數(shù)間的差別 不同樣本統(tǒng)計(jì)量間的差別,一
2、、樣本均數(shù)的抽樣分布與抽樣誤差,實(shí)驗(yàn)6-1 假定某年某地所有13歲女學(xué)生身高服從總體均數(shù) u=155.4cm,總體標(biāo)準(zhǔn)差=5.3cm的正態(tài)分布。在這樣一個(gè) 總體中隨機(jī)抽樣,每次均抽取30例組成一份樣本; 共抽100次; 算出每一份樣本的平均身高; 153.6,153.1,154.9,。157.7(見(jiàn)表6-1),表6-2 從正態(tài)總體N(155.4,5.32)抽樣得到的100個(gè)樣本均數(shù)的頻數(shù)分布(n=30),1、各樣本均數(shù)未必等于總體均數(shù); 2、樣本均數(shù)之間存在差異; 3、樣本均數(shù)的分布有一定規(guī)律,圍繞著總體均數(shù) (155.4cm),中間多,兩邊少,左右基本對(duì)稱,也服從正 態(tài)分布; 4、樣本均數(shù)的
3、變異較之原變量的變異大大縮小。,若隨機(jī)變量x服從正態(tài)分布X-N(u,2),則 1)樣本均數(shù)的總體均數(shù)仍等于原變量的總體均數(shù)u 2)樣本均數(shù)的標(biāo)準(zhǔn)誤 實(shí)際中, 表示均數(shù)抽樣誤差的指標(biāo):樣本均數(shù)的標(biāo)準(zhǔn)差, 也稱為樣本均數(shù)的標(biāo)準(zhǔn)誤。,標(biāo)準(zhǔn)誤的概念,抽樣的樣本量越大,標(biāo)準(zhǔn)誤就越小; 原來(lái)總體變異度小,標(biāo)準(zhǔn)誤就越小。 標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)之間的差異。當(dāng)標(biāo)準(zhǔn)誤大時(shí),用樣本均數(shù)對(duì)總體均數(shù)的估計(jì)的可靠程度就?。环粗嗳?。,標(biāo)準(zhǔn)誤用途,衡量樣本均數(shù)的可靠性:標(biāo)準(zhǔn)誤越小,表明樣本均數(shù)越可靠; 參數(shù)估計(jì):估計(jì)總體均數(shù)的置信區(qū)間(區(qū)域); 假設(shè)檢驗(yàn):用于總體均數(shù)的假設(shè)檢驗(yàn)(比較
4、)。,統(tǒng)計(jì)推斷,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤,意義:標(biāo)準(zhǔn)差用于描述個(gè)體值之間的變異,即觀察值間的離散度, 標(biāo)準(zhǔn)差小,表明觀察值圍繞均數(shù)的波動(dòng)小;標(biāo)準(zhǔn)誤描述統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度。標(biāo)準(zhǔn)誤小,表明抽樣誤差小,則統(tǒng)計(jì)量穩(wěn)定,與參數(shù)接近。 用途:標(biāo)準(zhǔn)差表示觀察值間波動(dòng)的大小,用于醫(yī)學(xué)參考值范圍;標(biāo)準(zhǔn)誤表示抽樣誤差的大小,用于參數(shù)估計(jì)。 關(guān)系:隨著樣本含量增加,都減小。 聯(lián)系:都是表示變異度的指標(biāo),當(dāng)樣本量一定時(shí),兩者成正比。,從非正態(tài)分布重復(fù)抽樣, 樣本均數(shù)的分布如何?,當(dāng)樣本量n較小時(shí),樣本均數(shù)的分布當(dāng)然并非正 態(tài)分布。,實(shí)驗(yàn)6-2 圖6-2(a)是一個(gè)正偏峰的分布,用電腦從中隨機(jī)抽取
5、樣本含量分別為5,10,30和50的樣本各1000次,計(jì)算樣本均數(shù)并繪制4個(gè)直方圖。,(1)樣本均數(shù)的總體均數(shù)仍等于原變量的總體均數(shù)u,樣本均數(shù)的標(biāo)準(zhǔn)誤仍滿足 (2)當(dāng)樣本量n較小時(shí),樣本均數(shù)的分布并非正態(tài)分布; (3)樣本量足夠大時(shí)(例如,n30),樣本均數(shù)的分布近似于正態(tài)分布 XN(u,2/n),二、樣本頻率的抽樣分布與抽樣誤差,實(shí)驗(yàn)6-3 樣本頻率抽樣分布的實(shí)驗(yàn) 在一口袋內(nèi)裝有形狀、重量完全相同的黑球和白球,已 知黑球比例為20%(總體概率=20%) 從口袋中每摸一次看清顏色后放回去,搖勻后再摸,重復(fù) 摸球50次(n=50),計(jì)算摸到黑球的比率(樣本頻率pi); 這樣的實(shí)驗(yàn)重復(fù)100次,
6、 每次摸到黑球的比例分別為 14%,20%,26%,22%。,根據(jù)二項(xiàng)分布原理,若隨機(jī)變量X-B(n,) 則樣本頻率P的總體均數(shù)為: 總體標(biāo)準(zhǔn)誤為: 當(dāng)總體概率未知時(shí),可用樣本頻率P近似地代替, 若增加樣本含量n可以減少樣本頻率的抽樣誤差。,例:某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人,其中患有骨質(zhì)疏松癥者322人,患病率為41.5%,試估計(jì)該樣本頻率的抽樣誤差。,2,二、t分布,實(shí)驗(yàn):從前述的13歲女學(xué)生身高這個(gè)正態(tài)總體中分別作樣本量為3和50的隨機(jī)抽樣,各抽取1000份樣本,并分別得到1000個(gè)樣本均數(shù)及其標(biāo)準(zhǔn)誤。對(duì)它們分別作t變換,并將t值繪制相應(yīng)的直方圖。,n=3 n=50,t 分
7、布是一抽樣分布,t 分布不是一條曲線,而是一簇曲線,因?yàn)閠 值的分布與自由度 有關(guān)。其特點(diǎn):,二、t分布的圖形和t分布表,附表2:不同自由度v下的t界值 橫標(biāo)目:自由度v 縱標(biāo)目:概率P 表中數(shù)字:當(dāng)v和p確定時(shí),對(duì)應(yīng)的t臨界值 相同自由度,/t/值越大, 尾部概率越小; 相同t值,雙側(cè)尾部概率為 單側(cè)尾部概率的兩倍。,t分布曲線下面積(附表2),例 當(dāng)v=16, 表中查得 單側(cè)0.05的臨界值 t0.05,161.746, P(t-t0.05,16 )=0.05 P(tt0.05,16 )=0.05 雙側(cè)0.05的臨界值 t0.05/2,162.120 P(t-t0.05/2,16 ) P(
8、tt0.05/2,16 ) =0.05,三、總體均數(shù)及總體概率的估計(jì),一、參數(shù)估計(jì)的概念 參數(shù)估計(jì):用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。 點(diǎn)估計(jì);區(qū)間估計(jì) (一)點(diǎn)估計(jì) 用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的點(diǎn)估計(jì)值。 點(diǎn)估計(jì)值沒(méi)有考慮抽樣誤差,無(wú)法評(píng)價(jià)其可信度。,例1:27例健康成年男子血紅蛋白量的樣本均數(shù)作為總體均 數(shù)的點(diǎn)估計(jì)值。 -認(rèn)為2000年該地所有健康成年男子血紅蛋白量的總體 均數(shù)約為125g/L 例2:776名50歲以上的中老年婦女骨質(zhì)疏松癥的樣本患病率 作為總體患病率的點(diǎn)估計(jì)值 -認(rèn)為該市所有50歲以上的中老年婦女骨質(zhì)疏松癥的總體 患病率約為41.5%。,(二)區(qū)間估計(jì) 總體參數(shù)的置信區(qū)間(co
9、nfidence interval,CI) 將樣本統(tǒng)計(jì)量與標(biāo)準(zhǔn)誤結(jié)合起來(lái),確定一個(gè)具有較大置 信度的包含總體參數(shù)的范圍。 置信度:1-a,其中a由研究者預(yù)先規(guī)定, 一般為0.1,0.05或0.01。 置信區(qū)間:上下兩個(gè)置信限構(gòu)成。,CI是隨機(jī)的,總體參數(shù)是固定的,CI包含總體參數(shù)的可能 性是1-a,而不是總體參數(shù)落在CI的可能性為1-a。,區(qū)間估計(jì)的理解:,圖4-2 模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖,圖4-2 模擬抽樣成年男子紅細(xì)胞數(shù)100次的95%可信區(qū)間示意圖,1、t分布方法: 應(yīng)用條件:總體方差未知,樣本量小(n50),正態(tài)總體N(,2)的樣本均數(shù)的t變換 t= t
10、分布 v=n-1 ,注意:有5%的情形,上式不對(duì)! 故可信度為95%?。ū?-1),二、置信區(qū)間的計(jì)算 (一)總體均數(shù)的置信區(qū)間,由表6-1可以看出,多數(shù)區(qū)間(95個(gè))覆蓋了總體均數(shù)155.4cm,只有少數(shù)(5個(gè))區(qū)間未包含總體均數(shù),即作100次同樣的估計(jì),有95次包括此值在內(nèi)。 當(dāng)我們據(jù)一份樣本對(duì)總體均數(shù)只作一次區(qū)間估計(jì)時(shí),我們宣布“總體均數(shù)在此范圍內(nèi)” -這句話未必正確,可信的程度為95%。,若將置信度定為(1-a),則總體均數(shù)的(1-a) 置信區(qū)間的一般計(jì)算公式為 : 或縮寫(xiě)為 Xta/2,vSx,例:已知某地27名健康成年男子的血紅蛋白量均為125g/l,標(biāo)準(zhǔn)差15g/l。試問(wèn)該地健康
11、成年男子血紅蛋白平均含量的95%置信區(qū)間和99%置信區(qū)間各是多少? n=27,v=27-1=26 雙側(cè) t0.05/2,26=2.056, t0.01/2,26=2.779 95%置信區(qū)間: Xt0.05/2,vSx=1252.05615/27=(119.06,130.94) 99%置信區(qū)間: Xt0.05/2,vSx=1252.77915/27=(116.98,133.02),置信區(qū)間的兩個(gè)要素: 1、準(zhǔn)確度:反映置信度1-a的大小,即區(qū)間包含總體均數(shù)的 概率大小。 2、精度:反映區(qū)間長(zhǎng)度。在置信度確定的情況下,增加樣 本例數(shù)可減少區(qū)間長(zhǎng)度,提高精度。,置信區(qū)間的意義: 從總體中進(jìn)行隨機(jī)抽樣
12、,由樣本均數(shù)計(jì)算置信 區(qū)間,有1-a的可能得到包含總體均數(shù)的置信區(qū)間。,均數(shù)的單側(cè)(1-a)置信區(qū)間 X-ta,vSx Xta,vSx,2、正態(tài)分布近似法: 應(yīng)用條件:當(dāng)總體標(biāo)準(zhǔn)差已知時(shí);或總體標(biāo)準(zhǔn)差未知,而樣本量較大時(shí)(n50),x+Za/2x,x+Za/2 sx,(一)總體均數(shù)的置信區(qū)間,例:某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm。試估計(jì)該市2000年19歲健康男大學(xué)生平均身高的95%置信區(qū)間。 N=9050,x+Za/2sx=X1.96sx =172.21.964.5/90 =(171.3,173.1),(二)總體概率的置信區(qū)間
13、,1、查表法 當(dāng)樣本含量n較小(n50),p很接近0或100%時(shí), 可以查表確定百分率總體概率的置信區(qū)間。 例:某醫(yī)院對(duì)39名前列腺患者實(shí)行開(kāi)放手術(shù)治療后,術(shù)后有合并癥者2人,試估計(jì)該手術(shù)合并癥發(fā)生概率的95%置信區(qū)間。 P=2/39=5.13% 點(diǎn)估計(jì)=5.13%,而概率的真值卻有可能在1%和17%之間.,例:某醫(yī)生用某藥物治療31例腦血管梗塞患者,其中25例患 者治療有效,試求該藥物治療腦血管梗塞有效概率的95%置 信區(qū)間。 注意:附表中僅列出Xn/2部分,當(dāng)Xn/2時(shí),應(yīng)以n-X值 查表,然后從100中減去查得的數(shù)值。 本例 n=31,X=25n/2,所以用n-X=6查附表,得8-38,
14、 再用100減去所查的數(shù)值得到95%置信區(qū)間為62%-92%。,2、正態(tài)近似法 當(dāng)n足夠大,且樣本頻率p和(1-p)均不太小時(shí) (np與n(1-p)均大于5),總體概率的置信區(qū)間: (P-Za/2Sp, PZa/2Sp ) 例:用某種儀器檢查已確診的乳腺癌患者120名,檢出乳腺癌患者94例,檢出率為78.3%。試估計(jì)該儀器乳腺癌總體檢出率的95%置信區(qū)間。 np=94及n(1-p)=26均大于5,可用近似公式估計(jì) PZa/2Sp=PZ0.05/2p(1-p)/n =0.7831.960.783(1-0.783)/120 =(0.709,0.857),下列說(shuō)法正確嗎?,算得某95%的可信區(qū)間,則
15、: 總體參數(shù)有95%的可能落在該區(qū)間。 有95%的總體參數(shù)在該區(qū)間內(nèi)。 該區(qū)間包含95%的總體參數(shù)。 該區(qū)間有95%的可能包含總體參數(shù)。 該區(qū)間包含總體參數(shù),可信度為95%。, ,小 結(jié),1、從同一總體中反復(fù)多次地隨機(jī)抽取若干份樣本,各樣本統(tǒng)計(jì)量之間以及樣本統(tǒng)計(jì)量與總體參數(shù)之間存在差異,此現(xiàn)象稱抽樣誤差。 2、反映抽樣誤差大小的指標(biāo)是標(biāo)準(zhǔn)誤。 3、來(lái)自正態(tài)總體的樣本均數(shù),其分布仍服從正態(tài)分布。 4、從偏峰分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似于正態(tài)分布。 5、要注意均數(shù)的標(biāo)準(zhǔn)誤與原變量的標(biāo)準(zhǔn)差之間的區(qū)別,不能混淆其意義。,2、當(dāng)X服從正態(tài)分布N(,2)時(shí),統(tǒng)計(jì)量 t = 服從自由度為v=n-1的t分布 自由度v不同,t分布的形狀不同; 自由度v很大很大時(shí),t分布近似標(biāo)準(zhǔn)正態(tài)分布。,3、參數(shù)估計(jì)有兩種方法: 點(diǎn)估計(jì):直接用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù) 區(qū)間估計(jì):按一定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版房地產(chǎn)反擔(dān)保抵押合同附件十3篇
- 二零二五年度綠色物流鋼材運(yùn)輸服務(wù)合同2篇
- 二零二五年度車(chē)輛租賃與車(chē)輛銷(xiāo)售服務(wù)合同2篇
- 二零二五年度高端商務(wù)汽車(chē)租賃服務(wù)合同協(xié)議2篇
- 二零二五版冷鏈物流訂餐服務(wù)合同范本與質(zhì)量保證2篇
- 二零二五年擔(dān)保合同范本修訂要點(diǎn)與執(zhí)行建議6篇
- 二零二五版房產(chǎn)抵押投資合作合同范本3篇
- 二零二五版物流運(yùn)輸企業(yè)勞動(dòng)合同范本與司機(jī)權(quán)益保障服務(wù)合同3篇
- 二零二五年度房地產(chǎn)經(jīng)紀(jì)服務(wù)合同補(bǔ)充協(xié)議2篇
- 二零二五版12333職業(yè)培訓(xùn)補(bǔ)貼政策合同3篇
- 上海紐約大學(xué)自主招生面試試題綜合素質(zhì)答案技巧
- 辦公家具項(xiàng)目實(shí)施方案、供貨方案
- 2022年物流服務(wù)師職業(yè)技能競(jìng)賽理論題庫(kù)(含答案)
- ?;钒踩僮饕?guī)程
- 連鎖遺傳和遺傳作圖
- DB63∕T 1885-2020 青海省城鎮(zhèn)老舊小區(qū)綜合改造技術(shù)規(guī)程
- 高邊坡施工危險(xiǎn)源辨識(shí)及分析
- 中海地產(chǎn)設(shè)計(jì)管理程序
- 簡(jiǎn)譜視唱15942
- 《城鎮(zhèn)燃?xì)庠O(shè)施運(yùn)行、維護(hù)和搶修安全技術(shù)規(guī)程》(CJJ51-2006)
- 項(xiàng)目付款審核流程(visio流程圖)
評(píng)論
0/150
提交評(píng)論