




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室金英良第四章抽樣誤差與假設(shè)檢驗(yàn)本章主要要內(nèi)容:第一節(jié)均均數(shù)數(shù)的抽樣樣誤差與與標(biāo)準(zhǔn)誤誤差第二節(jié)總總體體均數(shù)的的估計(jì)第三節(jié)假假設(shè)設(shè)檢驗(yàn)的的意義和和步驟第一節(jié)均均數(shù)的抽抽樣誤差差與標(biāo)準(zhǔn)準(zhǔn)誤差假定某年年某地所所有13歲女學(xué)學(xué)生身高高服從總總體均數(shù)數(shù)μ=155.4cm,,總體標(biāo)準(zhǔn)準(zhǔn)差σ=5..3cm的正態(tài)分分布N(155.4,5..32)。隨機(jī)抽取取30人人為一個(gè)個(gè)樣本((n=30),并計(jì)算樣樣本的均均數(shù)和標(biāo)標(biāo)準(zhǔn)差,,共抽取取100次,可可以得到到100份樣本本,每份份樣本可可以計(jì)算算相應(yīng)的的均數(shù)和和標(biāo)準(zhǔn)差差。1.156..75.16158..15.21155..65.3299.154..65.15100..156.65.25μ=155.4cmσ=5..3cmXS一百個(gè)樣樣本抽樣誤差差(smplingerror)這種由抽抽樣造成成的樣本統(tǒng)計(jì)計(jì)量與總體參數(shù)數(shù)之間的差差異成為為抽樣誤誤差.總體樣本隨機(jī)抽樣
統(tǒng)計(jì)量
參數(shù)
只要有個(gè)個(gè)體變異異和隨機(jī)機(jī)抽樣研研究,抽抽樣誤差差就是不可避免免的。若從正態(tài)態(tài)總體N(μ,,σ2)中,反復(fù)復(fù)多次隨隨機(jī)抽取取樣本含含量固定定為n的樣本,,那么這這些樣本本均數(shù)也服從正正態(tài)分布布。樣本本均數(shù)的總體均均數(shù)仍為為μ,樣本均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差為,其計(jì)算公公式為::中心極限限定理SAMPLE1:x11x12x13x14...x1nSAMPLE2:x21x22x23x24...x2nSAMPLEk:xk1xk2xk3xk4...xkn原始總體μk個(gè)樣本均均數(shù)的頻頻數(shù)分布布圖標(biāo)準(zhǔn)誤(standarderror,SE)樣本均數(shù)數(shù)的標(biāo)準(zhǔn)準(zhǔn)差。它反映了了來(lái)自同同一總體體的樣本本均數(shù)之之間的離離散程度度以及樣樣本均數(shù)數(shù)和總體體均數(shù)的的差異程程度,即均數(shù)的的抽樣誤誤差的大大小。統(tǒng)計(jì)上用用標(biāo)準(zhǔn)誤誤來(lái)衡量量抽樣誤誤差的大大??!由于在實(shí)實(shí)際工作作中,總總體標(biāo)準(zhǔn)準(zhǔn)差σ往往未知知,而是是用樣本本標(biāo)準(zhǔn)差差S來(lái)代替σ,故只能求求得樣本本均數(shù)標(biāo)標(biāo)準(zhǔn)誤的的估計(jì)值值SX,其計(jì)算公公式為::估計(jì)例4..1某某市隨隨機(jī)抽查查成年男男子140人,得紅紅細(xì)胞均均數(shù)4.77×1012/L,標(biāo)準(zhǔn)差差0.38×1012/L,計(jì)算其其標(biāo)準(zhǔn)誤誤。第二節(jié)總總體均數(shù)數(shù)的估計(jì)計(jì)1.統(tǒng)計(jì)推斷斷(statisticalinference)在總體中中隨機(jī)抽抽取一定定數(shù)量觀(guān)觀(guān)察單位位作為樣樣本進(jìn)行行抽樣研研究,然然后由樣樣本信息息推斷總總體特征征,這一一過(guò)程稱(chēng)稱(chēng)為統(tǒng)計(jì)計(jì)推斷。。一、可信信區(qū)間的的概念統(tǒng)計(jì)推斷斷參數(shù)估計(jì)計(jì)假設(shè)檢驗(yàn)驗(yàn)點(diǎn)估計(jì)區(qū)間估計(jì)計(jì)(可信信區(qū)間))2.參數(shù)估計(jì)計(jì)(parameterestimation)是指由樣樣本統(tǒng)計(jì)計(jì)量估計(jì)計(jì)總體參參數(shù),是是統(tǒng)計(jì)推推斷的一一個(gè)重要要內(nèi)容。。(1)點(diǎn)估計(jì)計(jì)(pointestimation)用樣本統(tǒng)統(tǒng)計(jì)量直直接作為為總體參參數(shù)的估估計(jì)值。。(2)區(qū)間估估計(jì)(intervalestimation)又稱(chēng)可信信區(qū)間((置信區(qū)區(qū)間,CI)按預(yù)先給給定的概概率,計(jì)計(jì)算出一一個(gè)區(qū)間間,使它它能夠包包含未知知的總體體均數(shù)。。μ=155.4cm身高(cm)總體均數(shù)數(shù)的95%可信信區(qū)間,,平均有有95個(gè)個(gè)可信區(qū)區(qū)間包括括了總體體均數(shù)μ,只有5個(gè)個(gè)可信區(qū)區(qū)間不包包括μ,即估計(jì)錯(cuò)錯(cuò)誤。進(jìn)行100次抽抽樣,每每次樣本本量為n=30,利用樣本本均數(shù)和和標(biāo)準(zhǔn)差差估計(jì)總總體均數(shù)數(shù)范圍。。3.可信區(qū)間間有兩個(gè)個(gè)要素::(1)準(zhǔn)確度((accuracy)可信度的的大小,,即可信信區(qū)間包包容μ的概率大大小(1-α)。(2)精密度((precision))反映在區(qū)區(qū)間的長(zhǎng)長(zhǎng)度,區(qū)區(qū)間長(zhǎng)度度越小精精密度越越高。一般情況況下,95%的的可信區(qū)區(qū)間更為為常用。。在可信度度確定的的情況下下,增加加樣本量量,可減減少區(qū)間間長(zhǎng)度,,提高精精密度。。t分布是t檢驗(yàn)的基基礎(chǔ),亦亦稱(chēng)studentt檢驗(yàn),是是計(jì)量資資料中最最常用的的假設(shè)檢檢驗(yàn)方法法。戈塞特(WilliamSealeyGosset)英國(guó)著名名統(tǒng)計(jì)學(xué)學(xué)家。出出生于英英國(guó)肯特特郡坎特特伯雷市市,求學(xué)學(xué)于曼徹徹斯特學(xué)學(xué)院和牛牛津大學(xué)學(xué),主要要學(xué)習(xí)化化學(xué)和數(shù)數(shù)學(xué)。二、總體體均數(shù)可可信區(qū)間間的計(jì)算算1899年作為為一名釀釀酒師進(jìn)進(jìn)入愛(ài)爾爾蘭的都都柏林一一家啤酒酒廠(chǎng)工作作,在那那里他涉涉及到有有關(guān)釀造造過(guò)程的的數(shù)據(jù)處處理問(wèn)題題。由于釀酒酒廠(chǎng)的規(guī)規(guī)定禁止止戈塞特特發(fā)表關(guān)關(guān)于釀酒酒過(guò)程變變化性的的研究成成果,因因此戈塞塞特不得得不于1908年,首首次以““學(xué)生””(Student)為筆名,,在《生生物計(jì)量量學(xué)》雜雜志上發(fā)發(fā)表了““平均數(shù)數(shù)的概率率誤差””。Gosset在文章中中使用Z統(tǒng)計(jì)量來(lái)來(lái)檢驗(yàn)常常態(tài)分配配母群的的平均數(shù)數(shù)。由于于這篇文文章提供供了“學(xué)學(xué)生t檢驗(yàn)”的的基礎(chǔ),,為此,,許多統(tǒng)統(tǒng)計(jì)學(xué)家家把1908年年看作是是統(tǒng)計(jì)推推斷理論論發(fā)展史史上的里里程碑。。隨機(jī)變量量XN(m,s2)標(biāo)準(zhǔn)正態(tài)態(tài)分布N(0,,12)u變換當(dāng)總體均數(shù)與標(biāo)準(zhǔn)差未知時(shí)均數(shù)標(biāo)準(zhǔn)正態(tài)態(tài)分布N(0,,12)在實(shí)際工工作中,,往往往往未知,,常用代代替替進(jìn)行變變換,即即不服從標(biāo)標(biāo)準(zhǔn)正態(tài)態(tài)分布!!而服從自自由度υ=n--1的t分布
f(t)
=∞(標(biāo)準(zhǔn)正態(tài)曲線(xiàn))
=5
=10.10.2-4-3-2-1012340.3t分布1、以0為中心心,左右右對(duì)稱(chēng)的的單峰分分布。2、t分布曲線(xiàn)線(xiàn)是一簇簇曲線(xiàn),,其形態(tài)態(tài)變化與與自由度度ν的大小有有關(guān)系((ν=n-1))。t分布的特特征:自由度越越小,t分布的峰峰越低,,而兩側(cè)側(cè)尾部翹翹得越高高;自由度逐逐漸增大大時(shí),t分布逐漸漸逼近標(biāo)標(biāo)準(zhǔn)正態(tài)態(tài)分布,,當(dāng)自由由度為無(wú)無(wú)窮大時(shí)時(shí),t分布就是是標(biāo)準(zhǔn)正正態(tài)分布布。為便于使使用,統(tǒng)統(tǒng)計(jì)學(xué)家家編制了了不同自自由度ν對(duì)應(yīng)的t界值表。。t分布的用用途:主要用于于總體均均數(shù)的區(qū)區(qū)間估計(jì)計(jì)及t檢驗(yàn)。s未知且且n較?。╪<50)按t分布但n足夠大((n>50)按按u分布s已知按u分布總體均數(shù)數(shù)可信區(qū)區(qū)間的計(jì)計(jì)算方法法,隨總總體標(biāo)準(zhǔn)準(zhǔn)差s是否已知知,以及及樣本含含量n的大小而而異。通常有t分布和u分布兩類(lèi)方法法:(一)σ已知u變換公式式:-1.96+1.962.5%2.5%95%(二)σ未知1.n較?。╪<50)-tt02.n較大(n>50)例4.2某醫(yī)生測(cè)測(cè)得25名動(dòng)脈粥粥樣硬化化患者血血漿纖維維蛋白原原含量的的均數(shù)為為3.32g/L,標(biāo)準(zhǔn)差差為0.57g/L,試計(jì)算算該種病病人血漿漿纖維蛋蛋白原含含量總體體均數(shù)的的95%可信區(qū)間間。該種病人人血漿纖纖維蛋白白原含量量總體均均數(shù)的95%可信區(qū)間間為3.09g/L~3.56g/L例4.3試計(jì)算例例4.1中該地成成年男子子紅細(xì)胞胞總體均均數(shù)的95%可信區(qū)間間。該地成年年男子紅紅細(xì)胞總總體均數(shù)數(shù)的95%可信區(qū)間間為4.71×1012/L~4.83×1012/L第三節(jié)假假設(shè)設(shè)檢驗(yàn)的的意義和和步驟一、假設(shè)設(shè)檢驗(yàn)的的基本思思想“反證法法”的思思想先根據(jù)研研究目的的建立假假設(shè),從從H0假設(shè)出發(fā)發(fā),先假假設(shè)它是是正確的的,再分分析樣本本提供的的信息是是否與H0有較大矛矛盾,即即是否支支持H0,若樣本信信息不支支持H0,便拒絕之之并接受受H1,否則不不拒絕H0。例4.4以以往通過(guò)過(guò)大規(guī)模模調(diào)查已已知某地地新生兒兒出生體體重為3.30kg..從該地難難產(chǎn)兒中中隨機(jī)抽抽取35名新生兒兒作為研研究樣本本,平均均出生體體重為3.42kg,,標(biāo)準(zhǔn)差為為0.40kg。問(wèn)該地難難產(chǎn)兒出出生體重重是否與與一般新新生兒體體重不同同?μ0=3.30kg次/分μ已知總體體未知總體體n=35,=3.42kgS=0..40kg
與μ0之間的差異(不相等),有兩種可能:1、μ=μ0,僅因?yàn)橛?/p>
去估計(jì)μ時(shí)存在抽樣誤差,所以導(dǎo)致了
與μ0之間的差異。2、μ與μ0本身就不相等,所以導(dǎo)致了
與μ之間的差異。假設(shè)檢驗(yàn)驗(yàn)的基本本原理:
抽樣誤差差所致P>0..05(來(lái)自同同一總體體)?假設(shè)檢驗(yàn)驗(yàn)回答本身存在在差別P<0..05(來(lái)自不不同總體體)兩均數(shù)兩兩率不等等二、假設(shè)設(shè)檢驗(yàn)的的基本步步驟1.建立假設(shè)設(shè)檢驗(yàn)和和確定檢檢驗(yàn)水準(zhǔn)準(zhǔn)H0(無(wú)效假假設(shè)):μ==μ0H1(備擇假假設(shè)):μ≠≠μ0(雙側(cè)檢檢驗(yàn))檢驗(yàn)水準(zhǔn)準(zhǔn):在實(shí)際工工作中一一般取0.05。它確確定了小小概率事事件的標(biāo)標(biāo)準(zhǔn),即即規(guī)定了了概率不不超過(guò)α就是小概概率事件件。μ>μ0(單側(cè)檢驗(yàn)驗(yàn))μ<μ0(單側(cè)檢驗(yàn)驗(yàn))α=0.05例如:要要比較經(jīng)經(jīng)常參加加體育鍛鍛煉的中中學(xué)男生生心率是是否低于于一般中中學(xué)男生生的心率率,就屬屬于單側(cè)側(cè)檢驗(yàn)。。H1:μ≠μ0,雙側(cè),,μ<μ0與μ>μ0都有可能能H1:μ>μ0,單側(cè)H1:μ<μ0,單側(cè)單、雙側(cè)側(cè)檢驗(yàn)單雙側(cè)問(wèn)問(wèn)題要由由專(zhuān)業(yè)知知識(shí)確定定2.選擇檢驗(yàn)驗(yàn)方法和和計(jì)算統(tǒng)統(tǒng)計(jì)量根據(jù)資料料的類(lèi)型型和分析析目的選選擇適當(dāng)當(dāng)?shù)臋z驗(yàn)驗(yàn)方法,,并根據(jù)據(jù)選擇的的方法計(jì)計(jì)算相應(yīng)應(yīng)的統(tǒng)計(jì)計(jì)量。3.確定概率率P值和作出出統(tǒng)計(jì)推推斷樣本統(tǒng)計(jì)計(jì)量值的的概率P樣本統(tǒng)計(jì)計(jì)量值的的概率P用P值與檢驗(yàn)驗(yàn)水準(zhǔn)α進(jìn)行比較較,根據(jù)據(jù)比較結(jié)結(jié)果作出出統(tǒng)計(jì)推推斷。檢驗(yàn)水準(zhǔn)準(zhǔn)α確定的P值樣本統(tǒng)計(jì)計(jì)量值的的概率P檢驗(yàn)水準(zhǔn)準(zhǔn)α確定的P值樣本統(tǒng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年皮革、毛皮、羽絨制品項(xiàng)目建議書(shū)
- 2025年特殊教育服務(wù)項(xiàng)目建議書(shū)
- 2025年云計(jì)算軟件項(xiàng)目合作計(jì)劃書(shū)
- 2025年半導(dǎo)體分立器件合作協(xié)議書(shū)
- 領(lǐng)導(dǎo)力培訓(xùn)感悟
- 商用POS機(jī)企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 文具用品批發(fā)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 紙漿模制品企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 真絲文胸企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 船用廚房企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 2025年中考百日誓師活動(dòng)教師代表發(fā)言(三)
- 中國(guó)家用通風(fēng)電器具制造行業(yè)分析報(bào)告
- 生物-天一大聯(lián)考2025屆高三四省聯(lián)考(陜晉青寧)試題和解析
- 天津2025年天津市住房公積金管理中心招聘9人筆試歷年參考題庫(kù)附帶答案詳解-1
- 區(qū)間價(jià)格突破策略(TB版)
- 高中主題班會(huì) 遠(yuǎn)離背后“蛐蛐”課件-高二下學(xué)期人際交往主題班會(huì)
- 2024廣西公務(wù)員考試及答案(筆試、申論A、B類(lèi)、行測(cè))4套 真題
- 2024年山東省濟(jì)南市中考英語(yǔ)試題卷(含答案解析)
- 汽車(chē)坡道玻璃雨棚施工方案
- 新高考英語(yǔ)讀后續(xù)寫(xiě)——人物描寫(xiě)高級(jí)表達(dá)素材
- EN10204-2004中文版
評(píng)論
0/150
提交評(píng)論