參數(shù)估計基礎(chǔ)-課件_第1頁
參數(shù)估計基礎(chǔ)-課件_第2頁
參數(shù)估計基礎(chǔ)-課件_第3頁
參數(shù)估計基礎(chǔ)-課件_第4頁
參數(shù)估計基礎(chǔ)-課件_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

參數(shù)估計基礎(chǔ)9/9/20231參數(shù)估計基礎(chǔ)8/3/20231了解總體特征的最好方法是對總體的每一個體進行觀察、試驗,但這在醫(yī)學(xué)研究實際中往往不可行。對無限總體不可能對所有個體逐一觀察.對有限總體限于人力、財力、物力、時間或個體過多等原因,不可能也沒必要對所有個體逐一研究(如對一批罐頭質(zhì)量檢查)。借助抽樣研究。9/9/20232了解總體特征的最好方法是對總體的每一個體進行觀察、試驗,但這抽樣研究的目的是用樣本信息推斷總體特征,即用樣本資料計算的統(tǒng)計指標推斷總體參數(shù)常用的統(tǒng)計推斷方法有參數(shù)估計(總體均數(shù)和總體概率的估計)和假設(shè)檢驗9/9/20233抽樣研究的目的是用樣本信息推斷總體特征,即用樣本資料計算的統(tǒng)內(nèi)容復(fù)習(xí)參數(shù)估計假設(shè)檢驗研究總體統(tǒng)計描述樣本統(tǒng)計推斷隨機抽樣統(tǒng)計表統(tǒng)計圖統(tǒng)計指標9/9/20234內(nèi)容復(fù)習(xí)參數(shù)估計研究總體統(tǒng)計描述樣本統(tǒng)計推斷隨機統(tǒng)計表8/3第五章總體均數(shù)估計抽樣分布與抽樣誤差t分布總體均數(shù)的估計案例討論9/9/20235第五章總體均數(shù)估計抽樣分布與抽樣誤差8/3/20235復(fù)習(xí)一些概念參數(shù)(parameter)與統(tǒng)計量(statistics)參數(shù)獲取的途徑對總體進行研究抽樣研究抽樣誤差(samplingerror)1.抽樣誤差的概念:由個體變異產(chǎn)生的,隨機抽樣引起的樣本統(tǒng)計量與總體參數(shù)間的差異。(抽樣誤差=總體參數(shù)-樣本統(tǒng)計量)2.抽樣誤差產(chǎn)生的原因:3.抽樣誤差的特點:隨機,不可避免,有規(guī)律可循。4.在大量重復(fù)抽樣的情況下,可以展示其規(guī)律性9/9/20236復(fù)習(xí)一些概念參數(shù)(parameter)與統(tǒng)計量(statis第一節(jié)抽樣分布與抽樣誤差樣本均數(shù)的抽樣分布與抽樣誤差樣本頻率的抽樣分布與抽樣誤差9/9/20237第一節(jié)抽樣分布與抽樣誤差樣本均數(shù)的抽樣分布與抽樣誤差8/一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布

舉例總體樣本1樣本2樣本3……樣本n……9/9/20238一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布總體樣本1樣本2樣本3…一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布

抽樣模擬實驗假定總體:某年某地13歲女學(xué)生身高值X~N(155.4,5.3)隨機抽樣:n=30,K=1009/9/20239一、均數(shù)的抽樣誤差樣本均數(shù)的抽樣分布8/3/20239一、均數(shù)的抽樣誤差μ=155.4σ=5.3………實驗5-1從已知的13歲女生身高總體中隨機抽樣示意圖9/9/202310一、均數(shù)的抽樣誤差μ=155.4………實驗5-1從已知100個隨機樣本的樣本均數(shù)(n=30)

樣本號均數(shù)樣本號均數(shù)1156.751155.72158.152153.73155.653154.84155.254155.65155.055154.86156.456155.67154.957158.2…………45155.495156.146155.996152.747155.397155.148154.698155.349156.199154.650154.7100156.69/9/202311100個隨機樣本的樣本均數(shù)(n=30)

樣本號均數(shù)樣本號均數(shù)一、均數(shù)的抽樣誤差表5-2從總體N(155.4,5.32)抽樣得到100個樣本均數(shù)的頻數(shù)分布組段(cm)頻數(shù)頻率(%)152.6~11.0153.2~44.0153.8~44.0154.4~2222.0155.0~2525.0155.6~2121.0156.2~1717.0156.8~33.0157.4~22.0158.0~158.611.0合計100100.09/9/202312一、均數(shù)的抽樣誤差表5-2從總體N(155.4,5.32)

將此100個樣本均數(shù)看成新變量值,則這100個樣本均數(shù)構(gòu)成一新分布,繪制直方圖。圖3-2從正態(tài)分布總體N(155.4,5.3)隨機抽樣所得樣本均數(shù)分布9/9/202313將此100個樣本均數(shù)看成新變量值,則這100個樣一、均數(shù)的抽樣誤差

1、樣本均數(shù)的抽樣分布特點各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)的分布規(guī)律:圍繞著總體均數(shù)155.4cm,中間多,兩邊少,左右基本對稱,服從正態(tài)分布;樣本均數(shù)的變異較原變量的變異減小。9/9/202314一、均數(shù)的抽樣誤差1、樣本均數(shù)的抽樣分布特點8/3/202一、均數(shù)的抽樣誤差抽樣誤差概念:由于抽樣造成的樣本統(tǒng)計量與統(tǒng)計量以及樣本統(tǒng)計量與總體參數(shù)之間的差異叫作抽樣誤差。抽樣誤差產(chǎn)生的基本條件抽樣研究個體差異表現(xiàn)形式樣本統(tǒng)計量與樣本統(tǒng)計量之間的差異樣本統(tǒng)計量與總體參數(shù)之間的差異9/9/202315一、均數(shù)的抽樣誤差抽樣誤差8/3/202315一、均數(shù)的抽樣誤差

2、均數(shù)的抽樣誤差(1)概念:由個體變異產(chǎn)生的,隨機抽樣引起的樣本均數(shù)與總體均數(shù)間的差異。(均數(shù)的抽樣誤差=總體均數(shù)-樣本均數(shù))(2)表現(xiàn)形式:樣本均數(shù)與總體均數(shù)間存在差異樣本均數(shù)與樣本均數(shù)間存在差異9/9/202316一、均數(shù)的抽樣誤差2、均數(shù)的抽樣誤差8/3/202316

m…….9/9/202317

均數(shù)的抽樣誤差可表現(xiàn)為樣本均數(shù)與總體均數(shù)的差值均數(shù)的抽樣誤差也可表現(xiàn)為多個樣本均數(shù)間的離散程度

在實際科研中,上述二者都難以得到。9/9/202318均數(shù)的抽樣誤差可表現(xiàn)為樣本均數(shù)與總體均數(shù)的差值8/3/202

如何度量抽樣誤差的大小?如何揭示抽樣分布的規(guī)律?中心極限定理為我們提供解決辦法:9/9/2023198/3/202319中心極限定理(centrallimittheorem)從均數(shù)為

、標準差為

的總體中獨立隨機抽樣,當樣本含量n增加時,樣本均數(shù)的分布將趨于正態(tài)分布,此分布的均數(shù)為

,標準差為。X~N~N9/9/202320中心極限定理(centrallimittheorem)X標準誤(standarderror,SE)樣本統(tǒng)計量的標準差稱為標準誤,用來衡量抽樣誤差的大小。樣本均數(shù)的標準差稱為標準誤。此標準誤與個體變異

成正比,與樣本含量n的平方根成反比。9/9/202321標準誤(standarderror,SE)8/3/20233、均數(shù)的標準誤(standarderror)(1)概念:將樣本均數(shù)的標準差稱為均數(shù)的標準誤,它是描述均數(shù)抽樣誤差大小的指標(2)計算:

實際工作中,

往往是未知的,一般可用樣本標準差s代替

:一、均數(shù)的抽樣誤差9/9/2023223、均數(shù)的標準誤(standarderror)一、均數(shù)的3、均數(shù)的標準誤

(standarderror)(3)統(tǒng)計學(xué)意義均數(shù)的標準誤越大,樣本均數(shù)的分布越分散,樣本均數(shù)離總體均數(shù)就越遠,樣本均數(shù)與總體均數(shù)的差別越大,抽樣誤差越大;抽樣誤差越大,由樣本均數(shù)估計總體均數(shù)的可靠性越差。反之,亦然。(4)影響抽樣誤差大小的因素

標準差樣本含量n

實際工作中,可通過適當增加樣本含量n來減少均數(shù)的標準誤,從而降低抽樣誤差。9/9/2023233、均數(shù)的標準誤(standarderror)(3)統(tǒng)計3個抽樣實驗結(jié)果圖示3個抽樣實驗結(jié)果圖示

4、總體分布非正態(tài)分布時,樣本均數(shù)的分布規(guī)律

中心極限定理表明,即使從非正態(tài)總體中隨機抽樣,只要樣本含量足夠大,樣本均數(shù)的分布也趨于正態(tài)分布.樣本均數(shù)的總體均數(shù)仍等于μ;樣本均數(shù)的標準誤仍滿足均數(shù)標準誤的計算式;當n較小時,樣本均數(shù)的分布是偏態(tài)的;當n足夠大(n≥50)樣本均數(shù)的分布近似正態(tài)分布一、均數(shù)的抽樣誤差9/9/2023254、總體分布非正態(tài)分布時,樣本均數(shù)的分布規(guī)律一、均數(shù)的抽樣

非正態(tài)總體樣本均數(shù)的抽樣實驗圖5-1(a)是一個正偏峰的分布,用電腦從中隨機抽取樣本含量分別為5,10,30和50的樣本各1000次,計算樣本均數(shù)并繪制4個直方圖9/9/202326非正態(tài)總體樣本均數(shù)的抽樣實驗8/3/2023269/9/2023278/3/2023279/9/2023288/3/2023289/9/2023298/3/2023299/9/2023308/3/2023309/9/2023318/3/202331⑴當原分布N(155.40,5.3)為正態(tài)分布時,則樣本均數(shù)的分布N(155.38,1.71)也為正態(tài)分布;當原分布為偏態(tài)分布時,當樣本含量足夠大時,樣本均數(shù)的分布也為近似正態(tài)分布。所以,不論原分布的分布類型如何,樣本均數(shù)的分布均為正態(tài)分布。⑵原分布可以用μ和σ來描述其分布特征;同樣,樣本均數(shù)的分布也可以用樣本均數(shù)的均數(shù)和樣本均數(shù)的標準差表示其分布特征。9/9/202332⑴當原分布N(155.40,5.3)為正態(tài)分布時,則樣本將樣本均數(shù)的標準差稱為均數(shù)的標準誤。標準誤反映樣本抽樣誤差的大小,是說明樣本均數(shù)可靠性的一個指標,常用的形式來表示樣本均數(shù)的可靠程度。9/9/202333將樣本均數(shù)的標準差稱為均數(shù)的標準誤。標準誤反映樣本抽樣誤差的影響抽樣誤差大小的因素有:⑴樣本標準差。S越大,也就越大。⑵樣本含量。n越大,抽樣誤差越小。因此如在一定標準差條件下,加大樣本含量,可減少抽樣誤差,以保證的樣本均數(shù)的代表性和可靠性。9/9/202334影響抽樣誤差大小的因素有:8/3/202334例6-12000年某研究者隨機調(diào)查某地健康成年男子27人,得到血紅蛋白量的均數(shù)為125g/L,標準差為15g/L。試估計該樣本均數(shù)的抽樣誤差。===2.89g/L9/9/202335例6-12000年某研究者隨機調(diào)查某地健康成年男子27人樣本頻率的抽樣分布與抽樣誤差在一口袋內(nèi)裝有形狀、重量完全相同的黑球和白球,已知黑球比例為20%(總體概率π=20%),從口袋中每摸一次看清顏色后放回去,攪勻后再摸,重復(fù)摸球35次(n=35),計算摸到黑球的百分比(樣本頻率p

i)。重復(fù)這樣的實驗100次,每次得到100個黑球的比例分別為14.4%,19.8%,20.2%,22.5%,······等,將其頻數(shù)分布列于表6-3。9/9/202336樣本頻率的抽樣分布與抽樣誤差在一口袋內(nèi)裝有形狀、黑球比例%樣本頻數(shù)樣本頻率(%)5.0~33.08.0~77.011.0~55.014.0~88.017.0~1616.020.0~2222.022.0~1515.025.0~77.028.0~77.031.0~55.034.0~33.040.0~22.0合計100100.0

表6-3總體概率為20%時的隨機抽樣結(jié)果(ni=35)9/9/202337黑球比例%樣本頻數(shù)樣本頻率(%)5.0~33.0抽樣分布與抽樣誤差頻率的抽樣誤差:這種樣本率樣本頻率與樣本率樣本頻率之間、樣本率樣本頻率與總體率總體概率之間的差異。頻率的標準誤:表示頻率的抽樣誤差的指標9/9/202338抽樣分布與抽樣誤差頻率的抽樣誤差:這種樣本率樣本頻率與樣本率樣本頻率的總體均數(shù)參數(shù)為π,

率的標準誤計算公式(5-3):公式(6-4)

9/9/2023398/3/202339例6-2某市隨機調(diào)查了50歲以上的中老年婦女776人,其中患有骨質(zhì)疏松癥者322人,患病率為41.5%,試估計該樣本頻率的抽樣誤差。p=41.5%=0.415,n=776=9/9/202340例6-2某市隨機調(diào)查了50歲以上的中老年婦女776人,其思考題:什么是抽樣誤差?決定抽樣誤差大小的因素有哪些?抽樣誤差能避免么?抽樣誤差有規(guī)律么?標準誤和標準差有何區(qū)別與聯(lián)系?9/9/202341思考題:8/3/202341標準誤和標準差有何區(qū)別與聯(lián)系9/9/202342標準誤和標準差有何區(qū)別與聯(lián)系8/3/202342第二節(jié)t分布t分布的概念t分布的特征t界值表9/9/202343第二節(jié)t分布t分布的概念8/3/202343一、t分布的概念隨機變量X~N(m,s2)標準正態(tài)分布N(0,1)Z變換t分布(ν=n-1)標準正態(tài)分布N(0,1)9/9/202344一、t分布的概念隨機變量X~N(m,s2)標準正態(tài)分布N(0t分布設(shè)從正態(tài)分布N(

,

2)中隨機抽取含量為n的樣本,樣本均數(shù)和標準差分別為和s,設(shè):

則t值服從自由度為n-1的t分布(t-distribution)。Gosset于1908年在《生物統(tǒng)計》雜志上發(fā)表該論文時用的是筆名“Student”,故t分布又稱Studentt分布。

9/9/202345t分布設(shè)從正態(tài)分布N(,2)中隨機抽取含量為n的樣本,樣二、t值與t分布學(xué)習(xí)t分布的意義事實上,任何一個樣本統(tǒng)計量均有其分布的特點和規(guī)律。統(tǒng)計量的抽樣分布規(guī)律是進行統(tǒng)計推斷的理論基礎(chǔ)。

t分布是十分有用的,它是總體均數(shù)的區(qū)間估計和假設(shè)檢驗的理論基礎(chǔ)。9/9/202346二、t值與t分布學(xué)習(xí)t分布的意義8/3/202346

從前述實驗的13歲女學(xué)生身高這個正態(tài)總體中分別作樣本量為3和50的隨機抽樣,各抽取1000份樣本,并分別得到1000個樣本均數(shù)及其標準誤。對它們分別作t變換,并將t值繪制相應(yīng)的直方圖,可得到t值分布曲線圖9/9/202347從前述實驗的13歲女學(xué)生身高這個正態(tài)總體中分別作樣本9/9/2023488/3/202348三、t分布的特征t分布的圖形t分布的參數(shù):ν=n-1自由度ν對圖形的影響t分布的極限是標準正態(tài)分布t分布曲線下的尾部面積(概率)-t界值表9/9/202349三、t分布的特征t分布的圖形8/3/202349t分布t值的分布與自由度

有關(guān)(實際是樣本含量n不同)。t分布的圖形不是一條曲線,而是一簇曲線。υ=∞(標準正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖9/9/202350t分布t值的分布與自由度有關(guān)(實際是樣本含量n不同)。tt分布的特征

t分布為一簇單峰分布曲線t分布以0為中心,左右對稱t分布只有一個特征參數(shù),即為自由度(υ)。

t分布與自由度

有關(guān),自由度越小,t分布的峰越低,而兩側(cè)尾部翹得越高,;自由度逐漸增大時,t分布逐漸逼近標準正態(tài)分布;當自由度為無窮大時,t分布就是標準正態(tài)分布。

9/9/202351t分布的特征

t分布為一簇單峰分布曲線8/3/202351

=∞(標準正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3圖5.2自由度分別為1、5、∞時的t分布9/9/202352=∞(標準正態(tài)曲線)=5=10.10.2-4-3t分布曲線下的面積規(guī)律同標準正態(tài)分布一樣,統(tǒng)計應(yīng)用中最關(guān)心的是t分布曲線下的尾部面積(即概率)與橫軸t值間的關(guān)系。每一自由度下的t分布曲線都有其自身分布規(guī)律9/9/202353t分布曲線下的面積規(guī)律同標準正態(tài)分布一樣,統(tǒng)計應(yīng)用中最關(guān)心t界值表

(tcriticalvalue)統(tǒng)計學(xué)家將t分布曲線下的尾部面積(即概率P)與橫軸t值間的關(guān)系編制了不同自由度

下的t界值表(附表2)(467頁)橫標目為自由度(υ=n-1)縱標目為概率P(即曲線下尾部陰影部分面積)表中的數(shù)字為相應(yīng)的t界值(t≥0)單側(cè)概率(one-tailedprobability)所對應(yīng)的t界值記為tα,ν雙側(cè)概率(two-tailedprobability)所對應(yīng)的t界值記為tα/2,ν9/9/202354t界值表(tcriticalvalue)統(tǒng)計學(xué)家將t分9/9/2023558/3/202355更一般的表示方法如圖5-4(a)和(b)中陰影部分所示為:單側(cè):P(t

t

,

)=

和P(t

t

,

)=

雙側(cè):P(t

t

/2,

)+P(t

t

/2,

)=

9/9/202356更一般的表示方法如圖5-4(a)和(b)中陰影部分所示為:8t界值表

(tcriticalvalue)不同自由度下的t界值表:附表2

查t0.05,16=1.746(單側(cè))

P(t≥1.746)=0.05或P(t≤-1.746)=0.05查t0.05/2,16=1.746(雙側(cè))

P(t≥1.746)+P(t≤-1.746)=0.05或P(-1.746<t<1.746)=0.95

t分布曲線的兩端尾部面積表示在隨機抽樣中獲得的等于及大于某|t|值(界值)的概率,即P值。9/9/202357t界值表(tcriticalvalue)不同自由度下的9/9/2023588/3/202358t界值表

(tcriticalvalue)t界值表的特點

同一自由度下,t值越大則P值越小;

P值相同時,υ越大,則t值越小;在相同的t值時,雙側(cè)概率為單側(cè)概率的兩倍即t0.10/2,16=t0.05,16=1.746υ→∞時,t界值為Z界值9/9/202359t界值表(tcriticalvalue)t界值表的特點t界值表

(tcriticalvalue)t界值表的用途已知υ和P(α),可查到相應(yīng)的t界值;已知υ和t界值,可確定單側(cè)或雙側(cè)概率P進行總體均數(shù)估計和均數(shù)的假設(shè)檢驗9/9/202360t界值表(tcriticalvalue)t界值表的用途第三節(jié)總體均數(shù)及總體概率的估計抽樣研究:從總體到樣本實際工作:由樣本推斷總體統(tǒng)計推斷(statisticalinference)就是根據(jù)樣本所提供的信息,以一定的概率推斷總體的性質(zhì)。9/9/202361第三節(jié)總體均數(shù)及總體概率的估計抽樣研究:從總體到樣本8/3第三節(jié)總體均數(shù)估計參數(shù)估計(parameterestimation)的概念概念用樣本統(tǒng)計量估計總體參數(shù)方法點估計(pointestimation)區(qū)間估計(intervalestimation)9/9/202362第三節(jié)總體均數(shù)估計參數(shù)估計(parameterestim點估計直接用樣本統(tǒng)計量作為總體參數(shù)的估計值方法簡單,但未考慮抽樣誤差的大小在實際問題中,總體參數(shù)往往是未知的,但它們是固定的值,并不是隨機變量值。而樣本統(tǒng)計量隨樣本的不同而不同,屬隨機的。

9/9/202363點估計直接用樣本統(tǒng)計量作為總體參數(shù)的估計值8/3/2023區(qū)間估計按一定的概率或可信度(1-

),用一個區(qū)間估計總體參數(shù)所在范圍,這個范圍稱作可信度為1-

的可信區(qū)間(confidenceinterval,CI),又稱置信區(qū)間。這種估計方法稱為區(qū)間估計。通常用樣本均數(shù)和均數(shù)的標準誤估計總體均數(shù)的95%(或99%)置信區(qū)間9/9/202364區(qū)間估計按一定的概率或可信度(1-),用一個區(qū)間估計總體

總體均數(shù)置信區(qū)間的計算需考慮:

(1)總體標準差

是否已知,(2)樣本含量n的大小通常有兩類方法:

(1)t分布法——

未知

(2)正態(tài)近似法——

已知

未知但n足夠大

總體均數(shù)的區(qū)間估計的計算:9/9/202365總體均數(shù)置信區(qū)間的計算需考慮:總體均數(shù)的區(qū)間估計的計算:8一、樣本均數(shù)估計總體均數(shù)總體均數(shù)的置信區(qū)間1.t分布法適用條件:σ未知時,按t分布原理估計總體均數(shù)的置信區(qū)間。計算公式:

9/9/202366一、樣本均數(shù)估計總體均數(shù)總體均數(shù)的置信區(qū)間8/3/20236一、樣本均數(shù)估計總體均數(shù)總體均數(shù)的置信區(qū)間2、正態(tài)近似法適用條件:σ未知但樣本含量足夠大(n≥100)時,按正態(tài)分布原理估計總體均數(shù)的置信區(qū)間。計算公式:9/9/202367一、樣本均數(shù)估計總體均數(shù)總體均數(shù)的置信區(qū)間8/3/20236例1:為了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機抽取了1歲嬰兒35人,測得其血紅蛋白均數(shù)為123.7g/L,標準差為11.9g/L。試估計該地1歲嬰兒的血紅蛋白平均濃度。分析:已知樣本標準差s,樣本例數(shù)n=35,不知到總體的信息,選用t分布法估計總體均數(shù)的可信區(qū)間。95%的CI公式為:例2:某地抽得正常成人200名,測得其血清膽固醇的均數(shù)為3.64mmol/L,標準差為1.20mmol/L,試估計該地正常成人血清膽固醇均數(shù)的95%和99%置信區(qū)間9/9/202368例1:為了解某地1歲嬰兒的血紅蛋白濃度,從該地隨機抽取了1歲例

隨機抽取12名口腔癌患者,檢測其發(fā)鋅含量,得均數(shù)為253.05

g/g,標準差為27.18

g/g,求發(fā)鋅含量總體均數(shù)95%的可信區(qū)間。

本例自由度

=12-1=11,經(jīng)查表得t0.05,11=2.201,則即口腔癌患者發(fā)鋅含量總體均數(shù)的95%可信區(qū)間為:193.23~321.87(

g/g)。用該區(qū)間估計口腔癌患者發(fā)鋅含量總體均數(shù)的可信度為95%。

9/9/202369例隨機抽取12名口腔癌患者,檢測其發(fā)鋅含量,得均數(shù)為25-tt09/9/202370-tt08/3/202370例

某地120名12歲男孩身高均數(shù)為142.67cm,標準差為0.5477cm,計算該地12歲男孩身高總體均數(shù)90%的可信區(qū)間。因n=120>100,故可以用標準正態(tài)分布代替t分布,u0.10=1.64

即該地12歲男孩平均身高的90%可信區(qū)間為:141.77~143.57(cm),可認為該地12歲男孩平均身高在141.77~143.57(cm)之間。

9/9/202371例某地120名12歲男孩身高均數(shù)為142.67cm,標準9/9/2023728/3/202372三、應(yīng)注意的一些問題

置信區(qū)間和置信限的關(guān)系準確度與精密度的關(guān)系9/9/202373三、應(yīng)注意的一些問題置信區(qū)間和置信限的關(guān)系8/3/2023正確理解可信區(qū)間的涵義可信區(qū)間一旦形成,它要么包含總體參數(shù),要么不包含總體參數(shù),二者必居其一,無概率可言。所謂95%的可信度是針對可信區(qū)間的構(gòu)建方法而言的。

以均數(shù)的95%可信區(qū)間為例,其涵義是:如果重復(fù)100次抽樣,每100個樣本所算得的100個可信區(qū)間,則在此100個可信區(qū)間內(nèi),理論上有95個包含總體均數(shù),而有5個不包含總體均數(shù)。9/9/202374正確理解可信區(qū)間的涵義可信區(qū)間一旦形成,它要么包含總體參數(shù),可信區(qū)間和可信限的關(guān)系可信限:分別指兩個點值,分別稱為下限值和上限值??尚艆^(qū)間:是指以上、下可信限為界的一個范圍。用公式表示可信限;用表示可信區(qū)間。9/9/202375可信區(qū)間和可信限的關(guān)系可信限:分別指兩個點值,分別稱為下限值置信區(qū)間的解釋

總體均數(shù)的95%置信區(qū)間:如果從總體中重復(fù)抽取100份樣本含量相同的獨立樣本,每份樣本可分別計算一個置信區(qū)間,那么在100個置信區(qū)間中,大約有95個置信區(qū)間包括μ(估計正確),只有5個置信區(qū)間不包括μ(估計錯誤)。

或者說對于某一個區(qū)間而言,它包含總體均數(shù)的可能性為95%,而不包含總體均數(shù)的可能性僅為5%。因此在實際應(yīng)用中,以這種方法估計總體均數(shù)犯錯誤的概率僅為5%。

置信區(qū)間的解釋總體均數(shù)的95%置信區(qū)間:如果圖4.1100個來自N(0,1)的樣本所估計的可信區(qū)間示意

9/9/202377圖4.1100個來自N(0,1)的樣本所估計的可信區(qū)間可信區(qū)間意義:

雖然不能知道某校全體女大學(xué)生身高均數(shù)的確切數(shù)值,全體女大學(xué)生身高均數(shù)在163.0--164.5cm之間的可能性是95%,在162.7–164.7cm之間的可能性是99%。

換句話說,做出校全體女大學(xué)生身高均數(shù)為163.0--164.5cm的結(jié)論,說對的概率是95%,說錯的概率是5%;做出校全體女大學(xué)生身高均數(shù)為162.7–164.7cm的結(jié)論,說對的概率是99%,說錯的概率是1%。9/9/202378可信區(qū)間意義: 換句話說,做出校全體女大學(xué)生身高均數(shù)為16可信區(qū)間的兩個要素準確度

反映為可信度1-

的大小,即區(qū)間包含總體均數(shù)的概率大小,越接近1越好精密度

反映為區(qū)間的寬度,區(qū)間越窄越好在可信度確定的情況下,增加樣本含量可減小可信區(qū)間的寬度9/9/202379可信區(qū)間的兩個要素準確度8/3/202379

95%可信區(qū)間99%可信區(qū)間

公式

區(qū)間范圍窄寬

估計錯誤的概率大(0.05)?。?.01)可信區(qū)間的兩個要素當樣本含量為定值時,上述兩者互相矛盾。9/9/20238095%可求參數(shù)置信區(qū)間保證準確度先提高精度再處理“準確度與精密度”關(guān)系的原則在置信度確定的情況下,增加樣本含量可減小區(qū)間寬度。9/9/202381求參數(shù)置信區(qū)間保證準確度先提高精度再處理“準確度與可信區(qū)間與參考值范圍的區(qū)別可信區(qū)間用于估計總體參數(shù),總體參數(shù)只有一個。參考值范圍用于估計變量值的分布范圍,變量值可能很多甚至無限。95%的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論