統(tǒng)計學(xué)第4章 參數(shù)估計_第1頁
統(tǒng)計學(xué)第4章 參數(shù)估計_第2頁
統(tǒng)計學(xué)第4章 參數(shù)估計_第3頁
統(tǒng)計學(xué)第4章 參數(shù)估計_第4頁
統(tǒng)計學(xué)第4章 參數(shù)估計_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第4章參數(shù)估計第4章參數(shù)估計4.1參數(shù)估計的一般問題4.2一個總體參數(shù)的區(qū)間估計4.3兩個總體參數(shù)的區(qū)間估計(自學(xué))4.4樣本容量的確定4.1參數(shù)估計的一般問題一、估計量與估計值二、點估計與區(qū)間估計三、評價估計量的標(biāo)準(zhǔn)估計量:用于估計總體參數(shù)的隨機變量如樣本均值,樣本比率、樣本方差等例:樣本均值就是總體均值的一個估計量總體參數(shù)用表示,估計量用表示估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值如果樣本均值x=80,則80就是θ的估計值估計量與估計值

(estimator&estimatedvalue)參數(shù)估計的基本方式用樣本對總體的未知參數(shù)進行估計的方法常見的有兩種:點估計(pointestimation)

區(qū)間估計(intervalestimation)

用某一樣本統(tǒng)計量的值來估計相應(yīng)總體參數(shù)的值叫總體參數(shù)的點估計。以樣本統(tǒng)計量的抽樣分布(概率分布)為理論依據(jù),按一定概率要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。用樣本的估計量直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計例如:用兩個樣本均值之差直接作為總體均值之差的估計優(yōu)點:簡單、具體明確缺點:點估計沒有給出估計值接近總體未知參數(shù)程度的信息點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等點估計

(pointestimate)點估計

(例題分析)例如,對一批某種型號的電子元件10000只進行耐用時間檢查,隨機抽取100只,測試的平均耐用時間為1055小時,合格率為91%。我們推斷說10000只電子元件的平均耐用時間為1055小時,全部電子元件的合格率也是91%。為了考察師大男生的身高狀況,隨機抽測50人得到試估計師大男生的平均身高和標(biāo)準(zhǔn)差。解:師大男生平均身高的估計值是170cm,但其真正的平均身高是否就是170cm?未必就是,這里面存在誤差。那么這種誤差是如何處理呢?點估計

(例題分析)點估計值僅僅是未知參數(shù)的一個近似值,它沒有反映出這個近似值的誤差范圍,使用起來把握不大。區(qū)間估計正好彌補了點估計的這個缺陷①②導(dǎo)彈直接命中敵機將其擊毀導(dǎo)彈接近敵機時引爆戰(zhàn)斗部,依靠高速飛行的彈片將其擊毀用空空導(dǎo)彈擊落敵機的兩種模式:可見估計未知參數(shù)的范圍比未知參數(shù)的點估計更有應(yīng)用價值設(shè)是未知參數(shù)的點估計未知參數(shù)落在什么范圍內(nèi)?用估計有多高的精度?區(qū)間估計問題的實際背景問題一問題二要求精確估計敵機位置(點估計)制導(dǎo)精度要求高,導(dǎo)彈可小型化不需要估計敵機精確位置,只需要判斷敵機是否落入導(dǎo)彈殺傷力范圍制導(dǎo)精度要求低,導(dǎo)彈體積較大分析則隨機區(qū)間可作為未知參數(shù)的“估計”.特點小,則估計精度高、可信度低大,則可信度高、估計精度低問如何平衡估計精度與可信度?區(qū)間估計若設(shè)有兩個統(tǒng)計量

譬如,在估計湖中魚數(shù)的問題中,若我們根據(jù)一個實際樣本,得到魚數(shù)N的估計量為1000條。

若我們能給出一個區(qū)間(950,1050),在此區(qū)間內(nèi)我們合理地相信N的真值位于其中,這樣對魚數(shù)的估計就有把握多了。

實際上,N的真值可能大于1000條,也可能小于1000條。區(qū)間估計

(例題分析)問題就在于:這個1000的估計值可能在區(qū)間(950,1050)內(nèi),也可能不在區(qū)間估計的思想

點估計總是有誤差的,但沒有衡量偏差程度的量,區(qū)間估計則是按一定的可靠性程度對待估參數(shù)給出一個區(qū)間范圍。引例設(shè)某廠生產(chǎn)的燈泡使用壽命X~N(,1002),現(xiàn)隨機抽取5只,測量其壽命如下:1455,1502,1370,1610,1430,則該廠燈泡的平均使用壽命的點估計值為可以認(rèn)為該種燈泡的使用壽命在1473.4個單位時間左右,但范圍有多大呢?又有多大的可能性在這“左右”呢?如果要求有95%的把握判斷在1473.4左右,則由Z統(tǒng)計量可知由查表得面積?區(qū)間估計

(intervalestimate)

在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到。根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量比如,某班平均分?jǐn)?shù)在75~85之間,置信水平是95%優(yōu)點:考慮了估計量的分布,能說明估計結(jié)果的可靠程度樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限設(shè)是一個待估計的參數(shù),是一給定的數(shù),(0<<1).若能找到兩個統(tǒng)計量使得則稱隨機區(qū)間為參數(shù)的置信度為1-的置信區(qū)間,分別稱

為置信下限與置信上限,1-稱為置信水平或置信度.

置信區(qū)間的定義區(qū)間估計的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比率稱為置信水平表示為(1-為是總體參數(shù)未在區(qū)間內(nèi)的比率常用的置信水平值有99%,95%,90%相應(yīng)的為0.01,0.05,0.10置信水平這個概率不是用來描述某個特定的區(qū)間包含總體參數(shù)真值的可能性,而是指在多次抽樣得到的區(qū)間中大概有多少個區(qū)間包含了總體參數(shù)的真值由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個置信區(qū)間

(confidenceinterval)總體參數(shù)的真值是固定的、未知的,而用不同樣本構(gòu)造的區(qū)間是不固定的,因此,置信區(qū)間是一個隨機區(qū)間,它會因樣本的不同而不同小結(jié)(1)區(qū)間估計簡單地說就是用一個區(qū)間去估計未知參數(shù),把未知參數(shù)估計在某兩個界限之間。(2)置信區(qū)間按照預(yù)先給定的概率(1-α

)確定的包含未知總體參數(shù)的可能范圍。它是以上下置信限(L1,L2)為界。(3)置信概率又稱置信水平或置信度,指在區(qū)間估計中,預(yù)先選定(規(guī)定)的概率。用1-α表示。常取95%或99%。(4)顯著性水平在使用置信區(qū)間作估計時,被估計的參數(shù)不在該區(qū)間內(nèi)的概率。用α表示。一般α取值要求較小。小結(jié)置信區(qū)間表達了區(qū)間估計的精確性。置信水平(1-α)表達了區(qū)間估計的可靠性。它是區(qū)間估計的可靠概率。顯著性水平α表達了區(qū)間估計的不可靠的概率。要點

§4.2點估計的評價標(biāo)準(zhǔn)

對于同一個未知參數(shù),不同的方法得到的估計量可能不同,于是提出問題應(yīng)該選用哪一種估計量?用何標(biāo)準(zhǔn)來評價一個估計量的好壞?常用標(biāo)準(zhǔn)(1)無偏性(3)一致性(2)有效性若則稱是的無偏估計量.

無偏性(unbiasedness)定義我們不可能要求每一次由樣本得到的估計值與真值都相等,但可以要求這些估計值的期望與真值相等.定義的合理性無偏性

(unbiasedness)無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù)P(

)BA無偏有偏抽樣分布中,樣本均值、比率、方差分別是總體均值、比率、方差的無偏估計量有效性

(efficiency)有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標(biāo)準(zhǔn)差的估計量更有效

AB

的抽樣分布

的抽樣分布P(

)無偏估計量還必須與總體參數(shù)的離散程度比較小都是總體參數(shù)的無偏估計量,且則稱比更有效.定義

設(shè)有效性有效一致性

(consistency)一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)AB較小的樣本容量較大的樣本容量P(

)4.2一個總體參數(shù)的區(qū)間估計一、總體均值的區(qū)間估計二、總體比率的區(qū)間估計三、總體方差的區(qū)間估計一個總體參數(shù)的區(qū)間估計總體參數(shù)符號表示樣本統(tǒng)計量均值比率方差總體均值的區(qū)間估計

(大樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,可由正態(tài)分布來近似(n

30)2.使用正態(tài)分布統(tǒng)計量z總體均值在1-置信水平下的置信區(qū)間為此條件下小樣本總體也適用總體均值的區(qū)間估計

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計

(例題分析)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:

總體均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g總體均值的區(qū)間估計

(例題分析)【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間36個投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計

(例題分析)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:

總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲總體均值的區(qū)間估計

(練習(xí))

某大學(xué)從該校學(xué)生中隨機抽取100人,調(diào)查到他們平均每天參加體育鍛煉的時間為26分鐘。試以95%的置信水平估計該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時間(已知總體方差為36分鐘)??傮w均值的區(qū)間估計

(例題分析)解:已知x=26,=6,n=100,1-=0.95,Z/2=1.96我們可以95%的概率認(rèn)為平均每天參加鍛煉的時間在24.824~27.176分鐘之間

某廠生產(chǎn)的零件長度X服從N(,0.04),現(xiàn)從該廠生產(chǎn)的零件中隨機抽取6個,長度測量值如下(單位:毫米):

14.6,15.l,14.9,14.8,15.2,15.1.求:μ的置信系數(shù)為0.95的區(qū)間估計。

總體均值的區(qū)間估計

(練習(xí))解:n=6,=0.05,z/2=z0.025=1.96,2=0.22.

所求置信區(qū)間為總體均值的區(qū)間估計

(例題分析)總體均值的區(qū)間估計

(小樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

未知小樣本

(n<30)2.使用t

分布統(tǒng)計量總體均值在1-置信水平下的置信區(qū)間為注意自由度t分布

t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z總體均值的區(qū)間估計

(例題分析)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(小時)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計

(例題分析)解:已知X~N(,2),n=16,1-=95%,t/2=2.131

根據(jù)樣本數(shù)據(jù)計算得:,

總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時

從一個正態(tài)總體中抽取一個隨機樣本,n=25,其均值x=50,標(biāo)準(zhǔn)差s=8。建立總體均值的95%的置信區(qū)間??傮w均值的區(qū)間估計

(練習(xí))總體均值的區(qū)間估計

(練習(xí))解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。我們可以95%的概率認(rèn)為總體均值在46.69~53.30之間

為估計一物體的重量μ,將其稱量10次,得到重量的測量值(單位:千克)如下:10.l,10.0,9.8,10.5,9.7,l0.l,9.9,10.2,10.3,9.9.設(shè)它們服從正態(tài)分布N(,2)。求的置信系數(shù)為0.95的置信區(qū)間。總體均值的區(qū)間估計

(練習(xí))解:

n=10,=0.05,t9(0.025)=2.2622,總體均值的區(qū)間估計

(練習(xí))總體比率的區(qū)間估計1. 假定條件樣本量足夠大樣本比率的抽樣分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量z總體比率在1-置信水平下的置信區(qū)間為參看P108總體比率的區(qū)間估計

(例題分析)【例】某城市想要估計下崗職工中女性所占的比率,隨機地抽取了100名下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比率的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比率的置信區(qū)間為55.65%~74.35%

總體比率的區(qū)間估計

(練習(xí))【例】某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機選取了200人組成一個樣本。在對其進行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造(95%的置信區(qū)間)。我們可以95%的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%~76.4%之間解:已知n=200,P=0.7,=0.95,Z/2=1.96總體比率的區(qū)間估計

(練習(xí))1. 估計一個總體的方差或標(biāo)準(zhǔn)差2. 假設(shè)總體服從正態(tài)分布3.總體方差2

的點估計量為s2,且4.總體方差在1-置信水平下的置信區(qū)間為參看P108總體方差的區(qū)間估計總體方差的區(qū)間估計

(圖示)221-2總體方差1-的置信區(qū)間自由度為n-1的2分布總體方差的區(qū)間估計

(例題分析)【例】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體方差的區(qū)間估計

(例題分析)解:已知n=25,1-=95%,根據(jù)樣本數(shù)據(jù)計算得

s2=93.21

2置信度為95%的置信區(qū)間為該企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43g總體方差的區(qū)間估計

(練習(xí))有一大批糖果,現(xiàn)從中隨機地抽取16袋,稱得重量(以克計)如下:506508499503504510497512514505493496506502509496設(shè)袋裝糖果的重量近似地服從正態(tài)分布,試求總體標(biāo)準(zhǔn)差σ的置信水平0.95為的置信區(qū)間。S=6.2022解:這里總體方差的區(qū)間估計

(練習(xí))于是得到σ的置信水平為0.95的置信區(qū)間為總體方差的區(qū)間估計

(練習(xí))例2:為估計一物體的重量μ,將其稱量10次,得到重量的測量值(單位:千克)如下:10.1,10.0,9.8,10.5,9.7,10.1,9.9,10.2,10.3,9.9.設(shè)它們服從正態(tài)分布N(,2)。求2的置信系數(shù)為0.95的置信區(qū)間。S2=0.0583解:n=10,

=0.05,S2=0.0583,查附表得,

于是,總體方差的區(qū)間估計

(練習(xí))4.4

樣本容量的確定一、估計總體均值時樣本容量的確定二、估計總體比率時樣本容量的確定估計總體均值時樣本容量n為樣本容量n與總體方差2、可接受的允許誤差E、可靠性系數(shù)Z或t之間的關(guān)系為與總體方差成正比與允許誤差成反比與可靠性系數(shù)成正比估計總體均值時樣本容量的確定其中:估計總體均值時樣本容量的確定

(例題分析)【例】擁有工商管理學(xué)士學(xué)位的大學(xué)畢業(yè)生年薪的標(biāo)準(zhǔn)差大約為2000元,假定想要估計年薪95%的置信區(qū)間,希望允許誤差為400元,應(yīng)抽取多大的樣本容量?估計總體均值時樣本容量的確定

(例題分析)解:已知=2000,E=400,1-=95%,z/2=1.96

應(yīng)抽取的樣本容量為即應(yīng)抽取97人作為樣本樣本容量的確定(實例)解:已知2=1800000,=0.05,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論