概率統(tǒng)計(jì) 第七章 參數(shù)估計(jì)_第1頁
概率統(tǒng)計(jì) 第七章 參數(shù)估計(jì)_第2頁
概率統(tǒng)計(jì) 第七章 參數(shù)估計(jì)_第3頁
概率統(tǒng)計(jì) 第七章 參數(shù)估計(jì)_第4頁
概率統(tǒng)計(jì) 第七章 參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章

參數(shù)估計(jì)§7.1參數(shù)的點(diǎn)估計(jì)§7.2估計(jì)量的評選標(biāo)準(zhǔn)§7.3區(qū)間估計(jì)正態(tài)總體參數(shù)的區(qū)間估計(jì)

統(tǒng)計(jì)推斷作為數(shù)理統(tǒng)計(jì)的基本課題,可分成兩大部分,一是本章要討論的參數(shù)估計(jì),二是下一章討論的假設(shè)檢驗(yàn)。參數(shù)估計(jì)面對這樣兩種情況:一是總體分布類型已知,需要估計(jì)的是其中若干未知參數(shù)。如,已知某門課程考試的成績X~N(,2),但未知,2,需要估計(jì);另一類是分布類型未知,但所關(guān)心的只是總體中的某些數(shù)字特征。如某火車站上午9點(diǎn)至11點(diǎn)之間顧客流量X是一隨機(jī)變量,其分布未知,但我們只關(guān)心這一時間段的平均客流量和客流量的波動情況,即需估計(jì)X的數(shù)學(xué)期望EX及方差DX。通常把上面兩種需要估計(jì)的量,稱為待估參數(shù)。

參數(shù)估計(jì)就其表達(dá)形式而言有兩種類型:一類是用一個樣本函數(shù)作為待估參數(shù)的估計(jì),這就是點(diǎn)估計(jì);另一類是用一個或兩個樣本函數(shù)構(gòu)成的隨機(jī)區(qū)間,對待估參數(shù)作出估計(jì),這就是區(qū)間估計(jì)。本章需要解決的問題是:如何從總體中抽得樣本,并借助樣本提供的信息對待估參數(shù)進(jìn)行估計(jì)。

設(shè)為總體X分布中的未知參數(shù),由樣本(X1,X2,…,Xn)出發(fā)構(gòu)造一個樣本函數(shù)=(X1,X2,…,Xn)來估計(jì)未知參數(shù),稱(X1,X2,…,Xn)為的估計(jì)量;若(x1,x2,…,xn)是樣本的觀察值,稱=(x1,x2,…,xn)為的估計(jì)值。于是,尋找未知參數(shù)的估計(jì)量(X1,X2,…,Xn)或估計(jì)值(x1,x2,…,xn),便是點(diǎn)估計(jì)要解決的問題。在不發(fā)生誤會的情況下,通常把待估參數(shù)的估計(jì)量和估計(jì)值統(tǒng)稱為的點(diǎn)估計(jì)。

本節(jié)介紹兩種常用的點(diǎn)估計(jì)方法——矩估計(jì)法和極大似然估計(jì)法。

§7.1點(diǎn)估計(jì)一、矩估計(jì)法

矩估計(jì)法的方法要點(diǎn):假設(shè)總體X中的待估參數(shù)有l(wèi)個:另設(shè)總體X的k階原點(diǎn)矩EXk存在,記為便是待估參數(shù)的矩估計(jì)量。矩是描述隨機(jī)變量的最簡單的數(shù)字特征。樣本矩一定程度上也反映了總體的特征,用樣本矩來估計(jì)與之相應(yīng)的總體矩的方法,稱為矩估計(jì)法。

例1

設(shè)總體X有分布律X123

22(1-)(1-)2其中∈(0,1)為待估參數(shù)。又設(shè)(X1,X2,…,Xn)為總體X的樣本,試求的矩估計(jì)量,并就樣本值(3,1,2,2,3,2)。求的估計(jì)值。解由于

于是,待估參數(shù)的矩估計(jì)量為:對給定樣本值可得的矩估計(jì)值為:

.

本例說明,總體均值和總體方差的矩估計(jì)與總體的分布無關(guān)。

例4

設(shè)總體X服從(a,b)上的均勻分布,其中a,b

未知。試求a,b的矩估計(jì)。解:由于故于是,由解之,得分別為a,b的矩估計(jì)。

二、極大似然估計(jì)法極大似然估計(jì)法最早由高斯(Gauss)提出,后來在1912年為費(fèi)歇爾(Fisher)重提,并進(jìn)一步完善,它是建立在極大似然原理基礎(chǔ)上的一種統(tǒng)計(jì)方法。極大似然原理:一個隨機(jī)試驗(yàn)如果有若干個可能的結(jié)果A,B,C,…;若在一次試驗(yàn)中結(jié)果A出現(xiàn),則一般認(rèn)為試驗(yàn)條件對A的出現(xiàn)有利。即A出現(xiàn)的概率最大。

一般地:設(shè)連續(xù)型總體X的概率密度為

f(x,θ),(x1,x2,…,xn)為(X1,X2,…,Xn)的觀察值,為樣本的聯(lián)合分布密度。則

由定義知,求參數(shù)的極大似然估計(jì)的問題,就是求似然函數(shù)L()的最大值問題。當(dāng)L()關(guān)于可微時,由高等數(shù)學(xué)知識知道,要使L()最大,應(yīng)滿足

稱上式為似然方程。注意到L()與lnL()在同一處取得極值,因此為計(jì)算簡便,的極大似然估計(jì)常利用下列方程

求得,稱上式為對數(shù)似然方程。

注意:矩估計(jì)法從總體的數(shù)字特征出發(fā),數(shù)學(xué)原理簡明扼要,操作方便,因而適用面較廣;但精度差。極大似然估計(jì)法以總體分布已知為前提,雖然方法很繁瑣,數(shù)學(xué)原理也不如矩估計(jì)法簡明直觀,但由于似然函數(shù)集中了總體分布較充分的信息,因而得到的估計(jì)量較矩估計(jì)量有較多的優(yōu)良性,是目前應(yīng)用較為廣泛的一種估計(jì)方法。

§7-2估計(jì)量的評選標(biāo)準(zhǔn)當(dāng)兩個估計(jì)值不同時,哪一個更好呢?評判估計(jì)量有各種各樣的標(biāo)準(zhǔn),這里介紹三種最常用的評判標(biāo)準(zhǔn)——無偏性、有效性、一致性。一、無偏性

設(shè)是未知參數(shù)的估計(jì)量,若,無偏估計(jì)量或稱估計(jì)量是無偏的,否則稱是參數(shù)的有偏估計(jì)量。如果滿足,則稱為的漸近無偏估計(jì)量。

〔無偏化處理〕樣本方差

〔進(jìn)一步討論方差〕

無偏估計(jì)的概率意義是:估計(jì)量作為樣本函數(shù),它在歷次試驗(yàn)中的觀測值總是圍繞真值的兩側(cè)擺動。即在的很多可能的取值中,有大于真值的,亦有小于真值的。無偏性只要求平均誤差為零,即。這雖是無偏估計(jì)的一個優(yōu)點(diǎn),但也有不合理處,因?yàn)榭傉`差應(yīng)累積計(jì)算,而不能用相互抵消來度量。這就是說,較合理的估計(jì)量還應(yīng)該要求“越小越優(yōu)”。注意到當(dāng)為的無偏估計(jì)量時,這就導(dǎo)致了下列有效性的概念。

有效性

則稱較有效。一致性注意到估計(jì)量的一致性判別只有當(dāng)樣本容量n很大時才能顯示出其優(yōu)越性,這在實(shí)際中往往難以做到。因此工程實(shí)際中往往較多使用無偏性和有效性標(biāo)準(zhǔn)。例如:樣本均值是總體均值的一致估計(jì)量;樣本方差S2及二階中心矩B2是總體方差2的一致估計(jì)量??梢宰C明,在較弱的條件下,矩估計(jì)量與極大似然估計(jì)量都具有一致性。練習(xí)題那一個更有效?§7.3區(qū)間估計(jì)

正態(tài)總體參數(shù)的區(qū)間估計(jì)

一、區(qū)間估計(jì)的概念二、單個正態(tài)總體參數(shù)的區(qū)間估計(jì)三、兩個正態(tài)總體參數(shù)的區(qū)間估計(jì)

點(diǎn)估計(jì):用一數(shù)(樣本值函數(shù))來估計(jì)未知參數(shù)但是用點(diǎn)估計(jì)的方法得到的估計(jì)值與真值之間有誤差,而且點(diǎn)估計(jì)得到的參數(shù)估計(jì)值既沒有給出它與真值之間的精確程度,也沒有給出可靠程度。在實(shí)際應(yīng)用中,有時往往需要知道參數(shù)的估計(jì)值落在其真值附近的一個范圍。為此,我們希望通過樣本構(gòu)造一個以較大的概率來包含真實(shí)參數(shù)θ的一個范圍或區(qū)間,這種帶有概率的區(qū)間稱為置信區(qū)間,通過構(gòu)造一個置信區(qū)間對未知參數(shù)進(jìn)行估計(jì)的方法稱為區(qū)間估計(jì)。區(qū)間估計(jì):在保證可信度的基礎(chǔ)上,用一范圍限度未知參數(shù)一、區(qū)間估計(jì)的概念置信區(qū)間的概念:

例如,估計(jì)明天上午10時的氣溫八成在26℃~30℃之間,這里(26,30)就是明天上午10時氣溫的置信區(qū)間,26為“置信下限”,30為“置信上限”,八成(即80%)就是置信度(可靠程度),30℃-26℃=4℃為精確程度,而置信水平=1–80%=0.2。

求θ置信區(qū)間的步驟:尋求樣本函數(shù),它僅包含待估參數(shù),且分布已知。

上述步驟的關(guān)鍵是:這一點(diǎn),在一般情況下,這決非易事,但對正態(tài)總體的情況,我們在§6.4的抽樣分布定理中已為此作了準(zhǔn)備;又由于正態(tài)分布是在實(shí)際中應(yīng)用最廣泛的分布,所以,下面我們將用上述方法對正態(tài)總體中參數(shù)的區(qū)間估計(jì)作較詳細(xì)的討論。二、單個正態(tài)總體參數(shù)的區(qū)間估計(jì)

設(shè)總體X~N(,2),,>0,(X1,X2,…,Xn)是取自總體X的一個樣本??傮wX的末知參數(shù)可能是,也可能是2,現(xiàn)分別討論參數(shù),2的置信區(qū)間的求法,取置信度為1–。1.均值的置信區(qū)間(1)2

已知01-

0t例1

某車間生產(chǎn)滾珠,已知滾珠直徑X~N(,2)。從某天生產(chǎn)的產(chǎn)品中隨機(jī)抽取6個滾珠,測得直徑(單位:mm)為:14.7,15.1,14.9,14.8,15.2,15.1。試在置信水平=0.05下,分別就2=0.04及2未知求該天生產(chǎn)的滾珠平均直徑的置信區(qū)間。解(1)在已知時,利用公式(3.3)知,的置信區(qū)間為因此,的以1-=95%為置信度的置信區(qū)間上、下限為:即,可以認(rèn)為該天生產(chǎn)的滾珠直徑的置信度為95%的置信區(qū)間為(14.81,15.13)。(2)由于未知,使用公式(3.4)知的置信區(qū)間為所以,的置信度為95%的置信區(qū)間的上、下限為:即(14.76,15.18)。

o

兩個正態(tài)總體N(1,12),N(2,22)情況1-2

的置信區(qū)間

0

0t

2、雙正態(tài)總體方差比的置信區(qū)間

假定1,2未知

例5

用甲、乙兩種電子儀器獨(dú)立測量兩個測地站A、B之間的距離(單位:m),用儀器甲獨(dú)立地測量了n1=10次,由X1,…,X10算得:,;用儀器乙獨(dú)立測量了n2=15次,由Y1,…,Y15算得:,。假定這兩種儀器的測量值都服從正態(tài)分布。試求這兩種儀器的平均測量值之差的置信度為99%的置信區(qū)間。解:(1)因題中未給出σ12與σ22是否相等的條件,為選擇合適的隨機(jī)變量對μ1-μ2作區(qū)間估計(jì),先確定σ12與σ22是否相等。為此首先求σ12/σ22的90%的置信區(qū)間:由公式(3.11),因?yàn)樗苑讲畋鹊闹眯哦葹?.9的置信區(qū)間為由于σ12/σ22的置信區(qū)間包含1,因此可以認(rèn)為σ12與σ22相等。其次求1-

2的置信區(qū)間,應(yīng)選用統(tǒng)計(jì)量

所以1-2的置信度為90%的置信區(qū)間的上、下限為即1-2的置信度為90%的置信區(qū)間為:(0.002,0.064)例題選講!

1.設(shè)X1,X2,…,Xn為總體的一個樣本,求下列總體的密度函數(shù)中的未知參數(shù)的極大似然估計(jì)量和矩估計(jì)量。其中θ>0,θ為未知參數(shù)。解:設(shè)x1,x2,…,xn是樣本的一組觀察值。則似然函數(shù)為:

其中解得θ的極大似然估計(jì)值為:

θ的極大似然估計(jì)量為:解得θ的矩估計(jì)量為:

2.已知某種木材橫紋抗壓力的實(shí)驗(yàn)值服從正態(tài)分布,對10個試件作橫紋抗壓力試驗(yàn),得數(shù)據(jù)如下(單位:公斤/平方厘米):482,493,457,471,510,446,435,418,394,469。試對該木材平均橫紋抗壓力進(jìn)行區(qū)間估計(jì)(α=0.05)。解:總體方差σ2未知,對總體期望作區(qū)間估計(jì),應(yīng)選用隨機(jī)變量:

根據(jù)P(|t|>t/2(n-1))=1-(1-)=0.05,因自由度為10-1=9,故tα/2(n-1)=t0.025(9)=2.262。

于是的置信度為95%的置信區(qū)間為

由所給實(shí)驗(yàn)數(shù)據(jù)易算得=457.5,s=35.218。將它們及n=10代入計(jì)算得此區(qū)間為

(432.3,482.69)。3.為了在正常條件下檢驗(yàn)一種雜交作物的兩種新處理方案,在同一地區(qū)隨機(jī)挑選8塊地段,在各個試驗(yàn)地段按兩種方案種植作物,這8塊地的單位面積產(chǎn)量是:

一號方案產(chǎn)量86,87,56,93,84,93,75,79;

二號方案產(chǎn)量80,79,58,91,77,82,74,66.假設(shè)這兩種方案的產(chǎn)量都服從正態(tài)分布,試求這兩種方案下平均產(chǎn)量之差的置信度為90%的置信區(qū)間。解:(1)因題中未給出σ12與σ22是否相等的條件,為選擇合適的隨機(jī)變量對μ1-μ2作區(qū)間估計(jì),先確定σ12與σ22是否相等。由P[F>F(n1-1,n2-1)]=P[F>F0.05(7,7)]=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論