應(yīng)用數(shù)理統(tǒng)計(jì)-擬合優(yōu)度檢驗(yàn)_第1頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)-擬合優(yōu)度檢驗(yàn)_第2頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)-擬合優(yōu)度檢驗(yàn)_第3頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)-擬合優(yōu)度檢驗(yàn)_第4頁(yè)
應(yīng)用數(shù)理統(tǒng)計(jì)-擬合優(yōu)度檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩28頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

考慮位置----刻度參數(shù)分布族:設(shè)X1,...,Xn是抽自連續(xù)型分布F的樣本,考慮的假設(shè)檢驗(yàn)問(wèn)題是

擬合優(yōu)度檢驗(yàn)Q-Q圖

H0:FL0={G:G(x)=F0((x)/),R,

>0}

H1:FL0其中連續(xù)、嚴(yán)格單調(diào)遞增的分布函數(shù)F0(.)是給定的,參數(shù),

的取值決定分布族中的具體分布.

令Zi=F(Xi),以F01記F0的反函數(shù),則當(dāng)H0成立時(shí),F(x)=F0((x)/)

H0:FL0={G:G(x)=F0((x)/),R,

>0}

H1:FL0對(duì)于某和成立。從而

F01(Zi)=F01(F0((Xi)/)))=(Xi)/

于是

Xi

=F01(Zi)+(4.1)Xi

=F01(Zi)+(4.1),Zi=F(Xi)=F0((Xi)/),

Zi

Fn(Xi)(4.2)其中Fn(x)是由X1,...,Xn得到的經(jīng)驗(yàn)分布函數(shù)。由式(4.1)和式(4.2)得

Xi

F01(Fn(Xi))+

式(4.1)表明:Xi和

F01(Zi)

呈線性關(guān)系,即點(diǎn)

{(F01(Zi),Xi),i=1,...,n}在一條直線上。由于和知,無(wú)法算出

Zi。注意到Zi

是分布函數(shù)在

Xi處的值,而分布函數(shù)可以由經(jīng)驗(yàn)分布函數(shù)來(lái)估計(jì),故Zi近似地可以表示為特別對(duì)順序統(tǒng)計(jì)量X(i),有Fn(X(i))=i/n,所以

X(i)

F01(i/n)+上式右邊當(dāng)i=n時(shí),一般無(wú)法算出。為此,使用時(shí)常在該公式中加入一個(gè)連續(xù)性校正常數(shù)c,取Xi

F01(Fn(Xi))+常取c=0.5或0.25。這里,我們約定取c=0.25。由此得到于是,為檢驗(yàn)H0作圖如下:把點(diǎn)

標(biāo)在直角坐標(biāo)系中,當(dāng)原假設(shè)H0成立時(shí),諸點(diǎn)構(gòu)成的點(diǎn)陣將呈一直線,且該直線的斜率可作為的估計(jì),截距可作為的估計(jì),這種圖稱為Q-Q散點(diǎn)圖。

通過(guò)Q-Q散點(diǎn)圖,若點(diǎn)陣不呈直線狀態(tài),則認(rèn)為H0不成立。此時(shí),圖形可能呈現(xiàn)各種各樣的情況。幾種典型的情況如下:(1)點(diǎn)陣構(gòu)成的圖形呈中心對(duì)稱的反S型,中部點(diǎn)的密度較大,這表明比起由

給定的橫坐標(biāo)來(lái),樣本中最大的一些值和最小的一些值比較突出,樣本值相對(duì)比較分散,總體分布可能比原假設(shè)下的分布族中的分布重尾。對(duì)稱性則表明,兩個(gè)分布族的密度曲線的形狀類似。

圖4.1b中樣本來(lái)自于Canchy分布,F(xiàn)0為N(0,1),Canchy分布與N(0,1)分布密度函數(shù)圖形見(jiàn)下圖,其中紅線為N(0,1)密度函數(shù),藍(lán)線為Canchy分布的密度函數(shù),其為:

(2)點(diǎn)陣構(gòu)成的圖形呈中心對(duì)稱的S型,中部點(diǎn)的密度較大,如圖4.1c所示。這表明樣本兩端的值比起由

給定的橫坐標(biāo)來(lái)相對(duì)變化較慢,從而樣本取值比較集中,總體分布可能比原假設(shè)下的分布族中的分布輕尾。圖c中樣本來(lái)自于正態(tài)分布,F(xiàn)0為L(zhǎng)aplace分布。N(0,1)分布與Laplace分布的密度函數(shù)圖形見(jiàn)下圖,其中紅線為N(0,1)密度函數(shù),藍(lán)線為L(zhǎng)aplace分布的密度函數(shù)

(3)在其他非典型的情況下,Q-Q散點(diǎn)圖的分析比較復(fù)雜。比如,4.1d中,由于F0取為N(0,1),可以看出總體的分布是偏態(tài)的,并且右側(cè)尾部較正態(tài)分布重。有時(shí)還可檢測(cè)出異常點(diǎn)的存在。所謂異常點(diǎn),是指“遠(yuǎn)離”其他數(shù)據(jù)點(diǎn)的觀測(cè)值。如在圖4.2a中,點(diǎn)P遠(yuǎn)離直線,而其他諸點(diǎn)在一直線周圍,這時(shí)認(rèn)為點(diǎn)P所對(duì)應(yīng)的數(shù)據(jù)點(diǎn)可能是異常點(diǎn)。如果圖形分為比較明顯的兩個(gè)部分,如圖4.2b的形狀,那么,可能意味著總體的分布是混合的。皮爾遜2----檢驗(yàn)法

前面的圖方法直觀易行,但不能從數(shù)量上反映樣本與給定分布擬合的程度。Pearson

2

檢驗(yàn)可以解決這個(gè)問(wèn)題。

Pearson

2

檢驗(yàn)是一種最常用的檢驗(yàn)總體分布為某個(gè)已知分布的檢驗(yàn)方法,它用K.Pearson提出的2統(tǒng)計(jì)量來(lái)衡量經(jīng)驗(yàn)分布與假設(shè)的理論分布間的差異。此法可以用來(lái)檢驗(yàn)總體是否服從任何一個(gè)預(yù)先給定的分布,而這個(gè)預(yù)先給定的分布可以是離散的,也可以是連續(xù)的。皮爾遜定理設(shè)A1,A2,…,Am是完備事件組,即

其中,P(Ai)=pi(pi是已知的),i=1,2,…,m。fi

是n

次獨(dú)立重復(fù)試驗(yàn)中Ai

發(fā)生的次數(shù)。則當(dāng)n時(shí)

的極限分布是2

(m1)。設(shè)總體X的分布是H0:P(X=zi)=pi,i=1,2,…,m(1)0pi1

是已知量

,樣本值是x1,…,xn,fi是樣本值中取值為zi

的個(gè)數(shù),i=1,2,…,m

。

現(xiàn)進(jìn)行了n次獨(dú)立重復(fù)試驗(yàn);記事件(X=zi)=Ai,i=1,2,…,m;fi是n次獨(dú)立重復(fù)試驗(yàn)中Ai出現(xiàn)的頻數(shù)。我們用檢驗(yàn)統(tǒng)計(jì)量拒絕域?yàn)閃={2>c}.當(dāng)n很大時(shí),一般n50時(shí)給定顯著水平,要使c=1-2(m-1),這樣可得H0

的拒絕域?yàn)椋篧={2>c}例1.有七臺(tái)自動(dòng)車床獨(dú)立的生產(chǎn)同一種產(chǎn)品。在某一段時(shí)間內(nèi),統(tǒng)計(jì)產(chǎn)生了238件次品,其情況如下表:機(jī)床號(hào)一二三四五六七

次品件數(shù)36232931346025試問(wèn)次品的產(chǎn)生是否與機(jī)床有關(guān)?(=0.05)

其中Ai表示第i臺(tái)機(jī)床產(chǎn)生次品。該假設(shè)的拒絕域?yàn)椋航?jīng)計(jì)算給定

=0.05,查

2分布表得所以在顯著水平

=0.05下,拒絕H0,認(rèn)為生產(chǎn)次品的情況與機(jī)床有關(guān)。因?yàn)槠栠d定理的推廣定理設(shè)X1,...,Xn為來(lái)自總體X的樣本,需檢驗(yàn)其中1,...,r為未知參數(shù)。在H0為真的條件下,用極大似然估計(jì)法得到未知參數(shù)的估計(jì)則當(dāng)n時(shí)的極限分布是

2(mr1),其中m是將實(shí)數(shù)軸分成不相交區(qū)間的個(gè)數(shù),pi是H0為真且(1,...,r)=時(shí),總體取值落入第i個(gè)小區(qū)間的概率,稱其為理論概率,npi稱為理論頻數(shù),fi是樣本觀測(cè)值落入第i個(gè)小區(qū)間的個(gè)數(shù),稱其為實(shí)際頻數(shù).

在實(shí)際應(yīng)用中,當(dāng)n很大時(shí),上述統(tǒng)計(jì)量

2近似服從分布2(mr1),為了檢驗(yàn)H0,對(duì)給定的,由2分布表可查得

1-2(mr1),使得從而可得到的拒絕域由于使用了近似服從

2分布的檢驗(yàn)統(tǒng)計(jì)量,所以該檢驗(yàn)也稱為

2—檢驗(yàn)法。

在使用

2---檢驗(yàn)法時(shí)要注意兩點(diǎn):樣本容量n要求很大,一般n50;劃分區(qū)間的個(gè)數(shù)m不宜太小也不宜過(guò)大,實(shí)際應(yīng)用中,一般取6m20,同時(shí)要求在每個(gè)小區(qū)間上fi

5

(或npi5)

。如果不滿足這個(gè)條件就要把相鄰的區(qū)間合并,直到滿足條件為止。由此,小區(qū)間的個(gè)數(shù)不是一開(kāi)始就確定不變的;另外上述

2公式也可變成如下形式進(jìn)行計(jì)算:

以下具體列出

2檢驗(yàn)法一般步驟:(a)根據(jù)問(wèn)題提出假設(shè)H0,在H0成立的條件下計(jì)算未知參數(shù)的極大似然估計(jì);(b)把實(shí)數(shù)軸分為m個(gè)不相交的區(qū)間(ai,ai+1),i=1,2,...,m,其中a1可取,am+1可取+;(c)計(jì)算概率pi=P(ai

<X

ai+1)=F(ai+1)F(ai),i=1,2,...,m,計(jì)算出理論頻數(shù)npi;(d)計(jì)算樣本觀測(cè)值x1,...,xn落在(ai,ai+1)中的個(gè)數(shù)fi,i=1,2,...,m;

(e)一般采用表格形式來(lái)計(jì)算出統(tǒng)計(jì)量2的值;

(f)對(duì)給定的顯著水平,查臨界值12(mr1)。

(g)若

2>1

2(mr1),則拒絕;

不難看出2檢驗(yàn)總體分布實(shí)際上不是完全檢驗(yàn)F(x)=F0(x),而是檢驗(yàn)F(ai)=F0(ai),i=1,…,m-1。不過(guò)由于ai選取的隨機(jī)性以及F(x)的光滑和單調(diào)性,所以這樣檢驗(yàn)的結(jié)果同實(shí)際情況相差不會(huì)太大。例2.

在一實(shí)驗(yàn)中,每隔一定時(shí)間間隔觀察一次計(jì)數(shù)器上記錄的某種鈾放射出的

粒子的個(gè)數(shù)X,獨(dú)立觀察100次的數(shù)據(jù)如下:

i01234567891011fi1516172611992121其中fi是觀察到有i個(gè)

粒子的個(gè)數(shù)。試問(wèn)X是否服從泊松分布。解:根據(jù)題意,提出假設(shè)H0:X~(),理論分布()的參數(shù)

未知。首先在H0為真條件下,用最大似然估計(jì)法得到

的最大似然估計(jì)值此時(shí)檢驗(yàn)假設(shè)寫為H0:X~(4.2)。

根據(jù)所給數(shù)據(jù)情況,將(,+)分為m=12個(gè)小區(qū)間,(,0],(0,1],(1,2],(2,3],(9,10],(10,+],數(shù)出樣本觀測(cè)值落在每個(gè)小區(qū)間上的個(gè)數(shù)。當(dāng)H0為真時(shí),由已知的X~(4.2),計(jì)算各小區(qū)間上的pi:小區(qū)間fi

npi

fi-npi

(fi-npi)2(fi-npi)2/npi(,0]11.51.83.240.415(0,1]56.3(1,2]1613.22.87.840.594(2,3]1718.51.52.250.122(3,4]2619.46.643.562.245(4,5]1116.35.328.091.725(5,6]911.42.45.760.505(6,7]96.92.14.410.629(7,8]23.6(8,9]11.7(9,10]20.70.50.250.038(10,+]10.5在表中,已將fi的值不超過(guò)5的小區(qū)間與鄰近的小區(qū)間合并,合并以后的小區(qū)間的個(gè)數(shù)為m=8。H0的拒絕域?yàn)?/p>

給定顯著水平

=0.05,由

2分布表查得由于所以在顯著水平

=0.05下,接受H0,認(rèn)為X服從泊松分布(4.2)

例3一車間生產(chǎn)一批某種車軸,加工的車軸長(zhǎng)度是一個(gè)隨機(jī)變量X(單位:cm)?,F(xiàn)從這批產(chǎn)品中抽取容量為120的樣本,測(cè)得樣本值如下表。判斷軸長(zhǎng)X是否服從正態(tài)分布。216203197208206209206208202203206213218207208202194203213211193213208208204206204206208209213203206196201208207213208207210208211211214220211203216224211209218

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論