否則就有顯著差異于是提出假設課件_第1頁
否則就有顯著差異于是提出假設課件_第2頁
否則就有顯著差異于是提出假設課件_第3頁
否則就有顯著差異于是提出假設課件_第4頁
否則就有顯著差異于是提出假設課件_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

§8.1假設檢驗的基本原理與兩類錯誤§8.2正態(tài)總體的假設檢驗§8.3分布擬合檢驗第8章假設檢驗§8.1假設檢驗的基本原理與兩類錯誤第8章假設檢驗下面通過一個具體實例引出假設檢驗的一些重要概念和基本思想。

例8.1.1某廠生產(chǎn)一種零件的尺寸

服從正態(tài)分布

,從過去較長一段時間的生產(chǎn)情況來看,零件的平均尺寸為mm,為檢驗該廠某批零件是否符合標準,現(xiàn)對該批零件隨機抽取6件得到其尺寸數(shù)據(jù)(單位:mm)32.56,29.66,31.64,30.00,31.87,31.03,

問該批零件的平均尺寸與過去是否有顯著差異?8.1.1問題的提出§8.1假設檢驗的基本原理與兩類錯誤下面通過一個具體實例引出假設檢驗的一些重要概念和基本思想。8

我們的問題是判斷該批零件的平均尺寸

是否為30.50mm,若mm,則認為其與過去沒有顯著差異,否則就有顯著差異.于是提出假設:稱

為零假設或原假設(originalhypothesis),

為備擇假設或?qū)α⒓僭O(alternativehypothesis).一般地,把關(guān)于未知分布的各種陳述稱為統(tǒng)計假設,簡稱為假設.若總體分布類型已知,僅對總體分布中未知參數(shù)的假設稱為參數(shù)假設.如上例中僅對參數(shù)

的假設.在有些實際問題中總體分布未知,需對總體分布類型提出假設,這類對總體分布類型的假設稱為非參數(shù)假設.我們的問題是判斷該批零件的平均尺寸是否為30.50m

在假設檢驗中,零假設和對立假設的選擇要看具體的目的和要求而定,如果我們希望通過樣本觀測值獲得對某個論斷的有力支持,則一般把這一論斷的否定作為原假設.因為僅通過一次抽樣無法去證實一個論斷,但用來否定一個論斷的理由則比較充分.如上例中

為原假設,

為對立假設.在假設檢驗中,零假設和對立假設的選擇要看具體的目的和要求

在統(tǒng)計假設提出之后,就要尋找一個檢驗法則,在

之間作出判斷,若拒絕原假設

,就意味著接受對立假設

,否則就不能拒絕(即接受)原假設.例8.1要檢驗總體均值

,根據(jù)參數(shù)估計知樣本均值是總體均值的良好估計,可考慮能否用樣本均值

來進行判斷,由抽樣的結(jié)果知樣本均值為

本次抽樣

的取值

與過去生產(chǎn)零件的平均尺寸之間差異為0.63mm,這種差異有以下兩種不同的解釋.(1)若

成立,這種差異是由抽樣的隨機性造成的.8.1.2假設檢驗的基本思想在統(tǒng)計假設提出之后,就要尋找一個檢驗法則,在(2)若

不成立,抽樣的隨機性不可能造成0.63mm這么大的差異,說明該批零件尺寸與過去生產(chǎn)的零件尺寸確實有明顯差異.

從而問題的關(guān)鍵是0.63mm的差異能否用抽樣的隨機性來解釋.為回答這一問題,由參數(shù)估計知道,樣本均值

的大小在一定程度上反映了總體均值的大小.由于

未知,用

代替

與30.50作比較,如選用

作為衡量

是否成立的指標.如果

成立,則

應該較小,如果

較大,則差異就不能僅僅解釋為樣本隨機性的影響了,從而有理由懷疑

是否成立.這樣問題就轉(zhuǎn)化為找一個合理的臨界值

,使得當

時,接受

;當

時,拒絕

;(2)若不成立,抽樣的隨機性不可能造成0.63m稱(8.1.1)為一個檢驗例8.1.1中

假設的檢驗法.該檢驗法給出的檢驗規(guī)則實質(zhì)上是把樣本

的所有可能取值(

的子集)分為互不相交的兩部分:于是檢驗法(8.1.1)又可表述為當

時,接受

;當

時,拒絕

;稱(8.1.1)為一個檢驗例8.1.1中假設的檢

因此問題是如何確定常數(shù)?為確定常數(shù)

,我們適當選擇一個小正數(shù)

,稱作顯著性水平(levelofsignificance),在

成立的條件下,確定隨機事件

為小概率事件,即

根據(jù)小概率事件的實際不可能原理,即“在一次試驗中小概率事件幾乎是不可能發(fā)生的”原理.由(8.1.2)確定的事件為小概率事件,實際上是不可能發(fā)生的.如果根據(jù)抽樣的結(jié)果,小概率事件

在一次抽樣中發(fā)生了,則說明抽樣得到的結(jié)果與原假設

不相符,因而有理由懷疑

的正確性.即在顯著水平

給定時,拒絕.如果在一次抽樣中小概率事件

沒有發(fā)生,則沒有充分理由拒絕

,從而只能接受,這就是顯著性檢驗.因此問題是如何確定常數(shù)?為確定常數(shù)

上例中取

,因為總體

,在

成立條件下,查正態(tài)分布表有根據(jù)(8.1.2)式

,。所以上例中取,因為總體即而代入樣本觀測值上式也等價于

給定

時,根據(jù)小概率事件原理,不能拒絕

,即認為該批零件的尺寸與過去生產(chǎn)的零件尺寸沒有顯著差異。即而代入樣本觀測值上式也等價于給定通過上例分析,我們知道假設檢驗的基本思想是:從

成立出發(fā),構(gòu)造合適的檢驗法,根據(jù)小概率事件原理,如果導出“不合理”的結(jié)論,則拒絕

,否則就不能拒絕

,因而只能接受

。上述思想可以概括為具有概率性質(zhì)的反證法.假設檢驗的一般步驟為:(1)根據(jù)實際問題的要求提出原假設

與對立假設.(2)選取適當?shù)慕y(tǒng)計量

,作為衡量

是否成立的標準,在

成立時,

的分布或漸近分布已知.(3)給定顯著水平

,在

成立的條件下,借助統(tǒng)計量

確定一個小概率事件,從而把樣本空間分為兩個互不相交的區(qū)域,即拒絕域

和接受域.(4)作出判斷,若樣本觀測值落入拒絕域

,則拒絕

否則接受.通過上例分析,我們知道假設檢驗的基本思想是:從成8.1.3兩類錯誤

顯著性檢驗是根據(jù)樣本對原假設

作出接受還是拒絕的判斷,由于樣本的隨機性和局限性.因此在作判斷時,我們有可能犯兩類錯誤:一類錯誤是,當

為真時,根據(jù)樣本拒絕了

,這類錯誤稱之為第一類錯誤,也稱為“棄真錯誤”.其發(fā)生的概率稱為犯第一類錯誤的概率,通常記為

,即

(拒絕|為真)=.

另一類錯誤是,當

為不真時,根據(jù)樣本接受了

,這類錯誤稱之為第二類錯誤,也稱為“采偽錯誤”,其發(fā)生的概率稱為犯第二類錯誤的概率,通常記為

,即

(接受|不真)=.在此我們把兩類錯的各種情況總結(jié)于表8-1中.8.1.3兩類錯誤顯著性檢驗是根據(jù)樣本對原假設

母體情況為真不真樣本

(拒絕域)犯第一類錯誤(概率為)正確(概率為)

(拒絕域)

正確(概率為

)犯第二類錯誤(概率為

)表8-1兩類錯誤

對于給定的一對

,總可以找到很多不同的拒絕域

,我們總希望找到這樣的拒絕域

,使得犯兩類錯誤的概率

都很小.但是當樣本容量

固定時,要想

都很小是不可能的,通常減少犯其中一類錯誤的概率,則犯另一類錯誤的概率就會增加。母體情況

基于這種情況,紐曼—皮爾遜(Neyman-Pearson)提出了一個原則:即在樣本容量

固定時,控制犯第一類錯誤的概率

,尋找最優(yōu)的檢驗法則,使犯第二類錯誤的概率

盡量小.具體實行這一原則有時也有許多困難,因而降低要求,僅對犯第一類錯誤的概率

加壓控制,而不考慮犯第二類錯誤的概率

,這類假設檢驗問題稱為顯著性假設檢驗問題,相應的檢驗稱為顯著性檢驗.一般情形下,顯著性檢驗法是較容易找到的,我們將在正態(tài)總體情形下詳細討論.基于這種情況,紐曼—皮爾遜(Neyman-Pears§8.2正態(tài)總體的假設檢驗8.2.1單個正態(tài)總體均值

的假設檢驗設總體

是來自總體

的樣本,

為顯著水平.(1)方差

已知,均值

的檢驗

檢驗的問題為

為已知常數(shù)),

(8.2.1)由第六章抽樣分布的理論知,當

成立時,

(8.2.2)選取

作為此假設檢驗的統(tǒng)計量,對給定的顯著水平

,§8.2正態(tài)總體的假設檢驗8.2.1單個正態(tài)總體均值因而拒絕域可取為

把樣本觀測察值

代入

,得到統(tǒng)計量

的觀察值

,則拒絕

,否則就接受.稱此檢驗法為

檢驗法.因而拒絕域可取為例8.2.1某種電器元件的電阻

,從過去生產(chǎn)情況看,其平均電阻一直保持在2.64,標準差為0.06.改變加工工藝后,測得100個元件,其平均電阻為2.62,標準差不變.問新工藝的平均電阻與原來的有無顯著差異?(取顯著水平

)解檢驗問題為.使用

檢驗法,計算統(tǒng)計量

的觀測值由

,查表得

,由于

,所以拒絕

,即認為新工藝元件的平均電阻與原來有顯著差異.例8.2.1某種電器元件的電阻以上討論的假設檢驗問題中,提出的是雙側(cè)檢驗,即對立假設.有時在實際問題中,我們僅關(guān)心總體均值是變大還是減小的情況,因而對立假設為

,這兩類檢驗統(tǒng)稱為單側(cè)檢驗.其檢驗方法與雙側(cè)檢驗類似,只是拒絕域相應變?yōu)?/p>

和.

另外,如果總體分布為非正態(tài)分布,但在

成立的條件下,統(tǒng)計量

的極限分布為正態(tài)分布,則在樣本容量

較大時,

近似服從正態(tài)分布,這時

檢驗法仍可使用.如對產(chǎn)品次品率的檢驗,泊松分布參數(shù)的檢驗等.以上討論的假設檢驗問題中,提出的是雙側(cè)檢驗,即對立假設例8.2.2某地區(qū)成年男性中吸煙占75%,經(jīng)過戒煙宣傳之后,進行了抽樣調(diào)查,發(fā)現(xiàn)100名被調(diào)查的成年男性,有63人是吸煙者,問戒煙宣傳是否受到了成效?(取顯著水平.)

解檢驗問題為.令

表示該調(diào)查該地區(qū)一名成年男性中吸煙的人數(shù),則

為來自總體

的樣本.由中心極限定理中知,在

成立的條件下,統(tǒng)計量

近似服從標準正態(tài)分布.因此可使用

檢驗法。例8.2.2某地區(qū)成年男性中吸煙占75%,經(jīng)過戒煙宣傳之后計算

的觀測值對給定的

,查表

,

,因此拒絕

,即認為戒煙宣傳收到了成效.(2)方差

未知,均值

的檢驗對(8.3)式給出的假設檢驗問題,可構(gòu)造如下的統(tǒng)計量

,

(8.2.3)其中.從而對給定的顯著水平

,有

,所以拒絕域可取為.稱此檢驗法為

檢驗法.計算的觀測值例8.2.3

已知某種礦石含鐵量服從正態(tài)分布,從中抽取5個樣品,經(jīng)測定其含鐵量(%)分別為:3.24,3.26,3.24,3.27,3.25,問在顯著水平

下,能否接受假設:這批礦石的含鐵量為3.25?解檢驗問題為.由于總體方差

未知,采用

檢驗法

,.由此得統(tǒng)計量的觀測值例8.2.3已知某種礦石含鐵量服從正態(tài)分布,從中抽取5個對給定的

,

查表

,故接受.即能認為這批礦石的含鐵量為3.25%.

對于以上假設檢驗問題,若采用第七章的區(qū)間估計的方法,能否作出對原假設

的判斷?

根據(jù)方差

未知,對均值

的區(qū)間估計.對給定的

,可得其置信區(qū)間

對給定的,查表

根據(jù)小概率原理,若

成立,對給定的

,可得置信度為95%的置信區(qū)間應該包含

,而現(xiàn)在一次樣本的調(diào)查結(jié)果表明

,因而無法拒絕

,即認為這批礦石的含鐵量為3.25%.通過本例可以看出,區(qū)間估計與假設檢驗的統(tǒng)計之處是相通的.實際上,假設檢驗的接受域也恰好是相應的區(qū)間估計的置信區(qū)間.根據(jù)小概率原理,若8.2.2單個正態(tài)總體方差

的假設檢驗設總體

,

是來自總體

的樣本,

未知.檢驗的問題為

為已知常數(shù)),

(8.2.4)由于樣本方差

的無偏估計,根據(jù)Fisher定理,當

成立時,從而可選取

作為檢驗統(tǒng)計量.對給定的顯著水平

所以其拒絕域為.稱此檢驗法為

檢驗法.8.2.2單個正態(tài)總體方差的假設檢驗設總體例8.2.4設某車間生產(chǎn)的銅絲的折斷力

,通常情形下

,現(xiàn)從某批產(chǎn)品中抽查5根銅絲測得其折斷力(單位:公斤)分別為578,572,570,568,582,問在顯著水平

下,能否接受該批銅絲的折斷力的方差仍為64?解檢驗的問題為

,由于總體均值

未知,采用

檢驗法

,.由此得統(tǒng)計量的觀測值例8.2.4設某車間生產(chǎn)的銅絲的折斷力對給定的

,查表

,因而

,故接受.即能認為這批銅絲的折斷力的方差仍為64.

以上(8.2.4)式的檢驗中,若均值

是已知的,檢驗統(tǒng)計量相應地為

從而對給定的顯著水平

,其拒絕域為

.上述討論的是關(guān)于方差假設檢驗問題的雙側(cè)檢驗情況,同樣關(guān)于方差假設檢驗問題也存在單側(cè)檢驗情形:對給定的,查表檢驗參數(shù)條件統(tǒng)計量及統(tǒng)計量的分布顯著水平

下拒絕域均值已知未知方差已知未知表8-2單個正態(tài)總體參數(shù)的假設檢驗檢驗條統(tǒng)計量及統(tǒng)顯著水平下拒絕域表8-2單個正態(tài)§8.3分布擬合檢驗

前面討論了在總體分布形式已知的前提下對其參數(shù)的假設檢驗問題,但在實際問題中,往往總體分布形式是未知的,需要對總體分布形式進行推斷.這類根據(jù)樣本對總體分布類型進行假設檢驗的問題,統(tǒng)稱為非參數(shù)假設檢驗.本節(jié)主要討論

擬合檢驗.設總體

的分布

未知,

是來自總體的樣本,檢驗問題

總體

的分布

(8.3.1)其中

是某個已知分布函數(shù).§8.3分布擬合檢驗前面討論了在總體分布形式已知為解決(8.3.1)式提出的假設檢驗是否成立,皮爾遜(K.Pearson)提出了

擬合檢驗法.其基本思想是將樣本觀測值決定的經(jīng)驗分布函數(shù)來替代總體分布,并與假設的理論分布相比較.由于抽樣的隨機性和樣本容量有限性,兩者之間必然存在一些偏差.問題是這種偏差能否解釋為僅僅是樣本的隨機性和試驗次數(shù)有限而帶來的隨機波動,還是因為所配合的理論分布與樣本分布之間確實具有實質(zhì)性差異所導致的.如果兩者偏差是顯著的,則認為總體分布不服從該理論分布,即拒絕

,否則接受.

擬合檢驗法的基本步驟如下:為解決(8.3.1)式提出的假設檢驗是否成立,皮爾遜(K.P(1)根據(jù)樣本觀測值的取值范圍,把總體

的一切可能取值的集合

的子集)分成

個互不相交的區(qū)間

,統(tǒng)計樣本觀測值落入各區(qū)間的頻數(shù)

與頻率

(2)在

成立的條件下,計算總體

落在每個區(qū)間的概率.若

中含有未知參數(shù),先需用極大似然估計法估計出參數(shù),再求相應的概率.

選取統(tǒng)計量

,

(8.3.2)(1)根據(jù)樣本觀測值的取值范圍,把總體的一切可能取值直觀上,

統(tǒng)計量可理解為觀測頻數(shù)與理論期望頻數(shù)的相對差異,也可理解為觀測頻率與理論概率差的加權(quán)平和.當

成立時,

值應該比較小,因此當

值大于某一臨界值時,就應該拒絕.

基于上述直觀理解,皮爾遜采用(8.3.2)式確定的統(tǒng)計量作為檢驗

的統(tǒng)計量,并證明了如下定理:

定理8.3.1(皮爾遜定理)對充分大的

,當

成立時,統(tǒng)計量(8.3.2)近似地服從自由度為

分布,其中

為待估參數(shù)的個數(shù).直觀上,統(tǒng)計量可理解為觀測頻數(shù)與理論期望頻數(shù)的相對

(3)在

成立的條件下,給定顯著水平

,可得拒絕域為.(4)根據(jù)樣本觀測值計算

值若

,拒絕

;若

,接受.

需要指出的是應用

擬合檢驗時,要求樣本容量

較大,一般分為5至7個區(qū)間,且樣本觀測值落入每個區(qū)間的頻數(shù)不能少于4,若少于4,則應并入相鄰的區(qū)間.盡管

擬合檢驗對于離散型和連續(xù)型總體分布都適用,但它依賴于區(qū)間的劃分,

擬合檢驗實質(zhì)上只是檢驗了

是否為真,并未真正檢驗總體分布

是否為.(3)在成立的條件下,給定顯著水平例8.3.1自1875年至1955年,對其中63年的觀測中,某市夏季共有180天下過暴雨.把5至9月作為夏季,每年夏季共153天.在統(tǒng)計的63年中,某市一年夏季有

天發(fā)生過暴雨的年數(shù)

如下表:012345678合計

481419104211063表8-5試問:觀測結(jié)果能否說明某市一年內(nèi)夏季發(fā)生暴雨的天數(shù)服從泊松分布

?

例8.3.1自1875年至1955年,對其中63年的觀測中解以

表示某市一年內(nèi)夏季發(fā)生暴雨的天數(shù),根據(jù)容量為63的樣本來檢驗假設

總體

服從泊松分布.當

成立時,

未知.首先要求出

的極大似然估計值把

的一切可能取值分為7個組,

,則在

成立時,可求出

的值如下:解以表示某市一年內(nèi)夏季發(fā)生暴雨的天數(shù),根據(jù)容量列表計算

列表計算值一年中暴雨天數(shù)實際年數(shù)假設概率期望年數(shù)040.05743.610.0399180.164110.340.5296

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論