第七章 假設檢驗_第1頁
第七章 假設檢驗_第2頁
第七章 假設檢驗_第3頁
第七章 假設檢驗_第4頁
第七章 假設檢驗_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第七章假設檢驗

假設檢驗的基本問題

一個總體參數(shù)的檢驗

二個總體參數(shù)的檢驗第一節(jié)假設檢驗的基本問題一、假設檢驗的陳述

由統(tǒng)計資料得知,2007年某地新生兒的平均體重為3190克,現(xiàn)從2008年的新生兒中隨機抽取100個,測得其平均體重為3210克,問2008年的新生兒與2007年相比,體重有無顯著差異。用統(tǒng)計的語言來說,“假設”就是對總體參數(shù)的具體數(shù)值所作的陳述。在假設檢驗中,首先需要提出兩種假設,即原假設和備擇假設。原假設,通常是研究者想收集證據(jù)予以反對的假設,由于原假設(H)用0修飾,所以也稱為零假設。備擇假設,通常是研究者想收集證據(jù)予以支持的假設,也稱為研究假設、替換假設,用H1或Ha表示。備擇假設通常是用于支持你自己的看法。假設的形式:H0——原假設,H1——備擇假設雙尾/側檢驗:H0:μ=μ0

,H1:μ≠μ0單尾/側檢驗:左側檢驗:H0:μ≥μ0

,H1:μ<μ0

右側檢驗:H0:μ≤μ0

,H1:μ>μ0幾點說明:第一,原假設和備擇假設是一個完備事件組,而且相互對立。第二,在建立假設時,通常是先確定備擇假設,然后再確定原假設。第三,在假設檢驗中,等號“=”總是放在原假設上。第四,在面對某一實際問題時,原假設和備擇假設可能是截然相反的。第五,假設檢驗的目的主要是收集證據(jù)來拒絕原假設。二、假設檢驗規(guī)則與兩類錯誤

1、確定檢驗規(guī)則差異臨界點判斷C拒絕H0C不拒絕H02、兩類錯誤

I類錯誤——棄真錯誤,發(fā)生的概率為α。

II類錯誤——取偽錯誤,發(fā)生的概率為β。檢驗決策H0為真H0非真拒絕H0犯I類錯誤(α)正確不拒絕H0正確犯II類錯誤(β)(a)(b)拒絕域假設檢驗中犯兩類錯誤的情況第一類錯誤:H0本身成立,但通過檢驗卻否定了它,犯了“棄真”錯誤,也叫Ⅰ型錯誤(typeⅠerror)、а錯誤。Ⅰ型錯誤,就是把非真實差異錯判為真實差異,即H0:μ1=μ2為真,卻接受了HA:μ1≠μ2

。第二類錯誤:H0本身不成立,但通過檢驗卻接受了它,犯了“取偽”錯誤,也叫II型錯誤(typeIIerror)、β錯誤。II型錯誤,真實差異錯判為非真實差異,即HA:μ1≠μ2為真,卻未能否定H0:μ1=μ2。

統(tǒng)計檢驗是基于“小概率事件實際不可能性原理”來否定H0

,但在一次試驗中小概率事件并不是絕對不會發(fā)生的。如果我們抽得一個樣本,它雖然來自與H0對應的抽樣總體,但計算所得的統(tǒng)計量卻落入了否定域中,因而否定了H0,于是犯了Ⅰ型錯誤。發(fā)生第Ⅰ類錯誤的概率也常被用于檢驗結論的可靠性度量,假設檢驗中犯的第Ⅰ類錯誤的概率被稱為顯著性水平,記為α。

Ⅱ型錯誤概率β值的大小較難確切估計,它只有與特定的HA結合起來才有意義。一般與顯著水平α、原總體的標準差σ、樣本含量n、以及相互比較的兩樣本所屬總體平均數(shù)之差μ1-μ2等因素有關。在其它因素確定時,α值越小,β越大;反之,α值越大,β值越?。粯颖竞考唉?-μ2越大、均數(shù)標準誤σ越小,β值越小。

由于β值的大小與α值的大小有關,所以在選用檢驗的顯著水平時應考慮到犯Ⅰ、Ⅱ型錯誤所產(chǎn)生后果嚴重性的大小,還應考慮到試驗的難易及試驗結果的重要程度。若一個試驗耗費大,可靠性要求高,不允許反復,那么α值應取小些;當一個試驗結論的使用事關重大,容易產(chǎn)生嚴重后果,如藥物的毒性試驗,α值亦應取小些。對于一些試驗條件不易控制,試驗誤差較大的試驗,可將α值放寬到0.1,甚至放寬到0.25。三、檢驗統(tǒng)計量與拒絕域根據(jù)樣本觀測結果計算得到的,并據(jù)以對原假設和備擇假設做出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量。檢驗統(tǒng)計量實際上是總體參數(shù)的點估計量,但點估計量并不能直接作為檢驗的統(tǒng)計量。只有將其標準化后,才能用于度量它與原假設的參數(shù)值之間的差異程度。對點估計量標準化的依據(jù)則是:①原假設為真;②點估計量的抽樣分布。實際上,假設檢驗中所有的檢驗統(tǒng)計量都是標準化檢驗統(tǒng)計量,它反映了點估計量與假設的總體參數(shù)相比相差多少個標準差。為敘述方便,通常將標準化檢驗統(tǒng)計量簡稱為檢驗統(tǒng)計量。①設有總體:,σ2已知。②隨機抽樣:樣本均值④確定α值⑤查概率表,知臨界值⑥計算Z值,作出判斷:③標準化:,拒絕H0。若,接受H0;若建立總體假設(1)抽樣得到樣本觀察值(2)根據(jù)具體決策要求確定α(4)選擇統(tǒng)計量確定H0為真時的抽樣分布(3)(5)確定分布上的臨界點C和檢驗規(guī)則(7)比較并作出檢驗判斷(6)計算檢驗統(tǒng)計量的數(shù)值【例】由統(tǒng)計資料得知,2007年某地新生兒的平均體重為3190克,標準差為80,現(xiàn)從2008年的新生兒中隨機抽取100個,測得其平均體重為3210克,問2008年的新生兒與2007年相比,體重有無顯著差異(α=0.05)。假設檢驗的流程如下:1.提出原假設和備擇假設:

H0:μ=3190(克),H1:μ≠3190(克)2.確定適當?shù)臋z驗統(tǒng)計量,并計算其數(shù)值:3.確定4.做出判斷,拒絕H0

四、利用P值進行決策如果原假設H0為真,所得到的樣本結果會像實際觀測結果那么極端或更極端的概率,稱為P值,也稱為觀察到的顯著性水平。P值與原假設的對或錯的概率無關,它是關于數(shù)據(jù)的概率。P值告訴我們:在某個總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。也就是說,P值是當原假設正確時,得到所觀測的數(shù)據(jù)的概率。

如前例,據(jù)隨機抽樣測得2008年的樣本均值為3210克,與2007年的總體均值3190克相差20克,20克的差異究竟是大還是小。換句話說,如果原假設成立,即2008年新生兒體重的總體均值與2007年新生兒體重的總體均值相同,那么隨機抽取出n=100的樣本,其均值大于3210克的概率有多大呢?這個概率稱為P值,所以P值就是當原假設為真時所得到的樣本觀察結果或更極端結果出現(xiàn)的概率。如果P值很小,說明這種情況發(fā)生的概率很小,而如果出現(xiàn)了,根據(jù)小概率原理,我們就有理由拒絕原假設,P值越小,我們拒絕原假設的理由就越充分。計算P值的一般表達式(1):左側檢驗:P值是當時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率,即P值=計算P值的一般表達式(2):右側檢驗:P值是當時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率,即P值=計算P值的一般表達式(3):雙側檢驗:P值是當時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率,即P值=在已知P值的條件下,將其與給定的顯著性水平α值進行比較,單側檢驗中,P值位于抽樣分布的一側,而雙側檢驗P值位于分布的兩側,每一側的P值為1/2。如果P值<α,拒絕原假設;如果P值>α,不拒絕原假設。第二節(jié)一個總體均值、比例和方差

的假設檢驗一、總體均值的檢驗

【例】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標準差為5ml。為檢驗每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機抽取了40罐進行檢驗,測得每罐平均容量為255.8ml。取顯著性水平α=0.05,檢驗該天生產(chǎn)的飲料容量是否符合標準要求。解:提出的原假設和備擇假設為:計算檢驗統(tǒng)計量的具體數(shù)值:顯著性水平α=0.05,得由于所以,不拒絕原假設。檢驗結果表明:樣本提供的證據(jù)不足以推翻原假設,因此不能證明該天生產(chǎn)的飲料不符合標準要求。方法二:用P值進行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.312495>α=0.05

3.作出決策由于P值=0.312495遠遠大于α=0.05,所以不拒絕原假設,得到的結論與前面的相同。

【例】某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工的零件的橢圓度漸近服從正態(tài)分布,其總體均值為0.081mm,今另換一種新機床進行加工,取200個零件進行檢驗,得到橢圓度均值為0.076mm,樣本標準差為0.025mm,問新機床加工零件的橢圓度總體均值與以前有無明顯差別。解:提出的原假設和備擇假設為:計算檢驗統(tǒng)計量的具體數(shù)值:顯著性水平α=0.05,得由于所以,拒絕原假設??梢哉J為新老機床加工零件的橢圓度的均值有顯著差異。方法二:用P值進行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.004655>α=0.05

3.作出決策由于P值=0.004655遠遠小于α=0.05,所以拒絕原假設,得到的結論與前面的相同。

【例】某批發(fā)商欲從廠家購進一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均不能低于1000小時。已知燈泡燃燒壽命服從正態(tài)分布,標準差為200小時。在總體中隨機抽取了100個燈泡,得知樣本均值為960小時,批發(fā)商是否應該購買這批燈泡?解:提出的原假設和備擇假設為:計算檢驗統(tǒng)計量的具體數(shù)值:顯著性水平α=0.05,得由于所以,拒絕原假設,即這批燈泡的使用壽命低于1000小時,批發(fā)商不應購買這批燈泡。方法二:用P值進行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.02275<α=0.05

3.作出決策由于P值=0.02275小于α=0.05,所以拒絕原假設,得到的結論與前面的相同?!锶绻诖死募僭O檢驗中,取顯著性水平α=0.02,會發(fā)生什么?

雙側檢驗左側檢驗右側檢驗假設形式檢驗統(tǒng)計量Α與拒絕域P值決策準則大樣本情況下一個總體均值的檢驗方法P<α,拒絕H0小樣本的檢驗方法【例】一種汽車配件的平均長度要求為12cm,高于低于該標準均被認為是不合格的。汽車生產(chǎn)企業(yè)在購進配件時,通常是經(jīng)過招標,然后對中標的配件提供商提供的樣品進行檢驗,以決定是否購進?,F(xiàn)對一個配件提供商提供的10個樣本進行了檢驗,結果如下:

12.2

10.8

12.0

11.8

11.9

12.4

11.3

12.2

12.0

12.3

假設該供貨商生產(chǎn)的配件服從正態(tài)分布,在0.05的顯著性水平下,檢驗該供應商提供的配件是否符合要求?解:依題意建立如下原假設和備擇假設:

H0:μ=12

H1:μ≠12根據(jù)樣本數(shù)據(jù)計算得:由于n=10<30,為小樣本,采用t檢驗統(tǒng)計量:根據(jù)自由度(n-1)=10-1=9,查t分布表得:由于不拒絕原假設,樣本提供的證據(jù)不足以推翻原假設。供應商提供的配件可以認為是符合要求的。方法二:用P值進行檢驗

1.用EXCEL計算P值

2.比較P值

P=0.498469786

>α=0.05

3.作出決策由于P值大于α=0.05,所以不拒絕原假設,得到的結論與前面的相同。雙側檢驗左側檢驗右側檢驗假設形式檢驗統(tǒng)計量Α與拒絕域P值決策準則小樣本情況下一個總體均值的檢驗方法P<α,拒絕H0二、總體比例的檢驗條件檢驗統(tǒng)計量H0、H1

拒絕域P值決策準則二項分布np≥5n(1-p)≥5H0:π=π0H1:π≠π0P<α,拒絕H0H0:π≥π0H1:π<π0H0:π≤π0H1:π>π0【例】一項統(tǒng)計結果聲稱,某市老年人口(年齡在65歲以上)所占的比例為14.7%,該市老年人口研究會為了檢驗該項統(tǒng)計是否可靠,隨機抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上,調(diào)查結果是否支持該市老年人口比例為14.7%的看法(α=0.05)?解:H0:π=14.7%

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論