第七章 假設檢驗_第1頁
第七章 假設檢驗_第2頁
第七章 假設檢驗_第3頁
第七章 假設檢驗_第4頁
第七章 假設檢驗_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1教師:陳新宏單位:數(shù)學與統(tǒng)計學院概率論與數(shù)理統(tǒng)計

2第七章假設檢驗

《統(tǒng)計學》編委制作3主要內容第一節(jié)假設檢驗的基本原理第二節(jié)總體均值的檢驗第三節(jié)總體方差和比例的檢驗4第一節(jié)假設檢驗的基本原理一、假設檢驗的意義和依據(jù)二、假設檢驗的基本形式三、假設檢驗的兩類錯誤四、檢驗統(tǒng)計量的構造五、假設檢驗的一般步驟51、小概率原理:指發(fā)生概率很小的隨機事件在一次試驗中是幾乎不可能發(fā)生的。小概率指p<5%。

2、假設檢驗的基本思想是應用小概率原理。例如:某廠產(chǎn)品合格率為99%,從一批(100件)產(chǎn)品中隨機抽取一件,恰好是次品的概率為1%。隨機抽取一件是次品幾乎是不可能的,但是這種情況發(fā)生了,我們有理由懷疑該廠的合格率為99%.這時我們犯錯誤的概率是1%。一、假設檢驗的意義和依據(jù)63.顯著性水平用樣本推斷H0是否正確,必有犯錯誤的可能。原假設H0正確,而被我們拒絕,犯這種錯誤的概率用表示。把稱為假設檢驗中的顯著性水平(Significantlevel),即決策中的風險。顯著性水平就是指當原假設正確時人們卻把它拒絕了的概率或風險。通常?。?.05或=0.01或=0.001,那么,接受原假設時正確的可能性(概率)為:95%,99%,99.9%。7二、假設檢驗的基本形式8雙側檢驗臨界值和拒絕域使用臨界值臨界值臨界值拒絕域拒絕域(一)雙側檢驗(雙尾)

關心的是要檢驗總體參數(shù)與假定值有沒有顯著差異,而不問差異的方向是正或負。9例:=0.05時的接受域和拒絕域10【例】一個著名的醫(yī)生聲稱有75%的女性所穿鞋子過小,一個研究組織對356名女性進行了研究,發(fā)現(xiàn)其中有313名婦女所穿鞋子的號碼至少小一號。你對這個醫(yī)生的論斷有何看法?

分析:這是一個雙側檢驗的問題。我們所關心的是:穿鞋子過小的女性比例與75%是否有顯著差異。此時,可做如下假設:11(二)單側檢驗(單尾)關心的是要檢驗總體參數(shù)與假定值是否有特定方向的顯著差異。1.下側檢驗下側檢驗臨界值和拒絕域使用臨界值臨界值拒絕域12【例】已知番茄罐頭中,維生素C含量服從正態(tài)分布。按照規(guī)定,維生素C的含量不得少于21mg?,F(xiàn)從一批罐頭中抽取17罐,計算得維生素C含量的平均值為23mg,標準差為3.98mg。問該批罐頭維生素C的含量是否合格?

分析:這個題目中,我們關心的是罐頭中維生素C的含量是否合格,即維生素C的含量是否低于規(guī)定標準21mg,因此屬于下側檢驗的問題。應提出如下假設:

132.上側檢驗上側檢驗臨界值和拒絕域臨界值拒絕域使用臨界值14【例】某廠有一批產(chǎn)品,須經(jīng)檢驗合格才能出廠。按照規(guī)定,次品率不能超過2%。今從這批產(chǎn)品中任意抽取10件,發(fā)現(xiàn)有1件次品。問:這批產(chǎn)品是否合格?分析:題目關心的是:這批產(chǎn)品是否合格,等同于檢驗該批產(chǎn)品的次品率是否高于規(guī)定值2%,因此屬于上側檢驗的問題。應做如下假設:

15注釋:雙側檢驗與單側檢驗假設檢驗根據(jù)實際的需要可以分為:雙側檢驗(雙尾):指只強調差異而不強調方向性的檢驗。單側檢驗(單尾):強調某一方向性的檢驗。左側檢驗右側檢驗16假設檢驗中的兩類錯誤假設檢驗是依據(jù)樣本提供的信息進行推斷的,即由部分來推斷總體,因而假設檢驗不可能絕對準確,是可能犯錯誤的。兩類錯誤:

錯誤(I型錯誤):H0為真時卻被拒絕,棄真錯誤;

錯誤(II型錯誤):H0為假時卻被接受,取偽錯誤。

假設檢驗中各種可能結果的概率:接受H0,拒絕H1拒絕H0,接受H1H0為真

1-(正確決策)(棄真錯誤)H0為偽

(取偽錯誤)1-(正確決策)三、假設檢驗的兩類錯誤1718(1)與是兩個前提下的概率。即是拒絕原假設H0時犯錯誤的概率,這時前提是H0為真;是接受原假設H0時犯錯誤的概率,這時前提是H0為偽。所以+不等于1。

(2)對于固定的n,與一般情況下不能同時減小。對于固定的n,越小,Z/2越大,從而接受假設區(qū)間(-Z/2,Z/2)越大,H0就越容易被接受,從而“取偽”的概率就越大;反之亦然。即樣本容量一定時,“棄真”概率和“取偽”概率不能同時減少,一個減少,另一個就增大。

與19

(3)要想減少與,一個方法就是要增大樣本容量n。與20四、檢驗統(tǒng)計量的構造根據(jù)樣本觀測結果計算得到的,并據(jù)以對原假設和備擇假設做出決策的某個樣本統(tǒng)計量,稱為檢驗統(tǒng)計量。與參數(shù)估計相同,需要考慮:總體是否正態(tài)分布;大樣本還是小樣本;總體方差已知還是未知。21五、假設檢驗的一般步驟(一)臨界值法的檢驗步驟提出與應用相適應的原假設

和備擇假設

。指定檢驗中的顯著性水平

。確定適當?shù)臋z驗統(tǒng)計量。確定臨界值和拒絕域。利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值。利用拒絕規(guī)則,作出決策:若統(tǒng)計量的值落在拒絕域,則拒絕

;否則不能拒絕。22第二節(jié)總體均值的檢驗一、單個總體均值的假設檢驗(一)大樣本的檢驗方法(二)小樣本的檢驗方法(正態(tài)總體)23一、單個總體均值的假設檢驗(一)大樣本的檢驗方法1.總體方差已知【例】一種袋裝牛奶采用自動生產(chǎn)線包裝生產(chǎn),按照標準,每袋牛奶的容量為221ml,標準差為5ml。質檢人員在某批包裝的牛奶中隨機抽取了50袋進行檢驗,測得樣本平均容量為220.5ml。要求:在顯著性水平為0.05的條件下檢驗該批袋裝牛奶是否符合標準要求。24解:這里,我們關心的是總體均值與221ml是否有顯著差異的問題,所以屬于雙側檢驗的問題。按照假設檢驗的步驟(臨界值法):(1)依據(jù)題意設立假設(2)指定顯著性水平(3)確定適當?shù)臋z驗統(tǒng)計量25(4)確定臨界值和拒絕域在的顯著性水平下,對應查標準正態(tài)分布表可得:臨界值為=1.96;拒絕域為:(5)利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量的值(6)根據(jù)規(guī)則作出決策由于-0.71>-1.96,統(tǒng)計量沒有落在拒絕域,因此不能拒絕原假設。即:沒有足夠證據(jù)表明該批產(chǎn)品不符合標準。

262.5%2.5%-1.961.96拒絕域拒絕域0-0.7127[例7-2]某市歷年來對7歲男孩的統(tǒng)計資料表明,他們的身高服從均值為1.32米、標準差為0.12米的正態(tài)分布?,F(xiàn)從各個學校隨機抽取25個7歲男學生,測得他們平均身高1.36米,若已知今年全市7歲男孩身高的標準差仍為0.12米,問與歷年7歲男孩的身高相比是否有顯著差異(?。?.05)。

解:從題意可知,=1.36米,=1.32米,=0.12米。

(1)建立假設:H0:=1.32,H1:1.32

(2)確定統(tǒng)計量:

28

(3)Z的分布:Z~N(0,1)

(4)對給定的=0.05確定臨界值。因為是雙側備擇假設所以查表時要注意。因概率表是按雙側排列的,所以應查1-0.05=0.95的值,查得臨界值=1.96。

(5)檢驗準則。|Z|<1.96,接受H0,反之,拒絕H0。

(6)決策:因Z=1.67<1.96;落在了接受域,因此認為今年7歲男孩平均身高與歷年7歲男孩平均身高無顯著差異,即不能拒絕零假設。

29

例2:設某廠生產(chǎn)一種燈管,其壽命X~N(,2002),由以往經(jīng)驗知平均壽命

=1500小時,現(xiàn)采用新工藝后,在所生產(chǎn)的燈管中抽取25只,測得平均壽命1675小時,問采用新工藝后,燈管壽命是否有顯著提高。(=0.05)解:這里拒絕H030(一)大樣本的檢驗方法2.總體方差未知例3糖廠用自動打包機打包,已知包重服從正態(tài)分布。每天開工后需要檢驗一次打包機工作是否正常。每包標準重量為100公斤。某日開工后,隨機抽取30包測得平均重量是99.7公斤,標準差為0.2公斤。問該日打包機工作是否正常?31解:這個題目屬于大樣本且總體方差未知的情形。打包機對糖進行打包,少于或多于100公斤都不正常,所以此題屬于雙側檢驗的問題。假設檢驗過程如下(臨界值法):(1)設立假設(2)指定顯著性水平(3)構造檢驗統(tǒng)計量

32(4)確定臨界值和拒絕域在的顯著性水平下,對應查標準正態(tài)分布表可得:臨界值為

=1.96;拒絕域為:(5)計算檢驗統(tǒng)計量的樣本觀測值(6)利用規(guī)則作出決策由于-8.22<-1.96,統(tǒng)計量落在了拒絕域內,因此拒絕原假設。即:有足夠證據(jù)表明,該日糖廠自動打包機工作不正常。332.5%2.5%-1.961.96拒絕域拒絕域0-8.2234(二)小樣本的檢驗方法(正態(tài)總體)

1.總體方差已知【例】設某產(chǎn)品的某指標服從正態(tài)分布,總體標準差為100個單位。今抽取了一個容量為17的樣本,計算得平均值為1650個單位。問在顯著性水平0.05下,能否認為這批產(chǎn)品的指標的期望值不低于1600?35解:(1)提出原假設和備擇假設

(2)確定顯著性水平(3)構造檢驗統(tǒng)計量由于題目給定是正態(tài)總體,所以同樣使用Z統(tǒng)計量36(4)確定臨界值和拒絕域單側檢驗下,對應查標準正態(tài)分布表可得:臨界值為=1.645;拒絕域為:(5)利用樣本信息計算統(tǒng)計量的值(6)利用規(guī)則作出決策由于2.06>1.645,統(tǒng)計量的觀測值落入了拒絕域內,因此有充分證據(jù)拒絕原假設。即這批產(chǎn)品的指標的期望值不低于1600。371.645拒絕域02.065%38·雙邊檢驗:對于假設H0:=0;H1:0由p{|T|t/2(n1)}=,得水平為的拒絕域為|T|t/2(n1),(二)小樣本的檢驗方法(正態(tài)總體)2.總體方差未知39t檢驗法是使用服從t分布的統(tǒng)計量檢驗正態(tài)總體平均值的方法。當正態(tài)總體標準差未知時,檢驗零假設H0:??梢宰C明,在H0成立的前提下,有:(其中,樣本標準差)40例3用熱敏電阻測溫儀間接溫量地熱勘探井底溫度,重復測量7次,測得溫度(℃):112.0113.4111.2112.0114.5112.9113.6而用某種精確辦法測得溫度為112.6(可看作真值),試問用熱敏電阻測溫儀間接測溫有無系統(tǒng)偏差(設溫度測量值X服從正態(tài)分布,取=0.05)?解:H0:=112.6;H1:112.6由p{|T|t0.025(n1)}=0.05,得水平為=0.05的拒絕域為|T|t0.025(6)=2.4469這里接受H041

[例7-5]某制藥廠試制某種安定神經(jīng)的新藥,給10個病人試服,結果各病人增加睡眠量如表7-2所示。

表7-1病人服用新藥增加睡眠量表

試判斷這種新藥對病人有無安定神經(jīng)的功效(=0.05)。

解:(1)建立假設H0:(沒有功效);

H1:(有功效)(單側備擇假設)

(2)計算統(tǒng)計量:

=1.24=1.45

病人號碼12345678910增加睡眠(小時)0.7-1.1-0.21.20.13.43.70.81.82.042

=2.57

(3)確定統(tǒng)計量分布。本例中,。

(4)對于給定的顯著性水平0.05,查自由度為9的t分布表,單側臨界值為1.833。

(5)建立檢驗規(guī)則。|t|1.833,接受H0,否則,拒絕H0。

(6)結論。因為本例t=2.57﹥1.833,所以,拒絕H0,即,認為這種新藥對病人有安定神經(jīng)的功效。

43【例】某公司年度財務報表的附注中聲明,其應收賬款的平均計算誤差不得超過50元。審計師從該公司年度內應收賬款賬戶中隨機抽取15筆進行調查,發(fā)現(xiàn)樣本平均計算誤差為55元,標準差為9元。假設該公司應收賬款的誤差服從正態(tài)分布,試以0.05的顯著性水平評估該公司應收賬款的平均計算誤差是否超過了規(guī)定的標準。44解:題目滿足正態(tài)總體、小樣本、總體方差未知的條件,應使用t檢驗。且題目關心的方向是“>”,屬于上側檢驗的問題。(1)設立原假設和備擇假設(2)確定顯著性水平(3)構造t統(tǒng)計量45(4)確定臨界值和拒絕域,由于此題是上側檢驗問題,所以查t分布表得:拒絕域為:(5)計算統(tǒng)計量的值(6)決策因為2.15>1.761,樣本統(tǒng)計值落在了拒絕域,應該拒絕原假設。即該公司應收賬款的平均計算誤差超過了規(guī)定的標準。

461.761拒絕域02.155%47例4已知某煉鐵廠的鐵水含碳量在正常情況下服從正態(tài)分布N(4.55,0.112).某日測得5爐鐵水含碳量如下:4.28,4.40,4.42,4.35,4.37.如果標準差不變,該日鐵水的平均含碳量是否顯著偏低?(取=0.05)解:得水平為的拒絕域為這里拒絕H048注:上題中,用雙邊檢驗或右邊檢驗都是錯誤的.若用雙邊檢驗,H0:=4.55;H1:4.55,則拒絕域為由|U|=3.78>1.96,故拒絕H0,說明可以認為該日鐵水的平均含碳量顯著異于4.55.但無法說明是顯著高于還是低于4.55.不合題意若用右邊檢驗,H0:4.55;H1:>4.55,則拒絕域為由U=-3.78<-1.96,故接受H0,說明不能認為該日鐵水的平均含碳量顯著高于4.55.但無法區(qū)分是等于還是低于4.55.不合題意.49假定未知,·雙邊檢驗:對于假設501.總體均值已知時,檢驗總體方差是否等于已知常數(shù)時檢驗步驟:建立假設:H0:(已知數(shù)),H1:(或、)。計算統(tǒng)計量

三、總體方差的檢驗51確定統(tǒng)計量的分布。當H0成立,可證明

服從自由度為n的分布。對給定的顯著性水平,查分布表,得到檢驗臨界值。確定判別標準。若﹥或﹤(雙側備擇假設),或﹥(右單側)或﹤(左單側)

則拒絕H0;否則,接受H0

。進行統(tǒng)計決策。52

2.總體均值未知時,在檢驗總體方差是否等于已知常數(shù)時,必須通過樣本,求得樣本平均數(shù),用來代替總體均值,這時統(tǒng)計量

服從自由度為n-1的分布。

有時候樣本平均數(shù)未知,但已知樣本方差,則可用統(tǒng)計量

仍然服從自由度為n-1的分布。

53[例7-11]根據(jù)過去實驗.某產(chǎn)品的某種質量指標服從正態(tài)分布,其方差=7.5?,F(xiàn)在,從這種產(chǎn)品中隨機抽取25件,測得樣本方差=10,試判斷產(chǎn)品質量變異程度是否增大了(=0.05)

解:(1)建立假設:H0:(已知數(shù)),H1:﹥。

(2)計算統(tǒng)計量

(3)確定統(tǒng)計量的分布。當H0成立,可證明

服從自由度df為25-1=24的分布。54(4)對給定的顯著性水平,查分布表,得到檢驗臨界值。因為是右單側備擇假設,對應于=0.05,df=24,

=36.415

(5)確定判別準則。若﹥=36.415,則拒絕H0;否則,接受H0。

(6)作結論。因為=44﹥36.415,所以,拒絕原假設,接受H1,認為產(chǎn)品質量變異程度增大了。

55例5電工器材廠生產(chǎn)一批保險絲,取10根測得其熔化時間(min)為42,65,75,78,59,57,68,54,55,71.問是否可以認為整批保險絲的熔化時間的方差小于等于80?(=0.05),熔化時間為正態(tài)變量.)得水平為=0.05的拒絕域為這里接受H056設保險絲的融化時間服從正態(tài)分布,取9根測得其熔化時間(min)的樣本均值為62,標準差為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論