第十二假設檢驗演示文稿_第1頁
第十二假設檢驗演示文稿_第2頁
第十二假設檢驗演示文稿_第3頁
第十二假設檢驗演示文稿_第4頁
第十二假設檢驗演示文稿_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十二假設檢驗演示文稿當前1頁,總共38頁。(優(yōu)選)第十二假設檢驗當前2頁,總共38頁。第十二章假設檢驗假設檢驗參數假設檢驗非參數假設檢驗總體分布已知,檢驗關于未知參數的某個假設總體分布未知時的假設檢驗問題當前3頁,總共38頁。第一節(jié)檢驗的基本原理

一、檢驗問題的提法

假設檢驗是既同估計密切聯(lián)系,但又有重要區(qū)別的一種推斷方法。例如:某種電子元件壽命X服從參數為λ的指數分布,隨機抽取其中的n件。測得其壽命數據,

問題⑴,這批元件的平均壽命是多少?問題⑵,按規(guī)定該型號元件當壽命不小于5000(h)為合格,問該批元件是否合格?

問題⑴是對總體未知參數μ=E(X)=1/λ作出估計?;卮稹唉淌嵌嗌??”,是定量的。問題⑵則是對假設“這批元件合格”做出接受還是拒絕的回答,因而是定性的。當前4頁,總共38頁。

對上述例子,還可做更細致考察,設想如基于一次觀察數據算出μ的估計值,我們能否就此接受“這批元件合格”的這一假設呢?盡管但這個估計僅僅是一次試驗的結果,能否保證下一次測試結果也能得到μ的估計值大于5000呢?也就是說從觀察數據得到的結果與參考值5000的差異僅僅是偶然的呢?還是總體均值μ確實有大于5000的“趨勢”?

這些問題是以前沒有研究過的。一般而言,估計問題是回答總體分布的未知參數是多少?或范圍有多大?而假設檢驗問題則是回答觀察到的數據差異只是機會差異,還是反映了總體的真實差異?因此兩者對問題的提法有本質不同。第一節(jié)檢驗的基本原理當前5頁,總共38頁。例有一批產品,需經檢驗合格后才能出廠,按按標準其次品率不得超過4%今從這批產品中任意抽10件,發(fā)現(xiàn)有3件次品,問這批產品能否出廠解:直觀上看,這批產品似乎不能出廠,但理論依據何在現(xiàn)以p表示這批產品的次品率,按標準,若p<=0.04,這批產品可出廠,若p>0.04,則這批產品不能出廠。我們的問題就是要根據“10件產品中有3件次品”,這一抽樣結果來判斷p是否大于0.04我們先提兩個相互對立的假設,注意到,在假設成立的前提下,“10件產品中有3件次品”這一抽樣結果的概率其概率小于0.01,即這是一個小概率事件。根據實際推理原理,小概率事件在一次抽樣中是不可能發(fā)生的。而今這一小概率事件在一次抽樣中竟然發(fā)生了,這是不合理的。所以不成立,即成立。所以按此標準這批產品不能出廠當前6頁,總共38頁。

下面通過一個例子介紹原假設和備擇假設二.原假設和備擇假設第一節(jié)檢驗的基本原理當前7頁,總共38頁。例1(酒精含量)一種無需醫(yī)生處方即可達到的治療咳嗽和鼻塞的藥。按固定其酒精含量為5﹪.今從一出廠的一批藥中隨機抽取10瓶,測試其酒精含量得到的10個含量的百分數:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06如果酒精含量服從正態(tài)分布N(μ,0.00016),問該批藥品的酒精含量是否合乎規(guī)定?任務:

通過樣本推斷X的均值μ是否等于5.假設:上面的任務就是要通過樣本去檢驗“X的均值=5”這樣一個假設是否成立.(在數理統(tǒng)計中把“X的均值μ=5”這樣一個待檢驗的假設記作“H0:μ=5”稱為

“原假設”或“零假設”.表明數據的“差異”是偶然的,總體沒有“變異”發(fā)生.

當前8頁,總共38頁。

原假設的對立面是“X的均值μ≠10”記作“H1:μ≠10”稱為“對立假設”或“備擇假設”.表明數據的“差異”不是偶然的,是總體“變異”的表現(xiàn).把它們合寫在一起就是:H0:μ=10

H1:μ≠10

原假設H0表明含量符合規(guī)定,這個5﹪也稱之為期望數,盡管10個數據都5﹪與有出入,這只是抽樣的隨機性所致;備擇假設H1表明總體均值μ已經偏離了期望數5﹪,數據與期望數5﹪的差異是其表現(xiàn).假設檢驗的任務

必須在原假設與備擇假設之間作一選擇當前9頁,總共38頁。檢驗統(tǒng)計量是構造一個適當的能度量觀察數與原假設下的期望數之間的差異程度的統(tǒng)計量,此統(tǒng)計量為檢驗統(tǒng)計量.特點:在原假設H0下分布式完全一致或者說可以計算.因而通過標準化可得到檢驗統(tǒng)計量三.檢驗統(tǒng)計量

本例的觀察數通過樣本平均表示,它是μ的一個無偏估計,而在下的期望數為μ=5,在H0下當前10頁,總共38頁。

從試驗數據判斷是否導致一個矛盾的結果,一個重要的依據是小概率事件的實際推斷原理.

看例1,由觀察數據,可算得的觀察值為4.989,代入統(tǒng)計量Z的表達式,得Z的觀察值為

四.否定論證及實際推斷原理

否定論證是假設檢驗的重要推理方法,其要旨是:先假定原假設H0成立,如果從試驗觀察數據及此假定將導致一個矛盾的結果,則必須否定這個原假設;反之,如果不出矛盾的結果,就不能否定原假設.當前11頁,總共38頁。

在H0下,Z服從標準正態(tài)分布,對于特定的一次試驗,統(tǒng)計量Z取得觀察值-2.7509,是十分罕見的,以至于實際不會發(fā)生.事實上,當H0成立時,事件發(fā)生的機會只有5﹪(如圖)

這是一個小概率事件.今從試驗數據得到Z=-2.7509,由于表明這一小概率事件在該次試驗中發(fā)生,這與實際推斷原理矛盾.因此否定原假設.至此本例已獲得解答,即基于數據該批藥品的酒精含量不符合規(guī)定.注意:

在否定論中最終能否得出矛盾的結果,取決于數據.02.5﹪1.96-1.96-2.7509當前12頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗一.假設檢驗的兩類錯誤

一類錯誤是,當H0為真時,因為盡管事件{A|H0}是小概率事件,但仍有可能發(fā)生,即樣本觀察值(x1,x2,...,xn)∈R時,按檢驗法則將拒絕原假設H0,這種錯誤稱為第一類錯誤.

根據檢驗法則,若A發(fā)生則拒絕H0,否則接受H0.這不免要犯二類錯誤.當前13頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗一.假設檢驗的兩類錯誤

另一類錯誤是,當原假設H0不真,即H1為真時,A也有可能不發(fā)生,即樣本觀察值(x1,x2,...,xn)∈R*,按檢驗法則將接受原假設H0,這種錯誤稱為第二類錯誤.當前14頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗正確正確H0

為真H0

為假真實情況所作判斷接受H0拒絕H0第一類錯誤(棄真)第二類錯誤(取偽)注意:不可能消除這兩種錯誤,而只能控制發(fā)生這兩類錯誤之一的概率.一.假設檢驗的兩類錯誤當前15頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗

我們當然希望獨兩類錯誤的概率都很小,但在樣本容量n固定時是無法做到的.基于這種情況,且因為人們常常把拒絕H0比錯誤地接受H0看得更重些.因此人們希望在控制犯第一類錯誤的概率α的條件下,盡量使犯第二類錯誤的概率小,但這也是不容易的,有時甚至是不可能的.于是人們不得不降低要求,只對犯第一類錯誤的概率α加以限制,而不考慮犯第二錯誤的概率,在這種原則下,尋找臨界域C時只涉及原假設H0,而不涉及備擇假設H1,這種統(tǒng)計假設問題稱為顯著性檢驗問題.對給定的犯第一類錯誤的概率α稱為顯著性水平.當前16頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗二.顯著水平檢驗法

顯著水平檢驗法:在數據收集之前就已經設定好一個檢驗規(guī)則,即文獻上稱之為拒絕域R,使得當樣本觀察值落入R就拒絕H0.

對拒絕域R的要求是:在H0

下{樣本落入R}為一小概率事件,即對預先給定的0<α<1有

P({樣本落入R}|H0)≤α此時稱R所代表的檢驗為顯著水平α的檢驗當前17頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗(1)根據問題的要求建立原假設H0和備擇假設H1;假設檢驗的方法步驟(2)選取檢驗統(tǒng)計量T(X1,X2,...,Xn),要求T不含任何參數,以便計算H0為真時的條件概率;(3)給定顯著性水平α,求出使P{T∈R|H0}≤α的臨界域C;(4)若樣本觀察值T(x1,x2,...,xn)∈R,則拒絕原假設H0,否則接受H0.當前18頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗1).方差已知時總體均值的假設檢驗1兩個正態(tài)總體的假設檢驗當前19頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗當前20頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗找臨界值uα/2示意圖0a/2ua/2a/2-ua/2當前21頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗當前22頁,總共38頁。作為未知參數μ的點估計,因此偏小應該拒絕H0.若H0成立,例3某降價盒裝餅干,其包裝上的廣告上稱每盒質量為269g.但有顧客投訴,鈣餅干質量不足269g。為此質檢部門從準備出廠的一批盒裝餅干中,隨機抽取30盒,由測得的30個質量數據算出樣本平均為268.假設盒裝餅干質量服從正態(tài)分布N(μ,22),以顯著水平α=0.05檢驗該產品廣告是否真實.解:依題意,可設原假設H0:μ=269備擇假設

H1:μ<269則有則在下Z~N(0,1),即Z的分布已知,因而Z可以做檢驗統(tǒng)計量,偏小等價于Z偏小,從而得到拒絕域的形式如下其中k待定,稱之為臨界值.當前23頁,總共38頁。α=0.05,為求顯著水平0.05的檢驗,只需選取k使得查表可得因而得到水平0.05檢驗的拒絕域代入數據得Z=-2.74,顯然小于臨界值-1.645,因而依據檢驗規(guī)則應該拒絕H0,即該盒裝廣告又不是廣告行為.當前24頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗2).方差未知時總體均值的雙側假設檢驗當前25頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗當前26頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗找臨界值tα/2示意圖0a/2a/2-ta/2(n-1)ta/2(n-1)當前27頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗當前28頁,總共38頁。其中σ未知.今用S*代替σ,得到t的統(tǒng)計量例4.在例3中,若盒裝餅干重量服從正態(tài)分布N(μ,σ2),μ與σ2均未知,已知樣本平均,修正樣本標準差為S*=1.8,求解相同的問題.解:此時不能使用Z作為統(tǒng)計量,因為標準化變量為由正態(tài)總體抽樣分布基本定理可知,在H0下可得到拒絕域的形式如下其中k待定,稱之為臨界值.當前29頁,總共38頁。α=0.05,為求顯著水平0.05的檢驗,只需選取k使得因而得到水平0.05檢驗的拒絕域代入數據得t=-3.044,顯然小于臨界值-1.699,因而依據檢驗規(guī)則應該拒絕H0,即該盒裝廣告又不是廣告行為.當前30頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗2兩個正態(tài)總體的假設檢驗當前31頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗1).方差已知時均值的雙側假設檢驗因為當H0成立時,統(tǒng)計量當前32頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗從而,對于給定的顯著性水平α,拒絕域為當前33頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗2).方差未知時均值的雙側假設檢驗當前34頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗當前35頁,總共38頁。第二節(jié)顯著水平檢驗法與正態(tài)總體檢驗當前36頁,總共38頁。例5.為評估某地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論