統(tǒng)計學(xué) 第6章假設(shè)檢驗與方差分析_第1頁
統(tǒng)計學(xué) 第6章假設(shè)檢驗與方差分析_第2頁
統(tǒng)計學(xué) 第6章假設(shè)檢驗與方差分析_第3頁
統(tǒng)計學(xué) 第6章假設(shè)檢驗與方差分析_第4頁
統(tǒng)計學(xué) 第6章假設(shè)檢驗與方差分析_第5頁
已閱讀5頁,還剩88頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章 假設(shè)檢驗與方差分析第一節(jié)第一節(jié) 假設(shè)檢驗的基本原理假設(shè)檢驗的基本原理 第二節(jié)第二節(jié) 總體均值的假設(shè)檢驗總體均值的假設(shè)檢驗 第三節(jié)第三節(jié) 總體比例的假設(shè)檢驗總體比例的假設(shè)檢驗 第四節(jié)第四節(jié) 單因子方差分析單因子方差分析第五節(jié)第五節(jié) 雙因子方差分析雙因子方差分析第六節(jié)第六節(jié) Excel在假設(shè)檢驗與方差在假設(shè)檢驗與方差 分析中的應(yīng)用分析中的應(yīng)用2掌握要點 假設(shè)檢驗的基本原理和步驟,以及相關(guān)概念 Z統(tǒng)計量、t統(tǒng)計量、F統(tǒng)計量的計算和應(yīng)用 方差分析的基本概念 針對單因素、雙因素的方差分析構(gòu)造F統(tǒng)計量3第一節(jié) 假設(shè)檢驗的基本原理一一 什么是假設(shè)檢驗什么是假設(shè)檢驗二二 原假設(shè)與備擇假設(shè)原假設(shè)與備擇假

2、設(shè)三三 檢驗統(tǒng)計量檢驗統(tǒng)計量四四 顯著性水平、顯著性水平、P-值與臨界值值與臨界值五五 雙側(cè)檢驗和單側(cè)檢驗雙側(cè)檢驗和單側(cè)檢驗六六 假設(shè)檢驗的兩類錯誤假設(shè)檢驗的兩類錯誤七七 關(guān)于假設(shè)檢驗結(jié)論的理解關(guān)于假設(shè)檢驗結(jié)論的理解4一、什么是假設(shè)檢驗 例6-1:假定咖啡的分袋包裝生產(chǎn)線的裝袋重量服從正態(tài)分布N(,2)。生產(chǎn)線按每袋凈重150克的技術(shù)標(biāo)準(zhǔn)控制操作?,F(xiàn)從生產(chǎn)線抽取簡單隨機(jī)樣本n=100袋,測得其平均重量為 =149.8克,樣本標(biāo)準(zhǔn)差S=0.872克。問該生產(chǎn)線的裝袋凈重的期望值是否為150克(即問生產(chǎn)線是否處于控制狀態(tài))?X5 所謂假設(shè)檢驗假設(shè)檢驗,就是事先對總體的參事先對總體的參數(shù)或總體分布形

3、式做出一個假設(shè),然數(shù)或總體分布形式做出一個假設(shè),然后利用抽取的樣本信息來判斷這個假后利用抽取的樣本信息來判斷這個假設(shè)(原假設(shè))是否合理設(shè)(原假設(shè))是否合理,即判斷總體的真實情況與原假設(shè)是否存在顯著的系統(tǒng)性差異,所以假設(shè)檢驗又被稱為顯著性檢驗。6 一個完整的假設(shè)檢驗過程,包括以下幾個步驟:(1)提出假設(shè);(2)構(gòu)造適當(dāng)?shù)臋z驗統(tǒng)計量,并根據(jù)樣本計 算統(tǒng)計量的具體數(shù)值;(3)規(guī)定顯著性水平,建立檢驗規(guī)則;(4)做出判斷。7二、原假設(shè)與備擇假設(shè) 原假設(shè)一般用H0表示,通常是設(shè)定總體參數(shù)等于某值,或服從某個分布函數(shù)等; 備擇假設(shè)是與原假設(shè)互相排斥的假設(shè),原假設(shè)與備擇假設(shè)不可能同時成立。 所謂假設(shè)檢驗問題

4、實質(zhì)上就是要判斷H0是否正確,若拒絕原假設(shè)H0 ,則意味著接受備擇假設(shè)H1 。 8 如在例6-1中,我們可以提出兩個假設(shè)兩個假設(shè): 假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)沒有顯著差異,記為H0: = 150; 假設(shè)平均袋裝咖啡重量與所要控制的標(biāo)準(zhǔn)有顯著差異,記為H1: 150。9三、檢驗統(tǒng)計量 所謂檢驗統(tǒng)計量,就是根據(jù)所抽取的樣本計算的用于檢驗原假設(shè)是否成立的隨機(jī)變量。 檢驗統(tǒng)計量中應(yīng)當(dāng)含有所要檢驗的總體參數(shù),以便在“總體參數(shù)等于某數(shù)值”的假定下研究樣本統(tǒng)計量的觀測結(jié)果。10 檢驗統(tǒng)計量還應(yīng)該在“H0成立”的前提下有已知的分布,從而便于計算出現(xiàn)某種特定的觀測結(jié)果的概率。11例6-2 構(gòu)造例6-1

5、的檢驗統(tǒng)計量,并計算相應(yīng)的樣本觀測值。 1213 14四、顯著性水平、P-值與臨界值 小概率事件: 在單獨一次的試驗中基本上不會發(fā)生,可以不予考慮。 在假設(shè)檢驗中,我們做出判斷時所依據(jù)的邏輯是: 如果在原假設(shè)正確的前提下,檢驗統(tǒng)計量如果在原假設(shè)正確的前提下,檢驗統(tǒng)計量的樣本觀測值的出現(xiàn)屬于小概率事件,那的樣本觀測值的出現(xiàn)屬于小概率事件,那么可以認(rèn)為原假設(shè)不可信,從而否定它,么可以認(rèn)為原假設(shè)不可信,從而否定它,轉(zhuǎn)而接受備擇假設(shè)轉(zhuǎn)而接受備擇假設(shè)。15 至于小概率的標(biāo)準(zhǔn)是多大?這要根據(jù)實際問題而定。 假設(shè)檢驗中,稱這一標(biāo)準(zhǔn)為顯著性水平顯著性水平,用來表示。 在應(yīng)用中,通常取 =0.01, =0.05

6、。一般來說,犯第一類錯誤可能造成的損失越大, 的取值應(yīng)當(dāng)越小。 對假設(shè)檢驗問題做出判斷可依據(jù)兩種規(guī)則: 一是P-值規(guī)則; 二是臨界值規(guī)則。16(一)P-值規(guī)則 所謂P-值,實際上是檢驗統(tǒng)計量超過(大于或小于)具體樣本觀測值的概率。 如果P-值小于所給定的顯著性水平,則認(rèn)為原假設(shè)不太可能成立; 如果P-值大于所給定的標(biāo)準(zhǔn),則認(rèn)為沒有充分的證據(jù)否定原假設(shè)。17例6-3 假定 =0.05,根據(jù)例6-2的結(jié)果,計算該問題的P-值,并做出判斷。18 解:查標(biāo)準(zhǔn)正態(tài)概率表, 當(dāng)z=2.29時,陰影面積為0.9890,尾部面積為1-0.9890=0.011,由對稱性可知,當(dāng)z= 2.29時,左側(cè)面積為0.0

7、11。0.011/2=0.0250.011這個數(shù)字意味著,假若我們反復(fù)抽取n=100的樣本,在100個樣本中僅有可能出現(xiàn)一個使檢驗統(tǒng)計量等于或小于2.29的樣本。該事件發(fā)生的概率小于給定的顯著性水平,所以,可以判斷=150的假定是錯誤的,也就是說,根據(jù)觀測的樣本,有理由表明總體的與150克的差異是顯著存在的。19 例例: 某電視機(jī)廠聲稱其產(chǎn)品耐用時間超過1200小時。隨機(jī)抽取100件產(chǎn)品后測得均值為1251小時,標(biāo)準(zhǔn)差s=300小時。 問該廠產(chǎn)品耐用時間是否高于1200小時? (顯著水平0.05)20(二)臨界值規(guī)則 假設(shè)檢驗中,還有另外一種做出結(jié)論的方法: 根據(jù)所提出的顯著性水平標(biāo)準(zhǔn)顯著性水

8、平標(biāo)準(zhǔn)(它是概率密度曲線的尾部面積)查表得到相應(yīng)的檢驗統(tǒng)計量的數(shù)值,稱作臨界值。 直接用檢驗統(tǒng)計量的觀測值與臨界值作比較,觀測值落在臨界值所劃定的尾部(稱之為拒絕域)內(nèi),便拒絕原假設(shè);21 觀測值落在臨界值所劃定的尾部之外(稱之為不能拒絕域)的范圍內(nèi),則認(rèn)為拒絕原假設(shè)的證據(jù)不足。這種做出檢驗結(jié)論的方法,我們稱之為臨界值規(guī)則。22 顯然,P-值規(guī)則和臨界值規(guī)則是等價的。在做檢驗的時候,只用其中一個規(guī)則即可。 P-值規(guī)則較之臨界值規(guī)則具有更明顯的優(yōu)點。 這主要是: 第一,它更加簡捷; 第二,在值規(guī)則的檢驗結(jié)論中,對于犯第一類錯誤的概率的表述更加精確。 推薦使用P-值規(guī)則。23例6-4 假定=0.0

9、5,根據(jù)例6-2的結(jié)果,用臨界值規(guī)則做出判斷。24 解:查表得到,臨界值-z0.025= 1.96。由于z= 2.29 1.96,即,檢驗統(tǒng)計量的觀測值落在臨界值所劃定的左側(cè)(即落在拒絕域),因而拒絕=150克的原假設(shè)。 上面的檢驗結(jié)果意味著,由樣本數(shù)據(jù)得到的觀測值的差異提醒我們:裝袋生產(chǎn)線的生產(chǎn)過程已經(jīng)偏離了控制狀態(tài),正在向裝袋重量低于技術(shù)標(biāo)準(zhǔn)的狀態(tài)傾斜。25五、雙側(cè)檢驗和單側(cè)檢驗 圖圖6-1 雙側(cè)、單側(cè)檢驗的拒絕域分配雙側(cè)、單側(cè)檢驗的拒絕域分配/21 /2Z /2 Z/2 (a)雙側(cè)檢驗 Z 0 (b)左側(cè)檢驗 0 Z (c)右側(cè)檢驗 26表6-1 拒絕域的單、雙側(cè)與備擇假設(shè)之間的對應(yīng)關(guān)系

10、拒絕域位置P-值檢驗的顯著性水平判斷標(biāo)準(zhǔn)原假設(shè)備擇假設(shè)雙側(cè)/2H0:0H1:0左單側(cè)H0:0H1:027六、假設(shè)檢驗的兩類錯誤 顯著性檢驗中的第一類錯誤第一類錯誤是指: 原假設(shè)事實上正確,可是檢驗統(tǒng)計量的觀測值卻落入拒絕域,因而否定了本來正確的假設(shè)。這是棄真的錯誤。 發(fā)生第一類錯誤發(fā)生第一類錯誤 的概率在雙側(cè)檢驗時是兩的概率在雙側(cè)檢驗時是兩個尾部的拒絕域面積之和;在單側(cè)檢驗時個尾部的拒絕域面積之和;在單側(cè)檢驗時是單側(cè)拒絕域的面積。是單側(cè)拒絕域的面積。28 顯著性檢驗中的第二類錯誤第二類錯誤是指: 原假設(shè)事實上不正確,而檢驗統(tǒng)計量的觀測值卻落入了不能拒絕域,因而沒有否定本來不正確的原假設(shè),這是取

11、偽的錯誤。 發(fā)生第二類錯誤的概率是把來自=1(10)的總體的樣本值代入檢驗統(tǒng)計量所得結(jié)果落入接受域的概率。29 根據(jù)不同的檢驗問題,對于和大小的選擇有不同的考慮。 例如,在例6-1中,如果檢驗者站在賣方的立場上,他較為關(guān)心的是不要犯第一類錯誤,即不要發(fā)生產(chǎn)品本來合格卻被錯誤地拒收這樣的事情,這時, 要較小。 反之,如果檢驗者站在買者的立場上,他關(guān)心的是不要把本來不合格的產(chǎn)品誤當(dāng)作合格品收下,也就是說,最好不要犯第二類錯誤,因此, 要較小。30 在樣本容量n不變的條件下,犯兩類錯誤的概率常常呈現(xiàn)反向的變化,要使和都同時減小,除非增加樣本的容量。 為此,統(tǒng)計學(xué)家奈曼與皮爾遜提出了一個原則,即在控制

12、犯第一類錯誤的概率情況下,盡量使犯第二類錯誤的概率小。 在實際問題中,我們往往把要否定的陳述作在實際問題中,我們往往把要否定的陳述作為原假設(shè),而把擬采納的陳述本身作為備擇為原假設(shè),而把擬采納的陳述本身作為備擇假設(shè),只對犯第一類錯誤的概率假設(shè),只對犯第一類錯誤的概率 加以限制,加以限制,而不考慮犯第二類錯誤的概率而不考慮犯第二類錯誤的概率 。31七、關(guān)于假設(shè)檢驗結(jié)論的理解 這就是說,在假設(shè)檢驗中,相對而言,當(dāng)原假設(shè)被拒絕時,我們能夠以較大的把握肯定備擇假設(shè)的成立。而當(dāng)原假設(shè)未被拒絕時,我們并不能認(rèn)為原假設(shè)確實成立。 32注意:顯著性檢驗到底回答了什么顯著性檢驗到底回答了什么樣的問題?樣的問題?

13、顯著性檢驗只是回答了所觀察到的差異(樣本數(shù)據(jù)與我們對總體所作的推測之間的差異)是純屬于機(jī)會變異,還是反映了真實的差異?33不能企圖用顯著性檢驗回答其不能不能企圖用顯著性檢驗回答其不能回答的問題回答的問題 (1)如果顯著性檢驗得到差異顯著的結(jié)論)如果顯著性檢驗得到差異顯著的結(jié)論(觀察到的差異提供了較充分的證據(jù)表明(觀察到的差異提供了較充分的證據(jù)表明差異真實存在),這是并不能評價差異的差異真實存在),這是并不能評價差異的大小和重要性。大小和重要性。 (2)顯著性檢驗只能告訴我們差異是否在)顯著性檢驗只能告訴我們差異是否在事實上存在,并不能回答差異產(chǎn)生的原因。事實上存在,并不能回答差異產(chǎn)生的原因。

14、(3)顯著性檢驗不能檢查我們對實驗所作)顯著性檢驗不能檢查我們對實驗所作的設(shè)計是否有缺陷。的設(shè)計是否有缺陷。34第二節(jié)第二節(jié) 總體均值為某定值總體均值為某定值的顯著性檢驗的顯著性檢驗35 注意: 總體總體指在隨機(jī)試驗中所觀測的隨機(jī)變量。 總體均值總體均值指的是隨機(jī)變量的期望值。36總體均值的顯著性檢驗包括: 雙尾情況雙尾情況 左單尾左單尾 右單尾右單尾37 如下就 總體分布的不同情況總體分布的不同情況 總體方差是否已知的不同情況總體方差是否已知的不同情況 樣本大小的不同情況樣本大小的不同情況分別介紹檢驗統(tǒng)計量和檢驗規(guī)則。38(一)總體為正態(tài)分布,總體方差已知,樣(一)總體為正態(tài)分布,總體方差已

15、知,樣本不論大小本不論大小 來自總體的樣本為(x1, x2, , xn)。 對于假設(shè):H0: = 0,在H0成立的前提下,有檢驗統(tǒng)計量 02(0,1)ZNnX39(二)總體分布未知,總體方差已知,大樣本總體分布未知,總體方差已知,大樣本 來自總體的樣本為(x1, x2, , xn)。 對于假設(shè):H0: = 0,在H0成立的前提下,如果樣本足夠大(n30),近似地有檢驗統(tǒng)計量 02(0,1)ZNnX40(三)總體為正態(tài)分布,總體方差未知,小總體為正態(tài)分布,總體方差未知,小樣本樣本 來自總體的樣本為(x1, x2, , xn)。對于假設(shè):H0: = 0,在H0成立的前提下,有檢驗統(tǒng)計量 若自由度(

16、n-1)30,該t統(tǒng)計量近似服從標(biāo)準(zhǔn)正態(tài)分布。02 (1)Stt nnX41例:已知初婚年齡服從正態(tài)分布。根據(jù)9個人的調(diào)查結(jié)果,樣本均值為 歲,樣本標(biāo)準(zhǔn)差s=3歲。問是否可以認(rèn)為該地區(qū)初婚年齡數(shù)學(xué)期望以及超過20歲( )5 .23 X05. 0 42(四)總體分布未知,總體方差未知,大樣本(四)總體分布未知,總體方差未知,大樣本 來自總體的樣本為(x1, x2, , xn)。 對于假設(shè):H0: = 0,在H0成立的前提下,如果總體偏斜適度,且樣本足夠大,近似地有檢驗統(tǒng)計量)1 , 0(Z20NnsX 43例6-5 某廠采用自動包裝機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為100

17、0克,某日隨機(jī)抽查9包,測得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差是24克。 試問在=0.05的顯著性水平上,能否認(rèn)為這天自動包裝機(jī)工作正常?44 解:第一步:確定原假設(shè)與備擇假設(shè)。H0: = 1000, H1: 1000第二步:構(gòu)造出檢驗統(tǒng)計量,計算檢驗統(tǒng)計量的觀測值。由于總體標(biāo)準(zhǔn)差未知,用樣本標(biāo)準(zhǔn)差代替,相應(yīng)檢驗統(tǒng)計量是t-統(tǒng)計量。75. 192410009860nsXt45 第三步:確定顯著性水平,確定拒絕域=0.05,查t-分布表(自由度n-1=8),得臨界值是t0.025(8)=2.306,拒絕域是 2.306 。 第四步:判斷。由于 2.306,檢驗統(tǒng)計量的樣本觀測值落入接受域,所以不

18、能拒絕。樣本數(shù)據(jù)沒有充分說明這天的自動包裝機(jī)工作不正常。tt46第三節(jié)第三節(jié) 總體比例為某定值總體比例為某定值的假設(shè)檢驗的假設(shè)檢驗47 48例6-7 一項調(diào)查結(jié)果聲稱,某市小學(xué)生每月零花錢達(dá)到200元的比例為40%,某科研機(jī)構(gòu)為了檢驗這個調(diào)查是否可靠,隨機(jī)抽選了100名小學(xué)生,發(fā)現(xiàn)有47人每月零花錢達(dá)到200元,調(diào)查結(jié)果能否證實早先調(diào)查40%的看法?(=0.05)49 解:由條件充分大,可以利用正態(tài)近似的公式進(jìn)行計算。 H0: = 40% H1: 40%確定拒絕域臨界值z0.025=1.96,Z顯著水平標(biāo)準(zhǔn) = 0.05,所以不能拒絕H0,即沒有得到足以表明四種配方的飼料下小雞增重水平有差異的顯著證據(jù)。臨界值規(guī)則:根據(jù)給定的顯著水平 = 0.05 ,查表得臨界值為F0.05(3,17)=3.20。因F=1.063.20,檢驗統(tǒng)計量的樣本值落入接受域,所以不能拒絕H0,即沒有得到足以表明四種配方的飼料下小雞增重水平有差異的顯著證據(jù)。89表6-4 方差分析表變異來源離差平方和自由度均方差F值P-值臨界值組間7112.14332370.714 1.012320.4115733.196774組內(nèi)39811.67172341.863總計46923.812090三、關(guān)于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論