統(tǒng)計學(xué)第五章假設(shè)檢驗_第1頁
統(tǒng)計學(xué)第五章假設(shè)檢驗_第2頁
統(tǒng)計學(xué)第五章假設(shè)檢驗_第3頁
統(tǒng)計學(xué)第五章假設(shè)檢驗_第4頁
統(tǒng)計學(xué)第五章假設(shè)檢驗_第5頁
已閱讀5頁,還剩100頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第五章 假設(shè)檢驗教學(xué)目的:本章闡述假設(shè)檢驗的理論與方法,通過學(xué)習(xí)使學(xué)生能運用兩種方法對總體參數(shù)估計進行假設(shè)檢驗。教學(xué)重點及難點:教學(xué)重點:假設(shè)檢驗基本原理和方法。教學(xué)難點:原假設(shè)與備擇假設(shè)的設(shè)定與理解。主要教學(xué)內(nèi)容及要求:1、理解原假設(shè)與備擇假設(shè)的含義與設(shè)定方法;2、理解顯著性水平及假設(shè)檢驗的判斷標準;3、掌握均值與比例假設(shè)檢驗的方法。章節(jié)安排第一節(jié) 假設(shè)檢驗原理第二節(jié) 一個總體參數(shù)的假設(shè)檢驗第三節(jié) 兩總體參數(shù)的假設(shè)檢驗第四節(jié) 正性檢驗第五節(jié) 兩樣本均值的等效檢驗第一節(jié) 假設(shè)檢驗原理一、假設(shè)檢驗的基本思想和步驟(一)假設(shè)檢驗的基本思想 所謂假設(shè)檢驗,就是對某一總體參數(shù)先作出假設(shè)的數(shù)值;然后搜集

2、樣本資料,用這些樣本資料確定假設(shè)數(shù)值與樣本數(shù)值之間的差異;最后,進一步判斷兩者差異是否顯著,若兩者差異很小,則假設(shè)的參數(shù)是可信的,作出“接受”的結(jié)論,若兩者的差異很大,則假設(shè)的參數(shù)準確的可能性很小,作出“拒絕”的結(jié)論。某廠生產(chǎn)一批產(chǎn)品,必須檢驗合格才能出廠,規(guī)定合格率為95%,現(xiàn)從中抽取100件進行質(zhì)量檢查,發(fā)現(xiàn)合格率為93%,假設(shè)檢驗就是利用樣本指標p=93%的合格率,來判斷原來假設(shè)P=95%合格率是否成立。如假設(shè)成立,產(chǎn)品就能出廠,如假設(shè)不成立,這批產(chǎn)品便不能出廠。例1某地區(qū)去年職工家庭年收入為72000元,本年抽樣調(diào)查結(jié)果表明,職工家庭年收入為71000元,這是否意味著職工生活水平下降呢

3、?我們還不能下這個結(jié)論,最好通過假設(shè)檢驗,檢驗這兩年職工家庭收入是否存在顯著性統(tǒng)計差異,才能判斷該地區(qū)今年職工家庭年收入是否低于去年水平。例2假設(shè)檢驗也可分為參數(shù)檢驗(Parametric Test)和非參數(shù)檢驗(Nonparametric Test)。當總體分布形式已知,只對某些參數(shù)做出假設(shè),進而做出的檢驗為參數(shù)檢驗;對其他假設(shè)做出的檢驗為非參數(shù)檢驗。(二)假設(shè)檢驗的步驟 1.提出原假設(shè)和備擇假設(shè)原假設(shè)(又稱零假設(shè))是接受檢驗的假設(shè),記作H0;備選假設(shè) (又稱替代假設(shè))是當原假設(shè)被否定時的另一種可成立的假設(shè),記作H1;H0與H1兩者是對立的,如H0真實,則H1不真實;如H0不真實,則H1為真

4、實。 H0和H1在統(tǒng)計學(xué)中稱為統(tǒng)計假設(shè)。關(guān)于總體平均數(shù)的假設(shè)有三種情況: (1) H0: =0; H1: 0 (2) H0: 0; H1: 0 以上三種類型,對第一種類型的檢驗,稱雙邊檢驗,因為0,包含0和0。而對第二、三種類型的檢驗,稱單邊檢驗。例2.選定檢驗統(tǒng)計量及其分布例3.選擇顯著性水平 當原假設(shè)H0為真時,卻因為樣本指標的差異而被拒絕,這種否定真實的原假設(shè)的概率就是顯著性水平。用表示。例=0.05(即5%)或=0.01(即1%) 假設(shè)檢驗應(yīng)用小概率事件實際極少發(fā)生的原理,這里的小概率就是指。給定了顯著性水平,就可由有關(guān)的概率分布表查得臨界值,從而確定 的接受區(qū)域和拒絕區(qū)域。臨界值就是

5、接受區(qū)域和拒絕區(qū)域的分界點。4.計算檢驗統(tǒng)計量 在計算檢驗統(tǒng)計量時,要注意是雙邊檢驗還是單邊檢驗。要根據(jù)顯著性水平的值確定統(tǒng)計量的拒絕域、接受域及臨界值。5.根據(jù)樣本指標計算的檢驗統(tǒng)計量的數(shù)值作出決策 如果檢驗統(tǒng)計量的數(shù)值落在拒絕域內(nèi)(包括臨界值),就說明原假設(shè)H0與樣本描述的情況有顯著差異,應(yīng)該否定原假設(shè);如果該數(shù)值落在接受域內(nèi),就說明原假設(shè)H0 與樣本描述的情況無顯著差異,則應(yīng)接受原假設(shè)。二、單側(cè)檢驗與雙側(cè)檢驗用單側(cè)檢驗還是雙側(cè)檢驗,使用左側(cè)檢驗還是右側(cè)檢驗,決定于備擇假設(shè)中的不等式形式與方向。與“不相等”對應(yīng)的是雙側(cè)檢驗,與“小于”相對應(yīng)的是左側(cè)檢驗,與“大于”相對應(yīng)的是右側(cè)檢驗。 二、

6、單側(cè)檢驗與雙側(cè)檢驗雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗說明 用單側(cè)檢驗還是雙側(cè)檢驗,使用左側(cè)檢驗還是右側(cè)檢驗,決定于備擇假設(shè)中的不等式形式與方向。與“不相等”對應(yīng)的是雙側(cè)檢驗,與“小于”相對應(yīng)的是左側(cè)檢驗,與“大于”相對應(yīng)的是右側(cè)檢驗。2022/9/516三、原假設(shè)和備擇假設(shè)的選擇 原假設(shè)?(null hypothesis)待檢驗的假設(shè),又稱“0假設(shè)”研究者想收集證據(jù)予以反對的假設(shè)3.總是有等號 , 或4.表示為 H0H0: 某一數(shù)值 指定為 = 號,即 或 例如, H0:1- 2 0零假設(shè)中有“不是”或“沒有”這樣的字眼2022/9/517 備擇假設(shè)?(alternative hypothesis)與原

7、假設(shè)對立的假設(shè),也稱“研究假設(shè)”研究者想收集證據(jù)予以支持的假設(shè)總是有不等號: , 或 表示為 H1H1: 某一數(shù)值,或 某一數(shù)值例如, H1: 提出假設(shè)雙側(cè)檢驗左邊檢驗右邊檢驗說明提出原假設(shè)應(yīng)本著“保守”或“不輕易拒絕原假設(shè)”的原則;等號總是出現(xiàn)在原假設(shè)的一方。2022/9/519原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立先確定備擇假設(shè),再確定原假設(shè) 等號“=”總是放在原假設(shè)上 因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)建 議2022/9/520【例】一種零件的生產(chǎn)標準是直徑應(yīng)為10cm,為對生產(chǎn)過程

8、進行控制,質(zhì)量監(jiān)測人員定期對一臺加工機床檢查,確定這臺機床生產(chǎn)的零件是否符合標準要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進行調(diào)整。試陳述用來檢驗生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)例題分析解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!?。建立的原假設(shè)和備擇假設(shè)為 H0 : 10cm H1 : 10cm 2022/9/521【例】某品牌洗滌劑在它的產(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗證該產(chǎn)品制造商的說明是否屬實。試陳述用于檢驗的原假設(shè)與備擇假設(shè)例題分析解:研究者抽檢的意圖是傾向于證實這種洗滌

9、劑的平均凈含量并不符合說明書中的陳述 。建立的原假設(shè)和備擇假設(shè)為 H0 : 500 H1 : 臨界值,拒絕H0左側(cè)檢驗:統(tǒng)計量 臨界值,拒絕H0得出拒絕或不拒絕原假設(shè)的結(jié)論2022/9/545P 值決策(P-value)1、在原假設(shè)為真的條件下,檢驗統(tǒng)計量的觀察值大于或等于其計算值的概率 雙側(cè)檢驗為分布中兩側(cè)面積的總和2、反映實際觀測到的數(shù)據(jù)與原假設(shè)H0之間不一致的程度3、被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值1200 = 0.05n = 100臨界值(s):檢驗統(tǒng)計量: 在 = 0.05的水平上不拒絕H0不能認為該廠生產(chǎn)的元件壽命顯著地高于1200小時決策:結(jié)論:Z0拒絕域0.

10、051.6452022/9/561總體均值的檢驗 (大樣本檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0統(tǒng)計量 已知: 未知:拒絕域P值決策拒絕H02022/9/562總體均值的檢驗 (小樣本)1.假定條件總體服從正態(tài)分布小樣本(n 30)檢驗統(tǒng)計量 2 已知: 2 未知:2022/9/563總體均值的檢驗( 2 未知)(例題分析)【例】某保險公司理賠部稱處理每個理賠的平均費用為60元。在與同業(yè)比較時發(fā)現(xiàn),該費用高于其他保險公司的水平。因此,該公司采取了成本削減措施。為評估措施的效果,隨機選擇了26宗理賠個案,得到

11、平均費用為57元,標準差是10元。是否可以說費用削減措施已經(jīng)奏效?(=0.01) 左側(cè)檢驗2022/9/564分析 H0: 60H1: =0.01,故不拒絕H0 2022/9/566某加盟連鎖店的主管想知道每家連鎖店的日平均銷售額是否大于400元,顯著性水平為0.05。隨機察看了172家連鎖店,結(jié)果平均銷售額是407元,標準差為38元。是否可下結(jié)論認為總體均值超過400元,或是二者之差7元(407-400=7)歸結(jié)于隨機因素?2022/9/567分析H0: =400H1: 400 = 0.05n = 100臨界值(s):檢驗統(tǒng)計量: 在 = 0.05的水平拒絕H0決策:z01.6451.645

12、0.005拒絕 H0拒絕 H00.0052022/9/568總體均值的檢驗 (小樣本檢驗方法的總結(jié))假設(shè)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗假設(shè)形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0統(tǒng)計量 已知: 未知:拒絕域P值決策拒絕H0注: 已知的拒絕域同大樣本2022/9/569二、總體比例假設(shè)檢驗假定條件有兩類結(jié)果總體服從二項分布可用正態(tài)分布來近似比例檢驗的 Z 統(tǒng)計量P0為假設(shè)的總體比例2022/9/570總體比率的檢驗 (例題分析)【例】2008年某國州長選舉中,有位候選人幾個月前的支持率是60%。近期的一項調(diào)查訪問了500人,發(fā)現(xiàn)他的支持率變成了55%。顯著性水平取

13、0.05,試用p-值方法,檢驗他的支持率是否下降了?2022/9/571總體比率的檢驗 (例題分析)H0 :P 60%H1 :P60% = 0.05n = 500臨界值(c):檢驗統(tǒng)計量:不拒絕H0 決策:-2.485t0拒絕域.05第三節(jié) 兩個總體參數(shù)的假設(shè)檢驗兩個成組樣本總體均值的假設(shè)檢驗兩個匹配樣本總體均值的假設(shè)檢驗方差不齊時兩小樣本均值比較2022/9/573兩個總體均值之差的檢驗 (獨立大樣本)1.假定條件兩個樣本是獨立的隨機樣本正態(tài)總體或非正態(tài)總體大樣本(n130和 n230)檢驗統(tǒng)計量 12 , 22 已知: 12 , 22 未知:2022/9/574兩個總體均值之差的檢驗獨立小

14、樣本 ( 12, 22 已知)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布 12, 22已知檢驗統(tǒng)計量2022/9/575兩個總體均值之差的檢驗 (獨立的小樣本12,22 未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、 22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:2022/9/576兩個總體均值之差的檢驗 (12, 22 未知且不相等1222)假定條件兩個總體都是正態(tài)分布12, 22未知且不相等,即1222樣本容量相等,即n1=n2=n檢驗統(tǒng)計量自由度:2022/9/577兩個總體均值之差的檢驗 (12, 22 未知且不相等1222)假定條件兩個總體都是正態(tài)分布1

15、2,22未知且不相等,即1222樣本容量不相等,即n1n2檢驗統(tǒng)計量2022/9/5782022/9/579我們假定兩個記錄均來自獨立正態(tài)分布總體。由于兩個樣本的均值分別為 和 ,可以實施下面的檢驗:序號企業(yè)1企業(yè)2企業(yè)2(改革后)序號企業(yè)1企業(yè)2企業(yè)2(改革后)1341514112515152143134129693352623133327354115914241520530192415142936619332916111217721242817212825813915183122219361220191810141017192420192331例題分析2022/9/580兩個總體均值之差的

16、檢驗 (用Excel進行檢驗)第1步:將原始數(shù)據(jù)輸入到Excel工作表格中 第2步:選擇“工具”下拉菜單并選擇“數(shù)據(jù)分析”選項 第3步:在“數(shù)據(jù)分析”對話框中選擇 “t-檢驗:雙樣本等方差 假設(shè)”第4步:當對話框出現(xiàn)后 在“變量1的區(qū)域”方框中輸入第1個樣本的數(shù)據(jù)區(qū)域 在“變量2的區(qū)域”方框中輸入第2個樣本的數(shù)據(jù)區(qū)域 在“假設(shè)平均差”方框中輸入假定的總體均值之差 在“”方框中輸入給定的顯著性水平(本例為0.05) 在“輸出選項”選擇計算結(jié)果的輸出位置,然后“確定” 2022/9/581t-檢驗: 雙樣本等方差假設(shè)2022/9/582總體均值差的假設(shè)檢驗:獨立樣本方差方程的 Levene 檢驗均

17、值方程的 t 檢驗FSig.tdfSig.均值標準差分的95%置信區(qū)間(雙側(cè))差值誤差值下限上限假設(shè)方差相等.021.8851.00538.3212.7502.736-2.7888.288假設(shè)方差不相等1.00537.960.3212.7502.736-2.7888.288方差是否相等均值是否相等因此我們無法拒絕零假設(shè),即不能得出企業(yè)1和企業(yè)2的產(chǎn)量有本質(zhì)差異。SPSS兩樣本均值比較檢驗是利用t統(tǒng)計量進行假設(shè)檢驗。當樣本量很小時,這種方法是合適的。當樣本量很大時,t值將近似等于大樣本下的z-值并且樣本檢驗結(jié)果將依然有效。2022/9/583序號企業(yè)1企業(yè)2企業(yè)2(改革后)序號企業(yè)1企業(yè)2企業(yè)2

18、(改革后)1341514112515152143134129693352623133327354115914241520530192415142936619332916111217721242817212825813915183122219361220191810141017192420192331完全類似于單樣本的檢驗總體均值差的假設(shè)檢驗:配對樣本2022/9/584我們(通過軟件)按照下面的步驟進行檢驗。在SPSS中打開數(shù)據(jù),選擇Analyze-Compare Means-Paried Samples T Test,把“企業(yè)2”和“企業(yè)2(改革后)”放入Paried Variables,再

19、選OK即可。設(shè)置配對變量拒絕t檢驗的H0 ,認為企業(yè)2改革前后平均日產(chǎn)量有顯著差異,改革后的日產(chǎn)量更高總體均值差的假設(shè)檢驗:配對樣本2022/9/585兩個總體均值之差的檢驗 (用Excel進行檢驗)第1步:選擇“工具”下拉菜單,并選擇“數(shù)據(jù)分析”選項第2步:在分析工具中選擇“t檢驗:平均值的成對二樣本分析”第3步:當出現(xiàn)對話框后 在“變量1的區(qū)域”方框內(nèi)鍵入數(shù)據(jù)區(qū)域 在“變量2的區(qū)域”方框內(nèi)鍵入數(shù)據(jù)區(qū)域 在“假設(shè)平均差”方框內(nèi)鍵入假設(shè)的差值(這里為0) 在“”框內(nèi)鍵入給定的顯著性水平 2022/9/5862022/9/587兩個總體均值之差的檢驗 (獨立大樣本)1.假定條件兩個樣本是獨立的隨

20、機樣本正態(tài)總體或非正態(tài)總體大樣本(n130和 n230)檢驗統(tǒng)計量 12 , 22 已知: 12 , 22 未知:2022/9/588兩個總體均值之差的檢驗獨立小樣本 ( 12, 22 已知)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布 12, 22已知檢驗統(tǒng)計量2022/9/589兩個總體均值之差的檢驗 (獨立的小樣本12,22 未知但12=22)假定條件兩個獨立的小樣本兩個總體都是正態(tài)分布12、 22未知但相等,即12=22檢驗統(tǒng)計量其中:自由度:2022/9/590兩個總體均值之差的檢驗 (12, 22 未知且不相等1222)假定條件兩個總體都是正態(tài)分布12, 22未知且不相等,即122

21、2樣本容量相等,即n1=n2=n檢驗統(tǒng)計量自由度:2022/9/591兩個總體均值之差的檢驗 (12, 22 未知且不相等1222)假定條件兩個總體都是正態(tài)分布12,22未知且不相等,即1222樣本容量不相等,即n1n2檢驗統(tǒng)計量2022/9/5922022/9/593我們假定兩個記錄均來自獨立正態(tài)分布總體。由于兩個樣本的均值分別為 和 ,可以實施下面的檢驗:序號企業(yè)1企業(yè)2企業(yè)2(改革后)序號企業(yè)1企業(yè)2企業(yè)2(改革后)134151411251515214313412969335262313332735411591424152053019241514293661933291611121772

22、1242817212825813915183122219361220191810141017192420192331例題分析2022/9/594兩個總體均值之差的檢驗 (用Excel進行檢驗)第1步:將原始數(shù)據(jù)輸入到Excel工作表格中 第2步:選擇“工具”下拉菜單并選擇“數(shù)據(jù)分析”選項 第3步:在“數(shù)據(jù)分析”對話框中選擇 “t-檢驗:雙樣本等方差 假設(shè)”第4步:當對話框出現(xiàn)后 在“變量1的區(qū)域”方框中輸入第1個樣本的數(shù)據(jù)區(qū)域 在“變量2的區(qū)域”方框中輸入第2個樣本的數(shù)據(jù)區(qū)域 在“假設(shè)平均差”方框中輸入假定的總體均值之差 在“”方框中輸入給定的顯著性水平(本例為0.05) 在“輸出選項”選擇計

23、算結(jié)果的輸出位置,然后“確定” 2022/9/595t-檢驗: 雙樣本等方差假設(shè)2022/9/596總體均值差的假設(shè)檢驗:獨立樣本方差方程的 Levene 檢驗均值方程的 t 檢驗FSig.tdfSig.均值標準差分的95%置信區(qū)間(雙側(cè))差值誤差值下限上限假設(shè)方差相等.021.8851.00538.3212.7502.736-2.7888.288假設(shè)方差不相等1.00537.960.3212.7502.736-2.7888.288方差是否相等均值是否相等因此我們無法拒絕零假設(shè),即不能得出企業(yè)1和企業(yè)2的產(chǎn)量有本質(zhì)差異。SPSS兩樣本均值比較檢驗是利用t統(tǒng)計量進行假設(shè)檢驗。當樣本量很小時,這種方法是合適的。當樣本量很大時,t值將近似等于大樣本下的z-值并且樣本檢驗結(jié)果將依然有效。2022/9/597序號企業(yè)1企業(yè)2企業(yè)2(改

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論