統(tǒng)計(jì)學(xué)-第八章假設(shè)檢驗(yàn)_第1頁(yè)
統(tǒng)計(jì)學(xué)-第八章假設(shè)檢驗(yàn)_第2頁(yè)
統(tǒng)計(jì)學(xué)-第八章假設(shè)檢驗(yàn)_第3頁(yè)
統(tǒng)計(jì)學(xué)-第八章假設(shè)檢驗(yàn)_第4頁(yè)
統(tǒng)計(jì)學(xué)-第八章假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第8章假設(shè)檢驗(yàn)8.1

假設(shè)檢驗(yàn)的基本原理8.2

一個(gè)總體參數(shù)的檢驗(yàn)正常人的平均體溫是37oC嗎?當(dāng)問(wèn)起健康的成年人體溫是多少時(shí),多數(shù)人的回答是37oC,這似乎已經(jīng)成了一種共識(shí)。下面是一個(gè)研究人員測(cè)量的50個(gè)健康成年人的體溫?cái)?shù)據(jù)37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0正常人的平均體溫是37oC嗎?根據(jù)樣本數(shù)據(jù)計(jì)算的平均值是36.8oC

,標(biāo)準(zhǔn)差為0.36oC

根據(jù)參數(shù)估計(jì)方法得到的健康成年人平均體溫的95%的置信區(qū)間為(36.7,36.9)。研究人員發(fā)現(xiàn)這個(gè)區(qū)間內(nèi)并沒(méi)有包括37oC因此提出“不應(yīng)該再把37oC作為正常人體溫的一個(gè)有任何特定意義的概念”我們應(yīng)該放棄“正常人的平均體溫是37oC”這個(gè)共識(shí)嗎?本章的內(nèi)容就將提供一套標(biāo)準(zhǔn)統(tǒng)計(jì)程序來(lái)檢驗(yàn)這樣的觀點(diǎn)8.1假設(shè)檢驗(yàn)的基本原理

8.1.1怎樣提出假設(shè)?

8.1.2怎樣做出決策?

8.1.3怎樣表述決策結(jié)果?第8章假設(shè)檢驗(yàn)8.1.1怎樣提出假設(shè)?8.1假設(shè)檢驗(yàn)的基本原理什么是假設(shè)?

(hypothesis)在參數(shù)檢驗(yàn)中,對(duì)總體參數(shù)的具體數(shù)值所作的陳述就一個(gè)總體而言,總體參數(shù)包括總體均值、比例、方差等分析之前必需陳述什么是假設(shè)檢驗(yàn)?

(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計(jì)方法有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理小概率是在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)原假設(shè)

(nullhypothesis)又稱“0假設(shè)”,研究者想收集證據(jù)予以反對(duì)的假設(shè),用H0表示所表達(dá)的含義總是指參數(shù)沒(méi)有變化或變量之間沒(méi)有關(guān)系

最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它總是有符號(hào),或H0:

=某一數(shù)值H0:

某一數(shù)值H0:

某一數(shù)值例如,H0:

10cmnull也稱“研究假設(shè)”,研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示所表達(dá)的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系備擇假設(shè)通常用于表達(dá)研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè)

總是有符號(hào)

,

或H1:

某一數(shù)值H1:

某一數(shù)值H1:<某一數(shù)值備擇假設(shè)(alternativehypothesis)備擇假設(shè)沒(méi)有特定的方向性,并含有符號(hào)“”的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)

備擇假設(shè)具有特定的方向性,并含有符號(hào)“>”或“<”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱為左側(cè)檢驗(yàn)

備擇假設(shè)的方向?yàn)椤?gt;”,稱為右側(cè)檢驗(yàn)

雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m

=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m

≠m0H1:m

<m0H1:m

>m0以總體均值的檢驗(yàn)為例【例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過(guò)程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過(guò)程不正常,必須進(jìn)行調(diào)整。試陳述用來(lái)檢驗(yàn)生產(chǎn)過(guò)程是否正常的原假設(shè)和被擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過(guò)程不正?!?。建立的原假設(shè)和備擇假設(shè)為

H0:

10cmH1:

10cm

【例】某品牌洗滌劑在它的產(chǎn)品說(shuō)明書(shū)中聲稱:平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過(guò)抽檢其中的一批產(chǎn)品來(lái)驗(yàn)證該產(chǎn)品制造商的說(shuō)明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說(shuō)明書(shū)中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500【例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車的比例超過(guò)30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過(guò)30%”。建立的原假設(shè)和備擇假設(shè)為

H0:

30%H1:

30%原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立先確定備擇假設(shè),再確定原假設(shè)等號(hào)“=”總是放在原假設(shè)上因研究目的不同,對(duì)同一問(wèn)題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)8.1.2怎樣做出決策?8.1假設(shè)檢驗(yàn)的基本原理兩類錯(cuò)誤與顯著性水平研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎(chǔ)之上,而樣本又是隨機(jī)的,因而就有可能犯錯(cuò)誤原假設(shè)和備擇假設(shè)不能同時(shí)成立,決策的結(jié)果要么拒絕H0,要么不拒絕H0。決策時(shí)總是希望當(dāng)原假設(shè)正確時(shí)沒(méi)有拒絕它,當(dāng)原假設(shè)不正確時(shí)拒絕它,但實(shí)際上很難保證不犯錯(cuò)誤第Ⅰ類錯(cuò)誤(錯(cuò)誤)原假設(shè)為正確時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率記為,被稱為顯著性水平2. 第Ⅱ類錯(cuò)誤(錯(cuò)誤)原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率記為(Beta)兩類錯(cuò)誤的控制一般來(lái)說(shuō),對(duì)于一個(gè)給定的樣本,如果犯第Ι類錯(cuò)誤的代價(jià)比犯第Ⅱ類錯(cuò)誤的代價(jià)相對(duì)較高,則將犯第Ⅰ類錯(cuò)誤的概率定得低些較為合理;反之,如果犯第Ι類錯(cuò)誤的代價(jià)比犯第Ⅱ類錯(cuò)誤的代價(jià)相對(duì)較低,則將犯第Ⅰ類錯(cuò)誤的概率定得高些一般來(lái)說(shuō),發(fā)生哪一類錯(cuò)誤的后果更為嚴(yán)重,就應(yīng)該首要控制哪類錯(cuò)誤發(fā)生的概率。但由于犯第Ι類錯(cuò)誤的概率是可以由研究者控制的,因此在假設(shè)檢驗(yàn)中,人們往往先控制第Ι類錯(cuò)誤的發(fā)生概率顯著性水平

(significantlevel)事先確定的用于拒絕原假設(shè)H0時(shí)所必須的證據(jù)能夠容忍的犯第Ⅰ類錯(cuò)誤的最大概率(上限值)2. 原假設(shè)為真時(shí),拒絕原假設(shè)的概率抽樣分布的拒絕域3. 表示為(alpha)

常用的值有0.01,0.05,0.104. 由研究者事先確定依據(jù)什么做出決策?若假設(shè)為H0:=500,H1:<500。樣本均值為495,拒絕H0嗎?樣本均值為502,拒絕H0嗎?做出拒絕或不拒絕原假設(shè)的依據(jù)是什么?傳統(tǒng)上,做出決策所依據(jù)的是樣本統(tǒng)計(jì)量,現(xiàn)代檢驗(yàn)中人們直接使用由統(tǒng)計(jì)量算出的犯第Ⅰ類錯(cuò)誤的概率,即所謂的P值根據(jù)樣本觀測(cè)結(jié)果計(jì)算出對(duì)原假設(shè)和備擇假設(shè)做出決策某個(gè)樣本統(tǒng)計(jì)量對(duì)樣本估計(jì)量的標(biāo)準(zhǔn)化結(jié)果原假設(shè)H0為真點(diǎn)估計(jì)量的抽樣分布檢驗(yàn)統(tǒng)計(jì)量(teststatistic)

標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量

用統(tǒng)計(jì)量決策

(雙側(cè)檢驗(yàn))抽樣分布H0臨界值臨界值a/2a/2拒絕H0拒絕H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection用統(tǒng)計(jì)量決策

(左側(cè)檢驗(yàn))抽樣分布H0臨界值a拒絕H01-置信水平RegionofRejectionRegionofNonrejection用統(tǒng)計(jì)量決策

(右側(cè)檢驗(yàn))抽樣分布H0臨界值2拒絕H01-置信水平RegionofNonrejectionRegionofRejection統(tǒng)計(jì)量決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z(mì)或z/2,t或t/2將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量I>臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量<-臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量>臨界值,拒絕H0用P值決策

(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會(huì)像實(shí)際觀測(cè)結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話,我們得到得到目前這個(gè)樣本數(shù)據(jù)的可能性有多大,如果這個(gè)可能性很小,就應(yīng)該拒絕原假設(shè)被稱為觀察到的(或?qū)崪y(cè)的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕H0雙側(cè)檢驗(yàn)的P值/

2/

2Z拒絕H0拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值左側(cè)檢驗(yàn)的P值Z拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量1/2P值右側(cè)檢驗(yàn)的P值Z拒絕H00計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值P值是關(guān)于數(shù)據(jù)的概率P值與原假設(shè)的對(duì)或錯(cuò)的概率無(wú)關(guān)它反映的是在某個(gè)總體的許多樣本中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度,它是當(dāng)原假設(shè)正確時(shí),得到目前這個(gè)樣本數(shù)據(jù)的概率比如,要檢驗(yàn)全校學(xué)生的平均生活費(fèi)支出是否等于500元,檢驗(yàn)的假設(shè)為H0:=500;H0:500。假定抽出一個(gè)樣本算出的樣本均值600元,得到的值為P=0.02,這個(gè)0.02是指如果平均生活費(fèi)支出真的是500元的話,那么,從該總體中抽出一個(gè)均值為600的樣本的概率僅為0.02。如果你認(rèn)為這個(gè)概率太小了,就可以拒絕原假設(shè),因?yàn)槿绻僭O(shè)正確的話,幾乎不可能抓到這樣的一個(gè)樣本,既然抓到了,就表明這樣的樣本不在少數(shù),所以原假設(shè)是不對(duì)的P值越小,你拒絕原假設(shè)的理由就越充分要證明原假設(shè)不正確,P值要多小,才能令人信服呢?原假設(shè)的可信度又多高?如果H0所代表的假設(shè)是人們多年來(lái)一直相信的,就需要很強(qiáng)的證據(jù)(小的P值)才能說(shuō)服他們拒絕的結(jié)論是什么?如果拒絕H0而肯定H1

,你就需要有很強(qiáng)的證據(jù)顯示要支持H1。比如,H1代表要花很多錢把產(chǎn)品包裝改換成另一種包裝,你就要有很強(qiáng)的證據(jù)顯示新包裝一定會(huì)增加銷售量(因?yàn)榫芙^H0要花很高的成本)多大的P值合適?有了P值,我們并不需要用5%或1%這類傳統(tǒng)的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來(lái)評(píng)估結(jié)果是否具有統(tǒng)計(jì)上的顯著性,從而可根據(jù)我們的需要來(lái)決定是否要拒絕原假設(shè)只要你認(rèn)為這么大的P值就算是顯著了,你就可以在這樣的P值水平上拒絕原假設(shè)傳統(tǒng)的顯著性水平,如1%、5%、10%等等,已經(jīng)被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn),我們大概可以說(shuō):10%代表有“一些證據(jù)”不利于原假設(shè);5%代表有“適度證據(jù)”不利于原假設(shè);1%代表有“很強(qiáng)證據(jù)”不利于原假設(shè)固定顯著性水平是否有意義用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計(jì)量檢驗(yàn)提供更多的信息統(tǒng)計(jì)量檢驗(yàn)是我們事先給出的一個(gè)顯著性水平,以此為標(biāo)準(zhǔn)進(jìn)行決策,無(wú)法知道實(shí)際的顯著性水平究竟是多少比如,根據(jù)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)時(shí),只要統(tǒng)計(jì)量的值落在拒絕域,我們拒絕原假設(shè)得出的結(jié)論都是一樣的,即結(jié)果顯著。但實(shí)際上,統(tǒng)計(jì)量落在拒絕域不同的地方,實(shí)際的顯著性是不同的。比如,統(tǒng)計(jì)量落在臨界值附近與落在遠(yuǎn)離臨界值的地方,實(shí)際的顯著性就有較大差異。而P值給出的是實(shí)際算出的顯著水平,它告訴我們實(shí)際的顯著性水平是多少P值決策與統(tǒng)計(jì)量的比較拒絕H0P值決策與統(tǒng)計(jì)量的比較拒絕H0的兩個(gè)統(tǒng)計(jì)量的不同顯著性Z拒絕H00統(tǒng)計(jì)量1

P1

值統(tǒng)計(jì)量2

P2

值拒絕H0臨界值8.1.3怎樣表述決策結(jié)果?8.1假設(shè)檢驗(yàn)的基本原理假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)的目的主要是收集證據(jù)拒絕原假設(shè),而支持你所傾向的備擇假設(shè)假設(shè)檢驗(yàn)只提供不利于原假設(shè)的證據(jù)。因此,當(dāng)拒絕原假設(shè)時(shí),表明樣本提供的證據(jù)證明它是錯(cuò)誤的,當(dāng)沒(méi)有拒絕原假設(shè)時(shí),我們也沒(méi)法證明它是正確的,因?yàn)榧僭O(shè)檢驗(yàn)的程序沒(méi)有提供它正確的證據(jù)這與法庭上對(duì)被告的定罪類似:先假定被告是無(wú)罪的,直到你有足夠的證據(jù)證明他是有罪的,否則法庭就不能認(rèn)定被告有罪。當(dāng)證據(jù)不足時(shí),法庭的裁決是“被告無(wú)罪”,但這里也沒(méi)有證明被告就是清白的假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)得出的結(jié)論都是根據(jù)原假設(shè)進(jìn)行闡述的我們要么拒絕原假設(shè),要么不拒絕原假設(shè)當(dāng)不能拒絕原假設(shè)時(shí),我們也從來(lái)不說(shuō)“接受原假設(shè)”,因?yàn)闆](méi)有證明原假設(shè)是真的采用“接受”原假設(shè)的說(shuō)法,則意味著你證明了原假設(shè)是正確的沒(méi)有足夠的證據(jù)拒絕原假設(shè)并不等于你已經(jīng)“證明”了原假設(shè)是真的,它僅僅意為著目前還沒(méi)有足夠的證據(jù)拒絕原假設(shè),只表示手頭上這個(gè)樣本提供的證據(jù)還不足以拒絕原假設(shè)比如,在上例中,如果拒絕原假設(shè),表明樣本提供的證據(jù)證明該品牌洗滌劑的凈含量與說(shuō)明書(shū)所標(biāo)識(shí)的不相符。如果不拒絕原假設(shè),只能說(shuō)這個(gè)樣本提供的證據(jù)還不足證明凈含量不是500克或500克以上,并不等于證明了凈含量就超過(guò)了500克“不拒絕”的表述方式實(shí)際上意味著沒(méi)有得出明確的結(jié)論假設(shè)檢驗(yàn)不能證明原假設(shè)正確“接受”的說(shuō)法有時(shí)會(huì)產(chǎn)生誤導(dǎo)這種說(shuō)法似乎暗示著原假設(shè)已經(jīng)被證明是正確的了實(shí)事上,H0的真實(shí)值我們永遠(yuǎn)也無(wú)法知道,不知道真實(shí)值是什么,又怎么能證明它是什么?H0只是對(duì)總體真實(shí)值的一個(gè)假定值,由樣本提供的信息也就自然無(wú)法證明它是否正確采用“不拒絕”的表述方法更合理一些,因?yàn)檫@種表述意味著樣本提供的證據(jù)不夠強(qiáng)大,因而沒(méi)有足夠的理由拒絕,這不等于已經(jīng)證明原假設(shè)正確假設(shè)檢驗(yàn)不能證明原假設(shè)正確【例】比如原假設(shè)為H0:=10,從該總體中抽出一個(gè)隨機(jī)樣本,得到x=9.8,在=0.05的水平上,樣本提供的證據(jù)沒(méi)有推翻這一假設(shè),我們說(shuō)“接受”原假設(shè),這意為著樣本提供的證據(jù)已經(jīng)證明=10是正確的。如果我們將原假設(shè)改為H0:=10.5,同樣,在=0.05的水平上,樣本提供的證據(jù)也沒(méi)有推翻這一假設(shè),我們又說(shuō)“接受”原假設(shè)。但這兩個(gè)原假設(shè)究竟哪一個(gè)是“真實(shí)的”呢?假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)中通常是先確定顯著性水平,這就等于控制了第Ι類錯(cuò)誤的概率,但犯第Ⅱ類錯(cuò)誤的概率卻是不確定的在拒絕H0時(shí),犯第Ⅰ類錯(cuò)誤的概率不超過(guò)給定的顯著性水平,當(dāng)樣本結(jié)果顯示沒(méi)有充分理由拒絕原假設(shè)時(shí),也難以確切知道第Ⅱ類錯(cuò)誤發(fā)生的概率采用“不拒絕”而不采用“接受”的表述方式,在多數(shù)場(chǎng)合下便避免了錯(cuò)誤發(fā)生的風(fēng)險(xiǎn)因?yàn)椤敖邮堋彼媒Y(jié)論可靠性將由第Ⅱ類錯(cuò)誤的概率來(lái)測(cè)量,而的控制又相對(duì)復(fù)雜,有時(shí)甚至根本無(wú)法知道的值,除非你能確切給出,否則就不宜表述成“接受”原假設(shè)假設(shè)檢驗(yàn)不能證明原假設(shè)正確在實(shí)際檢驗(yàn)中,針對(duì)一個(gè)具體的問(wèn)題,將檢驗(yàn)結(jié)果表述為“不拒絕”原假設(shè),這似乎讓人感到無(wú)所是從比如,你想購(gòu)買一批產(chǎn)品,檢驗(yàn)的結(jié)果沒(méi)有拒絕原假設(shè),即達(dá)到合同規(guī)定的標(biāo)準(zhǔn)要求,你是否購(gòu)買這批產(chǎn)品呢?這時(shí),你可以對(duì)檢驗(yàn)的結(jié)果采取某種默認(rèn)態(tài)度,退一步說(shuō),你可以將檢驗(yàn)結(jié)果表述為“可以接受”原假設(shè),你但這并不等于說(shuō)你“確實(shí)接受”它統(tǒng)計(jì)上顯著不一定有實(shí)際意義當(dāng)拒絕原假設(shè)時(shí),我們稱樣本結(jié)果是統(tǒng)計(jì)上顯著的(statisticallySignificant)當(dāng)不拒絕原假設(shè)時(shí),我們稱樣本結(jié)果是統(tǒng)計(jì)上不顯著的在“顯著”和“不顯著”之間沒(méi)有清除的界限,只是在P值越來(lái)越小時(shí),我們就有越來(lái)越強(qiáng)的證據(jù),檢驗(yàn)的結(jié)果也就越來(lái)越顯著“顯著的”(Significant)一詞的意義在這里并不是“重要的”,而是指“非偶然的”一項(xiàng)檢驗(yàn)在統(tǒng)計(jì)上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說(shuō),不是靠機(jī)遇能夠得到的如果得到這樣的樣本概率(P)很小,則拒絕原假設(shè)在這么小的概率下竟然得到了這樣的一個(gè)樣本,表明這樣的樣本經(jīng)常出現(xiàn),所以,樣本結(jié)果是顯著的統(tǒng)計(jì)上顯著不一定有實(shí)際意義統(tǒng)計(jì)上顯著不一定有實(shí)際意義在進(jìn)行決策時(shí),我們只能說(shuō)P值越小,拒絕原假設(shè)的證據(jù)就越強(qiáng),檢驗(yàn)的結(jié)果也就越顯著但P值很小而拒絕原假設(shè)時(shí),并不一定意味著檢驗(yàn)的結(jié)果就有實(shí)際意義因?yàn)榧僭O(shè)檢驗(yàn)中所說(shuō)的“顯著”僅僅是“統(tǒng)計(jì)意義上的顯著”一個(gè)在統(tǒng)計(jì)上顯著的結(jié)論在實(shí)際中卻不見(jiàn)得就很重要,也不意味著就有實(shí)際意義因?yàn)橹蹬c樣本的大小密切相關(guān),樣本量越大,檢驗(yàn)統(tǒng)計(jì)量的P值也就越大,P值就越小,就越有可能拒絕原假設(shè)統(tǒng)計(jì)上顯著不一定有實(shí)際意義如果你主觀上要想拒絕原假設(shè)那就一定能拒絕它這類似于我們通常所說(shuō)的“欲加之罪,何患無(wú)詞”只要你無(wú)限制擴(kuò)大樣本量,幾乎總能拒絕原假設(shè)當(dāng)樣本量很大時(shí),解釋假設(shè)檢驗(yàn)的結(jié)果需要小心在大樣本情況下,總能把與假設(shè)值的任何細(xì)微差別都能查出來(lái),即使這種差別幾乎沒(méi)有任何實(shí)際意義在實(shí)際檢驗(yàn)中,不要刻意追求“統(tǒng)計(jì)上的”顯著性,也不要把統(tǒng)計(jì)上的顯著性與實(shí)際意義上的顯著性混同起來(lái)一個(gè)在統(tǒng)計(jì)上顯著的結(jié)論在實(shí)際中卻不見(jiàn)得很重要,也不意為著就有實(shí)際意義統(tǒng)計(jì)上顯著不一定有實(shí)際意義

(樣本量對(duì)檢驗(yàn)結(jié)果的影響)投擲硬幣1000次、4040次和10000次時(shí)出現(xiàn)正面樣本比例的抽樣分布0.50.507這個(gè)結(jié)果出乎預(yù)料嗎?n=1000n=4040n=100008.2一個(gè)總體參數(shù)的檢驗(yàn)

8.2.1總體均值的檢驗(yàn)

8.2.2總體比例的檢驗(yàn)

8.2.3總體方差的檢驗(yàn)第8章假設(shè)檢驗(yàn)8.2.1總體均值的檢驗(yàn)

(大樣本)8.2一個(gè)總體參數(shù)的檢驗(yàn)總體均值的檢驗(yàn)

(大樣本)1. 假定條件大樣本(n30)使用z檢驗(yàn)統(tǒng)計(jì)量2

已知:2

未知:總體均值的檢驗(yàn)(2

已知)

(例題分析—大樣本)【例】一種罐裝飲料采用自動(dòng)生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗(yàn)每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機(jī)抽取了40罐進(jìn)行檢驗(yàn),測(cè)得每罐平均容量為255.8ml。取顯著性水平=0.05

,檢驗(yàn)該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求?雙側(cè)檢驗(yàn)總體均值的檢驗(yàn)(2

已知)

(例題分析-大樣本)H0

=255H1

255

=

0.05n

=

40臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

因?yàn)閆=1.01<1.96,所以在

=

0.05的顯著性水平上不拒絕H0.用Excel中的【NORMSDIST】函數(shù)得到的雙尾檢驗(yàn)P=0.3125>0.05不拒絕H0沒(méi)有證據(jù)表明該天生產(chǎn)的飲料不符合標(biāo)準(zhǔn)要求

z01.96-1.960.025拒絕H0拒絕H00.025總體均值的檢驗(yàn)(2

未知)

(例題分析—大樣本)【例】一種機(jī)床加工的零件尺寸絕對(duì)平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取50個(gè)進(jìn)行檢驗(yàn)。利用這些樣本數(shù)據(jù),檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?(=0.01)

左側(cè)檢驗(yàn)50個(gè)零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(yàn)

(例題分析—大樣本)H0

1.35H1

<1.35

=

0.01n

=

50臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:因?yàn)閆=-2.6061<-2.33,所以在

=

0.01的顯著性水平上不拒絕H0.新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01總體均值的檢驗(yàn)

(P值的圖示)計(jì)算出的樣本統(tǒng)計(jì)量=2.6061P=0.004579

Z拒絕H00臨界值P值總體均值的檢驗(yàn)(2

未知)

(例題分析)【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2

。一家研究機(jī)構(gòu)對(duì)小麥品種進(jìn)行了改良以期提高產(chǎn)量。為檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高,隨機(jī)抽取了36個(gè)地塊進(jìn)行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標(biāo)準(zhǔn)差為120/hm2

。試檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高?(=0.05)

右側(cè)檢驗(yàn)總體均值的檢驗(yàn)(2

未知)

(例題分析)H0

5200H1

>5200

=

0.05n

=

36臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0

(P=0.000088<

=0.05)改良后的新品種產(chǎn)量有顯著提高

決策:結(jié)論:z0拒絕H00.051.645總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的圖示)抽樣分布P=0.000088

01.645a=0.05拒絕H01-計(jì)算出的樣本統(tǒng)計(jì)量=3.75P值總體均值的檢驗(yàn)

(小樣本)1. 假定條件總體服從正態(tài)分布小樣本(n<

30)檢驗(yàn)統(tǒng)計(jì)量2

已知:2

未知:總體均值的檢驗(yàn)

(例題分析—小樣本)【例】一種汽車配件的平均長(zhǎng)度要求為12cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車生產(chǎn)企業(yè)在購(gòu)進(jìn)配件時(shí),通常是經(jīng)過(guò)招標(biāo),然后對(duì)中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購(gòu)進(jìn)?,F(xiàn)對(duì)一個(gè)配件提供商提供的10個(gè)樣本進(jìn)行了檢驗(yàn)。假定該供貨商生產(chǎn)的配件長(zhǎng)度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供貨商提供的配件是否符合要求?10個(gè)零件尺寸的長(zhǎng)度(cm)12.210.812.011.811.912.411.312.212.012.3總體均值的檢驗(yàn)

(例題分析—小樣本)H0

=12H1

12

=0.05df=10-1=9臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:不拒絕H0沒(méi)有證據(jù)表明該供貨商提供的零件不符合要求

決策:結(jié)論:t02.262-2.2620.025拒絕

H0拒絕H00.025一個(gè)總體均值的檢驗(yàn)

(作出判斷)是否已知小樣本量n大是否已知否t檢驗(yàn)否z檢驗(yàn)是z檢驗(yàn)

是z檢驗(yàn)8.2.2總體成數(shù)的檢驗(yàn)8.2一個(gè)總體參數(shù)的檢驗(yàn)總體成數(shù)檢驗(yàn)假定條件總體服從二項(xiàng)分布可用正態(tài)分布來(lái)近似(大樣本)檢驗(yàn)的z統(tǒng)計(jì)量0為假設(shè)的總體成數(shù)總體成數(shù)的檢驗(yàn)

(例題分析)【例】一種以休閑和娛樂(lè)為主題的雜志,聲稱其讀者群中有80%為女性。為驗(yàn)證這一說(shuō)法是否屬實(shí),某研究部門抽取了由200人組成的一個(gè)隨機(jī)樣本,發(fā)現(xiàn)有146個(gè)女性經(jīng)常閱讀該雜志。分別取顯著性水平

=0.05和=0.01

,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論