統(tǒng)計(jì)學(xué)-在經(jīng)濟(jì)管理中的應(yīng)用 課件 第五章 抽樣估計(jì)與假設(shè)檢驗(yàn)2 假設(shè)檢驗(yàn)_第1頁
統(tǒng)計(jì)學(xué)-在經(jīng)濟(jì)管理中的應(yīng)用 課件 第五章 抽樣估計(jì)與假設(shè)檢驗(yàn)2 假設(shè)檢驗(yàn)_第2頁
統(tǒng)計(jì)學(xué)-在經(jīng)濟(jì)管理中的應(yīng)用 課件 第五章 抽樣估計(jì)與假設(shè)檢驗(yàn)2 假設(shè)檢驗(yàn)_第3頁
統(tǒng)計(jì)學(xué)-在經(jīng)濟(jì)管理中的應(yīng)用 課件 第五章 抽樣估計(jì)與假設(shè)檢驗(yàn)2 假設(shè)檢驗(yàn)_第4頁
統(tǒng)計(jì)學(xué)-在經(jīng)濟(jì)管理中的應(yīng)用 課件 第五章 抽樣估計(jì)與假設(shè)檢驗(yàn)2 假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二節(jié)假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的基本原理二、假設(shè)檢驗(yàn)的基本方法三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤四、一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的基本原理參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,都是利用樣本對(duì)總體進(jìn)行某種推斷。推斷的角度不同:參數(shù)估計(jì)是在總體參數(shù)未知的情況下用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。假設(shè)檢驗(yàn)是先對(duì)總體參數(shù)提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立,如果成立,就接受這個(gè)假設(shè),否則就放棄。什么是假設(shè)檢驗(yàn)?

(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理二、假設(shè)檢驗(yàn)的步驟【例】

某企業(yè)生產(chǎn)一種零件,過去的大量資料表明,零件的平均長(zhǎng)度為5厘米,標(biāo)準(zhǔn)差為0.1厘米。為了提高零件的精度,該企業(yè)對(duì)這種零件的生產(chǎn)工藝進(jìn)行了改革。改革工藝后,抽查了100個(gè)零件,測(cè)得樣本平均長(zhǎng)度為4.94厘米。現(xiàn)問:(1)工藝改革前后零件的長(zhǎng)度是否發(fā)生了顯著的變化?(2)工藝改革后的零件長(zhǎng)度是否比原來有所縮短?(3)工藝改革后的零件長(zhǎng)度是否比原來的長(zhǎng)?1、提出原假設(shè)和備擇假設(shè)對(duì)每個(gè)假設(shè)檢驗(yàn)問題,要同時(shí)提出兩個(gè)相反的假設(shè):原假設(shè)和備擇假設(shè)。原假設(shè)又稱零假設(shè),是待檢驗(yàn)的假設(shè),是研究者想收集證據(jù)予以反對(duì)的假設(shè),記為H0;總是有符號(hào)

,

或。備擇假設(shè)是拒絕原假設(shè)后可供選擇的假設(shè),是研究者想收集證據(jù)予以支持的假設(shè),記為H1??偸怯蟹?hào)

,

或。原假設(shè)和備擇假設(shè)是相互對(duì)立的,并構(gòu)成一組完備假設(shè)。檢驗(yàn)結(jié)果二者必取其一。接受H0則必須拒絕H1;反之,拒絕H0則必須接受H1。原假設(shè)和備擇假設(shè)不是隨意提出的,應(yīng)根據(jù)所檢驗(yàn)問題的具體背景而定。常常是采取“不輕易拒絕原假設(shè)”的原則,即把沒有充分理由不能輕易否定的命題作為原假設(shè),而相應(yīng)地把沒有足夠把握就不能輕易肯定的命題作為備擇假設(shè)。一般地,假設(shè)有三種形式:1)H0:μ=μ0;H1:μ≠μ0。這種形式的假設(shè)檢驗(yàn)稱為雙側(cè)檢驗(yàn)。如前例中的第一個(gè)問題可提出假設(shè):H0:μ=5厘米;H1:μ≠5厘米。2)H0:μ≥μ0;H1:μ<μ0。這種形式的假設(shè)檢驗(yàn)稱為左側(cè)檢驗(yàn)。如前例中的第二個(gè)問題可提出假設(shè):H0:μ≥5厘米;H1:μ<5厘米。3)H0:μ≤μ0;H1:μ>μ0。這種形式的假設(shè)檢驗(yàn)稱為右側(cè)檢驗(yàn)。如前例中的第三個(gè)問題可提出假設(shè):H0:μ≤5厘米;H1:μ>5厘米。左側(cè)檢驗(yàn)和右側(cè)檢驗(yàn)統(tǒng)稱為單側(cè)檢驗(yàn)。采用哪種假設(shè),要根據(jù)所研究的實(shí)際問題而定。如果對(duì)所研究問題只需判斷有無顯著差異或要求同時(shí)注意總體參數(shù)偏大或偏小的情況,則采用雙側(cè)檢驗(yàn)。如果所關(guān)心的是總體參數(shù)是否比某個(gè)值偏大(或偏?。瑒t宜采用單側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m≠m0H1:m<m0H1:m>m0【例】一家研究機(jī)構(gòu)估計(jì),成都市居民家庭擁有汽車的比率超過40%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)。提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“成都市居民家庭擁有汽車的比率超過40%”。建立的原假設(shè)和備擇假設(shè)為

H0:

40%H1:

40%【例】一家研究機(jī)構(gòu)估計(jì),成都市居民家庭擁有汽車的比率超過40%。為驗(yàn)證這一估計(jì)是否正確,另一家機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)。2、選擇適當(dāng)統(tǒng)計(jì)量并確定其分布形式不同的假設(shè)檢驗(yàn)問題需選擇不同的統(tǒng)計(jì)量。用于假設(shè)檢驗(yàn)問題的統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量。選擇什么統(tǒng)計(jì)量作為檢驗(yàn)統(tǒng)計(jì)量,應(yīng)根據(jù)具體問題和不同的條件而定。例如,用于進(jìn)行檢驗(yàn)的樣本是大樣本還是小樣本,總體方差已知還是未知,等等。檢驗(yàn)統(tǒng)計(jì)量(teststatistic)與拒絕域檢驗(yàn)統(tǒng)計(jì)量:根據(jù)樣本統(tǒng)計(jì)量得到的,并能衡量樣本統(tǒng)計(jì)量與零假設(shè)差異的統(tǒng)計(jì)量通常檢驗(yàn)統(tǒng)計(jì)量取為:

根據(jù)樣本計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值,如該值與0相差很大,說明零假設(shè)不正確;否則,不能認(rèn)為零假設(shè)不正確。拒絕域:檢驗(yàn)統(tǒng)計(jì)量(或樣本統(tǒng)計(jì)量或樣本)取值的集合,當(dāng)根據(jù)樣本觀測(cè)結(jié)果算得檢驗(yàn)統(tǒng)計(jì)量的值屬于該集合時(shí),零假設(shè)應(yīng)被拒絕。

3、選擇顯著性水平а,確定臨界值顯著性水平表示原假設(shè)H0為真時(shí)拒絕原假設(shè)的概率,即拒絕原假設(shè)所犯錯(cuò)誤的概率,一般用а表示,統(tǒng)計(jì)上把α稱為假設(shè)檢驗(yàn)中的顯著性水平(Significantlevel),也就是決策中所面臨的風(fēng)險(xiǎn)。所以,顯著性水平是指當(dāng)原假設(shè)為正確時(shí)人們卻把它拒絕了的概率或風(fēng)險(xiǎn)。這個(gè)概率是由人們事前確定的,通常取α=0.05或α=0.01,這表明,當(dāng)做出接受原假設(shè)的決定時(shí),其正確的可能性(概率)為95%或99%。給定了顯著性水平а,也就確定了原假設(shè)H0的接受區(qū)域和拒絕區(qū)域。通過查分布表,得到臨界值,這個(gè)臨界值就是接受區(qū)域和拒絕區(qū)域的臨界點(diǎn)。對(duì)于不同形式的假設(shè),H0的接受區(qū)域和拒絕區(qū)域也有所不同。雙側(cè)檢驗(yàn)的拒絕區(qū)域位于統(tǒng)計(jì)量分布曲線的兩側(cè);左側(cè)檢驗(yàn)的拒絕區(qū)域位于統(tǒng)計(jì)量分布曲線的左側(cè);右側(cè)檢驗(yàn)的拒絕區(qū)域位于統(tǒng)計(jì)量分布曲線的右側(cè)。顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))抽樣分布0臨界值臨界值a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H01-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn)

)0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(單側(cè)檢驗(yàn)

)0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(左側(cè)檢驗(yàn)

)0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平觀察到的樣本統(tǒng)計(jì)量顯著性水平和拒絕域

(右側(cè)檢驗(yàn)

)0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平觀察到的樣本統(tǒng)計(jì)量4、作出結(jié)論1)給定顯著性水平,查表得出相應(yīng)的臨界值z(mì)

或z/2,t

或t/22)將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較3)作出決策雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量I>臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量<-臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量>臨界值,拒絕H0假設(shè)檢驗(yàn)步驟的總結(jié)1.陳述原假設(shè)和備擇假設(shè)2.從所研究的總體中抽出一個(gè)隨機(jī)樣本3.確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算出其具體數(shù)值4.確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,指定拒絕域5.將統(tǒng)計(jì)量的值與臨界值進(jìn)行比較,作出決策統(tǒng)計(jì)量的值落在拒絕域,拒絕H0,否則不拒絕H0三、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤1. 第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為真時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率記為

被稱為顯著性水平2. 第Ⅱ類錯(cuò)誤(取偽錯(cuò)誤)原假設(shè)為假時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率記為

(Beta)

H0:無罪假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策結(jié)果)陪審團(tuán)審判裁決實(shí)際情況無罪有罪無罪正確錯(cuò)誤有罪錯(cuò)誤正確H0檢驗(yàn)決策實(shí)際情況H0為真H0為假未拒絕H0正確決策(1–a)第Ⅱ類錯(cuò)誤(b)拒絕H0第Ⅰ類錯(cuò)誤(a)正確決策(1-b)假設(shè)檢驗(yàn)就好像一場(chǎng)審判過程統(tǒng)計(jì)檢驗(yàn)過程

錯(cuò)誤和

錯(cuò)誤的關(guān)系

你不能同時(shí)減少兩類錯(cuò)誤!

和的關(guān)系就像翹翹板,小就大,大就小影響錯(cuò)誤的因素1)總體參數(shù)的真值隨著假設(shè)的總體參數(shù)的減少而增大2)顯著性水平

當(dāng)減少時(shí)增大3)總體標(biāo)準(zhǔn)差

當(dāng)

增大時(shí)增大4)樣本容量n當(dāng)n

減少時(shí)增大四、一個(gè)總體參數(shù)的假設(shè)檢驗(yàn)z檢驗(yàn)(單側(cè)和雙側(cè))

t檢驗(yàn)(單側(cè)和雙側(cè))z

檢驗(yàn)(單側(cè)和雙側(cè))

2檢驗(yàn)(單側(cè)和雙側(cè))均值一個(gè)總體比率方差總體均值的檢驗(yàn)

(作出判斷)

是否已知小樣本容量n大

是否已知否t檢驗(yàn)否z檢驗(yàn)是z檢驗(yàn)

是z檢驗(yàn)(一)總體均值的檢驗(yàn)1、總體方差已知時(shí)對(duì)正態(tài)總體均值的假設(shè)檢驗(yàn)設(shè)總體X~N(μ,σ2),總體方差σ2

為已知,(x1,x2,…,xn)為總體的一個(gè)樣本,樣本平均數(shù)為?,F(xiàn)在的問題是對(duì)總體均值μ進(jìn)行假設(shè)檢驗(yàn)。H0:μ=μ0

(或μ≤μ0、μ≥μ0

)。根據(jù)抽樣分布定理,樣本平均數(shù)服從N(μ,σ2/n),所以,如果H0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量Z及其分布為:利用服從正態(tài)分布的統(tǒng)計(jì)量Z進(jìn)行的假設(shè)檢驗(yàn)稱為Z檢驗(yàn)法。根據(jù)已知的總體方差、樣本容量n和樣本平均數(shù),計(jì)算出檢驗(yàn)統(tǒng)計(jì)量Z的值。對(duì)于給定的檢驗(yàn)水平,查正態(tài)分布表可得臨界值,將所計(jì)算的Z值與臨界值比較,便可做出檢驗(yàn)結(jié)論。[例]根據(jù)過去大量資料,某公司所生產(chǎn)產(chǎn)品的使用壽命服從正態(tài)分布N(1020,1002)。該公司在進(jìn)行了技術(shù)革新后,需要檢驗(yàn)技術(shù)革新后的產(chǎn)品使用壽命是否有顯著改善,現(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16件,測(cè)得樣本平均壽命為1080小時(shí)。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高?解:根據(jù)題意,提出假設(shè):H0:μ≤1020;H1:μ>1020,檢驗(yàn)統(tǒng)計(jì)量由α=0.05,查表得臨界值z(mì)0.05=1.645由于Z=2.4>Z0.05=1.645,所以應(yīng)拒絕H0而接受H1,即這批產(chǎn)品的使用壽命確有顯著提高。總體均值的檢驗(yàn)條件檢驗(yàn)條件量拒絕域H0、H1(1)H0:μ=μ0H1:μ≠μ0

z(2)H0:μ≤μ0H1:μ>μ0(3)H0:μ≥μ0H1:μ<μz0z00非正態(tài)總體n≥30σ2已知或未知ZaZa2、總體方差未知時(shí)對(duì)正態(tài)總體均值的假設(shè)檢驗(yàn)設(shè)總體X~N(μ,σ2),但總體方差σ2

未知,此時(shí)對(duì)總體均值的檢驗(yàn)不能用上述Z檢驗(yàn)法,因?yàn)榇藭r(shí)的檢驗(yàn)統(tǒng)計(jì)量Z中包含了未知參數(shù)。為了得到一個(gè)不含未知參數(shù)的檢驗(yàn)統(tǒng)計(jì)量,很自然會(huì)用總體方差的無偏估計(jì)量即樣本方差S2

來代替σ2

,在小樣本時(shí)采用t統(tǒng)計(jì)量。檢驗(yàn)統(tǒng)計(jì)量t及其分布為:t利用服從t分布的統(tǒng)計(jì)量去檢驗(yàn)總體均值的方法稱為t檢驗(yàn)法。雙側(cè)檢驗(yàn)時(shí),若,則拒絕H0,接受H1。左側(cè)檢驗(yàn)時(shí),若t<–tα,則拒絕H0,接受H1。右側(cè)檢驗(yàn)時(shí),若t>tα,則拒絕H0,接受H1。【例】從長(zhǎng)期的資料可知,某公司生產(chǎn)的某種電子元件的使用壽命服從均值為200小時(shí),標(biāo)準(zhǔn)差未知的正態(tài)分布。通過改變部分生產(chǎn)工藝后,抽得10件樣本作分析(小時(shí)):202,209,213,198,206,210,195,208,200,207試根據(jù)抽查的樣本,判斷該公司所生產(chǎn)的電子元件的使用壽命是否有了提高。(α=0.05)解:根據(jù)題意,檢驗(yàn)?zāi)康氖强疾祀娮釉褂脡勖钠骄禂?shù)據(jù)是否有所提高。因此,可建立如下假設(shè):根據(jù)已知數(shù)據(jù)求得=204.8,S=5.789檢驗(yàn)統(tǒng)計(jì)量由α=0.05,查表得臨界值由于,所以拒絕H0接受H1,即可以接受“在新工藝下,這種電子元件使用壽命的平均值有所提高的假設(shè)”。t檢驗(yàn)法討論t檢驗(yàn)法適用于小樣本情況下總體方差未知時(shí)對(duì)正態(tài)總體均值的假設(shè)檢驗(yàn)。隨著樣本容量n的增大,t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。所以大樣本情況下(n>30),總體方差未知時(shí)對(duì)正態(tài)總體均值的假設(shè)檢驗(yàn)通常近似采用Z檢驗(yàn)法。同理,大樣本情況下非正態(tài)總體均值的檢驗(yàn)也可用Z檢驗(yàn)法。因?yàn)?,根?jù)大樣本的抽樣分布定理,總體分布形式不明或?yàn)榉钦龖B(tài)總體時(shí),樣本平均數(shù)趨近于正態(tài)分布。這時(shí),檢驗(yàn)統(tǒng)計(jì)量Z中的總體標(biāo)準(zhǔn)差用樣本標(biāo)準(zhǔn)差S來代替。(二)總體比例的假設(shè)檢驗(yàn)由比例的抽樣分布定理可知,樣本比例服從二項(xiàng)分布,因此可由二項(xiàng)分布來確定對(duì)總體比例進(jìn)行假設(shè)檢驗(yàn)的臨界值,但其計(jì)算往往十分繁瑣。大樣本情況下,二項(xiàng)分布近似服從正態(tài)分布。因此,對(duì)總體比例的檢驗(yàn)通常是在大樣本條件下進(jìn)行的,根據(jù)正態(tài)分布來近似確定臨界值,即采用Z檢驗(yàn)法。其檢驗(yàn)步驟與均值檢驗(yàn)時(shí)的步驟相同,只是檢驗(yàn)統(tǒng)計(jì)量不同。首先提出待檢驗(yàn)的假設(shè):檢驗(yàn)統(tǒng)量為

[例]調(diào)查人員在調(diào)查某企業(yè)的主要產(chǎn)品生產(chǎn)線時(shí),被告知生產(chǎn)線性能良好,產(chǎn)品生產(chǎn)穩(wěn)定,產(chǎn)品合格率達(dá)99%。為了驗(yàn)證這一說法,調(diào)查人員隨機(jī)抽查了200件產(chǎn)品,其中195件產(chǎn)品合格,判斷廠方的宣稱是否可信?(α=10%)。解:依題意,可建立如下假設(shè):樣本比例由于樣本容量相當(dāng)大,所以可近似采用Z檢驗(yàn)法。給定α=0.1,查正態(tài)分布表得由于,應(yīng)接受原假設(shè),即認(rèn)為廠方的宣稱是可信的。(三)總體方差的假設(shè)檢驗(yàn)在實(shí)際生產(chǎn)活動(dòng)或生活中,僅僅知道樣本均值或比率維持在一個(gè)特定的范圍內(nèi)是不夠的,因?yàn)檫@還不足以保證整個(gè)過程(如生產(chǎn)線)的穩(wěn)定性。在生產(chǎn)產(chǎn)品過程中,產(chǎn)品的方差大就意味著所生產(chǎn)的產(chǎn)品質(zhì)量或生產(chǎn)產(chǎn)品的生產(chǎn)線的性能不穩(wěn)定,但由于抽樣中受偶然因素的影響,所觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論