統(tǒng)計學(xué)第六章 假設(shè)檢驗_第1頁
統(tǒng)計學(xué)第六章 假設(shè)檢驗_第2頁
統(tǒng)計學(xué)第六章 假設(shè)檢驗_第3頁
統(tǒng)計學(xué)第六章 假設(shè)檢驗_第4頁
統(tǒng)計學(xué)第六章 假設(shè)檢驗_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第六章假設(shè)檢驗第一節(jié)假設(shè)檢驗的基本概念第二節(jié)單個總體參數(shù)的假設(shè)檢驗第三節(jié)兩個總體參數(shù)的假設(shè)檢驗第四屆非參數(shù)檢驗教學(xué)目的與要求:1.掌握假設(shè)檢驗的相關(guān)概念及思路和步驟;2.掌握單個總體的假設(shè)檢驗方法;3.了解兩個總體假設(shè)檢驗方法;4.了解非參數(shù)檢驗的特點和方法。第一節(jié)假設(shè)檢驗概述一、假設(shè)檢驗的基本概念(一)、假設(shè)檢驗與區(qū)間參數(shù)估計的區(qū)別和聯(lián)系1、聯(lián)系:參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個組成部分,都是利用樣本對總體進行某種推斷。2、區(qū)別:推斷的角度不同,區(qū)間估計是用給定的大概率推斷出總體參數(shù)的范圍,而假設(shè)檢驗是以小概率為標(biāo)準(zhǔn),對總體的狀況所做出的假設(shè)進行判斷。假設(shè)檢驗與區(qū)間估計結(jié)合起來,構(gòu)成完整的統(tǒng)計推斷內(nèi)容。(二)、假設(shè)檢驗的兩大類別:一類是參數(shù)假設(shè)檢驗,另一類是非參數(shù)假設(shè)檢驗。本章分別討論這兩類檢驗方法。

大數(shù)定理表明:就大量觀察而言,事件的發(fā)生具有一定的規(guī)律性。根據(jù)概率的大小,人們處理的態(tài)度和方式很不一樣。在日常生活中,人們往往習(xí)慣于把概率很小的事件,當(dāng)作一次觀察中是極不可能看到的事件。例如,人們出門做事就有可能遇到不測事故,但卻很少人因此而不敢出門。原因是:小概率事件極不可能發(fā)生。(三)小概率原理

小概率原理:即指概率很小的事件在一次試驗中實際上不可能出現(xiàn)。這種事件稱為“實際不可能事件”。

統(tǒng)計檢驗的依據(jù)是小概率原理:一是認(rèn)為小概率事件在一次觀察中是極少出現(xiàn)的;二是如果在一次觀察中出現(xiàn)了小概率事件,那么應(yīng)該否定原有事件具有小概率的說法或者假設(shè)。二、單側(cè)檢驗與雙側(cè)檢驗(一)、雙側(cè)檢驗α/21–αα/2-Zα/2

Zα/2雙側(cè)檢驗雙側(cè)檢驗中拒絕域位于正態(tài)分布的兩邊上,對于提出的,只要或二者之中有一個成立,就可以否定原假設(shè),這種假設(shè)有兩個拒絕域、兩個臨界值,每個拒絕域的面積為α/2,臨界值為-Zα/2、Zα/2。(二)單側(cè)檢驗1、左單側(cè)檢驗(下限檢驗)2、右單側(cè)檢驗(上限檢驗)

α–Zα0

α0Zα左側(cè)檢驗右側(cè)檢驗假定:–Zα為臨界值

假定Zα為臨界值(三)、用單側(cè)檢驗還是雙側(cè)檢驗,使用左側(cè)檢驗還是右側(cè)檢驗,決定于備選假設(shè)中的不等式形式與方向。與“不相等”對應(yīng)的是雙側(cè)檢驗,與“小于”相對應(yīng)的是左側(cè)檢驗,與“大于”相對應(yīng)的是右側(cè)檢驗。三、兩種類型的錯誤

1、決策結(jié)果存在四種情形:

接受拒絕真實判斷正確棄真錯誤(第一類錯誤或α錯誤)

不真實取偽錯誤(第二類錯誤或β錯誤)

判斷正確

在統(tǒng)計檢驗中,無論是拒絕或者接受原假設(shè),都不可能做到百分之百的正確,都有一定的錯誤。1)、第一類錯誤:原假設(shè)是真實的,判斷結(jié)論是拒絕原假設(shè),這種錯誤叫著“棄真錯誤”,在原假設(shè)為真的情況下,檢驗統(tǒng)計量剛好落入小概率的拒絕區(qū)域,使我們拒絕原假設(shè),因此犯第一類錯誤的概率大小等于顯著性水平α,我們可通過控制顯著性水平大小的方式來控制犯棄真錯誤的概率。在統(tǒng)計學(xué)上把第一類錯誤也叫著α錯誤。2)、第二類錯誤:原假設(shè)不真實,結(jié)論是接受原假設(shè),這種錯誤叫著“取偽錯誤”,犯第二類錯誤的概率記為,因此,在統(tǒng)計學(xué)上稱第二類錯誤為錯誤。3)、不管我們?nèi)绾芜x擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小。對任何一個給定的檢驗而言,犯第一類錯誤的危險越小,犯第二類錯誤的概率就越大;反之亦然。一般來講,不可能具體估計出第二類錯誤的概率值。第一類錯誤則不然,犯第一類錯誤的概率是否定域內(nèi)各種結(jié)果的概率之和。2、兩類錯誤及其關(guān)系四、檢驗功效1、檢驗功效或檢驗力:在犯第一類錯誤的概率α得到控制的條件下,犯取偽錯誤的概率β也要盡可能地小,或者說,不取偽的概率1-β應(yīng)盡可能增大。1-β越大,意味著當(dāng)原假設(shè)不真實時,檢驗判斷出原假設(shè)不真實的概率越大,檢驗的判別能力就越好;1-β越小,意味著當(dāng)原假設(shè)不真實時,檢驗結(jié)論判斷出原假設(shè)不真實的概率越小,檢驗的判別能力就越差。可見1-β是反映統(tǒng)計檢驗判別能力大小的重要標(biāo)志,我們稱之為檢驗功效或檢驗力。2、影響檢驗功效的因素1)、α取值:α大,檢驗功效就大(1-β)2)、要滿足α、β都盡可能的小,只有增加樣本的容量,但樣本容量都是有限的,因此在實際應(yīng)用中會先控制α

原因如下:A、遵循統(tǒng)一原則,討論問題較方便。

B、原假設(shè)清晰,備選假設(shè)模糊,,對于一個模糊的假設(shè)和一個清晰地假設(shè),我們更關(guān)心原假設(shè)為真時,我們卻把它放棄了的可能性有多大。

3)、原假設(shè)與備選假設(shè)的差異程度,差異明顯,則β減少,檢驗功效就大。五、值 值是指在原假設(shè)為真的情況下,得到某一樣本觀察結(jié)果或更為極端情形出現(xiàn)的概率。如果值很小,說明小概率事件發(fā)生了,從而有理由拒絕原假設(shè),值愈小則拒絕的理由愈充分。與根據(jù)檢驗統(tǒng)計量是否落入拒絕域的方法相比,利用值檢驗要更精確。在前一種方法中,在顯著性水平確定后,拒絕域也就確定了,如果檢驗統(tǒng)計量落入拒絕域,我們犯棄真的錯誤就是,而不管得到這一樣本觀察結(jié)果或更為極端情形出現(xiàn)的概率大小,根據(jù)這一方法的做出決策對決策錯誤的風(fēng)險反映不夠。而值在決策風(fēng)險度量上要更為精確。在應(yīng)用中,通常先確定一個顯著性水平,然后用值與比較,在雙側(cè)檢驗中,時拒絕原假設(shè),在單側(cè)檢驗中,

時拒絕原假設(shè)。(1)建立假設(shè)(2)確定統(tǒng)計量(4)計算檢驗統(tǒng)計量(3)選擇顯著性水平和否定域(5)判定所所包有

含統(tǒng)的計步檢驟驗

根據(jù)以往多年的統(tǒng)計表明,上海財大英語的平均成績?yōu)?0分,隨機抽取100個學(xué)生,其平均成績?yōu)?0分,問今年財大學(xué)生的英語成績是否下降?六、假設(shè)檢驗的步驟(5個)1.建立假設(shè)

1)、原假設(shè)(nullhypothesis):需要通過樣本去推斷其正確與否的命題稱為原假設(shè)。用表示,即:2)、備選假設(shè)(alternativehypothesis):與原假設(shè)對立的是假設(shè),備選假設(shè)是在原假設(shè)被否定時另一種可能成立的結(jié)論。備選假設(shè)比原假設(shè)還重要,這要由實際問題來確定,一般把期望出現(xiàn)的結(jié)論作為備選假設(shè)。用表示,備選假設(shè)與原假設(shè)相對立,原假設(shè)成立,則備選假設(shè)不真實,如原假設(shè)不真實,則備選假設(shè)成立。關(guān)于均值,原假設(shè)與備選假設(shè)有三種情況:

雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗2、確定適當(dāng)?shù)臋z驗統(tǒng)計量確定適當(dāng)?shù)慕y(tǒng)計量,且能在原假設(shè)成立的條件下知其分布。一般來說,檢驗統(tǒng)計量的基本形式可表示如下:

3、選擇顯著性水平和否定域被我們事先選定的可以犯第一類錯誤的概率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。因此,有人也把第一類錯誤稱之α錯誤。相應(yīng)地第二類錯誤被人稱為錯誤。在原假設(shè)成立的條件下,統(tǒng)計檢驗中所規(guī)定的小概率標(biāo)準(zhǔn)一般取為α=0.05或α=0.01。由α所決定的否定域與接受域之間的分界值被稱為臨界值,如Zα。4.計算檢驗統(tǒng)計量

在完成了上述工作之后,接下來就是做一次與理想試驗盡量相同的實際抽樣(比如實際做一次重復(fù)拋擲硬幣的試驗),并從獲取的樣本資料算出檢驗統(tǒng)計量。根據(jù)顯著性水平確定統(tǒng)計量的否定域或臨界值,并注意是單側(cè)檢驗還是雙側(cè)檢驗。5.判定

假設(shè)檢驗系指拒絕或保留原假設(shè)的判斷,又稱顯著性檢驗。在選擇否定域并計算檢驗統(tǒng)計量之后,我們完成最后一道手續(xù),即根據(jù)計算結(jié)果決定假設(shè)的取與舍。如果結(jié)果落在否定域內(nèi),我們將在已知犯第一類錯誤概率的條件下,否定零假設(shè)。反之,如果結(jié)果落在否定域外,則不否定零假設(shè),與此同時,我們就有了犯第二類錯誤的危險。

第二節(jié)單個總體參數(shù)的假設(shè)檢驗

一、總體均值檢驗1、提出原假設(shè)和備選假設(shè)(有三種情況)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗2、確定統(tǒng)計量3、確定顯著性水平及拒絕域

(一)、總體σ已知,對總體均值的檢驗1)、確定顯著性水平α

2)、雙側(cè)檢驗時,拒絕域為Z<-Zα/2或Z>Zα/2,即在

Z<-Zα/2或Z>Zα/2時拒絕原假設(shè),接受備選假設(shè),反

之接受原假設(shè),拒絕備選假設(shè)。如Z=Zα/2或Z=-Zα/2

為了慎重,一般先不下結(jié)論,應(yīng)再進行一次抽檢。

3)、單側(cè)檢驗時,左單側(cè)檢驗時,拒絕域為Z<–Zα,即

Z<–Zα?xí)r拒絕原假設(shè),接受備選假設(shè);右單側(cè)檢驗

時,拒絕域為Z>Zα,即Z>Zα?xí)r,拒絕原假設(shè),接

受備選假設(shè)

4、計算統(tǒng)計量z的值

5、根據(jù)統(tǒng)計量的值與臨界值的關(guān)系,進行判定是接受原假設(shè)還是拒絕備選假設(shè)1、根據(jù)長期經(jīng)驗和資料的分析,某磚瓦廠生產(chǎn)的磚的“抗斷強度”服從正態(tài)分布,方差為1.21。從該廠產(chǎn)品中隨機抽取6塊,測得抗斷強度如下(單位:KG/):32.5629.6631.6430.0031.8731.03

檢驗這批磚的平均抗斷強度為32.50是否成立?(α=0.05)2、某廠生產(chǎn)一種產(chǎn)品,原月產(chǎn)量服從平均值為u=75,方差為14的正態(tài)分布,設(shè)備更新后,為了考察產(chǎn)量是否提高,抽查了6個月產(chǎn)量,求得平均產(chǎn)量為78,假定方差不變,問在顯著性水平α=0.05下,設(shè)備更新后的月產(chǎn)量是否有顯著性提高?3、某批發(fā)商欲從廠家購進一批燈泡,根據(jù)合同規(guī)定燈泡的使用壽命平均不能低于1000小時。已知燈泡燃燒壽命服從正態(tài)分布,標(biāo)準(zhǔn)差為200小時。在總體中隨機抽取了100個燈泡,得知樣本均值為960小時,批發(fā)商是否應(yīng)購買這批燈泡?(二)、總體σ未知,對總體均值的檢驗總體方差未知時,可用樣本標(biāo)準(zhǔn)差與方差代替它們,檢驗統(tǒng)計量應(yīng)改為自由度為N-1的T分布,即:稱為t-檢驗統(tǒng)計量,這個檢驗統(tǒng)計量適用于小樣本情況,在大樣本場合,t統(tǒng)計量與標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計量近似,通常用z檢驗代替t檢驗。另T檢驗的步驟與z檢驗的步驟相同。1、提出原假設(shè)和備選假設(shè)(有三種情況)雙側(cè)檢驗左側(cè)檢驗右側(cè)檢驗2、確定統(tǒng)計量3、確定顯著性水平及拒絕域

1)、確定顯著性水平α2)、雙側(cè)檢驗時,拒絕域為t<-tα/2或t>tα/2,即在t<-tα/2或t>tα/2時拒絕原假設(shè),接受備選假設(shè),反之接受原假設(shè),拒絕備選假設(shè)。3)、單側(cè)檢驗時,左單側(cè)檢驗時,拒絕域為t<–tα,即t<–tα?xí)r拒絕原假設(shè),接受備選假設(shè);右單側(cè)檢驗時,拒絕域為t>tα,即t>tα?xí)r,拒絕原假設(shè),接受備選假設(shè)

4、計算統(tǒng)計量z的值

5、根據(jù)統(tǒng)計量的值與臨界值的關(guān)系,進行判定是接受原假設(shè)還是拒絕備選假設(shè)

練習(xí):某機器制造的肥皂厚度為5cm,今欲了解機器性能是否良好,隨機抽取10塊肥皂為樣本,測得平均厚度為5.3cm,標(biāo)準(zhǔn)差為0.3cm,試分別以0.05、0.01的顯著性水平檢驗機器性能良好(即機器厚薄符合規(guī)定的假設(shè))二、總體成數(shù)的檢驗當(dāng)樣本容量較大時,下列統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布:

上式中,ρ代表總體的成數(shù),p代表樣本的成數(shù)。以上的z統(tǒng)計量可以用作總體成數(shù)檢驗的檢驗統(tǒng)計量。檢驗的步驟和總體均值的檢驗步驟相同。練習(xí):一項調(diào)查結(jié)果表明某市老年人口比重為14.7%,該市老年人口研究會為了檢驗該項調(diào)查是否可靠,隨機抽選了400名居民,發(fā)現(xiàn)其中有57人年齡在65歲以上,調(diào)查結(jié)果是否支持該市老年人口比重為14.7%的看法?(顯著性水平為0.05)三、p-值檢驗1、定義:p-值檢驗就是通過計算p-值,再將它與顯著性水平α作比較,決定拒絕還是接受原假設(shè)。所謂p-值就是拒絕原假設(shè)所需的最低顯著性水平。2、p-值判斷的原則是:如果p-值小于給定的顯著性水平α,則拒絕原假設(shè);否則,接受原假設(shè)。或者,更直觀來說就是:如果p-值很小,拒絕原假設(shè),p-值很大,接受原假設(shè)。請大家注意的是這里的p-值是指概率,不要與成數(shù)指標(biāo)相混淆。3、z檢驗的p-值:步驟1、2(作出假設(shè)、構(gòu)造檢驗統(tǒng)計量)同

Z檢驗)步驟3:計算樣本統(tǒng)計量步驟4:檢驗統(tǒng)計量為z統(tǒng)計量的p-值計算公式,表示檢驗統(tǒng)計量的抽樣數(shù)據(jù),則p-值的計算方法如下:如果:,p-值=2 如果:,p-值= 如果:,p-值=步驟五:作出決策,如果p-值>顯著性水平,接受原假設(shè),反之拒絕原假設(shè)。4、t檢驗的p-值與z檢驗類同。四、總體方差檢驗原假設(shè)為:

或或1.總體均值未知時假設(shè)~,但總體均值未知,此時可用樣本方差與的比來構(gòu)造檢驗統(tǒng)計量,在原假設(shè)為真時,統(tǒng)計量表達(dá)式為:~

當(dāng)采用雙側(cè)檢驗時,若或則拒絕,反之接受;當(dāng)進行右側(cè)檢驗時,時拒絕,反之接受;當(dāng)進行左側(cè)檢驗時,時拒絕,反之接受。2、總體均值已知時假設(shè)~,則從總體中抽得的樣本滿足~在原假設(shè)為真時,可以構(gòu)造統(tǒng)計量:~進而可以確定拒絕域。當(dāng)采用雙側(cè)檢驗時,或時拒絕,反之接受;當(dāng)進行右側(cè)檢驗時,時拒絕,反之接受;當(dāng)進行左側(cè)檢驗時,時拒絕,反之接受。第三節(jié)兩個總體參數(shù)假設(shè)檢驗一、兩個總體均值之差的檢驗原假設(shè)(或)1.已知時由于~,~,且相互獨立,所以有:~~

所以可用Z檢驗統(tǒng)計量來檢驗原假設(shè)成立與否。2.未知時 當(dāng)未知但樣本量較大時,依然可以使用Z統(tǒng)計量進行檢驗,此時總體分別用樣本方差代替,公式如下:~

當(dāng)未知且樣本量較小時,則不能用代替的統(tǒng)計量來檢驗,此時需要使用t統(tǒng)計量。更具體了又可以分為兩種情況,一種是根據(jù)以往的大量經(jīng)驗或者事先通過檢驗知道有,另一種是不相等或無法判斷它們是否相等。我們先討論第一種情況,此時可以得到的標(biāo)準(zhǔn)差的估計,,其中,于是可以構(gòu)造檢驗統(tǒng)計量~

對于第二種情況,需要用來估計,可以得到,我們?nèi)匀煌ㄟ^構(gòu)造t統(tǒng)計量來進行檢驗~

其中,

注意,此時統(tǒng)計量的自由度已不再是,而是近似服從自由度為的分布。二、兩個總體比例之差的檢驗

實際中經(jīng)常要檢驗兩個總體中具有某一特征單位數(shù)的比例之差是否滿足某一條件。此時需要用到兩個總體比例之差的檢驗。設(shè)兩個總體都服從二項分布,兩個總體中具有某一特征單位數(shù)的比例分別為。從兩個總體中分別抽出樣本容量為的兩個樣本,樣本比例分別用表示。1.檢驗兩個總體比例之差為零的假設(shè)設(shè)所要檢驗的問題的原假設(shè)為:(或、)在原假設(shè)成立時,可以得到兩個樣本合并后得到的比例估計量,其中分別表示兩個樣本中具有該特征的單位數(shù)。在大樣本條件下,可以構(gòu)造統(tǒng)計量進行檢驗~2.檢驗兩個總體比例之差不為零的假設(shè)設(shè)所要檢驗的問題的原假設(shè)為(或、)其中為不等于零的常數(shù)。在大樣本條件下,依舊構(gòu)造Z統(tǒng)計量進行檢驗,但此時Z統(tǒng)計量的形式稍有變化。

~三、兩個總體方差比的檢驗兩總體方差是否相等的檢驗又稱為方差齊性檢驗。實際中常常需要對兩個總體方差是否相等進行檢驗,比如比較兩種資產(chǎn)的波動,比較生產(chǎn)工藝的穩(wěn)定性,等等。在前面介紹的方差未知且小樣本的兩總體均值之差檢驗中,曾假定兩總體的方差相等或不相等。而實際中往往需要通過方差齊性檢驗才能知道兩總體的方差是否相等。四、配對樣本的檢驗在實際中,經(jīng)常會碰到檢驗兩個相關(guān)樣本或配對樣本的平均數(shù)間是否有顯著差異的問題,比如檢驗一組肥胖者參加減肥訓(xùn)練班后體重是否有明顯的變化,車間工人在培訓(xùn)前后生產(chǎn)效率是否有明顯的差異,等等。對于這類兩個樣本之間存在相關(guān)性的問題,采用匹配樣本的檢驗,可以提高效率。這里通過一個例子介紹配對樣本的均值之差的檢驗[例6-13]某工廠為工人組織了一次技術(shù)培訓(xùn),為檢驗這次培訓(xùn)是否有效果,隨機抽取了10名工人進行調(diào)查,測得他們的培訓(xùn)前后每小時平均生產(chǎn)零件數(shù),如表6-2所示。第三節(jié)非參數(shù)檢驗非參數(shù)檢驗是對總體的分布不作任何限制的統(tǒng)計檢驗。故非參數(shù)檢驗又稱為自由分布檢驗。非參數(shù)檢驗,無需做出經(jīng)典統(tǒng)計所必要的關(guān)于分布的任何假設(shè)。唯一需要的假設(shè)是:全部數(shù)據(jù)或數(shù)據(jù)對都出自相同的基本總體,且取樣是隨機的、相互獨立的。基于這種原因,非參數(shù)檢驗又稱為分布自由(或無分布)檢驗?!盁o分布”不是指總體真的無分布,而是指雖有時對總體分布一無所知,但仍可以進行分析。不僅如此,這些很容易理解的方法還可以用于處理等級的資料和定性的信息。正因為如此,非參數(shù)檢驗成為管理科學(xué)中應(yīng)用較為廣泛的一種統(tǒng)計檢驗方法。

一、自由分布檢驗概述1、自由分布檢驗概念:又稱為非參數(shù)檢驗,對總體分布未加限制的檢驗。2、自由分布檢驗對比參數(shù)檢驗,具有以下優(yōu)點:首先,檢驗條件比較寬松,適應(yīng)性強。其次,自由分布檢驗的方法比較靈活,用途廣泛。對于那些不能進行加、減、乘、除運算的定類數(shù)據(jù)與定序數(shù)據(jù),可使用符號檢驗、秩和檢驗等方法進行檢驗。再次,自由分布檢驗的計算相對簡單。由于自由分布的檢驗方法不用復(fù)雜計算,一般使用計數(shù)方法就可以了,它的計數(shù)過程與結(jié)果都比較簡單、直觀與明顯。3、自由分布檢驗缺點由于它對原始數(shù)據(jù)中包含的信息利用得不夠充分,檢驗的功效相對較弱。當(dāng)總體的分布形式已知時,基于這種分布類型的參數(shù)方法,一般說來比非參數(shù)方法為佳。例如,對于一批資料,可同時適用于參數(shù)的t-檢驗、非參數(shù)的符秩檢驗和符號檢驗。其檢驗功效是,t-檢驗的最好,符秩檢驗次之,符號檢驗最差。這主要是由于符號檢驗對信息的利用最不充分。二、符號檢驗(最簡單的檢驗)該方法是建立在以正、負(fù)號表示樣本數(shù)據(jù)與假設(shè)參數(shù)值差異關(guān)系基礎(chǔ)上的,因此稱之為符號檢驗。該方法既適用于單樣本場合,也適用于配對樣本場合。(一)單樣本場合的符號檢驗中位數(shù)檢驗:

:=A樣本每個數(shù)據(jù)都減去A,只記錄其差數(shù)的符號。n+與n-分別是正、負(fù)符號的個數(shù),當(dāng)原假設(shè)為真是時,n+與n-應(yīng)該很接近;若兩者相差太遠(yuǎn),就有有理由拒絕原假設(shè)。例4:設(shè)有20個工人,他們一天生產(chǎn)的產(chǎn)品件數(shù),抽樣結(jié)果如下:168,163,160,172,162,168,152,153,167,165,164,142,173,166,160,165,171,186,167,170。試以α=0.10的檢驗水平,判定總體中位數(shù)是否是160。解:第一步:作出假設(shè)。:=160,:160由備選假設(shè)知,這個檢驗是雙側(cè)的。第二步:計數(shù)。對樣本數(shù)據(jù),大于160的記下“+”,小于160的記下“-”,等于160的,予以剔除(以0記之),結(jié)果如下:++0+++--+++-++0+++++計數(shù)以上“+”的個數(shù)是n+=15,“-”的個數(shù)n-=3,剔除數(shù)據(jù)2個。最后有效的樣本個數(shù)為n=n++n-=18。第三步:確定拒絕域。顯著水平α=0.10,由于進行雙側(cè)檢驗,拒絕域分布在兩邊,每側(cè)概率α/2=0.05,查二項分布臨界值表,得到拒絕域的臨界值是13。第四步:選擇n+、n-較大者,再與臨界值比較。結(jié)果是15>13。第五步:判斷。由于上一步的比較結(jié)果可知,樣本落入拒絕域,所以拒絕原假設(shè),認(rèn)為樣本數(shù)據(jù)不能證明總體中位數(shù)等于160件。(二)配對樣本場合的符號檢驗樣本配對場合與單樣本場合的符號檢驗,基本原理是一致的。設(shè)從兩個總體中分別抽出一個容量相等的樣本,然后將兩樣本的數(shù)據(jù)進行一一配對,得到一組配對值。再將各對配對值相減,記錄下差數(shù)的符號,計算出“+”的個數(shù)n+與“-”的個數(shù)n-。如果兩個樣本的總體差異不顯著,配對值之差的正負(fù)號出現(xiàn)的概率各是1/2,則n+與n-應(yīng)當(dāng)非常接近;如果n+、n-相差太大的話,說明兩總體存在顯著差異。例子見書上的。三、秩和檢驗秩和檢驗也稱Wilcoxon-Man-Whitney檢驗。該檢驗方法可用于檢驗兩個獨立的樣本是否來自同一個總體,或判斷總體間是否存在顯著性的差異。它和符號檢驗最主要的區(qū)別是,符號檢驗只考慮樣本間差數(shù)的符號,而秩和檢驗還要考慮差數(shù)的順序,比符號檢驗利用數(shù)據(jù)信息更加充分,因此,檢驗功效就更強。秩和檢驗原理:1、設(shè)分別從兩個未知的總體獨立、隨機地抽取容量為n1和n2的樣本,把樣本容量較小的總體稱為總體Ⅰ。如果兩樣本容量相等,就把任意一個總體稱作總體Ⅰ,另一個總體稱作總體Ⅱ,這里不妨設(shè)n1<n2。2、現(xiàn)將兩個樣本混合起來,并按數(shù)據(jù)的大小,從小到大排列編號,每個數(shù)值的編號就是它的秩次。如果混合樣本中有若干個相同的數(shù)值,則把它們的秩次進行簡單算術(shù)平均,用此平均值作為這些數(shù)值的秩次,計算來自總體Ⅰ的n1個數(shù)據(jù)在混合樣本中的秩次之和,記為T。3、顯然T最小的可能值是:T1=1+2+3+…+n1=[n1(n1+1)]/2;最大的可能值是T2=(n2+1)+(n2+2)+…+(n2+n1)=n1[(n2+1)+(n2+n1)]/2。如果兩個總體分布無顯著差異,則T值不應(yīng)太大或太小,等于中間值(T1+T2)/2;如果總體Ⅰ分布于總體Ⅱ的右邊,T將接近其最大值T2;如果總體Ⅰ位于總體Ⅱ的左邊,T將接近于它的最小值T1。因此,我們可以用秩和T作為檢驗的統(tǒng)計量。4、第一種方法,當(dāng)n1和n2都不超過10時,查“秩和檢驗表”確定臨界值;第二種方法,當(dāng)n1和n2都超過10時,秩和T服從正態(tài)分布:先對T進行標(biāo)準(zhǔn)化變換,再利用標(biāo)準(zhǔn)正態(tài)分布表,確定檢驗的臨界值。練習(xí):有A、B兩家廠商供應(yīng)同一種商品,兩家商品價格與性能一致,但使用壽命是否一致有待檢驗。今分別從兩家生產(chǎn)產(chǎn)品中抽出樣本,測定產(chǎn)品使用壽命(見下表,單位:小時):試以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論