統(tǒng)計(jì)學(xué)第七章方差分析_第1頁(yè)
統(tǒng)計(jì)學(xué)第七章方差分析_第2頁(yè)
統(tǒng)計(jì)學(xué)第七章方差分析_第3頁(yè)
統(tǒng)計(jì)學(xué)第七章方差分析_第4頁(yè)
統(tǒng)計(jì)學(xué)第七章方差分析_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)第七章方差分析第一頁(yè),共四十六頁(yè),2022年,8月28日

方差分析(AnalysisofVariance,ANOVA)是假設(shè)檢驗(yàn)的一種延續(xù)與擴(kuò)展,它可以解決諸如多個(gè)均值是否相等等方面的檢驗(yàn)問(wèn)題,在因素分析中具有一定的優(yōu)勢(shì)。

例4:一個(gè)兒童食品制造商生產(chǎn)兒童麥片,該制造商認(rèn)為以下三種因素影響麥片味道:(1)麥片中小麥與玉米的比例;(2)甜味劑類型的選擇:糖、蜂蜜等;(3)制作時(shí)間的長(zhǎng)短。

該例中,食品制造商通過(guò)生產(chǎn)出不同類型的麥片并邀請(qǐng)兒童進(jìn)行品嘗試驗(yàn),最后發(fā)現(xiàn):

(1)麥片成份及甜味劑類型對(duì)麥片食味有很大影響;

(2)制作時(shí)間對(duì)麥片食味沒(méi)有影響。一、方差分析的基本問(wèn)題第二頁(yè),共四十六頁(yè),2022年,8月28日因此,食品制造商可以對(duì)麥片成份及甜味劑類型給予充分的關(guān)注以生產(chǎn)更合兒童口味的麥片,而對(duì)制作時(shí)間不必太介意。

方差分析可以用來(lái)分析不同因素(如上例中小麥與玉米的比例、甜味劑類型、制作時(shí)間)對(duì)總體特征是否有顯著影響。所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源第三頁(yè),共四十六頁(yè),2022年,8月28日

方差分析主要用來(lái)對(duì)多個(gè)總體均值是否相等作出假設(shè)檢驗(yàn)。

例:某飲料制造商生產(chǎn)一種新型飲料,共有四種顏色:(1)橘黃、(2)粉紅、(3)綠色、(4)無(wú)色。該制造商想知道顏色是否對(duì)銷售量有顯著影響,隨機(jī)抽取了5家超市前一期的銷售量(下表)進(jìn)行分析。

一、方差分析的內(nèi)容第四頁(yè),共四十六頁(yè),2022年,8月28日下表四種飲料銷售量情況樣本均值27.3229.5626.4431.46

樣本方差2.672.143.311.66

樣本標(biāo)準(zhǔn)差1.641.461.821.29四種顏色可以看作是四個(gè)總體第五頁(yè),共四十六頁(yè),2022年,8月28日其中,i(I=1,2,3,4)

表示所有飲料(無(wú)色、粉紅、橘黃、綠色)銷售量之均值。樣本來(lái)自于一個(gè)相同的總體樣本來(lái)自于不同的總體

要知道顏色是否對(duì)飲料銷售有顯著影響,就是要知道四種顏色飲料銷售量的均值是否有顯著差異,即進(jìn)行下述假設(shè)檢驗(yàn):

H0:1=2=3=4H1:四個(gè)總體均值不全相等第六頁(yè),共四十六頁(yè),2022年,8月28日

1、相關(guān)術(shù)語(yǔ)

因素:是一個(gè)獨(dú)立的變量,是方差分析的研究對(duì)象(上例中的飲料顏色);二、方差分析的假設(shè)

單因素方差分析:只針對(duì)一個(gè)因素進(jìn)行分析;

多因素方差分析:同時(shí)針對(duì)多個(gè)因素進(jìn)行分析。

水平:因素中的內(nèi)容(上例中飲料的四種顏色:無(wú)色、粉色、橘黃色、綠色)第七頁(yè),共四十六頁(yè),2022年,8月28日2、進(jìn)行方差分析必須滿足如下假設(shè)(1)每個(gè)總體的相應(yīng)變量(因素)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每種顏色飲料的銷售量必需服從正態(tài)分布(2)所有總體相應(yīng)變量(因素)的方差相等2對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷售量的方差都相同(3)不同觀察值(水平)相互獨(dú)立(每個(gè)樣本點(diǎn)的取值不影響其他樣本點(diǎn)的取值)比如,每個(gè)超市的銷售量都與其他超市的銷售量獨(dú)立第八頁(yè),共四十六頁(yè),2022年,8月28日在上述假定條件下,判斷顏色對(duì)銷售量是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等的問(wèn)題如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近四個(gè)樣本的均值越接近,我們推斷四個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,我們推斷總體均值不同的證據(jù)就越充分第九頁(yè),共四十六頁(yè),2022年,8月28日如果原假設(shè)成立,即H0:m1=m2=m3=m4四種顏色飲料銷售的均值都相等沒(méi)有系統(tǒng)誤差

這意味著每個(gè)樣本都來(lái)自均值為、差為2的同一正態(tài)總體

Xf(X)1

2

3

4

第十頁(yè),共四十六頁(yè),2022年,8月28日如果備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的有系統(tǒng)誤差這意味著四個(gè)樣本分別來(lái)自均值不同的四個(gè)正態(tài)總體Xf(X)3

1

2

4

第十一頁(yè),共四十六頁(yè),2022年,8月28日

觀察值之間的差異來(lái)自兩個(gè)方面:某因素不同水平的影響(系統(tǒng)性影響)其他隨機(jī)因素的影響(隨機(jī)性影響)水平間方差(組間方差)水平內(nèi)方差(組內(nèi)方差)三、方差分析的原理如果原假設(shè)成立:說(shuō)明某因素不同水平的影響不顯著(無(wú)系統(tǒng)性影響),只剩下隨機(jī)性影響,因此組間方差與組內(nèi)方差差別不大,它們的比接近于1。

如果原假設(shè)不成立:說(shuō)明某因素不同水平的影響顯著(存在系統(tǒng)性影響),組間方差與組內(nèi)方差差別較大,它們的比遠(yuǎn)超出1。第十二頁(yè),共四十六頁(yè),2022年,8月28日二、單因素方差分析的步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策第十三頁(yè),共四十六頁(yè),2022年,8月28日提出假設(shè)一般提法H0:m1=m2=…=

mk(因素有k個(gè)水平)H1:m1

,m2

,…

,mk不全相等對(duì)前面的例子H0:m1=m2=m3=

m4顏色對(duì)銷售量沒(méi)有影響H0:m1

,m2

,m3,m4不全相等顏色對(duì)銷售量有影響第十四頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值離差平方和均方(MS)第十五頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平的均值)假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡(jiǎn)單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)計(jì)算公式為式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)

xij為第i個(gè)總體的第j個(gè)觀察值

第十六頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個(gè)數(shù)計(jì)算公式為第十七頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(前例計(jì)算結(jié)果)表8-2四種顏色飲料的銷售量及均值超市(j)水平A(i)無(wú)色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計(jì)136.6147.8132.2157.3573.9水平均值觀察值個(gè)數(shù)x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.695第十八頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總離差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計(jì)算公式為

前例的計(jì)算結(jié)果:

SST=(26.5-28.695)2+(28.7-28.695)2+…+(32.8-28.695)2=115.9295第十九頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算誤差項(xiàng)平方和SSE)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)離差平方和該平方和反映的是隨機(jī)誤差的大小計(jì)算公式為

前例的計(jì)算結(jié)果:SSE=39.084第二十頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平項(xiàng)平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為

前例的計(jì)算結(jié)果:SSA=76.8455第二十一頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的關(guān)系)總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSE+SSA第二十二頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的作用)

SST反映了全部數(shù)據(jù)總的誤差程度;SSE反映了隨機(jī)誤差的大小;SSA反映了隨機(jī)誤差和系統(tǒng)誤差的大小如果原假設(shè)成立,即H1=H2

=…=Hk為真,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗(yàn)這種差異,需要構(gòu)造一個(gè)用于檢驗(yàn)的統(tǒng)計(jì)量第二十三頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方,也稱為均方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSE的自由度為n-k第二十四頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)

SSA的均方也稱組間方差,記為MSA,計(jì)算公式為

SSE的均方也稱組內(nèi)方差,記為MSE,計(jì)算公式為第二十五頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)的統(tǒng)計(jì)量F)將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即第二十六頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE1a

F分布F(k-1,n-k)0拒絕H0不能拒絕H0F第二十七頁(yè),共四十六頁(yè),2022年,8月28日

對(duì)原假設(shè):H0:1=2=3=4

及備擇假設(shè):

H1:四個(gè)總體均值不全相等計(jì)算F值:

F=MSA/MSE=25.6152/2.4428=10.486

給出顯著性水平:=0.05,查F(r-1,n-r)分布表臨界值:3.24由于計(jì)算的F=10.486>3.24

,拒絕原假設(shè),從而得出:顏色對(duì)該公司飲料銷售有顯著影響。第二十八頁(yè),共四十六頁(yè),2022年,8月28日第二十九頁(yè),共四十六頁(yè),2022年,8月28日三、雙因素方差分析

分析兩個(gè)因素(因素A和因素B)對(duì)試驗(yàn)結(jié)果的影響分別對(duì)兩個(gè)因素進(jìn)行檢驗(yàn),分析是一個(gè)因素在起作用,還是兩個(gè)因素都起作用,還是兩個(gè)因素都不起作用如果A和B對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷因素A和因素B對(duì)試驗(yàn)指標(biāo)的影響,這時(shí)的雙因素方差分析稱為無(wú)交互作用的雙因素方差分析如果除了A和B對(duì)試驗(yàn)結(jié)果的單獨(dú)影響外,因素A和因素B的搭配還會(huì)對(duì)銷售量產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析對(duì)于無(wú)交互作用的雙因素方差分析,其結(jié)果與對(duì)每個(gè)因素分別進(jìn)行單因素方差分析的結(jié)果相同第三十頁(yè),共四十六頁(yè),2022年,8月28日雙因素方差分析中需假設(shè)兩個(gè)因素不交互作用,即各自獨(dú)立地發(fā)揮影響作用。

(一)數(shù)據(jù)結(jié)構(gòu)

雙因素方差分析第三十一頁(yè),共四十六頁(yè),2022年,8月28日雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)是因素A的第i個(gè)水平下各觀察值的平均值是因素B的第j個(gè)水平下的各觀察值的均值是全部kr個(gè)樣本數(shù)據(jù)的總平均值第三十二頁(yè),共四十六頁(yè),2022年,8月28日雙因素方差分析的步驟第三十三頁(yè),共四十六頁(yè),2022年,8月28日提出假設(shè)對(duì)因素A提出的假設(shè)為H0:m1=m2

=

…=mi=…=

mk(mi為第i個(gè)水平的均值)H1:mi

(i=1,2,…,k)不全相等對(duì)因素B提出的假設(shè)為H0:m1=m2

=

…=mj=…=

mr(mj為第j個(gè)水平的均值)H1:mj

(j=1,2,…,r)不全相等第三十四頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算總離差平方和水平項(xiàng)平方和誤差項(xiàng)平方和均方第三十五頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總離差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況計(jì)算公式為第三十六頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算SSA、SSB和SSE)因素A的離差平方和SSA因素B的離差平方和SSB誤差項(xiàng)平方和SSE第三十七頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(各平方和的關(guān)系)總離差平方和(SST)、水平項(xiàng)離差平方和(SSA和SSB)、誤差項(xiàng)離差平方和(SSE)之間的關(guān)系SST=SSA+SSB+SSE

第三十八頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)各離差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是總離差平方和SST的自由度為kr-1因素A的離差平方和SSA的自由度為k-1因素B的離差平方和SSB的自由度為r-1隨機(jī)誤差平方和SSE的自由度為(k-1)×(r-1)

第三十九頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)因素A的均方,記為MSA,計(jì)算公式為因素B的均方,記為MSB

,計(jì)算公式為隨機(jī)誤差項(xiàng)的均方,記為MSE

,計(jì)算公式為第四十頁(yè),共四十六頁(yè),2022年,8月28日構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)的統(tǒng)計(jì)量F)為檢驗(yàn)因素A的影響是否顯著,采用下面的統(tǒng)計(jì)量為檢驗(yàn)因素B的影響是否顯著,采用下面的統(tǒng)計(jì)量第四十一頁(yè),共四十六頁(yè),2022年,8月28日統(tǒng)計(jì)決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平在F分布表中查找相應(yīng)的臨界值F

若FAF

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,即所檢驗(yàn)的因素(A)對(duì)觀察值有顯著影響若FBF

,則拒絕原假設(shè)H0

,表明均值之間有顯著差異,即所檢驗(yàn)的因素(B)對(duì)觀察值有顯著影響第四十二頁(yè),共四十六頁(yè),2022年,8月28日雙因素方差分析表

(基本結(jié)構(gòu))方差來(lái)源平方和SS自由度df均方MSF值因素A

因素B誤差總和SSASSBSSESSTk-1r-1(k-1)(r-1)kr-1MSA

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論