賈俊平《統(tǒng)計(jì)學(xué)》第五版第10章 方差分析_第1頁(yè)
賈俊平《統(tǒng)計(jì)學(xué)》第五版第10章 方差分析_第2頁(yè)
賈俊平《統(tǒng)計(jì)學(xué)》第五版第10章 方差分析_第3頁(yè)
賈俊平《統(tǒng)計(jì)學(xué)》第五版第10章 方差分析_第4頁(yè)
賈俊平《統(tǒng)計(jì)學(xué)》第五版第10章 方差分析_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第10章方差分析10.1方差分析引論10.1.1方差分析及其有關(guān)術(shù)語(yǔ)檢驗(yàn)多個(gè)總體均值是否相等通過(guò)對(duì)各觀察數(shù)據(jù)誤差來(lái)源的分析來(lái)判斷多個(gè)總體均值是否相等2. 變量一個(gè)定類(lèi)尺度的自變量2個(gè)或多個(gè)(k個(gè))處理水平或分類(lèi)一個(gè)定距或比例尺度的因變量3. 用于分析完全隨機(jī)化試驗(yàn)設(shè)計(jì)什么是方差分析?

(一個(gè)例子)該飲料在五家超市的銷(xiāo)售情況超市無(wú)色粉色橘黃色綠色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8【例8.1】某飲料生產(chǎn)企業(yè)研制出一種新型飲料。飲料的顏色共有四種,分別為橘黃色、粉色、綠色和無(wú)色透明。這四種飲料的營(yíng)養(yǎng)含量、味道、價(jià)格、包裝等可能影響銷(xiāo)售量的因素全部相同?,F(xiàn)從地理位置相似、經(jīng)營(yíng)規(guī)模相仿的五家超級(jí)市場(chǎng)上收集了前一時(shí)期該飲料的銷(xiāo)售情況。試分析飲料的顏色是否對(duì)銷(xiāo)售量產(chǎn)生影響。什么是方差分析?

(例子的進(jìn)一步分析)檢驗(yàn)飲料的顏色對(duì)銷(xiāo)售量是否有影響,也就是檢驗(yàn)四種顏色飲料的平均銷(xiāo)售量是否相同設(shè)1為無(wú)色飲料的平均銷(xiāo)售量,2粉色飲料的平均銷(xiāo)售量,3為橘黃色飲料的平均銷(xiāo)售量,4為綠色飲料的平均銷(xiāo)售量,也就是檢驗(yàn)下面的假設(shè)H0:123

4

H1:1,2,3,4

不全相等檢驗(yàn)上述假設(shè)所采用的方法就是方差分析因素或因子所要檢驗(yàn)的對(duì)象稱為因子要分析飲料的顏色對(duì)銷(xiāo)售量是否有影響,顏色是要檢驗(yàn)的因素或因子水平因素的具體表現(xiàn)稱為水平A1、A2、A3、A4四種顏色就是因素的水平觀察值在每個(gè)因素水平下得到的樣本值每種顏色飲料的銷(xiāo)售量就是觀察值試驗(yàn)這里只涉及一個(gè)因素,因此稱為單因素四水平的試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體比如A1、A2、A3、A4四種顏色可以看作是四個(gè)總體樣本數(shù)據(jù)上面的數(shù)據(jù)可以看作是從這四個(gè)總體中抽取的樣本數(shù)據(jù)10.1.2方差分析的基本思想和原理1.兩類(lèi)誤差(1)組內(nèi)誤差來(lái)自水平內(nèi)部的數(shù)據(jù)誤差比如,同一種顏色的飲料在不同超市上的銷(xiāo)售量的差異。(2)組間誤差來(lái)自不同水平之間的數(shù)據(jù)誤差比如,同一家超市,不同顏色飲料的銷(xiāo)售量的差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于顏色本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差2.兩類(lèi)方差(1)組內(nèi)方差(誤差平方和、殘差平方和、

SSE)因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的方差比如,無(wú)色飲料A1在5家超市銷(xiāo)售數(shù)量的方差組內(nèi)方差只包含隨機(jī)誤差(2)組間方差(因素平方和、SSA)因素的不同水平(不同總體)下各樣本之間的方差比如,四種顏色飲料銷(xiāo)售量之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差3.誤差分析如果顏色(水平)對(duì)銷(xiāo)售量(結(jié)果)沒(méi)有影響,那么在SSA中只包含有隨機(jī)誤差,而沒(méi)有系統(tǒng)誤差。這時(shí),SSA與SSE就應(yīng)該很接近,兩個(gè)方差的比值就會(huì)接近1如果不同的水平對(duì)結(jié)果有影響,在SSA中除了包含隨機(jī)誤差外,還會(huì)包含有系統(tǒng)誤差,這時(shí)SSA就會(huì)大于SSE,SSA與SSE的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異10.1.3方差分析中的基本假定1.每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本。比如,每種顏色飲料的銷(xiāo)售量必需服從正態(tài)分布2.各個(gè)總體的方差必須相同對(duì)于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的比如,四種顏色飲料的銷(xiāo)售量的方差都相同3.觀察值是獨(dú)立的比如,每個(gè)超市的銷(xiāo)售量都與其他超市的銷(xiāo)售量獨(dú)立在上述假定條件下,判斷顏色對(duì)銷(xiāo)售量是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的四個(gè)正態(tài)總體的均值是否相等的問(wèn)題如果四個(gè)總體的均值相等,可以期望四個(gè)樣本的均值也會(huì)很接近四個(gè)樣本的均值越接近,我們推斷四個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,我們推斷總體均值不同的證據(jù)就越充分如果原假設(shè)成立,即H0:m1=m2=m3=m4四種顏色飲料銷(xiāo)售的均值都相等沒(méi)有系統(tǒng)誤差

這意味著每個(gè)樣本都來(lái)自均值為、差為2的同一正態(tài)總體

Xf(X)1

2

3

4

如果備擇假設(shè)成立,即H1:mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的有系統(tǒng)誤差這意味著四個(gè)樣本分別來(lái)自均值不同的四個(gè)正態(tài)總體

Xf(X)3

1

2

4

10.1.4問(wèn)題的一般提法H0:1=2=…=4

自變量對(duì)因變量沒(méi)有顯著影響H1:1,2,…,4

不全相等

自變量對(duì)因變量有顯著影響10.2單因素方差分析10.2.1數(shù)據(jù)結(jié)構(gòu)觀察值(j)因素(A)i

水平A1水平A2

…水平Ak12::n

x11x12…x1kx21x22…x2k::::::::xn1

xn2…xnk10.2.2分析步驟1.提出假設(shè)一般提法

H0:m1=m2=…=mk(因素有k個(gè)水平)

H1:m1

,m2

,…,mk不全相等對(duì)前面的例子

H0:m1=m2=m3=m4顏色對(duì)銷(xiāo)售量沒(méi)有影響 H0:m1

,m2

,m3,m4不全相等顏色對(duì)銷(xiāo)售量有影響2.構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量(1)計(jì)算各樣本的均值假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡(jiǎn)單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù);xij為第i個(gè)總體的第j個(gè)觀察值(2)計(jì)算全部觀測(cè)值的總均值四種顏色飲料的銷(xiāo)售量及均值超市(j)水平A(i)無(wú)色(A1)粉色(A2)橘黃色(A3)綠色(A4)1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8合計(jì)136.6147.8132.2157.3573.9水平均值觀察值個(gè)數(shù)x1=27.32n1=5x2=29.56n2=5x3=26.44n3=5x4=31.46n4=5總均值x=28.695(3)計(jì)算各誤差平方和三個(gè)平方和的關(guān)系總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSE+SSA三個(gè)平方和的作用

SST反映了全部數(shù)據(jù)總的誤差程度;SSE反映了隨機(jī)誤差的大?。籗SA反映了隨機(jī)誤差和系統(tǒng)誤差的大小如果原假設(shè)成立,即1=2=…=k為真,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗(yàn)這種差異,需要構(gòu)造一個(gè)用于檢驗(yàn)的統(tǒng)計(jì)量(4)計(jì)算統(tǒng)計(jì)量各離差平方和的大小與觀察值的多少有關(guān),為了消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSE的自由度為n-k

SSA的均方也稱組間方差,記為MSA,計(jì)算公式為

SSE的均方也稱組內(nèi)方差,記為MSE,計(jì)算公式為將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即F分布與拒絕域如果均值相等,F(xiàn)=MSA/MSE1a

F分布F(k-1,n-k)0拒絕H0不能拒絕H0F3.統(tǒng)計(jì)決策將統(tǒng)計(jì)量的值F與給定的顯著性水平的臨界值F進(jìn)行比較,作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F

若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素(A)對(duì)觀察值有顯著影響若FF

,則不能拒絕原假設(shè)H0

,表明所檢驗(yàn)的因素(A)對(duì)觀察值沒(méi)有顯著影響單因素方差分析表

(基本結(jié)構(gòu))方差來(lái)源平方和SS自由度df均方MSF值組間(因素影響)

組內(nèi)(誤差)

總和SSASSESSTk-1n-kn-1MSAMSEMSAMSE【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的樣本,其中零售業(yè)抽取7家,旅游業(yè)抽取了6家,航空公司抽取5家、家電制造業(yè)抽取了5家,然后記錄了一年中消費(fèi)者對(duì)總共23家服務(wù)企業(yè)投訴的次數(shù),結(jié)果如表9.7。試分析這四個(gè)行業(yè)的服務(wù)質(zhì)量是否有顯著差異?(=0.05)消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)

觀察值(j)行業(yè)(A)零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675755464554534762496054565551494855477068636960單因素方差分析

(計(jì)算結(jié)果)解:設(shè)四個(gè)行業(yè)被投訴次數(shù)的均值分別為,m1、m2

、m3、m4

,則需要檢驗(yàn)如下假設(shè)

H0:m1=m2=m3

=

m4(四個(gè)行業(yè)的服務(wù)質(zhì)量無(wú)顯著差異)H1:m1

,m2

,m3,m4不全相等(有顯著差異)Excel輸出的結(jié)果如下

結(jié)論:拒絕H0。四個(gè)行業(yè)的服務(wù)質(zhì)量有顯著差異10.2.4方差分析中的多重比較多重比較是通過(guò)對(duì)總體均值之間的配對(duì)比較來(lái)進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異多重比較方法有多種,這里介紹Fisher提出的最小顯著差異方法,簡(jiǎn)寫(xiě)為L(zhǎng)SD,該方法可用于判斷到底哪些均值之間有差異

LSD方法是對(duì)檢驗(yàn)兩個(gè)總體均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來(lái)代替)而得到的提出假設(shè)H0:mi=mj

(第i個(gè)總體的均值等于第j個(gè)總體的均值)H1:mi

mj

(第i個(gè)總體的均值不等于第j個(gè)總體的均值)檢驗(yàn)的統(tǒng)計(jì)量為若|t|t,拒絕H0;若|t|<t,不能拒絕H0通過(guò)判斷樣本均值之差的大小來(lái)檢驗(yàn)H0檢驗(yàn)的統(tǒng)計(jì)量為:xi–xj檢驗(yàn)的步驟為

提出假設(shè)H0:mi=mj(第i個(gè)總體的均值等于第j個(gè)總體的均值)H1:mi

mj(第i個(gè)總體的均值不等于第j個(gè)總體的均值)計(jì)算LSD若|xi-xj|LSD,拒絕H0,若|xi-xj|<LSD

,不能拒絕H0根據(jù)前面的計(jì)算結(jié)果:x1=27.3;x2=29.5;x3=26.4;x4=31.4提出假設(shè)H0:mi=mj

;H1:mi

mj計(jì)算LSD|x1-x2|=|27.3-29.5|=2.2>2.096

顏色1與顏色2的銷(xiāo)售量有顯著差異|x1-x3|=|27.3-26.4|=0.9<2.096

顏色1與顏色3的銷(xiāo)售量沒(méi)有顯著差異|x1-x4|=|27.3-31.4|=4.1>2.096

顏色1與顏色4的銷(xiāo)售量有顯著差異|x2-x3|=|29.5-26.4|=3.1>2.096

顏色2與顏色3的銷(xiāo)售量有顯著差異|x2-x4|=|29.5-31.4|=1.9<2.096

顏色2與顏色4的銷(xiāo)售量沒(méi)有顯著差異|x3-x4|=|26.4-31.4|=5>2.096

顏色3與顏色4的銷(xiāo)售量有顯著差異10.3雙因素方差分析10.3.1雙因素方差分析及其類(lèi)型分析兩個(gè)因素(因素A和因素B)對(duì)試驗(yàn)結(jié)果的影響同時(shí)對(duì)兩個(gè)因素進(jìn)行檢驗(yàn),分析是一個(gè)因素在起作用,還是兩個(gè)因素都起作用,還是兩個(gè)因素都不起作用如果A和B對(duì)試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷因素A和因素B對(duì)試驗(yàn)指標(biāo)的影響,這時(shí)的雙因素方差分析稱為無(wú)交互作用的雙因素方差分析如果除了A和B對(duì)試驗(yàn)結(jié)果的單獨(dú)影響外,因素A和因素B的搭配還會(huì)對(duì)銷(xiāo)售量產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析

對(duì)于無(wú)交互作用的雙因素方差分析,其結(jié)果與對(duì)每個(gè)因素分別進(jìn)行單因素方差分析的結(jié)果相同10.3.2無(wú)交互作用的雙因素方差分析因素A(i)因素(B)j平均值

B1B2…BrA1A2::Ak

x11x12…x1kx21x22…x2k::::::::xr1

xr2…

xrk

::平均值…雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)

是因素A的第i個(gè)水平下各觀察值的平均值是因素B的第j個(gè)水平下的各觀察值的均值是全部kr個(gè)樣本數(shù)據(jù)的總平均值2.分析步驟(1)提出假設(shè)對(duì)因素A提出的假設(shè)為H0:μ1=μ2=…=μi=…=μkμi為第i個(gè)水平的均值)

H1:μi

(i=1,2,…,k)不全相等對(duì)因素B提出的假設(shè)為H0:μ1=μ2=…=μj=…=μr(μj為第j個(gè)水平的均值)

H1:μj

(j=1,2,…,r)不全相等(2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量為檢驗(yàn)H0是否成立,需確定檢驗(yàn)的統(tǒng)計(jì)量

構(gòu)造統(tǒng)計(jì)量需要計(jì)算總離差平方和水平項(xiàng)平方和誤差項(xiàng)平方和均方

構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總離差平方和

SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算SSR、SSC和SSE)因素A的離差平方和SSR因素B的離差平方和SSC誤差項(xiàng)平方和SSE構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(各平方和的關(guān)系)總離差平方和(SST)、水平項(xiàng)離差平方和(SSR和SSC)、誤差項(xiàng)離差平方和(SSE)之間的關(guān)系SST=SSR+SSC+SSE

構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方

MS)各離差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)離差平方和大小的影響,需要將其平均,這就是均方,也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個(gè)平方和的自由度分別是總離差平方和SST的自由度為kr-1因素A的離差平方和SSA的自由度為k-1因素B的離差平方和SSB的自由度為r-1隨機(jī)誤差平方和SSE的自由度為(k-1)×(r-1)

構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)因素A的均方,記為MSR,計(jì)算公式為因素B的均方,記為MSC

,計(jì)算公式為隨機(jī)誤差項(xiàng)的均方,記為MSE

,計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

F)為檢驗(yàn)因素A的影響是否顯著,采用下面的統(tǒng)計(jì)量為檢驗(yàn)因素B的影響是否顯著,采用下面的統(tǒng)計(jì)量(3)統(tǒng)計(jì)決策根據(jù)給定的顯著性水平α和兩個(gè)自由度,查表得到臨界值Fα如果,則拒絕H0:μ1=μ2=…=μi=…=μkμi為第i個(gè)水平的均值),即行因素對(duì)觀測(cè)值有顯著影響如果

,則拒絕H0:μ1=μ2=…=μj=…=μrμj為第i個(gè)水平的均值),即列因素對(duì)觀測(cè)值有顯著影響雙因素方差分析表

(基本結(jié)構(gòu))方差來(lái)源平方和SS自由度df均方MSF值

因素A

因素B誤差總和SSRSSCSSESSTk-1r-1(k-1)(r-1)kr-1MSRMSCMSEFRFC雙因素方差分析

(一個(gè)例子)不同品牌的彩電在各地區(qū)的銷(xiāo)售量數(shù)據(jù)品牌(因素A)銷(xiāo)售地區(qū)(因素B)B1B2B3B4B5A1A2A3A4365345358288350368323280343363353298340330343260323333308298【例】有四個(gè)品牌的彩電在五個(gè)地區(qū)銷(xiāo)售,為分析彩電的品牌(因素A)和銷(xiāo)售地區(qū)(因素B)對(duì)銷(xiāo)售量是否有影響,對(duì)每個(gè)品牌在各地區(qū)的銷(xiāo)售量取得以下數(shù)據(jù),見(jiàn)下表。試分析品牌和銷(xiāo)售地區(qū)對(duì)彩電的銷(xiāo)售量是否有顯著影響?雙因素方差分析

(提出假設(shè))對(duì)因素A提出的假設(shè)為H0:m1=m2=m3=m4

(品牌對(duì)銷(xiāo)售量沒(méi)有影響)H1:mi

(i=1,2,…,4)

不全相等

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論