精品課件《方差分析》_第1頁
精品課件《方差分析》_第2頁
精品課件《方差分析》_第3頁
精品課件《方差分析》_第4頁
精品課件《方差分析》_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章

方差分析

§8.1

方差分析§8.2

多重比較§8.3

方差齊性分析

§8.1

方差分析8.1.1

問題的提出

實(shí)際工作中我們經(jīng)常碰到多個(gè)正態(tài)總體均值的比較問題,處理這類問題通常采用所謂的方差分析方法。

方差分析是統(tǒng)計(jì)檢驗(yàn)的一種。由英國著名統(tǒng)計(jì)學(xué)家:

R.A.FISHER推導(dǎo)出來的,也叫F檢驗(yàn)。

方差分析簡(jiǎn)述方差分析主要用來檢驗(yàn)兩個(gè)以上總體均值差異的顯著程度。對(duì)于比較不同生產(chǎn)工藝或設(shè)備條件下產(chǎn)量、質(zhì)量的差異,分析不同計(jì)劃方案效果的好壞和比較不同地區(qū)、不同人員有關(guān)的數(shù)量指標(biāo)差異是否顯著時(shí),方差分析是非常有用的。本章在討論方差分析基本原理的基礎(chǔ)上,重點(diǎn)介紹單因子試驗(yàn)方差分析法、多重比較及方差齊性檢驗(yàn)。在此之前,先介紹幾個(gè)常用術(shù)語。1、試驗(yàn)指標(biāo)(experimentalindex):

為了衡量試驗(yàn)結(jié)果的好壞或處理效應(yīng)的高低,在試驗(yàn)中具體測(cè)定的性狀或觀測(cè)的項(xiàng)目稱為試驗(yàn)指標(biāo)。由于試驗(yàn)?zāi)康牟煌x擇的試驗(yàn)指標(biāo)也不相同。在畜禽、水產(chǎn)試驗(yàn)中常用的試驗(yàn)指標(biāo)有:日增重、產(chǎn)奶量、產(chǎn)蛋率、瘦肉率等。在農(nóng)業(yè)試驗(yàn)中常用的試驗(yàn)指標(biāo)是產(chǎn)量等2、試驗(yàn)因子(experimentalfactor):試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素叫試驗(yàn)因子。如研究如何提高豬的日增重時(shí),飼料的配方、豬的品種、飼養(yǎng)方式、環(huán)境溫濕度等都對(duì)日增重有影響,均可作為試驗(yàn)因子來考慮。又如在農(nóng)業(yè)試驗(yàn)中,作物的品種,化肥的品種,土地肥沃程度的等級(jí)都對(duì)作物的產(chǎn)量有影響,可作為試驗(yàn)中感興趣的因子。當(dāng)試驗(yàn)中考察的因子只有一個(gè)時(shí),稱為單因子試驗(yàn);若同時(shí)研究?jī)蓚€(gè)或兩個(gè)以上因子對(duì)試驗(yàn)指標(biāo)的影響時(shí),則稱為兩因子或多因子試驗(yàn)。試驗(yàn)因子常用大寫字母A、B、C、…等表示。3、因子水平(leveloffactor)

試驗(yàn)因子所處的某種特定狀態(tài)或數(shù)量等級(jí)稱為因素水平,簡(jiǎn)稱水平。如比較3個(gè)品種奶牛產(chǎn)奶量的高低,這3個(gè)品種就是奶牛品種這個(gè)試驗(yàn)因子的3個(gè)水平;研究某種飼料中4種不同能量水平對(duì)肥豬瘦肉率的影響,這4種特定的能量水平就是飼料能量這一試驗(yàn)因子的4個(gè)水平。因子水平用代表該因子的字母加添足標(biāo)1,2,…,來表示。如A1、A2、…,B1、B2、…,等。例8.1.1

某大型集團(tuán)公司的銷售主管想比較五種不同的推銷方法有無顯著的效果差異。在條件基本相同且無銷售經(jīng)驗(yàn)的人員中選取若干名,分成五組分別進(jìn)行不同銷售方法的培訓(xùn)。培訓(xùn)后觀察他們?cè)谝粋€(gè)月內(nèi)的銷售額列于下表:方法方法1方法2方法3方法4方法5銷售額20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2

在例8.1.1中的試驗(yàn)指標(biāo)為銷售額,銷售方法為因子,5種不同的方法代表5種不同的水平。這是一項(xiàng)單因子試驗(yàn),試驗(yàn)的目的是了解不同銷售方法水平對(duì)銷售額有無顯著影響。

通常,在單因子試驗(yàn)中,記因子為A,設(shè)其有r個(gè)水平,記為A1,A2,…,Ar.在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體.8.1.2單因子方差分析的統(tǒng)計(jì)模型假定:每一總體均為正態(tài)總體,記為N(i

,

i2),

i=1,2,…,r;各總體的方差相同:1

2=22=…=

r2=

2

;從每一總體中抽取的樣本是相互獨(dú)立的,即所有的試驗(yàn)結(jié)果yij

都相互獨(dú)立。

比較各水平下的均值是否相同,即對(duì)如下的一個(gè)假設(shè)進(jìn)行檢驗(yàn):H0

:1=2=…=r

(8.1.1)

備擇假設(shè)為H1

:1,2,…,r

不全相等在不會(huì)引起誤解的情況下,H1通??墒÷圆粚?。如果H0成立,因子A的r個(gè)水平均值相同,稱因子A的r個(gè)水平間沒有顯著差異,簡(jiǎn)稱因子A不顯著;反之,當(dāng)H0不成立時(shí),因子A的r個(gè)水平均值不全相同,這時(shí)稱因子A的不同水平間有顯著差異,簡(jiǎn)稱因子A顯著。

設(shè)從第i個(gè)水平下的總體獲得m個(gè)試驗(yàn)結(jié)果,記yij

表示第i個(gè)總體的第j次重復(fù)試驗(yàn)結(jié)果。共得如下n=rm個(gè)試驗(yàn)結(jié)果:yij,

i=1,2,…,r,j=1,2,…,m,

其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號(hào),j為重復(fù)編號(hào)。在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值i一般總是有差距的,記ij

=yiji,ij

稱為隨機(jī)誤差。于是有

yij

=

i+ij

(8.1.2)(8.1.2)式稱為試驗(yàn)結(jié)果yij

的數(shù)據(jù)結(jié)構(gòu)式。

單因子方差分析的統(tǒng)計(jì)模型:(8.1.3)

總均值與效應(yīng):

稱諸i的平均為總均值.

稱第i水平下的均值i與總均值

的差:

ai=i-為Ai的效應(yīng)。

模型(8.1.3)可以改寫為

(8.1.8)

假設(shè)(8.1.1)可改寫為

H0

:a1

=a2=…=ar=0(8.1.9)

一、試驗(yàn)數(shù)據(jù)表

表8.1.2

單因子方差分析試驗(yàn)數(shù)據(jù)

因子水平

試驗(yàn)數(shù)據(jù)

平均

A1y11

y12

y1mT1A2y21

y22

y2mT2┆┆┆┆Aryr1

yr2

yrmTrT8.1.3平方和分解

表8.1.2中的最后二列的和與平均的含義如下:

數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij

表示,它可分解為二個(gè)偏差之和(8.1.10)記二、組內(nèi)偏差與組間偏差

由于(8.1.11)所以

僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差,稱為組內(nèi)偏差;而(8.1.12)除了反映隨機(jī)誤差外,還反映了第i個(gè)水平的效應(yīng),稱為組間偏差。在統(tǒng)計(jì)學(xué)中,把k個(gè)數(shù)據(jù)y1,y2,…,yk分別對(duì)其均值=(y1+…+yk

)/k的偏差平方和稱為k個(gè)數(shù)據(jù)的偏差平方和,它常用來度量若干個(gè)數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在構(gòu)成偏差平方和Q的k個(gè)偏差y1

,…,yk

間有一個(gè)恒等式,這說明在Q中獨(dú)立的偏差只有k1個(gè)。在統(tǒng)計(jì)學(xué)中把平方和中獨(dú)立偏差個(gè)數(shù)稱為該平方和的自由度,常記為f,如Q的自由度為fQ=k1。自由度是偏差平方和的一個(gè)重要參數(shù)。

各yij間總的差異大小可用總偏差平方和

表示,其自由度為fT=n1;

四、總平方和分解公式

僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用

組內(nèi)偏差平方和

表示,也稱為誤差偏差平方和,其自由度為fe=nr;由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和

表示,也稱為因子A的偏差平方和,其自由度為fA=r1;

定理8.1.1

在上述符號(hào)下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,其自由度也有相應(yīng)分解公式,具體為:

ST=SA+Se,fT=fA+fe

(8.1.16)(8.1.16)式通常稱為總平方和分解式。

偏差平方和Q的大小與自由度有關(guān).為了便于在偏差平方和間進(jìn)行比較,統(tǒng)計(jì)上引入了均方和的概念,它定義為MS=Q/fQ

,其意為平均每個(gè)自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對(duì)因子平方和SA與誤差平方和Se之間進(jìn)行比較,用其均方和MSA=SA

/fA

,MSe=Se

/fe

進(jìn)行比較,故用作為檢驗(yàn)H0的統(tǒng)計(jì)量。8.1.4檢驗(yàn)方法定理8.1.2

在單因子方差分析模型(8.1.8)及前述符號(hào)下,有

(1)Se/

2~

2(nr),從而E(Se)

=(nr)

2

,進(jìn)一步,若H0成立,則有SA/

2~

2(r1)(2)SA與Se獨(dú)立。

由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計(jì)量F服從自由度為fA和fe的F分布,因此拒絕域?yàn)閃={FF1(fA

,fe)},通常將上述計(jì)算過程列成一張表格,稱為方差分析表。表8.1.3單因子方差分析表來源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1對(duì)給定的,可作如下判斷:

若F

F1(fA

,fe)

,則說明因子A不顯著。該檢驗(yàn)的p值也可利用統(tǒng)計(jì)軟件求出,若以Y記服從F(fA

,fe)的隨機(jī)變量,則檢驗(yàn)的

p值為p=P(YF)。

如果F>F1(fA

,fe),則認(rèn)為因子A顯著;常用的各偏差平方和的計(jì)算公式如下:

(8.1.19)

一般可將計(jì)算過程列表進(jìn)行。

例8.1.1(續(xù))對(duì)例8.1.1中的假設(shè)進(jìn)行檢驗(yàn)方法方法1方法2方法3方法4方法5合計(jì)銷售額20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2Ti149172.1143.9127.6193.3T=785.9Ti2/m3171.574231.202958.172325.975337.8418024.75平方和

3243.304325.253030.992334.445365.9918295.74

算得各偏差平方和為:n=35,T2/n=17646.82,ST=18295.74-17646.82=648.92,SA=377.93,SE=ST

–SA=270.99,可列出如下方差分析表返回對(duì)于給定的顯著性水平α=0.05,由于F=10.46>F1-α(t-1,n-t)=F0.95(4,30)=2.69,拒絕H0,即不同的銷售方法對(duì)銷售額由顯著的影響。方差來源平方和自由度均方F比銷售方法377.93494.4810.46誤差270.99309.03總和648.9334單因素方差分析表例8.1.2

在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉為主的飼料,A2是以槐樹粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選24只相似的雛雞隨機(jī)均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗(yàn)結(jié)果如下表所示:

表8.1.2

雞飼料試驗(yàn)數(shù)據(jù)

飼料A雞重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048

解:

這是一個(gè)單因子方差分析問題.,將原始數(shù)據(jù)減去1000,列表給出計(jì)算過程:

表8.1.4例8.1.2的計(jì)算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363

利用(8.1.19),可算得各偏差平方和為:把上述諸平方和及其自由度填入方差分析表表8.1.5例8.1.2的方差分析表

來源平方和自由度均方和F比因子9660.083324830.04173.5948

誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95

(2

,21)=3.47

,由于F=3.5948>3.47,故認(rèn)為因子A(飼料)是顯著的,即三種飼料對(duì)雞的增肥作用有明顯的差別。

8.1.5參數(shù)估計(jì)

在檢驗(yàn)結(jié)果為顯著時(shí),我們可進(jìn)一步求出總均值

、各主效應(yīng)ai和誤差方差2的估計(jì)。

一、點(diǎn)估計(jì)由模型(8.1.8)知諸yij相互獨(dú)立,且yij~N(+ai

,2)

,因此,可使用極大似然方法求出一般平均

、各主效應(yīng)ai和誤差方差2的估計(jì):由極大似然估計(jì)的不變性,各水平均值i的極大似然估計(jì)為,由于不是2的無偏估計(jì),可修偏:

由于,可給出Ai的水平均值i的1-的置信區(qū)間為

其中。

二、置信區(qū)間例8.1.3

繼續(xù)例8.1.2,此處我們給出諸水平均值的估計(jì)。因子A的三個(gè)水平均值的估計(jì)分別為從點(diǎn)估計(jì)來看,水平2(以槐樹粉為主的飼料)是最優(yōu)的。

誤差方差的無偏估計(jì)為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處,,若?。?.05

,則t1-/2(fe

)=t0.95(21

)=2.0796,,于是三個(gè)水平均值的0.95置信區(qū)間分別為

在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個(gè)結(jié)果:

因子是否顯著;

試驗(yàn)的誤差方差2的估計(jì);

諸水平均值i的點(diǎn)估計(jì)與區(qū)間估計(jì)。

在因子A顯著時(shí),通常只需對(duì)較優(yōu)的水平均值作參數(shù)估計(jì),在因子A不顯著場(chǎng)合,參數(shù)估計(jì)無需進(jìn)行。8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個(gè)水平下重復(fù)試驗(yàn)次數(shù)全相等,在重復(fù)數(shù)不等場(chǎng)合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。

數(shù)據(jù):設(shè)從第i個(gè)水平下的總體獲得mi個(gè)試驗(yàn)結(jié)果,記為yi1

,yi2…,yim

,i=1,2,…r,統(tǒng)計(jì)模型為:

(8.1.24)

總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均)(8.1.25)稱為總均值或一般平均。

效應(yīng)約束條件:

各平方和的計(jì)算:SA的計(jì)算公式略有不同

例8.1.4

某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個(gè)地段繁華程度相似、規(guī)模相近的商店做試驗(yàn),其中二種包裝各指定兩個(gè)商店銷售,另二個(gè)包裝各指定三個(gè)商店銷售。在試驗(yàn)期內(nèi)各店貨架排放的位置、空間都相同,營業(yè)員的促銷方法也基本相同,經(jīng)過一段時(shí)間,記錄其銷售量數(shù)據(jù),列于表8.1.6左半邊,其相應(yīng)的計(jì)算結(jié)果列于右側(cè)。

表8.1.6銷售量數(shù)據(jù)及計(jì)算表

包裝類型

銷售量

miTiTi2/miA11218230450468A2141213339507509A319172135710831091A4243025414581476和n=10T=180由此可求得各類偏差平方和如下

方差分析表如表8.1.8所示

.若?。?.01,查表得F0.01(3,6)=9.78,由于F=11.22>9.78,故我們可認(rèn)為各水平間有顯著差異。

表8.1.7例8.1.4的方差分析表

來源平方和自由度均方和F比因子A25838611.22誤差e4667.67總和T3049

由于因子顯著,我們還可以給出諸水平均值的估計(jì)。因子A的四個(gè)水平均值的估計(jì)分別為由此可見,第四種包裝方式效果最好。誤差方差的無偏估計(jì)為

進(jìn)一步,利用(8.1.23)也可以給出諸水平均值的置信區(qū)間,只是在這里

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論