




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第八章
方差分析
§8.1
方差分析§8.2
多重比較§8.3
方差齊性分析
§8.1
方差分析8.1.1
問題的提出
實(shí)際工作中我們經(jīng)常碰到多個(gè)正態(tài)總體均值的比較問題,處理這類問題通常采用所謂的方差分析方法。
方差分析是統(tǒng)計(jì)檢驗(yàn)的一種。由英國著名統(tǒng)計(jì)學(xué)家:
R.A.FISHER推導(dǎo)出來的,也叫F檢驗(yàn)。
方差分析簡(jiǎn)述方差分析主要用來檢驗(yàn)兩個(gè)以上總體均值差異的顯著程度。對(duì)于比較不同生產(chǎn)工藝或設(shè)備條件下產(chǎn)量、質(zhì)量的差異,分析不同計(jì)劃方案效果的好壞和比較不同地區(qū)、不同人員有關(guān)的數(shù)量指標(biāo)差異是否顯著時(shí),方差分析是非常有用的。本章在討論方差分析基本原理的基礎(chǔ)上,重點(diǎn)介紹單因子試驗(yàn)方差分析法、多重比較及方差齊性檢驗(yàn)。在此之前,先介紹幾個(gè)常用術(shù)語。1、試驗(yàn)指標(biāo)(experimentalindex):
為了衡量試驗(yàn)結(jié)果的好壞或處理效應(yīng)的高低,在試驗(yàn)中具體測(cè)定的性狀或觀測(cè)的項(xiàng)目稱為試驗(yàn)指標(biāo)。由于試驗(yàn)?zāi)康牟煌x擇的試驗(yàn)指標(biāo)也不相同。在畜禽、水產(chǎn)試驗(yàn)中常用的試驗(yàn)指標(biāo)有:日增重、產(chǎn)奶量、產(chǎn)蛋率、瘦肉率等。在農(nóng)業(yè)試驗(yàn)中常用的試驗(yàn)指標(biāo)是產(chǎn)量等2、試驗(yàn)因子(experimentalfactor):試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素叫試驗(yàn)因子。如研究如何提高豬的日增重時(shí),飼料的配方、豬的品種、飼養(yǎng)方式、環(huán)境溫濕度等都對(duì)日增重有影響,均可作為試驗(yàn)因子來考慮。又如在農(nóng)業(yè)試驗(yàn)中,作物的品種,化肥的品種,土地肥沃程度的等級(jí)都對(duì)作物的產(chǎn)量有影響,可作為試驗(yàn)中感興趣的因子。當(dāng)試驗(yàn)中考察的因子只有一個(gè)時(shí),稱為單因子試驗(yàn);若同時(shí)研究?jī)蓚€(gè)或兩個(gè)以上因子對(duì)試驗(yàn)指標(biāo)的影響時(shí),則稱為兩因子或多因子試驗(yàn)。試驗(yàn)因子常用大寫字母A、B、C、…等表示。3、因子水平(leveloffactor)
試驗(yàn)因子所處的某種特定狀態(tài)或數(shù)量等級(jí)稱為因素水平,簡(jiǎn)稱水平。如比較3個(gè)品種奶牛產(chǎn)奶量的高低,這3個(gè)品種就是奶牛品種這個(gè)試驗(yàn)因子的3個(gè)水平;研究某種飼料中4種不同能量水平對(duì)肥豬瘦肉率的影響,這4種特定的能量水平就是飼料能量這一試驗(yàn)因子的4個(gè)水平。因子水平用代表該因子的字母加添足標(biāo)1,2,…,來表示。如A1、A2、…,B1、B2、…,等。例8.1.1
某大型集團(tuán)公司的銷售主管想比較五種不同的推銷方法有無顯著的效果差異。在條件基本相同且無銷售經(jīng)驗(yàn)的人員中選取若干名,分成五組分別進(jìn)行不同銷售方法的培訓(xùn)。培訓(xùn)后觀察他們?cè)谝粋€(gè)月內(nèi)的銷售額列于下表:方法方法1方法2方法3方法4方法5銷售額20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2
在例8.1.1中的試驗(yàn)指標(biāo)為銷售額,銷售方法為因子,5種不同的方法代表5種不同的水平。這是一項(xiàng)單因子試驗(yàn),試驗(yàn)的目的是了解不同銷售方法水平對(duì)銷售額有無顯著影響。
通常,在單因子試驗(yàn)中,記因子為A,設(shè)其有r個(gè)水平,記為A1,A2,…,Ar.在每一水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有r個(gè)水平,故有r個(gè)總體.8.1.2單因子方差分析的統(tǒng)計(jì)模型假定:每一總體均為正態(tài)總體,記為N(i
,
i2),
i=1,2,…,r;各總體的方差相同:1
2=22=…=
r2=
2
;從每一總體中抽取的樣本是相互獨(dú)立的,即所有的試驗(yàn)結(jié)果yij
都相互獨(dú)立。
比較各水平下的均值是否相同,即對(duì)如下的一個(gè)假設(shè)進(jìn)行檢驗(yàn):H0
:1=2=…=r
(8.1.1)
備擇假設(shè)為H1
:1,2,…,r
不全相等在不會(huì)引起誤解的情況下,H1通??墒÷圆粚?。如果H0成立,因子A的r個(gè)水平均值相同,稱因子A的r個(gè)水平間沒有顯著差異,簡(jiǎn)稱因子A不顯著;反之,當(dāng)H0不成立時(shí),因子A的r個(gè)水平均值不全相同,這時(shí)稱因子A的不同水平間有顯著差異,簡(jiǎn)稱因子A顯著。
設(shè)從第i個(gè)水平下的總體獲得m個(gè)試驗(yàn)結(jié)果,記yij
表示第i個(gè)總體的第j次重復(fù)試驗(yàn)結(jié)果。共得如下n=rm個(gè)試驗(yàn)結(jié)果:yij,
i=1,2,…,r,j=1,2,…,m,
其中r為水平數(shù),m為重復(fù)數(shù),i為水平編號(hào),j為重復(fù)編號(hào)。在水平Ai下的試驗(yàn)結(jié)果yij與該水平下的指標(biāo)均值i一般總是有差距的,記ij
=yiji,ij
稱為隨機(jī)誤差。于是有
yij
=
i+ij
(8.1.2)(8.1.2)式稱為試驗(yàn)結(jié)果yij
的數(shù)據(jù)結(jié)構(gòu)式。
單因子方差分析的統(tǒng)計(jì)模型:(8.1.3)
總均值與效應(yīng):
稱諸i的平均為總均值.
稱第i水平下的均值i與總均值
的差:
ai=i-為Ai的效應(yīng)。
模型(8.1.3)可以改寫為
(8.1.8)
假設(shè)(8.1.1)可改寫為
H0
:a1
=a2=…=ar=0(8.1.9)
一、試驗(yàn)數(shù)據(jù)表
表8.1.2
單因子方差分析試驗(yàn)數(shù)據(jù)
因子水平
試驗(yàn)數(shù)據(jù)
和
平均
A1y11
y12
…
y1mT1A2y21
y22
…
y2mT2┆┆┆┆Aryr1
yr2
…
yrmTrT8.1.3平方和分解
表8.1.2中的最后二列的和與平均的含義如下:
數(shù)據(jù)間是有差異的。數(shù)據(jù)yij與總平均間的偏差可用yij
表示,它可分解為二個(gè)偏差之和(8.1.10)記二、組內(nèi)偏差與組間偏差
由于(8.1.11)所以
僅反映組內(nèi)數(shù)據(jù)與組內(nèi)平均的隨機(jī)誤差,稱為組內(nèi)偏差;而(8.1.12)除了反映隨機(jī)誤差外,還反映了第i個(gè)水平的效應(yīng),稱為組間偏差。在統(tǒng)計(jì)學(xué)中,把k個(gè)數(shù)據(jù)y1,y2,…,yk分別對(duì)其均值=(y1+…+yk
)/k的偏差平方和稱為k個(gè)數(shù)據(jù)的偏差平方和,它常用來度量若干個(gè)數(shù)據(jù)分散的程度。三、偏差平方和及其自由度在構(gòu)成偏差平方和Q的k個(gè)偏差y1
,…,yk
間有一個(gè)恒等式,這說明在Q中獨(dú)立的偏差只有k1個(gè)。在統(tǒng)計(jì)學(xué)中把平方和中獨(dú)立偏差個(gè)數(shù)稱為該平方和的自由度,常記為f,如Q的自由度為fQ=k1。自由度是偏差平方和的一個(gè)重要參數(shù)。
各yij間總的差異大小可用總偏差平方和
表示,其自由度為fT=n1;
四、總平方和分解公式
僅由隨機(jī)誤差引起的數(shù)據(jù)間的差異可以用
組內(nèi)偏差平方和
表示,也稱為誤差偏差平方和,其自由度為fe=nr;由于組間差異除了隨機(jī)誤差外,還反映了效應(yīng)間的差異,故由效應(yīng)不同引起的數(shù)據(jù)差異可用組間偏差平方和
表示,也稱為因子A的偏差平方和,其自由度為fA=r1;
定理8.1.1
在上述符號(hào)下,總平方和ST可以分解為因子平方和SA與誤差平方和Se之和,其自由度也有相應(yīng)分解公式,具體為:
ST=SA+Se,fT=fA+fe
(8.1.16)(8.1.16)式通常稱為總平方和分解式。
偏差平方和Q的大小與自由度有關(guān).為了便于在偏差平方和間進(jìn)行比較,統(tǒng)計(jì)上引入了均方和的概念,它定義為MS=Q/fQ
,其意為平均每個(gè)自由度上有多少平方和,它比較好地度量了一組數(shù)據(jù)的離散程度。如今要對(duì)因子平方和SA與誤差平方和Se之間進(jìn)行比較,用其均方和MSA=SA
/fA
,MSe=Se
/fe
進(jìn)行比較,故用作為檢驗(yàn)H0的統(tǒng)計(jì)量。8.1.4檢驗(yàn)方法定理8.1.2
在單因子方差分析模型(8.1.8)及前述符號(hào)下,有
(1)Se/
2~
2(nr),從而E(Se)
=(nr)
2
,進(jìn)一步,若H0成立,則有SA/
2~
2(r1)(2)SA與Se獨(dú)立。
由定理8.1.2,若H0成立,則檢驗(yàn)統(tǒng)計(jì)量F服從自由度為fA和fe的F分布,因此拒絕域?yàn)閃={FF1(fA
,fe)},通常將上述計(jì)算過程列成一張表格,稱為方差分析表。表8.1.3單因子方差分析表來源平方和自由度均方和F比因子SAfA=r1MSA=SA/fAF=MSA/MSe誤差Sefe=nrMSe=Se/fe總和STfT=n1對(duì)給定的,可作如下判斷:
若F
F1(fA
,fe)
,則說明因子A不顯著。該檢驗(yàn)的p值也可利用統(tǒng)計(jì)軟件求出,若以Y記服從F(fA
,fe)的隨機(jī)變量,則檢驗(yàn)的
p值為p=P(YF)。
如果F>F1(fA
,fe),則認(rèn)為因子A顯著;常用的各偏差平方和的計(jì)算公式如下:
(8.1.19)
一般可將計(jì)算過程列表進(jìn)行。
例8.1.1(續(xù))對(duì)例8.1.1中的假設(shè)進(jìn)行檢驗(yàn)方法方法1方法2方法3方法4方法5合計(jì)銷售額20.024.916.017.525.216.821.320.118.226.617.922.617.320.226.921.230.220.917.729.323.929.922.019.130.426.822.526.818.429.722.420.720.816.525.2Ti149172.1143.9127.6193.3T=785.9Ti2/m3171.574231.202958.172325.975337.8418024.75平方和
3243.304325.253030.992334.445365.9918295.74
算得各偏差平方和為:n=35,T2/n=17646.82,ST=18295.74-17646.82=648.92,SA=377.93,SE=ST
–SA=270.99,可列出如下方差分析表返回對(duì)于給定的顯著性水平α=0.05,由于F=10.46>F1-α(t-1,n-t)=F0.95(4,30)=2.69,拒絕H0,即不同的銷售方法對(duì)銷售額由顯著的影響。方差來源平方和自由度均方F比銷售方法377.93494.4810.46誤差270.99309.03總和648.9334單因素方差分析表例8.1.2
在飼料養(yǎng)雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉為主的飼料,A2是以槐樹粉為主的飼料,A3是以苜蓿粉為主的飼料。為比較三種飼料的效果,特選24只相似的雛雞隨機(jī)均分為三組,每組各喂一種飼料,60天后觀察它們的重量。試驗(yàn)結(jié)果如下表所示:
表8.1.2
雞飼料試驗(yàn)數(shù)據(jù)
飼料A雞重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048
解:
這是一個(gè)單因子方差分析問題.,將原始數(shù)據(jù)減去1000,列表給出計(jì)算過程:
表8.1.4例8.1.2的計(jì)算表水平數(shù)據(jù)(原始數(shù)據(jù)-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A3932980212232294835412531620984113350517791363
利用(8.1.19),可算得各偏差平方和為:把上述諸平方和及其自由度填入方差分析表表8.1.5例8.1.2的方差分析表
來源平方和自由度均方和F比因子9660.083324830.04173.5948
誤差28215.9584211343.6171總和37876.041723若取=0.05,則F0.95
(2
,21)=3.47
,由于F=3.5948>3.47,故認(rèn)為因子A(飼料)是顯著的,即三種飼料對(duì)雞的增肥作用有明顯的差別。
8.1.5參數(shù)估計(jì)
在檢驗(yàn)結(jié)果為顯著時(shí),我們可進(jìn)一步求出總均值
、各主效應(yīng)ai和誤差方差2的估計(jì)。
一、點(diǎn)估計(jì)由模型(8.1.8)知諸yij相互獨(dú)立,且yij~N(+ai
,2)
,因此,可使用極大似然方法求出一般平均
、各主效應(yīng)ai和誤差方差2的估計(jì):由極大似然估計(jì)的不變性,各水平均值i的極大似然估計(jì)為,由于不是2的無偏估計(jì),可修偏:
由于,可給出Ai的水平均值i的1-的置信區(qū)間為
其中。
二、置信區(qū)間例8.1.3
繼續(xù)例8.1.2,此處我們給出諸水平均值的估計(jì)。因子A的三個(gè)水平均值的估計(jì)分別為從點(diǎn)估計(jì)來看,水平2(以槐樹粉為主的飼料)是最優(yōu)的。
誤差方差的無偏估計(jì)為利用(8.1.23)可以給出諸水平均值的置信區(qū)間。此處,,若?。?.05
,則t1-/2(fe
)=t0.95(21
)=2.0796,,于是三個(gè)水平均值的0.95置信區(qū)間分別為
在單因子試驗(yàn)的數(shù)據(jù)分析中可得到如下三個(gè)結(jié)果:
因子是否顯著;
試驗(yàn)的誤差方差2的估計(jì);
諸水平均值i的點(diǎn)估計(jì)與區(qū)間估計(jì)。
在因子A顯著時(shí),通常只需對(duì)較優(yōu)的水平均值作參數(shù)估計(jì),在因子A不顯著場(chǎng)合,參數(shù)估計(jì)無需進(jìn)行。8.1.6重復(fù)數(shù)不等情形單因子方差分析并不要求每個(gè)水平下重復(fù)試驗(yàn)次數(shù)全相等,在重復(fù)數(shù)不等場(chǎng)合的方差分析與重復(fù)數(shù)相等情況下的方差分析極為相似,只在幾處略有差別。
數(shù)據(jù):設(shè)從第i個(gè)水平下的總體獲得mi個(gè)試驗(yàn)結(jié)果,記為yi1
,yi2…,yim
,i=1,2,…r,統(tǒng)計(jì)模型為:
(8.1.24)
總均值:諸i的加權(quán)平均(所有試驗(yàn)結(jié)果的均值的平均)(8.1.25)稱為總均值或一般平均。
效應(yīng)約束條件:
各平方和的計(jì)算:SA的計(jì)算公式略有不同
例8.1.4
某食品公司對(duì)一種食品設(shè)計(jì)了四種新包裝。為考察哪種包裝最受顧客歡迎,選了10個(gè)地段繁華程度相似、規(guī)模相近的商店做試驗(yàn),其中二種包裝各指定兩個(gè)商店銷售,另二個(gè)包裝各指定三個(gè)商店銷售。在試驗(yàn)期內(nèi)各店貨架排放的位置、空間都相同,營業(yè)員的促銷方法也基本相同,經(jīng)過一段時(shí)間,記錄其銷售量數(shù)據(jù),列于表8.1.6左半邊,其相應(yīng)的計(jì)算結(jié)果列于右側(cè)。
表8.1.6銷售量數(shù)據(jù)及計(jì)算表
包裝類型
銷售量
miTiTi2/miA11218230450468A2141213339507509A319172135710831091A4243025414581476和n=10T=180由此可求得各類偏差平方和如下
方差分析表如表8.1.8所示
.若?。?.01,查表得F0.01(3,6)=9.78,由于F=11.22>9.78,故我們可認(rèn)為各水平間有顯著差異。
表8.1.7例8.1.4的方差分析表
來源平方和自由度均方和F比因子A25838611.22誤差e4667.67總和T3049
由于因子顯著,我們還可以給出諸水平均值的估計(jì)。因子A的四個(gè)水平均值的估計(jì)分別為由此可見,第四種包裝方式效果最好。誤差方差的無偏估計(jì)為
進(jìn)一步,利用(8.1.23)也可以給出諸水平均值的置信區(qū)間,只是在這里
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 古代表示年齡的詞語從小到大排序
- 公益慈善存在的問題及建議
- 公共直飲水點(diǎn)管理制度
- 公共交通服務(wù)質(zhì)量評(píng)估制度
- 工作票安規(guī)流程
- 工業(yè)產(chǎn)品外觀設(shè)計(jì)的基本原則
- 2025年養(yǎng)老保險(xiǎn)市場(chǎng)分析:參保人數(shù)穩(wěn)步增長(zhǎng) 持續(xù)優(yōu)化服務(wù)保障
- 廣東省茂名市2024-2025學(xué)年高三上學(xué)期第一次綜合測(cè)試數(shù)學(xué)試題(解析版)
- 湛江降水井施工方案
- 寧波耐堿磚施工方案
- 山東省淄博市、濱州市2025屆高三一模語文試題及答案解析
- 2025年阜陽職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試題庫有答案
- 手術(shù)十大安全管理目標(biāo)
- 2025年1月時(shí)事政治考試100題及參考答案
- 實(shí)施“教聯(lián)體”賦能共同體 打造校家社協(xié)同育人新模式
- 六年級(jí)下冊(cè)快樂讀書吧外國名著閱讀練習(xí)《魯濱遜漂流》《湯姆索亞歷險(xiǎn)記》《騎鵝旅行記》答案
- 科技助力野生動(dòng)植物保護(hù)-創(chuàng)新技術(shù)與方法探討
- 2025年黑龍江旅游職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫匯編
- 2025年哈爾濱電力職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫完整版
- 2025年湖南城建職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫新版
- 國家基本藥物臨床應(yīng)用指南
評(píng)論
0/150
提交評(píng)論