概率論-方差分析_第1頁
概率論-方差分析_第2頁
概率論-方差分析_第3頁
概率論-方差分析_第4頁
概率論-方差分析_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第五章方差分析ANOVA(analysis

of

variance)第一節(jié)

方差分析的基本原理

?

方差分析的基本特點是:將所有處理的觀察值和平均數(shù)作

為一個整體加以考慮,把觀察值總變異的自由度和平方和

分解為不同變異來源的自由度和平方和,進而獲得不同變

異來源的總體方差估計值。

通過計算這些總體方差的估計值的適當比值,就能檢驗各樣本所屬總體平均數(shù)是否相等。?

方差分析實質(zhì)上是關(guān)于觀測值變異原因的數(shù)量分析,它在

科學研究中應用十分廣泛。第一節(jié)

方差分析的基本原理方差分析的優(yōu)點:不受比較組數(shù)的限制,可比較多組均數(shù)可同時分析多個因素的作用可分析因素間的交互作用第一節(jié)

方差分析的基本原理相關(guān)術(shù)語:試驗指標(experimental

index):

為衡量試驗結(jié)果的好壞或處理效應的高低,在試驗中具體測定的性狀或觀測的項目稱為試驗指標。由于試驗目的不同,選擇的試驗指標也不相同。試驗因素(experimental

factor)

試驗中所研究的影響試驗指標的因素叫試驗因素。當試驗中考察的因素只有一個時,稱為單因素試驗;若同時研究兩個或兩個以上的因素對試驗指標的影響時,則稱為兩因素或多因素試驗。第一節(jié)

方差分析的基本原理因素水平(level

of

factor)

試驗因素所處的某種特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平。試驗處理(treatment)

事先設計好的實施在試驗單位上的具體項目叫試驗處理。在單因素試驗中,實施在試驗單位上的具體項目就是試驗因素的某一水平。在多因素試驗中,實施在試驗單位上的具體項目是各因素的某一水平組合。試驗單位(experimental

unit)

在試驗中能接受不同試驗處理的獨立的試驗載體叫試驗單位。重復(repetition)

在試驗中,將一個處理實施在兩個或兩個以上的試驗單位上,稱為處理有重復。

第一節(jié)

方差分析的基本原理試驗效應(experiment

effect)

:試驗因素對試驗指標所起

的增加和減少的作用。簡單效應(simple

effect)

:同一因素內(nèi)兩種水平間試驗指

標的差數(shù)。主要效應(main

effect)

:一個因素內(nèi)各簡單效應的平均數(shù),

又稱平均效應,簡稱主效。交互作用

(interaction

effect)

兩個因素簡單效應間的

平均差異稱為交互作用效應,簡稱互作。它反映一個因素

的各個水平在另一因素的不同水平中反應不一致的現(xiàn)象。第一節(jié)

方差分析的基本原理

2×2試驗數(shù)據(jù)表(解釋各種效應)試驗因素NIP水平

P1N110N216平均

13N2-N1

6P21824216平均14206IIPP2-P1

水平

P1

8N110

8N216

8平均

130,0/2=0

N2-N1

6P218282110平均14228IIIPP2-P1

水平

P1

8N11012N216

10平均

134,4/2=2

N2-N1

6P21820192平均14184P2-P1846-4,-4/2=-2第一節(jié)

方差分析的基本原理

自由度和平方和的分解:

[例5.1]以A、B、C、D4種藥劑處理水稻種子,其中A為對照,每處理各得4個苗高觀察值(cm),試分解其自由度和平方和。藥劑苗高觀察值總和Ti平均數(shù)ABCD18201028212415272026172913221432

72

92

5611618231429T=336=21=

182

+

212

++

322

?

=

602第一節(jié)

方差分析的基本原理

自由度和平方和的分解:

1、總變異把表中的全部觀察值作為一個組看待[即把4個處理(4組、每組有4個觀察值)合并成一組,共有24個觀察值],根據(jù)前面講過的計算平方和的公式

,可以計算出總變異的平方和和自由度SST

=(y

i

?

y)2

=y2

?3362

4×4(∑

y)2

nk∑∑自由度DFT=nk-1=4×4-1=15。∑∑第一節(jié)

方差分析的基本原理

自由度和平方和的分解:

2、誤差效應

?

表中處理內(nèi)(組內(nèi))各觀察值之間,若不存在誤差,則各觀察值應該相等,由于誤差是客觀存在的,因而處理內(nèi)(組內(nèi))各觀察值之間必然是有差異的,因此,可以用組內(nèi)(處理內(nèi))的差異度量誤差效應:k

n1

1SSe

=(yij

?

yi)2

=

38+

20+

26+14

=

98

每個組內(nèi)(處理內(nèi))的自由度為:n

-1=4-1=3所以誤差的自由度為:DFe=k(n-1)=4(4-1)=12∑

?C,Ti2=

n∑(ySSt

i

?

y)

=2k1

nDFt

=

(k

?1)本例中平方和:

602=504+98自由度:15=3+12因此誤差平方和可以采用簡單的辦法計算SSe=SST-SSt=602-504=98。第一節(jié)

方差分析的基本原理

自由度和平方和的分解:

3、處理效應

?

如果沒有處理效應,表中各個處理(組)平均數(shù)

yi

從理論上

講均應該相等,

因此可以用

y

來度量處理效應。s168.00=

=

20.56s8.17第一節(jié)

方差分析的基本原理

F

分布與F

檢驗

?

在一個平均數(shù)為μ、方差為σ2的正態(tài)總體中隨機抽取兩

個獨立樣本,將其均方的比值定義為F.

21

212)F(df1,df=1.0f(F)0.80.20.40.60.0F

分布?

F

分布是具平均數(shù)

μF=1和取值區(qū)間

為[0,

∞]的一組曲

線;而某一特定

曲線的形狀僅決

定于參數(shù)df1和df2。01234Fdf=2,df=5df=8,df=20df=4,df=10和s

彼此獨立。F

檢驗

?

在方差分析的體系中,F(xiàn)

檢驗可用于檢測某項變異因素

的效應或方差是否存在。所以在計算F值時,總是將要檢

驗的那一項變異因素的均方作分子,而以另一項變異(如

誤差項)作分母。

?

F

檢驗需具備的條件:

–(1)變量x遵循N(μ,σ2);–(2)s1

222查表在df1=3,df2=12時實得F=20.56>

F0.01F0.05=3.49,

F0.01=5.95

P<0.01多重比較(multiple

comparisons)?

通過平方和與自由度分解,將所估計的處理均方與誤差均

方作比較,由F檢驗推論處理間有顯著差異。但我們并不清楚那些處理間存在差異,故需要進一步做處理平均數(shù)間的比較。?

一個試驗中k個處理平均數(shù)間可能有k(k-1)/2個比較,因而這種比較是復式比較亦稱為多重比較。多重比較有多種方法,常用的有三種:最小顯著差數(shù)法(LSD法)、復極差法(q法)和Duncan氏新復極差法(SSR法)。sxi

j

x

=2se多重比較(multiple

comparisons)

?

最小顯著差數(shù)法(least

significant

difference,簡稱

LSD法),LSD法實質(zhì)上是t檢驗。其程序是:在處理間的

F檢驗為顯著的前提下,計算出顯著水平為α的最小顯著差

數(shù)

LSDα;任何兩個平均數(shù)的差數(shù)如其絕對值≥

LSDα,即

為在α水平上顯著;反之則為不顯著。2jn?LSDα

=

tαsxi

?x多重比較(multiple

comparisons)?

LSD法的t檢驗是根據(jù)兩個樣本平均數(shù)差數(shù)(k=2)的抽樣

分布提出來的,但是一組處理(k>2)是同時抽取k個樣本

的結(jié)果。抽樣理論提出k=2時與k>2時,例如k=10時其隨

機極差是不同的,隨著k的增大而增大,因而用k=2時的t

檢驗有可能夸大k=10時最大與最小兩個樣本平均數(shù)差數(shù)的

顯著性?;跇O差的抽樣分布理論,Student-Newman-

Keul提出了q檢驗或稱復極差檢驗,有時又稱SNK檢驗或

NK檢驗。se

2n多重比較(multiple

comparisons)

?

q檢驗方法是將一組k個平均數(shù)由大到小排列后,根據(jù)所比

較的兩個處理平均數(shù)的差數(shù)是幾個平均數(shù)間的極差分別確

定最小顯著極差LSRα的。q檢驗因是根據(jù)極差抽樣分布原

理,其各個比較都可保證同一個α水平。其尺度構(gòu)成為:

LSRα

=

qα,df

,Msxsx

=sxse

2不同藥劑處理水稻苗高(q法)LSRα值P234q

0.05

3.08

3.77

4.20q

0.01

4.32

5.04

5.50LSR0.05

4.40

5.39

6.01LSR0.01

6.18

7.21

7.87處理苗高平均數(shù)

差異顯著性0.05

0.01abDBAC29231814c

cAAB

BC

C不同藥劑處理水稻苗高平均數(shù)比較(q法)例5.1中==

n8.17/

4

1.43多重比較(multiple

comparisons)?

q法不同秩次距M下的最小顯著極差變幅大,雖然減小了犯α錯誤的概率,但同時增加了犯β錯誤的概率。為此,D.B.Duncan(1955)提出了新復極差法,又稱最短顯著極差法(shortest

significant

ranges

SSR)。該法與q法相似,其區(qū)別在于計算最小顯著極差時不是查q表而是查SSR表,所得最小顯著極差值隨著k增大通常比q檢驗時減小。LSRα

=

SSRα,df

,Msx多重比較(multiple

comparisons)?

多重比較方法的選擇1、試驗事先確定比較的標準,凡是與對照相比較,

或與預定要比較的對象比較,一般可選用最小顯

著差數(shù)法;2、根據(jù)否定一個正確的

H0

和接受一個不正確的

H0

的相對重要性來決定。?

三種方法的顯著尺度不同,LSD法最低,SSR法次之,q

法最高。故LSD檢驗犯α錯誤的概率最大,q法最小,SSR法介于兩者之間,因此,對于試驗結(jié)論事關(guān)重大或有嚴格要求的,宜用q法;一般試驗可用SSR法。方差分析的線性數(shù)學模型?

方差分析是建立在一定的線性可加模型的基礎上的。所謂線性可加模型是指總體每一個變量可按其變異

的原因分解成若干個線性組成部分,它是方差分析的基礎。數(shù)據(jù)的線性模型可表示為:?

式中,μ為總體平均數(shù),τi為試驗處理效應,εij為隨機誤差具有N(0,σ2)。xij

=

μ

i

+εij方差分析的線性數(shù)學模型?

在以樣本符號表示時,樣本的線性組成為:xij

=

x

+

ti

+

eij?

式中,x

是μ的無偏估計值,

ti

=

(xi

?

x)

→τ

i

+

eieij

=

(xij

?

xi)

εij方差分析的線性數(shù)學模型在線性可加模型中,由于對τi有不同解釋產(chǎn)生了固定模型和隨機模型。一、固定模型(fixed

model)指試驗的各處理都抽自特定的處理總體,其處理效應τi=(μi-μ

)是一個固定的常量,我們的目的就在于研究τi,所測驗的假設是H0:τi=0或H0:μi=

μ。①因素的水平確定后,因素的效應即被確定。②因素的

a個水平是人為特意選擇的。③方差分析所得結(jié)論只適用于所選定的a個水平。指試驗中的各處理皆是抽自N(0,

)的一組隨機樣

τ

σ方差分析的線性數(shù)學模型二、隨機模型(random

model)本,因而處理效應τi是隨機的,它會因試驗的不同而不同;故我們的目的不在于研究τi而在于研究τi的變異度。隨機模型在遺傳、育種和生態(tài)的研究試驗方面有較廣泛的用處。①因素的水平確定之后,其效應并不固定。②因素的

a

個水平是從水平總體中隨機抽取的。③從隨機因素的

a

個水平所得到的結(jié)論,可推廣到該因素的所有水平上。2第二節(jié)

單因素方差分析方差分析的基本步驟現(xiàn)歸納如下:(一)計算各項平方和與自由度。(二)列出方差分析表,進行F檢驗。(三)若F檢驗顯著,則進行多重比較。處理

第二節(jié)

單因素方差分析根據(jù)各處理內(nèi)重復數(shù)是否相等,單因素方差分析又分為重

復數(shù)相等和重復數(shù)不等兩種情況。當重復數(shù)不等時,各項平

方和與自由度的計算,多重比較中標準誤的計算略有不同。[例5.2見教材P100例6.3]小麥種子切胚乳試驗的方差分析

小麥切胚乳試驗單株粒重(g)表

株號合計平均數(shù)12345678910Ⅰ212924222530272620425.5Ⅱ2025252329312426202124424.4Ⅲ24222825212614624.3sxse

2第二節(jié)

單因素方差分析

小麥切胚乳試驗方差分析表dfSum

SqMean

SqF

valuePr(>F)0.31760.7314groupResiduals2216.767223.7333.38310.654Total23230.510.654

8

#The

result

of

R

computing.?

如果F檢驗顯著,則需多重比較,計算n0

24×2==

n0≈1.16光照(A)

5h/d

10h/d

15h/d

25℃143,138,

120,107

96,103,

78,91

79,83,

96,98

溫度(B)

30℃101,100,

80,83

79,61,

83,59

60,71,

78,64

35℃

89,93,101,76

80,76,

61,67

67,58,

71,83

第三節(jié)

二因素方差分析具有重復觀察值的二因素方差分析

[例5.3見教材P106例6.5]

不同溫度及光照條件下某種昆蟲滯育天數(shù)(天)表

第三節(jié)

二因素方差分析具有重復觀察值的二因素方差分析

某種昆蟲滯育天數(shù)方差分析表dfSum

SqMean

SqF

valuePr(>F)Group

AGroup

B

A×B2245367.15391.1

464.92683.52695.5

116.221.934522.0326

0.95012.199e-06

***2.119e-06

***

0.4505Residuals

273303.2122.3Total3514526.3#The

result

of

R

computing.∑TsABsAB∑TsABsABsssAB第三節(jié)

二因素方差分析

二因素方差分析表變異來源dfSS固定模型

F隨機模型

F混合模型(A隨

機、B固定)F

A因素B因素a-1b-1A×B互作(a-1)(b-1)試驗誤差ab(n-1)總變異abn-12SST=?C∑

xSSASSe

=

SST

?

SSA

?

SSB

?

SSABSSB

2i?

2?

j==/bn?C/an?C2SS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論