WJF生物統(tǒng)計學(xué)課件 第八章模版課件_第1頁
WJF生物統(tǒng)計學(xué)課件 第八章模版課件_第2頁
WJF生物統(tǒng)計學(xué)課件 第八章模版課件_第3頁
WJF生物統(tǒng)計學(xué)課件 第八章模版課件_第4頁
WJF生物統(tǒng)計學(xué)課件 第八章模版課件_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第八章 單因素方差分析 (one-factor analysis of variance)一、一般概念及兩種不同的處理效應(yīng) 方差分析(ANOVA)是一類特定情況下的統(tǒng)計假設(shè)檢驗,或者說是平均數(shù)差異顯著性檢驗的一種引伸。t 檢驗可以判斷兩組數(shù)據(jù)平均數(shù)的差異的顯著性, 而方差分析則可以同時判斷多組數(shù)據(jù)平均數(shù)之間的差異的顯著性。1. 例 2.1調(diào)查了5個不同小麥品系的株高,結(jié)果列于表21。 在這個例子中,只出現(xiàn)“品系”這樣一個因素(factor),故稱單因素。共有5 個不同的品系,我們稱品系這一因素共有5個水平(level)。5個品系可以認為是5個總體,表 24的數(shù)據(jù)是從5個總體中抽出的5個樣本,通

2、過比較這5個樣本,判斷這5個總體是否存在差異。表 21 5個小麥品系株高調(diào)查結(jié)果 株號株 高 1 2 3 4 5 和 64.665.364.866.065.8326.5 64.565.364.663.763.9322.0 76.866.367.166.868.5336.5 71.872.170.069.171.0354.0 69.268.269.868.367.5343.0 平均數(shù)65.364.467.370.868.62. 例 2.2 為了探討不同窩的動物的出生重是否存在差異,隨機選取4窩動物,每窩中均有4只幼仔,結(jié)果如下: 表22 4窩動物的出生重(克) 動物號窩 別1234和34.733

3、.326.231.6125.833.226.028.632.3120.127.123.327.826.7104.932.931.425.7 28.0118.0平均數(shù)31.45030.02526.22529.500 通過對以上數(shù)據(jù)的分析,判斷不同窩別動物出生重是否存在差異。 3. 以上兩個例子的共同點是:每個實驗都只有一個因素,該因素有a個水平或稱為有a個處理(treatment),這樣的實驗稱為單因素實驗。 從單因素實驗的每一處理所得到的結(jié)果都是一隨機變量X i。對于a個處理,各重復(fù)n次(或者說做n次觀察)的單因素方差分析的一般化表示方法見表23 。表 23單因素方差分析的典型數(shù)據(jù) X1X2X

4、3 X i X a 123 :jnx11 x12x13:x1j:x1nx21 x22x23:x2j:x2nx31 xi1 xa1x32 xi2 xa2x33 xi3 xa3: : :x3j xij xaj: : :x3n xin xan平均數(shù)x1 x2 x3 xi xa 4. 表中的數(shù)據(jù)xij,表示第 i 次處理下的第j次觀察值。其中的n個符號做如下說明: 用“ ”表示下標的和,使用時很方便,在以后會經(jīng)常遇到。 5. 常用如下的所謂線性統(tǒng)計模型(linear statistical model)描述每一個觀察值:其中:xij 是在第 i 水平(處理)下的第 j 次觀察值。是對所有觀察值的一個參

5、量,稱為總平均數(shù)(overall mean)。i是僅限于對第 i 次處理的一個參量,稱為第i次處理效應(yīng)(treatment effect)。方差分析的目的,就是要檢驗處理效應(yīng)的大小或有無。eij是隨機誤差成份。6.上述模型中,包括兩類不同的處理效應(yīng)。第一類處理效應(yīng)稱為固定效應(yīng)(fixed effect):它是由固定因素(fixed factor)所引起的效應(yīng)。若因素的a個水平是經(jīng)過特意選擇的,則該因素稱為固定因素。例如,幾個不同的實驗溫度,幾個不同的化學(xué)藥物或一種藥物的幾種不同濃度,幾個作物品種以及幾個不同的治療方案和治療效果等。7. 在這些情況中,因素的水平是特意選擇的,所檢驗的是關(guān)于ai

6、的假設(shè),得到的結(jié)論只適合與方差分析中所考慮的那幾個水平,并不能將其結(jié)論擴展到未加考慮的其它類似水平上。 所以上述的那些因素:溫度、藥物、品種等,稱為固定因素。處理這樣的因素所用的模型稱為固定效應(yīng)模型(fixed effect model)。 例2.1中的5個小麥品系是特意選擇的,目的是從這5 個品系中,選出最優(yōu)者,因而“品系”這個因素屬于固定因素,所用的模型是固定效應(yīng)模型。 8.第二類處理效應(yīng)稱為隨機效應(yīng)(ran-dom effect):它是由隨機因素(random factor)所引起的效應(yīng)。若因素的a 個水平,是從該因素全部水平的總體中隨機抽出的樣本,則該因素稱為隨機因素。從隨機因素的a

7、個水平所得到的結(jié)論,可以推廣到這個因素的所有水平上。處理隨機因素所用的模型稱為隨機效應(yīng)模型(random effect mo-del)。例2.2 的動物窩別,是從動物所有可能的窩別中隨機選出來的,實驗的目的是考查在窩別之間,出生重是否存在差異,因而“窩別”是隨機因素。 9. 有時固定因素和隨機因素很難區(qū)分,除上述所講的原則外,還可以從另一角度鑒別:固定因素是指因素水平,可以嚴格地人為控制。在水平固定之后,它的效應(yīng)值也是固定的。例如,研究三種溫度對胰蛋白酶水解產(chǎn)物的影響。因為溫度水平是可以嚴格控制的,即每一溫度水平,在各個重復(fù)之間都可以準確地控制在一個固定值上,所以在重復(fù)該實驗時,水解產(chǎn)物的產(chǎn)量

8、也是固定的。簡單地說,在水平(不同溫度)固定以后,其效應(yīng)值(產(chǎn)量)也是固定的。因此,溫度是固定因素。 10.隨機因素的水平是不能嚴格地人為控制的,在水平確定之后,它的效應(yīng)值并不固定。例如,在研究不同農(nóng)家肥施用量對作物產(chǎn)量的影響試驗中,農(nóng)家肥是因素,不同施用量是該因素的不同水平,作物的產(chǎn)量是它的效應(yīng)值。由于農(nóng)家肥的有效成份很復(fù)雜,不能像控制溫度那樣,將農(nóng)家肥的有效成份嚴格地控制在某一個固定值上。在重復(fù)試驗時即使施以相同數(shù)量的肥料,也得不到一個固定的效應(yīng)值。即在因素的水平(施肥量)固定之后,它的效應(yīng)值(產(chǎn)量)并不固定,因而農(nóng)家肥是一隨機因素。 11.二、 固定效應(yīng)模型 在固定效應(yīng)模型中,ai 是處

9、理平均數(shù)與總平均數(shù)的離差 ,且是個常量,因而 要檢驗a個處理效應(yīng)的相等性,就要 判斷各 是否等于0。若各ai 都等于0,則各處理效應(yīng)之間無差異。因此,零假設(shè)為: 備擇假設(shè)為: HA:ai0(至少有1個i)。若接受H0,則不存在處理效應(yīng),每個觀察值都是由平均數(shù)加上隨機誤差所構(gòu)成。若拒絕H0,則存在處理效應(yīng),每個觀察值是由總平均數(shù)、處理效應(yīng)和誤差三部分構(gòu)成。 12. 方差分析的基本思想:就是將總的變差分解為構(gòu)成總變差的各個部分。對單因素實驗,可以將總平方和(total sum of squa-res)做如下分解: 對于每個固定的 xi , 13.因此, (23)式表示度量全部數(shù)據(jù)變差的總平方和,可

10、以分解為處理平均數(shù)與總平均數(shù)之間離差的平方和,處理內(nèi)部觀察值與處理平均數(shù)之間離差的平方和兩部分。處理平均數(shù)與總平均數(shù)之間的離差,度量了處理之間的差異;而處理內(nèi)部觀察值與處理平均數(shù)之間的離差,度量了隨機誤差的大小。14.用SST表示總平方和, 用SSA表示(23)等號右邊第一項,稱為處理平方和(treatments sum of squares)或稱為處理間平方和(sum of squares between treatments)。15. 用SSe表示(23)等號右邊第二項,稱為誤差平方和(error sum of squares)或稱為處理內(nèi)平方和(sum of squares within

11、 treatments)。因此: 自由度可以做同樣的分割:SST具an1自由度dfTan1;A因素工有a 水平,因而SSA有a1自由度dfAa1;SSe有ana自由度,這是因為每一處理均有n1自由度,共有a個處理,因而SS e的自由度為ana,dfeana。為了估計s2,用SS e除以相應(yīng)的自由度16. MS e稱為誤差均方(error mean square)。 用類似的方法,可以求出處理均方MSA(treatments mean square) 用MSA與MS e比較,就可以反映出a i的大小。若MSA與MS e相差不大,就可以認為各a i與0的差異不大,或者說各m i之間差異不大。若MS

12、A與MS e超出很多,則認為各 m i之間差異是顯著的。為此,用F單側(cè)檢驗,具dfA,dfe自由度。 17. 當FFa時,則可以認為MSA與MSe差異不大,產(chǎn)生的變差是由隨機誤差造成的;接受零假設(shè),處理平均數(shù)之間差異不顯著。當FFa時,拒絕零假設(shè),處理平均數(shù)間差異顯著。 以上所述可以歸納成方差分析表(table of variance analysis),見表24。 表24 單因素固定效應(yīng)模型方差分析表 變差來源平方和自由度均 方F處理間誤差或處理內(nèi)SSASSea1naaMSAMSeMSAMS e 總 和SSTna118.其中的(x2n a)通常稱為校正項(correc-tion),用C表示。

13、 在實際計算時,通常將SST和SSA寫成下列形式:19.誤差平方和可由(213)式求出, 現(xiàn)在用以上各式計算例2.1。在方差分析中,為了簡化計算同樣可以用編碼法。方差分析的編碼,必須將全部數(shù)據(jù)均減去同一個共同的數(shù)。在例2.1中,每一個xij都減去65,列成下表,先計算校正項C再計算20.株號品 系123450.40.30.21.00.80.50.30.41.31.12.81.32.11.83.56.87.15.04.16.04.23.24.83.32.5總 和x ix 2ixi j1.52.251.933.09.003.411.5132.2529.4329.0841.0174.4618.032

14、4.068.06571308.50277.28 21.將以上結(jié)果列成方差分析表(見表25): 表25 不同小麥品系株高方差分析表 變 差 來 源平 方 和自 由 度均 方 F品 系 間誤 差131.7415.5842032.720.7841.95* 總 和147.3224 * a0.01 當分子自由度為4,分母自由度為20時,F(xiàn)4,20,0.052.87,F(xiàn)4,20,0.014.43,F(xiàn)F0.01。因此,不同小麥品系的株高差異極顯著。習(xí)慣上用“*”表示在0.05水平上差異顯著,用“*”表示在0.01水平上差異顯著,常常稱為差異“極顯著”(highly significant)。 22.三、 隨

15、機效應(yīng)模型 在實驗中,經(jīng)?;赜龅侥硞€因素有許多可能的水平,若參加實驗的a個水平,是從該因素的水平總體中隨機選出的,那么這一因素稱為隨機因素。其方差分析是通過隨機選取的a個水平對該因素的水平總體做推斷。要求水平的總體是無暇總體,即使不是無限總體,也應(yīng)相當大,以至于可以認為是無限總體。例2.2中動物的“窩”是隨機因素,每一窩是一個水平,這種動物所有的窩構(gòu)成一水平總體。從該總體中隨機選擇4個水平(4窩)做實驗,實驗的目的是希望由這4窩動物去推斷該種動物所有不同的窩別之間幼仔出生重是否存在差異。23. 固定效應(yīng)模型中ai0的假設(shè)在這里不再適用。在隨機模型中,對單個處理效應(yīng)的檢驗是無意義的,所要檢驗的是

16、關(guān)于ai的變異性的假設(shè),因而, H0:sa20HA:sa2 0 如果接受H0:sa20,則表示處理之間沒有差異;若拒絕H0而接受HA:sa20,則表示處理之間存在差異,方差分析的做法仍然是將總平方和分解, 24.自由度做同樣分解, 由此可得出MSA和MSe。然后用F 單側(cè)檢驗(具dfA ,dfe 自由度), 方差分析的程序與固定效應(yīng)模型的方差分析程序完全一樣,但是結(jié)論不同。隨機效應(yīng)模型適用于全部水平的總體,而固定效應(yīng)模型只適用于所選水平的總體。下面計算例 2.2,并對結(jié)果加以解釋。將表22中的每一個數(shù)值都減去30,列成下表, 25. 4.7 3.2 2.9 2.9 3.3 4.0 6.7 1.

17、4 3.8 1.4 2.2 4.3 1.6 2.3 3.3 2.0 總 和 c i 5.80 0.10 15.10 2.00 c 2i 33.64 0.01 228.01 4.00 c2i j 49.98 33.49 69.03 32.8611.20 265.66 185.3626.將上述結(jié)果列成方差分析表: 表26 動物出生重方差分析 變 差 來 源平 方 和自 由 度均 方F 窩 別 誤 差58.575118.94531219.5259.9121.97總 和177.5215 查表得知,F(xiàn)3,12,0.053.49,因FF0.05,所以差異不顯著。通過對4窩動物出生重的調(diào)查,可以推斷不同窩別

18、動物的出生重沒有顯著差異。 27.四、 多重比較(multiple comparison) 假設(shè)對一個固定效應(yīng)模型經(jīng)過方差分析之后,結(jié)論是拒絕H0,處理之間存在差異。但這并不說在每對處理之間多存在差異。為了弄清究竟在哪些對之間存在顯著差異,哪些對之間無顯著差異,必須在個處理平均數(shù)之間一對一對地做比較,這就是多重比較。多重比較的方法很多,這里只介紹LSD法和Duncan法。 LSD稱為最小顯著差數(shù)(least significant difference),它的計算方法簡述如下。 28. 對于任意兩組數(shù)據(jù)的平均數(shù),差數(shù)(x1x2)的差異顯著性檢驗,可以用成組數(shù)據(jù) t 檢驗, 當n1n2時 29. 其中MSe為誤差均方,n為每一處理的觀察次數(shù),于是 具ana自由度,當tt0.05時差異顯著,當 tt0.01時差異極顯著。因此,當差異顯著時 30.并可得到,當時差異顯著。t0.052M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論