生物統(tǒng)計學(xué)-方差分析_第1頁
生物統(tǒng)計學(xué)-方差分析_第2頁
生物統(tǒng)計學(xué)-方差分析_第3頁
生物統(tǒng)計學(xué)-方差分析_第4頁
生物統(tǒng)計學(xué)-方差分析_第5頁
已閱讀5頁,還剩162頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

.,第六章方差分析,應(yīng)用統(tǒng)計學(xué),重慶大學(xué)生物工程學(xué)院,.,基本概念,方差分析:方差分析是對兩個或兩個以上樣本平均數(shù)差異顯著性檢驗的方法。例:為研究某種生物材料的生物學(xué)性能,將材料分成三組,分別與成骨細(xì)胞共培養(yǎng)1,7,11天后測試細(xì)胞活性。為避免誤差,每組測試5個樣品,試判斷材料的生物學(xué)性能。,.,基本概念,.,兩個樣本數(shù)據(jù)平均數(shù)比較,1、當(dāng)總體方差和已知,或總體方差和未知,但兩樣本均為大樣本,2、當(dāng)總體方差和未知,且兩樣本均為小樣本,.,例:生產(chǎn)某種紡織品,要求棉花纖維長度平均在30mm以上?,F(xiàn)有一棉花品種,以n400進(jìn)行抽樣,測得纖維平均長度為30.2mm,標(biāo)準(zhǔn)差為2.5mm,問該棉花品種的纖維長度是否合格?,分析:1)已知,u檢驗2)由于只能大于30mm才能合格,故單尾檢驗,解:(1)假設(shè),即該棉花品種纖維長度不能達(dá)到紡織品生產(chǎn)要求含量。對,(2)選取顯著水平,(3)檢驗計算,(4)推斷,u0.05,顯著水平上接受H0,拒絕HA。即認(rèn)為該棉花品種纖維長度不符合紡織品種生產(chǎn)要求,.,例為了探討不同窩的動物的出生重是否存在差異,隨機(jī)選取4窩動物,每窩中均有4只幼仔,結(jié)果如下:,表4窩動物的出生重(克),通過對以上數(shù)據(jù)的分析,判斷不同窩別動物出生重是否存在差異。,.,方差分析的意義,k個樣本均數(shù)的比較:如果仍用t檢驗或u檢驗,需比較次數(shù)為:,例如4個樣本均數(shù)需比較次數(shù)為6次。,假設(shè)每次比較所確定的檢驗水準(zhǔn)為0.05,則每次檢驗拒絕H0不犯第一類錯誤的概率為1-0.05=0.95;那么6次檢驗都不犯第一類錯誤的概率為(1-0.05)6=0.7351,而犯第一類錯誤的概率為0.2649,.,方差分析的意義,k個樣本均數(shù)的比較:如果仍用t檢驗或u檢驗,有以下問題:,1、檢驗過程繁瑣2、無統(tǒng)一的試驗誤差,誤差估計的精確性和檢驗的靈敏性低3、推斷的可靠性降低,犯第1類錯誤的概率增加,.,方差分析:是一類特定情況下的統(tǒng)計假設(shè)檢驗,或者說是平均數(shù)差異顯著性檢驗的一種引伸。u檢驗和t檢驗可以判斷兩組數(shù)據(jù)平均數(shù)的差異的顯著性,而方差分析則可以同時判斷多組數(shù)據(jù)平均數(shù)之間的差異的顯著性。當(dāng)然,在多組數(shù)據(jù)的平均數(shù)之間做比較時,可以在平均數(shù)的所有對之間做t檢驗。但這樣做會提高犯型錯誤的概率,因而是不可取的。,.,方差分析由英國統(tǒng)計學(xué)家R.A.Fisher首創(chuàng),為紀(jì)念Fisher,以F命名,故方差分析又稱F檢驗(F-test)。用于推斷多個總體均數(shù)有無差異,.,方差分析的定義,方差分析是對兩個或多個樣本平均數(shù)差異顯著性檢驗的方法。它是將測量數(shù)據(jù)的總變異按照變異來源分解為處理效應(yīng)和試驗誤差,并做出其數(shù)量估計。,它將所有處理的觀測值作為一個整體,一次比較就對多有各組間樣本平均數(shù)是否有差異做出判斷。如果差異不顯著,則認(rèn)為它們都是相同的;如果差異顯著,再進(jìn)一步比較是哪組數(shù)據(jù)與其它數(shù)據(jù)不同。,.,方差分析的意義,方差分析基本思想:1、把k個總體當(dāng)作一個整體看待2、把觀察值的總變異的平方和及自由度分解為不同來源的平方和及自由度3、計算不同方差估計值的比值4、檢驗各樣本所屬的平均數(shù)是否相等實際上是觀察值變異原因的數(shù)量分析,.,方差分析的應(yīng)用條件和用途,方差分析應(yīng)用條件:1、各樣本須是相互獨立的隨機(jī)樣本2、各樣本來自正態(tài)分布總體3、各總體方差相等,即方差齊,方差分析基本用途:1、多個樣本平均數(shù)的比較2、多個因素間的交互作用3、回歸方程的假設(shè)檢驗4、方差的同質(zhì)性檢驗,.,第一節(jié)方差分析的基本原理,.,試驗指標(biāo)(Experimentalindex):試驗測定的項目或者性狀。日增重、產(chǎn)仔數(shù)、瘦肉率試驗因素(Experimentalfactor):影響試驗指標(biāo)的因素,也稱:處理因素,簡稱因素或因子。1、可控因素(固定因素):人為可控2、非控因素(隨機(jī)因素):不能人為控制試驗因素的表示:大寫字母A,B,C,等來表示,一、相關(guān)術(shù)語,.,因素水平(Leveloffactor):試驗因素所處的特定狀態(tài)或者數(shù)量等級。簡稱水平水平的表示方法:用代表該因素的字母添加下標(biāo)表示,如A1,A2,B1,B2試驗處理(Treatment):實施在試驗單位上的具體項目,簡稱處理。單因素:試驗因素的一個水平多因素:試驗因素的一個水平組合,一、相關(guān)術(shù)語,.,試驗單位(Experimentalunit):試驗載體,即根據(jù)研究目的而確定的觀測總體重復(fù)(Repetition):一個處理實施在兩個或者兩個以上的試驗單位上,稱為處理有重復(fù)。試驗單位數(shù)稱為處理的重復(fù)數(shù),一、相關(guān)術(shù)語,.,方差分析是關(guān)于k(k3)個樣本平均數(shù)的假設(shè)測驗方法,是將總變異按照來源分為處理效應(yīng)和試驗誤差,并做出其數(shù)量估計。發(fā)現(xiàn)各變異原因在總變異中相對重要程度的一種統(tǒng)計分析方法。,二、方差分析的基本原理,.,總變異分解為組間變異和組內(nèi)變異。組內(nèi)變異是個體差異所致,是抽樣誤差。組間變異可能由兩種原因所致,一是抽樣誤差;二是處理不同。在抽樣研究中抽樣誤差是不可避免的,故導(dǎo)致組間變異的第一種原因肯定存在;第二種原因是否存在,需通過假設(shè)檢驗作出推斷,二、方差分析的基本原理,.,三、數(shù)學(xué)模型,每組具有n個觀測值的k組樣本數(shù)據(jù)資料,.,例2.1調(diào)查了5個不同小麥品系的株高,結(jié)果列于表21。在這個例子中,只出現(xiàn)“品系”這樣一個因素(factor),故稱單因素。共有5個不同的品系,我們稱品系這一因素共有5個水平(level)。5個品系可以認(rèn)為是5個總體,表21的數(shù)據(jù)是從5個總體中抽出的5個樣本,通過比較這5個樣本,判斷這5個總體是否存在差異。,表215個小麥品系株高調(diào)查結(jié)果,.,例2.2為了探討不同窩的動物的出生重是否存在差異,隨機(jī)選取4窩動物,每窩中均有4只幼仔,結(jié)果如下:,表224窩動物的出生重(克),通過對以上數(shù)據(jù)的分析,判斷不同窩別動物出生重是否存在差異。,.,以上兩個例子的共同點是:每個實驗都只有一個因素,該因素有a個水平或稱為有a個處理(treatment),這樣的實驗稱為單因素實驗。從單因素實驗的每一處理所得到的結(jié)果都是一隨機(jī)變量Xi。對于a個處理,各重復(fù)n次(或者說做n次觀察)的單因素方差分析的一般化表示方法見表23。,表23單因素方差分析的典型數(shù)據(jù),.,每一個觀察值可以通過如下常用的所謂線性統(tǒng)計模型(linearstatisticalmodel)描述:,其中:xij是在第i水平(處理)下的第j次觀察值。是對所有觀察值的一個參量,稱為總平均數(shù)(overallmean)。i是僅限于對第i次處理的一個參量,稱為第i次處理效應(yīng)(treatmenteffect)。方差分析的目的,就是要檢驗處理效應(yīng)的大小或有無。eij是隨機(jī)誤差成份。,.,上述模型中,包括兩類不同的處理效應(yīng)。第一類處理效應(yīng)稱為固定效應(yīng)(fixedeffect),它是由固定因素(fixedfactor)所引起的效應(yīng)。若因素的a個水平是經(jīng)過特意選擇的,則該因素稱為固定因素。例如,幾個不同的實驗溫度,幾個不同的化學(xué)藥物或一種藥物的幾種不同濃度,幾個作物品種以及幾個不同的治療方案和治療效果等。,.,在這些情況中,因素的水平是特意選擇的,所檢驗的是關(guān)于ai的假設(shè),得到的結(jié)論只適合與方差分析中所考慮的那幾個水平,并不能將其結(jié)論擴(kuò)展到未加考慮的其它類似水平上。所以上述的那些因素:溫度、藥物、品種等,稱為固定因素。處理這樣的因素所用的模型稱為固定效應(yīng)模型(fixedeffectmodel)。例2.1中的5個小麥品系是特意選擇的,目的是從這5個品系中,選出最優(yōu)者,因而“品系”這個因素屬于固定因素,所用的模型是固定效應(yīng)模型。,.,第二類處理效應(yīng)稱為隨機(jī)效應(yīng)(ran-domeffect),它是由隨機(jī)因素(randomfactor)所引起的效應(yīng)。若因素的a個水平,是從該因素全部水平的總體中隨機(jī)抽出的樣本,則該因素稱為隨機(jī)因素。從隨機(jī)因素的a個水平所得到的結(jié)論,可以推廣到這個因素的所有水平上。處理隨機(jī)因素所用的模型稱為隨機(jī)效應(yīng)模型(randomeffectmo-del)。例2.2的動物窩別,是從動物所有可能的窩別中隨機(jī)選出來的,實驗的目的是考查在窩別之間,出生重是否存在差異,因而“窩別”是隨機(jī)因素。,.,有時固定因素和隨機(jī)因素很難區(qū)分,除上述所講的原則外,還可以從另一角度鑒別。固定因素是指因素水平,可以嚴(yán)格地人為控制。在水平固定之后,它的效應(yīng)值也是固定的。例如,研究三種溫度對胰蛋白酶水解產(chǎn)物的影響。因為溫度水平是可以嚴(yán)格控制的,即每一溫度水平,在各個重復(fù)之間都可以準(zhǔn)確地控制在一個固定值上,所以在重復(fù)該實驗時,水解產(chǎn)物的產(chǎn)量也是固定的。簡單地說,在水平(不同溫度)固定以后,其效應(yīng)值(產(chǎn)量)也是固定的。因此,溫度是固定因素。,.,隨機(jī)因素的水平是不能嚴(yán)格地人為控制的,在水平確定之后,它的效應(yīng)值并不固定。例如,在研究不同農(nóng)家肥施用量對作物產(chǎn)量的影響試驗中,農(nóng)家肥是因素,不同施用量是該因素的不同水平,作物的產(chǎn)量是它的效應(yīng)值。由于農(nóng)家肥的有效成份很復(fù)雜,不能像控制溫度那樣,將農(nóng)家肥的有效成份嚴(yán)格地控制在某一個固定值上。在重復(fù)試驗時即使施以相同數(shù)量的肥料,也得不到一個固定的效應(yīng)值。即在因素的水平(施肥量)固定之后,它的效應(yīng)值(產(chǎn)量)并不固定,因而農(nóng)家肥是一隨機(jī)因素。,.,三、數(shù)學(xué)模型,.,三、數(shù)學(xué)模型,.,三、數(shù)學(xué)模型,.,四、平方和與自由度的分解,全部觀測值的總變異可以用總體方差來度量。方差即均方是離均差平方和除以自由度。把一個實驗資料的總變異按變異來源分解為相應(yīng)的變異,首先要將總平方和與總自由度分解為各個變異來源的相應(yīng)部分。則考察總方差可以考察處理間方差和處理內(nèi)的方差,.,四、平方和與自由度的分解,平方和的分解:,總平方和=處理間平方和處理內(nèi)平方和,.,四、平方和與自由度的分解,自由度的分解:,總自由度=處理間自由度處理內(nèi)自由度,.,四、平方和與自由度的分解,計算方差:,.,五、統(tǒng)計假設(shè)的顯著性檢驗F檢驗,F檢驗的目的:推斷處理間的差異是否存在,.,五、統(tǒng)計假設(shè)的顯著性檢驗F檢驗,注意:方差分析中的F檢驗總是單尾檢驗,而且為右尾檢驗,.,F越大,越說明組間方差是主要方差來源,因子影響越顯著;F越小,越說明隨機(jī)方差是主要的方差來源,因子的影響越不顯著,五、統(tǒng)計假設(shè)的顯著性檢驗F檢驗,.,eg.某水產(chǎn)研究所為了比較四種不同配合飼料對魚的飼喂效果,選取了條件基本相同的魚20尾,隨機(jī)分成4組,投喂不同飼料,經(jīng)1個月以后,各組魚的增重(g)資料如下表,試進(jìn)行方差分析,分析:1個因素,4個水平,5個重復(fù)的方差分析,.,解:,.,.,不同飼料飼喂魚增重的方差分析表,.,二、固定效應(yīng)模型在固定效應(yīng)模型中,ai是處理平均數(shù)與總平均數(shù)的離差,且是個常量,因而,要檢驗a個處理效應(yīng)的相等性,就要ai判斷各是否等于0。若各ai都等于0,則各處理效應(yīng)之間無差異。因此,零假設(shè)為:,備擇假設(shè)為:HA:ai0(至少有1個i)。若接受H0,則不存在處理效應(yīng),每個觀察值都是由平均數(shù)加上隨機(jī)誤差所構(gòu)成。若拒絕H0,則存在處理效應(yīng),每個觀察值是由總平均數(shù)、處理效應(yīng)和誤差三部分構(gòu)成。,.,例2.1調(diào)查了5個不同小麥品系的株高,結(jié)果列于表21。在這個例子中,只出現(xiàn)“品系”這樣一個因素(factor),故稱單因素。共有5個不同的品系,我們稱品系這一因素共有5個水平(level)。5個品系可以認(rèn)為是5個總體,表24的數(shù)據(jù)是從5個總體中抽出的5個樣本,通過比較這5個樣本,判斷這5個總體是否存在差異。,表215個小麥品系株高調(diào)查結(jié)果,.,解:在方差分析中,為了簡化計算可以用編碼法。方差分析的編碼,必須將全部數(shù)據(jù)均減去同一個共同的數(shù)。在例2.1中,每一個xij都減去65,列成下表,,.,先計算校正項C,再計算,.,將以上結(jié)果列成方差分析表(見表25):,表25不同小麥品系株高方差分析表,*a0.01,當(dāng)分子自由度為4,分母自由度為20時,F(xiàn)4,20,0.052.87,F(xiàn)4,20,0.014.43,F(xiàn)F0.01。因此,不同小麥品系的株高差異極顯著。習(xí)慣上用“*”表示在0.05水平上差異顯著,用“*”表示在0.01水平上差異顯著,常常稱為差異“極顯著”(highlysignificant)。,.,三、隨機(jī)效應(yīng)模型在實驗中,經(jīng)?;赜龅侥硞€因素有許多可能的水平,若參加實驗的a個水平,是從該因素的水平總體中隨機(jī)選出的,那么這一因素稱為隨機(jī)因素。其方差分析是通過隨機(jī)選取的a個水平對該因素的水平總體做推斷。要求水平的總體是無暇總體,即使不是無限總體,也應(yīng)相當(dāng)大,以至于可以認(rèn)為是無限總體。例2.2中動物的“窩”是隨機(jī)因素,每一窩是一個水平,這種動物所有的窩構(gòu)成一水平總體。從該總體中隨機(jī)選擇4個水平(4窩)做實驗,實驗的目的是希望由這4窩動物去推斷該種動物所有不同的窩別之間幼仔出生重是否存在差異。,.,固定效應(yīng)模型中ai0的假設(shè)在這里不再適用。在隨機(jī)模型中,對單個處理效應(yīng)的檢驗是無意義的,所要檢驗的是關(guān)于ai的變異性的假設(shè),因而,H0:sa20HA:sa20如果接受H0:sa20,則表示處理之間沒有差異;若拒絕H0而接受HA:sa20,則表示處理之間存在差異,方差分析的做法仍然是將總平方和分解,,.,自由度做同樣分解,由此可得出MSt和MSe。然后用F單側(cè)檢驗(具dft,dfe自由度),,方差分析的程序與固定效應(yīng)模型的方差分析程序完全一樣,但是結(jié)論不同。隨機(jī)效應(yīng)模型適用于全部水平的總體,而固定效應(yīng)模型只適用于所選水平的總體。下面計算例2.2,并對結(jié)果加以解釋。,.,例2.2為了探討不同窩的動物的出生重是否存在差異,隨機(jī)選取4窩動物,每窩中均有4只幼仔,結(jié)果如下:,表224窩動物的出生重(克),.,解:將表22中的每一個數(shù)值都減去30,列成下表,,.,.,將上述結(jié)果列成方差分析表:,表26動物出生重方差分析,查表得知,F(xiàn)3,12,0.053.49,因FF0.05,所以差異不顯著。通過對4窩動物出生重的調(diào)查,可以推斷不同窩別動物的出生重沒有顯著差異。,.,Excel方差分析,Office的默認(rèn)安裝中沒有“數(shù)據(jù)分析”要指定才會安裝。一旦安裝,“工具”菜單下出現(xiàn)“數(shù)據(jù)分析”條,可以用它來方便的做方差分析等統(tǒng)計推斷分析??赏ㄟ^運行Analysis中的模板文件ANALYS32.XLL調(diào)入此宏,.,加載數(shù)據(jù)分析,如“工具”菜單下沒有“數(shù)據(jù)分析”單擊“加載宏”,.,Excel解方差分析,選一批單元格輸入原始數(shù)據(jù);,.,Excel解方差分析,選“工具”“數(shù)據(jù)分析”;,.,Excel解方差分析,選“工具”“數(shù)據(jù)分析”“單因素方差分析”,.,Excel解方差分析,“單因素方差分析”對話框中:輸入?yún)^(qū)域,分組方式,輸出選項,.,Excel解方差分析,“單因素方差分析”對話框中:填入信息后單擊“確定”按鈕,.,Excel解方差分析,分析結(jié)果,.,Excel解方差分析,方差分析結(jié)果表中各項目的含義,SS平方和df自由度MS均方F及FcritF值及F臨界值,F(xiàn)crit=FINV(a,df1,df2)P-valueF分布概率P-value=FDIST(F,df1,df2),.,F檢驗如果否定了H0,接受了HA,表明試驗的總變異主要來源于處理間的變異,六、多重比較,多重比較:假設(shè)對一個固定效應(yīng)模型經(jīng)過方差分析之后,結(jié)論是拒絕H0,處理之間存在差異。但這并不說在每對處理之間多存在差異。為了弄清究竟在哪些對之間存在顯著差異,哪些對之間無顯著差異,必須在個處理平均數(shù)之間一對一對地做比較,這就是多重比較。即:多個平均數(shù)的相互比較,.,六、多重比較,常用的:1、最小顯著差數(shù)法(LSD法)2、最小顯著極差法(LSR法)新復(fù)極差檢驗(SSR法)q檢驗,LSD稱為最小顯著差數(shù)(leastsignificantdifference)它的計算方法簡述如下:,.,對于任意兩組數(shù)據(jù)的平均數(shù),差數(shù)(x1x2)的差異顯著性檢驗,可以用成組數(shù)據(jù)t檢驗,,當(dāng)n1n2時,最小顯著差數(shù)法(LSD法),樣本平均數(shù)的差數(shù),樣本平均數(shù)差數(shù)的標(biāo)準(zhǔn)誤,.,其中MSe為誤差方差,即處理內(nèi)方差,n為每一處理的觀察次數(shù),于是,具k(n1)自由度,當(dāng)tt0.05時差異顯著,當(dāng)tt0.01時差異極顯著。因此,當(dāng)差異顯著時,最小顯著差數(shù)法(LSD法),.,并可得到,當(dāng),時差異顯著。t0.052MSen稱為最小顯著差數(shù),記為LSD。每一對平均數(shù)的差與LSD比較,當(dāng)x1x2LSD時,差異顯著;否則差異不顯著。LSD是一種很有用的檢驗方法,計算起來很方便,也容易比較。但是它有難以克服的缺點,即這種比較方法將會加大型錯誤的概率。,最小顯著差數(shù)法(LSD法),.,LSD法的步驟:,最小顯著差數(shù)法(LSD法),1、計算平均數(shù)差數(shù)標(biāo)準(zhǔn)誤,2、由t逆函數(shù)(TINV)和平均數(shù)差數(shù)標(biāo)準(zhǔn)誤計算出達(dá)到差異顯著的最小差數(shù),記為LSD,3、將全部平均數(shù)從大到小依次排列,并比較若即為在給定的水平上差異顯著,反之亦然,.,說明實質(zhì)上是t檢驗,但統(tǒng)一了標(biāo)準(zhǔn)誤簡單、靈敏(降低了檢驗標(biāo)準(zhǔn)、夸大了差異的顯著性)I類錯誤概率增大,控制單次比較的I類錯誤時應(yīng)用無法控制所有比較的總體I類錯誤,最小顯著差數(shù)法(LSD法),.,2、求解達(dá)到差異顯著的最小差數(shù)(LSD)臨界值:t0.05(16)=2.120,t0.01(16)=2.921LSD0.05(16)=2.120*14.622=31.0LSD0.01(16)=2.921*14.622=42.7,3、將全部平均數(shù)從大到小依次排列,并比較,.,excel數(shù)據(jù)的排序,工具,數(shù)據(jù)分析,排序與百分比,.,excel數(shù)據(jù)的排序,.,四種飼料飼喂魚增重差異顯著性(LSD檢驗,梯形法),4、分析結(jié)果:A1飼料對魚增重效果極顯著高于A3和A2,顯著高于A4;A4飼料對魚增重效果顯著高于A3;A4和A2,A2和A3飼料對魚增重效果沒有顯著差異,.,四種飼料飼喂魚增重差異顯著性(LSD檢驗,字母標(biāo)記法),(1)在最大的平均數(shù)上標(biāo)字母aA1行標(biāo)注a,a,(2)將該平均數(shù)與以下各平均數(shù)相比,凡相差不顯著的(LSD0.05,則A4標(biāo)b,b,(3)再以標(biāo)有b的平均數(shù)為標(biāo)準(zhǔn),與各個比它大的平均數(shù)比較,凡差數(shù)差異不顯著的在字母的右邊加標(biāo)字母b,然后再以標(biāo)b的最大平均數(shù)為標(biāo)準(zhǔn)與以下未標(biāo)字母的平均數(shù)相比,凡相差不顯著的都標(biāo)上字母b,直到某個與相差顯著的則標(biāo)字母c往上:(A4-A1)是已經(jīng)比較了;往下(A4-A2)=17.0,標(biāo)b,(A4-A3)=32.4,標(biāo)c,b,c,(4)以此重復(fù),直到最小的平均數(shù)標(biāo)記字母以A3為標(biāo)準(zhǔn),往上:A3與A2相比無顯著差異,故在A2行b右邊標(biāo)注c,A3與A4已比較了,c,A,A,B,B,B,總結(jié):差異不顯著標(biāo)同一字母,差異顯著標(biāo)不同字母,.,四種飼料飼喂魚增重差異顯著性(LSD檢驗,字母標(biāo)記法),判斷:凡有一個相同標(biāo)記字母的即為差異不顯著,凡具有不同標(biāo)記字母的即為差異顯著,分析結(jié)果:A1飼料對魚增重效果極顯著高于A3和A2,顯著高于A4;A4飼料對魚增重效果顯著高于A3;A4和A2,A2和A3飼料對魚增重效果沒有顯著差異,.,把平均數(shù)的差異看成是平均數(shù)的極差(range)根據(jù)極差范圍內(nèi)所包括的處理數(shù)(稱為秩次距)k的不同,而采用不同的檢驗尺度叫做最小顯著極差LSR秩次距是指當(dāng)平均數(shù)由大到小排序后,相比較的兩個平均數(shù)之間(含這兩個平均數(shù))包含的平均數(shù)個數(shù)I類錯誤下降、工作量加大,最小顯著極差法(LSR法),.,為了克服LSD法的缺點,Duncan(1955)提出了Duncan多范圍檢驗(Duncanmultipletest)。檢驗方法如下:首先,將需要比較的a個平均數(shù)依次排列好,使之,并將每一對x之間的差(范圍)列成下表,注:表中的x均為x,新復(fù)極差法,.,Duncan檢驗與LSD的一個明顯不同是Duncan檢驗中,不同對平均數(shù)的差有不同的臨界值Rk。,其中,.,rara(k,df)的值可以從附表“多重比較中的Duncan表”中查出:表的最左邊一列是誤差自由度dfa(n1),最上一列為k值,表體為ra(k,df)。表中的k值是相比較的兩個平均數(shù)之間所包含的平均數(shù)的個數(shù)。如兩個要比較的平均數(shù)相鄰時k2,兩個要比較的平均數(shù)中間隔一個平均數(shù)時k3,依此類椎。因為平均數(shù)共有a個,所以需查出a一1個ra,分別乘以S,得:,.,先從表的第一行最左邊的一個差x1xa開始比較。若x1xaRa,則x1與xa的差異顯著;否則差異不顯著,然后比較下一個。若x1xa1Ra一1,則x1與xa1差異顯著,否則差異不顯著,。第一行比較完之后用同樣的方法比較第二行。先從第二行最左邊的一個差x2xa開始,在x2到xa這個范圍內(nèi)共包含a1個平均數(shù),因此x2xa應(yīng)與Ra1比較,若x2xaRa1,則差異顯著,否則不顯著,。第二行比較完再比較第三行,第四行,。直到所有平均數(shù)的差均與其相應(yīng)的Rk比較完為止。對于顯著的標(biāo)上“*”,極顯著的標(biāo)上“*”。,.,新復(fù)極差法,此法是以統(tǒng)計量SSR的概率分布為基礎(chǔ)的。SSR值由下式求得,.,SSR檢驗步驟,計算出平均數(shù)標(biāo)準(zhǔn)誤;由自由度dfe、秩次距M(所含平均數(shù)的個數(shù))查臨界SSR值(附表6),計算最小顯著極差LSR0.05,M,LSR0.01,M;將平均數(shù)多重比較表中的各極差與相應(yīng)的最小顯著極差LSR0.05,M,LSR0.01,M比較,作出統(tǒng)計推斷,.,有關(guān)采用excel自定義函數(shù)來生成SSR值可參見文獻(xiàn),.,q檢驗法,此法是以統(tǒng)計量q的概率分布為基礎(chǔ)的。q值由下式求得,q值分布表附表7,其余與SSR檢驗法一樣,.,例6.2:測定東北、內(nèi)蒙古、河北、安徽、貴州5個地區(qū)黃鼬冬季針毛的長度(mm),每個地區(qū)隨機(jī)抽取4個樣本,測定結(jié)果于下表,試比較各個地區(qū)黃鼬針毛長度的差異顯著性,分析:1個因素,5個水平,4個重復(fù)的方差分析,.,解:“excel”“工具”“數(shù)據(jù)分析”“單因素方差分析”,由分析結(jié)果知:P0.01,說明5個地區(qū)黃鼬冬季針毛長度差異顯著,.,q檢驗,1、計算平均數(shù)標(biāo)準(zhǔn)誤,2、查附表7,當(dāng)dfe=15,M=2,q0.05=3.01,q0.01=4.17,則,當(dāng)M=3,M=4,M=5時按同理計算,結(jié)果列表,.,不同地區(qū)黃鼬冬季針毛長度的LSR值(q檢驗),a,b,b,c,A,B,B,C,3、不同地區(qū)黃鼬冬季針毛長度的差異顯著(q檢驗),d,C,c,C,.,4、結(jié)果表明:東北與其他地區(qū);內(nèi)蒙古和安徽、貴州黃鼬冬季針毛長度差異均達(dá)極顯著水平。河北和貴州,安徽和貴州差異達(dá)顯著水平。內(nèi)蒙古和河北,河北和安徽差異不顯著。,LSD檢驗的分析結(jié)果:東北與其他地區(qū);內(nèi)蒙古和安徽、貴州;以及河北和貴州黃鼬冬季針毛長度差異均達(dá)極顯著水平。安徽和貴州差異達(dá)顯著水平。內(nèi)蒙古和河北,河北和安徽差異不顯著。,.,多重比較有多種方法,不同方法用途不同、比較的結(jié)果不同,總結(jié):多重比較,尺度大?。篖SD法SSR法q檢驗法,(原因:SSR和q檢驗是針對不同秩次距的平均數(shù)極差采用不同的顯著尺度,充分考慮到同一總體抽樣時,平均數(shù)的極差將隨秩次距的增大而增大這一現(xiàn)象),對試驗要求嚴(yán)格時,用q檢驗法較為妥當(dāng),生物試驗中,由于試驗誤差較大,常采用新復(fù)極差法(SSR法),應(yīng)該注明利用的是何種多重比較方法,.,1、多個實驗組與一個對照組均數(shù)間兩兩比較若目的是減小第II類錯誤,最好選用最小顯著差法LSD;若目的是減小第I類錯誤,最好選用SSR法。,總結(jié):多重比較,2、多個樣本均數(shù)間兩兩比較常用q檢驗的方法,.,第二節(jié)單因素方差分析,.,單因素方差分析,分析目的:判斷某試驗因素各水平的相對效果,分類:根據(jù)組內(nèi)觀測數(shù)目(重復(fù)數(shù))是否相同1、組內(nèi)觀測次數(shù)相等的方差分析2、組內(nèi)觀測次數(shù)不等的方差分析,.,各處理重復(fù)次數(shù)不等的方差分析,Excel中對應(yīng)函數(shù):,求和:SUM()求冪:POWER(x,power)求平方和:SUMSQ(),.,例題6.3.用某種小麥種子進(jìn)行切胚乳試驗,試驗分為3種處理:整粒小麥(I),切去一半胚乳(II),切去全部胚乳(III),同期播種于條件比較一致的花盆內(nèi),出苗后每盆選留2株,成熟后進(jìn)行單株考種,每株粒重(g)結(jié)果如下表,試進(jìn)行方差分析,分析:1個因素,10個水平,3個重復(fù)的方差分析,.,解:“excel”“工具”“數(shù)據(jù)分析”“單因素方差分析”,結(jié)果分析:3種處理的單株粒重?zé)o顯著差異,.,第三節(jié)二因素方差分析,.,兩因素試驗資料的方差分析是指對試驗指標(biāo)同時受到兩個試驗因素作用的試驗資料的方差分析,兩因素方差分析,主效應(yīng):各試驗因素的相對獨立作用,簡稱主效或效應(yīng),互作:某一因素在另一因素的不同水平上所產(chǎn)生的效應(yīng)不同,則二因素間存在交互作用,簡稱互作。互作效應(yīng)實際是由于兩個或多個試驗因素的相互作用而產(chǎn)生的效應(yīng),.,互作分類:1、正的交互作用2、負(fù)的交互作用3、無交互作用:即互作效應(yīng)為零。沒有交互作用的因素是相互獨立的因素,此時,不論在某個因素哪個水平,另一因素的效應(yīng)都是相等的,互作效應(yīng),.,互作與主效應(yīng)的關(guān)系:因素間的交互作用顯著與否關(guān)系到主效應(yīng)的利用價值1、若交互作用不顯著:各因素的效應(yīng)可以累加,各因素的最優(yōu)水平組合起來,即為最優(yōu)的處理組合2、若交互作用顯著:各因素的效應(yīng)就不能累加,最優(yōu)處理組合的選定應(yīng)根據(jù)各處理組合的直接表現(xiàn)選定3、有時候交互作用相當(dāng)大,甚至可以忽略主效應(yīng),互作效應(yīng),.,二因素方差分析,分析目的:判斷對因素主效應(yīng)和交互作用,分類:1、無重復(fù)觀測值的二因素方差分析2、具有重復(fù)觀測值的二因素方差分析,.,前提二因素?zé)o互作,每個處理可不設(shè)重復(fù)數(shù)據(jù)假定A因素有a個水平、B因素有b個水平,每個水平組合只有一個觀測值,全試驗共有ab個觀測值,無重復(fù)觀測值的二因素方差分析,.,無重復(fù)觀測值的二因素數(shù)據(jù)資料,A因素每個水平看作b個重復(fù)B因素每個水平看作a個重復(fù),.,模型假定,每個觀察值為一個從平均值等于ij的群體隨機(jī)、獨立的抽樣。共有ab個樣本。處理效應(yīng)和區(qū)組效應(yīng)是加性的。處理和區(qū)組沒有互作數(shù)據(jù)的方差相等eij為隨機(jī)誤差,相互獨立,且服從N(0,2),.,數(shù)學(xué)模型,=總體平均ai=第i個處理效應(yīng),i.bj=第j個區(qū)組的效應(yīng),.jeij=隨機(jī)誤差項,xijij,.,方差剖分,無重復(fù)觀測值二因素的試驗A因素的每個水平有b次重復(fù),B因素的每個水平有a次重復(fù),每個觀測值同時受到A、B兩因素及隨機(jī)誤差的作用。因此全部ab個觀測值的總變異可以剖分為A因素水平間變異、B因素水平間變異及試驗誤差三部分自由度也相應(yīng)剖分,.,平方和計算,.,各項方差計算,.,ANOVA表,.,例題6.4:將一種生長激素配成M1,M2,M3,M4,M5五種濃度,并用H1,H2,H3三種時間浸漬某大豆品種的種子,出苗45天后得到各處理每一植株的平均干物重(g),結(jié)果如下表,試作方差分析。,分析:2個因素,無重復(fù)的方差分析,.,解:“excel”“工具”“數(shù)據(jù)分析”“無重復(fù)雙因素方差分析”,.,F檢驗結(jié)果表明:激素處理濃度之間的F值大于F0.01,達(dá)到極顯著水平;激素處理時間之間的F值未達(dá)到顯著水平,說明不同激素濃度對大豆干物重有極顯著的影響。,多重比較(用SSR檢驗):激素處理濃度之間的效應(yīng)達(dá)到極顯著水平,而激素處理時間之間的F值未達(dá)到顯著水平,所以只對5種浸漬濃度進(jìn)行多重比較。,.,計算濃度之間的平均數(shù)標(biāo)準(zhǔn)誤:,查SSR值表(附表6),得到在dfe8時,不同秩次距下的SSR值和LSR值,.,不同激素濃度大豆干物重多重比較的LSR值(SSR檢驗),a,a,b,c,A,A,B,C,不同激素濃度大豆干物重平均數(shù)的差異顯著(SSR檢驗),c,C,.,多重比較結(jié)果表明:5種生長激素濃度度對大豆干物重有極顯著的影響。M1與M2,M5與M3之間差異不顯著;除此之外,其他激素濃度之間的大豆干物重均達(dá)到極顯著差異。5種激素濃度中,M1和M2的處理效果較好,.,如果兩個因素存在互作將互作項和誤差項的平方和自由度分解有互作試驗設(shè)計設(shè)重復(fù),有重復(fù)觀測值的二因素方差分析,.,上面講過,因素可分作固定因素和隨機(jī)因素。在兩因素實驗中,當(dāng)兩個因素都是固定因素時,稱為固定模型(fixedmodel);兩個因素均為隨機(jī)因素時,稱為隨機(jī)模型(randommodel);一個因素是固定因素,另一個因素是隨機(jī)因素時,稱為混合模型(mixedmodel)。這三種模型雖然在計算方法上沒有多大不同,但在檢驗以及對結(jié)果解釋上卻截然不同。尤其是在兩因素之間存在交互作用時,不同類型模型的區(qū)別就更明顯。,.,兩因素實驗的典型設(shè)計是:假定A因素有a水平,B因素有b水平,則每一次重復(fù)都包括ab次實驗,并設(shè)實驗重復(fù)次數(shù)n次,ijk表示A因素的第i水平,B因素第j水平和第k次重復(fù)的觀察值。數(shù)據(jù)將以下表的形式出現(xiàn)。表2-7中A和B可以是固定因素,也可以是隨機(jī)因素,因而引出三種不同的統(tǒng)計模型。,.,表27兩因素交互分組實驗的一般格式,.,表27中的各種符號做如下說明:ci表示A因素第i水平的所有觀察值的和;cj表示B因素第j水平的所有觀察值的和;cij表示A的第i水平和B的第j水平的所有觀察值的和;c表示所有觀察值的綜合。,.,數(shù)學(xué)模型,.,平方和的計算,.,自由度計算,.,各項方差計算,.,F檢驗,.,固定模型,.,兩因素固定模型方差分析表如下:,表28固定模型方差分析表(因素A、B固定型),.,例2.3為了從三種不同原料和三種不同發(fā)酵溫度中,選出最適的條件,設(shè)計了一個兩因素試驗。并得到以下結(jié)果(表29):,.,在這個試驗中,溫度和原料均為固定因素。每一處理有4次重復(fù)。因此可按上面敘述過的方法分析。將表中的每一數(shù)字均減去30,列成表210.1,由表210.1中,可以計算出,及,.,表210.1發(fā)酵實驗方差分析計算表,.,利用ij列列成表210.2。,表210.2發(fā)酵實驗方差分析表,.,由表210.2中可以計算出,.,列成方差分析表:,表211發(fā)酵實驗方差分析表,*a0.01*a0.05,原料和溫度在0.01水平上拒絕H0;交互作用在0.05水平上拒絕H0。因此酒精的產(chǎn)量不僅與原料與溫度有關(guān),而且與兩者的交互作用也有關(guān)。,.,隨機(jī)模型,.,表214隨機(jī)效應(yīng)模型方差分析表(因素A、B隨機(jī)型),隨機(jī)效應(yīng)模型的方差分析表如下:,.,例2.6為了研究不同地塊中施用不同數(shù)量農(nóng)家肥對作物產(chǎn)量的影響,設(shè)計了一個兩因素試驗。試驗結(jié)果列在下表中。,解前面已經(jīng)說過,這是一隨機(jī)模型。隨機(jī)模型的各項平方和的計算與固定模型是一樣的。將上表中的cijk每一個均減去9.5列成下表:,.,表215.1作物產(chǎn)量方差分析計算表,.,利用ijk列,列成下表:,表215.2作物產(chǎn)量方差分析計算表,由表215.1計算出,.,由表215.2計算出,.,列成方差分析表:,*a0.01,從以上方差分析表中,可以看出所選擇的不同地塊對產(chǎn)量沒有顯著影響。但不同施肥兩對產(chǎn)量的影響極為顯著。,.,混合模型,.,混合模型方差分析表如下:,表216混合模型方差分析表(A固定,B隨機(jī)),.,例27表217所列出的數(shù)據(jù)是四個受試者在四種速度下工作,即正常速度的60、80、100、120所得到的能量消耗的比值,試驗共有16種處理,每一處理重復(fù)觀察2次,共做32次觀察。,表217四個受試者在四種速度下工作的能量消耗,.,解首先,看因素的類型。因素A是從60120這個范圍內(nèi),人為地選出的四個水平,這四個水平是可以嚴(yán)格控制的,所以因素A為固定型;因素B的四個水平,是從受試者人群中隨機(jī)抽取的,所以因素B為隨機(jī)型。本試驗屬于混合效應(yīng)模型。具體計算過程不再重復(fù),下面給出方差分析表,表218能量消耗實驗方差分析表,.,首先,檢驗假設(shè),因為FF9,16,0.05,所以A、B之間存在交互作用。檢驗,FF3,16,0.05,所以實驗對象個體之間的差異不顯著。,.,最后,檢驗,FF3,16,0.01,接受H01。因素A是不顯著的。在這四種速度下,工作的能量消耗沒有顯著不同。要提醒大家的是,在混合模型的方差分析時,正確區(qū)分因素的類型,正確地使用檢驗的統(tǒng)計量是非常重要的。,.,ANOVA表,.,例題6.5:為了研究某種昆蟲滯育期長短和環(huán)境的關(guān)系,在給定的溫度和光照條件下進(jìn)行實驗室培養(yǎng),每一處理記錄4只昆蟲的滯育天數(shù),結(jié)果列于下表,試對該資料進(jìn)行方差分析,分析:2個因素,有重復(fù)的,固定模型的方差分析,.,解:“excel”“工具”“數(shù)據(jù)分析”“可重復(fù)雙因素方差分析”,.,F檢驗結(jié)果表明:不同光照和溫度對該昆蟲的滯育有極顯著影響,即昆蟲滯育期長短主要決定光照和溫度;光照和溫度兩者之間的互作關(guān)系不大需要對光照和溫度分別作多重分析,.,采用Excel計算重復(fù)觀測值的二因素方差分析,注意事項:1、數(shù)據(jù)輸入?yún)^(qū)域必須有標(biāo)題2、直接分析結(jié)果僅適用用固定模型,.,例題:用兩種不同的飼料A和B,以不同的配比方式飼養(yǎng)大白鼠,每一種飼料均取4個水平,各配比處理的食量相同,每一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論