第07章SAS方差分析_第1頁
第07章SAS方差分析_第2頁
第07章SAS方差分析_第3頁
第07章SAS方差分析_第4頁
第07章SAS方差分析_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、DATA new; DO i=1 TO 4; DO trt=1 TO 3; INPUT y; OUTPUT; END; END;DROP trt; CARDS;0.0780.133 0.128 0.0840.139 0.134 0.0730.128 0.123 0.0650.120 0.115 PROC ANOVA; CLASS I; MODEL y=I;MEANS I/DUNCAN; RUN; §7.4.1 組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析例7.5 研究6種氮肥施用法(K=6)對小麥的效應(yīng),每種施肥法種5盆小麥(n=5),完全隨機設(shè)計,最后測定它們的含氮量(mg),其結(jié)果

2、見表10.1,試作方差分析。表10.1 種施肥法小麥植株的含氮量(mg)12312.914.012.610.514.614.012.313.83.210.814.613.312.213.813.410.714.413.712.513.613.410.814.413.512.713.613.010.514.413.7由于組內(nèi)觀測值數(shù)目相等,故采用ANOVA過程分析。程序如下8.95 9.22 8.64 8.818.92 8.70 8.79 8.849.01 8.78 8.91 8.81 1程序及說明/*數(shù)據(jù)來源:南京農(nóng)業(yè)大學(xué),田間試驗和統(tǒng)計方法,P102*/DATA new; DO i=1 TO

3、 3; DO trt=1 TO 4; INPUT y; OUTPUT; END; END;DROP i; /*刪除臨時變量I */CARDS;8.95 8.92 9.01 PROC ANOVA; /*調(diào)用ANOVA過程作方差分析*/CLASS trt; /*規(guī)定以trt為分類變量 */MODEL y=trt;MEANS trt/DUNCAN; /*選用新復(fù)極差法作多重比較 */RUN; 2輸出結(jié)果及說明 Analysis of Variance Procedure 方差分析過程 Class Level Information 處理水平信息 Class Levels Values 處理因素變量名

4、 水平數(shù) 具體值 TRT 6 1 2 3 4 5 6 Number of observations in data set = 30 數(shù)據(jù)集中有30個觀察值Dependent Variable: Y 依變量名為y Sum of MeanSource DF Squares Square F Value Pr > F變異來源 自由度 平方和 均方 F值 概率值PModel 5 44.46300000 8.89260000 164.17 0.0001Error 24 1.30000000 0.05416667Corrected Total 29 45.76300000 R-Square C.V

5、. Root MSE Y Mean所用模型的決定系數(shù) 變異系數(shù) 剩余標(biāo)準(zhǔn)差 依變量均數(shù) 0.971593 1.786165 0.232737 13.0300000Source DF Anova SS Mean Square F Value Pr > F變異來源 自由度 平方和 均方 F值 概率值PTRT 5 44.46300000 8.89260000 164.17 0.0001 Analysis of Variance Procedure Duncan's Multiple Range Test for variable: Y 用DUNCAN法測驗 NOTE: This tes

6、t controls the type I experimentwise error rate under the complete null hypothesis but not under partial null hypotheses. Alpha= 0.05 df= 24 MSE= 0.054167 水平為0.05,自由度為24,MS誤差為0.054167 Number of Means 2 3 4 5 6 Critical Range 0.3038 0.3191 0.3289 0.3358 0.3410 兩兩比較時的界值,兩平均數(shù)之差大于該界值時則兩組有統(tǒng)計學(xué)差異 Means wit

7、h the same letter are not significantly different. 標(biāo)有相同字母的兩平均數(shù)間無差異 Duncan Grouping Mean N TRT 測驗結(jié)果 各組均數(shù) 例數(shù) 組別 A 14.4800 5 5 B 13.7600 5 2 B 13.6400 5 6 C 13.1200 5 3 D 12.5200 5 1 E 10.6600 5 4在輸出結(jié)果中,找CLASS語句指出的變量的Pr > F(概率)值。此例中,P0.0001,可得出各種施肥法間有極顯著差異。說明6種施氮法的植株含氮量是顯著不同的。用DUNCAN新復(fù)極差法測驗結(jié)果表明,除第2種

8、施肥法和第6種施肥法之間的差異不顯著外,其余各種方法間的差異均達到Alpha= 0.05水平,其中第5種施肥法的效果最好,其次是第2和第6種施肥法較好。第7章 方差分析摘要:多組資料均數(shù)比較一般采用方差分析的方法,SAS中方差分析的功能非常全面,能實現(xiàn)方差分析功能的過程有ANOVA過程和GLM過程。對于兩個平均數(shù)的假設(shè)測驗,一般采用t測驗來完成,對于多個平均數(shù)的假設(shè)測驗,若采用t測驗兩兩進行,不僅非常麻煩,而且容易犯第一類錯誤。方差或稱均方,即標(biāo)準(zhǔn)差的平方,它是一個表示變異程度的量。在一項試驗或調(diào)查中往往存在著許多種影響生物性狀變異的因素,這些因素有較重要的,也有較次要的。方差分析就是將總變異

9、分裂為各個因素的相應(yīng)變異,作出其數(shù)量估計,從而發(fā)現(xiàn)各個因素在變異中所占的重要程度;而且除了可控制因素所引起的變異后,其剩余變異又可提供試驗誤差的準(zhǔn)確而無偏的估計,作為統(tǒng)計假設(shè)測驗的依據(jù)。當(dāng)試驗結(jié)果受到多個因素的影響,而且也受到每個因素的各水平的影響時,為從數(shù)量上反映各因素以及各因素諸水平對試驗結(jié)果的影響,可使用方差分析的方法。SAS系統(tǒng)用于進行方差分析的過程主要有ANOVA過程和GLM過程,對于均衡數(shù)據(jù)的分析一般采用ANOVA過程,對于非均衡數(shù)據(jù)的分析一般采用GLM過程。方差分析和協(xié)方差分析在SAS系統(tǒng)中由SAS/STAT模塊來完成,其中我們常用的有ANOVA過程和GLM過程。前者運算速度較快

10、,但功能較為有限;后者運算速度較慢,但功能強大,我們做協(xié)方差分析時就要用到GLM過程。本章將首先介紹方差分析所用數(shù)據(jù)集的建立技巧,然后重點介紹這兩個程序步。§7.1 方差分析概述一、方差分析的應(yīng)用場合、基本思想和前提條件1應(yīng)用場合當(dāng)影響因素是定性變量(一般稱為分組變量或原因變量),觀測結(jié)果是定量變量(一般稱為結(jié)果變量或反應(yīng)變量),常用的數(shù)據(jù)處理方法是對均數(shù)或均值向量進行假設(shè)檢驗。若只有一個原因變量,而且其水平數(shù)k2,一元時常用U檢驗、t檢驗、秩和檢驗,多元時用多元檢驗(T2檢驗或wilks檢驗);若原因變量的水平數(shù)k3或原因變量的個數(shù)2,一元時常用下檢驗,也叫一元方差分析(簡寫成AN

11、OVA)或非參數(shù)檢驗,多元時用多元方差分析(簡寫成MANOVA,其中最常用的是Wilks檢驗)。2基本思想方差分析的基本思想可概述為:把全部數(shù)據(jù)關(guān)于總均數(shù)的離均差平方和分解成幾個部分,每一部分表示某一影響因素或諸影響因素之間的交互作用所產(chǎn)生的效應(yīng),將各部分均方(即方差)與誤差均方相比較,依據(jù)下分布作出統(tǒng)計推斷,從而確認(rèn)或否認(rèn)某些因素或交互作用的重要性。由于試驗設(shè)計的類型多種多樣,不同的設(shè)計類型往往需用不同的方差分析模型去處理,因此,用來作為度量影響因素作用大小的尺子誤差的均方,也就不是一成不變的了。這就出現(xiàn)了誤差固定的設(shè)計類型及其定量資料的統(tǒng)計分析方法和誤差變動的設(shè)計類型及其定量資料的統(tǒng)計分析

12、方法。3前提條件無論是進行ANOVA還是MANOVA,嚴(yán)格他說,都要求資料滿足正態(tài)性和方差齊性的。要求,但方差齊性有時較難滿足,此時可采用有關(guān)的非參數(shù)檢驗或?qū)?shù)據(jù)作某種變換后使之滿足前提條件。此處僅給出一元情形時,如何用SAS程序?qū)崿F(xiàn)對資料的正態(tài)性和方差齊性檢驗。例71 為了研究輕度和重度再障貧血患者血清中可溶性CD,抗原水平(Uml)與正常人有無顯著性差別,以反映患者免疫狀態(tài)紊亂而導(dǎo)致造血功能障礙的程度。從三種人群中分別隨機地抽取了10人,測得CD8抗原水平如下,試對下列三組資料作正態(tài)性和方差齊性檢驗。 正常組:234,318,402,382,621,408,243,141,42,98。 輕

13、度組:509,518,555,758,845,712,585,448,753,896。 重度組:851,562,918,631,653,843,659,849,762,901。【分析與解答】關(guān)于正態(tài)性檢驗:H。:三組資料分別取自正態(tài)分布的總體;H1:三組資料并非取自正態(tài)分布的總體;=0.05。關(guān)于方差齊性檢驗:H。:三組資料所取自的總體的方差相等;H1:三組資料所取自的總體的方差不相等或不全相等;=0.05?!維AS程序】DATA aa; DO g=1 TO 3; INPUT X; OUTPUT; END; CARDS; 234 509 851 318 518 562 402 555 918

14、382 758 631 621 845 653 408 712 843 243 585 659 141 448 849 42 753 762 98 896 901PROC SORT DATA=aa; BY g;PROC PRINT;RUN;二、方差分析數(shù)據(jù)集的建立技巧1方差分析的數(shù)據(jù)集格式統(tǒng)計分析所用的數(shù)據(jù)格式和我們在分析整理資料時所用的格式是不同的。一般來說,數(shù)據(jù)集中應(yīng)至少有一個結(jié)果變量,用于記錄不同處理因素水平下觀察值的大??;至少有一個處理因素變量,用于記錄處理因素的類型及其水平數(shù)。以單因素方差分析為例,就應(yīng)有一個結(jié)果變量和一個處理因素變量;而兩因素的方差分析應(yīng)有一個結(jié)果變量和兩個處理因素

15、變量。例A 某職業(yè)病防治院對31名石棉礦工中的石棉肺患者、可疑患者及非患者進行了用力肺活量測定,請給出數(shù)據(jù)集的結(jié)構(gòu)。解:數(shù)據(jù)集中應(yīng)有兩個變量,x和group。x記錄肺活量的大??;group取值為1、2或3,分別代表石棉肺患者、可疑患者及非患者。例B 某廠醫(yī)務(wù)室測定了10名氟作業(yè)工人工前、工中及工后4小時的尿氟濃度,請給出數(shù)據(jù)集的結(jié)構(gòu)。解:數(shù)據(jù)集中應(yīng)有三個變量,x、group和worker。x記錄尿氟濃度;group取值為1、2或3,分別代表工前、工中及工后;worker取值為1到10,分別代表10名工人。2方差分析數(shù)據(jù)集的建立方法可見方差分析的數(shù)據(jù)集其變量取值有一定的規(guī)律,因此可以利用循環(huán)語句

16、和判斷語句來簡化輸入。例72 請建立例B的數(shù)據(jù)集。解:此例中數(shù)據(jù)較有規(guī)律,各組的例數(shù)均相等,這可正是循環(huán)語句大顯身手的時候。data NEW;do group=1 to 3; do worker=1 to 10; input X ; output; end; end; cards; 90.53 88.43 47.37 . 105.27 58.95proc print;run;§7.2 ANOVA(Analysis of Variance)過程如果實驗的每種組合安排相同數(shù)目的實驗單位,則這種實驗設(shè)計稱為平衡設(shè)計。由于數(shù)據(jù)是平衡的,則平方和的計算可以簡化。這樣的方差分析可用ANOVA過程

17、,不必用占機時更多的GLM過程。ANOVA過程可進行單向分組資料的方差分析、隨機區(qū)組試驗及拉丁方試驗的統(tǒng)計分析等。一、過程格式PROC ANOVA 選擇項;CLASS 變量表; 必需,指定要分析的處理因素MODEL 依變量表=效應(yīng)表/選擇項; 必需,給出分析用的方差分析模型MEANS 效應(yīng)表 /選擇項; 指定要兩兩比較的因素及比較方法FREQ 變量名;TEST H=效果名稱 E=效果名稱; 指定多元方差分析的選項MANOVA H=效果名稱 E=效果名稱 M=變量的轉(zhuǎn)換式 PREFIX=新變量的名稱代號 MNAMES=新變量名表 /選擇項;REPEATED 重復(fù)變量的名稱 組名 變量轉(zhuǎn)換/選擇項

18、;BY 變量表;二、語句說明程序中CLASS語句和MODEL語句是必需的,而且CLASS語句必須出現(xiàn)在MODEL語句之前。如果選用TEST和MANOVA語句,則必須放在MODEL語句之后。MEANS、TEST和MANOVA語句可以重復(fù)使用,其他語句只能使用一次。1PROC ANOVA語句選擇項DATA=數(shù)據(jù)集 指定用來分析的數(shù)據(jù)集名,若缺省,則使用最新建立的數(shù)據(jù)集。MANOVA 要求PROC ANOVA語句將含一個或一個以上依變量缺失值的觀察值剔除。當(dāng)使用交互式進行方差分析時,最好指定此選擇項。OUTSTAT=數(shù)據(jù)集 輸出結(jié)果中包括離差平方和(SS)、F值以及各試驗效果的顯著程度。2CLASS

19、語句聲明方差分析中因素的分類水平處理變量,也稱為分類變量,指明數(shù)據(jù)集中的自變量,可以是數(shù)值型,也可以是字符型。若為字符變量,其長度不超過16個字母。3MODEL語句指明依變量(因子變量)效應(yīng)。效應(yīng)是分類變量的各種組合,效應(yīng)可以是主效應(yīng)、交互效應(yīng)、嵌套效應(yīng)和混合效應(yīng)。MODEL語句的選擇項有兩個:NOUNI 抑制單變量方差分析結(jié)果的輸出;INTERCEPT或INT 要求SAS將線性模型內(nèi)的截距(也稱為數(shù)據(jù)的總平均數(shù))當(dāng)作一個參數(shù),同時對該參數(shù)作是否為零的測驗。4MEANS語句計算并輸出所列的效應(yīng)對應(yīng)的依變量均數(shù)。其主要選擇項可分三類:多重比較選擇項 若指明了該選擇項,則將進行主效應(yīng)平均數(shù)間的測驗

20、,即多重比較。常用的多重比較方法選擇項如DUNCAN(Duncan新復(fù)極差法)、T或LSD(配對t測驗或Fisher氏最小顯著差數(shù)法)、SNK(Q測驗)、TUKEY(Tukey固定極差測驗)、DUNNETT和DUNNETU(Dunnett氏最小顯著差數(shù)兩尾和單尾測驗法)、BON、CABRIEL、REGWF、REGWQ、SCHEFFE、SIDAK、SMM(GT2)、WALLER等。統(tǒng)計顯著水平以ALPHA=P設(shè)定,如ALPHA=0.01設(shè)定顯著水平為0.01,缺省值為0.05。E=效應(yīng)名稱 規(guī)定F測驗的分母,若缺省則試驗設(shè)計的誤差的均方將自動成為分母。5FREQ語句指定頻次變量。其用法與第5章用

21、法相同。6TEST語句一般情況下,SAS默認(rèn)采用誤差的均方(MS Residual)作為F測驗的分母。但也可自定F測驗的分子和分母以進行不同的F測驗,該語句中H=分子,E=分母。如:“TEST H=A B E=A*B;”表示F=A/(A*B),F(xiàn)=B/(A*B)。7MANOVA語句當(dāng)MODEL中有一個以上依變量時,要求進行多變量的方差分析。8REPEATED語句指定在一個或多個獨立變量上對分析單位進行重復(fù)測量設(shè)計的分析。在某些情況下采用此語句可以精簡程序代碼。9BY語句要求按其指定變量分別進行方差分析。三、使用說明:設(shè)有三個因素A、B及C,一個觀測變量Y。(1)如果只考慮主效應(yīng),則需下列語句:

22、 PROC ANOVA: CLASS A B C; MODEL YA B C;(2)如果具有交叉因素,則需下列語句: PROC ANOVA; CLASS A B C; MODEL A B C A*B A*C B*C A*B*C;(3)如果A和B是主效應(yīng),C嵌套于A和B中(對A和B的每一組合,觀測到C的水平是不同的),則需下列語句: PROC ANOVA; CLASS A B C; MODEL YA B C(A B)其中C(AB)表示C嵌套于A和B中。再如C(A)表示C嵌套于A中。(4)如果既有嵌套又有交叉效應(yīng),則在MODEL語句中可同時使用*和()。例如: PROC ANOVA; CLASS

23、A B C; MOOEL YA B(A)C(A)B*C(A);四、輸出說明 (1)CLASS LEVEL INFORMATION分類水平信息。其中包括: CLASS CLASS語句中列出的效應(yīng)名。 LEVELS 因素效應(yīng)的水平數(shù)。 VALUES 因素效應(yīng)中各水平的值或標(biāo)記。 (2)SOURCE變異來源。 (3)SUM OF SOUARES(SS)平方和。 (4)MEAN SQUARE(MS)均方。 (5)F VALUE F值。其中MODEL(模型)的下值為MODEL(模型)的均方除以ERROR(誤差)的均方。用于檢驗?zāi)P椭兴行?yīng)均為零的假設(shè),以便說明模型的重要程度。 (6)PrF顯著水平。

24、(7)MODEL模型。它的平方和等于各因素效應(yīng)的平方和之和,其均方等于它的平方和除以自由度。 (8)ERROR誤差。 (9)CORRECTED TOTAL校正總變異。 (10)R-SQUANE R2,其值為模型的平方和除以校正總平方和。一般來說,R2值越大,模型擬合數(shù)據(jù)越好。(11)C.V變異系數(shù)。樣本的變異系數(shù)為該樣本的標(biāo)準(zhǔn)差除以均值,表示單位量的變異。 (12)ROOT MSE 誤差均方根,是觀測變量的標(biāo)準(zhǔn)差的估計值。(13)T TEST FOR VARIABLE 各處理平均數(shù)的多重比較T檢驗,凡有一個相同標(biāo)記字母的即為差異不顯著,凡具有不同標(biāo)記字母的即為差異顯著。 §7.3 G

25、LM(General Linear Model)過程GLM是General Linear Model(一般線性模型)的縮寫,用于非均衡數(shù)據(jù)方差分析。在SAS/STAT中,GLM過程的分析功能最多,回歸分析、方差分析、偏相關(guān)分析、協(xié)方差分析、多元方差分析等比較復(fù)雜的分析過程均可采用GLM過程。這里只介紹GLM過程在方差分析中的應(yīng)用。前面介紹的ANOVA過程只能用于均衡設(shè)計資料的方差分析,當(dāng)不均衡時,只能用采用GLM過程進行分析。一、過程格式PROC GLM 選擇項;CLASS 變量表;MODEL 依變量=效應(yīng)表/選擇項;MEANS 效應(yīng)表/選擇項;FREQ 變量名;TEST H=效果名稱 E=效

26、果名稱;MANOVA H=效果名稱 E=效果名稱 M=變量的轉(zhuǎn)換式PREFIX=新變量的名稱代號MNAMES=新變量名表 /選擇項;RANDOM 效應(yīng)表/選擇項;CONTRAST “對比說明” 各組效應(yīng)系數(shù)/選擇項;REPEATED 重復(fù)變量的名稱 組名 變量轉(zhuǎn)換/選擇項;BY 變量表;ID 變量表;二、語句說明CLASS語句和MODEL語句是必需的,且CLASS語必須出現(xiàn)在MODEL語句之前。1PROC GLM語句選擇項DATA=數(shù)據(jù)集 指定用來分析的數(shù)據(jù)集名,若缺省,則使用最新建立的數(shù)據(jù)集。ORDER=FREQ|DATA|INTERNAL|FORMATTED 指定某一變量下各類別的輸出次序

27、。FREQ按遞減計數(shù)次序排列;DATA按首先出現(xiàn)在輸入數(shù)據(jù)集中的順序放置;INTERNAL按值的內(nèi)部表示排列;FORMATTED按外部的格式排列。缺省值為ORDER=INTERNAL。MANOVA 要求PROC ANOVA語句將含一個或一個以上依變量缺失值的觀察值剔除。當(dāng)使用交互式進行方差分析時,最好指定此選擇項。OUTSTAT=數(shù)據(jù)集 輸出結(jié)果中含離差平方和(SS)、F值以及各試驗效果的顯著程度。NOPRINT 要求PROC GLM抑制分析結(jié)果在報表上的輸出。2RANDOM語句用于指定模型中的隨機效應(yīng)。在MODEL語句后可多次應(yīng)用RANDOM語句,若缺省則GLM過程將MODEL語句中的所有的

28、效應(yīng)為固定效應(yīng)。其選擇項有兩個:Q 要求輸出固定效應(yīng)的二次式函數(shù)值。TEST 要求對RANDOM語句中所指定的各項隨機效應(yīng)執(zhí)行適當(dāng)?shù)腇測驗,并且F測驗的分母完全根據(jù)各效應(yīng)的期望均方而定。需要注意的是:若某兩個主效應(yīng)被RANDOM指定為隨機效應(yīng),其交互項并沒有被相應(yīng)指定為隨機效應(yīng),需要特別指定。3CONTRAST語句用于對比測驗。比較式的名字必須放在引號內(nèi),其長度最多為20個字符,命名方式可隨意,但在其中不能出現(xiàn)“;”。各組效應(yīng)系數(shù)前必須注明所要比較的效應(yīng),這些效應(yīng)必須是MODEL語句中出現(xiàn)過的,這些系數(shù)的總和必須為0,而且只能是整數(shù)或小數(shù),各系數(shù)間以空格隔開。該語句的選擇項有:E規(guī)定輸出線性函

29、數(shù)的向量;E=效應(yīng)名稱 指定以E的效應(yīng)為CONTRAST中F測驗的分母,系統(tǒng)默認(rèn)值是誤差的均方(MS Error);ETYPE=1|2|3|4 用于指定計算E=效應(yīng)名稱中效應(yīng)的離差均方的類型。4PROC GLM過程中其他語句CLASS語句、MODEL語句、MEANS語句等參見PROC ANOVA過程。三、ANOVA過程和GLM過程中常用的數(shù)學(xué)模型在使用ANOVA和GLM過程進行方差分析時,關(guān)鍵在于定義線性數(shù)學(xué)模型。同一試驗資料選用不同的數(shù)學(xué)模型,結(jié)果將不同。因而需要依據(jù)試驗設(shè)計選定正確的線性數(shù)學(xué)模型。模型定義語句的一般格式是:依變量=線性模型效應(yīng)。線性模型效應(yīng)主要有三類:主效應(yīng) 直接寫出效應(yīng)變

30、量,如:a。交互效應(yīng) 以一個或多個以“*”號連接的變量表表示,如:a*b*c。嵌套效應(yīng) 假定自變量b嵌套在主效應(yīng)a中,則寫作:b(a)。常用的模型定義語句有:MODEL y=a; 單因素模型。MODEL y= a b; 兩因素主效模型。MODEL y=a b a*b; 兩因素主效帶互作的模型。MODEL y=a b(a); 嵌套(NESTED)模型,用于系統(tǒng)分組資料。在模型定義中,可以用“|”和“n”簡化模型效應(yīng)的表達?!皘”等價于將模型效應(yīng)從左到右展開,“n”表示互作效應(yīng)和嵌套效應(yīng)作用的最高元次。常用模型簡化表示法及其等價形式為:a|b 等價于a b a*ba|b|c 等價于a b a*b

31、c a*c b*c a*b*ca|b|c2 等價于a b a*b c a*c b*c a|c(b) 等價于a c(b) a*c(b)a(b)|c(b) 等價于a(b) c(b) a*c(b)a|b(a)|c 等價于a b(a) c a*c b(a)*ca|b(a)|c2 等價于a b(a) c a*ca(b)|b(d e) 等價于a(b) b(d e) 四、使用說明 (1)對平衡資料的方差分析可用ANOVA過程,也可用GLM過程。但前者效率更高。對于非平衡資料的方差分析只能用GLM過程。(2)設(shè)有如下數(shù)據(jù)(因素A有2個水平,因素日有2個水平):因素Np水平N1N2P110181616P2924

32、28 例7.3 程序示例如下:data new; input n$ p$ y; cards; n1 p1 10 n1 p1 18 n2 p1 16 n2 p1 16 n1 p2 9 n1 p2 . n2 p2 24 n2 p2 28proc glm; class n p; model y=n p n*p;run;上述程序中的數(shù)據(jù)也可用下面的方法讀入:例74 data new; do p=1 to 2; do n=1 to 2; input y; output; end; end; cards; 10 18 16 16 9 . 24 28proc glm; class n p; model y=

33、n p n*p;run;§7.4 單向分組資料的方差分析觀察值僅按一個方向分組,同組各供試單位受相同處理,不同組受不同處理,也稱完全隨機設(shè)計實驗。§7.4.1 組內(nèi)觀察值數(shù)目相等的單向分組資料的方差分析例7.5 研究6種氮肥施用法(K=6)對小麥的效應(yīng),每種施肥法種5盆小麥(n=5),完全隨機設(shè)計,最后測定它們的含氮量(mg),其結(jié)果見表10.1,試作方差分析。表10.1 種施肥法小麥植株的含氮量(mg)12345612.914.012.610.514.614.012.313.83.210.814.613.312.213.813.410.714.413.712.513.61

34、3.410.814.413.512.713.613.010.514.413.7由于組內(nèi)觀測值數(shù)目相等,故采用ANOVA過程分析。程序如下:1程序及說明/*數(shù)據(jù)來源:南京農(nóng)業(yè)大學(xué),田間試驗和統(tǒng)計方法,P102*/DATA new; DO i=1 TO 5; DO trt=1 TO 6; INPUT y; OUTPUT; END; END;DROP i; /*刪除臨時變量I */CARDS; 12.9 14.0 12.6 10.5 14.6 14.0 12.3 13.8 13.2 10.8 14.6 13.3 12.2 13.8 13.4 10.7 14.4 13.7 12.5 13.6 13.4

35、 10.8 14.4 13.5 12.7 13.6 13.0 10.5 14.4 13.7PROC ANOVA; /*調(diào)用ANOVA過程作方差分析*/CLASS trt; /*規(guī)定以trt為分類變量 */MODEL y=trt;MEANS trt/DUNCAN; /*選用新復(fù)極差法作多重比較 */RUN; 2輸出結(jié)果及說明 Analysis of Variance Procedure 方差分析過程 Class Level Information 處理水平信息 Class Levels Values 處理因素變量名 水平數(shù) 具體值 TRT 6 1 2 3 4 5 6 Number of obse

36、rvations in data set = 30 數(shù)據(jù)集中有30個觀察值Dependent Variable: Y 依變量名為y Sum of MeanSource DF Squares Square F Value Pr > F變異來源 自由度 平方和 均方 F值 概率值PModel 5 44.46300000 8.89260000 164.17 0.0001Error 24 1.30000000 0.05416667Corrected Total 29 45.76300000 R-Square C.V. Root MSE Y Mean所用模型的決定系數(shù) 變異系數(shù) 剩余標(biāo)準(zhǔn)差 依變量

37、均數(shù) 0.971593 1.786165 0.232737 13.0300000Source DF Anova SS Mean Square F Value Pr > F變異來源 自由度 平方和 均方 F值 概率值PTRT 5 44.46300000 8.89260000 164.17 0.0001 Analysis of Variance Procedure Duncan's Multiple Range Test for variable: Y 用DUNCAN法測驗 NOTE: This test controls the type I experimentwise erro

38、r rate under the complete null hypothesis but not under partial null hypotheses. Alpha= 0.05 df= 24 MSE= 0.054167 水平為0.05,自由度為24,MS誤差為0.054167 Number of Means 2 3 4 5 6 Critical Range 0.3038 0.3191 0.3289 0.3358 0.3410 兩兩比較時的界值,兩平均數(shù)之差大于該界值時則兩組有統(tǒng)計學(xué)差異 Means with the same letter are not significantly d

39、ifferent. 標(biāo)有相同字母的兩平均數(shù)間無差異 Duncan Grouping Mean N TRT 測驗結(jié)果 各組均數(shù) 例數(shù) 組別 A 14.4800 5 5 B 13.7600 5 2 B 13.6400 5 6 C 13.1200 5 3 D 12.5200 5 1 E 10.6600 5 4在輸出結(jié)果中,找CLASS語句指出的變量的Pr > F(概率)值。此例中,P0.0001,可得出各種施肥法間有極顯著差異。說明6種施氮法的植株含氮量是顯著不同的。用DUNCAN新復(fù)極差法測驗結(jié)果表明,除第2種施肥法和第6種施肥法之間的差異不顯著外,其余各種方法間的差異均達到Alpha= 0

40、.05水平,其中第5種施肥法的效果最好,其次是第2和第6種施肥法較好。§7.4.2 組內(nèi)觀察值數(shù)目不等的單向分組資料的方差分析例7.6 研究三塊麥田的基本苗數(shù),按面積比例抽取樣點,得三塊麥田各樣點的苗數(shù)分別為:21,29,24,22,25,30,27,26;20,25,25,23,29,31,24,26,20,21;24,22,28,25,21, 26。試作方差分析。1序及說明/*數(shù)據(jù)來源:南京農(nóng)業(yè)大學(xué),田間試驗和統(tǒng)計方法,P105*/DATA new; DO trt=1 TO 3; /* 變量trt代表不同麥田,其水平數(shù)是3 */ INPUT n; /* 變量n代表各組數(shù)據(jù)個數(shù) *

41、/ DO i=1 TO n; INPUT y; OUTPUT; END; END; DROP n i; CARDS; 8 21 29 24 22 25 30 27 26 10 20 25 25 23 29 31 24 26 20 21 6 24 22 28 25 21 26PROC GLM; CLASS trt; /* 指明分類變量trt */ MODEL y=trt; /* 指明單因素的效果模型 */RUN;2輸出結(jié)果及說明 General Linear Models Procedure Class Level Information Class Levels Values TRT 3 1

42、2 3 Number of observations in data set = 24Dependent Variable: Y Sum of MeanSource DF Squares Square F Value Pr > FModel 2 6.76666667 3.38333333 0.32 0.7314Error 21 223.73333333 10.65396825Corrected Total 23 230.50000000 R-Square C.V. Root MSE Y Mean 0.029356 13.18805 3.264042 24.7500000Source DF

43、 Type I SS Mean Square F Value Pr > FTRT 2 6.76666667 3.38333333 0.32 0.7314Source DF Type III SS Mean Square F Value Pr > FTRT 2 6.76666667 3.38333333 0.32 0.7314麥田間:F=0.32,P=0.7314>0.05,故三塊麥田的基本苗數(shù)是沒有顯著差異的。F測驗不顯著,不需再作平均數(shù)間的比較。§7.4.3 組內(nèi)又分亞組的單向分組資料的方差分析例7.7 在溫室內(nèi)以種培養(yǎng)液培養(yǎng)某作物,每種盆,每盆株,一個月后測定其

44、株高生長量(mm),得結(jié)果見表10.2,試作方差分析。表10.2 種培養(yǎng)液下的株高增長量(mm)培養(yǎng)液盆 號A1A2A3B1B2B3C1C2C3D1D2D3生長量50 55 40 3535 35 30 4045 40 40 5050 45 50 4555 60 50 5055 45 65 5585 60 90 8565 70 80 6570 70 70 7060 55 35 7060 85 45 7565 65 85 751程序及說明/*數(shù)據(jù)來源:南京農(nóng)業(yè)大學(xué),田間試驗和統(tǒng)計方法,P108*/DATA new; DO i=1 TO 4; /* i為亞組內(nèi)觀察值數(shù)*/ DO trt="A","B","C","D" /* trt為組 */ DO pot=1 TO 3; /* pot為亞組 */ INPUT y; OUTPUT; END

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論