第九章 SAS系統(tǒng)與屬性數(shù)據(jù)分析(SAS課件-北大光華 陳奇)_第1頁
第九章 SAS系統(tǒng)與屬性數(shù)據(jù)分析(SAS課件-北大光華 陳奇)_第2頁
第九章 SAS系統(tǒng)與屬性數(shù)據(jù)分析(SAS課件-北大光華 陳奇)_第3頁
第九章 SAS系統(tǒng)與屬性數(shù)據(jù)分析(SAS課件-北大光華 陳奇)_第4頁
第九章 SAS系統(tǒng)與屬性數(shù)據(jù)分析(SAS課件-北大光華 陳奇)_第5頁
已閱讀5頁,還剩110頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

SAS系統(tǒng)

與方差分析1

目錄

1.單因素方差分析2.多因素方差分析3.均值估計與比較4.非參數(shù)統(tǒng)計2

方差分析(ANOVA)方差分析(AnalysisofVariance,簡記為ANOVA)是分析試驗數(shù)據(jù)的一種常用統(tǒng)計方法.在方差分析中,我們把試驗數(shù)據(jù)(響應(yīng)變量)的總變差(總波動)分解為所考察因素(分類變量)的變差和由隨機(jī)因素引起的變差,然后通過分析比較這些變差來推斷哪些因素對指標(biāo)(響應(yīng)變量)影響最顯著,哪些不顯著.對多個均值進(jìn)行統(tǒng)計推斷通常使用方差分析.3單因素方差分析

方差分析的問題與模型:

為了比較不同配方和工藝條件對產(chǎn)品產(chǎn)量和質(zhì)量的影響,往往需要進(jìn)行多個總體均值的比較.方差分析就是對兩個或多個總體均值進(jìn)行比較最常用的一種統(tǒng)計方法.例如有k種不同的工藝條件,在方差分析中也稱每種工藝條件為一個水平,在每個水平下,例如在第i種水平下,產(chǎn)品產(chǎn)量的全體為一個總體,對此總體得到了產(chǎn)品產(chǎn)量的觀測樣本為Xi1,Xi2,…,Xin.希望由此對不同水平下總體的均值進(jìn)行比較.4單因素方差分析假設(shè)觀察到的Xij可用以下的模型表示:

Xij=

i+

ij

,1≤j≤n,1≤i≤k

其中

i表示第i種水平下產(chǎn)量的均值,

ij為第i種水平下產(chǎn)量的第j次觀測值所包含的隨機(jī)誤差,在方差分析中為了得到有效的檢驗法還常假定

ij

滿足:●

ij

為相互獨(dú)立的,即不同水平下觀測的樣本是相互獨(dú)立的;●

ij

都是正態(tài)分布的,且

ij

的均值都為0,方差也相同.5單因素方差分析

在上面的模型中,觀測到的數(shù)據(jù)的均值受一個因素不同水平的影響,即

i依賴于因素的第i個水平,這類問題稱為單因素問題,用以處理這類問題的統(tǒng)計方法稱為單因素的方差分析.要分析的變量(指標(biāo))X稱為因變量、響應(yīng)變量或分析變量.比較不同水平下均值是否相同的問題就歸為檢驗如下的假設(shè):

H0:

1

=

2=...=

k,H1:

1,

2,...,

k不全相等;

6單因素方差分析例(隔熱試驗的例子):為檢驗三種隔熱材料的效果進(jìn)行30次試驗,每種10次.比較三種材料的平均溫度變化是否一樣.對7單因素方差分析

方差分析模型在方差分析中: 指標(biāo)X(或稱因變量或響應(yīng)變量):記錄在各種試驗條件下的觀測結(jié)果; 若干個因素(或稱自變量或分類變量):設(shè)定觀測的試驗條件.分類變量的不同值又稱為水平.8看數(shù)據(jù)isi.insulate,QC.veneer單因素方差分析

方差分解與統(tǒng)計檢驗方差分析將觀測到的響應(yīng)變量的變差分解為由于分類變量不同水平產(chǎn)生的(組間)變差和隨機(jī)誤差(組內(nèi))進(jìn)行分析.9單因素方差分析

方差分解與統(tǒng)計檢驗--觀測數(shù)據(jù)

組均值10單因素方差分析

方差分解與統(tǒng)計檢驗單因素數(shù)據(jù)的方差分析(均值模型)或(效應(yīng)模型、線性模型)方差分解自由度分解組間組內(nèi)11單因素方差分析

方差分解與統(tǒng)計檢驗12單因素方差分析

方差分解與統(tǒng)計檢驗

方差分解與檢驗

C-TotalSS=SS(因素A)+ResidualSS

TotalDF=DF(A)+ResidualDF

MS(A)=SS(A)/DF(A)F(A)=MS(A)/ResidualMS

13Insight:Fit(XY),Insulate,Veneer,水平參數(shù)解釋=>驗證假定單因素方差分析

驗證方差模型的假定方差分析模型的假定:誤差項eij:同方差、零均值

相互獨(dú)立

正態(tài)分布(eij~N(0,

2))常用殘差的比較盒形圖和殘差分布QQ圖來驗證這些假定.違反這些假定會使方差分析的檢驗失效.14Univariate.Insight自動生成余差圖及數(shù)據(jù)單因素方差分析

例子--膠合板耐磨性試驗例1.1(膠合板耐磨性試驗)為了比較五種不同品牌的膠合板的質(zhì)量,從每種品牌中隨機(jī)抽取4個樣品作耐磨性試驗.記錄了每次試驗測量的板材磨損數(shù)量,數(shù)據(jù)存放在數(shù)據(jù)集SASUSER.VENEER中(見下表).該數(shù)據(jù)集有兩個變量:BRAND表示膠合板的品牌;WEAR表示測得的磨損數(shù)量.

膠合板磨損數(shù)據(jù)品牌磨損數(shù)量(每個牌子四個樣品)

ACME2.3,2.1,2.4,2.5CHAMP2.2,2.3,2.4,2.6AJAX2.2,2.0,1.9,2.1TUFFY2.4,2.7,2.6,2.7XTRA2.3,2.5,2.3,2.415單因素方差分析

例子--膠合板耐磨性試驗試用SAS菜單系統(tǒng)INSIGHT,分析家或用編程方法檢驗五種不同品牌的膠合板的質(zhì)量是否有顯著性差異?

在使用方差分析之前,利用圖形進(jìn)行直觀地比較結(jié)果是有益的.在Insight中打開SASUSER.VENEER,比較不同牌子的膠合板磨損數(shù)量:16單因素方差分析

用INSIGHT進(jìn)行探索數(shù)據(jù)選分析(Analyze)→盒形圖/馬賽克圖(BoxPlot/MosaicPlot)(Y)→在彈出的對話窗選中品牌BRAND,點(diǎn)擊X→選中磨損數(shù)量WEAR,點(diǎn)擊Y→確定(OK)。則在輸出結(jié)果窗中給出5種不同牌子的盒形圖.

17單因素方差分析

用INSIGHT進(jìn)行探索數(shù)據(jù)18單因素方差分析

用INSIGHT進(jìn)行探索數(shù)據(jù)

為了更清楚地顯示不同牌子的膠合板的均值和方差的信息,可在圖形左下角的下拉菜單中選中:

均值(Means)、值(Values)和取消觀測(Observations).

從圖上可以看出,五種牌子測試結(jié)果標(biāo)準(zhǔn)差的差異并不顯著(菱形的高度差異不大),均值間有一定的差異.但在統(tǒng)計上差異是否顯著還需要行方差分析.19單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

探索完數(shù)據(jù)以后,接著進(jìn)行方差分析.在使用Insight進(jìn)行方差分析時自變量X必須是列名型的。

選分析(Analyze)→擬合(Fit)(XY)→在彈出的擬合窗選中自變量BRAND,點(diǎn)擊X

→選中因變量WEAR,點(diǎn)擊Y→確定(OK).在隨即顯示的分析結(jié)果中包含若干個表:第一個表提供擬合模型的一般信息:(1)WEAR=BRAND表示這個分析是以WEAR為因變量,BRAND為自變量的線性模型;20單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

(2)響應(yīng)分布是正態(tài)分布,因為這是缺省的分布,要這一分析成立,誤差項應(yīng)該是近似正態(tài)分布的.(3)關(guān)聯(lián)函數(shù)提供數(shù)據(jù)中響應(yīng)變量和模型中的響應(yīng)變量間的聯(lián)系.在這個例子中,因為在模型擬合前沒有對響應(yīng)變量進(jìn)行任何變換,所以關(guān)聯(lián)函數(shù)是恒等函數(shù):g()=.21單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

第二、第三張表提供自變量的取值水平的信息:

即BRAND為列名型的,有五個水平,在設(shè)定標(biāo)識變量的時侯,P_2、P_3、P_4、P_5和P_6分別為ACME、AJAX、CHANP、TUFFY和XTRA五個牌子的標(biāo)識變量.22單因素方差分析

用INSIGHT進(jìn)行單因素方差分析為了用一般線性模型來描述因變量Wear與自變量Brand(因素或分類變量)間的線性關(guān)系式,把分類變量Brand數(shù)量化,引入4個標(biāo)識變量Z1,Z2,Z3,Z4,并令

BrandZ1Z2Z3Z4ACME1000AJAX0100CHANP0010TUFFY0001XTRA000023單因素方差分析

用INSIGHT進(jìn)行單因素方差分析以下把方差分析模型寫成一般線性模型:(注意:

k

=0)當(dāng)取第i個水平時,即(zi1,…,zi(k-1))=(0,…,1,…,0)(第i個元素為1的k-1維向量).

若用INSIGHT的記號,線性模型表為:當(dāng)取第i個水平時,即(P_2,…,P_k)=(0,…,1,…,0),(此例k=5,為第i個元素為1的4維向量).24單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

第四張表給出響應(yīng)變量均值關(guān)于自變量不同水平的模型方程式:

若變量BRAND(牌子)為ACME,則P_2為1,其他為0;若牌子為AJAX,則P_3為1,其他為0,以此類推.

由模型方程式可得出各品牌下磨損量均值的估計值.如品牌ACME的磨損量均值估計為2.3750-0.05=2.325;而品牌XTRA的磨損量均值為2.3750.25單因素方差分析

用INSIGHT進(jìn)行單因素方差分析第五張表給出模型擬合的匯總信息:1、響應(yīng)變量的均值(MeanofResponse),即變量WEAR20次試驗結(jié)果的平均值2.3450;2、均方誤差平方根(RootMSE)為誤差項(假定誤差項有等方差)的標(biāo)準(zhǔn)差的估計值。3、R平方是判定(決定)系數(shù)(coefficientofdetermination),闡明了自變量所能描述的變化在全部校正平方和中的比例。它的值總在0和1之間,若其值:26單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

1)接近于0,自變量(因素)不能說明指標(biāo)數(shù)據(jù)的大部分變異;2)接近于1,自變量說明數(shù)據(jù)的變化中的一個相對較大的比例.雖然希望R平方接近于1,但對R平方大小的判定還依賴于問題的具體內(nèi)容。4、校正R平方(AajR-Sq)是類似于R平方的統(tǒng)計量,但它隨模型中的參數(shù)的個數(shù)而修正,尤其在回歸分析中比較擬合同一數(shù)據(jù)的不同模型時,校正R平方是有用的。27單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

第六張方差分析表包含對模型效果顯著性的假設(shè)檢驗H0:

1

=

2=...=

k1、一般,自由度(DF)可想象為獨(dú)立信息源的個數(shù).①模型自由度(ModelDF)是處理數(shù)5減1;②校正平方和的總自由度(Ctotal)是樣本容量20減1;28單因素方差分析

用INSIGHT進(jìn)行單因素方差分析2、模型平方和(SSModel)匯總了組間差異;

誤差平方和(SSError)匯總了組內(nèi)差異;全部校正平方和(SSC-Total)=SSM+SSE。3、均方(MeanSquare)是由平方和被相應(yīng)的自由度相除而得到的。

F統(tǒng)計量=模型均方(MSModel)/

誤差均方(MSError)比較F統(tǒng)計量相應(yīng)的p值,若p值<0.05=α,則拒絕原假設(shè),反之則接受原假設(shè)。在這里,p值=0.0017小于0.05,所以拒絕原假設(shè),即不同牌子的膠合板的磨損數(shù)量有顯著差異。29單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

III型檢驗用于檢驗因素(自變量)brand對指標(biāo)(響應(yīng)變量)wear的作用是否顯著.單因素方差分析只考慮一個因素,故第七張表提供與第六張表本質(zhì)相同的內(nèi)容(就是第六張表的第一行).30單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

在參數(shù)估計表中,有關(guān)于不同水平下磨損數(shù)量差異的估計和檢驗:1、根據(jù)標(biāo)識變量規(guī)定的方法,截距項的估計2.3750是對應(yīng)牌子XTRA(該因素的最后一個水平)的磨損數(shù)量的均值,其后的t檢驗是檢驗這一均值是否為0(H0:

k=0)31單因素方差分析

用INSIGHT進(jìn)行單因素方差分析

2、ACME后的估計-0.0500是牌子ACME與XTRA磨損量均值之差(

1-

k=

1)的估計值,其后的t檢驗也是檢驗這兩個磨損量均值之差

1是否為0.

由于p值為0.6313>0.05,所以ACME和XTRA兩個牌子的磨損指數(shù)沒有顯著差異的.從這里我們還可以得到

1的估計值為2.375-0.050=2.325.

32單因素方差分析

用INSIGHT進(jìn)行單因素方差分析3、在表中還有容差(Tolerance)和方差膨脹因子(Varianceinflationfactors),在單因素方差分析中沒有提供什么信息,在多元回歸分析中將考察這些統(tǒng)計量.

再接下來的一行AJAX后的估計-0.325是品牌AJAX與XTRA磨損量均值之差的估計值,并檢驗均值差是否為0.由于p值為0.0062<0.05,這說明這兩個品牌的磨損量均值有顯著差異.其余幾行也是估計和檢驗別的品牌與XTRA磨損量均值的差異.33單因素方差分析

用INSIGHT進(jìn)行單因素方差分析--考察模型假定

在顯示結(jié)果窗的底部有一個殘差對預(yù)測值的散點(diǎn)圖,這個圖可以幫助校驗?zāi)P偷募俣?從圖中看出,殘差有大體隨機(jī)的散布,它表明等方差的假設(shè)并沒問題.

34單因素方差分析

用INSIGHT進(jìn)行單因素方差分析--考察模型假定

為了驗證殘差為正態(tài)分布的假定,回到數(shù)據(jù)窗.可以看到殘差和預(yù)測值已加到數(shù)據(jù)集之中,可以用分布Distribution(Y)來驗證殘差的正態(tài)性.選:1、分析(Analyze)→分布(Distribution)(Y),R_WEAR→Y,→OK;2、曲線(Curves)→分布檢驗(TestforDistribution)→選中正態(tài)

在TestforDistribution表中看到,p值大于0.05,不能拒絕原假設(shè),表明沒有破壞正態(tài)性的假定.35單因素方差分析

用分析員應(yīng)用作單因素方差分析

1、在分析員應(yīng)用中打開SASUSER.VENEER;2、選統(tǒng)計

→方差分析

單向方差分析;3、在彈出的單向ANOVA窗中選模型的因變量和變量:BRAND→Independent,WEAR→Dependent;若要作圖或進(jìn)行多重比較,可點(diǎn)擊Plots或Means.比如在這里我們點(diǎn)擊Plots鍵,并選擇繪制均值圖,在均值圖選項中條形高度選為2倍均值的標(biāo)準(zhǔn)差→OK→OK.36單因素方差分析

用分析員應(yīng)用作單因素方差分析

37單因素方差分析

用分析員應(yīng)用作單因素方差分析

輸出的方差分析表,匯總統(tǒng)計量及單個因素對指標(biāo)作用是否顯著的檢驗結(jié)果見下表.匯總信息方差分析表因素效應(yīng)的檢驗38單因素方差分析

用分析員應(yīng)用作單因素方差分析

因素Brank(品牌)各水平下磨損量的均值圖39單因素方差分析

ANOVA和GLM過程的簡單用法PROCGLMDATA=數(shù)據(jù)集名;

CLASS變量名列;

MODEL

因變量名列=自變量名列;RUN;在SAS/STAT模塊中提供多個PROC實現(xiàn)方差分析的功能:

GLM:一般線性模型,有均值檢驗與比較功能;ANOVA:用于均衡設(shè)計觀測數(shù)據(jù)的方差分析;TTEST:兩獨(dú)立樣本均值的比較.其他:NESTED,VARCOMP,REG,CATMOD,NPAR1WAYPLAN

40Anv001,011,012Veneer多因素交互TST089Factorial(3x5x6)單因素方差分析

ANOVA和GLM過程的簡單用法--例子

例1.1(膠合板磨損試驗):為比較5種不同品牌產(chǎn)品的質(zhì)量,每種抽取4個做磨損試驗.試用編程的方法比較5種品牌的質(zhì)量有無顯著差異.解:procanovadata=veneer;classbrand;modelwear=brand;run;或

procglmdata=veneer;classbrand;modelwear=brand;run;(Anova11.sas)結(jié)論:由方差分析表或因素的效應(yīng)檢驗結(jié)果可知:

F=7.40,

p=0.0017<0.05故五種品牌的質(zhì)量有顯著差異.41單因素方差分析

ANOVA和GLM過程的簡單用法--例子

例1.2(飼料對比試驗):為比較3種不同的飼料配方對養(yǎng)雞增肥的效果,每種飼料配方各喂養(yǎng)10只小雞,于60天后測量其重量.試用編程的方法比較3種飼料配方對小雞增肥的效果有無顯著差異.(Anova12.sas)datad12(drop=i);

inputtype$@;

doi=1

to

10;

inputy@@; output;

end;cards;A1073105810711037106610261053104910651051B1016105810381042102010451044106110341049C1084106911061078107510901079109411111092;解:42單因素方差分析

ANOVA和GLM過程的簡單用法--例子proc

anova

data=d12;

classtype;

modely=type;

meanstype;run;proc

glm

data=d12;

classtype;

modely=type;run;quit;ANOVA過程輸出的方差分析表43單因素方差分析

ANOVA和GLM過程的簡單用法--例子ANOVA過程輸出的各水平下均值的估計值結(jié)論:飼料配方對小雞增肥的效果有顯著影響;且配方C對小雞增肥的效果最好.44多因素方差分析

在上面介紹的單因素方差分析中,所研究的指標(biāo)(因變量)只受一個因素(自變量)不同水平的影響。但在一些實際問題中,影響指標(biāo)(因變量)的因素(自變量)不止一個,這就要考慮兩個或多個因素的問題.另這些因素間還可能存在交互作用,即這些因素的水平之間的不同搭配對指標(biāo)可能有影響.45多因素方差分析

不存在交互作用的多因素方差分析

例2.1(驅(qū)蟲劑藥效試驗):在數(shù)據(jù)集PESTCIDE中,記錄了用五種不同配方的驅(qū)蟲劑在三個住宅中實驗的結(jié)果,變量PCTLOSS記錄了驅(qū)蟲劑使用一周后藥效損耗的百分比,這是衡量驅(qū)蟲劑持續(xù)使用效果的主要標(biāo)志,分類變量BLOCK和BLEND分別表示該實驗所在的住宅和驅(qū)蟲劑的代號。確定哪種驅(qū)蟲劑最長效是實驗的主要目的。但是因為環(huán)境條件不同一種驅(qū)蟲劑在不同的住宅可能有不同的效果。若將不同驅(qū)蟲劑使用于不同的住宅,則會將驅(qū)蟲劑不同的差異與住宅不同的影響混淆在一起,無法區(qū)分出好的驅(qū)蟲劑,為此可在每個住宅的不同房間隨機(jī)地試用一種驅(qū)蟲劑。試用方差分析將驅(qū)蟲劑不同和住宅不同的影響區(qū)分開來。這種實驗方式又稱隨機(jī)化實驗。每個住宅稱為一個區(qū)組。46多因素方差分析

不存在交互作用的多因素方差分析47多因素方差分析

不存在交互作用的多因素方差分析

較為一般的是考慮有重復(fù)觀測的情形。若第一個因素A有l(wèi)個水平,第二個因素B有m水平。在因素A的第i個水平和因素B的第j個水平下進(jìn)行了多次觀測,記為{Xijk,1≤k≤n},對Xijk考慮以下模型:

Xijk=μ+αi+τj+εijk

,(1≤k≤n,1≤i≤l,1≤j≤m)

其中μ表示總平均的效應(yīng),αi

和τj分別表示因素A的第i個水平和因素B的第j個水平的附加效應(yīng),εijk為誤差,同樣這里的誤差也假定它是獨(dú)立的并且是等方差的正態(tài)分布。

以上模型中假設(shè)兩因素沒有存在交互作用.48多因素方差分析

不存在交互作用的多因素方差分析

為了說明因素A對指標(biāo)X有無顯著影響,就是要檢驗如下假設(shè):

H0:α1

=α2=…=αl

=0

,H1:α1,α2,…,αl不全等于0;

為了說明因素B對指標(biāo)X有無顯著影響,就是要檢驗如下假設(shè):

H0:τ1=τ2=…=τm

=0

,H1:τ1,τ2,…,τm不全等于0;而模型無顯著效果是指以上兩個假設(shè)的原假設(shè)同時成立。49多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

1、在Insight中打開PESTCIDE;2、由于在Insight中,要求方差分析中的自變量必須是列名型的,故先把變量BLOCK的測量水平由區(qū)間型改為列名型;

3、分析(Analyze)→擬合(Fit)(XY),

規(guī)定分類變量(因素)BLOCK→X,BLEND→X,規(guī)定響應(yīng)變量(指標(biāo))PCTLOSS→Y;

在隨即顯示的分析結(jié)果中的幾張表的含義與單因素方差分析相應(yīng)的表的功能是類似的:50多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

第一張表提供了模型的一般信息.第二張表列舉了作為分類變量的BLOCK和BLEND的水平的信息:51多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

第三張參數(shù)信息表給出了標(biāo)識變量P_i的定義:當(dāng)BLOCK=1時,P_2=1,而P_3=0,P_4=0;否則P_2=0,而某個P_i=1(i=3或4).其他類似;當(dāng)BLEND=A時,P_5=1,而其余P_i=0(i=6,7,8,9);否則P_5=0,而某個P_i=1(i>=6).其他類似.當(dāng)BLOCK=2,BLEND=C時,P_3=1,P_7=1,其余的P_i=0(i=2,4,5,6,8,9)52多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

第四張表給出了模型方程:利用參數(shù)信息表中標(biāo)識變量的定義可以推算出在各個因素不同水平下變量PCTLOSS均值的估計信息。

比如當(dāng)BLOCK=1,BLEND=A時,變量PCTLOSS均值的估計值為19.16-0.8-1.8333=16.5267.

當(dāng)BLOCK=3,BLEND=E時,變量PCTLOSS均值的估計值為19.16.53多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

兩因素方差分析對應(yīng)的一般線性模型為(l=3,m=5):54多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

第五張擬合匯總表中:提供了變量PCTLOSS的全部觀測的樣本均值為17.54,判定系數(shù)為0.6538等;比如當(dāng)BLOCK=1,BLEND=A時,變量PCTLOSS均值的估計值為=19.16-0.8-1.8333=16.5267.55多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

在第六張方差分析表中:檢驗?zāi)P惋@著性的F統(tǒng)計量為2.52,相應(yīng)的p值為0.1133>0.05=α;所以無法拒絕BLEND和BLOCK對分析變量(指標(biāo))PCTLOSS無顯著影響的假設(shè),即模型是不顯著的.56多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

在第七張Ⅲ型(各因素效應(yīng))檢驗表中:進(jìn)一步將模型平方和分解為屬于BLOCK和BLEND的平方和。在模型顯著的情況下常需要進(jìn)一步分析兩個因素是否都有顯著影響或者只有一個因素是顯著的,這時就需要用到這張表提供的信息。在這里兩個因素的p值都大于0.05,再一次說明了這兩個因素對指標(biāo)PCTLOSS都無顯著影響。57多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

第九張表為參數(shù)(均值或效應(yīng))的估計表.58多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

第九張參數(shù)估計表(l=3,m=5):

參數(shù)估計表也是根據(jù)標(biāo)識變量的定義,對參數(shù)或不同水平下參數(shù)之差進(jìn)行估計和檢驗.

例如第一行是對BLOCK=3,BLEND=E水平下均值

35(

lm)的估計和檢驗;第二行是BLOCK=1,BLEND=E水平下的均值

15與BLOCK=3,BLEND=E水平下的均值

35之差

15的估計與檢驗.根據(jù)t統(tǒng)計量的p值來檢驗兩個水平下均值是否有顯著差異.59多因素方差分析

用Insight作多因素方差分析并進(jìn)行說明

考察模型假定:

在顯示窗的底部有一個殘差對預(yù)測值的散點(diǎn)圖,可以象單因素分析一樣考察殘差分布的正態(tài)性假定.60多因素方差分析

用分析員應(yīng)用作多因素方差分析

在分析員應(yīng)用環(huán)境下調(diào)入數(shù)據(jù)后,選:

統(tǒng)計→方差分析(ANOVA)→因子方差分析,

PCTLOSS→Dependent,BLEND、BLOCK→Independent;

若要得到用圖形表示的兩個因素不同水平下均值和標(biāo)準(zhǔn)差的信息,可按Plots鍵,在MeansPlots框中選上PlotsDependent

MeansforMainEffects(作主效應(yīng)響應(yīng)均值圖)。

61多因素方差分析

用編程作多因素方差分析datapestcide;inputblockblend$pctloss@@;cards;1B18.21A16.31C17.01E18.31D15.12A16.52E18.32B19.22C18.12D16.03B17.13D17.83C17.33E19.83A17.5;Procanovadata=pestcide;classblockblend;modelpctloss=blockblend;Run;Quit;(anova21.sas)62多因素方差分析

用編程作多因素方差分析

由方差分析表可得出①模型的均方MSM=2.2006667誤差的均方MSE=0.874(作為

2的估計)②F統(tǒng)計量的值為2.52,相應(yīng)的顯著性概率值

p=0.1133>0.05,這表明在=0.05的水平下不能否定Block和Bland對指標(biāo)沒有顯著影響的假設(shè)(

i=0且j=0).63多因素方差分析

用編程作多因素方差分析由各因素效應(yīng)檢驗的結(jié)果可得出①檢驗H0:α1

=α2=…=αl

=0

,F(xiàn)統(tǒng)計量的值為0.94,相應(yīng)的顯著性概率值

p=0.4289>0.05,這表明在=0.05的水平下不能否定Block對指標(biāo)沒有顯著影響的假設(shè).②檢驗H0:τ1=τ2=…=τm

=0

,F(xiàn)統(tǒng)計量的值為3.31,相應(yīng)的顯著性概率值

p=0.0705>0.05,這表明在=0.05的水平下不能否定Bland對指標(biāo)沒有顯著影響的假設(shè).③兩個因素中Bland比Block重要些(0.07<0.42)64多因素方差分析

存在交互作用的多因素方差分析

在多因素的問題中,例如考察添加劑和工藝條件對產(chǎn)品產(chǎn)量的影響,不同的添加劑會要求不同的工藝條件,在一種工藝條件下有效的添加劑,在另一種工藝條件下可能是完全無效的.這種現(xiàn)象,就是兩者對產(chǎn)量的影響不是兩者效果的簡單疊加,而是兩種因素不同水平之間的搭配對產(chǎn)量有影響.在方差分析中稱為兩個因素存在交互作用.65多因素方差分析

存在交互作用的多因素方差分析—例2.2

例2.2(肥料和種子對產(chǎn)量的影響):在數(shù)據(jù)集DST.FCTORIAL中,記錄了不同的種子處理方法和不同施肥水平對農(nóng)作物產(chǎn)量的影響.變量YIELD表示產(chǎn)量,METHOD和VARIETY分別表示處理方法和施肥水平.關(guān)心的是這兩個因素對產(chǎn)量的影響,在這個例子中,不同的種子處理方法對不同的施肥水平可能有不同的反應(yīng),所以要考慮存在交互作用的模型.

66多因素方差分析

存在交互作用的多因素方差分析

對于存在交互作用的觀測{Xijk},采用以下的模型:

Xijk=μ+αi+τj+γij+εijk

,

(1≤k≤n,1≤i≤l,1≤j≤m)其中μ表示平均的效應(yīng),αi

和τj分別表示因素A的第i個水平和因素B的第j個水平的附加效應(yīng),γij表示因素A的第i個水平和因素B的第j個水平交互作用的附加效應(yīng).εijk為誤差,這里也假定它是獨(dú)立的并且是等方差的正態(tài)分布.67多因素方差分析

存在交互作用的多因素方差分析

為了說明交互作用有無顯著影響,就是要檢驗如下假設(shè):

H0:γ11

=γ12

=…=γlm=0

,H1:γ11

、γ12

、…、γlm不全為零;

所以在多因素方差分析中,在多因素?zé)o交互作用方差分析所作檢驗的基礎(chǔ)上,還要加上對有無交互作用的檢驗.

68多因素方差分析

用分析員應(yīng)用作多因素方差分析—例2.2

在分析員應(yīng)用環(huán)境下調(diào)入數(shù)據(jù)后,選:1、統(tǒng)計→方差分析→因子方差分析,

YIELD→Dependent,METHOD、VARIETY→Independent;2、點(diǎn)擊Model,在彈出的建模菜單中選:點(diǎn)StandardModels→選Effectsupto2-wayinteractions。注意表示交互作用的VARIETY*METHOD加入了模型效應(yīng)攔。顯示的結(jié)果也包含方差分析表和匯總信息。69多因素方差分析

用分析員應(yīng)用作多因素方差分析—例2.2

方差分析表匯總信息Ⅲ型檢驗表--各因素效應(yīng)的檢驗70多因素方差分析

用分析員應(yīng)用作多因素方差分析—例2.2

處理方法和施肥水平的產(chǎn)量均值圖71多因素方差分析

用編程作多因素方差分析—例2.2

(anova22.sas)datafctorial;

inputmethod$varietyyield@@;

cards;A122.1A124.1A119.1A122.1A125.1…………C514.3C521.3C56.3C57.8C513.8;proc

anova

data=fctorial;

classmethodvariety;

modelyield=methodvarietymethod*variety;meansmethod|variety;run;quit;72多因素方差分析

用編程作多因素方差分析—例2.2

73多因素方差分析

用編程作多因素方差分析—例2.274多因素方差分析

用編程作多因素方差分析—例2.2

結(jié)論:(1)由方差分析表可得出:F統(tǒng)計量的值為4.87,相應(yīng)的顯著性概率值

p<0.0001<0.05,這表明在=0.05的水平下有足夠證據(jù)否定兩因素及交互作用對指標(biāo)沒有顯著影響的假設(shè).

(2)

由各因素效應(yīng)檢驗的結(jié)果可得出:①對因素METHOD檢驗H0:α1

=α2=…=αl

=0

(l=3)

F統(tǒng)計量的值為24.25,相應(yīng)的顯著性概率值

pA<

0.0001<0.05,這表明在=0.05的水平下有足夠證據(jù)否定因素A對指標(biāo)沒有顯著影響的假設(shè)(即因素A對指標(biāo)影響顯著).75多因素方差分析

用編程作多因素方差分析—例2.2

②對因素VARIETY檢驗H0:τ1=…=τm=0

(m=5)

F統(tǒng)計量的值為0.14,相應(yīng)的顯著性概率值

pB=0.9648>0.05,這表明在=0.05的水平下不能否定因素VARIETY對指標(biāo)沒有顯著影響的假設(shè)(即對指標(biāo)沒有影響顯著).③檢驗H0:γ11

=γ12

=…=γlm=0

,F(xiàn)統(tǒng)計量的值為2.38,相應(yīng)的顯著性概率值

pA*B=0.0241<

0.05,這表明在=0.05的水平下可以否定兩因素的交互作用對指標(biāo)沒有顯著影響的假設(shè)(即有交互作用).76多因素方差分析

用編程作多因素方差分析—例2.2

(3)因交互效應(yīng)METHOD*AARIETY對指標(biāo)的影響顯著,尋找最佳生產(chǎn)條件時:比較因素METHOD各水平的均值,最大者(23.01)即為從因素METHOD中選出最佳的生產(chǎn)水平(A);比較METHOD*AARIETY各水平的均值,最大者(25.9667)即選出最佳的生產(chǎn)水平(A*4);則最佳的生產(chǎn)條件為:處理方法為A,且施肥水平為第4種,其產(chǎn)量均值為25.9667.77多因素方差分析

用編程作多因素方差分析—例2.3

(anova23.sas)

例2.3(橡膠配方試驗):在某種橡膠配方中,考慮了三種不同的促進(jìn)劑(A),四種不同份量的氧化鋅(B),相同的配方試驗兩次,測得指標(biāo)Y(300%的定強(qiáng))如下表:

B1B2B3B4A131,3334,3635,3639,38A233,3436,3737,3938,41A335,3737,3839,4042,44試問:因素A,B以及它們的交互作用對指標(biāo)Y有無顯著的影響?什么是主要矛盾?最佳的生產(chǎn)條件是什么?78多因素方差分析

用編程作多因素方差分析—例2.3

(anova23.sas)

解:(1)首先生成數(shù)據(jù)集D23.Datad23(drop=i);infiledatalinesdlm=‘,‘;doa=‘A1’‘A2’,‘A3’;

dob=‘B1’,‘B2’,‘B3’,‘B4’;doi=1,2;inputy@@;output;end;end;end;datalines;31,3334,3635,3639,3833,3436,3737,3938,4135,3737,3839,4042,44;79多因素方差分析

用編程作多因素方差分析—例2.3

(2)調(diào)用ANOVA過程(或GLM)進(jìn)行方差分析.proc

anova

data=d23;/*或procglmdata=d23;*/

classab;

modely=a|b;/*等價于modelaba*b;*/

meansa|b;run;quit;(anova23.sas)方差分析表80多因素方差分析

用編程作多因素方差分析—例2.3

因素各水平均值的估計值匯總統(tǒng)計量主效應(yīng)和交互效應(yīng)的平方和及檢驗.81多因素方差分析

用編程作多因素方差分析—例2.3

82多因素方差分析

用編程作多因素方差分析—例2.3

結(jié)論:(1)由方差分析表可得出:F統(tǒng)計量的值為12.06,相應(yīng)的顯著性概率值

p<0.0001<0.05,這表明在=0.05的水平下有足夠證據(jù)否定兩因素及交互作用對指標(biāo)沒有顯著影響的假設(shè).

(2)

由各因素效應(yīng)檢驗的結(jié)果可得出:①對因素A檢驗H0:α1

=α2=…=αl

=0

(l=3),F統(tǒng)計量的值為19.40,相應(yīng)的顯著性概率值

pA=0.0002<0.05,這表明在=0.05的水平下有足夠證據(jù)否定因素A對指標(biāo)沒有顯著影響的假設(shè)(即因素A對指標(biāo)影響顯著).83多因素方差分析

用編程作多因素方差分析—例2.3

②對因素B檢驗H0:τ1=τ2=…=τm=0

(m=4)

,F(xiàn)統(tǒng)計量的值為30.20,相應(yīng)的顯著性概率值

pB<0.0001<0.05,這表明在=0.05的水平下有足夠證據(jù)否定因素B對指標(biāo)沒有顯著影響的假設(shè)(即因素A對指標(biāo)影響顯著).③檢驗H0:γ11

=γ12

=…=γlm=0

,F(xiàn)統(tǒng)計量的值為0.54,相應(yīng)的顯著性概率值

pA*B=0.7665>0.05,這表明在=0.05的水平下不能否定因素A和B的交互作用對指標(biāo)沒有顯著影響的假設(shè)(即沒有交互作用).84多因素方差分析

用編程作多因素方差分析—例2.3

④因為pB<0.0001<pA=0.0002,這表明在兩個因素中因素B比因素A重要些.

(3)因交互效應(yīng)A*B對指標(biāo)的影響不顯著,尋找最佳生產(chǎn)條件時:比較因素A各水平的均值,由最大值(39)即可從因素A中選出最佳的生產(chǎn)水平(A3);比較因素B各水平的均值,由最大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論