第五章 方差分析_第1頁
第五章 方差分析_第2頁
第五章 方差分析_第3頁
第五章 方差分析_第4頁
第五章 方差分析_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第五章方差分析第1頁,共99頁,2023年,2月20日,星期三5.1方差分析中的有關(guān)概念5.1.1單因素方差分析問題與模型5.1.2雙因素方差分析問題與模型5.1.3方差分析中的基本假定第2頁,共99頁,2023年,2月20日,星期三在現(xiàn)實的生產(chǎn)和經(jīng)營管理中,經(jīng)常要分析各種因素對研究對象某些特征值的影響.方差分析(analysisofvariance)就是采用數(shù)理統(tǒng)計方法對數(shù)據(jù)進行分析,以鑒別各種因素對研究對象的某些特征值影響大小的一種有效方法.研究對象的特征值,即所考察的試驗(其涵義包括調(diào)查,收集等)結(jié)果(如產(chǎn)品質(zhì)量、數(shù)量、銷量、成本等)稱為試驗指標(biāo),簡稱指標(biāo),常用x表示.在試驗中對所關(guān)心的“指標(biāo)”有影響的、要加以考察而改變狀態(tài)的原因稱為因素,用A,B,C等大寫英文字母表示.方差分析的基本思想第3頁,共99頁,2023年,2月20日,星期三5.1.1單因素方差分析問題與模型1.數(shù)學(xué)模型進行單因素方差分析時,需要得到如圖5-1所示的數(shù)據(jù)結(jié)構(gòu)。設(shè)xij表示第i個總體的第j個觀測值(i=1,2,…,m,j=1,2,…,ni),希望由此對不同水平下總體的均值進行比較。觀測值(j)A因素(i)A1A2…Am1x11x21…xm12x12x22…xm2……………ni…第4頁,共99頁,2023年,2月20日,星期三對此,觀察到的xij常用以下的模型表示:xij=i+ij

,1≤j≤ni,1≤i≤m其中i表示第i個總體的均值,ij為隨機誤差,在方差分析中為了得到有效的檢驗法還常假定ij滿足:●ij為相互獨立的;●ij都服從正態(tài)分布,且ij的均值都為0,方差都相同。第5頁,共99頁,2023年,2月20日,星期三2.方差分析的過程為了方便起見,可將i記為:i=+i其中稱為總均值,i=i–,i=1,2,…,m稱為因素A的第i個水平的附加效應(yīng),這樣比較不同水平下均值是否相同。問題的檢驗假設(shè):

H0:1=2=…=m,H1:1,2,…,m不全相等;就可以表示為:

H0:1=2=…=m=0,H1:1,2,…,m不全為零。第6頁,共99頁,2023年,2月20日,星期三在H0成立下檢驗用統(tǒng)計量:其中、稱為組間、組內(nèi)(變差)平方和;這里稱為組內(nèi)平均;稱為總平均,n=n1+n2+…+nm;另外稱為全部(變差)平方和;可以證明SST=SSMA+SSE。第7頁,共99頁,2023年,2月20日,星期三當(dāng)原假設(shè)成立時,各總體均值相等,各樣本均值間的差異應(yīng)該較小,模型平方和也應(yīng)較小,F(xiàn)統(tǒng)計量取很大值應(yīng)該是稀有的情形。所以對給定顯著性水平α(0,1),若p=P{F

F0}<α,則拒絕原假設(shè)H0(F0為F統(tǒng)計量的觀測值),可以認(rèn)為所考慮的因素對響應(yīng)變量有顯著影響;否則不能拒絕H0,認(rèn)為所考慮的因素對響應(yīng)變量無顯著影響。第8頁,共99頁,2023年,2月20日,星期三3.方差分析表通常將上述計算結(jié)果表示為表5-1所示的方差分析表。表5-1單因素方差分析表其中,MSA=SSMA/(m–1),MSE=SSE/(n–m)。利用方差分析表中的信息,就可以對因素各水平間的差異是否顯著做出判斷。來源Source自由度DF平方和SunofSquare平均平方和MeanSquareF統(tǒng)計量Fvaluep值Pr>F組間m–1SSMASSMA/(m–1)MSA/MSEp組內(nèi)n–mSSESSE/(n–m)全部(C-tatol)n–1SSA+SSE第9頁,共99頁,2023年,2月20日,星期三例2.1.1某公司為了研究三種內(nèi)容的廣告宣傳對某種無季節(jié)性的大型機械銷售量的影響進行了調(diào)查統(tǒng)計.經(jīng)廣告廣泛宣傳后,按寄回的廣告上的訂購數(shù)計算,一年四個季度的銷售量(單位:臺)為:廣告類型 第一季度 第二季度 第三季度 第四季度A1 163 176170185 A2 184198179190 A3 206

191

218

224 A1是強調(diào)運輸方便性的廣告,A2是強調(diào)節(jié)省燃料的經(jīng)濟性的廣告,A3是強調(diào)噪音低的優(yōu)良性的廣告.試判斷:新聞廣告的類型對該種機械的銷售量是否有顯著影響?若影響顯著,哪一種廣告內(nèi)容為好?第10頁,共99頁,2023年,2月20日,星期三所以拒絕H0,即認(rèn)為廣告內(nèi)容不同對銷售量的影響是顯著分析結(jié)果如下:第11頁,共99頁,2023年,2月20日,星期三例2.設(shè)有三臺機器,用來生產(chǎn)規(guī)格相同的鋁合金薄板.取樣,測量薄板的厚度精確至千分之一厘米.得結(jié)果如表所示.問不同機器對生產(chǎn)的鋁合金板的厚度有無影響,請看分別用菜單系統(tǒng)和程序進行討論.程序名datalb給出了單因素方差分析的典型解法,進行了方差分析同時又在各水平組間進行了均值的比較,作了直方圖,菜單系統(tǒng)和程序中均有選項”Dunnett”進行某一水平和其余水平的均值差異比較和檢驗,選項”snk”則進行所有水平間均值差異的比較和檢驗.第12頁,共99頁,2023年,2月20日,星期三例.設(shè)有三臺機器,用來生產(chǎn)規(guī)格相同的鋁合金薄板.取樣,測量薄板的厚度精確至千分之一厘米.得結(jié)果如表所示.問不同機器對生產(chǎn)的鋁合金板的厚度有無影響?第13頁,共99頁,2023年,2月20日,星期三1.編程輸入數(shù)據(jù):DataE411;inputc$y@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procprint;RUN;第14頁,共99頁,2023年,2月20日,星期三Solution→Analysis→Analyst(分析員系統(tǒng))(出現(xiàn)空白數(shù)據(jù)表)→File→OpenBySasName…

(在Makeoneselection窗口中)work選中數(shù)據(jù)名E411→(OK)→Statistics→ANOVA→One-WayANOVA…

Independent填分類變量c→Dependent因變量yPlots—可選擇分水平的盒形圖(Box-&-WhiskerPlot),條形圖(BarChart)及均值、標(biāo)準(zhǔn)差圖Means—ComparisonsMethods給出了10種多重比較的方法

α為選擇的顯著性水平,Breakdown可按水平分組出描述性統(tǒng)計量→OK(點擊運行后的結(jié)果樹標(biāo)簽則會打開相應(yīng)圖.第15頁,共99頁,2023年,2月20日,星期三因,故在水平0.05下拒絕H0,認(rèn)為各臺機器生產(chǎn)的薄板厚度有顯著的差異.

SumofSourceDFSquaresMeanSquareFValuePr>FModel20.000580670.0002903319.950.0022Error60.000087330.00001456CorrectedTotal80.00066800第16頁,共99頁,2023年,2月20日,星期三5.1.2雙因素方差分析問題與模型1.無交互作用的雙因素方差分析對于多因素問題,通??紤]有重復(fù)觀測的情形,其數(shù)據(jù)結(jié)構(gòu)如圖5-2所示。 圖5-2雙因素方差分析中數(shù)據(jù)結(jié)構(gòu)觀測值A(chǔ)因素(i)平均值A(chǔ)1A2…AlB因素(j)B1x111…x11nx211…x21n…xl11…xl1nB2x121…x12nx221…x22n…xl21…xl1n……………Bmx1m1…x1mnx2m1…x2mn…xlm1…xlmn平均值第17頁,共99頁,2023年,2月20日,星期三若第一個因素A有l(wèi)個水平,第二個因素B有m個水平。在因素A的第i個水平和因素B的第j個水平下進行了多次觀測,記為{xijk,1≤k≤n}。對xijk考慮以下模型:xijk=+i

+j+ijk,1≤i≤l,1≤j≤m,1≤k≤n

其中表示平均的效應(yīng),i和j分別表示因素A的第i個水平和因素B的第j個水平的附加效應(yīng),ijk為隨機誤差,同樣這里的隨機誤差也假定它是獨立的并且服從等方差的正態(tài)分布。第18頁,共99頁,2023年,2月20日,星期三要說明因素A有無顯著影響,就是要檢驗如下假設(shè):

H0A:1=2=…=l,H1A:1,2,…,l不全相等;要說明因素B有無顯著影響,就是要檢驗如下假設(shè):

H0B:1=2=…=m,H1B:1,2,…,m不全相等;而模型無顯著效果是指以上兩個假設(shè)的原假設(shè)同時成立。第19頁,共99頁,2023年,2月20日,星期三在H0A、H0B成立時,檢驗用統(tǒng)計量:對于給定的顯著性水平α當(dāng)值p=P{FA>FA0}<α?xí)r拒絕H0A;當(dāng)值p=P{FB>FB0}<α?xí)r拒絕H0B。其中,F(xiàn)A0為FA統(tǒng)計量的觀測值,F(xiàn)B0為FB統(tǒng)計量的觀測值。第20頁,共99頁,2023年,2月20日,星期三2.有交互作用的多因素方差分析對于有交互作用的觀測{xijk},采用以下的模型:xijk=+i

+j+ij+ijk,1≤i≤l,1≤j≤m,1≤k≤n

其中表示平均的效應(yīng),i和j分別表示因素A的第i個水平和因素B的第j個水平的附加效應(yīng),ij表示因素A的第i個水平和因素B的第j個水平交互作用的附加效應(yīng)。ijk為隨機誤差,這里也假定它是獨立的并且服從等方差的正態(tài)分布。注意,其中n必須大于1,即為了檢驗交互作用,必須有重復(fù)觀測。第21頁,共99頁,2023年,2月20日,星期三要說明交互作用有無顯著影響,就是要檢驗如下假設(shè):

H0(A*B):ij=0(1≤i≤l,1≤j≤m),

Hl(A*B):ij不全為零(1≤i≤l,1≤j≤m)所以在多因素方差分析中,須在無交互作用所作檢驗的基礎(chǔ)上,加上交互作用的檢驗。第22頁,共99頁,2023年,2月20日,星期三構(gòu)造H0A,H0B,H0(A*B)的檢驗統(tǒng)計量分別為對于給定的顯著性水平α

當(dāng)值p=P{FA≥FA0}<α?xí)r拒絕H0A,否則不能拒絕H0A;當(dāng)值p=P{FB≥FB0}<α?xí)r拒絕H0B,否則不能拒絕H0B;當(dāng)值p=P{F(A*B)≥F(A*B)0}<α?xí)r拒絕H0(A*B),否則不能拒絕H0(A*B)。第23頁,共99頁,2023年,2月20日,星期三3.方差分析表無交互作用的雙因素方差分析表見表5-2。表5-2無交互作用的雙因素方差分析表其中MSA=SSMA/(l–1),MSB=SSMB/(m–1),MSE=SSE/(lmn–l–m+l)。利用方差分析表中的信息,就可以對每個因素各水平間的差異是否顯著做出判斷。來源Source自由度DF平方和SunofSquare平均平方和MeanSquareF統(tǒng)計量Fvaluep值Pr>F因素Al–1SSMASSMA/(l–1)MSA/MSEp(A)因素Bm–1SSMBSSMB/(m–1)MSB/MSEp(B)隨機誤差lmn–l–m+lSSESSE/(lmn–l–m+l)全部lmn–1SSA+SSB+SSE第24頁,共99頁,2023年,2月20日,星期三有交互作用的雙因素方差分析表見表5-3。表5-3有交互作用的雙因素方差分析表

其中MSA=SSMA/(l–1),MSB=SSMB/(m–1),MS(A*B)=SSM(A*B)/(l–1)(m–1),MSE=SSE/lm(n–l)。利用表中的信息,就可以對各個因素間交互作用是否顯著和每個因素各水平間的差異是否顯著做出判斷。來源Source自由度DF平方和SunofSquare平均平方和MeanSquareF統(tǒng)計量Fvaluep值Pr>F因素Al–1SSMASSMA/(l–1)MSA/MSEpA因素Bm–1SSMBSSMB/(m–1)MSB/MSEpBA*B(l–1)(m–1)SSM(A*B)SSM(A*B)/(l–1)(m–1)MS(A*B)/MSEp(A*B)隨機誤差lm(n–1)SSESSE/lm(n–l)全部lmn–1SSMA+SSMB+SSM(A*B)+SSE第25頁,共99頁,2023年,2月20日,星期三5.1.3方差分析中的基本假定方差分析中常用的基本假定是:●正態(tài)性:每個總體均服從正態(tài)分布,也就是說,對于每一個水平,其觀測值是來自正態(tài)分布的簡單隨機樣本?!穹讲铨R性:各總體的方差相同?!癃毩⑿裕簭拿恳豢傮w中抽取的樣本是相互獨立的。在SAS中,正態(tài)性可用第3章介紹的方法來驗證,也可通過本章介紹的“殘差的正態(tài)性檢驗”來驗證,方差齊性可以在方差分析的過程進行驗證,而獨立性可由試驗的隨機化確定。第26頁,共99頁,2023年,2月20日,星期三5.2單因素方差分析5.2.1用INSIGHT作單因素方差分析5.2.2用“分析家”作單因素方差分析5.2.3用過程進行單因素方差分析第27頁,共99頁,2023年,2月20日,星期三5.2.1用INSIGHT作單因素方差分析1.實例【例5-1】消費者與產(chǎn)品生產(chǎn)者、銷售者或服務(wù)的提供者之間經(jīng)常發(fā)生糾紛。當(dāng)發(fā)生糾紛后,消費者常常會向消費者協(xié)會投訴。為了對幾個行業(yè)的服務(wù)質(zhì)量進行評價,消費者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了不同的企業(yè)作為樣本。每個行業(yè)各抽取5家企業(yè),所抽取的這些企業(yè)在服務(wù)對象、服務(wù)內(nèi)容、企業(yè)規(guī)模等方面基本上是相同的。然后統(tǒng)計出最近一年中消費者對總共20家企業(yè)投訴的次數(shù),結(jié)果如表5-4。第28頁,共99頁,2023年,2月20日,星期三表5-4消費者對四個行業(yè)的投訴次數(shù)通常,受到投訴的次數(shù)越多,說明服務(wù)的質(zhì)量越差。消費者協(xié)會想知道這幾個行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,即在方差分析中檢驗原假設(shè):四個行業(yè)被投訴次數(shù)的均值相等。零售業(yè)旅游業(yè)航空公司家電制造業(yè)5768314466394951492921654045347744564058第29頁,共99頁,2023年,2月20日,星期三2.分析步驟

1)將表5-4中數(shù)據(jù)整理成如圖左所示結(jié)構(gòu)的數(shù)據(jù)集,存放在Mylib.xfzts中;

2)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.xfzts;

3)選擇菜單“Analyze(分析)”→“Fit(擬合)”,在打開的“Fit(XY)”對話框中按圖(右)選擇分析變量;

4)單擊“OK”按鈕,得到分析結(jié)果。

第30頁,共99頁,2023年,2月20日,星期三第31頁,共99頁,2023年,2月20日,星期三3.結(jié)果分析第一張表提供擬合模型的一般信息:

第二張表為列名型變量信息,即HANGYE為列名型的,有4個水平;第三張表提供參數(shù)信息,并且約定,P_2、P_3、P_4、P_5分別為航空、家電、零售和旅游4個行業(yè)的標(biāo)識變量(也稱啞變量)。如下圖所示。

第32頁,共99頁,2023年,2月20日,星期三第四張表給出響應(yīng)變量均值關(guān)于自變量不同水平的模型方程,如圖5-6所示。其中,標(biāo)識變量取值:第33頁,共99頁,2023年,2月20日,星期三第五張表(圖5-7)給出模型擬合的匯總信息,其中:R-Square(R2)是判定系數(shù)(coefficientofdetermination),闡明了自變量所能描述的變化(模型平方和)在全部變差平方和中的比例,它的值總在0和1之間,其值越大,說明自變量的信息對說明因變量信息的貢獻(xiàn)越大,即分類變量取不同的值對因變量的影響越顯著。AajR-Sq(校正R2)是類似于R2的,但它隨模型中的參數(shù)的個數(shù)而修正。第34頁,共99頁,2023年,2月20日,星期三第六張為方差分析表,如圖5-8所示,其中各項含義可參見表5-1的說明。從方差分析表可以看出,p值小于0.05(顯著水平),所以拒絕原假設(shè),即不同行業(yè)的消費者投訴次數(shù)有顯著差異。第七張表提供III型檢驗,它是方差分析表的細(xì)化,給出了各因素的平方和及F統(tǒng)計量,因為本例是單因素的,所以這一行與圖5-8的“Model”一行相同。如圖5-9所示。第35頁,共99頁,2023年,2月20日,星期三第八張為參數(shù)估計表,其中有關(guān)于不同行業(yè)下投訴次數(shù)差異的估計和檢驗:

1)根據(jù)標(biāo)識變量的定義,Intercept后的估計47.4是對應(yīng)于旅游業(yè)投訴次數(shù)的均值,其后的t檢驗是檢驗這一均值是否為0。這里p值<0.0001<0.05=α,故顯著非0。

2)航空后的估計-12.4是航空業(yè)與旅游業(yè)投訴次數(shù)均值之差的估計值,其后的t檢驗也是檢驗這兩個投訴次數(shù)均值之差是否為0。由于p值的絕對值為0.1313>0.05,所以航空業(yè)與旅游業(yè)的被投訴次數(shù)沒有顯著差異的。其它分析類似。第36頁,共99頁,2023年,2月20日,星期三4.檢驗?zāi)P图俣榱蓑炞C殘差為正態(tài)分布的假定,回到數(shù)據(jù)窗口??梢钥吹絉_TOUSU(殘差)和P_TOUSU(預(yù)測值)已加到數(shù)據(jù)集之中,下面用Distribufion(Y)來驗證殘差的正態(tài)性。

1)選擇菜單“Analyze”→“Distribution(Y)”;

2)在打開的“Distribution(Y)”對話框中選定分析變量:R_TOUSU;單擊“OK”按鈕;第37頁,共99頁,2023年,2月20日,星期三

3)選擇菜單“Curves”→“TestforDistribution”;在打開的“TestforDistribution”對話框中直接單擊“OK”按鈕。在檢驗結(jié)果的“TestforDistribution”表中看到,p值大于0.05,不能拒絕原假設(shè),表明可以認(rèn)為殘差是正態(tài)分布的(圖5-12)。第38頁,共99頁,2023年,2月20日,星期三5.2.2用“分析家”作單因素方差分析1.分析步驟

1)在“分析家”中,打開數(shù)據(jù)集Mylib.xfzts;

2)選擇菜單“Statistics(統(tǒng)計)”→“ANOVA(方差分析)”→“One-WayANOVA(單因素方差分析)”,打開“One-WayANOVA”對話框;第39頁,共99頁,2023年,2月20日,星期三

3)選中分類變量HANGYE,單擊“Independent”按鈕,將其移到“Independent(自變量)”框中;選中數(shù)值變量TOUSU,單擊按鈕“Dependent”,將其移到“Dependent(因變量)”框中,如圖5-13所示;第40頁,共99頁,2023年,2月20日,星期三

4)為了檢驗方差分析中關(guān)于方差齊性的假定,單擊“Tests”按鈕,打開“One-WayANOVA:Tests”對話框,選中“Testsforequalvariance”欄下的“l(fā)evene'stest”復(fù)選框(常用),如圖左,單擊“OK”按鈕返回;

第41頁,共99頁,2023年,2月20日,星期三5)單擊“Plots”按鈕,打開“One-WayANOVA:Plots”對話框,可以選擇圖形類型,如選中“Typesofplots”欄下的“Box-&-whiskerplot”復(fù)選框,如圖右,單擊“OK”按鈕返回;再次單擊“OK”按鈕。第42頁,共99頁,2023年,2月20日,星期三2.結(jié)果分析在顯示的結(jié)果中,提供了自變量的各個水平和單因素方差分析表。

結(jié)果分為五個部分,第一部分(下圖左)是因素水平的信息,可以看到只有一個因素HANGYE,它的4個水平分別是航空、家電、零售、旅游,共有20個觀測。第43頁,共99頁,2023年,2月20日,星期三第二部分就是經(jīng)典的方差分析表。由于這里p值小于0.05(顯著水平),所以模型是顯著的,即因素對指標(biāo)有顯著影響。第三部分是一些與模型有關(guān)的簡單統(tǒng)計量,第一個是復(fù)相關(guān)系數(shù)平方R2,代表總變差中能被模型解釋的比例,第二個是指標(biāo)的變異系數(shù),第三個是根均方誤差,第四個是均值。第四部分是方差分析表的細(xì)化,給出了各因素的平方和及F統(tǒng)計量,因為是單因素所以這一行與上面的“Model(模型)”一行相同。第44頁,共99頁,2023年,2月20日,星期三第五部分是對方差齊性的假定檢驗的結(jié)果,如圖5-16所示。結(jié)果表明使用Levene's檢驗法的p值為0.6357,所以不同水平下觀測結(jié)果的方差無顯著差異。第45頁,共99頁,2023年,2月20日,星期三在分析家窗口的項目管理器中雙擊“BoxplotofTOUSYbyHANGYE”選項,得到響應(yīng)變量關(guān)于自變量各水平的盒形圖如圖5-17所示。圖中從左到右依次為航空、家電、零售、旅游等水平的盒形圖,可以從中對不同水平下均值的差異以及方差的差異有一個直觀的了解。第46頁,共99頁,2023年,2月20日,星期三5.2.3用過程進行單因素方差分析1.ANOVA過程和GLM過程的簡介

(1)ANOVA過程

ANOVA過程的一般格式包含許多選項,其中最為常用的為如下格式:PROCANOVADATA=<數(shù)據(jù)集>;CLASS<自變量列表>;

MODEL<因變量名>=<自變量表達(dá)式>[/<選項列表>];

MEANS<自變量表達(dá)式>[/<選項>];RUN;第47頁,共99頁,2023年,2月20日,星期三其中CLASS語句用來指定樣本分組的分類變量,CLASS語句是必需的,而且必需位于MODEL語句之前;

MODEL語句給出模型表達(dá)式,可以用來表示三種不同的效應(yīng)模型:

1)主效應(yīng)模型:y=abc2)交互效應(yīng)模型:y=abca*ba*cb*ca*b*c3)嵌套效應(yīng)模型:y=abc(ab)

同一MODEL語句中三種效應(yīng)可以混合使用。

MEANS語句指定ANOVA過程計算自變量各水平下因變量的均值、標(biāo)準(zhǔn)差,并進行組間的多重比較。第48頁,共99頁,2023年,2月20日,星期三(2)GLM過程PROCGLMDATA=<數(shù)據(jù)集>[ALPHA=<p>];CLASS<自變量列表>;

MODEL<因變量名>=<自變量表達(dá)式>[/<選項列表>];

MEANS<自變量表達(dá)式>[/<選項>];RUN;

一般地,ANOVA過程中涉及的所有語句都包含在GLM過程所涉及的語句中,其用法和功能也都是基本相同的。第49頁,共99頁,2023年,2月20日,星期三2.使用ANOVA過程作單因素方差分析使用ANOVA過程對例5-1作方差分析的方法:procanovadata=Mylib.xfzts;

classhangye;modeltousu=hangye;run;分析結(jié)果與“分析家”相同。第50頁,共99頁,2023年,2月20日,星期三3.使用GLM過程作單因素方差分析使用GLM過程對例5-1作方差分析的方法:procGLMdata=Mylib.xfzts;classhangye;modeltousu=hangye;run;

分析結(jié)果與“分析家”相同。第51頁,共99頁,2023年,2月20日,星期三編程進行單因素方差分析(注意Roman字型)DataE411;inputcy@@;cards;10.23620.25730.25810.23820.25330.26410.24820.25530.25910.24520.25430.26710.24320.26130.262;procglm

data=E411;/*glm為方差分析*/classc;/*分類變量c*/modely=c;/*模型因變量=自變量*/lsmeansc;/*最小誤差法*/meansc;/*求c的均值*/RUN;第52頁,共99頁,2023年,2月20日,星期三5.3雙因素方差分析5.3.1用INSIGHT作雙因素方差分析5.3.2用“分析家”作雙因素方差分析5.3.3用GLM過程進行雙因素方差分析第53頁,共99頁,2023年,2月20日,星期三5.3.1用INSIGHT作雙因素方差分析1.不存在交互作用的雙因素方差分析【例5-2】為了提高一種橡膠的定強,考慮三種不同的促進劑(因素A)、四種不同分量的氧化鋅(因素B)對定強的影響,對配方的每種組合重復(fù)試驗兩次,總共試驗了24次,得到表5-5的結(jié)果。表5-5橡膠配方試驗數(shù)據(jù)A:促進劑B:氧化鋅1234131,3334,3635,3639,38233,3436,3737,3938,41335,3737,3839,4042,44第54頁,共99頁,2023年,2月20日,星期三要用方差分析將不同促進劑和不同份量氧化鋅的影響區(qū)分開來。即檢驗:

H0A:不同促進劑對定強無影響,H1A:不同促進劑對定強有顯著影響

H0B:氧化鋅的不同分量對定強無影響,H1B:氧化劑的不同分量對定強有顯著影響第55頁,共99頁,2023年,2月20日,星期三(1)分析設(shè)置

1)將表5-5中數(shù)據(jù)整理成如圖5-18左所示結(jié)構(gòu)的數(shù)據(jù)集,存放在Mylib.xjpf中;

第56頁,共99頁,2023年,2月20日,星期三

2)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.xjpf。由于在Insight中,要求方差分析中的自變量必須是列名型的,故先把變量a和b的測量水平由區(qū)間型改為列名型;3)選擇菜單“Analyze(分析)”→“Fit(擬合)”,在打開的“Fit(XY)”對話框中選擇數(shù)值型變量作因變量,分類型變量作自變量:選擇變量stren,單擊“Y”按鈕,選擇變量a和b,單擊“X”按鈕,分別將變量移到列表框中,如圖5-18右所示;單擊“OK”,得到分析結(jié)果。第57頁,共99頁,2023年,2月20日,星期三(2)分析結(jié)果

1)第一張表提供了模型的一般信息;第二張表列舉了作為分類變量的a和b的水平的信息;第三張參數(shù)信息表給出了標(biāo)識變量P_i的定義;

其中,標(biāo)識變量取值:

第58頁,共99頁,2023年,2月20日,星期三

2)第四張表給出了方差分析模型,利用參數(shù)信息表中標(biāo)識變量的定義可以推算出在各個因素不同水平下變量stren均值的信息;第五張擬合匯總表中給出變量stren的均值為37.0417,判定系數(shù)R2為0.8945等,如圖5-20;圖5-20多因素方差分析第4、5張表第59頁,共99頁,2023年,2月20日,星期三

3)在第六張方差分析表中,檢驗?zāi)P惋@著性的F統(tǒng)計量為30.53,相應(yīng)的p值小于0.05=,所以拒絕a和b對分析變量stren無顯著影響的假設(shè),即模型是顯著的;

在模型顯著的情況下常需要進一步分析兩個因素是否都有顯著影響或者只有一個因素是顯著的,這時就需要用到第七張表提供的信息。在III型檢驗表中,進一步將模型平方和分解為屬于a和b的平方和。在這里兩個因素的p值都小于0.05,再一次說明了這兩個因素對分析變量stren都有顯著影響,如圖5-21。

第60頁,共99頁,2023年,2月20日,星期三第61頁,共99頁,2023年,2月20日,星期三

4)第八張是模型的參數(shù)估計表(圖5-22),參數(shù)估計表也是根據(jù)標(biāo)識變量的定義,對參數(shù)或?qū)Ω饕蛩夭煌较碌膮?shù)之差進行估計和檢驗。可以根據(jù)t統(tǒng)計量的p值來檢驗不同水平下均值是否有顯著差異。圖5-22多因素方差分析第8張表第62頁,共99頁,2023年,2月20日,星期三模型方程提供了各個因素不同水平下變量stren均值的信息,利用參數(shù)信息表中標(biāo)識變量P_j的定義可以推算出:參數(shù)估計表根據(jù)標(biāo)識變量的定義,對參數(shù)或不同水平下參數(shù)之差進行估計和檢驗。如第一行是對a=3,b=4水平下均值的估計和檢驗,第二行是a=1,b=4水平下的均值與a=3,b=4水平下均值之差的估計與檢驗。結(jié)果表明兩個因素的各水平下的均值都有顯著差異。第63頁,共99頁,2023年,2月20日,星期三

5)考察模型假定:在顯示窗的底部有一個殘差和預(yù)測值的散點圖(如圖5-23所示),可以像單因素分析一樣考察殘差分布的正態(tài)性假定。第64頁,共99頁,2023年,2月20日,星期三2.存在交互作用的雙因素方差分析【例5-3】考慮合成纖維收縮率(因素A)和總拉伸倍數(shù)(因素B)對纖維彈性y的影響。收縮率取4個水平:A1=0,A2=4,A3=8,A4=12;因素B也取4個水平:B1=460,B2=520,B3=580,B4=640。在每個組合AiBj下重復(fù)做二次試驗,彈性數(shù)據(jù)如表5-6所示。表5-6合成纖維收縮率和總拉伸倍數(shù)對纖維彈性的影響A:收縮率B:拉伸倍數(shù)460520580640071,7372,7375,7377,75473,7576,7478,7774,74876,7379,7774,7574,731275,7373,7270,7169,69第65頁,共99頁,2023年,2月20日,星期三考慮如下問題:

1)收縮率(因素A)、拉伸倍數(shù)(因素B)對彈性y有無顯著性影響?2)因素A和因素B是否有交互作用?3)使纖維彈性達(dá)到最大的生產(chǎn)條件是什么?要用方差分析將不同收縮率和不同拉伸倍數(shù)的影響區(qū)分開來。即檢驗:H0A:不同收縮率對彈性無影響,H1A:不同收縮率對彈性有顯著影響H0B:不同拉伸倍數(shù)對彈性無影響,H1B:不同拉伸倍數(shù)對彈性有顯著影響第66頁,共99頁,2023年,2月20日,星期三(1)分析設(shè)置

1)將表5-6中數(shù)據(jù)整理成如圖所示結(jié)構(gòu)的數(shù)據(jù)集,存放在Mylib.xwtx中;

2)在INSIGHT模塊中打開數(shù)據(jù)集Mylib.xwtx。由于在Insight中,要求方差分析中的自變量必須是列名型的,故先把變量a和b的測量水平由區(qū)間型改為列名型;第67頁,共99頁,2023年,2月20日,星期三

3)選擇菜單“Analyze(分析)”→“Fit(擬合)”,在打開的“Fit(XY)”對話框中選擇數(shù)值型變量作因變量,分類型變量作自變量,如圖所示。

圖5-24數(shù)據(jù)集xwtx與分析變量的選擇為了考慮變量a和b的交互作用,同時選上a、b,然后單擊“Cross”按鈕,注意到在右框中多了a*b一行,如圖5-24右所示。

4)單擊“OK”按鈕,得到分析結(jié)果。第68頁,共99頁,2023年,2月20日,星期三(2)分析結(jié)果

1)在參數(shù)信息表中較無交互作用的情形多了表示兩個因素各個水平組合下的標(biāo)識變量,而在模型方程表中也就多了許多的參數(shù),如圖5-25所示;圖5-25多因素方差分析的前5張表

第69頁,共99頁,2023年,2月20日,星期三

2)在方差分析表中,檢驗?zāi)P惋@著性的F統(tǒng)計量為7.87,相應(yīng)的p值為0.0001<0.05,所以模型的效應(yīng)是顯著的;

3)在Ⅲ型檢驗表中,將模型平方和分解為兩個因素和它們的交互作用,表中看出,檢驗b變量效應(yīng)的p值為0.1363>0.05,所以從總體上看b變量的效應(yīng)不顯著;檢驗a變量效應(yīng)的p值為<0.0001<0.05,所以變量a的效應(yīng)是顯著的;檢驗兩者交互作用的p值為0.0006<0.05,所以交互作用的影響也是顯著的,如圖5-27。第70頁,共99頁,2023年,2月20日,星期三

4)在模型方程(圖5-25中)和參數(shù)估計表(圖5-28)中也提供了雙因素不同水平組合下因變量y均值的估計和比較的信息。因為這里是考慮存在交互作用的情形,所以較為復(fù)雜一些。第71頁,共99頁,2023年,2月20日,星期三5.3.2用“分析家”作雙因素方差分析1.不存在交互作用的雙因素方差分析下面介紹在“分析家”中對例5-2作方差分析:

1)在“分析家”中,打開數(shù)據(jù)集Mylib.xjpf;

2)選擇菜單“Statistics(統(tǒng)計)”→“ANOVA(方差分析)”→“FactorialANOVA(因素方差分析)”,打開“FactorialANOVA”對話框(如圖5-29);第72頁,共99頁,2023年,2月20日,星期三

若要得到用圖形表示的兩個因素不同水平下均值和標(biāo)準(zhǔn)差的信息,可以單擊“Plots”按鈕,在打開的“FactorialANOVA:Plots”對話框中,選中“Meansplots”欄下的“PlotsDependentMeansforMainEffects(作主效應(yīng)響應(yīng)均值圖)”。

第73頁,共99頁,2023年,2月20日,星期三

4)分析結(jié)果如圖5-30所示,其中內(nèi)容前面已講,這里不再贅述。圖5-30無交互作用的多因素方差分析第74頁,共99頁,2023年,2月20日,星期三

5)在分析家窗口的項目管理器中依次雙擊“MeansPlots”下的兩個選項,得到響應(yīng)變量關(guān)于自變量a、b的均值圖如圖5-31所示。

圖5-31響應(yīng)變量關(guān)于自變量a、b的均值圖圖中描述了變量a、b不同水平下的均值和標(biāo)準(zhǔn)差的圖形,從中可以對不同水平下均值的差異有一個直觀的了解。

第75頁,共99頁,2023年,2月20日,星期三2.存在交互作用的雙因素方差分析下面介紹在“分析家”中對例5-3合成纖維的試驗數(shù)據(jù)作方差分析。分析步驟如下:

1)在“分析家”中,打開數(shù)據(jù)集Mylib.xwtx;

2)選擇菜單“Statistics”→“ANOVA”→“FactorialANOVA”,打開“FactorialANOVA”對話框,按圖選擇參數(shù)與圖形;第76頁,共99頁,2023年,2月20日,星期三輸出的方差分析表給出雙因素考慮交互作用的方差分析模型是顯著的(F=7.87,p=0.0001),最下面一張表給出兩個因素和交互作用的檢驗結(jié)果。由最后一列“Pr>F”的三個p值可以看出因素A及因素A與B的交互作用(A*B)對指標(biāo)y的影響是高度顯著的,而因素B在

=0.05的水平上對指標(biāo)y的影響是不顯著(p=0.1363>0.05)。第77頁,共99頁,2023年,2月20日,星期三在分析家窗口的項目管理器中依次雙擊選項“MeansPlotofybyaandb”,得到雙因素不同水平下因變量均值差異的連線圖如圖5-35所示。直觀地可以看出使纖維彈性達(dá)最大的最佳生產(chǎn)條件是A3和B2;其次是A2和B3。第78頁,共99頁,2023年,2月20日,星期三5.3.3用GLM過程進行雙因素方差分析1.不考慮交互作用過程GLM也可用于多因素方差分析,其用法與單因素方差分析是相同的,只需要在class語句和model語句中分別填入表示因素的多個自變量。以數(shù)據(jù)集Mylib.xjpf為例,為了比較變量a和b不同水平下因變量stren均值的差異,可使用以下程序:procglmdata=Mylib.xjpf;classab;modelstren=ab;run;第79頁,共99頁,2023年,2月20日,星期三提交上述程序后得到與上一節(jié)使用“分析家”有相似的結(jié)果,如圖5-36所示。有關(guān)的說明請參見上節(jié)的解釋。第80頁,共99頁,2023年,2月20日,星期三2.考慮交互作用使用過程GLM于多因素方差分析時,若要考慮交互作用只需要在model語句中增加相應(yīng)的交互作用項即可。以數(shù)據(jù)集Mylib.xjpf為例,為了比較變量a和b不同水平組合下變量stren均值的差異,可使用以下的程序:procglmdata=Mylib.xjpf;classab;modelstren=aba*b;run;

這里model語句中a*b就是指明要考慮交互作用。第81頁,共99頁,2023年,2月20日,星期三提交這一程序后的輸出如圖5-37所示。圖5-37使用GLM過程作有交互作用的多因素方差分析第82頁,共99頁,2023年,2月20日,星期三5.4均值估計與多重比較5.4.1概述5.4.2用“分析家”進行均值比較第83頁,共99頁,2023年,2月20日,星期三5.4.1概述在方差分析中,不論是單因素或多因素的實驗結(jié)果,都是檢驗關(guān)于參數(shù)的一個整體的假設(shè)。若原假設(shè)被拒絕,表明某個因素各個水平下的響應(yīng)有顯著差異或因素間存在交互影響,但并不了解某兩個水平下響應(yīng)是否有差異。所以在方差分析后,還常需要對各水平下響應(yīng)變量的均值進行估計和比較。第84頁,共99頁,2023年,2月20日,星期三5.4.2用“分析家”進行均值比較1.對于單因素方差分析的均值比較下面介紹在“分析家”中對例5-1作均值比較。(1)分析設(shè)置

1)在“分析家”中,打開數(shù)據(jù)集Mylib.xfzts;2)選擇菜單“Statistics”→“ANOVA”→“One-WayANOVA”,打開“One-WayANOVA”對話框,按圖所示設(shè)置;第85頁,共99頁,2023年,2月20日,星期三

3)單擊“Means(均值)”按鈕,在打開的“One-WayANOVA:Means”對話框中選中“Comparisons(比較)”選項卡。按圖設(shè)置。第86頁,共99頁,2023年,2月20日,星期三(2)分析結(jié)果

1)使用Tukey'sHSD檢驗法的結(jié)果,如圖5-39所示。圖5-39Duncan'sMultipleRange檢驗法它先提示這一檢驗法是控制整體的第一類錯誤的,但它的第二類錯誤一般比REGWQ方法要高。第87頁,共99

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論