數(shù)據(jù)分析補(bǔ)充_第1頁
數(shù)據(jù)分析補(bǔ)充_第2頁
數(shù)據(jù)分析補(bǔ)充_第3頁
數(shù)據(jù)分析補(bǔ)充_第4頁
數(shù)據(jù)分析補(bǔ)充_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)分析主講:黃劍補(bǔ)充:方差分析2023年2月3日數(shù)據(jù)分析(主講:黃劍)2一、方差分析概念方差分析(analysisofvariance)又稱變異數(shù)分析,可簡記為ANOVA,主要用于檢驗(yàn)計(jì)量資料中的兩個(gè)或兩個(gè)以上均值間差別顯著性的方法。根據(jù)效應(yīng)的可加性,將總的離均差平方和分解成若干部分,每一部分都與某一種效應(yīng)相對應(yīng),總自由度也被分成相應(yīng)的各個(gè)部分,各部分的離均差平方除以相應(yīng)部分的自由度得出各部分的均方,然后列出方差分析表算出值,作出統(tǒng)計(jì)推斷。2023年2月3日數(shù)據(jù)分析(主講:黃劍)3變異來源source離差平方和SS自由度df均方MSF統(tǒng)計(jì)量FP效應(yīng)S1SS1df1MS1=SS1/df1F1(df1,dfe)=MS1/MSeP1效應(yīng)S2SS2df2MS2=SS2/df2F2(df2,dfe)=MS2/MSeP2…………………………效應(yīng)SmSSmdfmMSm=SSm/dfmFm(dfm,dfe)=MSm/MSePm誤差SeSSedfeMSe=SSe/dfe總變異STSST=SS1+SS2+…+SSm+SSedfT=df1+df2+…+dfm+dfeMST=SST/dfTFT(dfT,dfe)=MST/MSePT單因素方差分析2023年2月3日數(shù)據(jù)分析(主講:黃劍)4設(shè)因素A有k個(gè)水平A1,A2,…Ak,在每一個(gè)水平下考察的指標(biāo)可以看成一個(gè)總體,現(xiàn)有k個(gè)總體,并假定:1、每一個(gè)總體均服從正態(tài)分布;2、每一個(gè)總體的方差相同;3、從每一個(gè)總體中抽取的樣本相互獨(dú)立。我們要比較各個(gè)總體的均值是否一致,就是要檢驗(yàn)各總體的均值是否相同,設(shè)第i個(gè)總體的均值為μi,那么就是要檢驗(yàn)如下原假設(shè):統(tǒng)計(jì)量統(tǒng)計(jì)量檢驗(yàn)的

值為對給出的

,若

,則拒絕,各水平的效應(yīng)有顯著差異;否則,不能拒絕,認(rèn)為各水平的效應(yīng)無顯著差異.SAS中的procanova用于單因素的方差分析.例3.1幼鼠對三種食譜的體重增加量的數(shù)據(jù)如下,試分析營養(yǎng)效果是否明顯差異.dataexamp3_1;inputrecipe$weight@@;cards;a1164a1190a1203a1205a1206a1214a1228a1257a2185a2197a2201a2231a3187a3212a3215a3220a3248a3265a3281;run;proc

anova

data=examp3_1;classrecipe;modelweight=recipe;run;

例3.2分析四個(gè)實(shí)驗(yàn)室試制的紙張光滑度有無差異dataexamp3_2;inputlab$smooth@@;cards;a138.7a141.5a143.8a144.5a145.5a146.0a147.7a158.0a239.2a239.3a239.7a241.4a241.8a242.9a243.3a245.8a334.0a335.0a339.0a340.0a343.0a343.0a344.0a345.0a434.0a434.8a434.8a435.4a437.2a437.8a441.2a442.8;run

各對均值差異的置信區(qū)間proc

anovadata=examp3_3;classlab;modelsmooth=lab;meanslab;meanslab/clmalpha=0.05;meanslab/tcldiffalpha=0.05;run;雙因素方差分析研究飲食和健美操對減肥的作用。我們認(rèn)為飲食對減肥肯定有一定作用,適當(dāng)?shù)慕∶啦賹p肥也有效果。如果飲食加上健美操作為減肥的手段,就存在哪一種飲食配上哪一樣健美操最為有效的問題,因?yàn)轱嬍撑c飲食這兩種減肥手段之間存在著交互作為,會強(qiáng)化減肥的作用?,F(xiàn)有三套飲食方案稱為a、b、c,五種不同的健美操標(biāo)記為1、2、3、4、5。構(gòu)成成了3×5=15種水平組合,選擇了情況基本相同的90個(gè)肥胖人進(jìn)行試驗(yàn),將他們隨機(jī)地指派到這15個(gè)組中且每組6人。經(jīng)過一段時(shí)間后,體重的下降結(jié)果見表所示proc

glmdata=fatness;classfoodtrain;modely=foodtrainfood*train;lsmeansfoodtrainfood*train;lsmeansfood*train/slice=foodslice=train;Contrast't1vst4inf1‘train1

0

0-1

0food*train

1

0

0-1

0;Contrast't2vst4inf1‘train0

1

0-1

0food*train

0

1

0-1

0;Contrast't3vst4inf1‘train0

0

1-1

0food*train

0

0

1-1

0;Contrast't4vst5inf1‘train0

0

0

1-1food*train

0

0

0

1-1;Contrast't2vst5inf3‘train0

1

0

0-1food*train

0

0

0

0

0

0

0

0

0

0

0

1

0

0-1;run;程序說明:本例中有兩個(gè)因素food和train,因此在class語句中要有這兩個(gè)分組變量名。由于除了要考察這兩個(gè)因素的主效應(yīng)外,還要考察這兩個(gè)因素的交互效應(yīng),表示為food*train,所以需要在model語句的后面加上這個(gè)交互效應(yīng)。用lsmeans語句替代means語句的主要原因是,對于非均衡的試驗(yàn)數(shù)據(jù)需要計(jì)算最小二乘均值,它是一種調(diào)整后的均值。第二條lsmeans語句的作用,考慮到交叉項(xiàng)food*train是顯著情況時(shí),通過Slice選項(xiàng)規(guī)定的food效應(yīng)和train效應(yīng)來分開交叉的food*train效應(yīng)。Contrast語句是作更進(jìn)一步的對比,前四條Contrast語句是把因素food固定在第一個(gè)水平a上,然后對food因素有顯著交互作用的train因素的某兩個(gè)水平之間進(jìn)行比較,最后一條contrast語句是把因素food固定在第三個(gè)水平c上,對train因素的第二個(gè)水平均值和第五個(gè)水平均值進(jìn)行比較。要注意food*train交叉效應(yīng)的參數(shù)化形式的規(guī)則為,交叉組合下標(biāo)里最右邊的變量水平比最左邊的變量水平變化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論