方差分析實例分析_第1頁
方差分析實例分析_第2頁
方差分析實例分析_第3頁
方差分析實例分析_第4頁
方差分析實例分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、方差分析實例分析摘要:為研究貨架的高度和寬度兩個因素的影響,本文基于shelf數(shù)據(jù),分別對高度和 寬度進行方差分析。首先對數(shù)據(jù)進行高度和寬度進行分組,并進行描述性統(tǒng)計分析。其次, 利用Bartlett檢驗進行方差其次性檢驗,以檢驗數(shù)據(jù)在不同的水平下方差是否相同。最后, 利用aov()函數(shù)進行單因素方差分析、交互作用的雙因素方差分析。其結(jié)果表明:單因素方 差分析結(jié)果表明:高度的bottom、middle top三個水平設(shè)置要求不相同,寬度的reg、wide 兩個水平設(shè)置要求相同。三個高度設(shè)置的需求和兩個寬度設(shè)置的要求之間的關(guān)系是一樣的。關(guān)鍵詞:方差其次性檢驗;方差分析;高度;寬度;貨架1引言方差

2、分析是在20世紀(jì)20年代發(fā)展起來的一種統(tǒng)計方法,它是由英國統(tǒng)計學(xué)家費希爾 在進行實驗設(shè)計時為解釋實驗數(shù)據(jù)而首先引入的。從形式上看,方差分析是比較多個總體的 均值是否相等;但是其本質(zhì)上是研究變量之間的相互關(guān)系。方差分析主要用于研究一個數(shù)值 因變量與一個或多個分類自變量的關(guān)系。方差分析(analysis of variance ,ANOVV)就是通過 檢驗各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。本文基于shelf數(shù)據(jù),分別對高度和寬度進行方差分析。首先對數(shù)據(jù)進行高度和寬度進 行分組,并進行描述性統(tǒng)計分析。其次,利用Bartlett檢驗進行方差其次性檢驗,以檢驗數(shù) 據(jù)在不

3、同的水平下方差是否相同。最后,利用aov()函數(shù)進行單因素方差分析和有交互作用 的雙因素方差分析,以說明三個層次高度的要求是否相同,兩個層次的寬度要求是否相同,以 及寬度設(shè)置的需求和高度之間的關(guān)系。2貨架數(shù)據(jù)描述性統(tǒng)計分析對shelf數(shù)據(jù)進行三個層次高度進行分組,分別分為bottom、middle top三個層次。對 寬度進行reg、wide兩個層次進行分組。表1給出了 shelf數(shù)據(jù)的原始數(shù)據(jù)表,表2給出了高度 三個層次的描述性統(tǒng)計結(jié)果,表3給出了寬度兩個層次的描述性統(tǒng)計結(jié)果。從表2可看出,bottom的平均值為55.8,方差為6.136; middle的平均值為77.2,方差 為9.628

4、; top的平均值為51.5,方差為2.716。其結(jié)果表明:三個水平的貨架高度平均值存 在差異,但是其方差也有差別。表3可看出,reg的平均值為60.8,方差為129.4050; wide 的平均值為62.2,方差為165.2775。貨架的寬度wide的方差較大,其說明貨架的寬度wide 的波動性較大。表1 shelf數(shù)據(jù)的原始數(shù)據(jù)表heightwidthMeanregwidebottom58.2055.70bottom53.7052.50CC Qbottom55.8058.9055.8Mean55.9055.70middle73.0076.20middle78.1078.40nn omidd

5、le75.4082.1077.2Mean75.5078.90toptoptopMean52.4049.7050.9051.0054.0052.1049.9052.0051.5Mean60.8062.2061.5表2高度三個層次的描述性統(tǒng)計結(jié)果HeightNMeanVarSdMaxMedianMinbottom655.86.1362.47709558.955.7552.5middle677.29.6283.10290282.177.1573.0top651.52.7161.64802954.051.5049.7表3寬度兩個層次的描述性統(tǒng)計結(jié)果WidthNMeanVarSdMaxMedianMin

6、reg960.8129.405011.3756378.155.849.7wide962.2165.277512.8560382.155.749.9下面對貨架的高度和寬度數(shù)據(jù)進行繪制箱線圖和柱狀圖,分別見圖1-4。從圖1-2可清 晰的看出獲獎的高度和寬度數(shù)據(jù)在各個水平下的變化情況。圖3-4可清晰的看出,貨架高度 和寬度在各個水平下的平均值的變化情況。從柱狀圖可以看出,各水平獲獎的平均分存在一 定的差異,但是這種差異顯著不顯著,還需要進一步分析。BottommlddistopHeightWiCttfl岳 r-移 忌 推 掐 QureiEWWidm圖2貨架寬度箱線圖m ddleSL 端09O寸Rpu

7、IXJEaJ口bottomSoreg_M&anwide_Meanwirtth圖4貨架寬度柱狀圖3貨架高度和寬度方差分析由以上分析可以看出,雖然各個水平的貨架的平均分存在差異,但是其方差也有差別, 方差分析的基本思想就是弄清楚影響因變量取值的誤差來源,以判斷是否是分類自變量對因 變量產(chǎn)生影響。在上述數(shù)據(jù)中,各組數(shù)據(jù)的誤差主要來源于以下幾個部分。即使是同一組的數(shù)據(jù),其取值也具有差別,這是因為貨架數(shù)據(jù)是隨機抽取的,從而它們 之間的差異可以看作是隨機因素的影響造成的,或者說是由抽樣的隨機性造成的,這種 來自水平內(nèi)部的誤差稱之為組內(nèi)誤差,顯然,組內(nèi)誤差只含有隨機誤差。各組的取值不同。來自不同水平之間的誤

8、差稱為組間誤差,這種差異可能來自于隨機誤 差,也可能來自于因子本身的系統(tǒng)性誤差造成的系統(tǒng)誤差。因此,組內(nèi)誤差包含有可能 包含兩個方面,即隨機誤差和系統(tǒng)誤差??傉`差為組內(nèi)誤差與組間誤差之和。這樣,就把造成因變量的差異的誤差分解成組內(nèi)誤差和組間誤差。即總誤差=組內(nèi)誤差+組間誤差如果組內(nèi)誤差與組間誤差相差太大,說明組間誤差存在很大成分的系統(tǒng)誤差,這時候就 可以認(rèn)為各水平均值顯著不等。在進行貨架高度和寬度方差性分析需要進行以下步驟:Stepl :對貨架數(shù)據(jù)按照高度三個層次和寬度兩個層次進行分組;Step2 :分別為貨架高度和寬度數(shù)據(jù)進行方差齊次性檢驗;Step3:分別對寬度和高度進行單因素方差分析,以

9、及寬度和高度交互作用的雙因素方差 分析。3.1方差齊性Bartlett檢驗若氣,.,七是從總體中抽樣得到的n個獨立的觀測值,其總體方差為c 2,而樣本方差為S2 = 1 U (x - X)2n 1 ii=1其中X是平均值。無論觀測值的分布是什么,S 2是無偏估計。若觀測值服從正太分布,則S 2 是自由度為n 1的卡方分布。通過F檢驗用于比較兩個樣本的方差,對于樣本量分別為n和m的兩個樣本X和7其F = =2統(tǒng)計量服從F分布,即 F (n 1, m 1) 對于多個樣本的方差比較,可用 s 2/c 2y yBartlett 檢驗:原假設(shè)(null hypothesis)為:H0 :c2 =c2 =

10、.=c2 ;備選假設(shè)為: gq;,.,c;各不相等。假設(shè)皿.,為k個樣本的方差,其自由度分別為”,七,n 并另=LEn s2,n i=1其中n = En/i=1Bartlett檢驗需計算其統(tǒng)計量, 1B = n In s 2 C其中C = 1 +3(k 1)11)n n) / I,B近似服從自由度為k 1的卡方分布,據(jù)此可以通過卡方分布計算出其值,并根據(jù)相關(guān)的顯著性水平做出推斷。3.2方差分析 單因素方差分析方差分析所需的數(shù)據(jù)結(jié)構(gòu)一般是一個數(shù)據(jù)框。進行方差分析可以使用lm()函數(shù),也可以 使用aov()函數(shù),再利用summary()函數(shù)或者anova()函數(shù)輸出最終結(jié)果。無交互作用的雙因素方差

11、分析因變量可能受到來自一個以上的因素的影響,最典型的就是雙因素方差分析。假如因素 A與因素B沒有聯(lián)合效應(yīng),則稱為無交互作用的雙因素方差分析。有交互作用的雙因素方差分析因素之間的交互作用在現(xiàn)實中很常見,比如胖胖的人喜歡藍(lán)色的衣服,南方的人更喜歡 喝雪花啤酒等,前者是體重和顏色的交互作用,后者是地區(qū)和啤酒品牌的交互作用。因此, 如果兩個因素聯(lián)合在一起對因變量有顯著的影響,則稱這樣的方差分析為有交互作用的方差 分析。3.3代碼實現(xiàn)利用R軟件進行編程,方差齊次性檢驗和方差分析的代表如下:rm(list = ls()#加載數(shù)據(jù)data - read.csv(D:/RStudio/R code/homew

12、ork multivariate statistics/HW5/shelf.csv,header=T )reg_Mean - tapply(data$reg,data$height,mean)wide_Mean - tapply(data$reg,data$height,mean)#柱狀圖H - cbind(reg_Mean,wide_Mean)M - c(reg,wide)regions - c(bottom,middle,top)Plot the bar chart.barplot(H,beside=TRUE,xlab=width,ylab=Demand,col=c(2,3,4), mai

13、n=shelf chart,legend=regions,ylim = c(0,130)barplot(t(H),beside=TRUE,xlab=height,ylab=Demand,col=c(6,7), main=shelf chart,legend=regions,ylim = c(0,130)shelf - c(58.2,55.7,53.7,52.5,55.8,58.9,73,76.2,78.1,78.4,75.4,82.1,52.4,54,49.7,52.1,50.9,49.9)type1 -c(bottom,bottom,bottom,bottom,bottom,bottom,

14、middle,middle,middle,middle,middle,middle, top”,top”,top”,top”,top”,top)type2 -c(reg,width,reg,width,reg,width,reg,width,reg,width, reg,width,reg,width,reg,width,reg,width)Height - data.frame(sheltype1)Width -data.frame(sheltype2)HeightWidth#統(tǒng)計性描述Height_N - tapply(Height$shelHeight$type1,length)Heig

15、ht_Mean - tapply(Height$shelHeight$type1,mean)Height_Var - tapply(Height$shelHeight$type1,var)Height_Sd - tapply(Height$shelf,Height$type1,sd)Height_Max - tapply(Height$shelHeight$type1,max)Height_Median - tapply(Height$shelHeight$type1,median)Height_Min - tapply(Height$shelHeight$type1,min)Height_r

16、esult1 - data.frame(Height_N,Height_Mean,Height_Var,Height_Sd,Height_Max,Height_Median,Height_Min)Height_result1Width_N - tapply(Width$shelf,Width$type2,length)Width_Mean - tapply(Width$shelf,Width$type2,mean)Width_Var - tapply(Width$shelf,Width$type2,var)Width_Sd - tapply(Width$shelf,Width$type2,sd

17、)Width_Max -tapply(Width$shelf,Width$type2,max)Width_Median -tapply(Width$shelf,Width$type2,median)Width Min - tapply(Width$shelf,Width$type2,min)Width_result1 - data.frame(Width_N,Width_Mean,Width_Var,Width_Sd, Width_Max,Width_Median,Width_Min)Width_result1#箱線圖boxplot(shelftype1,xlab=Height,ylab=De

18、mand,col=c(2,3,4)boxplot(shelftype2,xlab=Width,ylab=Demand,col=c(5,6)#在進行方差分析之前先對幾條假設(shè)進行檢驗,由于隨機抽取,#假設(shè)總體滿足獨立、正態(tài),考察方差齊次性(用bartlett檢驗)A - factor(type1)B - factor(type2)qx_type1 - bartlett.test(shelfA)qx_type1qx_type2 - bartlett.test(shelfB)qx_type2#交互效應(yīng)的方差分析rs top)的方差齊性Bartlett檢驗中,P值為0.4216,由于P值大于 常用的0.

19、05,因此,接受原假設(shè),即認(rèn)為方差相等。寬度的兩個水平reg、wide)的的方差 齊性Bartlett檢驗中,P值為0.7374,因此,接受原假設(shè),即認(rèn)為方差相等。表4方差齊性Bartlett檢驗結(jié)果高度Bartletts K-squared 1.7275p-value0.4216接受原假設(shè),方差相等寬度Bartletts K-squared0.11241p-value0.7374接受原假設(shè),方差相等根據(jù)以上分析結(jié)果,認(rèn)為各個水平的貨架高度和寬度的方差相等,為了說明三個層次高 度的要求是否相同,兩個層次的寬度要求是否相同,以及寬度設(shè)置的需求和高度之間的關(guān)系。 下面利用方差性分析對不同水平的貨架高度和寬度進行分析。其結(jié)果見表5所示。表5貨架高度和寬度方差分析類型DfSum SqMean SqF valuePr(F)高度22273.91136.9185.6239.42e-10*寬度18.88.81.4400.253高度和寬度210.15.00.8230.462Residuals 1273.56.1注 Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1從表5可清晰的看出,高度的三個水平(bottom、middle top)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論