11、方差分析.ppt_第1頁
11、方差分析.ppt_第2頁
11、方差分析.ppt_第3頁
11、方差分析.ppt_第4頁
11、方差分析.ppt_第5頁
已閱讀5頁,還剩65頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十一章方差分析 第十一章方差分析 第一節(jié)方差分析的基本原理第二節(jié)單因素方差分析第三節(jié)雙因素方差分析 學(xué)習(xí)目標(biāo) 掌握方差分析的概念了解方差分析的基本思路2 掌握單因素方差分析的方法及應(yīng)用3 掌握雙因素方差分析的方法及應(yīng)用 第一節(jié)方差分析的基本原理 一 什么是方差分析二 方差分析的原理三 F分布 什么是方差分析 檢驗(yàn)多個分總體均值是否相等通過對各觀察數(shù)據(jù)誤差來源的分析來判斷多個分總體均值是否相等2 變量一個定類尺度的自變量2個或多個 k個 水平或類別一個定距或比例尺度的因變量3 用于分析完全隨機(jī)化試驗(yàn)設(shè)計(jì) 什么是方差分析 例子 例8 1 某飲料廠研制出一種新型飲料 該飲料的顏色共有四種 分別為橘黃色 粉紅色 綠色和無色透明 設(shè)四種飲料的營養(yǎng)含量 味道 價格 包裝等可能影響銷售量的因素全部相同 現(xiàn)從地理位置相似 經(jīng)營規(guī)模相仿的五家超市收集了前段時間該飲料的銷售情況 見表8 1 試分析飲料顏色是否對銷售量產(chǎn)生影響 什么是方差分析 例子的進(jìn)一步分析 檢驗(yàn)飲料的顏色對銷售量是否有影響 也就是檢驗(yàn)四種顏色飲料的平均銷售量是否相同設(shè) 1為無色飲料的平均銷售量 2為粉紅色飲料的平均銷售量 3為橘黃色飲料的平均銷售量 4為綠色飲料的平均銷售量 則要檢驗(yàn)的是如下假設(shè)H0 1 2 3 4H1 1 2 3 4不全相等檢驗(yàn)上述假設(shè)的過程就叫做方差分析 方差分析的基本思想和原理 方差分析的幾個基本概念 一 因素或因子所要檢驗(yàn)的影響因素稱為因子要分析飲料的顏色對銷售量是否有影響 顏色是要檢驗(yàn)的因素或因子水平因素包含的具體類別稱為水平A1 A2 A3 A4四種顏色就是因素的四個水平觀察值在每個因素水平下抽樣得到的樣本觀察值每種顏色飲料的銷售量就是樣本觀察值 方差分析的幾個基本概念 二 試驗(yàn)這里只涉及一個因素 因此稱為單因素四水平的試驗(yàn)分總體因素的每一個水平可以看作是一個分總體比如A1 A2 A3 A4四種顏色可以看作是四個分總體樣本數(shù)據(jù)上面的數(shù)據(jù)可以看作是從這四個分總體中抽取的樣本數(shù)據(jù) 1 將總誤差分解成兩類誤差 類別間的誤差和類別內(nèi)的誤差 組間誤差和組內(nèi)誤差 2 如果組間誤差顯著地大于組內(nèi)的隨機(jī)誤差 則原假設(shè)的各分總體均值相等就不能接受 反之 就接受原假設(shè)3 誤差是由各部分的誤差占總誤差的比例來測度的 方差分析的基本思想和原理 方差分析的基本思想和原理 兩類誤差 隨機(jī)誤差 組內(nèi)誤差 在因素的同一水平 同一個分總體 下 樣本的各觀察值之間的差異比如 同一種顏色的飲料在不同超市上的銷售量是不同的不同超市銷售量的差異可以看成是隨機(jī)因素的影響 或者說是由于抽樣的隨機(jī)性所造成的 稱為隨機(jī)誤差系統(tǒng)誤差 組間誤差 在因素的不同水平 不同分總體 下 各觀察值之間的差異比如 同一家超市 不同顏色飲料的銷售量也是不同的這種差異可能是由于抽樣的隨機(jī)性所造成的 也可能是由于顏色本身所造成的 后者所形成的誤差是由系統(tǒng)性因素造成的 稱為系統(tǒng)誤差 方差分析的基本思想和原理 兩類方差 組內(nèi)方差因素的同一水平 同一個總體 下樣本數(shù)據(jù)的方差比如 無色飲料A1在5家超市銷售數(shù)量的方差組內(nèi)方差只包含隨機(jī)誤差組間方差因素的不同水平 不同總體 下各樣本之間的方差比如 A1 A2 A3 A4四種顏色飲料銷售量之間的方差組間方差既包括隨機(jī)誤差 也包括系統(tǒng)誤差 方差分析的基本思想和原理 方差的比較 如果不同顏色 水平 對銷售量 結(jié)果 沒有影響 那么在組間方差中只包含有隨機(jī)誤差 而沒有系統(tǒng)誤差 這時 組間方差與組內(nèi)方差就應(yīng)該很接近 兩個方差的比值就會接近1如果不同的水平對結(jié)果有影響 在組間方差中除了包含隨機(jī)誤差外 還會包含有系統(tǒng)誤差 這時組間方差就會大于組內(nèi)方差 組間方差與組內(nèi)方差的比值就會大于1當(dāng)這個比值大到某種程度時 就可以說不同水平之間存在著顯著差異 方差分析的基本假定 方差分析的基本假定 每個分總體都應(yīng)服從正態(tài)分布對于因素的每一個水平 其觀察值是來自服從正態(tài)分布總體的簡單隨機(jī)樣本比如 每種顏色飲料的銷售量必需服從正態(tài)分布各個分總體的方差必須相同 方差齊性 各組觀察數(shù)據(jù) 是從具有相同方差的分總體中抽取的比如 四種顏色飲料的銷售量的方差都相同觀察值是獨(dú)立的比如 每個超市的銷售量都與其他超市的銷售量獨(dú)立 方差分析中的基本假定 在上述假定條件下 判斷顏色對銷售量是否有顯著影響 實(shí)際上也就是檢驗(yàn)具有同方差的四個正態(tài)總體的均值是否相等的問題如果四個總體的均值相等 可以期望四個樣本的均值也會很接近四個樣本的均值越接近 我們推斷四個總體均值相等的證據(jù)也就越充分樣本均值越不同 我們推斷總體均值不同的證據(jù)就越充分 方差分析中基本假定 如果原假設(shè)成立 即H0 m1 m2 m3 m4四種顏色飲料銷售的均值都相等沒有系統(tǒng)誤差這意味著每個樣本都來自均值為 差為 2的同一正態(tài)總體 方差分析中基本假定 如果備擇假設(shè)成立 即H1 mi i 1 2 3 4 不全相等至少有一個總體的均值是不同的有系統(tǒng)誤差這意味著四個樣本分別來自均值不同的四個正態(tài)總體 第二節(jié)單因素方差分析 一 單因素方差分析的步驟二 方差分析中的多重比較三 單因素方差分析中的其他問題 單因素方差分析的數(shù)據(jù)結(jié)構(gòu) 單因素方差分析的步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策 提出假設(shè) 一般提法H0 m1 m2 mk 因素有k個水平 H1 m1 m2 mk不全相等對前面的例子H0 m1 m2 m3 m4顏色對銷售量沒有影響H0 m1 m2 m3 m4不全相等顏色對銷售量有影響 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 為檢驗(yàn)H0是否成立 需確定檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值離差平方和均方 MS 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算水平的均值 假定從第i個分總體中抽取一個容量為ni的簡單隨機(jī)樣本 則該分總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計(jì)算公式為 式中 ni為第i個總體的樣本觀察值個數(shù)xij為第i個總體的第j個觀察值 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算全部觀察值的總均值 全部觀察值的總和除以觀察值的總個數(shù)計(jì)算公式為 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 前例計(jì)算結(jié)果 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算總離差平方和SST 全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計(jì)算公式為 前例的計(jì)算結(jié)果 SST 26 5 28 695 2 28 7 28 695 2 32 8 28 695 2 115 9295 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算誤差項(xiàng)平方和SSE 每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況 又稱組內(nèi)離差平方和該平方和反映的是隨機(jī)誤差的大小計(jì)算公式為 前例的計(jì)算結(jié)果 SSE 39 084 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算水平項(xiàng)平方和SSA 各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度 又稱組間平方和該平方和既包括隨機(jī)誤差 也包括系統(tǒng)誤差計(jì)算公式為 前例的計(jì)算結(jié)果 SSA 76 8455 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 三個平方和的關(guān)系 總離差平方和 SST 誤差項(xiàng)離差平方和 SSE 水平項(xiàng)離差平方和 SSA 之間的關(guān)系 SST SSE SSA 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 三個平方和的作用 SST反映了全部數(shù)據(jù)總的誤差程度 SSE反映了隨機(jī)誤差的大小 SSA反映了隨機(jī)誤差和系統(tǒng)誤差的大小如果原假設(shè)成立 即H1 H2 Hk為真 則表明沒有系統(tǒng)誤差 組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大 如果組間均方顯著地大于組內(nèi)均方 說明各水平 總體 之間的差異不僅有隨機(jī)誤差 還有系統(tǒng)誤差判斷因素的水平是否對其觀察值有影響 實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小為檢驗(yàn)這種差異 需要構(gòu)造一個用于檢驗(yàn)的統(tǒng)計(jì)量 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算均方MS 各離差平方和的大小與觀察值的多少有關(guān) 為了消除觀察值多少對離差平方和大小的影響 需要將其平均 這就是均方 也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個平方和的自由度分別是SST的自由度為n 1 其中n為全部觀察值的個數(shù)SSA的自由度為k 1 其中k為因素水平 總體 的個數(shù)SSE的自由度為n k 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算均方MS SSA的均方也稱組間方差 記為MSA 計(jì)算公式為 SSE的均方也稱組內(nèi)方差 記為MSE 計(jì)算公式為 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量F 將MSA和MSE進(jìn)行對比 即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時 二者的比值服從分子自由度為k 1 分母自由度為n k的F分布 即 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 F分布與拒絕域 如果均值相等 F MSA MSE 1 統(tǒng)計(jì)決策 將統(tǒng)計(jì)量的值F與給定的顯著性水平 的臨界值F 進(jìn)行比較 作出接受或拒絕原假設(shè)H0的決策根據(jù)給定的顯著性水平 在F分布表中查找與第一自由度df1 k 1 第二自由度df2 n k相應(yīng)的臨界值F 若F F 則拒絕原假設(shè)H0 表明均值之間的差異是顯著的 所檢驗(yàn)的因素 A 對觀察值有顯著影響若F F 則不能拒絕原假設(shè)H0 表明所檢驗(yàn)的因素 A 對觀察值沒有顯著影響 單因素方差分析表 基本結(jié)構(gòu) MSE 單因素方差分析 Excel的輸出結(jié)果 單因素方差分析 一個例子 例 為了對幾個行業(yè)的服務(wù)質(zhì)量進(jìn)行評價 消費(fèi)者協(xié)會在零售業(yè) 旅游業(yè) 航空公司 家電制造業(yè)分別抽取了不同的樣本 其中零售業(yè)抽取7家 旅游業(yè)抽取了6家 航空公司抽取5家 家電制造業(yè)抽取了5家 然后記錄了一年中消費(fèi)者對總共23家服務(wù)企業(yè)投訴的次數(shù) 結(jié)果如表9 7 試分析這四個行業(yè)的服務(wù)質(zhì)量是否有顯著差異 0 05 單因素方差分析 一個例子 單因素方差分析 計(jì)算結(jié)果 解 設(shè)四個行業(yè)被投訴次數(shù)的均值分別為 m1 m2 m3 m4 則需要檢驗(yàn)如下假設(shè)H0 m1 m2 m3 m4 四個行業(yè)的服務(wù)質(zhì)量無顯著差異 H1 m1 m2 m3 m4不全相等 有顯著差異 Excel輸出的結(jié)果如下 結(jié)論 拒絕H0 四個行業(yè)的服務(wù)質(zhì)量有顯著差異 方差分析中的多重比較 方差分析中的多重比較 作用 多重比較是通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異多重比較方法有多種 這里介紹Fisher提出的最小顯著差異方法 簡寫為LSD 該方法可用于判斷到底哪些均值之間有差異LSD方法是對檢驗(yàn)兩個總體均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正 用MSE來代替 而得到的 方差分析中的多重比較 步驟 提出假設(shè)H0 mi mj 第i個總體的均值等于第j個總體的均值 H1 mi mj 第i個總體的均值不等于第j個總體的均值 檢驗(yàn)的統(tǒng)計(jì)量為 若 t t 拒絕H0 若 t t 不能拒絕H0 方差分析中的多重比較 基于統(tǒng)計(jì)量 xi xj的LSD方法 通過判斷樣本均值之差的大小來檢驗(yàn)H0檢驗(yàn)的統(tǒng)計(jì)量為 xi xj檢驗(yàn)的步驟為提出假設(shè)H0 mi mj 第i個總體的均值等于第j個總體的均值 H1 mi mj 第i個總體的均值不等于第j個總體的均值 計(jì)算LSD 若 xi xj LSD 拒絕H0 若 xi xj LSD 不能拒絕H0 方差分析中的多重比較 實(shí)例 根據(jù)前面的計(jì)算結(jié)果 x1 27 3 x2 29 5 x3 26 4 x4 31 4提出假設(shè)H0 mi mj H1 mi mj計(jì)算LSD 方差分析中的多重比較 實(shí)例 x1 x2 27 3 29 5 2 2 2 096顏色1與顏色2的銷售量有顯著差異 x1 x3 27 3 26 4 0 92 096顏色1與顏色4的銷售量有顯著差異 x2 x3 29 5 26 4 3 1 2 096顏色2與顏色3的銷售量有顯著差異 x2 x4 29 5 31 4 1 92 096顏色3與顏色4的銷售量有顯著差異 第三節(jié)雙因素方差分析 一 雙因素方差分析的基本問題二 雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)雙因素方差分析的步驟一個應(yīng)用實(shí)例 雙因素方差分析的基本問題 雙因素方差分析 概念要點(diǎn) 分析兩個因素 因素A和因素B 對試驗(yàn)結(jié)果的影響分別對兩個因素進(jìn)行檢驗(yàn) 分析是一個因素在起作用 還是兩個因素都起作用 還是兩個因素都不起作用如果A和B對試驗(yàn)結(jié)果的影響是相互獨(dú)立的 分別判斷因素A和因素B對試驗(yàn)指標(biāo)的影響 這時的雙因素方差分析稱為無交互作用的雙因素方差分析如果除了A和B對試驗(yàn)結(jié)果的單獨(dú)影響外 因素A和因素B的搭配還會對銷售量產(chǎn)生一種新的影響 這時的雙因素方差分析稱為有交互作用的雙因素方差分析對于無交互作用的雙因素方差分析 其結(jié)果與對每個因素分別進(jìn)行單因素方差分析的結(jié)果相同 雙因素方差分析的基本假定 每個總體都服從正態(tài)分布對于因素的每一個水平 其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個總體的方差必須相同對于各組觀察數(shù)據(jù) 是從具有相同方差的總體中抽取的觀察值是獨(dú)立的 雙因素方差分析的數(shù)據(jù)結(jié)構(gòu) 雙因素方差分析的數(shù)據(jù)結(jié)構(gòu) 是因素A的第i個水平下各觀察值的平均值 是因素B的第j個水平下的各觀察值的均值 是全部kr個樣本數(shù)據(jù)的總平均值 雙因素方差分析的步驟 提出假設(shè) 對因素A提出的假設(shè)為H0 m1 m2 mi mk mi為第i個水平的均值 H1 mi i 1 2 k 不全相等對因素B提出的假設(shè)為H0 m1 m2 mj mr mj為第j個水平的均值 H1 mj j 1 2 r 不全相等 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 為檢驗(yàn)H0是否成立 需確定檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算總離差平方和水平項(xiàng)平方和誤差項(xiàng)平方和均方 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算總離差平方和SST 全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況計(jì)算公式為 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算SSA SSB和SSE 因素A的離差平方和SSA 因素B的離差平方和SSB 誤差項(xiàng)平方和SSE 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 各平方和的關(guān)系 總離差平方和 SST 水平項(xiàng)離差平方和 SSA和SSB 誤差項(xiàng)離差平方和 SSE 之間的關(guān)系 SST SSA SSB SSE 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算均方MS 各離差平方和的大小與觀察值的多少有關(guān) 為消除觀察值多少對離差平方和大小的影響 需要將其平均 這就是均方 也稱為方差計(jì)算方法是用離差平方和除以相應(yīng)的自由度三個平方和的自由度分別是總離差平方和SST的自由度為kr 1因素A的離差平方和SSA的自由度為k 1因素B的離差平方和SSB的自由度為r 1隨機(jī)誤差平方和SSE的自由度為 k 1 r 1 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算均方MS 因素A的均方 記為MSA 計(jì)算公式為 因素B的均方 記為MSB 計(jì)算公式為 隨機(jī)誤差項(xiàng)的均方 記為MSE 計(jì)算公式為 構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量F 為檢驗(yàn)因素A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論