張厚粲第九章方差分析_第1頁
張厚粲第九章方差分析_第2頁
張厚粲第九章方差分析_第3頁
張厚粲第九章方差分析_第4頁
張厚粲第九章方差分析_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章方差分析(ANOVA)方差分析又稱為變異分析(analysisofvariance,ANOVA),是由斯內(nèi)德克(GeorgeWaddelSnedecor)提出的一種方法。方差分析通過對多組平均數(shù)的差異進(jìn)行顯著性檢驗(yàn),分析實(shí)驗(yàn)數(shù)據(jù)中不同來源的變異對總變異影響的大小。

t檢驗(yàn)法適用于樣本平均數(shù)與總體平均數(shù)及兩樣本平均數(shù)間的差異顯著性檢驗(yàn),但在生產(chǎn)和科學(xué)研究中經(jīng)常會遇到比較多個處理優(yōu)劣的問題,即需進(jìn)行多個平均數(shù)間的差異顯著性檢驗(yàn)(K≥3)。這時,若仍采用t檢驗(yàn)法就不適宜了。這是因?yàn)椋?/p>

1、檢驗(yàn)過程煩瑣例如,一試驗(yàn)包含5個處理,采用t檢驗(yàn)法要進(jìn)行10次兩兩平均數(shù)的差異顯著性檢驗(yàn);若有k個處理,則要作k(k-1)/2次類似的檢驗(yàn)。2、無統(tǒng)一的試驗(yàn)誤差,誤差估計的精確性和檢驗(yàn)的靈敏性低對同一試驗(yàn)的多個處理進(jìn)行比較時,應(yīng)該有一個統(tǒng)一的試驗(yàn)誤差的估計值。若用t檢驗(yàn)法作兩兩比較,由于每次比較需計算一個s,故使得各次比較誤差的估計不統(tǒng)一,同時沒有充分利用資料所提供的信息而使誤差估計的精確性降低,從而降低檢驗(yàn)的靈敏性。

例如,試驗(yàn)有5個處理,每個處理重復(fù)6次,共有30個觀測值。進(jìn)行t檢驗(yàn)時,每次只能利用兩個處理共12個觀測值估計試驗(yàn)誤差,誤差自由度為2(6-1)=10;若利用整個試驗(yàn)的30個觀測值估計試驗(yàn)誤差,顯然估計的精確性高,且誤差自由度為5(6-1)=25??梢姡谟胻檢法進(jìn)行檢驗(yàn)時,由于估計誤差的精確性低,誤差自由度小,使檢驗(yàn)的靈敏性降低,容易掩蓋差異的顯著性。

3、這種兩兩比較會隨著樣本組數(shù)的增加而加大犯Ⅰ型錯誤的概率用t檢驗(yàn)法進(jìn)行4個處理平均數(shù)間的差異顯著性檢驗(yàn),若兩兩比較推斷正確的概率為95%,則所有比較都正確的概率為0.956=0.74,則降低了推斷的可靠性。

幾個常用術(shù)語:1、試驗(yàn)指標(biāo)(experimentalindex)為衡量試驗(yàn)結(jié)果的好壞或處理效應(yīng)的高低,在試驗(yàn)中具體測定的性狀或觀測的項目稱為試驗(yàn)指標(biāo)。由于試驗(yàn)?zāi)康牟煌?,選擇的試驗(yàn)指標(biāo)也不相同。2、試驗(yàn)因素(experimentalfactor)試驗(yàn)中所研究的影響試驗(yàn)指標(biāo)的因素叫試驗(yàn)因素。當(dāng)試驗(yàn)中考察的因素只有一個時,稱為單因素試驗(yàn);若同時研究兩個或兩個以上的因素對試驗(yàn)指標(biāo)的影響時,則稱為兩因素或多因素試驗(yàn)。試驗(yàn)因素常用大寫字母A、B、C、…等表示。

3、因素水平(leveloffactor)試驗(yàn)因素所處的某種特定狀態(tài)或數(shù)量等級稱為因素水平,簡稱水平。4、試驗(yàn)處理(treatment)事先設(shè)計好的實(shí)施在試驗(yàn)單位上的具體項目叫試驗(yàn)處理,簡稱處理。在單因素試驗(yàn)中,實(shí)施在試驗(yàn)單位上的具體項目就是試驗(yàn)因素的某一水平。進(jìn)行單因素試驗(yàn)時,試驗(yàn)因素的一個水平就是一個處理。在多因素試驗(yàn)時,試驗(yàn)因素的一個水平組合就是一個處理。5、重復(fù)(repetition)在試驗(yàn)中,將一個處理實(shí)施在兩個或兩個以上的試驗(yàn)單位上,稱為處理的重復(fù)數(shù)。第一節(jié)方差分析的基本原理及步驟一、方差分析的基本原理:綜合的F檢驗(yàn)(一)綜合的虛無假設(shè)與部分虛無假設(shè)1.綜合的虛無假設(shè)樣本所歸屬的總體的平均數(shù)相等,即

H0:μ1=μ2=μ32.此為部分虛無假設(shè)

組間的虛無假設(shè)(二)方差的可分解性(可加性)1.可加性方差分析作為一種統(tǒng)計方法,是把實(shí)驗(yàn)數(shù)據(jù)的總變異分解為若干個不同來源的分量。因而它所依據(jù)的基本原理是變異的可加性。即每一個數(shù)據(jù)與數(shù)據(jù)的總體平均數(shù)差的平方和,可以分解為每一組數(shù)據(jù)各自的離差平方和與由各組數(shù)據(jù)的平均數(shù)組成的一組數(shù)據(jù)的離差平方和兩部分。前者表達(dá)的是組內(nèi)差異,即每組數(shù)據(jù)中各個數(shù)據(jù)之間的差異,也就是個體差異,表達(dá)的是抽樣誤差或隨機(jī)誤差程度;后者表達(dá)的是組間差異,即各組平均數(shù)之間的差異,表達(dá)的是實(shí)驗(yàn)操縱的差異程度,實(shí)驗(yàn)操縱即指自變量的操縱,這兩部分差異之間相互獨(dú)立??捎霉奖硎緸椋篠ST=SSB+SSw如:欲觀察某因素的三個水平對被試是否產(chǎn)生相同的影響:組一:A、A、A、A、A—水平一組二:B、B、B、B、B—水平二組三:C、C、C、C、C—水平三總組:A、A、A、A、A、B、B、B、B、B、C、C、C、C、C2.總體變異的構(gòu)成總體變異組間變異:組內(nèi)變異:組內(nèi)變異理論上要求齊性,實(shí)際計算取其均值3.方差的基本公式一般總體方差稱方差,樣本方差稱均方能使變量發(fā)生變異的原因很多,這些原因我們都將其稱為變異因素或變異來源。方差分析就是發(fā)現(xiàn)各類變異因素相對重要性的一種方法方差分析的思路就是:把整個試驗(yàn)(設(shè)有k個總體)的樣本資料作為一個整體來考慮。把整個試驗(yàn)的總變異按照變異的來源分解成不同因素的變異。由于方差等于平方和除以自由度,因此總方差分解成各因素的方差,就是將形成總方差的平方和和自由度分解為各因素的平方和和自由度。然后對各個因素的方差作出數(shù)量上的估計,從而發(fā)現(xiàn)各個因素的方差的相對重要程度。從總方差中除去各可控因素所引起的方差后,剩余方差又可以準(zhǔn)確地估計試驗(yàn)誤差,作為統(tǒng)計假設(shè)檢驗(yàn)的依據(jù)因此,方差分析可以幫助我們抓住試驗(yàn)的主要矛盾和技術(shù)關(guān)鍵,發(fā)現(xiàn)主要的變異來源,從而抓住主要的、實(shí)質(zhì)性的東西。4.平方和的剖分SS(sumofsquares)表示平方和SST(thesumofsquarestotal)總平方和,一個試驗(yàn)中的總變異。SSB(sumofsquaresbetweengroups)組間平方和,表示由于不同的實(shí)驗(yàn)處理而造成的變異。(主試)SSW(sumofsquareswithingroup)試驗(yàn)誤差造成的變異。(被試)

SST=SSB+SSW總變異=組間變異+組內(nèi)變異總變異(SST)是將所有被試的數(shù)值作為一個整體考慮到的結(jié)果,是用所有被試的因變量的值計算出來的。組間變異(SSB

)主要是因?yàn)榻邮懿煌膶?shí)驗(yàn)處理而造成的各組之間的變異。用兩個平均數(shù)的離差表示。組內(nèi)變異(SSW)指組內(nèi)各被試因變量的差異范圍。5.組間方差(組間均方)與組內(nèi)方差(組內(nèi)均方)6.自由度的分解在計算處理間平方和時,各處理均數(shù)要受這一條件的約束,故處理間自由度為處理數(shù)減1,即k-1。處理間自由度記為dfB,即dfB=k-1。在計算處理內(nèi)平方和時,每組自由度為n-1,共有k組,故處理內(nèi)自由度k(n-1),

處理內(nèi)自由度記為dfW,即dfW=k(n-1)=kn-k。7、方差分析方差之間的差異分析用F檢驗(yàn),因此,組間與組內(nèi)方差的分析也用F檢驗(yàn)。方差分析關(guān)注的是組間均方是否顯著大于組內(nèi)均方。因此,常用作單側(cè)檢驗(yàn)。kj表明數(shù)據(jù)的總變異基本上是有不同的實(shí)驗(yàn)處理造成的(不同的實(shí)驗(yàn)處理間存在顯著差異)表明數(shù)據(jù)的總變異基本上是有實(shí)驗(yàn)誤差和個體誤差造成的,與不同的實(shí)驗(yàn)處理關(guān)系不大(不同的實(shí)驗(yàn)處理間不存在顯著差異)。二、方差分析的基本假設(shè)1.總體正態(tài)分布2.各實(shí)驗(yàn)處理是隨機(jī)的且相互獨(dú)立(一般情況下都能滿足)3.各實(shí)驗(yàn)處理內(nèi)方差一致(需要進(jìn)行檢驗(yàn))最為重要的假定三、方差齊性檢驗(yàn)1.哈特萊最大F比率法找出要比較的組內(nèi)方差的最大值與最小值。最大方差與最小方差無顯著差異即為方差齊性。四、方差分析的基本步驟(一).提出假設(shè)(二).選擇檢驗(yàn)統(tǒng)計量并計算

1.分解平方和總平方和SST

組間平方和SSB

組內(nèi)平方和SSW

2.分解自由度df總自由度:dfT=nk-1組間自由度:dfB=k-1組內(nèi)自由度:dfW=nk-k組內(nèi)自由度的計算(1)不同實(shí)驗(yàn)處理人數(shù)相同時每組自由度n1-1,n2-1,n3-1…nk-1組內(nèi)自由度n1-1+n2-1+n3-1+…nk-1,因?yàn)閚1=n2=n3=…nk,所以為K(n-1)(2)不同實(shí)驗(yàn)處理人數(shù)不相同時每組自由度n1-1,n2-1,n3-1…nk-1組內(nèi)自由度n1-1+n2-1+n3-1+…nk-1

3.計算方差MSMSB=SSB/dfB和MSW=SSW/dfW4.計算F值F=MSB/MSW(三).作出統(tǒng)計結(jié)論1.顯著性水平2.臨界水平F值3.比較推論(四)陳列方差分析表變異(差異)來源平方和(SS)自由度(df)

均方(MS) Fp組間SSBdfB=k-1MSBFp組內(nèi)SSWdfW=nk-kMSW總變異SSTdfT=nk-1MST例:研究人員采用四種不同的心理治療方案,對每個志愿參加治療的患者進(jìn)行心理治療。他們用錄音機(jī)記錄了每個被試在一段時間中所講的詞數(shù)。由于錄音的困難每種方案記錄的人數(shù)各不相同,原始數(shù)據(jù)見表1。問這幾種方案是否有差異?序號治療方案X1X2X3X41309005025001832488774427454763814445631367860843462116664356341156603600458336462384424576765776562384444193666435663814445833645227047806400計算表11.提出假設(shè)H0:μ1=μ2=μ3=μ4H1:至少有兩個總體平均數(shù)不等2.選擇檢驗(yàn)統(tǒng)計量并計算假定四組記錄數(shù)據(jù)是從四個正態(tài)總體中抽出的獨(dú)立樣本,對多個獨(dú)立樣本平均數(shù)的差異進(jìn)行顯著性檢驗(yàn),應(yīng)采用完全隨機(jī)設(shè)計的方差分析。(1).計算平方和:組間平方和組內(nèi)平方和總平方和(2).計算自由度組間自由度組內(nèi)自由度總自由度(3).計算方差組間方差

組內(nèi)方差(4).計算F值

3.做統(tǒng)計決斷,列方差分析表變異來源平方和自由度方差F值概率組間變異2850.43950.13.77*P<0.05組內(nèi)變異4786.519251.9總變異7636.922表9-3四組記錄數(shù)據(jù)的完全隨機(jī)設(shè)計方差分析表第二節(jié)完全隨機(jī)設(shè)計的方差分析單因素完全隨機(jī)設(shè)計的方差分析(completerandomizeddesign)把從同一個總體中隨機(jī)抽取的被試隨機(jī)地分配為幾個實(shí)驗(yàn)組,每個實(shí)驗(yàn)組分別接受某一因素的不同水平的操縱,檢驗(yàn)這幾個獨(dú)立樣本平均數(shù)之間是否存在顯著差異一、各實(shí)驗(yàn)處理組樣本容量相同例題:從五所中學(xué)同一個年級隨機(jī)抽取3名學(xué)生進(jìn)行統(tǒng)一數(shù)學(xué)測驗(yàn),結(jié)果如下,問五所學(xué)校數(shù)學(xué)成績之間有無顯著差異?

ABCDE176788683732738184827437081858778實(shí)驗(yàn)分析:自變量:學(xué)校類型自變量的不同水平:不同類型的學(xué)校因變量:數(shù)學(xué)成績實(shí)驗(yàn)?zāi)康募邦A(yù)學(xué)校類型對數(shù)學(xué)成績有無影響?重點(diǎn)中學(xué)應(yīng)該好于一般中學(xué)1.提出假設(shè):虛無假設(shè):u1=u2……=u5;備選假設(shè):至少兩個總體的平均數(shù)不相等;2.選擇并計算統(tǒng)計量(1)計算平方和容量平均數(shù)總和平方和均方組一3732191600515987組二380240920619200組三3852552166721168組四3842522118216899組五3752252116816875合計1511919495994905組間平方和:SSB=94905-11912/3*5=339.6組內(nèi)平方和:SSW=94959-94905=54(2)計算自由度:組間自由度:dfB=k-1=-5-1=4組內(nèi)自由度:dfW

=k(n-1)=5×2=10(3)計算方差組間方差:MSB=SSB/(k-1)=339.6/4=84.9組內(nèi)方差:MSW

=SSW

/(nk-n)=54/10=5.4(4)計算F值F=MSB/MSW=84.9/5.4=15.723.查F值表做出統(tǒng)計推斷F0.05(dfB,dfW

)=F0.05(4,10)

=3.48統(tǒng)計推斷:F=15.72>F0.05(dfB,dfW)=3.48,p<0.05。存在顯著差異。4.列出方差分析表二、各實(shí)驗(yàn)處理組樣本容量不同例:研究人員采用四種不同的心理治療方案,對每個志愿參加治療的患者進(jìn)行心理治療。他們用錄音機(jī)記錄了每個被試在一段時間中所講的詞數(shù)。由于錄音的困難每種方案記錄的人數(shù)各不相同,原始數(shù)據(jù)見表1。問這幾種方案是否有差異?1.提出假設(shè)H0:μ1=μ2=μ3=μ4H1:至少有兩個總體平均數(shù)不等2.選擇檢驗(yàn)統(tǒng)計量并計算假定四組記錄數(shù)據(jù)是從四個正態(tài)總體中抽出的獨(dú)立樣本,對多個獨(dú)立樣本平均數(shù)的差異進(jìn)行顯著性檢驗(yàn),應(yīng)采用完全隨機(jī)設(shè)計的方差分析。(1).計算平方和:組間平方和組內(nèi)平方和總平方和(2).計算自由度組間自由度組內(nèi)自由度總自由度(3).計算方差組間方差

組內(nèi)方差(4).計算F值

3.做統(tǒng)計決斷,列方差分析表變異來源平方和自由度方差F值概率組間變異2850.43950.13.77*P<0.05組內(nèi)變異4786.519251.9總變異7636.922表9-3四組記錄數(shù)據(jù)的完全隨機(jī)設(shè)計方差分析表三、利用樣本統(tǒng)計量進(jìn)行方差分析適用范圍:分析資料沒有原始數(shù)據(jù),只有si2、ni,平均數(shù)等。適用原始公式求解第三節(jié)隨機(jī)區(qū)組設(shè)計的方差分析含義:所謂區(qū)組是指把從同一總體中隨機(jī)抽取的被試按條件相同的原則區(qū)分成各個組,使每個組內(nèi)的被試盡量保持同質(zhì),讓每個組均接受所有的各種實(shí)驗(yàn)處理,每種實(shí)驗(yàn)處理在各個區(qū)組中重復(fù)的次數(shù)相等,這種設(shè)計也稱為被試內(nèi)設(shè)計。對這樣獲得的多個相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論