ch09均值比較、試驗(yàn)設(shè)計和方差分析_第1頁
ch09均值比較、試驗(yàn)設(shè)計和方差分析_第2頁
ch09均值比較、試驗(yàn)設(shè)計和方差分析_第3頁
ch09均值比較、試驗(yàn)設(shè)計和方差分析_第4頁
ch09均值比較、試驗(yàn)設(shè)計和方差分析_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

均值比較、實(shí)驗(yàn)設(shè)計和方差分析第九章本章內(nèi)容

獨(dú)立簡單隨機(jī)樣本

兩個獨(dú)立樣本之差的抽樣分布m1s1總體1s2

m2總體2抽取簡單隨機(jī)樣樣本容量n1計算X1抽取簡單隨機(jī)樣樣本容量n2計算X2計算每一對樣本的X1-X2所有可能樣本的X1-X2m1-m2抽樣分布案例HomeStyle家具商店在兩家商店銷售家具:一家位于市區(qū);另一家地處郊區(qū)購物中心。地區(qū)經(jīng)理注意到:在一家商店暢銷的商品在另一家商店賣的不一定好。經(jīng)理認(rèn)為這種情況可能歸因于兩個地區(qū)顧客人群的差異。假定經(jīng)理要求我們調(diào)查一下這兩家商店顧客平均年齡差異。

兩個總體均值之差的估計

(例題分析)【例】某地區(qū)教育委員會想估計兩所中學(xué)的學(xué)生高考時的英語平均分?jǐn)?shù)之差,為此在兩所中學(xué)獨(dú)立抽取兩個隨機(jī)樣本,有關(guān)數(shù)據(jù)如右表。建立兩所中學(xué)高考英語平均分?jǐn)?shù)之差95%的置信區(qū)間

兩個樣本的有關(guān)數(shù)據(jù)

中學(xué)1中學(xué)2n1=46n1=33S1=5.8S2=7.2English兩個總體均值之差的估計

(例題分析)解:兩個總體均值之差在1-置信水平下的置信區(qū)間為兩所中學(xué)高考英語平均分?jǐn)?shù)之差的置信區(qū)間為5.03分~10.97分

向下取整兩個總體均值之差的估計

(例題分析)【例】沿用前例。假定第一種方法隨機(jī)安排12名工人,第二種方法隨機(jī)安排8名工人,即n1=12,n2=8,所得的有關(guān)數(shù)據(jù)如表。假定兩種方法組裝產(chǎn)品的時間服從正態(tài)分布,且方差不相等。以95%的置信水平建立兩種方法組裝產(chǎn)品所需平均時間差值的置信區(qū)間兩個方法組裝產(chǎn)品所需的時間方法1方法228.336.027.631.730.137.222.226.529.038.531.037.634.433.832.128.020.028.830.030.221兩個總體均值之差的估計

(例題分析)解:根據(jù)樣本數(shù)據(jù)計算得自由度為:兩種方法組裝產(chǎn)品所需平均時間之差的置信區(qū)間為0.192分鐘~9.058分鐘SPSS的應(yīng)用

左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)常見的假設(shè)的形式

假設(shè)研究的問題沒有差異有差異均值1均值2均值1<均值2均值1均值2均值1>均值2H0

1–2=0

1–20

1–20H1

1–20

1–2<0

1–2>0兩個總體均值之差的檢驗(yàn)

(12、22

已知)假定條件兩個樣本是獨(dú)立的隨機(jī)樣本兩個總體都是正態(tài)分布若不是正態(tài)分布,可以用正態(tài)分布來近似(n130和n230)檢驗(yàn)統(tǒng)計量為拒絕法則下側(cè)檢驗(yàn)上側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計量拒絕法則:p值法拒絕法則:臨界值法EXCEL應(yīng)用z-檢驗(yàn):雙樣本均值分析

CenterACenterB平均8278已知協(xié)方差100100觀測值3040假設(shè)平均差0z1.6561573P(Z<=z)單尾0.048845z單尾臨界1.6448536P(Z<=z)雙尾0.09769z雙尾臨界1.959964

向下取整例題研究一款新的軟件是否能夠有助于系統(tǒng)分析員減少設(shè)計、開放、實(shí)現(xiàn)信息系統(tǒng)所需要的時間。因此指定12名分析員使用當(dāng)前技術(shù)來開發(fā)的信息系統(tǒng),另外12名分析員使用新軟件包來開發(fā)系統(tǒng)。EXCEL應(yīng)用t-檢驗(yàn):雙樣本異方差假設(shè)

CurrentNew平均325286方差1599.6361935.818觀測值1212假設(shè)平均差0df22tStat2.272127P(T<=t)單尾0.016602t單尾臨界1.717144P(T<=t)雙尾0.033204t雙尾臨界2.073873

兩個總體均值之差的推斷:匹配樣本匹配樣本,又稱配對樣本,是指兩個樣本的數(shù)據(jù)之間存在一一對應(yīng)的關(guān)系。配對樣本一般來自配對組或是同對一個樣本的兩次試驗(yàn)。例如,對某一高血壓群體測試某一種藥物是否可以降低他們的血壓。比較:

使用前——使用后兩個總體均值之差的估計

(匹配大樣本)假定條件兩個匹配的大樣本(n130和n230)兩個總體各觀察值的配對差服從正態(tài)分布兩個總體均值之差d=1-2在1-置信水平下的置信區(qū)間為對應(yīng)差值的均值對應(yīng)差值的標(biāo)準(zhǔn)差兩個總體均值之差的估計

(匹配小樣本)假定條件兩個匹配的小樣本(n1<30和n2<30)兩個總體各觀察值的配對差服從正態(tài)分布

兩個總體均值之差d=1-2在1-置信水平下的置信區(qū)間為

自由度為n-1兩個總體均值之差的估計

(例題分析)【例】由10名學(xué)生組成一個隨機(jī)樣本,讓他們分別采用A和B兩套試卷進(jìn)行測試,結(jié)果如下表。試建立兩種試卷分?jǐn)?shù)之差d=1-2

95%的置信區(qū)間

10名學(xué)生兩套試卷的得分學(xué)生編號試卷A試卷B差值d17871726344193726111489845691741754951-27685513876601698577810553916兩個總體均值之差的估計

(例題分析)解:根據(jù)樣本數(shù)據(jù)計算得兩種試卷所產(chǎn)生的分?jǐn)?shù)之差的置信區(qū)間為6.33分~15.67分匹配樣本的t

檢驗(yàn)

(檢驗(yàn)統(tǒng)計量)樣本差值均值樣本差值標(biāo)準(zhǔn)差自由度df=n

-1統(tǒng)計量D0:假設(shè)的差值【例】一個以減肥為主要目標(biāo)的健美俱樂部聲稱,參加其訓(xùn)練班至少可以使減肥者平均體重減重8.5kg以上。為了驗(yàn)證該宣稱是否可信,調(diào)查人員隨機(jī)抽取了10名參加者,得到他們的體重記錄如下表:匹配樣本的t

檢驗(yàn)

(例題分析)在

=0.05的顯著性水平下,調(diào)查結(jié)果是否支持該俱樂部的聲稱?訓(xùn)練前94.5101110103.59788.596.5101104116.5訓(xùn)練后8589.5101.5968680.58793.593102單側(cè)檢驗(yàn)樣本差值計算表訓(xùn)練前訓(xùn)練后差值Di94.5101110103.59788.596.5101104116.58589.5101.5968680.58793.5931029.511.58.57.51189.57.51114.5合計—98.5配對樣本的t

檢驗(yàn)

(例題分析)配對樣本的t

檢驗(yàn)

(例題分析)差值均值差值標(biāo)準(zhǔn)差H0:

m1–m2

8.5H1:

m1–m2

<8.5a=0.05df=

10-1=9臨界值(s):檢驗(yàn)統(tǒng)計量:決策:結(jié)論:

=0.05的水平上不拒絕H0不能認(rèn)為該俱樂部的宣稱不可信配對樣本的t

檢驗(yàn)

(例題分析)-1.833t0拒絕域.05匹配樣本差的區(qū)間估計WorkerMethod1Method2di165.40.6255.2-0.2376.50.546.25.90.3566066.45.80.6EXCEL的應(yīng)用數(shù)據(jù)——數(shù)據(jù)分析t-檢驗(yàn):成對雙樣本均值分析

Method1Method2平均6.15.8方差0.4280.212觀測值66泊松相關(guān)系數(shù)0.876424假設(shè)平均差0df5tStat2.195775P(T<=t)單尾0.039758t單尾臨界2.015048P(T<=t)雙尾0.079516t雙尾臨界2.570582

兩個正態(tài)總體參數(shù)的檢驗(yàn)兩個總體的檢驗(yàn)Z檢驗(yàn)(大樣本)t檢驗(yàn)(小樣本)t檢驗(yàn)(小樣本)Z檢驗(yàn)F檢驗(yàn)獨(dú)立樣本配對樣本均值比例方差實(shí)驗(yàn)設(shè)計和方差分析簡介觀察性研究(observationalstudy),是在自然的狀態(tài)下對研究對象的特征進(jìn)行觀察、記錄,并對結(jié)果進(jìn)行描述和對比分析。實(shí)驗(yàn)性研究(experimentalstudy),是在控制的條件下系統(tǒng)的操縱某種變量的變化,來研究這種變量的變化(自變量)對其他變量(因變量)所產(chǎn)生的影響。幾個概念自變量(因子、因素、輸入變量、過程變量):可以控制的、影響因變量的變量。因變量(反應(yīng)變量、響應(yīng)變量、輸出變量):我們所關(guān)心的、承載試驗(yàn)結(jié)果的變量。水平(設(shè)置):自變量的不同等級(不同取值)。水平數(shù)通常不多,連續(xù)型變量需離散化取值。處理:各因子按設(shè)定水平的一個組合。試驗(yàn)單元:試驗(yàn)載體的最小單位。例子Chemitech公司開發(fā)了一種新的城市供水過濾系統(tǒng),其元件需從幾家供應(yīng)商處購買,然后Chemitech公司在位于南加州哥倫比亞的工廠裝配這些元件。由工程部負(fù)責(zé)確定新過濾系統(tǒng)的最佳裝配方法??紤]過各種可能之后,工程部將范圍縮小至三種方法:方法A、方法B及方法C。這些方法在產(chǎn)品裝配步驟上有所不同。Chemitech公司的管理者希望確定哪種裝配方法每周生產(chǎn)的過濾系統(tǒng)數(shù)最大。完全隨機(jī)化設(shè)計工廠里所有的工人抽取15個工人進(jìn)行隨機(jī)試驗(yàn)每一種裝配方法隨機(jī)指派5人方法B5人方法C5人方法A5人例子中涉及的概念因子:裝配方法響應(yīng)變量:每周裝配的過濾系統(tǒng)的數(shù)量處理:這里的因子有三個處理,裝配方法A、裝配方法B和裝配方法C試驗(yàn)單元:試驗(yàn)載體的最小單位,這里最小的一個樣本需要3個工人。研究的問題

【例】確定超市的位置和競爭者的數(shù)量對銷售額是否有顯著影響,獲得的年銷售額數(shù)據(jù)(單位:萬元)如下表因子水平或處理樣本數(shù)據(jù)另外一個例子對應(yīng)的概念和問題如果只考慮“超市位置”對銷售額是否有顯著影響,實(shí)際上也就是要判斷不同位置超市的銷售額均值是否相同若它們的均值相同,意味著“超市位置”對銷售額沒有顯著影響;若均值不全相同,則意味著“超市位置”對銷售額有顯著影響“超市位置”就是分類自變量,“銷售額”則是數(shù)值因變量。“超市位置”是要檢驗(yàn)的對象,稱為因子(factor),商業(yè)區(qū)、居民小區(qū)、寫字樓是因子的3個取值,稱為水平(level)或處理(treatment)。每個因子水平下得到的銷售額為樣本觀測值A(chǔ)ugust1,2010方差分析的基本原理是在20世紀(jì)20年代由英國統(tǒng)計學(xué)家RonaldA.Fisher在進(jìn)行實(shí)驗(yàn)設(shè)計時為解釋實(shí)驗(yàn)數(shù)據(jù)而首先引入的檢驗(yàn)多個總體均值是否相等通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類型自變量對數(shù)值型因變量的影響

一個或多個分類型自變量一個數(shù)值型因變量有單因子方差分析和雙因子方差分析單因子方差分析:涉及一個分類的自變量雙因子方差分析:涉及兩個分類的自變量什么是方差分析(ANOVA)

(analysisofvariance)

零售業(yè)旅游業(yè)航空公司家電制造方差分析的基本思想和原理

(圖形分析)方差分析的基本思想和原理

(圖形分析)從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)是有明顯差異的即使是在同一個行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造也被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想(兩種誤差)隨機(jī)誤差因子的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差

系統(tǒng)誤差因子的不同水平(不同總體)下,各觀察值之間的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于方法本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差方差分析的基本思想(兩類方差)數(shù)據(jù)的誤差用平方和(sumofsquares)表示,稱為方差組內(nèi)方差(withingroups)因子的同一水平(同一個總體)下樣本數(shù)據(jù)的方差比如,零售業(yè)被投訴次數(shù)的方差組內(nèi)方差只包含隨機(jī)誤差組間方差(betweengroups)因素的不同水平(不同總體)下各樣本之間的方差比如,四個行業(yè)被投訴次數(shù)之間的方差組間方差既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想(方差的比較)若不同不同行業(yè)對投訴次數(shù)沒有影響,則組間誤差中只包含隨機(jī)誤差,沒有系統(tǒng)誤差。這時,組間誤差與組內(nèi)誤差經(jīng)過平均后的數(shù)值就應(yīng)該很接近,它們的比值就會接近1。若不同不同行業(yè)對投訴次數(shù)存在影響,在組間誤差中除了包含隨機(jī)誤差外,還會包含有系統(tǒng)誤差,這時組間誤差平均后的數(shù)值就會大于組內(nèi)誤差平均后的數(shù)值,它們之間的比值就會大于1。當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響。正態(tài)性(normality)。每個總體都應(yīng)服從正態(tài)分布,即對于因子的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機(jī)樣本。方差齊性(homogeneityvariance)。各個總體響應(yīng)變量的方差必須相同,對于分類變量的k個水平,有12=22=…=k2獨(dú)立性(independence)。每個樣本數(shù)據(jù)是來自因子各水平的獨(dú)立樣本(該假定不滿足對結(jié)果影響較大)方差分析的假定分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計量統(tǒng)計決策如果原假設(shè)成立,即H0:m1=m2=m3三種裝配方法的效率是相等的意味著每個樣本都來自均值為、方差為2的同一正態(tài)總體

Xf(X)1

2

3

4

方差分析的假設(shè)August1,2010若備擇假設(shè)成立,即H1:mi(i=1,2,3)不全相等至少有一個總體的均值是不同的3個樣本分別來自均值不同的3個正態(tài)總體

Xf(X)

1

2

3

方差分析的假設(shè)分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計量統(tǒng)計決策單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

(one-wayanalysisofvariance)

觀察值(i

)因子(A)j

水平A1水平A2

…水平Ak12::n

x11x21…

xk1x12x22…

xk2::::::::x1n

x2n…

xkn構(gòu)造統(tǒng)計量需要計算樣本均值(組內(nèi)均值、水平均值)總樣本均值(全部觀察值的總均值)誤差平方和均方(MS)計算樣本均值假定從第j個總體中抽取一個容量為nj的簡單隨機(jī)樣本,第j個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)計算公式

第j個處理的樣本均值(第j個總體的樣本均值)計算總樣本均值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論