最新-第5講均值比較與方差分析-PPT精品課件_第1頁
最新-第5講均值比較與方差分析-PPT精品課件_第2頁
最新-第5講均值比較與方差分析-PPT精品課件_第3頁
最新-第5講均值比較與方差分析-PPT精品課件_第4頁
最新-第5講均值比較與方差分析-PPT精品課件_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、2019數(shù)學建模培訓7/19/20221第5講 均值比較與方差分析7/19/20222一、SPSS數(shù)據(jù)的錄入與管理7/19/20223 由于建立數(shù)據(jù)文件是SPSS分析的基礎,所以本講首先簡要介紹數(shù)據(jù)的錄入與管理。 SPSS具有很強的數(shù)據(jù)處理和分析能力,它可以讀取11種不同類型的外部文件,存儲30種不同類型的數(shù)據(jù)文件。 利用SPSS對數(shù)據(jù)進行分析, 首先7/19/20224要建立數(shù)據(jù)文件。另外,有時還需要對已有數(shù)據(jù)文件進行編輯、管理,如變量、屬性和文件的管理等。1. 數(shù)據(jù)的錄入與調(diào)用 下面用一個實例介紹建立數(shù)據(jù)文件和錄入數(shù)據(jù)的方法。 例1 現(xiàn)有15人的體檢資料,試建立SPSS數(shù)據(jù)文件,并存為1_

2、1.sav。7/19/20225 體檢資料包含的信息有編號、姓名、文化程度、出生日期、體檢日期、身高、體重、疾病名稱。 在SPSS中,錄入數(shù)據(jù)時,首先要根據(jù)數(shù)據(jù)特征確定變量的名稱、類型(寬度,小數(shù))、標簽、值等。 本例中的變量特征如下: 7/19/20226名稱類型寬度小數(shù)標簽說明編號數(shù)值20校體檢姓名字符80*8ASCII 4漢文化數(shù)值401-6 小學-博士出生日日期100*mm/dd/yyyy體檢日日期100*普查mm/dd/yyyy身高數(shù)值52cm體重數(shù)值42kg疾病數(shù)值40代碼表示疾病7/19/20227 數(shù)據(jù)錄入過程與方法: (1) 啟動SPSS,選擇“輸入數(shù)據(jù)”,進入數(shù)據(jù)編輯器;

3、(2) 選擇變量視圖; (3) 依次錄入各變量的名稱、類型 (寬度, 小數(shù))、標簽、值; (4) 選擇數(shù)據(jù)視圖; (5) 依次錄入相應數(shù)據(jù)。7/19/20228 保存后即生成.sav文件。 如果SPSS需調(diào)用Excel文件,當數(shù)據(jù)較少時,可直接復制;當數(shù)據(jù)較多時,可通過: 文件打開數(shù)據(jù)庫新建查詢Excel files流程調(diào)入Excel 數(shù)據(jù)。 調(diào)入數(shù)據(jù)后,可按照前述方式對其分別定義變量各屬性。7/19/20229 調(diào)入Excel數(shù)據(jù)要特別注意第1行數(shù)據(jù)的變化。2. 數(shù)據(jù)的管理 數(shù)據(jù)文件建立后,有時需要對變量進行管理,如插入變量、定義變量屬性、復制變量屬性等。 數(shù)據(jù)管理主要通過“數(shù)據(jù)”菜單進行,

4、請各位自行練習。7/19/202210二、均值比較7/19/2022111. 引言 在科學實驗中常常要研究不同實驗條件或方法對實驗結(jié)果的影響。比如,幾種不同藥物對某種疾病的療效;不同飼料對牲畜體重增長的效果等。 研究上述問題的基本思路是比較不同實驗條件或方法下樣本均值間的差異。 7/19/202212 比較樣本均值間的差異是否具有統(tǒng)計學意義的常用方法有均值比較和方差分析。 均值比較僅用于單因素兩水平設計和單組設計中均值的檢驗,而方差分析可用于單因素多水平設計和多因素設計中均值的檢驗。 簡單地說,均值比較僅適用于兩7/19/202213個樣本均值的比較,而方差分析適用三個及以上樣本均值的比較。2

5、. 均值比較的原理與步驟 均值比較采用假設檢驗原理,并設總體均為正態(tài)分布,比較步驟為:(1) 提出假設 通常假設差異不顯著。(2) 構(gòu)造檢驗統(tǒng)計量 7/19/202214 總體方差已知時,構(gòu)造的統(tǒng)計量服從正態(tài)分析,稱為Z檢驗。大多數(shù)情況下,總體方差未知,此時構(gòu)造的統(tǒng)計量服從t分布,稱為t檢驗。(3) 確定顯著性水平(拒真概率) 顯著性水平 即為檢驗時犯拒真 錯誤概率的最大允許值,也就是說接受假設的正確率至少為 。 7/19/202215 通常取 。(4) 計算檢驗統(tǒng)計量t0(5) 作出推斷(兩種方法) 用統(tǒng)計量若 , 則拒絕假設,即差異顯著。 用顯著性概率P值(sig.)若顯著性概率 ,則拒絕

6、假設,即差異顯著。 7/19/202216 7/19/2022173. 單一樣本均值的t檢驗 單一樣本均值的檢驗,即只對單一變量的均值進行檢驗,用于檢驗樣本均值是否與給定的總體均值之間存在顯著差異。 例1 已知某年級15個學生身高數(shù)據(jù)如下,檢驗其平均身高是否與全年級平均身高165相同。7/19/202218 解 分析-比較均值-單樣本t檢驗。 選身高入檢驗變量,檢驗值設為165;選項中置信區(qū)間百分比默認為0.95,即 。7/19/202219 顯然,在0.05水平下應接受假設,即15個學生的平均身高與年級平均身高無顯著差異。7/19/2022204. 獨立樣本均值的t檢驗 獨立樣本均值的檢驗用

7、于檢驗兩個來自獨立正態(tài)總體的樣本均值之間是否存在顯著差異。 例2 根據(jù)下列數(shù)據(jù)比較男生和女生的平均身高是否相等。 解 本題首先要注意數(shù)據(jù)格式。 可以設置三列數(shù)據(jù)。第一列為序7/19/202221號(字符型或數(shù)據(jù)型),第二列為身高(數(shù)值型),第三列為性別(字符型, 字符1表示男生,字符0表示女生)。 此時一定要在數(shù)據(jù)視圖的“值”中進行值標簽定義,如1=“男生”, 0= “女生”。 分析-比較均值-獨立樣本t檢驗。7/19/202222 選身高入檢驗變量,選性別入分組變量,并在定義組中定義組1, 組2的值分別為1, 0。 其余默認,確定。7/19/202223 F=0.843, P=0.3750.

8、01,按0.01水平可認為男女生總體方差相等,應選擇方差相等的結(jié)果。 7/19/202224 顯然,在0.01水平下應拒絕假設,即男女生的平均身高有顯著差異。7/19/2022255. 配對樣本均值的t檢驗 配對樣本均值的檢驗用于檢驗兩個具有配對關(guān)系的正態(tài)總體的樣本均值之間是否存在顯著差異。 配對的兩個樣本值是一一對應的,且容量相同。例如,一組病人治療前后身體的指標;一個年級學生的期中和期末成績。7/19/202226 例3 根據(jù)下列數(shù)據(jù)比較期中和期末成績是否相等。 解 本題數(shù)據(jù)格式與例2不同。 分析-比較均值-配對樣本t檢驗。 7/19/202227 期中期末成績高度相關(guān)且顯著。拒絕假設,期

9、中期末成績差異明顯。7/19/202228三、方差分析7/19/2022291. 方差分析及基本概念 在科學研究中,經(jīng)常要分析多種因素對研究對象某些特征值的影響。例如,醫(yī)學界研究幾種藥物對某種疾病的療效;體育科研中研究訓練方法訓練時間和運動量對提高運動成績的效果。方差分析就是研究各種因素對研究對象某種特征值影響大小的一種 7/19/202230統(tǒng)計方法。 下面通過一個例子簡要介紹方差分析中的相關(guān)概念。 引例 一家超市要研究競爭者的數(shù)量對銷售額是否有顯著影響。抽取3家超市,競爭者數(shù)量按0個, 1個, 2個, 3個以上分為4類,獲得的年銷售額如下表。試研究競爭者的數(shù)量對銷售額7/19/202231

10、是否有顯著影響。 研究對象即試驗結(jié)果稱為試驗指標,簡稱指標,常用y表示,如本例中的銷售額。 7/19/202232 在試驗中要通過改變狀態(tài)加以考察的因素稱為因子,常用A,B,C,表示,如本例中的競爭者。 因子在試驗中所取的不同狀態(tài)稱為因子的水平,常用A1, A2, , Ar表示, r稱為因子A的水平數(shù)。本例中顯然有4個水平。 從平均銷售額來看,好像競爭者7/19/202233個數(shù)對銷售額有一定影響,但仔細分析一下數(shù)據(jù),問題就不那么簡單。 可以看到,在競爭者個數(shù)相同的條件下,不同超市的銷售額也不完全一樣。由于試驗時已考慮超市的其它條件基本相同,產(chǎn)生這種差異的原因主要是試驗過程中各種偶然因素,稱之

11、為試驗誤差。 7/19/202234 因此對不同競爭者個數(shù)超市平均銷售額的差異應作仔細分析,以確定差異究竟是由試驗誤差引起的,還是由于競爭者個數(shù)不同引起的。 如果差異是由試驗誤差引起的,則認為競爭者個數(shù)對銷售額沒有顯著影響,簡稱因子不顯著。 如果不同水平下銷售額的不同,7/19/202235除了誤差影響外,主要是由水平不同造成的,則認為競爭者個數(shù)對銷售額有顯著影響,簡稱因子顯著。2. 方差分析基本思想 方差分析的基本思想是:假設待比較的均值都相等,然后將總偏差平方和分解為效應平方和SA與誤差平方和Se兩部分,再利用SA 和Se 構(gòu)造F 統(tǒng)7/19/202236計量進行假設檢驗,從而判定均值之間

12、是否存在差異。 由于檢驗統(tǒng)計量是根據(jù)組間方差和組內(nèi)方差構(gòu)造的,所以稱此方法為方差分析。3. 單因子方差分析 單因子方差分析研究一個因子的不同水平對指標是否有顯著影響。 7/19/202237 單因子方差分析的步驟為:(1) 提出假設 通常假設影響不顯著。(2) 構(gòu)造檢驗統(tǒng)計量 方差分析構(gòu)造的檢驗統(tǒng)計量服從F分布。(3) 確定顯著性水平 顯著性水平 即為檢驗時犯錯誤7/19/202238的概率,也就是說接受假設的正確率為 。 通常取 。 (4) 計算檢驗統(tǒng)計量F0(5) 作出推斷 可以根據(jù)下列兩種方法推斷: 用統(tǒng)計量若 , 則拒絕假設,即影響顯著。 7/19/202239 用P值若 ,則拒絕假設

13、,即影響顯著。 顯著性水平 越小,顯著性越高,且有如下規(guī)則: 7/19/2022407/19/202241 例4 對引例進行方差分析。 解 (1) 建立數(shù)據(jù)文件,格式為:數(shù)據(jù)為2列,第1列為因子的水平,第2列為對應的銷售額。 (2) 分析-比較均值-單因素ANOVA。 (3) 選銷售額為因變量,競爭者為因子。7/19/202242 (4) 在對比欄中選擇“多項式(線性)”;在兩兩比較欄中選擇“LSD”, 其它默認; (5) 在選項中可選擇“方差同質(zhì)性檢驗”和“均值圖”。 7/19/202243 因子分析要求各水平下總體方差相等,即方差齊性。 本題中方差齊性檢驗統(tǒng)計量等于0.746,P=0.55

14、40.1,通過檢驗,即可認為滿足方差齊性。7/19/202244 競爭者個數(shù)對銷售額影響顯著。7/19/2022457/19/202246 同時比較多個水平間指標差異是否顯著稱為多重比較。 表中數(shù)據(jù)顯示,0和1,0和3,1和3,2和3差異不顯著,而0和2,1和2差異顯著。 均值圖顯示了均值的變化趨勢,也從一定程度上驗證了多重比較的結(jié)論。7/19/2022477/19/2022484. 多因子方差分析 多因子方差分析研究兩個及以上因素是否對指標產(chǎn)生顯著影響。 多因子方差分析不僅能分析多個因素對指標的獨立影響,更能分析多個因素的交互作用能否對指標產(chǎn)生顯著影響,進而找到有利于指標的最優(yōu)組合。7/19

15、/202249 下面以兩因子為例介紹多因子方差分析。 在兩因子分析中,不僅要通過試驗數(shù)據(jù)分析因子A的r水平及因子B的s個水平對指標y是否有顯著影響,有時還要考慮兩個因子聯(lián)合起來對指標y是否有顯著影響,這種聯(lián)合作用稱為因子的交互作用,記為AB。7/19/202250 若一個因子水平下的指標不受另一個因子不同水平的影響,則稱這兩個因子無交互作用。否則,稱這兩個因子有交互作用。無交互作用7/19/202251有交互作用 無交互作用時雙因子方差分析的步驟為:(1) 提出假設 通常假設影響不顯著。7/19/202252(2) 構(gòu)造檢驗統(tǒng)計量 構(gòu)造的檢驗統(tǒng)計量服從F分布。(3) 確定顯著性水平(4) 計算

16、檢驗統(tǒng)計量(5) 作出推斷 有交互作用時雙因子方差分析的步驟為:(1) 提出假設7/19/202253 通常假設影響不顯著。(2) 構(gòu)造檢驗統(tǒng)計量 構(gòu)造的檢驗統(tǒng)計量服從F分布。(3) 確定顯著性水平(4) 計算檢驗統(tǒng)計量(5) 作出推斷 若 ,則在 水平下因子A顯著;7/19/202254 若 ,則在 水平下因子B顯著; 若 ,則在 水平下因子AB顯著。 例5 有4個品牌的電腦在5個地區(qū)銷售,銷售量見下表。試分析電腦品牌和銷售地區(qū)對銷售量的影響。 解 (1) 建立數(shù)據(jù)文件,格式為:7/19/202255數(shù)據(jù)為3列,第1列為銷售量,第2,3列分別為地區(qū)和品牌。 (2) 分析-一般線性模型-單變量

17、。注:這里的變量是指因變量。 (3) 選銷售量為因變量,地區(qū)和品牌為固定因子。 (4) 模型選項中選“設定”,并將地區(qū)和品牌選入模型。7/19/202256 (5) 對比和繪制選項可以默認。 (6) 在兩兩比較選項中選地區(qū)或品牌進比較框,并選擇LSD方法。 (7) 在選項欄中可選擇輸出“方差齊性檢驗” 。 7/19/202257 有時,由于數(shù)據(jù)原因,SPSS無法進行方差齊性檢驗(如本例)。不過,一般認為,方差齊性檢驗不太重要,只要各組樣本數(shù)量相等即可。7/19/202258 地區(qū)不顯著,而品牌高度顯著。7/19/2022597/19/202260 多重比較的解釋同前。 例5中并未考慮交互作用。若要考慮交互作用,則應選擇全因子分析模型,但并不是任何數(shù)據(jù)都可以進行全因子分析,如例5。 下面用例6說明如何進行交互作用分析。 例6 將超市位置按商業(yè)區(qū)、居民7/19/202261區(qū)和寫字樓分成3類,并在不同位置分別隨機抽取3家超市,競爭者數(shù)量按0個, 1個, 2個, 3個分為4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論