第2講列聯(lián)分析與方差分析_第1頁
第2講列聯(lián)分析與方差分析_第2頁
第2講列聯(lián)分析與方差分析_第3頁
第2講列聯(lián)分析與方差分析_第4頁
第2講列聯(lián)分析與方差分析_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第2講列聯(lián)分析和方差分析1第一節(jié)交叉列聯(lián)表分析一、擬合優(yōu)度檢驗(yàn)二、二維交叉分析三、多維交叉分析2一、擬合優(yōu)度檢驗(yàn)研究調(diào)研數(shù)據(jù)與原假設(shè)擬合的程度或一致的程度二、交叉分析如:收入等級和文化程度、專業(yè)和性別、地區(qū)和廣告創(chuàng)意、年齡和閱讀書籍習(xí)慣等三、檢驗(yàn)

3一、擬合優(yōu)度檢驗(yàn)原假設(shè):兒童對電視臺提供的六種兒童節(jié)目沒有偏好。原假設(shè):賭場的骰子沒有做手腳。原假設(shè):四季中,旅游產(chǎn)品銷售春秋季為旺季。節(jié)目編號觀測頻次185280355410540630合計(jì)300SPSS(案例)有兩種準(zhǔn)備數(shù)據(jù)的方式DATA→Weightcases;analyze→nonparametrictest→chi-square4一、擬合優(yōu)度檢驗(yàn)5一、擬合優(yōu)度檢驗(yàn)6二、交叉列表分析(一)交叉列表分析概念就是同時(shí)將兩個(gè)或兩個(gè)以上有一定聯(lián)系的變量及其變量值,按照一定的順序交叉排列在一張表中,從中分析變量之間的相關(guān)關(guān)系并得出科學(xué)結(jié)論的一種數(shù)據(jù)分析技術(shù)。7二、交叉列表分析例1、某城市人口關(guān)于受教育程度與收入水平之間關(guān)系分析:小學(xué)以下中學(xué)大專本科研究生合計(jì)

高收入81112263794中高收入1622569098282中等收入28369211276344中低收入485552347196最低收入4226133084合計(jì)1421502252652181000

(二)二維交叉列表基本分析方法行邊緣數(shù)列邊緣數(shù)8二、交叉列表分析9二、交叉列表分析(案例)計(jì)算實(shí)際卡方值比較實(shí)際卡方值和理論卡方值之間關(guān)系根據(jù)原假設(shè)做出判斷10二、交叉列表分析(案例)11二、交叉列表分析(案例1)

一公司二公司三公司四公司合計(jì)贊成68755779279反對32453331141合計(jì)10012090110420例2:某集團(tuán)公司有4個(gè)分公司,對是否推行某項(xiàng)決策有兩種意見:贊成和反對,試分析各分公司意見是否不同?實(shí)際值

一公司二公司三公司四公司合計(jì)贊成66806073反對34403037合計(jì)期望值12二、交叉列表分析(案例)13二、交叉列表分析(案例2)(三)多維交叉列表分析14第一節(jié)交叉列聯(lián)表分析一、交叉列聯(lián)表分析概念就是同時(shí)將兩個(gè)或兩個(gè)以上有一定聯(lián)系的分類變量及其變量值,按照一定的順序交叉排列在一張表中,從中分析變量之間的相關(guān)關(guān)系并得出科學(xué)結(jié)論的一種數(shù)據(jù)分析技術(shù)。15交叉列表分析例1、某城市人口關(guān)于受教育程度與收入類別之間關(guān)系分析:小學(xué)以下中學(xué)大專本科研究生合計(jì)

最高收入81112263794中高收入1622569098282中等收入28369211276344中低收入485552347196低收入4226133084合計(jì)1421502252652181000

二、交叉列表基本分析方法行邊緣數(shù)列邊緣數(shù)16交叉列表分析(以行計(jì)算)

教育程度小學(xué)以下中學(xué)大專本科研究生合計(jì)收入

最高收入9%12%13%28%39%100%中高收入6%8%20%32%35%100%中等收入8%10%27%33%22%100%中低收入24%28%27%17%4%100%低收入50%31%15%4%0%100%稱為5*5列聯(lián)交叉表17交叉列表分析(以列計(jì)算)

教育程度小學(xué)以下中學(xué)大專本科研究生社會階層

最高收入6%7%5%10%17%中高收入11%15%25%34%45%中等收入20%24%41%42%35%中低收入34%37%23%13%3%低收入30%17%6%1%0%合計(jì)100%100%100%100%100%一般原則:以自變量為基準(zhǔn)計(jì)算百分?jǐn)?shù)18交叉列表分析三、交叉列表卡方分析19交叉列表分析(兩個(gè)函數(shù))20交叉列表分析(案例1)

一公司二公司三公司四公司合計(jì)贊成68755779279反對32453331141合計(jì)10012090110420例2:某集團(tuán)公司有4個(gè)分公司,對是否推行某項(xiàng)決策有兩種意見:贊成和反對,試分析各分公司意見是否不同?實(shí)際值

一公司二公司三公司四公司合計(jì)贊成66806073反對34403037合計(jì)期望值21交叉列表分析(案例)計(jì)算實(shí)際卡方值比較實(shí)際卡方值和理論卡方值之間關(guān)系根據(jù)原假設(shè)做出判斷22交叉列表分析(案例)23交叉列表分析(案例2)例3:欲研究不同收入群體對某種特定商品是否有相同的該買習(xí)慣,市場調(diào)研人員調(diào)查了四個(gè)不同的收入組共527人,結(jié)果如表:實(shí)際值期望值

低收入組偏低收入組偏高收入組高收入組合計(jì)經(jīng)常購買25404746158有時(shí)購買36261937118不購買69517457251合計(jì)13011714014052724第二節(jié)方差分析

(analysisofvariance,ANOVA)25方差分析

(analysisofvariance,ANOVA)定義:就是通過檢驗(yàn)個(gè)總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。注:其實(shí)質(zhì)是研究分類型自變量對數(shù)值型因變量的影響。26一、方差分析的步驟方差分析的步驟建立原假設(shè)和備擇假設(shè);構(gòu)造統(tǒng)計(jì)檢驗(yàn)量(F統(tǒng)計(jì)檢驗(yàn)量—);計(jì)算統(tǒng)計(jì)檢驗(yàn)量的值并進(jìn)行檢驗(yàn);計(jì)算均值計(jì)算誤差平方和

從原問題或調(diào)查角度闡述結(jié)論。27二、單因素方差分析(案例與基本概念)消費(fèi)者協(xié)會在零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)分別抽取了規(guī)模大致一樣的幾家企業(yè)調(diào)查其投訴率,協(xié)會想知道這幾個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異。行業(yè)零售業(yè)旅游業(yè)航空公司家電制造57683144663949514929216540453477345640585351

44

因素:所要檢驗(yàn)的對象;水平:因素的不同表現(xiàn);觀測值:每個(gè)因子水平下的得到的樣本數(shù)據(jù);自變量(分類型)因變量(數(shù)值型)28單因素方差分析(誤差分解)

行業(yè)零售業(yè)旅游業(yè)航空公司家電制造投訴次數(shù)57683144663949514929216540453477345640585351

44

平均數(shù)49483559總平均數(shù)47.86956522組間誤差:來自不同水平的數(shù)據(jù)誤差;組內(nèi)誤差:來自水平內(nèi)部的數(shù)據(jù)誤差;總誤差:全部數(shù)據(jù)誤差大小的平方和;29單因素方差分析(誤差分解)

行業(yè)零售業(yè)旅游業(yè)航空公司家電制造投訴次數(shù)57683144663949514929216540453477345640585351

44

平均數(shù)49483559總平均數(shù)47.8695652230單因素方差分析(誤差分解)組間誤差:來自不同水平的數(shù)據(jù)誤差,自由度為(k-1);組內(nèi)誤差:來自水平內(nèi)部的數(shù)據(jù)誤差,自由度為(n-k);總誤差:全部數(shù)據(jù)誤差大小的平方和,自由度為(n-1)。總誤差(SST)組內(nèi)誤差(SSw)組間誤差(SSb)31單因素方差分析(案例)

行業(yè)零售業(yè)旅游業(yè)航空公司家電制造投訴次數(shù)57683144663949514929216540453477345640585351

44

平均數(shù)49483559總平均數(shù)47.8695652232單因素方差分析(案例)

行業(yè)零售業(yè)旅游業(yè)航空公司家電制造投訴次數(shù)57683144663949514929216540453477345640585351

44

平均數(shù)49483559總平均數(shù)47.8695652233單因素方差分析(方差分析表)方差分析表誤差來源平方和SS自由度均方F值P值F臨界值組間SSbk-1MSbMSb/MSw

組內(nèi)SSwn-kMSw

總和SSTn-1

方差分析表誤差來源平方和SS自由度均方F值P值F臨界值組間1456.6083485.563.410.0383.13

組內(nèi)270819142.53

總和4164.60822

34單因素方差分析(案例2)例

某公司在一次新產(chǎn)品的研究中,試驗(yàn)三種不同的包裝對新產(chǎn)品銷售的影響。從某城市隨機(jī)選取5個(gè)相似商店,將樣本配以不同包裝進(jìn)行銷售,試分析包裝對新產(chǎn)品的銷售是否有顯著影響。不同包裝甲包裝乙包裝丙包裝商店1101510商店2142012商店312176商店48812商店511151035單因素方差分析(案例2)例某公司在一次新產(chǎn)品的研究中,試驗(yàn)三種不同的包裝對新產(chǎn)品銷售的影響。從某城市隨機(jī)選取5個(gè)相似商店,將樣本配以不同包裝進(jìn)行銷售,試分析包裝對新產(chǎn)品的銷售是否有顯著影響。SUMMARY

組觀測數(shù)求和平均方差列1555115列25751519.5列355010636單因素方差分析(案例2)例、某公司在一次新產(chǎn)品的研究中,試驗(yàn)三種不同的包裝對新產(chǎn)品銷售的影響。從某城市隨機(jī)選取5個(gè)相似商店,將樣本配以不同包裝進(jìn)行銷售,試分析包裝對新產(chǎn)品的銷售是否有顯著影響。方差分析

差異源SSdfMSFP-valueFcrit組間702353.4426230.0658193.885294組內(nèi)1221210.16667

總計(jì)19214

37練習(xí)

某公司在一次新產(chǎn)品的研究中,試驗(yàn)3種不同的包裝對新產(chǎn)品銷售的影響。從某城市隨機(jī)選取12個(gè)相似商店,將他們分成3組,配以不同包裝進(jìn)行銷售,試分析不同包裝對新產(chǎn)品的銷售是否有顯著影響。單因素方差分析(練習(xí))A包裝(瓶裝)B包裝(罐裝)C包裝(袋裝)銷售數(shù)量757460707864667265696855平均值707361總均值68差異源SSdfMSFP-valueFcrit組間組內(nèi)總計(jì)38練習(xí)

某公司在一次新產(chǎn)品的研究中,試驗(yàn)3種不同的包裝對新產(chǎn)品銷售的影響。從某城市隨機(jī)選取12個(gè)相似商店,將他們分成3組,配以不同包裝進(jìn)行銷售,試分析不同包裝對新產(chǎn)品的銷售是否有顯著影響。單因素方差分析(練習(xí))A包裝(瓶裝)B包裝(罐裝)C包裝(袋裝)銷售數(shù)量757460707864667265696855平均值707361總均值68差異源SSdfMSFP-valueFcrit組間312215690.00714.26組內(nèi)156917.3

總計(jì)46811

39單因素方差分析(操作)EXCEL操作SPSS操作40三、雙因素方差分析兩個(gè)因素(行因素Row和列因素Column)對試驗(yàn)結(jié)果的影響如果兩個(gè)因素對試驗(yàn)結(jié)果的影響是相互獨(dú)立的,分別判斷行因素和列因素對試驗(yàn)數(shù)據(jù)的影響,這時(shí)的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析(Two-factorwithoutreplication)如果除了行因素和列因素對試驗(yàn)數(shù)據(jù)的單獨(dú)影響外,兩個(gè)因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時(shí)的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析(Two-factorwithreplication)41雙因素方差分析(案例與基本概念)定義:當(dāng)方差分析中涉及兩個(gè)分類型自變量對數(shù)值型因變量的影響。分類:

無重復(fù)雙因素方差分析(無交互因素)有重復(fù)雙因素方差分析(有交互因素)42雙因素方差分析的基本假定每個(gè)總體都服從正態(tài)分布對于因素的每一個(gè)水平,其觀察值是來自正態(tài)分布總體的簡單隨機(jī)樣本各個(gè)總體的方差必須相同對于各組觀察數(shù)據(jù),是從具有相同方差的總體中抽取的觀察值是獨(dú)立的43雙因素方差分析的數(shù)據(jù)結(jié)構(gòu)44雙因素方差分析(誤差分解)45雙因素方差分析(無交互作用)案例

品牌1品牌2品牌3品牌4行平均數(shù)地區(qū)1365345358288339.0地區(qū)2350368323280330.3地區(qū)3343363353298339.3地區(qū)4340330343260318.3地區(qū)5323333308298315.5列平均數(shù)344.2347.8337.0284.8328.546分析步驟

提出假設(shè)對行因素提出的假設(shè)H0:m1=m2=…=mi=…=mr(mi為第i個(gè)水平的均值)H1:mi(i=1,2,…,r)不全相等對列因素提出的假設(shè)為H0:m1=m2=…=mj=…=mc(mj為第j個(gè)水平的均值)H1:mj(j=1,2,…,c)不全相等雙因素方差分析的假設(shè)47

構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

總離差平方和(SST)、水平項(xiàng)離差平方和(SSR和SSC)、誤差項(xiàng)離差平方和(SSE)之間的關(guān)系SST=SSR+SSC+SSE48統(tǒng)計(jì)決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出對原假設(shè)H0的決策根據(jù)給定的顯著性水平

在F分布表中查找相應(yīng)的臨界值F

若FR>F

,則拒絕原假設(shè)H0,表明均值之間的差異是顯著的,即所檢驗(yàn)的行因素對觀察值有顯著影響若FC>F

,則拒絕原假設(shè)H0,表明均值之間有顯著差異,即所檢驗(yàn)的列因素對觀察值有顯著影響491、雙因素方差分析(無交互作用)案例

品牌1品牌2品牌3品牌4行平均數(shù)地區(qū)1365345358288339.0地區(qū)2350368323280330.3地區(qū)3343363353298339.3地區(qū)4340330343260318.3地區(qū)5323333308298315.5列平均數(shù)344.2347.8337.0284.8328.5501、雙因素方差分析(無交互作用)總誤差自由度:rc-1行因素自由度:r-1列因素自由度:c-1隨機(jī)誤差自由度:(r-1)*(c-1)51雙因素方差分析(案例)52差異源誤差平方和SS自由度df均方MSF行因素SSRr-1MSR=SSR/(r-1)MSR/MSE列因素SSCc-1MSC=SSC/(c-1)MSC/MSE隨機(jī)誤差SSE(r-1)*(c-1)MSE=SSE/(r-1)*(c-1)

總計(jì)SSn-1

53差異源SSdfMSFP-valueFcrit行2011.74502.9252.1008460.1436653.259167列13004.5534334.8518.107779.46E-053.490295誤差2872.712239.3917

總計(jì)17888.9519

541、雙因素方差分析(無交互作用)無交互作用:注意選擇custom/maineffects交互作用:注意選擇custom/fullfunctional(Type3)552、雙因素方差分析(有交互作用的)行因素有r個(gè)水平列因素有c個(gè)水平行變量中每個(gè)水平的每個(gè)樣本的行數(shù)為m行。562、雙因素方差分析(有交互作用的)572、雙因素方差分析(有交互作用的)582、雙因素方差分析(有交互作用的)592、雙因素方差分析(交互作用)總誤差自由度:rcm-1行因素自由度:r-1列因素自由度:c-1交互因素自由度:(r-1)*(c-1)隨機(jī)誤差自由度:rc*(m-1)602、雙因素方差分析(有交互作用的)

路段1路段2高峰期26192420272325222521非高峰期2018

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論