社會統(tǒng)計學(xué)盧淑華版PPT課件_第1頁
社會統(tǒng)計學(xué)盧淑華版PPT課件_第2頁
社會統(tǒng)計學(xué)盧淑華版PPT課件_第3頁
社會統(tǒng)計學(xué)盧淑華版PPT課件_第4頁
社會統(tǒng)計學(xué)盧淑華版PPT課件_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

.,1,第八章類別變量與尺度變量關(guān)系的假設(shè)檢驗方差分析,8.1方差分析的原理8.2一元方差分析8.3二元方差分析,.,2,第一節(jié)方差分析的原理,一、方差分析及其有關(guān)術(shù)語1、什么是方差分析方差分析通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等來檢驗多個總體均值是否相等,從而研究分類型自變量對數(shù)值型因變量的影響。根據(jù)自變量的多少,方差分析可分分為單因素方差、雙因素方差分析和多因素方差分析。2、因素或因子因素或因子是指所要檢驗的對象。3、水平或處理水平或處理是指因子的不同表現(xiàn)。,.,3,第一節(jié)方差分析的原理,4、觀察值觀察值是指在每個因素水平下得到的樣本數(shù)據(jù)。二、方差分析的基本思想和原理1、基本思想方差分析通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。2、基本原理兩類誤差隨機誤差因素的同一水平(總體)下,由隨機因素的影響造成的樣本各觀察值之間的差異稱為隨機誤差。,.,4,第一節(jié)方差分析的原理,系統(tǒng)誤差因素的不同水平(不同總體)下由系統(tǒng)性因素造成的樣本各觀察值之間觀察值的差異稱為系統(tǒng)誤差。誤差平方和SS數(shù)據(jù)的誤差用平方和(sumofsquares)表示,分為組內(nèi)平方和和組間平方和。組內(nèi)平方和組內(nèi)平方和是指因素的同一水平下數(shù)據(jù)誤差的平方和,組內(nèi)平方和只包括隨機誤差。組間平方和組間平方和是指因素的不同水平之間數(shù)據(jù)誤差的平方和,組間平方和既包括隨機誤差,也包括系統(tǒng)誤差。,.,5,第一節(jié)方差分析的原理,均方MS均方是指平方和除以相應(yīng)的自由度?;驹砣粼僭O(shè)(自變量對因變量沒有影響)成立,組間均方與組內(nèi)均方的數(shù)值就應(yīng)該很接近,它們的比值就會接近1;若原假設(shè)不成立,組間均方會大于組內(nèi)均方,它們之間的比值就會大于1。當(dāng)這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,即自變量對因變量有影響。三、方差分析的基本假定1、每個總體都應(yīng)服從正態(tài)分布,自變量對因變量沒有影響,則沒有系統(tǒng)性誤差,組間平方和中只有隨機誤差。,.,6,第一節(jié)方差分析的原理,對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本。2、各個總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的。3、觀察值是獨立的四、問題的一般提法1、設(shè)因素有m個水平,每個水平的均值分別用1,2,,m表示2、要檢驗m個水平(總體)的均值是否相等,需要提出如下假設(shè):H0:12mH1:1,2,,m不全相等,.,7,第二節(jié):單因素方差分析/一元方差分析,一、數(shù)據(jù)結(jié)構(gòu),.,8,第二節(jié):單因素方差分析/一元方差分析,二、分析步驟1、提出假設(shè)H0:1=2=m自變量對因變量沒有顯著影響H1:1,2,k不全相等自變量對因變量有顯著影響注意:拒絕原假設(shè),只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等2、構(gòu)造檢驗的統(tǒng)計量水平的均值,.,9,第二節(jié):單因素方差分析/一元方差分析,假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數(shù)。計算公式:,式中:ni為第i個總體的樣本觀察值個數(shù),xij為第i個總體的第j個觀察值。,計算全部觀察值的總均值用全部觀察值的總和除以觀察值的總個數(shù),計算公式:,.,10,第二節(jié):單因素方差分析/一元方差分析,計算總誤差平方和TSS總誤差平方和TSS是全部觀察值與總平均值的離差平方和,反映全部觀察值的離散狀況,其計算公式為:,計算組間平方和BSS,組間平方和是各組平均值,組間平方和是各組平均值與總平均值的離差平方和,反映各總體的樣本均值之間的差異程度,計算公式為:,.,11,第二節(jié):單因素方差分析/一元方差分析,計算組內(nèi)平方和RSS組內(nèi)平方和是每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和,該平方和反映的是隨機誤差的大小,計算公式為:,三個平方和的關(guān)系,TSS=BSS+RSS,.,12,第二節(jié):單因素方差分析/一元方差分析,計算均方MS各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差。均方由誤差平方和除以相應(yīng)的自由度求得,三個平方和對應(yīng)的自由度分別是:TSS的自由度為n-1,其中n為全部觀察值的個數(shù)BSS的自由度為m-1,其中m為因素水平(總體)的個數(shù)RSS的自由度為n-m,組間方差MSB:,組內(nèi)方差MSR:,.,13,第二節(jié):單因素方差分析/一元方差分析,3、計算檢驗統(tǒng)計量F,4、統(tǒng)計決策將統(tǒng)計量的值F與給定的顯著性水平的臨界值F進行比較,作出對原假設(shè)H0的決策。,例(參見教材376頁例1、383頁例2)為了研究職業(yè)對家庭贍養(yǎng)人數(shù)的影響,研究者抽查了某企業(yè)41名員工的家庭贍養(yǎng)人數(shù)(如下表),試判斷職業(yè)對家庭贍養(yǎng)人數(shù)是否有影響。,.,14,第二節(jié):單因素方差分析,變量間關(guān)系的強度用自變量平方和(BSS)占總平方和(TSS)的比例大小來反映,自變量平方和占總平方和的比例記為R2,即:,其平方根R就可以用來測量兩個變量之間的關(guān)系強度。,三、關(guān)系強度的測量拒絕原假設(shè)表明因素(自變量)與觀測值之間有顯著關(guān)系,組間平方和(BSS)度量了自變量(行業(yè))對因變量(投訴次數(shù))的影響效應(yīng)。只要組間平方和BSS不等于0,就表明兩個變量之間有關(guān)系(只是是否顯著的問題)。當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時,就意味著兩個變量之間的關(guān)系顯著,大得越多,表明它們之間的關(guān)系就越強。反之,就意味著兩個變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱。,.,15,第三節(jié)雙因素方差分析/二元方差分析,一、二元方差分析的數(shù)學(xué)模型二元方差又稱雙因素方差分析,用來分析兩個因素(行因素Row和列因素Column)對試驗結(jié)果的影響。設(shè)兩個自變量A和B作用于總體,其中自變量A有a種取值:A1,A2,Aa,自變量B有b種取值:B1,B2,Bb。變量A的取值為Ai、變量B的取值為Bj時因變量y的取值為yij無交互作用的二元方差分析模型如果兩個因素對試驗結(jié)果的影響是相互獨立的,分別判斷行因素和列因素對試驗數(shù)據(jù)的影響,這時的二元方差分析稱為無交互作用的二元方差分析或無重復(fù)二元方差分析(Two-factorwithoutreplication)。,.,16,因變量y與自變量A、B之間的關(guān)系可以表達為以下模型:,ij相互獨立,并且服務(wù)正態(tài)分布:,有交互作用的二元方差分析模型,如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析(Two-factorwithreplication)。,.,17,因變量y與自變量A、B之間的關(guān)系可以表達為以下模型:,ijk相互獨立,并且服務(wù)正態(tài)分布:,K=1,2,rr為自變量A和B每種搭配的重復(fù)數(shù),.,18,二、無交互作用的二元方差分析提出假設(shè),2、構(gòu)造檢驗統(tǒng)計量,幾個基本概念,自變量y1j,y2j,yaj,觀測一次取平均的,因此可以認為變量A的影響已經(jīng)相互抵消,所以行平均值反映的是自變量B對因變量y的影響。,.,19,自變量yi1,yi2,yib,觀測一次取平均的,因此可以認為變量B的影響已經(jīng)相互抵消,所以行平均值反映的是自變量A對因變量y的影響。,變量A的離差平方和BSSA,.,20,變量B的離差平方和BSSB,TSS=BSSA+BSSB+RSS,剩余平方和RSS,離差平方和之間的關(guān)系,.,21,計算均方,其中a-1是自由度,其中a-1是自由度,其中(a-1)、(b-1)是自由度,構(gòu)造檢驗統(tǒng)計量,.,22,用Excel進行方差分析(Excel分析步驟),第1步:選擇“數(shù)據(jù)”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項第3步:在分析工具中選擇【單因素方差分析】,然后選擇【確定】第4步:當(dāng)對話框出現(xiàn)時在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在【】方框內(nèi)鍵入0.05(可根據(jù)需要確定)在【輸出選項】中選擇輸出區(qū)域,確定臨界值,并與檢驗統(tǒng)計量進行比較,得出結(jié)論:,.,23,例三個地區(qū)家庭人口數(shù)的抽樣調(diào)查如下表所示,試問這三地區(qū)的平均家庭人口有沒有顯著差異?,.,24,三、有交互作用的二元方差分析提出假設(shè),幾個基本概念,總平均值,總平均值是對全部觀測值求平均,.,25,行平均值,行平均值是對行號相同的全部觀測值求平均,列平均值,列平均值是對列號相同的全部觀測值求平均,格平均值,格平均值是對行號和列號都相同的全部觀測值求平均,.,26,總離差平均和TSS,列間平均和BSSA,列間平方和BSSA反映了由變量A解釋掉的誤差,行間平均和BSSB,行間平方和BSSB反映了由變量B解釋掉的誤差,.,27,交互作用,自變量A、B在每一格所能解釋的全部誤差BSS,剩余誤差RSS,總離差平方和、行間平方和、列間平方和、交互作用、剩余誤差之間的關(guān)系,.,28,平方和的自由度,總平方和TSS的自由度,總平方和TSS是圍繞著均值計算的,獨立變化的取值只有abr-1,所以總平方和TSS的自由度為abr-1,列間平方和BSSA的自由度,列間平方和BSSA是圍繞著均值計算的,存在的約束,所以列間平方和BSSA的自由度為a-1,列間平方和BSSB的自由度,列間平方和BSSB是圍繞著均值計算的,存在的約束,所以列間平方和BSSA的自由度為b-1,剩余平方和RSS的自由度,剩余平方和BSS是圍繞著各格AiBj的均值計算的,所以剩余平方和BSS的自由度為abr-ab,.,29,自由度之間存在與平方和之間同樣的關(guān)系式:,abr-1,a-1,b-1,abr-ab,?,交互作用IAB的自由度,交互作用IAB的自由度=(abr-1)-(a-1)-(b-1)-(abr-ab)=(a-1)(b-1),交互作用顯著性的檢驗,提出假設(shè)H0:,i=1,2,aj=1,2,b,H1:,i=1,2,aj=1,2,b,.,30,構(gòu)造檢驗統(tǒng)計量,確定臨界值:,比較臨界值與檢驗統(tǒng)計量,得出結(jié)論:,4、交互作用不顯著情況下,自變量A、B顯著性的檢驗,交互作用不顯著,則交互作用的平方和IAB合并到誤差項RSS中,作為總誤差TRSS,自由度也相應(yīng)地合并:abr-a-b+1,.,31,自變量A的檢驗,檢驗統(tǒng)計量:,根據(jù)給定的顯著性水平,查出臨界值。如果,則不拒絕原假設(shè)。否則,拒絕原假設(shè)。,自變量B的檢驗,檢驗統(tǒng)計量:,根據(jù)給定的顯著性水平,查出臨界值。如果,則不拒絕原假設(shè)。否則,拒絕原假設(shè)。,.,32,5、交互作用顯著情況下,自變量A、B顯著性的檢驗,交互作用顯著情況下,自變量A、B的檢驗方法要根據(jù)變量A和B的性質(zhì)來確定。如果某變量的取值是固定的,則該變量屬于固定變量。如果變量所涉及的測試個體是隨機選擇的,則該變量屬于隨機變量。根據(jù)A、B性質(zhì)的不同,可以分為三種模型:,固定模型:A、B都是固定變量,對于固定模型,F(xiàn)檢驗分母項就用剩余誤差項(RSS)的均方,變量A的檢驗,檢驗統(tǒng)計量:,.,33,根據(jù)給定的顯著性水平,查出臨界值。如果,則不拒絕原假設(shè)。否則,拒絕原假設(shè)。,變量B的檢驗,檢驗統(tǒng)計量:,根據(jù)給定的顯著性水平,查出臨界值。如果,則不拒絕原假設(shè)。否則,拒絕原假設(shè)。,混合模型:A和B中有一個固定變量,另一個是隨機變量,以A為固定變量,B為隨機變量為例,固定變量A的檢驗,F(xiàn)檢驗分母項用交互誤差項(IAB)的均方,.,34,檢驗統(tǒng)計量:,根據(jù)給定的顯著性水平,查出臨界值。如果,則不拒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論