第九章列聯(lián)表_第1頁
第九章列聯(lián)表_第2頁
第九章列聯(lián)表_第3頁
第九章列聯(lián)表_第4頁
第九章列聯(lián)表_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章列聯(lián)表第一頁,共二十三頁,編輯于2023年,星期四contents二維列聯(lián)表的齊性和獨立性的χ2檢驗1低維列聯(lián)表的Fisher精確檢驗2對數(shù)線性模型與高維列聯(lián)表的獨立性檢驗簡介3第二頁,共二十三頁,編輯于2023年,星期四一、交互分類和列聯(lián)表所謂交互分類(CrossClassification)是指對某一樣本同時按兩個或兩個以上標(biāo)準(zhǔn)進(jìn)行的交叉分類。所謂列聯(lián)表(ContingencyTable)就是交互分類后形成的表格。如下表:婦女的志愿與其受教育水平的交互分類表志愿(Y)教育水平(X)合計高低幸福家庭12595220理想工作65105170合計1902003909.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第三頁,共二十三頁,編輯于2023年,星期四二、r×c列聯(lián)表第二分類準(zhǔn)則第一分類準(zhǔn)則水平水平123…C合計1O11O12O13…O1cn1.2O21O22O23…O2cN2.3O31O32O33…O3cN3.…………………rOr1Or2Or3…OrcNr.合計n.1n.2N.3…n.cn9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第四頁,共二十三頁,編輯于2023年,星期四在r×c列聯(lián)表中,第一種分類準(zhǔn)則將樣本分成了C個水平(即C列);第二個分類準(zhǔn)則將樣本分成了r個水平(即r行);交叉點上的Oij,(i=1,2,…,r;j=1,2,…,c)表示樣本落在第i行第j列(單元)的樣本數(shù),我們稱為該單元的實際觀察頻數(shù)。令ni.和n.j分別表示第i行第j列的樣本總數(shù),則:9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗式中n就是隨機(jī)樣本的容量。第五頁,共二十三頁,編輯于2023年,星期四如果令Pij表示任一樣本落在第i行第j列的概率,則Pi.和P.j分別表示列聯(lián)表的行邊際概率和列邊際概率,且

9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第六頁,共二十三頁,編輯于2023年,星期四三、齊性X2檢驗一般假設(shè)為:H0:行分布是齊性的(即各行的總體分布一致F1(x)=F2(x))=…=Fr(x))H1:行分布不齊(即各行的總體分布不一致F1(x)≠F2(x))≠…≠Fr(x))在r×c列聯(lián)表中,如H0成立表明各行在同一列的比率一致,即Pi1=Pi2=…=Pic=P.j(i=1,2,…,r;j=1,2,…,c)9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第七頁,共二十三頁,編輯于2023年,星期四在H0成立時,第ij單元的期望值(預(yù)期頻數(shù))按X2統(tǒng)計量的定義可表示為:它在樣本量較大時(一般Eij大于5時)近似服從自由度為k(r-1)-(r-1)=(k-1)(r-1)的X2分布。9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第八頁,共二十三頁,編輯于2023年,星期四例9.1:檢驗兩種教學(xué)方法的成效。把學(xué)生分成兩組,隨機(jī)地從兩組中各抽出50名學(xué)生,根據(jù)每個學(xué)生期末成績分為甲、乙、丙、丁、戊五個等級,具體數(shù)字下表所示:兩組學(xué)生的期末成績表根據(jù)題意,可檢驗如下假設(shè):Ho:兩種教學(xué)法使學(xué)生的成績無顯著性差異;H1:Ho假設(shè)為不真。若Ho為真,則兩組學(xué)生的成績在各相應(yīng)等級的概率應(yīng)相等(即P1j=P2j)。組別等級總數(shù)甲乙丙丁戊1組81316103502組4914167509.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第九頁,共二十三頁,編輯于2023年,星期四這樣可計算各等級概率的估計值為:甲級(8+4)/100=0.12乙級(13+9)/100=0.22丙級(16+14)/100=0.30丁級(10+16)/100=0.26戊級1-(0.12+0.22+0.30+0.26)=1-0.9=0.10所以:查自由度為(R-1)(C-1)=(5-1)(2-1)=4,a=0.05,C=9.488,X2<C,接受Ho假設(shè)。9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十頁,共二十三頁,編輯于2023年,星期四例9.2:一個市場分析員想知道年齡不同的人所喜歡的電視節(jié)目是否不同,他在不同年齡組中各抽選了一個隨機(jī)樣本,并請樣本中的每一個人指出自己喜歡的節(jié)目類型,調(diào)查結(jié)果列于下表,括號內(nèi)是預(yù)期頻數(shù)。喜愛的電視節(jié)目與年齡的交互分類節(jié)目類型年齡小組ABC合計30歲以下120(70)30(67.50)50(62.50)20030-44歲10(35)75(33.75)15(31.25)10045歲及以上10(35)30(33.75)60(31.25)100合計1401351254009.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十一頁,共二十三頁,編輯于2023年,星期四如果不同年齡組喜愛的節(jié)目一致,則在每一年齡組中,喜歡A類節(jié)目者的比例都等于140/400=0.35,將每一樣本數(shù)乘以0.35,便得出不同年齡組喜歡A類節(jié)目的預(yù)期頻數(shù)。于是有200*0.35=70,100*0.35=35,其余數(shù)據(jù)可用類似的方法得出。假設(shè)組為:H0:就所喜歡的電視節(jié)目類型而言三個年齡組是一致的;H1:三個年齡組不一致。9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十二頁,共二十三頁,編輯于2023年,星期四由表中數(shù)據(jù)算出得:設(shè)α=0.05,查X2表可知,當(dāng)自由度為4時,X2的臨界值為9.488,因為X2的計算值180.495大于9.488,所以否定Ho并得出結(jié)論:就所喜歡的電視節(jié)目類型而言,這些總體是不一致的(P<0.005)。9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十三頁,共二十三頁,編輯于2023年,星期四四、獨立性X2檢驗獨立性X2檢驗是用來檢驗兩種分類(分組)是否彼此獨立的。資料要求至少是定類尺度測量。具體用途可用于兩個獨立樣本或k個獨立樣本的獨立性檢驗。如我們將電視觀眾按年齡和他們喜歡的電視節(jié)目類型進(jìn)行了交互分組,那么我們就可以檢驗電視觀眾的年齡與他們喜愛的節(jié)目類型之間是否有關(guān)聯(lián)(如無關(guān)聯(lián)即二者獨立)。9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十四頁,共二十三頁,編輯于2023年,星期四獨立性X2檢驗的假設(shè)組應(yīng)為:H0:兩種分類準(zhǔn)則彼此獨立(Pij=Pi.·P.j);H1:兩種分類準(zhǔn)則彼此不獨立(Pij≠Pi.·P.j);在列聯(lián)表中,理論頻數(shù)Eij=n·Pij,因為當(dāng)Ho為真時,Pij=Pi.·P.j,這里Pi.(邊際概率)可用邊際頻率ni./n來代替,即Pi.=ni./n;同理P.j=n.j/n所以

9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十五頁,共二十三頁,編輯于2023年,星期四例9.3:一個市場調(diào)查公司想知道某城市成年人駕駛的汽車式樣與其居住地之間是否存在某種聯(lián)系。抽取了500名成年駕駛者進(jìn)行調(diào)查,其資料如下表所示:500名汽車駕駛者的調(diào)查數(shù)據(jù)居住區(qū)汽車式樣合計ABC152(45.36)64(52.64)24(42)140260(55.4)59(64.3)52(51.3)171350(61.24)65(71.06)74(56.7)189合計1621881505009.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十六頁,共二十三頁,編輯于2023年,星期四解:建立假設(shè)組:Ho:成年人所駕駛的汽車式樣與他們的居住區(qū)之間彼此獨立;H1:兩種分類準(zhǔn)則彼此不獨立。設(shè)顯著性水平a為0.05。計算檢驗統(tǒng)計量:9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十七頁,共二十三頁,編輯于2023年,星期四在r行c列的列聯(lián)表中自由度等于(r-1)(c-1)=(3-1)(3-1)=4。X2(0.95,4)的臨界值為9.488,于是否定區(qū)域由等于或大于9.488的X2值構(gòu)成。五、小預(yù)期頻數(shù)列聯(lián)表中,如果某單元的預(yù)期頻數(shù)很小,采用近似的卡方檢驗會帶來較大的誤差。所以一般要求預(yù)期頻數(shù)大于5.不過對于預(yù)期頻數(shù)的大小問題,學(xué)者們的意見尚不一致。多數(shù)人同意科庫蘭(Cochran,1945)的意見:即對自由度大于1的列聯(lián)表,只要預(yù)期頻數(shù)小于5的單元數(shù)不超過總數(shù)的20%,一個單元的最小預(yù)期頻數(shù)?。笔窃试S的。為了滿足這一要求,可以把相鄰幾行或幾列合并,如果這樣做不至于破壞分類方案的邏輯的話。9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十八頁,共二十三頁,編輯于2023年,星期四六、2×2列聯(lián)表根據(jù)卡方統(tǒng)計量的定義可推導(dǎo)出:第二分類準(zhǔn)則第一分類準(zhǔn)則合計121aba+b2cdc+d合計a+cb+dn9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第十九頁,共二十三頁,編輯于2023年,星期四七、耶特斯修正對2×2列聯(lián)表的耶特斯(Yates,1934)“修正”:將觀察頻數(shù)與預(yù)期頻數(shù)之差的絕對值在取平方之前先減去0.5n。

9.1二維列聯(lián)表的齊性和獨立性的χ2檢驗第二十頁,共二十三頁,編輯于2023年,星期四八、齊性與獨立性X2檢驗的區(qū)別盡管二者計算統(tǒng)計量的公式形式一樣,但他們是有區(qū)別的:⑴抽樣程序不同;⑵推算預(yù)期頻數(shù)的根據(jù)不同;(3)對結(jié)果的解釋不同。當(dāng)我們應(yīng)用獨立性卡方檢驗時,典型的抽樣程序是從一個總體抽出一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論