第5章 卡方檢驗(yàn) 73_第1頁
第5章 卡方檢驗(yàn) 73_第2頁
第5章 卡方檢驗(yàn) 73_第3頁
第5章 卡方檢驗(yàn) 73_第4頁
第5章 卡方檢驗(yàn) 73_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第第五章五章2 檢驗(yàn)檢驗(yàn)本章介紹本章介紹對對分類次數(shù)資料分類次數(shù)資料進(jìn)行進(jìn)行適合適合 性檢驗(yàn)性檢驗(yàn)和和獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)的的 2檢驗(yàn)法。檢驗(yàn)法。ni=1第一第一節(jié)節(jié) 2分布分布及及 2統(tǒng)計(jì)數(shù)統(tǒng)計(jì)數(shù)一、一、 2(chi-square)分布)分布若若n個(gè)相互獨(dú)立的隨機(jī)變量個(gè)相互獨(dú)立的隨機(jī)變量X1,X2,Xn ,均服,均服從標(biāo)準(zhǔn)正態(tài)分布,則這從標(biāo)準(zhǔn)正態(tài)分布,則這n個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的隨個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方機(jī)變量的平方和和 Y= Xi2構(gòu)成一新的隨機(jī)變量,構(gòu)成一新的隨機(jī)變量,其分布規(guī)律稱為其分布規(guī)律稱為 2分布(分布(chi-square distribution),),其中參數(shù)其中參

2、數(shù) n 稱為自由度,自由度不同就是不同的稱為自由度,自由度不同就是不同的 2分布。分布。卡方分布是一種卡方分布是一種連續(xù)連續(xù)型型分布:按分布的密度函分布:按分布的密度函 數(shù)可給出自由度數(shù)可給出自由度=1=1,2 2,33的一簇分布曲線的一簇分布曲線卡方分布的特征卡方分布形狀依賴于自由度卡方分布形狀依賴于自由度n;當(dāng)自由度當(dāng)自由度n2時(shí),曲線呈時(shí),曲線呈L型;型;隨著隨著n的增加,曲線逐漸對稱;的增加,曲線逐漸對稱;當(dāng)自由度當(dāng)自由度n時(shí),曲線逼近于正態(tài)曲線;時(shí),曲線逼近于正態(tài)曲線;卡方分布曲線下右側(cè)尾部的面積為卡方分布曲線下右側(cè)尾部的面積為 時(shí),橫時(shí),橫 軸上相應(yīng)的卡方值,記為軸上相應(yīng)的卡方值,

3、記為 n,如果如果 n,曲線下面積小于,曲線下面積小于 ;反之則大于;反之則大于 2021-12-15醫(yī) 學(xué) 統(tǒng) 計(jì) 學(xué)00.10.20.30.40.5024681012141622()f1610 2檢驗(yàn)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,檢驗(yàn)是現(xiàn)代統(tǒng)計(jì)學(xué)的創(chuàng)始人之一,英國人英國人 Karl . Pearson于于1900年提出的年提出的一種具有廣泛用途的統(tǒng)計(jì)方法一種具有廣泛用途的統(tǒng)計(jì)方法??ǚ綑z驗(yàn)卡方檢驗(yàn)(chi-square test)(chi-square test)二二、統(tǒng)計(jì)數(shù)的意義統(tǒng)計(jì)數(shù)的意義2豌豆花色遺傳中,紅花和白花是受一豌豆花色遺傳中,紅花和白花是受一 對等位基因控制的一對相對性狀,雜對

4、等位基因控制的一對相對性狀,雜交交F F2 2植植 株的理論比例為株的理論比例為紅紅: :白白=3:1=3:1。孟德爾(孟德爾(18651865)在雜交在雜交F2F2群體中隨機(jī)調(diào)群體中隨機(jī)調(diào) 查了查了929929株,其中株,其中705705株為紅花,株為紅花,224224株為白株為白花花。這一結(jié)果是否符合。這一結(jié)果是否符合3:13:1的理論比例。的理論比例。若符合理論比例若符合理論比例(紅(紅: :白白= =3:13:1), 929929株中株中的紅花株數(shù)應(yīng)為的紅花株數(shù)應(yīng)為:9299293/4=3/4=696.75696.75株株(實(shí)際(實(shí)際705705株)株)白花株數(shù)應(yīng)為白花株數(shù)應(yīng)為:929

5、9291/4=1/4=232.25232.25株株(實(shí)際實(shí)際224224株株)實(shí)際觀察次數(shù)與理論次數(shù)有差異實(shí)際觀察次數(shù)與理論次數(shù)有差異,各相差各相差8.258.25株株產(chǎn)生這種情況有兩種可能:一種是紅花植株產(chǎn)生這種情況有兩種可能:一種是紅花植株 與白花植株的比例不符合與白花植株的比例不符合3:13:1;另一種是符合;另一種是符合3:13:1, 實(shí)際出現(xiàn)的實(shí)際出現(xiàn)的705:224705:224是抽樣誤差造成的。是抽樣誤差造成的。到底屬于哪種情況到底屬于哪種情況 ,需尋求合適的統(tǒng)計(jì)數(shù),需尋求合適的統(tǒng)計(jì)數(shù) 進(jìn)行統(tǒng)計(jì)分析,即進(jìn)行顯著性檢驗(yàn)。進(jìn)行統(tǒng)計(jì)分析,即進(jìn)行顯著性檢驗(yàn)。表表6-16-1豌豆雜交豌豆雜

6、交F F2 2花色分離的實(shí)際觀察次數(shù)與理論次數(shù)花色分離的實(shí)際觀察次數(shù)與理論次數(shù)從表中可見,從表中可見,理論數(shù)與實(shí)際數(shù)存在差別理論數(shù)與實(shí)際數(shù)存在差別。 如果如果原原假設(shè)成立的假設(shè)成立的話話,這種差別屬于抽樣誤差,應(yīng)該不會(huì)很大,這種差別屬于抽樣誤差,應(yīng)該不會(huì)很大; 反之反之,如果這,如果這種差別很懸殊,種差別很懸殊,則因該懷疑原假設(shè)不成立則因該懷疑原假設(shè)不成立。 如何評價(jià)如何評價(jià)“懸殊懸殊”與與“不懸殊不懸殊”? 卡方檢驗(yàn)卡方檢驗(yàn)花花色色實(shí)際觀察次數(shù)實(shí)際觀察次數(shù)(A A)理論次數(shù)理論次數(shù)(T T)A AT T( (A AT T) )2 2/ /T T紅紅色色705(705(A A1 1) )696

7、.75(696.75(T T1 1) )8.258.250.09770.0977白白色色224(224(A A2 2) )232.25(232.25(T T2 2) )8.258.250.29310.2931合合計(jì)計(jì)9299299299290 00.39080.3908先將先將A A1 1T T1 1、A A2 2T T2 2平方,然后再求和,即平方,然后再求和,即。數(shù)值的大小可用來表示實(shí)際觀數(shù)值的大小可用來表示實(shí)際觀察次數(shù)與理論次數(shù)的相差程度察次數(shù)與理論次數(shù)的相差程度 。計(jì)算計(jì)算 ( A T )2( A T )2用用 ( A T )2 來表示實(shí)際觀察次數(shù)與理論次數(shù)來表示實(shí)際觀察次數(shù)與理論次數(shù)

8、 的相差程度還存在一個(gè)問題的相差程度還存在一個(gè)問題。例如例如,上述兩組的,上述兩組的實(shí)際觀察次數(shù)與理實(shí)際觀察次數(shù)與理 論次數(shù)的差數(shù)的絕對值都是論次數(shù)的差數(shù)的絕對值都是8.258.25, ( A T )2 都是都是68.062568.0625,但二者顯然不能,但二者顯然不能相提并論。相提并論。 紅花組是相對于理論次數(shù)紅花組是相對于理論次數(shù)696.75696.75,相差相差8.258.25;白花組是相對于理論次數(shù)白花組是相對于理論次數(shù)232.25232.25,相,相差差 8.258.25。2= =2i iTi( A T )ki122統(tǒng)計(jì)學(xué)家統(tǒng)計(jì)學(xué)家K. Pearson(1900)發(fā)現(xiàn),對于間斷型次

9、)發(fā)現(xiàn),對于間斷型次 數(shù)資料由下式定義的數(shù)資料由下式定義的 ,近似地服從自由度,近似地服從自由度為為 df k 1的連續(xù)型隨機(jī)變量的連續(xù)型隨機(jī)變量 分布。分布。(6-16-1)i表示每一個(gè)分類都進(jìn)行求和2 是度量實(shí)際觀察次數(shù)與理論次數(shù)偏離程是度量實(shí)際觀察次數(shù)與理論次數(shù)偏離程 度的一個(gè)統(tǒng)計(jì)數(shù)。度的一個(gè)統(tǒng)計(jì)數(shù)。如果如果原原假設(shè)成立假設(shè)成立,實(shí)際數(shù)與理論數(shù)的差距應(yīng)該,實(shí)際數(shù)與理論數(shù)的差距應(yīng)該較小較小,按照上式計(jì)算的卡方值因該接近,按照上式計(jì)算的卡方值因該接近0 0,如果如果卡方值遠(yuǎn)離卡方值遠(yuǎn)離0 0則應(yīng)該拒絕原假設(shè);則應(yīng)該拒絕原假設(shè); 可見卡方檢驗(yàn)的基本原理就是分析可見卡方檢驗(yàn)的基本原理就是分析實(shí)際

10、頻數(shù)實(shí)際頻數(shù)與與根據(jù)假設(shè)構(gòu)建的根據(jù)假設(shè)構(gòu)建的理論頻數(shù)理論頻數(shù)間的間的吻合程度吻合程度(擬合(擬合度度)。對于上述豌豆花色的調(diào)查結(jié)對于上述豌豆花色的調(diào)查結(jié)果果可計(jì)算得可計(jì)算得:2696.75232.25Tii1( A T )2(705 696.75)2(224 232.25)20.39082 ii花花色色實(shí)際觀察次數(shù)實(shí)際觀察次數(shù)(A A)理論次數(shù)理論次數(shù)(T T)A AT T( (A AT T) )2 2/ /T T紅紅色色705(705(A A1 1) )696.75(696.75(T T1 1) )8.258.250.09770.0977白白色色224(224(A A2 2) )232.25

11、(232.25(T T2 2) )8.258.250.29310.2931合合計(jì)計(jì)9299299299290 00.39080.3908三三、連續(xù)性矯正連續(xù)性矯正2近似地服從自由度近似地服從自由度的的 2,即,即對于間斷型次數(shù)資料由(對于間斷型次數(shù)資料由(6-16-1)式定義)式定義kii ii1( A T )2T為為 df k 1的連續(xù)型隨機(jī)變量的連續(xù)型隨機(jī)變量 2 分布。由間分布。由間 斷型次數(shù)資料按上式算得的斷型次數(shù)資料按上式算得的 2值均有偏大的趨值均有偏大的趨 勢,尤其是當(dāng)勢,尤其是當(dāng) df 1 時(shí),偏差較大時(shí),偏差較大。F. Yates(1934)提出對)提出對 2 進(jìn)行連續(xù)性矯正

12、。進(jìn)行連續(xù)性矯正。,即即方進(jìn)行計(jì)算。矯正后的方進(jìn)行計(jì)算。矯正后的 2 記為記為矯正方法是,先將各組實(shí)際觀察次數(shù)與理矯正方法是,先將各組實(shí)際觀察次數(shù)與理 論次數(shù)的差數(shù)的絕對值分別減去論次數(shù)的差數(shù)的絕對值分別減去0.50.5,然后再平,然后再平2c2iicTii1A T 0.52k(6-26-2) 當(dāng)自由度為當(dāng)自由度為1 1時(shí),時(shí),需要進(jìn)行校正需要進(jìn)行校正當(dāng)當(dāng)dfdf22時(shí),(時(shí),(6-16-1)式計(jì)算的)式計(jì)算的2 與連與連續(xù)型隨機(jī)變量續(xù)型隨機(jī)變量 2 相近,這時(shí),可不作連續(xù)性相近,這時(shí),可不作連續(xù)性 矯正,但要求各組內(nèi)的矯正,但要求各組內(nèi)的理論次數(shù)不小于理論次數(shù)不小于5 5。如。如 果某一組的

13、理論次數(shù)小于果某一組的理論次數(shù)小于5 5,則應(yīng)把它與其相,則應(yīng)把它與其相 鄰的一組或幾組合并鄰的一組或幾組合并 ,直到合并組的理論次,直到合并組的理論次 數(shù)大于數(shù)大于5 5為止。為止。四、四、 2 檢測的基本方法檢測的基本方法kTii1( A T )22i icTiA T 0.52 ki12 = = iid f =1d f 1Ai:觀察次數(shù);Ti:理論次數(shù);k:組數(shù);d f = k-122統(tǒng)計(jì)推斷的一般方法:統(tǒng)計(jì)推斷的一般方法:1、如果、如果2、如果、如果可得。可得。22或或c 大于大于 ,則拒絕則拒絕無效假設(shè)無效假設(shè)Ho或或c 小于小于 ,則不拒絕則不拒絕無效假設(shè)無效假設(shè)H022是顯著水平與

14、自由度兩個(gè)因子的函數(shù),查表是顯著水平與自由度兩個(gè)因子的函數(shù),查表2第二第二節(jié)節(jié)適合性檢驗(yàn)適合性檢驗(yàn)一、適合性檢驗(yàn)的意義一、適合性檢驗(yàn)的意義對于分類次數(shù)資料,判斷實(shí)際觀察的屬性對于分類次數(shù)資料,判斷實(shí)際觀察的屬性 類別分配是否符合已知屬性類別分配理論或?qū)W類別分配是否符合已知屬性類別分配理論或?qū)W 說的假設(shè)檢驗(yàn)稱為說的假設(shè)檢驗(yàn)稱為適合性檢驗(yàn)適合性檢驗(yàn) 。察的屬性類別分配符合已知屬性類別分配的理察的屬性類別分配符合已知屬性類別分配的理論或?qū)W說;論或?qū)W說;備擇假備擇假設(shè)設(shè):實(shí)際觀察的屬性類:實(shí)際觀察的屬性類別分配不符合已知屬性類別分配的理論或?qū)W說。別分配不符合已知屬性類別分配的理論或?qū)W說。0在適合性檢驗(yàn)

15、中在適合性檢驗(yàn)中,無效假無效假設(shè)設(shè) H:實(shí)際觀:實(shí)際觀AH適合性檢驗(yàn)的自由度等于屬性類別數(shù)減適合性檢驗(yàn)的自由度等于屬性類別數(shù)減1 1。 若屬性類別數(shù)為若屬性類別數(shù)為k k,則適合性檢驗(yàn)的自由度為,則適合性檢驗(yàn)的自由度為k k-1-1然后根據(jù)然后根據(jù)(6-16-1)或()或(6-26-2)式計(jì)算)式計(jì)算出出或或。將所計(jì)算得的將所計(jì)算得的比比較較:在假設(shè)無效假設(shè)成立的條件下,在假設(shè)無效假設(shè)成立的條件下,按已知屬性類別按已知屬性類別 分配的理論或?qū)W說計(jì)算各屬性類別的理論次數(shù)分配的理論或?qū)W說計(jì)算各屬性類別的理論次數(shù)。22cc2 或或 2值與根據(jù)自由度值與根據(jù)自由度k k1 1查查0.05值表(值表(附

16、表附表4 4)所得的臨界所得的臨界 2值:值: 20.01或或 2,0.010.01p p0.050.05,表,表明實(shí)際觀察次數(shù)與理論次數(shù)明實(shí)際觀察次數(shù)與理論次數(shù)差異顯差異顯著著,實(shí)際觀察,實(shí)際觀察 的屬性類別分配顯著不符合已知屬性類別分配的的屬性類別分配顯著不符合已知屬性類別分配的 理論或?qū)W說理論或?qū)W說。,p p0.050.05,表明實(shí)際觀察,表明實(shí)際觀察若若 2(或或2)c次數(shù)與理論次數(shù)次數(shù)與理論次數(shù)差異不顯差異不顯著著,可以認(rèn)為實(shí)際觀察,可以認(rèn)為實(shí)際觀察 的屬性類別分配符合已知屬性類別分配的理論或的屬性類別分配符合已知屬性類別分配的理論或 學(xué)說;學(xué)說;20.0120.050.05若若 2

17、 (2c或或 2),p p 0.010.01,表明實(shí)際,表明實(shí)際觀察次數(shù)與理論次數(shù)差觀察次數(shù)與理論次數(shù)差異異極顯極顯著著,實(shí)際觀察的,實(shí)際觀察的 屬性類別分配極顯著不符合已知屬性類別分配屬性類別分配極顯著不符合已知屬性類別分配 的理論或?qū)W說。的理論或?qū)W說。0.01c若若 2(或(或 2) 2二、適合性檢驗(yàn)的方法二、適合性檢驗(yàn)的方法【例【例6161】紫花大豆與白花大豆雜紫花大豆與白花大豆雜交交F F1 1全全為紫花,為紫花,F(xiàn) F2 2出現(xiàn)分離,在出現(xiàn)分離,在F F2 2中共觀察中共觀察16501650株,其株,其 中紫花中紫花12601260株,白花株,白花390390株。問這一結(jié)果是否符株。

18、問這一結(jié)果是否符 合孟德爾遺傳分離定律的合孟德爾遺傳分離定律的3:13:1比例?比例?1 1、提出假設(shè)、提出假設(shè)H0:大豆花色:大豆花色F F2 2分離符合分離符合3:13:1的理論比例的理論比例;:大豆花色:大豆花色F F2 2分離不符合分離不符合3:13:1的理論比例的理論比例。HA2 2、計(jì)算理論次數(shù)、計(jì)算理論次數(shù) 在無效假設(shè)成立的條件在無效假設(shè)成立的條件 下,計(jì)算理論次數(shù),即根據(jù)理論比例下,計(jì)算理論次數(shù),即根據(jù)理論比例3:13:1計(jì)算理計(jì)算理 論次數(shù):論次數(shù):紫花理論次數(shù):紫花理論次數(shù):T T1 1=1650=16503/4=1237.53/4=1237.5; 白花理論次數(shù):白花理論次

19、數(shù):T T2 2=1650=16501/4=412.51/4=412.5,或或T T2 2=1650-1237.5=412.5=1650-1237.5=412.5。表表6-26-2計(jì)算表計(jì)算表2c性狀性狀實(shí)際觀察次數(shù)實(shí)際觀察次數(shù)(A A)理論次數(shù)理論次數(shù)(T T)紫花紫花126012601237.51237.5白花白花390390412.5412.5總總 和和16501650165016503 3、計(jì)算、計(jì)算2c21237.5412.5cT( A T 0.5)2(1260 1237.5 0.5)2( 390 412.5 0.5)21.5644性狀性狀實(shí)際觀察次數(shù)實(shí)際觀察次數(shù)(A A)理論次數(shù)理

20、論次數(shù)(T T)紫花紫花126012601237.51237.5白花白花390390412.5412.5總總 和和16501650165016504 4、統(tǒng)計(jì)推斷、統(tǒng)計(jì)推斷表明實(shí)際觀察次數(shù)與理論次數(shù)差異不顯著。表明實(shí)際觀察次數(shù)與理論次數(shù)差異不顯著??煽?以認(rèn)為大豆花色在以認(rèn)為大豆花色在F F2 2的這一結(jié)果是符合的這一結(jié)果是符合3:13:1的理的理 論比例,即大豆紫花與白花這一相對性狀在論比例,即大豆紫花與白花這一相對性狀在F F2 2 的分離比例符合一對等位基因的遺傳規(guī)律的分離比例符合一對等位基因的遺傳規(guī)律。20.05(1)3.84,c實(shí)際計(jì)算的實(shí)際計(jì)算的 2 =1.5644=1.56440

21、.05(1) 2 3.84 ,故故p p0.050.05,不能否,不能否定定,H0【例【例6262】兩對等位基因控制的兩對相兩對等位基因控制的兩對相 對性狀遺傳對性狀遺傳。如果兩對等位基因完全顯性且無。如果兩對等位基因完全顯性且無 連鎖,則連鎖,則F F2 2的四種表現(xiàn)型在理論上應(yīng)有的四種表現(xiàn)型在理論上應(yīng)有9:3:3:1 9:3:3:1 的比例。有一水稻遺傳試驗(yàn),的比例。有一水稻遺傳試驗(yàn), 以以稃尖有色稃尖有色非糯非糯 品種與品種與稃尖無色稃尖無色糯性糯性品種雜交,品種雜交, 其其F F2 2的觀察結(jié)的觀察結(jié) 果為果為稃尖有色非糯稃尖有色非糯491491株(株(A A1 1),),稃尖有色糯稻

22、稃尖有色糯稻 7676株(株(A A2 2),),稃尖無色非糯稃尖無色非糯9090株(株(A A3 3),), 稃尖稃尖 無色糯稻無色糯稻8686株(株(A A4 4)。)。 試檢驗(yàn)實(shí)際觀察結(jié)果是試檢驗(yàn)實(shí)際觀察結(jié)果是 否符合否符合9:3:3:19:3:3:1的理論比例。的理論比例。1 1、提出假設(shè)、提出假設(shè)H0 :實(shí)際觀察次數(shù)之比符合:實(shí)際觀察次數(shù)之比符合9:3:3:19:3:3:1的的 理論比例;理論比例;HA :實(shí)際觀察次數(shù)之比不符合:實(shí)際觀察次數(shù)之比不符合9:3:3:19:3:3:1的理論比例。的理論比例。2 2、計(jì)算理論次數(shù)、計(jì)算理論次數(shù)稃尖有色非糯稃尖有色非糯的理論次數(shù):的理論次數(shù):

23、T T1 1=743=7439/16=417.949/16=417.94;稃尖有色糯稻稃尖有色糯稻的理論次數(shù):的理論次數(shù):T T2 2=743=7433/16=139.313/16=139.31;稃尖無色非稃尖無色非糯糯的理論次數(shù):的理論次數(shù):T T3 3=743=7433/16=139.313/16=139.31;稃尖無色糯稻稃尖無色糯稻的理論次數(shù):的理論次數(shù):T T4 4=743=7431/16=46.441/16=46.44,或或T T4 4=743-417.94-139.31-139.31=46.44=743-417.94-139.31-139.31=46.44。3 3、計(jì)算、計(jì)算 2

24、22139.3146.44(AT)T(491417.94)2(76139.31)2417.94(90139.31)2139.31(8646.44)292.69614 4、統(tǒng)計(jì)推斷、統(tǒng)計(jì)推斷因因 20.01(3)=92.6961 =92.6961 2 11.34,故,故p p0.010.01,否定,否定 H0 ,接受,接受 HA ,表明該水稻稃尖和,表明該水稻稃尖和 糯性性狀在糯性性狀在F F2 2的實(shí)際觀察次數(shù)之比的實(shí)際觀察次數(shù)之比極顯著極顯著不符不符 合合9:3:3:19:3:3:1的理論比例。的理論比例。這一結(jié)果表明,這一結(jié)果表明,該兩對等位基因并非完全該兩對等位基因并非完全 顯性、無連鎖

25、顯性、無連鎖。當(dāng)屬性類別數(shù)大于當(dāng)屬性類別數(shù)大于2 2時(shí),可利用下面時(shí),可利用下面簡化簡化公式公式計(jì)算計(jì)算2:22ipiT 1AT(6-36-3)其中,其中,A Ai i為第為第i i組的實(shí)際觀察次數(shù)組的實(shí)際觀察次數(shù),p pi i為為第第i i組的理論比例組的理論比例, 為總觀察次數(shù):為總觀察次數(shù):iAT T(不作要求,考試使用四步法即可)將將【例【例6262】按(按(6-36-3)式計(jì)算)式計(jì)算:222227629028627439332iApi2T149127437439 163 163 161 16 1649176908674392.7063 1T用(用(6-36-3)式計(jì)算的)式計(jì)算的

26、2與用(與用(6-16-1)式計(jì))式計(jì) 算的算的2因舍入誤差略有不同。因舍入誤差略有不同。用(用(6-36-3)式計(jì)算)式計(jì)算2不需計(jì)算理論次數(shù),不需計(jì)算理論次數(shù), 且舍入誤差小。且舍入誤差小。第三第三節(jié)節(jié)獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)一、獨(dú)立性檢驗(yàn)的意義一、獨(dú)立性檢驗(yàn)的意義對于分類次數(shù)資料,判斷兩類因子是相互對于分類次數(shù)資料,判斷兩類因子是相互 獨(dú)立還是彼此相關(guān)的假設(shè)檢驗(yàn)稱為獨(dú)立還是彼此相關(guān)的假設(shè)檢驗(yàn)稱為獨(dú)立性檢獨(dú)立性檢驗(yàn)驗(yàn) 。例如,研究例如,研究玉米種子滅菌與否玉米種子滅菌與否和和果穗是否果穗是否 發(fā)病發(fā)病兩類因子之間的關(guān)系,兩類因子之間的關(guān)系,若相互獨(dú)立,表示若相互獨(dú)立,表示 種子滅菌與否和果穗是

27、否發(fā)病無關(guān),滅菌處理種子滅菌與否和果穗是否發(fā)病無關(guān),滅菌處理 對防止果穗發(fā)病無對防止果穗發(fā)病無效效;若彼此相關(guān),則表示種若彼此相關(guān),則表示種 子滅菌與否和果穗是否發(fā)病有關(guān),滅菌處理對子滅菌與否和果穗是否發(fā)病有關(guān),滅菌處理對 防止果穗發(fā)病有效。防止果穗發(fā)病有效。(1 1)獨(dú)立性檢驗(yàn)的次數(shù)資料是按兩因子)獨(dú)立性檢驗(yàn)的次數(shù)資料是按兩因子 屬性類別進(jìn)行歸組。根據(jù)兩因子屬性類別數(shù)的屬性類別進(jìn)行歸組。根據(jù)兩因子屬性類別數(shù)的 不同而構(gòu)成不同而構(gòu)成2 22 2、2 2c c、r rc c列聯(lián)表(列聯(lián)表(r r為行為行 因因子的屬性類別數(shù)子的屬性類別數(shù) ,c c 為列因子的屬性類別為列因子的屬性類別數(shù))。數(shù))。

28、(2 2)獨(dú)立性檢驗(yàn)的)獨(dú)立性檢驗(yàn)的理論次理論次數(shù)數(shù)是在兩因子是在兩因子 相互獨(dú)立的假設(shè)下計(jì)算。相互獨(dú)立的假設(shè)下計(jì)算。行是一個(gè)因子,列是另一個(gè)因子。(3 3)在)在r rc c列聯(lián)表的獨(dú)立性檢驗(yàn)中列聯(lián)表的獨(dú)立性檢驗(yàn)中 ,共有,共有rcrc個(gè)理論次數(shù),但受到以下條件的約束:個(gè)理論次數(shù),但受到以下條件的約束: rcrc個(gè)理論次數(shù)的總和等于個(gè)理論次數(shù)的總和等于rcrc個(gè)實(shí)際次數(shù)的個(gè)實(shí)際次數(shù)的總總 和;和; r r個(gè)橫行中的每一橫行理論次數(shù)總和等于該個(gè)橫行中的每一橫行理論次數(shù)總和等于該 行實(shí)際次數(shù)的總和;行實(shí)際次數(shù)的總和; 自由度自由度 = =(橫行屬性類別數(shù)(橫行屬性類別數(shù)1 1)(直列(直列 屬性

29、類別數(shù)屬性類別數(shù)1 1)。二、獨(dú)立性檢驗(yàn)的方法二、獨(dú)立性檢驗(yàn)的方法(一)(一)2 22 2列聯(lián)表的獨(dú)立性檢驗(yàn)列聯(lián)表的獨(dú)立性檢驗(yàn)需作連續(xù)性矯正,應(yīng)計(jì)算需作連續(xù)性矯正,應(yīng)計(jì)算2 值。值。c兩個(gè)因子,各有兩種情況表表6-46-42 22 2列聯(lián)表的一般形式列聯(lián)表的一般形式其中其中A Aijij為實(shí)際觀察次數(shù),為實(shí)際觀察次數(shù),T Tijij為理論次數(shù)。為理論次數(shù)。1 12 2行總和行總和 Ti 1 1A A1111( (T T1111) )A A1212( (T T1212) )T1 = =A A1111+ + A A12122 2A A2121( (T T2121) )A A2222( (T T22

30、22) )T2 = =A A2121+ + A A 2222列總和列總和 TjT = =A A1111+ + A A 2121 1T = =A A1212+ + A A 22222T = =A A1111+ + A A1212+A+A2121+ + A A 2222【例【例6464】 為防治小麥散黑穗病,播種為防治小麥散黑穗病,播種 前用某種藥劑對小麥種子進(jìn)行滅菌處理前用某種藥劑對小麥種子進(jìn)行滅菌處理 ,以未,以未 經(jīng)滅菌處理的小麥種子為對照經(jīng)滅菌處理的小麥種子為對照 ,觀察結(jié)果為:,觀察結(jié)果為: 種子滅菌的種子滅菌的7676株中有株中有2626株發(fā)病株發(fā)病 ,5050株未發(fā)?。恢晡窗l(fā)?。?種

31、子未滅菌的種子未滅菌的384384株中有株中有184184株發(fā)病,株發(fā)病,200200株未發(fā)株未發(fā) 病病 。試分析。試分析種子滅菌對防止小麥散黑穗病是否種子滅菌對防止小麥散黑穗病是否 有效有效?表表6-56-5防止小麥散黑穗病的觀察結(jié)果防止小麥散黑穗病的觀察結(jié)果處理項(xiàng)目處理項(xiàng)目發(fā)病穗數(shù)發(fā)病穗數(shù)未發(fā)病穗數(shù)未發(fā)病穗數(shù)行總和行總和 Ti 種子滅菌種子滅菌262650507676種子未滅菌種子未滅菌184184200200384384列總和列總和 Tj210210250250T460460:種子滅菌對防止小麥散黑穗病無效,:種子滅菌對防止小麥散黑穗病無效,即種子滅菌與否與散黑穗病發(fā)病穗多少無關(guān),即種子

32、滅菌與否與散黑穗病發(fā)病穗多少無關(guān),二者相互獨(dú)立;二者相互獨(dú)立;1 1、 提出假設(shè)提出假設(shè)H0:種子滅菌對防止小麥散黑穗病有效,:種子滅菌對防止小麥散黑穗病有效,即種子滅菌與否和散黑穗病發(fā)病穗多少有關(guān),即種子滅菌與否和散黑穗病發(fā)病穗多少有關(guān), 二者彼此相關(guān)。二者彼此相關(guān)。HA2 2、 計(jì)算理論次數(shù)計(jì)算理論次數(shù)在無效假設(shè)成立的條件下,計(jì)算各個(gè)理在無效假設(shè)成立的條件下,計(jì)算各個(gè)理 論次數(shù)論次數(shù) 。假設(shè)種子滅菌對防止小麥散黑穗病。假設(shè)種子滅菌對防止小麥散黑穗病 無效,即種子滅菌與否與散黑穗病發(fā)病穗多無效,即種子滅菌與否與散黑穗病發(fā)病穗多 少無關(guān),也就是說少無關(guān),也就是說種子滅菌與種子未滅菌的種子滅菌與

33、種子未滅菌的 理論發(fā)病率相同理論發(fā)病率相同,依此計(jì)算出各個(gè)理論次數(shù),依此計(jì)算出各個(gè)理論次數(shù) 如下:如下:種子滅菌的理論發(fā)病穗數(shù):種子滅菌的理論發(fā)病穗數(shù):T T1111=76=76210/460=34.70210/460=34.70種子滅菌的理論未發(fā)病穗數(shù):種子滅菌的理論未發(fā)病穗數(shù):T T1212=76=76250/460=41.30 250/460=41.30 或或T T1212=76-34.70=41.30=76-34.70=41.30處理項(xiàng)目處理項(xiàng)目發(fā)病穗數(shù)發(fā)病穗數(shù)未發(fā)病穗數(shù)未發(fā)病穗數(shù)行總和行總和 Ti 種子滅菌種子滅菌2626(34.7034.70)5050(41.3041.30)767

34、6種子未滅菌種子未滅菌184184(175.30175.30)200200(208.70208.70)384384列總和列總和 Tj210210250250T460460種子未滅的理論發(fā)病穗數(shù):種子未滅的理論發(fā)病穗數(shù): T T2121=384=384210/460=175.30210/460=175.30或或T T2121=210-34.70=175.30=210-34.70=175.30種子未滅菌的理論未發(fā)病穗數(shù):種子未滅菌的理論未發(fā)病穗數(shù):T T2222=384=384250/460=208.70 250/460=208.70 或或 T T2222=250-41.30=208.70=250

35、-41.30=208.703 3、計(jì)算、計(jì)算2c234.7041.30175.30208.70cT( A T 0.5)2( 26 34.70 0.5)2( 50 41.30 0.5)2(184 175.30 0.5)2( 200 208.70 0.5)24.274 4、統(tǒng)計(jì)推斷、統(tǒng)計(jì)推斷和和之間,之間,接受,接受, 表表明種子滅菌與否和散黑穗病發(fā)病穗多少顯著明種子滅菌與否和散黑穗病發(fā)病穗多少顯著 有關(guān),這里表現(xiàn)為種子滅菌發(fā)病率顯著低于有關(guān),這里表現(xiàn)為種子滅菌發(fā)病率顯著低于 種子未滅菌,說明小麥種子用該藥劑滅菌對種子未滅菌,說明小麥種子用該藥劑滅菌對 防止小麥散黑穗病是有效的防止小麥散黑穗病是有

36、效的。0.05(1)因?yàn)橐驗(yàn)?20.01(1)3.84, 2 6.63而實(shí)而實(shí)c故故0.010.01p p0.050.05,否定,否定0.05(1)際計(jì)算的際計(jì)算的 2 4.27 介于介于 220.01(1)H0HA在進(jìn)行在進(jìn)行22列聯(lián)表獨(dú)立性檢驗(yàn)時(shí),還可利列聯(lián)表獨(dú)立性檢驗(yàn)時(shí),還可利c用下述簡化公式計(jì)用下述簡化公式計(jì)算算 2:c2 2( A AA AT )2 T11221221T T T T1212 (6-46-4)和全部實(shí)際觀察次數(shù)的總和全部實(shí)際觀察次數(shù)的總和和計(jì)算,計(jì)算工作量計(jì)算,計(jì)算工作量小,累計(jì)舍入誤差也小。小,累計(jì)舍入誤差也小。c直接利用實(shí)際觀察次數(shù)直接利用實(shí)際觀察次數(shù)A Aijij

37、,列、行總和,列、行總和利用(利用(6-46-4)式計(jì)算)式計(jì)算 2,不需要先計(jì)算理論次數(shù),不需要先計(jì)算理論次數(shù),T、T、T、121T2T對于對于【例【例6464】,利用(,利用(6-46-4)式可得:)式可得:2 2c( A A A A( 26200 50184 460)2 460 24.2721025076384T )2T11221221T T T T1 212所得結(jié)果與前面計(jì)算的結(jié)果相同。所得結(jié)果與前面計(jì)算的結(jié)果相同。(二)(二)2 2c c列聯(lián)表的獨(dú)立性檢驗(yàn)列聯(lián)表的獨(dú)立性檢驗(yàn)表表6-66-62 2c c聯(lián)列表一般形式聯(lián)列表一般形式其中其中A Aijij為實(shí)際觀察次數(shù)為實(shí)際觀察次數(shù), ,

38、 T Tijij為理論次數(shù)為理論次數(shù)(i i=1=1,2 2;j j=1=1,2 2,c c)。)。一個(gè)因子有兩個(gè)屬性,另一個(gè)多個(gè)屬性1 12 2c c行總和行總和 Ti 1 1A A1111( (T T1111) )A A1212( (T T1212) )A A1c1c( (T T1c1c) )T T1 1. .2 2A A2121( (T T2121) )A A2222( (T T2222) )A A2c2c( (T T2c2c) )T T2 2. .列總和列總和 TjT 1T2TcT【例【例6565】 檢測甲、乙、丙檢測甲、乙、丙3 3種農(nóng)藥對煙蚜種農(nóng)藥對煙蚜 的毒殺效果:用甲農(nóng)藥處理的

39、毒殺效果:用甲農(nóng)藥處理187187頭煙蚜,其中頭煙蚜,其中37 37 頭死亡,頭死亡,150150頭未死亡;用乙農(nóng)藥處理頭未死亡;用乙農(nóng)藥處理 149 149頭煙頭煙 蚜,其中蚜,其中4949頭死亡,頭死亡,100100頭未死亡;用丙農(nóng)藥處頭未死亡;用丙農(nóng)藥處 理理8080頭煙蚜頭煙蚜 , 其中其中2323頭死亡,頭死亡,5757頭未死亡。頭未死亡。 分析這三種農(nóng)藥對煙蚜的毒殺效果是否一致分析這三種農(nóng)藥對煙蚜的毒殺效果是否一致?:對煙蚜的毒殺效果與農(nóng)藥類型有關(guān)。:對煙蚜的毒殺效果與農(nóng)藥類型有關(guān)。:對煙蚜的毒殺效果與農(nóng)藥類型無關(guān);:對煙蚜的毒殺效果與農(nóng)藥類型無關(guān);AHH01 1、 提出假設(shè)提出假

40、設(shè)2 2、 計(jì)算理論次計(jì)算理論次數(shù)數(shù) 在無效假設(shè)為正確在無效假設(shè)為正確的條的條件下件下,計(jì)算各個(gè)理論次數(shù),計(jì)算各個(gè)理論次數(shù) 。T T1111=109=109187/416=49.00 187/416=49.00 T T1212=109=109149/416=39.04 149/416=39.04 T T1313=109=10980/416=20.96 80/416=20.96 T T2121=307=307187/416=138.00 187/416=138.00 T T2222=307=307149/416=109.96 149/416=109.96 T T2323=307=30780/41

41、6=59.0480/416=59.04甲甲乙乙丙丙行總和行總和 Ti 死亡數(shù)死亡數(shù)3737(49.0049.00)4949(39.0439.04)2323(20.9620.96)109109未死亡數(shù)未死亡數(shù)150150(138.00138.00)100100(109.96109.96)5757(59.0459.04)307307列總和列總和Tj1871871491498080T 4164163 3、計(jì)、計(jì)算算值值22249.0039.0459.04(A T )T(37 49.00)2(49 39.04)2(57 59.04)27.69因?qū)嶋H計(jì)算的因?qū)嶋H計(jì)算的介于介于與與 之間,之間, 故故 0.010.01p p0.050.05,否否定定,接受,接受,說明說明3 3種農(nóng)藥對煙蚜的毒殺種農(nóng)藥對煙蚜的毒殺效果不一致。效果不一致。4 4、 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷20.05 ( 2 )5.9920.01( 2 )9.2127.6920.05(2)20.01( 2 )H0HA在進(jìn)行在進(jìn)行2c列聯(lián)表獨(dú)立檢驗(yàn)時(shí)也可不計(jì)算列聯(lián)表獨(dú)立檢驗(yàn)時(shí)也可不計(jì)算 理論次數(shù),直接代入下面簡化公式(理論次數(shù),直接代入下面簡化公式(6- -5)計(jì))計(jì) 算算 2值。值。2A 2TT 22 1 T1 T2 1 j

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論