第二章 統(tǒng)計(jì)推斷-1_第1頁
第二章 統(tǒng)計(jì)推斷-1_第2頁
第二章 統(tǒng)計(jì)推斷-1_第3頁
第二章 統(tǒng)計(jì)推斷-1_第4頁
第二章 統(tǒng)計(jì)推斷-1_第5頁
已閱讀5頁,還剩94頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 第一節(jié) 統(tǒng)計(jì)推斷的基本原理和步驟統(tǒng)計(jì)推斷的基本原理和步驟 總體與樣本之間的關(guān)系包括兩個(gè)方面。如何從總體到樣本的研究及如何通過樣本去推斷總體。由樣本推斷總體是以各種樣本統(tǒng)計(jì)量的抽樣分布為基礎(chǔ)的。對(duì)總體做統(tǒng)計(jì)推斷(statistical inference),可以通過兩條途徑進(jìn)行。一是首先對(duì)所估計(jì)的總體提出一個(gè)假設(shè)(hypothesis),例如假設(shè)這個(gè)總體的平均數(shù)等于某個(gè)值0(=0),然后,通過樣本數(shù)據(jù)去推斷這個(gè)假設(shè)是否可以接受。如果可以接受,樣本很可能抽自這個(gè)總體;否則,很可能不是抽自這個(gè)總體。二是通過樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)。前一種途徑稱為統(tǒng)計(jì)假設(shè)檢驗(yàn)(statistical test of

2、hypothesis),后一種稱為總體參數(shù)估計(jì)(estimation of poplation parameter)。這兩種不同的統(tǒng)計(jì)推斷方法,在實(shí)際應(yīng)用中可互相參照使用。 統(tǒng)計(jì)推斷的內(nèi)容很廣泛,本章重點(diǎn)講解統(tǒng)計(jì)推斷的一般原理以及對(duì)總體平均數(shù)及標(biāo)準(zhǔn)差的推斷。 下面通過一個(gè)例子來說明假設(shè)檢驗(yàn)的基本原理和有關(guān)概念。 例 21 用實(shí)驗(yàn)動(dòng)物做實(shí)驗(yàn)材料,要求動(dòng)物平均體重 =20000g,若 20000g需再飼養(yǎng),若 20000g則應(yīng)淘汰。 動(dòng)物體重是服從正態(tài)分布 N( ,2)的隨機(jī)變量。已知總體標(biāo)準(zhǔn)差= 040g,但總體平均數(shù)是未知的。為了得出對(duì)總體平均數(shù)的推斷,從動(dòng)物群體中,隨機(jī)抽取含量為n的樣本,通

3、過樣本平均數(shù)x推斷總體平均數(shù)。 2.1.1假設(shè)假設(shè) 總體平均數(shù)是未知的,為了得到對(duì)總體平均數(shù)的推斷,可以假設(shè)總體平均數(shù)等于某一給定的值0(0)?;蛘哒f,與0差等于0(-0=0)。這樣的假設(shè)通常稱為零假設(shè)零假設(shè)(null hypothesis)。記為 H0:=0 或H0: -0=0。 與零假設(shè)相對(duì)立的假設(shè)稱為備擇假設(shè)備擇假設(shè)(alternative hypothesis)。從備擇假設(shè)的名稱上就可以看出,它是在拒絕的情況下,可供選擇的假設(shè)。備擇假設(shè)記HA。例如,HA: 0、HA: 0。 2.1.2小概率原理小概率原理 它的基本內(nèi)容是:小概率的事件,在一次試驗(yàn)中,幾乎是不會(huì)發(fā)生的。若根據(jù)一定的假設(shè)條

4、件計(jì)算出來該事件發(fā)生的概率很小,而在一次試驗(yàn)中,它竟然發(fā)生了,則可以認(rèn)為假設(shè)的條件不正確。因此,否定假設(shè)。 根據(jù)上述原理所建立起來的檢驗(yàn)方法稱為顯著性顯著性檢驗(yàn)檢驗(yàn)(significance test)。究竟概率小到什么程度算是小概率,要根據(jù)實(shí)際情況或?qū)嶒?yàn)要求而定,生物統(tǒng)計(jì)工作中,通常規(guī)定5或1以下為小概率。 5%或 1%(或其他的值)稱為顯著性水平顯著性水平(significance level),記為“”。上述的統(tǒng)計(jì)量 稱為u檢驗(yàn)統(tǒng)計(jì)量(test statistic)。下面幾種統(tǒng)計(jì)假設(shè)檢驗(yàn)中還會(huì)遇到統(tǒng)計(jì)量 t,統(tǒng)計(jì)量 X2以及統(tǒng)計(jì)量F,它們都稱為檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量。 2.1.3單側(cè)檢驗(yàn)與

5、雙側(cè)檢驗(yàn) 若備擇假設(shè)為HA: 0,或HA: 0,若已知不可能小于0。 HA:0和0。 (3)顯著性水平,習(xí)慣上規(guī)定在 =0.05水平上拒絕 H0,稱為“差異顯著”。而在001水平上拒絕 H0,稱為“差異極顯著”。 4)檢驗(yàn)統(tǒng)計(jì)量: u=(X-0)/( /n1/2 ) (5)相應(yīng)于2中各備擇假設(shè)的 H0的拒絕域分別為: uu。 u0(377.2) =0.05 計(jì)算統(tǒng)計(jì)量 u,分別輸入有關(guān)數(shù)據(jù)。 u=(-0)/( /n1/2 ) u=1.8182 查表 u0.05=1.6449,uu0.05,拒絕H0假設(shè),接受HA假設(shè)。因栽培條件的改善,顯著地提高了豌豆的籽粒重量。 =0.01 u0.01=2.3

6、263 單樣本統(tǒng)計(jì)推斷單樣本統(tǒng)計(jì)推斷.xls 例22 已知玉米單交種群單101的平均穗重300克,標(biāo)準(zhǔn)差為 9.5。噴藥處理后,隨機(jī)抽取9個(gè)玉米穗重分別為: 308、311、298、315、312、300、323、294、319克,這種藥物對(duì)玉米穗重量是否有影響? 單樣本統(tǒng)計(jì)推斷單樣本統(tǒng)計(jì)推斷.xls 2. 2 . 2 未知時(shí)平均數(shù)的顯著性檢驗(yàn)-t檢驗(yàn)(t-test) 在統(tǒng)計(jì)中所遇到的絕大多數(shù)問題,總體標(biāo)準(zhǔn)差都是未知的,而平均數(shù)已知(0)。在未知時(shí),平均數(shù)的顯著性檢驗(yàn),一般廣泛使用t檢驗(yàn)。 t檢驗(yàn)的過程類似u檢驗(yàn),但統(tǒng)計(jì)量計(jì)算的不同,還必須計(jì)算樣本的標(biāo)準(zhǔn)(偏)差s。 s/n 1/2 通常記為S

7、X t=(-0)/( s/n 1/2 ) 自由度為:df=n-1 用EXCEL中的函數(shù)中的統(tǒng)計(jì)函數(shù)中的TINV函數(shù)查出臨界值, TINV(probability,degrees_freedom) Probability P= 2(上尾),或P=1-2(下尾), 雙尾 P= 或 P=1- Degrees_freedom 為分布的自由度。 例 2.3 已知玉米單交種群單101的平均穗重300克。噴藥處理后,隨機(jī)抽取9個(gè)玉米穗重分別為: 308、311、298、315、312、300、323、294、319克,噴藥后與噴藥前的玉米穗重差異是否顯著? 解: 假設(shè): H0:=0(300) HA:0(30

8、0) 計(jì)算統(tǒng)計(jì)量 t,分別輸入有關(guān)數(shù)據(jù)。計(jì)算統(tǒng)計(jì)量平均值(X)和標(biāo)準(zhǔn)差s,可通過選擇數(shù)據(jù)分析中的“描述統(tǒng)計(jì)”計(jì)算, 在公式攔輸入公式。 t=2.5579 單樣本統(tǒng)計(jì)推斷單樣本統(tǒng)計(jì)推斷.xls 用EXCEL中的函數(shù)中的統(tǒng)計(jì)函數(shù)中的TINV函數(shù)查出, t8,0.05/2=2.3060,t t8,0.05/2 ,拒絕H0假設(shè),接受HA假設(shè)。因噴藥前后的玉米穗重差異顯著。 t8,0.01/2=3.3554 例 2.4 某地區(qū)10年前普查13歲男孩的平均身高為1.51米,現(xiàn)抽查200個(gè)13歲男孩,身高平均為1.53米,標(biāo)準(zhǔn)差S=0.073米,問10年來該地區(qū)男孩身高是否明顯增長? t=3.8649 t0

9、.05=1.6525 t0.01=2.3452 單樣本統(tǒng)計(jì)推斷單樣本統(tǒng)計(jì)推斷.xls 223 變異性的顯著性檢驗(yàn)變異性的顯著性檢驗(yàn)X2 檢驗(yàn)(檢驗(yàn)(X2 test or chi-test) 雖然在實(shí)際工作中,經(jīng)常遇到的是對(duì)假設(shè)的總體平均數(shù)做檢驗(yàn),但是對(duì)假設(shè)的總體標(biāo)準(zhǔn)差做檢驗(yàn)的情況也很多。對(duì)單個(gè)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差做檢驗(yàn)使用 X2檢驗(yàn),X2檢驗(yàn)是建立在X2分布基礎(chǔ)上的。 設(shè)X是服從正態(tài)分布N(,2)的隨機(jī)變量,并從中獲得含量為n的隨機(jī)樣本,計(jì)算出樣本方差s2,則(n-1)s2/2服從n-1自由度的X2分布。統(tǒng)計(jì)量 X2df=(n-1)S2/2 假設(shè):H0:=0 HA:0 HA:X2, X2X/22 或X

10、2X1-/22。 可以用EXCEL中的函數(shù)中的統(tǒng)計(jì)函數(shù)中的CHIINV函數(shù)查出X2分布的上側(cè)分位數(shù)。 CHIINV(probability,degrees_freedom) Probability P= (上尾), P=1- (下尾), 雙尾 P=/2(上尾), 或P=1-/2(下尾) Degrees_freedom 自由度。 X2檢驗(yàn)的原理與t檢驗(yàn)基本相似。 例2.5 一個(gè)混雜的小麥品種,株高標(biāo)準(zhǔn)差為14cm,經(jīng)過提純以后隨機(jī)抽出10株,它們的株高為 90、105、101、95、100、100、101、105、93、97cm,考查提純后的群體是否比原群體整齊? 假設(shè):H0:=0(14) HA

11、:p0 則在分子中增加-0.5/n, 反則+0.5/n 檢驗(yàn)過程類似單樣本U檢驗(yàn)例2.7 有一批蔬菜種子的平均發(fā)芽率為0.85,現(xiàn)隨機(jī)抽取500粒,用種衣劑進(jìn)行浸種處理,結(jié)果有445粒發(fā)芽率,試檢驗(yàn)種衣劑對(duì)種子發(fā)芽有無效果。假設(shè) H0:p= p0 HA: pp0=0.05U=(p- p0)/ p =(445/500-0.85)/( 445/500(1-445/500)500)1/2 =2.5U0.05/2=1.96UU0.05/2接受HA=0.01U0.01/2=1.5758U2 =0.05 F=S12/S22 雙樣本統(tǒng)計(jì)推斷 FINV (df1,df2) 上尾檢驗(yàn) df1=n1-1 數(shù)據(jù)的類

12、型數(shù)據(jù)的類型 成組數(shù)據(jù)成組數(shù)據(jù)資料的特點(diǎn)是指兩個(gè)樣本的各個(gè)變量是從各自總體中抽取的,兩個(gè)樣本之間的變量沒有任何關(guān)聯(lián),即兩個(gè)抽樣樣本彼此獨(dú)立。這樣,不論兩樣本的容量是否相同,所得數(shù)據(jù)皆為成組數(shù)據(jù)。 成對(duì)數(shù)據(jù)成對(duì)數(shù)據(jù)資料的特點(diǎn)要求兩樣本間配偶成對(duì),每一對(duì)除隨機(jī)地給予不同處理外,其他試驗(yàn)條件應(yīng)盡量一致。成對(duì)數(shù)據(jù),由于同一配對(duì)內(nèi)兩個(gè)供試單位的試驗(yàn)條件非常接近,而不同配對(duì)間的條件差異又可以通過各個(gè)配對(duì)差數(shù)予以消除,因而,可以控制試驗(yàn)誤差,具有較高精確度。 1和 2 未知,但通過F檢驗(yàn)確認(rèn)1= 2時(shí),我們可以用等方差二樣本的t檢驗(yàn): t=(X1-X2)/(n1-1)S12+(n2-1)S22)/(n1+n

13、2-2)(1/n1+1/n2)1/2 當(dāng)MSe= (n1-1)S12+(n2-1)S22)/(n1+n2-2)時(shí) t=(X1-X2)/(Se(1/n1+1/n2) 當(dāng)Sx1-x2=(MSe(1/n1+1/n2) 時(shí)t=(X1-X2)/ Sx1-x2 df=n1+n2-2合并方差Sx1-x2 =(S12/n1+S22/n2 )1/2 (N50時(shí)) 例2.8 用高蛋白和低蛋白兩種飼料飼養(yǎng)一月齡大白鼠,在三個(gè)月時(shí),測(cè)定兩組大白鼠的增重量(g),兩組的數(shù)據(jù)分別為: 高蛋白組:134,146,106,119,124,161,107,83,113,129,97,123; 低蛋白組:70,118,101,8

14、5,107,132,94 試問兩種飼料飼養(yǎng)的大白鼠增重量是否有差別? (1) F檢驗(yàn) H0:1=2 HA:12 =0.05 F=S12/S22 =425.3333/258.7879 =1.6436 F0.05=3.0946 FX2 =0.05 t=(X1-X2)/ Sx1-x2 =1.5732 t0.05=1.7396 t0 =0.05 d=(X1-X2)/(Sd/n)1/2 =4.2015 d0.05=1.8946 dd0.05 接受HA假設(shè) =0.01 d0.01=2.9980 dd0.01 接受HA假設(shè) 兩組飼料對(duì)試驗(yàn)動(dòng)物肝中維生素A含量的作用差異極其顯著 雙樣本統(tǒng)計(jì)推斷 例 2.13

15、某豬場(chǎng)從10窩豬仔中隨機(jī)抽取2頭,并隨機(jī)分配到兩個(gè)飼料組,進(jìn)行飼料對(duì)比試驗(yàn),試驗(yàn)30天后,其增重結(jié)果如下,試檢驗(yàn)兩種飼料飼喂的仔豬平均增重差異是否顯著?飼料1 10.0 11.2 12.1 10.5 11.1 9.8 10.8 12.5 12.0 9.9飼料2 10.5 10.5 11.8 9.5 12.0 8.8 9.7 11.2 11.0 9.0 參數(shù)估計(jì)是統(tǒng)計(jì)推斷的另一個(gè)方面,它是指由樣本結(jié)果對(duì)總體參數(shù)在一定概率水平下所作出的估計(jì)。參數(shù)估計(jì)包括區(qū)間估計(jì)和點(diǎn)估計(jì)。 點(diǎn)估計(jì): 利用樣本構(gòu)造一個(gè)統(tǒng)計(jì)量,用它來作為總體參數(shù)的估計(jì)值. 點(diǎn)估計(jì)的方法很多,常用的矩估計(jì)法,最大似然法,最小二乘法等.

16、當(dāng) 算術(shù)平均值: X=xi/n I=1,2,3,n ,樣本方差 S2= (xi-X)2 /(n-1)時(shí),總體參數(shù)2=S2, =X 為無偏估計(jì). 區(qū)間估計(jì): 是以一定置信度對(duì)參數(shù)真值得可能范圍進(jìn)行估計(jì). 1 平均值的區(qū)間估計(jì) 已知 (X-U/2/n 1/2 , X+U/2/n 1/2 ) 未知 (X-t/2S/n 1/2 , X+t/2S/n 1/2 ) 2 方差2的區(qū)間估計(jì) ( (n-1)S2/X2 1-/2 , (n-1)S2/X2 /2 ) 例416 用高蛋白和低蛋白兩種飼料飼養(yǎng)一月齡大白鼠,在三個(gè)月時(shí),測(cè)定兩組大白鼠的增重量(g),兩組的數(shù)據(jù)分別為: 高蛋白組:134,146,106,1

17、19,124,161,107,83,113,129,97,123; 低蛋白組:70,118,101,85,107,132,94。 進(jìn)行置信度為95時(shí)兩種蛋白飼料飼養(yǎng)的大白鼠增重的差數(shù)區(qū)間估計(jì)和點(diǎn)估計(jì)。 雙樣本統(tǒng)計(jì)推斷 前面所介紹的樣本平均數(shù)的U檢驗(yàn)、t檢驗(yàn)以及樣本方差的同質(zhì)性檢驗(yàn)都是在已知總體參數(shù)值的情況下所進(jìn)行的檢驗(yàn),因此,也叫參數(shù)檢驗(yàn)法。參數(shù)檢驗(yàn)法所要求的條件比較高,一般需要了解總體的分布。 但在生物學(xué)研究中,有許多情況是不知道總體的分布特性的,這時(shí),進(jìn)行假設(shè)檢驗(yàn)就需要采用非參數(shù)檢驗(yàn)法。 非參數(shù)檢驗(yàn)比較簡單、直觀,且計(jì)算量較小,但靈敏度要低于參數(shù)檢驗(yàn),在精度要求不高時(shí)比較適用。 例 4 2

18、4為了比較甲、乙兩藥劑治療某種疾病的療效,各進(jìn)行10組試驗(yàn),其治愈率()分別為: 甲藥劑: 94,88,83, 92,87, 95, 90, 90,86,84; 乙藥劑:86,84,85,78,76,82,83,84,82,83。 試比較兩種藥劑的療效有無顯著差異。 符號(hào)檢驗(yàn)法有許多優(yōu)點(diǎn),但也有不足之處,比如要求兩樣本的數(shù)據(jù)必須一一對(duì)應(yīng),另外符號(hào)檢驗(yàn)只是簡單地比較這些數(shù)的大小,而不管具體數(shù)字,因此必然損失了許多可利用的信息。 秩和檢驗(yàn)法從一定程度上克服了符號(hào)檢驗(yàn)法的不足。 設(shè)有容量分別為n1 和n2的兩個(gè)樣本(n1 n2),我們希望檢驗(yàn)這兩個(gè)樣本是否來自于同一個(gè)總體。首先將這兩個(gè)樣本合在一起按

19、數(shù)字從小到大依次進(jìn)行編號(hào),共有n1+n2=n個(gè)序號(hào),在秩和檢驗(yàn)法中,每個(gè)序號(hào)就是它對(duì)應(yīng)數(shù)據(jù)的秩。這樣,我們就用秩1,2,n來代替原始的n個(gè)數(shù)據(jù)。如果兩個(gè)樣本所屬總體的均值沒有差異,那么對(duì)應(yīng)于第一個(gè)樣本的秩的和與對(duì)應(yīng)于第二樣本的秩的和應(yīng)該大致相等。如果一個(gè)樣本的秩和明顯小于另一樣本,這時(shí),就需要計(jì)算 P(秩和= Q)=p0。假設(shè) H0:兩總體的平均數(shù)相等,如果P0a,則否定HO;如果P0=a,則接受H0。 下面通過具體例子來介紹秧和檢驗(yàn)的程序。 下面通過具體例子來介紹秩和檢驗(yàn)的程序。 例425用甲、乙兩種方法進(jìn)行對(duì)蝦育苗試驗(yàn),甲、乙兩種方法均用5個(gè)小池,池子大小水體都相同,每池放卵均為250萬粒

20、,最后出池檢查孵出的仔蝦數(shù)目如下: 方法甲(萬尾):148,143,138,145,142; 方法乙(萬尾):139,136,141,133,140。 試檢驗(yàn)方法甲孵出的蝦苗數(shù)是否明顯超過方法乙。用秩和檢驗(yàn)法來解此題。 根據(jù)秩和檢驗(yàn)表(附表7),查出秩和臨界值T1和T2,進(jìn)行比較,作出推斷。 如果T1TT2 則接受H0;如果T=T2,則否定H0,接受HA 。 如上例中,T=18,在a= 0.05下,當(dāng)n1=5,n2=5時(shí)的秩和檢驗(yàn)區(qū)間為(T1 =19,T2=36),T=T1,因此認(rèn)為方法甲孵出仔蝦數(shù)顯著高于方法乙。 在使用秩和檢驗(yàn)表時(shí),只適用n1=10、n2ua,故否定H0,接受HA,推斷A、

21、B兩種殺蟲劑的效果有顯著差異。 例 4.27 調(diào)查水稻不同插秧期的每穗結(jié)實(shí)粒數(shù)如下: 6月4日:31,84,71,38,46,46,54,44,88,24,45,89; 6月17日:31,44,65,32,40,53,54,60,34,49,52。 試檢驗(yàn)兩插秧期對(duì)水稻結(jié)實(shí)粒數(shù)有無影響? 前章詳細(xì)講述了樣本平均數(shù)和樣本頻率的假設(shè)檢,這些都是針對(duì)計(jì)量資料即連續(xù)型資料來進(jìn)行檢驗(yàn)的。 對(duì)計(jì)數(shù)資料和屬性資料,即離散型資料的假設(shè)檢驗(yàn)通常都采用X2檢驗(yàn)檢驗(yàn)。計(jì)數(shù)資料和屬性資料的X2檢驗(yàn),一般有兩種類型。 一類是適合性檢驗(yàn),這種方法是對(duì)樣本的理論數(shù)先通過一定的理論分布推算出來,然后用實(shí)際觀測(cè)值與理論數(shù)比較,

22、從而得出實(shí)際觀測(cè)值與理論數(shù)之間是否吻合,因此適合性檢驗(yàn)也叫吻合度檢驗(yàn)吻合度檢驗(yàn)。 另一類是獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn),是研究兩個(gè)或兩個(gè)以上屬性的計(jì)數(shù)資料或?qū)傩再Y料間是相互獨(dú)立的或是相互聯(lián)系的,這時(shí)可以假設(shè)所觀測(cè)的各屬性之間沒有關(guān)聯(lián),然后證明這種無關(guān)聯(lián)的假設(shè)是否成立。 從前章中知道,X2的原意是從方差為2的正態(tài)總體中,隨機(jī)抽取含量為n的樣本,計(jì)算出樣本方差S2 。在研究樣本方差的分布時(shí),通常將它標(biāo)準(zhǔn)化,得到一個(gè)不帶有任何單位的純數(shù): 這是隨自由度df=k-1而變化的連續(xù)型分布。 對(duì)計(jì)數(shù)資料或?qū)傩再Y料進(jìn)行X2檢驗(yàn),其基本原理是應(yīng)用理論推算值與實(shí)際觀測(cè)值之間的偏離程度來決定其X2 值的大小。理論值與實(shí)際值

23、之間偏差越大,越不符合,偏差越小,越趨于符合,若兩值完全相等時(shí),表明理論值與實(shí)際值完全符合。 在計(jì)算理論推算值E與實(shí)際觀測(cè)值O之間的符合程度時(shí),最簡單的方法是比較兩者差數(shù)的大小,但由于OE有正有負(fù),則(O E)趨近于零,不能真實(shí)地反映理論推算值與實(shí)際觀測(cè)值差值的大小,故采用(O一 E)2,這樣就可以消除負(fù)號(hào)的影響。實(shí)際觀測(cè)值與理論推算值相差越大,則(OE)2也越大,反之亦然。由實(shí)際觀測(cè)值與理論推算值差的平方和似乎可以度量觀測(cè)值與理論值的相差程度,實(shí)際上這個(gè)絕對(duì)差異數(shù)還不足以表示相差程度。例如,在某動(dòng)物育種實(shí)驗(yàn)中,F(xiàn)2 代出現(xiàn)下面的分離: 顯然兩次實(shí)驗(yàn)的(OE)2 都是16,但二者不能等量齊觀。

24、對(duì)于K組資料,采用差的平方和使其轉(zhuǎn)化為相對(duì)比值,這個(gè)值便是X2 值,即: 式中,O為實(shí)際觀測(cè)值,E為理論推算值。 由公式可知,X2 最小值為0,隨著X2值的增大,觀測(cè)值與理論值符合度越來越小,所以X2的分布是由0到無限大的變數(shù)。實(shí)際上其符合程度由X2概率決定。由X2值表可知,X2值與概率P成反比,X2值越小,P值越大;X2越大,P值越小。因此,可由X2分布對(duì)計(jì)數(shù)資料或?qū)傩再Y料進(jìn)行假設(shè)檢驗(yàn)。X2檢驗(yàn)的步驟為: (1)提出無效假設(shè)H0:觀測(cè)值與理論值的差異由抽樣誤差引起,即觀測(cè)值=理論值。同時(shí)給出相應(yīng)的備擇假設(shè)HA:觀測(cè)值與理論值的差值不等于0,即觀測(cè)值與理論值不相等; (2)確定顯著水平 ,一般

25、可確定為 0.05或 0.01; (3)計(jì)算樣本的X2;求得各個(gè)理論次數(shù)Ei,并根據(jù)各實(shí)際次數(shù)Oi,代入計(jì)算樣本的X2。 (4)進(jìn)行統(tǒng)計(jì)推斷。由于df=K-1,查表值Xa2 。 如果計(jì)算X2 Xa2,即表明Pa,應(yīng)接受H0,否定HA,則表明在a顯著標(biāo)準(zhǔn)下理論值與實(shí)際值差異不顯著,二者之間的差異系由抽樣誤差引起。 如果實(shí)得 X2 Xa2,即表明Pa,應(yīng)否定H0,接受 HA,則表明在a顯著標(biāo)準(zhǔn)下理論值與實(shí)際值差異是顯著的,二者之間的差異是真實(shí)存在的。 由于X2分布是連續(xù)的,而計(jì)數(shù)資料是離散的,故所得的X2值是一個(gè)近似值。為了使離散型的計(jì)算結(jié)果適合于連續(xù)型分布給出的概率,在計(jì)算 X2時(shí)應(yīng)注意以下兩個(gè)

26、問題: (1)任何一組的理論次數(shù)Ei都必須大于5,如果Ei=2時(shí),由于Xc2與X2相差不大,所以一般不再進(jìn)行連續(xù)性矯正。 比較觀測(cè)數(shù)與理論數(shù)是否符合的假設(shè)檢驗(yàn)叫適合性檢驗(yàn),也稱吻合性檢驗(yàn)。例如,在遺傳學(xué)上,常用X2 檢驗(yàn)來測(cè)定所得的結(jié)果是否符合孟德爾分離規(guī)律、自由組合定律等。許多與已有理論比率進(jìn)行比較的資料,也需用X2來作適合性檢驗(yàn)。適合性檢驗(yàn)是生產(chǎn)檢驗(yàn)最常用的方法之一。 作適合性檢驗(yàn)時(shí),可提出無效假設(shè)從:OE=0,即認(rèn)為觀測(cè)數(shù)與理論數(shù)之間沒有差異,再計(jì)算樣本X2 值,根據(jù)規(guī)定的顯著性水平和自由度df從Xa2值表中查出Xa2 ,當(dāng)X2 Xa2時(shí),拒絕H0,接受HA;X2Xa2時(shí),接受HA。 例

27、 5.1 有一鯉魚遺傳試驗(yàn),以荷包紅鯉(紅色)與湘江野鯉(青灰色)雜交,其F2代獲得青灰色為1503, 紅色為99,問這一資料的實(shí)際觀察值是否符合孟德爾的青:紅=3:l的一對(duì)等位基因的遺傳規(guī)律? 本例為判斷實(shí)際觀察值與理論比率是否相符的問題,屬于典型的兩組數(shù)據(jù)的適合性檢驗(yàn)問題。 (1)H0:鯉魚體色已分離符合3:1比率; HA:鯉魚體色F2分離不符合3:1比率; (2)取顯著水平 a=0.05; (3)計(jì)算統(tǒng)計(jì)數(shù)X2:由于該資料只有K=2組,故自由度df=K-1=2-1=1,因而計(jì)算X2時(shí)需要進(jìn)行連續(xù)性矯正。 (4)查 X2值表,當(dāng) df=1時(shí),Xa2=3.840?,F(xiàn)實(shí)得 Xc2= 301.

28、63,遠(yuǎn)大于 Xa2,故應(yīng)否定H0,接受HA;即認(rèn)為鯉魚體色F2分離不符合3:1比率。 遺傳學(xué)中,有許多顯、隱性比率可以劃分為兩組的資料,如欲測(cè)其與某種理論比率。 適合性,則X2值可用表53中的簡式進(jìn)行計(jì)算。 例5-2 進(jìn)行大豆花色的遺傳研究,共觀測(cè)F2代289株,其中紫色208株,白色81,試檢驗(yàn)大豆花色分離是否符合3:l的分離規(guī)律? (1) H0:大豆花色F2分離符合3:1比率; HA:大豆花色地分離不符合3:1比率; (2)取顯著水平 a= 0.05; (3)由表53計(jì)算統(tǒng)計(jì)數(shù)X2值; 例53孟德爾用豌豆的兩對(duì)相對(duì)性狀進(jìn)行雜交實(shí)驗(yàn),黃色圓滑種子與綠色皺縮種子的豌豆雜交后,F(xiàn)2代分離的情況為:黃圓315粒,黃皺101粒,綠圓108粒,綠皺32粒,共556粒,問此結(jié)果是否符合自由組合規(guī)律? 對(duì)于資料組數(shù)多于兩組的X2值,還可通過下面簡式進(jìn)行計(jì)算: 式中,Oi為第i組的實(shí)際觀測(cè)數(shù),pi為第i組的理論比率,總次數(shù)記為n。 對(duì)于例5.3中兩對(duì)等位基因F2的分離,按9:3:3:1的自由組合分離比率,計(jì)算如下: 獨(dú)立性檢驗(yàn)是研究兩個(gè)或兩個(gè)以上因子彼此之間是獨(dú)立的還是相互影響的一類統(tǒng)計(jì)方法。例如,慢性氣管炎和吸煙量有無關(guān)系,若無關(guān)系則說明兩者是獨(dú)立的,若有關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論