版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、生生 物物 統(tǒng)統(tǒng) 計計 與與 實實 驗驗 設設 計計Biological Statistics And Experimental Designs如果一個人說他如果一個人說他從來從來沒有說過謊。他能夠沒有說過謊。他能夠證明證明嗎?要證明他沒有說過謊,他必須出嗎?要證明他沒有說過謊,他必須出示他從小到大示他從小到大每一時刻每一時刻的錄音錄像,所有的錄音錄像,所有書寫的東西等等,還要證明這些物證是完書寫的東西等等,還要證明這些物證是完全的、真實的、沒有間斷的。這簡直是不全的、真實的、沒有間斷的。這簡直是不可能的。即使他找到一些證人,比如他的可能的。即使他找到一些證人,比如他的同學、家人和同事,那也只
2、能夠證明在那同學、家人和同事,那也只能夠證明在那些證人在場的某些片刻,他沒有被聽到說些證人在場的某些片刻,他沒有被聽到說謊。謊。反過來,如果要反過來,如果要證明證明這個人這個人說過說過謊謊很容易,只要有很容易,只要有一次一次被抓住就被抓住就足夠了。足夠了。企圖肯定什么事物很難,而否定企圖肯定什么事物很難,而否定卻要相對容易得多卻要相對容易得多。這就是假設檢驗背后的哲學。這就是假設檢驗背后的哲學。區(qū)間估計與假設檢驗的基本區(qū)別區(qū)間估計與假設檢驗的基本區(qū)別上一章中討論了置信區(qū)間的估計方法。它是利用上一章中討論了置信區(qū)間的估計方法。它是利用樣本數(shù)據(jù),以抽樣總體的分布為理論基礎,用一樣本數(shù)據(jù),以抽樣總體
3、的分布為理論基礎,用一定的概率保證來計算出原總體中未知參數(shù)的區(qū)間定的概率保證來計算出原總體中未知參數(shù)的區(qū)間范圍。特別值得注意的是:范圍。特別值得注意的是:在作區(qū)間估計之前,在作區(qū)間估計之前,我們對所要估計的參數(shù)是一無所知的我們對所要估計的參數(shù)是一無所知的。而在這一章中,我們所要做的工作是,先對要而在這一章中,我們所要做的工作是,先對要研究的參數(shù)作一個假設,然后去檢驗這個假設研究的參數(shù)作一個假設,然后去檢驗這個假設是否正確。因此是否正確。因此假設檢驗對于所研究的參數(shù)總假設檢驗對于所研究的參數(shù)總是先有一個假設的值。是先有一個假設的值。這也是這兩種方法最基本的區(qū)別。這也是這兩種方法最基本的區(qū)別。假設
4、檢驗假設檢驗又叫又叫顯著性檢驗顯著性檢驗是統(tǒng)計學中的一是統(tǒng)計學中的一個重要內容個重要內容 。 顯著性檢驗的方法很多顯著性檢驗的方法很多 ,常用的有,常用的有u檢檢驗、驗、t檢驗、檢驗、F檢驗和檢驗和 2檢驗等。盡管這些檢驗等。盡管這些檢驗方法的使用條件及用途不同,但檢驗檢驗方法的使用條件及用途不同,但檢驗的基本原理是相同的。的基本原理是相同的。 6它是利用它是利用小概率小概率反證法反證法思想,從問題的思想,從問題的對立面對立面(H0)出發(fā)間接判斷要解決的問題出發(fā)間接判斷要解決的問題(H1)是否成立。然后在是否成立。然后在H0成立的條件下成立的條件下計算檢驗統(tǒng)計量,最后獲得計算檢驗統(tǒng)計量,最后獲
5、得P值來判斷值來判斷。 假設檢驗假設檢驗基本思想基本思想7問題實質上都是希望通過樣本統(tǒng)計量與總體參數(shù)的差別,或兩個樣本統(tǒng)計量的差別,來推斷總體參數(shù)是否不同。這種識別的過程,就是本章介紹的假設檢驗(hypothesis test)。 8假設檢驗在統(tǒng)計方法中的假設檢驗在統(tǒng)計方法中的地位地位 統(tǒng)計方法統(tǒng)計方法描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計參數(shù)估計參數(shù)估計假設檢驗假設檢驗9第一節(jié)第一節(jié) 統(tǒng)計假設檢驗的統(tǒng)計假設檢驗的基本原理基本原理 如,某地進行了兩個水稻品種對比試驗,在如,某地進行了兩個水稻品種對比試驗,在相相同條件下同條件下,兩個水稻品種分別種植,兩個水稻品種分別種植10個小區(qū),個小區(qū),獲得兩個水
6、稻品種的平均產(chǎn)量為獲得兩個水稻品種的平均產(chǎn)量為: 我們能否根據(jù)我們能否根據(jù) 就判定這兩個水稻就判定這兩個水稻品種平均產(chǎn)量不同?結論是,品種平均產(chǎn)量不同?結論是,不一定不一定。1510 x 2500 x 1210 xx1210 xx因為兩個水稻品種平均產(chǎn)量因為兩個水稻品種平均產(chǎn)量 、都、都是從試驗種植的是從試驗種植的10個小區(qū)獲得,僅是兩個品個小區(qū)獲得,僅是兩個品種有關總體平均數(shù)種有關總體平均數(shù) 的的估計值估計值。由于存。由于存在試驗誤差在試驗誤差 ,樣本平均數(shù)并不等于總體平均,樣本平均數(shù)并不等于總體平均數(shù)數(shù) ,樣本平均數(shù)包含樣本平均數(shù)包含總體平均數(shù)總體平均數(shù)與與試驗誤差試驗誤差二部分二部分,即
7、,即1x2x12, 111x222x 于是,于是, 121212()()xx其中,其中, 為為試驗的試驗的表面表面差異差異, 為為試驗的試驗的真實真實差異差異, 為為試驗誤差試驗誤差。12()xx12()12()表明,試驗的表面差異表明,試驗的表面差異 是由兩部分組是由兩部分組成:成: 一部分是一部分是試驗的真實差異試驗的真實差異 ; 另一部分是另一部分是試驗誤差試驗誤差 。 雖然真實差異雖然真實差異 未知,但試驗的表面差異未知,但試驗的表面差異 是可以計算的,借助數(shù)理統(tǒng)計方法可以對試驗誤差作出是可以計算的,借助數(shù)理統(tǒng)計方法可以對試驗誤差作出估計。所以,估計。所以,可將試驗的表面差異可將試驗的
8、表面差異 與試驗誤差與試驗誤差相比較相比較間接推斷間接推斷真實差異真實差異 是否存在是否存在,即進行差異,即進行差異顯著性檢驗。顯著性檢驗。12()xx12()12()12()12()xx12()xx12()顯著性檢驗的顯著性檢驗的目的目的在于判明,試驗的表面在于判明,試驗的表面差異差異 主要是由試驗的真實差異主要是由試驗的真實差異 造成造成的,還是由試驗誤差的,還是由試驗誤差 造成的,從而得到造成的,從而得到可靠的結論。可靠的結論。12()xx12()12()二、顯著性檢驗的二、顯著性檢驗的步驟步驟【例例31】 已知某品種玉米單穗重已知某品種玉米單穗重N(300,9.52),即單穗重總體平均
9、數(shù)),即單穗重總體平均數(shù) 300g,標準差標準差9.5g。在種植過程中噴灑了某種。在種植過程中噴灑了某種藥劑的植株中隨機抽取藥劑的植株中隨機抽取9個果穗個果穗 ,測得平均單,測得平均單穗重穗重 308g,試問這種藥劑對該品種玉,試問這種藥劑對該品種玉米的平均單穗重米的平均單穗重有無真實影響有無真實影響?x0 x (一)提出假設(一)提出假設 000 00()x首先對樣本所在的首先對樣本所在的總體總體作一個作一個假設假設。假設噴。假設噴灑了藥劑的玉米單穗重總體平均數(shù)與原灑了藥劑的玉米單穗重總體平均數(shù)與原來的玉米單穗重總體平均數(shù)之間來的玉米單穗重總體平均數(shù)之間沒有沒有真真實差異實差異,即或。也就是
10、假設,即或。也就是假設表面差異表面差異 是由是由抽樣誤差抽樣誤差造成的。造成的。這種假設通常稱為這種假設通常稱為無效無效假設假設或或零零假設假設,記,記為為 。無效假設是待檢驗的假設,它有。無效假設是待檢驗的假設,它有可能被接受,也有可能被否定。可能被接受,也有可能被否定。 相應地還要有一個對應假設,相應地還要有一個對應假設, 稱為稱為備擇備擇假設假設。備擇假設是在無效假設被否定時備擇假設是在無效假設被否定時 ,準備接受的,準備接受的假設,記為假設,記為 或或 。 通過檢驗,若否定無效假設,我們就接受備通過檢驗,若否定無效假設,我們就接受備擇假設。此外,樣本頻率、變異數(shù)以及多個平擇假設。此外,
11、樣本頻率、變異數(shù)以及多個平均數(shù)的假設檢驗,也應根據(jù)試驗目的提出無效均數(shù)的假設檢驗,也應根據(jù)試驗目的提出無效假設和備則假設。假設和備則假設。00:H000:AH19(二)確定顯著水平(二)確定顯著水平 在進行無效假設和備擇假設后,要確定一在進行無效假設和備擇假設后,要確定一個個否定否定H0的的概率標準概率標準,這個概率標準叫顯,這個概率標準叫顯著水平(著水平(significance level)或概率水平或概率水平(probability level),記作,記作。 是人為規(guī)是人為規(guī)定的定的小概率小概率界限界限,生物統(tǒng)計學中常取,生物統(tǒng)計學中常取0.05和和0.01兩個顯著水平。兩個顯著水平。
12、 (三)計算概率(三)計算概率 在假定無效假設成立的前提下,根據(jù)所檢驗在假定無效假設成立的前提下,根據(jù)所檢驗的統(tǒng)計數(shù)的的統(tǒng)計數(shù)的抽樣分布抽樣分布,計算表面差異,計算表面差異 是由是由抽樣抽樣誤差誤差造成的造成的概率概率。0()x本例是在假定無效假設本例是在假定無效假設 成立的前成立的前提下,研究在提下,研究在 N(300,9.52)這一已知)這一已知正態(tài)總體中抽樣所獲得的樣本平均數(shù)正態(tài)總體中抽樣所獲得的樣本平均數(shù) 的分布。的分布。00:Hxx21若若 ,則樣本平均,則樣本平均數(shù)數(shù) , , ,將其標準化,將其標準化,得得2( ,)xN 2(,)xxxN xxn0 xxxxxxun 本例,本例,
13、得得09,308300nxgg9.5g03083002.5269.59xun下面估計下面估計|u|2.526的的兩尾概率兩尾概率,即估計,即估計P(|u |2.526)是多少?)是多少? 我們知道,兩尾概率為我們知道,兩尾概率為0.05的臨界值為的臨界值為 =1.96,兩尾概率為,兩尾概率為0.01的臨界的臨界 值為值為 =2.58,即:,即:0.01uP(| |1.96)= P( 1.96)+ P( -1.96) =0.05 0.05uuuuuu P(| |2.58)= P( 2.58)+ P( -2.58) =0.01uuu根據(jù)樣本數(shù)據(jù)計算所得的根據(jù)樣本數(shù)據(jù)計算所得的 值為值為2.526,
14、介,介于兩個臨界于兩個臨界 值之間,即:值之間,即: 2.526uu0.05u0.01u所以,所以,| |2.526的概率的概率P介于介于0.01和和0.05之間,即之間,即 0.01 p 0.05 說明假定說明假定表面差異表面差異( )是由抽樣誤)是由抽樣誤差造成的概率在差造成的概率在0.010.05之間之間(小概率取值小概率取值范圍內范圍內)。u0 x ( (四四) )統(tǒng)計推斷統(tǒng)計推斷 根據(jù)小概率事件實際不可能性原理作根據(jù)小概率事件實際不可能性原理作出否定或接受無效假設的推斷。出否定或接受無效假設的推斷。 根據(jù)這一原理根據(jù)這一原理 ,當表面差異是抽樣誤差,當表面差異是抽樣誤差的概率在小于的
15、概率在小于0.05( )時)時 ,可以認為在一,可以認為在一次抽樣中表面差異是抽樣誤差實際上是不可能次抽樣中表面差異是抽樣誤差實際上是不可能的,因而的,因而否定否定原先所作的無效假設原先所作的無效假設H0: ,接受備擇假設接受備擇假設HA: , 即認為存在真實即認為存在真實差異。差異。 當表面差異是抽樣誤差的概率大于當表面差異是抽樣誤差的概率大于0.05( )時,說明無效假設)時,說明無效假設H0: 成立的成立的可能性大,不能被否定,因而也就不能接受備可能性大,不能被否定,因而也就不能接受備擇假設擇假設HA: 。0000顯著性檢驗的結果表明:顯著性檢驗的結果表明: 本例的樣本平均數(shù)與原總體平均
16、數(shù)之間本例的樣本平均數(shù)與原總體平均數(shù)之間的的表面差異表面差異( ) 除包含抽樣誤差外,除包含抽樣誤差外,還還包含真實差異包含真實差異( ) , 即噴灑了藥劑即噴灑了藥劑的玉米單穗重總體平均數(shù)的玉米單穗重總體平均數(shù) 與原來的玉米與原來的玉米單穗重總體平均數(shù)單穗重總體平均數(shù) 不同。不同。0 x0028 綜上所述,顯著性檢驗,從提出無效假綜上所述,顯著性檢驗,從提出無效假設與備擇假設,到根據(jù)小概率事件實際不可設與備擇假設,到根據(jù)小概率事件實際不可能性原理來否定或接受無效假設,這一過程能性原理來否定或接受無效假設,這一過程實際上是應用所謂實際上是應用所謂“概率性質的概率性質的反證法反證法”對對樣本所屬
17、總體所作的無效假設的統(tǒng)計推斷。樣本所屬總體所作的無效假設的統(tǒng)計推斷。 上述顯著性檢驗利用了上述顯著性檢驗利用了 分布來估計出分布來估計出 u 2.526的兩尾概率,所以的兩尾概率,所以稱為稱為 檢驗檢驗. uu29假設檢驗的假設檢驗的步驟步驟可概括為:可概括為:(1)對樣本所屬總體提出無效假設)對樣本所屬總體提出無效假設H0和備和備擇假設擇假設HA;(2)確定檢驗的顯著水平)確定檢驗的顯著水平;(3)在)在H0正確的前提下,根據(jù)抽樣分布的正確的前提下,根據(jù)抽樣分布的統(tǒng)計數(shù),進行假設檢驗的概率計算;統(tǒng)計數(shù),進行假設檢驗的概率計算;(4)根據(jù)顯著水平)根據(jù)顯著水平 的統(tǒng)計數(shù)(如的統(tǒng)計數(shù)(如u值)臨
18、值)臨界值,進行差異是否顯著的推斷。界值,進行差異是否顯著的推斷。三、顯著水平與兩種類型的錯誤三、顯著水平與兩種類型的錯誤 ( (一一) )顯著水平顯著水平 用來否定或接受無效假設的概率標準叫用來否定或接受無效假設的概率標準叫顯著水平顯著水平,記作。,記作。 在生物學研究中常取在生物學研究中常取=0.05,稱,稱 為為 5% 顯顯 著著 水水 平;平; 或或=0.01,稱,稱 為為 1% 顯顯 著著 水水 平平 或或 極顯著極顯著水平。水平。 對于上述例子的檢驗來說,若對于上述例子的檢驗來說,若 u 1.96 ,則說明試驗的表面差異屬于試驗誤差,則說明試驗的表面差異屬于試驗誤差的概率的概率p0
19、.05,即表面差異屬于試驗誤差的,即表面差異屬于試驗誤差的可能性大,不能否定。統(tǒng)計學上把可能性大,不能否定。統(tǒng)計學上把這一檢驗結果表述為:這一檢驗結果表述為: “總體平均數(shù)總體平均數(shù) 與與差異不顯著差異不顯著”,在計算所得的,在計算所得的 u 值的右上方標值的右上方標記記“”或不標記符號;或不標記符號;u00:H0ns若若|,則說明試驗的表,則說明試驗的表面差異屬于試驗誤差的概率面差異屬于試驗誤差的概率p在在0.010.05之間,即之間,即0.01p0.05,表面差異,表面差異 屬屬 于于 試試 驗誤差的可能性較小,應否定驗誤差的可能性較小,應否定H0:,接受,接受HA:。統(tǒng)計學上把這一檢:。
20、統(tǒng)計學上把這一檢驗結果表述為:驗結果表述為:“總體平均數(shù)總體平均數(shù)與與 差異顯著差異顯著 ”,在計算所得的值的右上,在計算所得的值的右上方標記方標記“*”;1.96u2.58000u若若|2.58,則說明試驗的表面差異屬,則說明試驗的表面差異屬于試驗誤差的概率于試驗誤差的概率 p 不超過不超過 0.01 ,即,即 p 0.01 ,表面差異屬于試驗誤差的可能性更小,表面差異屬于試驗誤差的可能性更小,應否定應否定H0:,接受,接受HA:。統(tǒng)計學。統(tǒng)計學上把這一檢驗結果表述為:上把這一檢驗結果表述為: “總體平均數(shù)總體平均數(shù)與與差異差異極極顯著顯著 ” , 在計算所得的在計算所得的 值的值的右上方標
21、記右上方標記“* *”。u000u可以看到,是否否定無效可以看到,是否否定無效假設假設 ,是,是用實際計算出的檢驗統(tǒng)計數(shù)的用實際計算出的檢驗統(tǒng)計數(shù)的絕對值絕對值與顯著水與顯著水平對應的平對應的臨界值臨界值比較:比較: 若若|,則在,則在 水平上否定水平上否定 若若| ,則,則 不不 能能 在在 水水 平平 上上 否否定定 。00:Huu uuuuu00:H00:H 區(qū)間區(qū)間 和和 稱為水平稱為水平 上的上的否定域否定域,而區(qū)間,而區(qū)間 則稱為則稱為 水水平上的平上的接受域接受域。 , u ,u(,)uu因為在顯著性檢驗中,否定或接受無因為在顯著性檢驗中,否定或接受無效假設的依據(jù)是效假設的依據(jù)是
22、“小概率事件實際不可能小概率事件實際不可能性原理性原理”,所以我們下的結論不可能有百,所以我們下的結論不可能有百分之百的把握。分之百的把握。例如,經(jīng)例如,經(jīng) 檢驗獲得檢驗獲得“差異顯著差異顯著”的結論,的結論,我們有我們有95%的把握否定無效假設的把握否定無效假設H0,同時要冒,同時要冒5%下錯結論的風險;下錯結論的風險; 經(jīng)經(jīng) 檢驗獲得檢驗獲得“差異極差異極顯著顯著”的結論,我們有的結論,我們有99%的把握否定無效假的把握否定無效假設設H0,同時要冒,同時要冒1%下錯結論的風險;而經(jīng)下錯結論的風險;而經(jīng) 檢驗獲得檢驗獲得“差異不顯著差異不顯著”的結論,在統(tǒng)計學的結論,在統(tǒng)計學上是指上是指“沒
23、有理由沒有理由”否定無效假設否定無效假設H0,同樣也,同樣也要冒下錯結論的風險。要冒下錯結論的風險。uuu 顯著性檢驗可能出現(xiàn)兩種類型的錯誤:顯著性檢驗可能出現(xiàn)兩種類型的錯誤:類錯誤類錯誤 與與類錯誤。類錯誤。 類錯誤又稱為錯誤,就是把真實的類錯誤又稱為錯誤,就是把真實的差異錯判為是非真實的差異,即實際上差異錯判為是非真實的差異,即實際上H0正正確,檢驗結果為確,檢驗結果為否定否定H0。犯犯類型錯誤的可類型錯誤的可能性一般不會超過所選用的顯著水平能性一般不會超過所選用的顯著水平;類錯誤又稱為錯誤類錯誤又稱為錯誤 ,就是把非真實,就是把非真實的差異錯判為是真實的差異的差異錯判為是真實的差異 ,即
24、實際上,即實際上HA正確,檢驗結果卻正確,檢驗結果卻未能否定未能否定H0 。 犯犯類型類型錯誤的可能性記為錯誤的可能性記為,一般是隨著的,一般是隨著的減小或試驗誤差的增大而增大,所以減小或試驗誤差的增大而增大,所以越小或試驗誤差越大,就越容易將試驗的真越小或試驗誤差越大,就越容易將試驗的真實差異錯判為試驗誤差。實差異錯判為試驗誤差。00 顯著性檢驗的兩類錯誤歸納如下:顯著性檢驗的兩類錯誤歸納如下:表表3-1 顯著性檢驗的兩類錯誤顯著性檢驗的兩類錯誤假設檢驗的結果假設檢驗的結果 客觀實際客觀實際 拒絕拒絕 H0 “接受”“接受”H0 H0成立成立 I 型錯誤型錯誤( ) 推斷正確推斷正確(1 )
25、 H0不成立不成立 即即 H1成立成立 推斷正確推斷正確(1 ) II 型錯誤型錯誤( ) 因此,如果經(jīng)因此,如果經(jīng) 檢驗獲得檢驗獲得“差異顯著差異顯著”或或“差異極顯著差異極顯著”,我們有,我們有95%或或99%的把握的把握認為,認為, 與與 不相同,不相同, 判斷錯誤的可能性不判斷錯誤的可能性不超過超過5%或或1% ; 若經(jīng)若經(jīng) 檢驗獲得檢驗獲得 “差異不差異不顯著顯著”, 我們只能認為在本次試驗條件下,我們只能認為在本次試驗條件下, 與與 沒有差異的假設沒有差異的假設 H0: 未被否定未被否定,這有,這有兩種可能存在:兩種可能存在: 或者是或者是 與與 確實沒有差異,確實沒有差異, 或者
26、是或者是 與與 有差異而因為試驗誤差大被掩有差異而因為試驗誤差大被掩蓋了蓋了。uu0000042因而,因而,不能不能僅憑統(tǒng)計推斷就簡單僅憑統(tǒng)計推斷就簡單地作出地作出絕對絕對肯定或絕對否定的結論??隙ɑ蚪^對否定的結論。 “有有很大很大的可靠性,但有的可靠性,但有一定一定的錯的錯誤率誤率” 這是統(tǒng)計推斷的基本特點。這是統(tǒng)計推斷的基本特點。 為了降低犯兩類錯誤的概率,一般從為了降低犯兩類錯誤的概率,一般從選取選取適適當當?shù)娘@著水平的顯著水平和和增加增加試驗重復次數(shù)試驗重復次數(shù)來考慮。來考慮。因為選取數(shù)值小的顯著水平值可以降低犯因為選取數(shù)值小的顯著水平值可以降低犯類型錯誤的概率,但與此同時也增大了犯類
27、型錯誤的概率,但與此同時也增大了犯型型錯誤的概率,所以顯著水平值的選用要同時錯誤的概率,所以顯著水平值的選用要同時考慮到犯兩類錯誤的概率的大小??紤]到犯兩類錯誤的概率的大小。n44 減少(增加)減少(增加)I型錯誤型錯誤,將會,將會增加(減少)增加(減少)II型錯誤型錯誤增大增大n 同時降低同時降低 與與 與與 間的關系間的關系45 對于田間試驗,由于試驗條件不容易控對于田間試驗,由于試驗條件不容易控制完全一致,試驗誤差較大,制完全一致,試驗誤差較大, 為了降低犯為了降低犯型錯誤的概率,也有選取顯著水平為型錯誤的概率,也有選取顯著水平為0.10或或0.20的(注意,在選用這些顯著水平值時,的(
28、注意,在選用這些顯著水平值時,一定要予以注明)。一定要予以注明)。 通常采用通常采用適當增加試驗適當增加試驗處理的重復次數(shù)處理的重復次數(shù)(即樣本容量),(即樣本容量), 以降低試以降低試驗誤差,提高試驗的精確度,驗誤差,提高試驗的精確度, 降低犯降低犯型錯型錯誤的概率。誤的概率。46減少減少I型錯誤型錯誤的主要方法:假設檢驗時設定的主要方法:假設檢驗時設定 值值。減少減少II型錯誤型錯誤的主要方法:的主要方法:提高提高檢驗效能檢驗效能。提高提高檢驗效能的最有效方法:檢驗效能的最有效方法:增加樣本量增加樣本量。如何如何選擇合適的樣本量:選擇合適的樣本量:實驗設計實驗設計。 在在【例例31】中,對
29、應于無效假設中,對應于無效假設 H0:的備擇假設為的備擇假設為HA:。:。 HA實際實際上包含了或這兩種情況。此時,上包含了或這兩種情況。此時,在水平上否定域為和,對在水平上否定域為和,對稱地分配在分布曲線的兩側尾部,每側尾部稱地分配在分布曲線的兩側尾部,每側尾部的概率為的概率為 ,如,如圖圖3-1所示。這種所示。這種利用兩尾利用兩尾概率進行的檢驗叫兩尾檢驗概率進行的檢驗叫兩尾檢驗. 為為 水平兩水平兩尾檢驗的臨界值。尾檢驗的臨界值。四、四、兩兩尾檢驗與尾檢驗與一一尾檢驗尾檢驗0000, u ,uu/2u0u48圖3-1 雙側檢驗 /2 49 圖3-2 單側檢驗-150 圖3-2 單側檢驗-2
30、兩尾檢驗的兩尾檢驗的目的目的在于判斷在于判斷 與與 有無差異有無差異,而不考慮而不考慮 與與 誰大誰小。誰大誰小。00在有些情況下兩尾檢驗不一定符合實際在有些情況下兩尾檢驗不一定符合實際情況。情況。例如,目前我國大豆育種工作者認為,大例如,目前我國大豆育種工作者認為,大豆籽粒蛋白質含量豆籽粒蛋白質含量超過超過45%( )的品種為高)的品種為高蛋白品種。如果進行樣品含量檢測蛋白品種。如果進行樣品含量檢測 ,我們關心,我們關心的是的是 所在的總體平均數(shù)所在的總體平均數(shù) 大于大于 。 此時的無效假設仍為此時的無效假設仍為H0: ,但備擇假,但備擇假設則為設則為HA: 。這時否定域位于。這時否定域位于
31、 分布曲分布曲線的線的右尾右尾,即,即 。 例如當例如當 =0.05時,否定域為時,否定域為 。0 x000u,)u1.64,)又如,國家規(guī)定稻米中某種農藥成分的殘又如,國家規(guī)定稻米中某種農藥成分的殘留物含量應留物含量應低于低于0.1%( )。在抽檢中,我們)。在抽檢中,我們關心的是關心的是 所在的總體平均數(shù)所在的總體平均數(shù) 小于小于 (即該(即該品種屬于合格產(chǎn)品)。此時的無效假設仍為品種屬于合格產(chǎn)品)。此時的無效假設仍為H0: ,但備擇假設則為,但備擇假設則為HA: 。這。這 時時 否否 定定 域域 位位 于于 分分 布布 曲曲 線線 的的 左尾左尾,即即 。例如當。例如當 =0.05時,時
32、, 分布的否定分布的否定域為域為 ,見,見圖圖3-2。0 x000u(,u u(, 1.64 這種這種利用一尾概率進行的檢驗叫一尾檢驗利用一尾概率進行的檢驗叫一尾檢驗 。此時此時 為一尾檢驗的臨界為一尾檢驗的臨界 值。值。 一尾檢驗的一尾檢驗的 =兩尾檢驗的兩尾檢驗的 uuu2u例如,例如,一尾檢驗的一尾檢驗的=兩尾檢驗的兩尾檢驗的 =1.64=1.64, 0.05u0.10u0.01u0.02u實際應用中,如何選用兩尾檢驗或一尾檢實際應用中,如何選用兩尾檢驗或一尾檢驗,應根據(jù)專業(yè)的要求在試驗設計時就確定。驗,應根據(jù)專業(yè)的要求在試驗設計時就確定。 一般情況下,若事先不知道與誰大誰一般情況下,若
33、事先不知道與誰大誰小,只是為了檢驗與小,只是為了檢驗與 是否存在差異,則選是否存在差異,則選用兩尾檢驗;用兩尾檢驗; 如果憑借一定的專業(yè)知識和經(jīng)驗如果憑借一定的專業(yè)知識和經(jīng)驗推測推測 應小于(或大于)時,則選用一尾檢應小于(或大于)時,則選用一尾檢驗。驗。 000 第二節(jié)第二節(jié) 樣本平均數(shù)與總體樣本平均數(shù)與總體 平均數(shù)差異顯著性檢驗平均數(shù)差異顯著性檢驗 檢驗一個樣本平均數(shù)與已知的總體檢驗一個樣本平均數(shù)與已知的總體平均數(shù)是否有顯著差異,即平均數(shù)是否有顯著差異,即檢驗該樣本檢驗該樣本是否來自某一總體是否來自某一總體。已知的總體平均數(shù)。已知的總體平均數(shù)一般為一些公認的理論數(shù)值、經(jīng)驗數(shù)值或一般為一些公
34、認的理論數(shù)值、經(jīng)驗數(shù)值或期望數(shù)值。期望數(shù)值。x0057一、一、大樣本大樣本平均數(shù)的假設檢驗平均數(shù)的假設檢驗u檢驗檢驗 當總體方差當總體方差 已知,或者總體方差未已知,或者總體方差未知但樣本為知但樣本為大樣本大樣本(n30)時,樣)時,樣本平均數(shù)的分布服從于本平均數(shù)的分布服從于正態(tài)分布正態(tài)分布,標,標準化后則服從于標準正態(tài)分布,即準化后則服從于標準正態(tài)分布,即u分布。因此用分布。因此用u檢驗法進行假設檢驗。檢驗法進行假設檢驗。258(一)一個樣本平均數(shù)的(一)一個樣本平均數(shù)的u檢驗檢驗1.總體方差總體方差2已知時的檢驗已知時的檢驗例例 某漁場按常規(guī)方法所育鰱魚苗一月齡某漁場按常規(guī)方法所育鰱魚苗一
35、月齡的平均體長的平均體長7.25cm,標準差為,標準差為1.58cm,為提高魚苗質量,現(xiàn)采用一新方法進為提高魚苗質量,現(xiàn)采用一新方法進行育苗,一月齡時隨機抽取行育苗,一月齡時隨機抽取100尾進行尾進行測量,測得其平均體長為測量,測得其平均體長為7.65cm,試,試問新育苗方法與常規(guī)方法有無顯著差問新育苗方法與常規(guī)方法有無顯著差異?異?59檢驗步驟:檢驗步驟:(1)假設:)假設:H0: u u07.25cm HA: u u0(2)選取顯著水平)選取顯著水平 a0.05;(3)檢驗計算:)檢驗計算:1.580.1581007.657.252.5320.158xxnxu60(4)推斷:u分布中,當a
36、0.05時,u0.051.96。實得 u 1.96,P 0.05,故在0.05顯著水平上否定H0,接受HA,認為新育苗方法與常規(guī)方法有顯著差異。612.總體方差總體方差2未知時的檢驗未知時的檢驗 當總體方差當總體方差2未知時,只要未知時,只要樣本容量大樣本容量大于于30,可用樣本方差,可用樣本方差s2來代替總體方差來代替總體方差2,仍可用,仍可用u檢驗方法檢驗方法;xxssnxus62(二)(二)兩個兩個樣本樣本平均數(shù)比較的平均數(shù)比較的u檢驗檢驗 在兩個樣本方差在兩個樣本方差12和和22已知,或已知,或12和和22未知,未知,但兩個樣本都是但兩個樣本都是大樣本大樣本,即在,即在n130和和n2
37、30時,時,可用可用u檢驗檢驗方法。方法。 在進行兩個大樣本平均數(shù)的比較時,需要計算在進行兩個大樣本平均數(shù)的比較時,需要計算樣本平均數(shù)差數(shù)的標準誤樣本平均數(shù)差數(shù)的標準誤 和和u值,當兩個值,當兩個樣本方差樣本方差12和和22已知已知,兩個樣本平均數(shù)差數(shù)的,兩個樣本平均數(shù)差數(shù)的標準誤為:標準誤為:12xx63121212122212122221212221222212;3 .111;2xxxxxxxxnnnnnn1212()當時 , 式 ( 3 . 1 ) 則 為 :當 n= n= n 時 , 式 ( 3 . 1 ) 則 為 :當, n= n= n 時 , 式 ( 3 . 1 ) 則 為 :64
38、在假設Ho:1=2= 時,u值為:1212xxxxu當兩樣本方差當兩樣本方差未知未知時,由于兩個樣本都時,由于兩個樣本都是是大樣本大樣本,故可用樣本平均數(shù)差數(shù)的標,故可用樣本平均數(shù)差數(shù)的標準誤準誤 來代替來代替 。12xx12xxs65 例例:為了比較:為了比較“42-67*RRIM603”和和“42-67*PB86”兩個橡膠品種的割膠產(chǎn)量,兩品兩個橡膠品種的割膠產(chǎn)量,兩品種分別隨機抽樣種分別隨機抽樣55株和株和107株進行割膠,割株進行割膠,割膠平均產(chǎn)量分別為膠平均產(chǎn)量分別為95.4mL株株1和和77.6mL株株1,割膠產(chǎn)量的方差分別為,割膠產(chǎn)量的方差分別為936.6(mL株株1)和)和80
39、0.89 (mL株株1) ,試檢驗兩,試檢驗兩個橡膠個橡膠品種品種在割膠產(chǎn)量上是否有顯著在割膠產(chǎn)量上是否有顯著差別差別。661212221212120.010936.36 800.894.9515510795.4 77.63.954.9512.58,0.01,xxxxAsssnnxxusuupHH檢驗計算:推斷:現(xiàn)實得故否定接受,即兩個橡膠品種的割膠產(chǎn)量存在極顯著的差別。如果總體如果總體 未知未知、且為、且為小樣本小樣本(n 30),則用),則用t t檢驗法檢驗法。 2 t t 檢驗法,就是在顯著性檢驗時利用檢驗法,就是在顯著性檢驗時利用 t t分布進行概率計算的檢驗方法分布進行概率計算的檢驗
40、方法。當樣本容量n30且總體方差 未知時,檢驗樣本平均數(shù)與總體平均數(shù)的差異顯著性,就必須使用t檢驗。在生物學研究中,具有重要意義。2一個樣本的假設檢驗 是總體方差 未知,樣本容量n30的平均數(shù)是否屬于平均數(shù)為 總體的一種t檢驗方法。因為小樣本的S2和 相差較大,故202nsssxtxx,0遵循自由度df=n-1的t 分布均值均值的雙尾的雙尾 t 檢驗檢驗 ( 2 2 未知未知)1.假定條件假定條件總體為總體為正態(tài)分布正態(tài)分布2.使用使用t 統(tǒng)計量統(tǒng)計量) 1(0ntnsxt70 【例例3333】 晚稻良種汕優(yōu)晚稻良種汕優(yōu)63的千粒重的千粒重 27.5g。 現(xiàn)育成一高產(chǎn)品種協(xié)優(yōu)輻現(xiàn)育成一高產(chǎn)品種
41、協(xié)優(yōu)輻819,在在9個小區(qū)種植,得其千粒重為:個小區(qū)種植,得其千粒重為: 32.5、28.6、28.4、24.7、29.1、 27.2、29.8、33.3、29.7(g) 問新育成品種的千粒重與汕優(yōu)問新育成品種的千粒重與汕優(yōu)6363有無顯著有無顯著差異?差異?01 1、提出假設提出假設0H:027.5AH:27.5 2 2、 計算計算t t 值值 1dfn) 1(0ntnsxt 29.255xxn32.528.629.79222222() /1(263.3)32.528.629.799 153.5429 12.587xxnSn xS=Sn=2.5879=0.862 所以所以 0 xxts=29
42、.25527.50.862= 2.036= 2.036 3 3、統(tǒng)計推斷統(tǒng)計推斷 由由df=n-1=9-1=8查臨界查臨界t值,得:值,得: 計算所得的計算所得的 t0.05,故P5np5或者或者nq30nq30的條件時,可近似地采用的條件時,可近似地采用u u檢驗法,檢驗法,即正態(tài)近似法來進行顯著性檢驗;即正態(tài)近似法來進行顯著性檢驗;若若npnp和和nqnq均大于均大于3030,不必不必對對u u進行進行連續(xù)性矯正連續(xù)性矯正。 107 【例例3838】 用糯玉米和非糯玉米雜用糯玉米和非糯玉米雜交,預期交,預期F F1 1 植株上糯性花粉粒的百分率為植株上糯性花粉粒的百分率為 =0.50=0.
43、50?,F(xiàn)檢視?,F(xiàn)檢視150150?;ǚ郏门葱曰ǚ哿;ǚ?,得糯性花粉6868粒,糯性花粉粒百分率粒,糯性花粉粒百分率 =0.453=0.453,問此,問此結果和理論百分率結果和理論百分率 =0.50=0.50是否相符?是否相符? p0p0p108 本本 例例 的的糯性花粉粒百分率服從二項分布糯性花粉粒百分率服從二項分布,但樣本容量但樣本容量n=150n=150較大,較大,np=75 np=75 、nq=75nq=75均大于均大于5(5(注意,此處假定注意,此處假定 , 來計算來計算npnp和和nq)nq),所以采,所以采用用正態(tài)近似法正態(tài)近似法來進行顯著性檢驗;來進行顯著性檢驗; 且要回答且要
44、回答的問題是糯性花粉粒樣本百分率的問題是糯性花粉粒樣本百分率 =0.453 =0.453 與與理論百分率理論百分率 =0.50=0.50是否相符,是否相符, 故采用故采用兩兩尾尾u u檢驗檢驗;由于;由于np=75np=75、nq=75nq=75均大于均大于 3030,不必不必對對u u進行連續(xù)性矯正進行連續(xù)性矯正。 00.50pp00(1)0.50qqp p0p109檢驗步驟如下:檢驗步驟如下: 1 1、統(tǒng)計假設、統(tǒng)計假設H H0 0: H HA A:00.50pp00.50pp2 2、計算、計算u u值值 0pppu110其中其中, , 為樣本百分率,為樣本百分率, =0.5=0.5為已知
45、為已知總體百分率,總體百分率, 為為樣本百分率標準誤樣本百分率標準誤: p0p p0000(1)pp qppnn其中,其中,n n為樣本容量。為樣本容量。 111 本例,本例,680.453150p 00(1)0.5 (1 0.5)0.041150pppn于是,于是, 00.4530.500.041pppu1.146112 3 3、統(tǒng)計推斷、統(tǒng)計推斷 計算所得的計算所得的 ,故,故p p0.050.05,不能否定,不能否定H H0 0: ,表明糯,表明糯性花粉樣本百分率性花粉樣本百分率 0.453 0.453 和和 差異不顯著差異不顯著 ,可以認為糯性花粉粒樣本百分可以認為糯性花粉粒樣本百分率
46、率 =0.453=0.453所在的總體百分率所在的總體百分率 與理論百分與理論百分率率 =0.50=0.50相同相同。 u0.051.96u00.50pp p00.50p pp p0p113二、兩個樣本百分率差異顯著性檢驗二、兩個樣本百分率差異顯著性檢驗檢檢 驗驗 服服 從從 二二 項分布的兩個樣本百分項分布的兩個樣本百分率、差異是否顯著,其目的在于檢驗兩率、差異是否顯著,其目的在于檢驗兩個樣本百分率個樣本百分率 、 所在的兩個總體百分所在的兩個總體百分率、是否相同。率、是否相同。1 p2 p 1 p2 p1p2p 當兩樣本的當兩樣本的npnp、nqnq均大于均大于5 5時,可以采時,可以采用
47、正態(tài)近似法,即用正態(tài)近似法,即u u檢驗法進行檢驗;若兩檢驗法進行檢驗;若兩樣本的樣本的npnp和和nqnq均大于均大于3030,不必對,不必對u u進行連續(xù)進行連續(xù)性矯正。性矯正。 114 【例例3939】 調查春大豆品種調查春大豆品種 A A的的 120120個豆莢(個豆莢( =120=120) ,其,其 中中 有有 癟癟 莢莢3838莢莢(f f1 1=38=38),癟莢率),癟莢率31.7%31.7%( );調查春大);調查春大豆品種豆品種B B的的135135個豆莢(個豆莢( =135=135),其),其 中有中有癟莢癟莢5252莢(莢(f f2 2=52=52),癟莢率),癟莢率3
48、8.5%38.5%( )。)。試試 檢檢 驗驗 這兩個品種的癟莢率差異是否顯這兩個品種的癟莢率差異是否顯著?著?1n1 p2n2 p115 本例為服從二項分布的百分率資料,樣本例為服從二項分布的百分率資料,樣本容量較大,本容量較大, =120, =135,且,且1n1n11112042.360,(1)120 (1)77.60.3535400.3 3pnnqnp222135 0.35347.655,(1)135 (1 0.353)87.345n pn qnp116 均大于均大于5 (注意,假定注意,假定 成立,成立, 為合并樣本百分率,可以為合并樣本百分率,可以采采用正態(tài)近似法用正態(tài)近似法 ,即
49、,即u檢驗法進行顯著性檢檢驗法進行顯著性檢驗,要回答的問題是兩個品種的癟莢率差驗,要回答的問題是兩個品種的癟莢率差異是否顯著異是否顯著 ,故,故 采用兩尾采用兩尾u檢驗檢驗;由;由于于 , 均大于均大于30,不必不必對對u進行連續(xù)性矯正進行連續(xù)性矯正。 11 1,n p nq22,n p n q12ppp11 1,n p nq22,n p n q117 檢驗步驟如下:檢驗步驟如下: 1 1、統(tǒng)計假設、統(tǒng)計假設 H H0 0:;:;H HA A: 。12pp12pp2 2、計算、計算u u值值 1212ppSpup118其中,為兩個樣本其中,為兩個樣本百分率,為百分率,為樣本百分率差異標準誤樣本
50、百分率差異標準誤, 111 pfn222 pfn 12ppS121211()pppqSnn119為為合并樣本百分合并樣本百分率率p1122121212n pn pffpnnnn本例,本例,111380.317120fpn1201 10.3530.3530.6470.647222520.385135fpn38520.353120 135p q12112ppS1211()pqnn110.353 0.647 ()1201350.060 122于是,于是, u1212ppppS0.3170.3850.061.133 1233 3、統(tǒng)計推斷、統(tǒng)計推斷 由于計算所得的由于計算所得的 = 1.960.050
51、.05,不能否定,不能否定H H0 0: ,表明兩個品,表明兩個品種的癟莢率種的癟莢率差異不顯著差異不顯著,可以認為兩個品種可以認為兩個品種的癟莢率相同的癟莢率相同。u0.05u12pp124三、百分率資料顯著性檢驗的連續(xù)性矯正三、百分率資料顯著性檢驗的連續(xù)性矯正( (一一) ) 樣本樣本百分率與百分率與總體總體百分率差異顯著性檢驗百分率差異顯著性檢驗 的的連續(xù)性矯正連續(xù)性矯正 檢驗一個服從二項分布的樣本百分率與已檢驗一個服從二項分布的樣本百分率與已知的二項總體百分率差異是否顯著知的二項總體百分率差異是否顯著 ,當滿足,當滿足n n足夠大,足夠大,p p不過小,不過小,npnp和和nqnq均大
52、于均大于5 5的條件時,的條件時,可近似地采用可近似地采用 u u檢驗法,即正態(tài)近似法來進行檢驗法,即正態(tài)近似法來進行顯著性檢驗;如果此時顯著性檢驗;如果此時npnp和(或)和(或)nqnq小于或等小于或等于于3030,還須對,還須對u u進行進行連續(xù)性矯正連續(xù)性矯正。 125將連續(xù)性矯正后計算的值記為將連續(xù)性矯正后計算的值記為 cu0.50cpppun檢驗的其它步驟同檢驗的其它步驟同【例例3838】。 126( (二二) ) 兩個樣本百分率差異顯著性檢驗的兩個樣本百分率差異顯著性檢驗的連續(xù)性矯正連續(xù)性矯正 檢驗服從二項分布的兩個樣本百分率差檢驗服從二項分布的兩個樣本百分率差異是否顯著,當兩樣
53、本的異是否顯著,當兩樣本的npnp、nqnq均大于均大于5時,時,可以采用正態(tài)近似法,即可以采用正態(tài)近似法,即u u檢驗法進行檢驗;檢驗法進行檢驗;如果此時兩樣本的如果此時兩樣本的npnp和(或)和(或)nqnq小于或等于小于或等于3030,還須對,還須對u u進行連續(xù)性矯正進行連續(xù)性矯正。 1271211220.550.cppppuSnn檢驗的其它步驟同檢驗的其它步驟同【例例3939】。128【例例310310】調查大豆調查大豆A A品種品種2020莢,其中莢,其中三粒莢三粒莢1414莢,兩粒以下莢莢,兩粒以下莢 6 6莢,三粒莢百分莢,三粒莢百分率為率為0.700.70;B B品種品種2525莢,其中三粒莢莢,其中三粒莢7 7莢,兩莢,兩粒以下莢粒以下莢1818莢,三粒莢百分率為莢,三粒莢百分率為0.280.28。問兩。問兩 個大豆品種的三粒莢百分率差異是否顯著?個大豆品種的三粒莢百分率差異是否顯著?129本例本例 2020, 2525, 1n2n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國活血止痛散行業(yè)供需狀況發(fā)展戰(zhàn)略規(guī)劃分析報告
- 2024-2030年中國水污染治理行業(yè)發(fā)展現(xiàn)狀分析規(guī)劃研究報告
- 2024-2030年中國氧化鋁纖維市場占有率格局及未來發(fā)展策略分析報告
- 高效藥品監(jiān)管制度研究
- 教育行業(yè)安全風險防范制度
- 機場疫情防控日報告制度
- 2022年大學數(shù)學專業(yè)大學物理下冊月考試卷D卷-附解析
- 2022年大學物理學專業(yè)大學物理二期中考試試題C卷-含答案
- 2022年大學航空航天專業(yè)大學物理下冊期中考試試題D卷-附解析
- 2022年大學輕工紡織食品專業(yè)大學物理二期中考試試題A卷-含答案
- 消防安全培訓內容
- 2024-2030年辣椒種植行業(yè)市場深度分析及發(fā)展策略研究報告
- 變電站綠化維護施工方案
- 校園展美 課件 2024-2025學年人美版(2024)初中美術七年級上冊
- 2024版《糖尿病健康宣教》課件
- ktv保安管理制度及崗位職責(共5篇)
- 腦出血試題完整版本
- 義務教育信息科技課程標準(2022年版)考試題庫及答案
- 建筑施工安全生產(chǎn)責任書
- 新員工三級安全教育考試試題參考答案
- 公司年會策劃及執(zhí)行服務合同
評論
0/150
提交評論