第三章 spss 生物統(tǒng)計學(xué)_第1頁
第三章 spss 生物統(tǒng)計學(xué)_第2頁
第三章 spss 生物統(tǒng)計學(xué)_第3頁
第三章 spss 生物統(tǒng)計學(xué)_第4頁
第三章 spss 生物統(tǒng)計學(xué)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章統(tǒng)計推斷

前面第四章第六節(jié)講了樣本平均數(shù)抽樣分布的問題。抽樣研究的目的是用樣本信息來推斷總體特征,這就是我們將重點(diǎn)討論的統(tǒng)計推斷問題。所謂統(tǒng)計推斷是指根據(jù)樣本以及問題的條件和假定模型對未知事物(即總體)作出的以概率形式表述的推斷,它主要包括假設(shè)檢驗(yàn)和參數(shù)估計兩個內(nèi)容。

假設(shè)檢驗(yàn)又叫顯著性檢驗(yàn),其方法很多,常用的有t檢驗(yàn)、F檢驗(yàn)和χ2檢驗(yàn)等。盡管這些檢驗(yàn)方法的用途及使用條件不同,但其檢驗(yàn)的基本原理是相同的。本章以平均數(shù)的差異顯著性檢驗(yàn)為例闡明顯著性檢驗(yàn)的原理,介紹幾種t檢驗(yàn)的方法,然后介紹總體均數(shù)的區(qū)間估計。第一節(jié)

顯著性檢驗(yàn)的基本原理第二節(jié)

樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)第三節(jié)

兩樣本平均數(shù)的差異顯著性檢驗(yàn)第四節(jié)

顯著性檢驗(yàn)中應(yīng)注意的問題第五節(jié)

總體均數(shù)的區(qū)間估計第一節(jié)顯著性檢驗(yàn)的基本原理一、顯著性檢驗(yàn)的意義二、顯著性檢驗(yàn)的基本步驟三、顯著水平與兩類錯誤四、雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)一、顯著性檢驗(yàn)的意義

本節(jié)的內(nèi)容主要是解決這樣幾個問題,即進(jìn)行顯著性檢驗(yàn)的目的、檢驗(yàn)對象、基本思想和基本前提是什么?下面結(jié)合具體例子來說明。

(一)為什么要進(jìn)行顯著性檢驗(yàn)?在某種豬場隨機(jī)抽測了甲、乙兩品種經(jīng)產(chǎn)母豬各10頭的產(chǎn)仔初生窩重:甲品種10頭母豬產(chǎn)仔平均初生窩重標(biāo)準(zhǔn)差;乙品種10頭母豬產(chǎn)仔平均初生窩重,標(biāo)準(zhǔn)差。問題:能否僅憑這兩個樣本均數(shù)差值立即得出甲、乙兩品種母豬經(jīng)產(chǎn)仔初生窩重不同的結(jié)論呢?

統(tǒng)計學(xué)認(rèn)為,這樣得出的結(jié)論是不可靠的。這是因?yàn)樵囼?yàn)指標(biāo)既受處理因素的影響,又受試驗(yàn)誤差(或抽樣誤差)的影響。如果我們再分別隨機(jī)抽測10頭甲、乙兩品種豬母豬產(chǎn)仔初生窩重,又可得到兩個樣本資料。兩樣本均數(shù)就不一定是13.5kg和11.63kg,其差值也不一定是1.87kg。

怎樣通過樣本來推斷總體呢?——這正是顯著性檢驗(yàn)要解決的問題。

(二)檢驗(yàn)對象

設(shè)甲品種豬經(jīng)產(chǎn)母豬產(chǎn)仔初生窩重的總體均數(shù)為,乙品種的總體均數(shù)為。試驗(yàn)研究(本例為抽樣比較)的目的,就是要給、是否相同做出推斷,由于總體均數(shù)、未知,在進(jìn)行顯著性檢驗(yàn)時只能以樣本均數(shù)、作為檢驗(yàn)對象,更確切地說,是以作為檢驗(yàn)對象。事實(shí)上,因?yàn)闃颖揪鶖?shù)具有下述特征:

離均差的平方和最小。說明樣本平均數(shù)與樣本各個觀察值最接近,平均數(shù)是資料的代表數(shù)。

樣本平均數(shù)是總體均數(shù)的無偏估計值,

統(tǒng)計學(xué)中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布。所以,以樣本平均數(shù)作為檢驗(yàn)對象,由兩個樣本均數(shù)差異的大小去推斷樣本所屬總體平均數(shù)是否相同是有其依據(jù)的。由上所述,一方面我們有依據(jù)由樣本均數(shù)的差異來推斷總體均數(shù)、相同與否,另一方面又不能僅據(jù)樣本均數(shù)表面上的差異直接作出結(jié)論,其根本原因在于試驗(yàn)誤差(或抽樣誤差)的不可避免性。(三)基本思想

我們所得到的觀察值由兩部分組成,即若樣本含量為n,則可得到n個觀察值。于是樣本平均數(shù)。說明樣本均數(shù)并非總體均數(shù),它還包含試驗(yàn)誤差的成分。對于接受不同處理的兩個樣本來說,則有:

兩個樣本均數(shù)之差試驗(yàn)的處理效應(yīng)試驗(yàn)誤差樣本平均數(shù)的差包含有試驗(yàn)誤差,它不只是試驗(yàn)的表面效應(yīng)。因此,僅憑就對總體均數(shù)、是否相同下結(jié)論是不可靠的。只有通過顯著性檢驗(yàn)才能從中提取結(jié)論。

對進(jìn)行顯著性檢驗(yàn)就是要分析:

主要由處理效應(yīng)引起的,還是主要由試驗(yàn)誤差所造成?雖然處理效應(yīng)未知,但試驗(yàn)的表面效應(yīng)是可以計算的,借助數(shù)理統(tǒng)計方法試驗(yàn)誤差又是可以估計的。所以,可從試驗(yàn)的表面效應(yīng)與試驗(yàn)誤差的權(quán)衡比較中間接地推斷處理效應(yīng)是否存在,這就是顯著性檢驗(yàn)的基本思想。(四)基本前提

為了通過樣本對其所在的總體作出符合實(shí)際的推斷,要求合理進(jìn)行試驗(yàn)設(shè)計,準(zhǔn)確地進(jìn)行試驗(yàn)與觀察記載,盡量降低試驗(yàn)誤差,避免系統(tǒng)誤差,使樣本盡可能代表總體。只有從正確、完整而又足夠的資料中才能獲得可靠的結(jié)論。若資料中包含有較大的試驗(yàn)誤差與系統(tǒng)誤差,有許多遺漏、缺失甚至錯誤,再好的統(tǒng)計方法也無濟(jì)于事。因此,收集到正確、完整而又足夠的資料是通過顯著性檢驗(yàn)獲得可靠結(jié)論的基本前提。小結(jié):(一)顯著性檢驗(yàn)要解決的問題——如何通過樣本來推斷估計總體。(二)檢驗(yàn)的對象及其依據(jù)——樣本平均數(shù)(根據(jù)有三條)。(三)顯著性檢驗(yàn)的基本思想——從試驗(yàn)的表面效應(yīng)與試驗(yàn)誤差的權(quán)衡比較中間接地推斷處理效應(yīng)是否存在。(四)通過檢驗(yàn)獲得可靠結(jié)論的基本前提——收集到正確、完整而又足夠的資料。二、顯著性檢驗(yàn)的基本步驟

(一)首先對試驗(yàn)樣本所在的總體作假設(shè)。這里假設(shè),即假設(shè)甲、乙兩品種豬經(jīng)產(chǎn)母豬仔豬初生重的總體均數(shù)相等,其意義是試驗(yàn)的表面效應(yīng)系試驗(yàn)誤差,處理無效,故稱為無效假設(shè)(nullhypothesis),記作。

無效假設(shè)是被檢驗(yàn)的假設(shè),通過檢驗(yàn)可能被接受,也可能被否定。提出的同時,相應(yīng)地有一對應(yīng)假設(shè),稱為備擇假設(shè)(alternativehypothesis),記作。

備擇假設(shè)是在無效假設(shè)被否定時準(zhǔn)備接受的假設(shè)。

本例的備擇假設(shè)是:甲、乙兩品種豬經(jīng)產(chǎn)母豬仔豬初生窩重的總體均數(shù)不相等,記作亦即存在處理效應(yīng),試驗(yàn)的表面效應(yīng)除包含試驗(yàn)誤差外,主要的是含有處理效應(yīng)在內(nèi)。

(二)在無效假設(shè)成立的前提下,構(gòu)造合適的統(tǒng)計量,并研究試驗(yàn)所得統(tǒng)計量的抽樣分布。

就我們的例子,研究在無效假設(shè)成立的前提下,統(tǒng)計量的抽樣分布。經(jīng)統(tǒng)計學(xué)研究,得到一個的t分布。(請聯(lián)系上一章的內(nèi)容思考如何得出該結(jié)論的??)其中為均數(shù)差異標(biāo)準(zhǔn)誤;分別為兩樣本的含量、平均數(shù)、均方。根據(jù)前面兩個樣本的數(shù)據(jù),計算得:

于是下面進(jìn)一步估計出的兩尾概率,即估計是多少。查附表3,在時,兩尾概率為0.05的臨界t值,兩尾概率為0.01的臨界t值,即:由于根據(jù)兩樣本數(shù)據(jù)計算所得的t值為2.234,介于二個臨界t值之間,所以,|t|≥2.234的概率P介于0.01和0.05之間,即:0.01<P<0.05

(三)根據(jù)“小概率事件實(shí)際不可能性原理”否定或接受無效假設(shè)。當(dāng)一事件發(fā)生的概率很小(例如小于0.05或0.01)時,在一次試驗(yàn)中可以認(rèn)為其實(shí)際上不可能發(fā)生,這叫小概率事件實(shí)際不可能性原理。|t|≥2.234的兩尾概率

說明試驗(yàn)處理效應(yīng)不存在,即試驗(yàn)的表面效應(yīng)為試驗(yàn)誤差的可能性在0.01~0.05之間。在生物學(xué)研究中常以0.05和0.01兩個概率作為

某事件是否是小概率事件的標(biāo)準(zhǔn)。若本例中,按所建立的,表面效應(yīng)為試驗(yàn)誤差的概率在0.01~0.05之間,即無效假設(shè)屬于小概率事件,根據(jù)小概率原理,故有理由否定,從而接受可以認(rèn)為甲、乙兩品種經(jīng)產(chǎn)母豬的仔豬初生窩重總體平均數(shù)不相同。小概率事件不認(rèn)為是小概率事件小結(jié)(顯著性檢驗(yàn)的基本步驟):

首先對試驗(yàn)樣本所在的總體作假設(shè)(無效假設(shè)和備擇假設(shè))。

在無效假設(shè)成立的前提下,構(gòu)造合適的統(tǒng)計量,并研究試驗(yàn)所得統(tǒng)計量的抽樣分布。(得出無效假設(shè)成立的概率)

根據(jù)“小概率事件實(shí)際不可能性原理”否定或接受無效假設(shè)。(在一定的概率保證下,對無效假設(shè)是否成立作出判斷)綜上所述,顯著性檢驗(yàn),從建立假設(shè)到最后依概率的大小來決定接受還是否定假設(shè),這一過程實(shí)際上應(yīng)用所謂“概率性質(zhì)的反證法”對試驗(yàn)樣本所屬總體所作假設(shè)的統(tǒng)計證明。對于各種顯著性檢驗(yàn)的方法,除明確其應(yīng)用條件,掌握有關(guān)統(tǒng)計運(yùn)算方法外,正確的邏輯推理是不可忽視的。三、顯著水平與兩類錯誤

(一)顯著水平(Significancelevel)在顯著性檢驗(yàn)中,否定或接受無效假設(shè)的依據(jù)是“小概率事件實(shí)際不可能性原理”。用來確定否定或接受無效假設(shè)的概率標(biāo)準(zhǔn)叫顯著水平,記作α。在生物學(xué)研究中常取α=0.05或α=0.01。

(二)顯著水平α在顯著性檢驗(yàn)(t檢驗(yàn))中的應(yīng)用

若,則說明試驗(yàn)的表面效應(yīng)屬于試驗(yàn)誤差的概率P>0.05,即表面效應(yīng)屬于試驗(yàn)誤差的可能性大,不能否定。這時稱“差異不顯著”,記為“ns”或不標(biāo)記;

若,則說明試驗(yàn)的表面效應(yīng)屬于試驗(yàn)誤差的概率P在0.01~0.05之間,即0.01<P<0.05,亦即表面效應(yīng)屬于試驗(yàn)誤差的可能性較小,應(yīng)否定,接受,這時稱“差異顯著”,記為“*”;

若,則說明試驗(yàn)的表面效應(yīng)屬于試驗(yàn)誤差的概率P不超過0.01,即P≤0.01。亦即表面效應(yīng)屬于試驗(yàn)誤差的可能性更小,應(yīng)否定,接受,這時稱“差異極顯著”,記為“**”。(三)兩類錯誤因?yàn)轱@著性檢驗(yàn)是根據(jù)“小概率事件實(shí)際不可能性原理”來否定或接受無效假設(shè)的,所以不論是接受還是否定無效假設(shè),都沒有100%的把握。也就是說,在檢驗(yàn)一個假設(shè)時可能犯兩類錯誤。

第一類錯誤是真實(shí)情況為成立,卻否定了它,犯了“棄真”錯誤,也叫Ⅰ型錯誤(typeⅠerror)

犯Ⅰ型錯誤的概率不會超過α,Ⅰ型錯誤也叫α錯誤,在醫(yī)學(xué)上還稱為假陽性錯誤。

第二類錯誤是實(shí)際不成立,卻接受了它,犯了“納偽”錯誤,也叫Ⅱ型錯誤(typeⅡerror)。犯Ⅱ型錯誤的概率記為β。Ⅱ型錯誤又叫β錯誤,在醫(yī)學(xué)上還稱為假陰性錯誤。犯Ⅱ型錯誤可能性β的大小與α取值的大小、兩均數(shù)差異大小等因素有關(guān)。

兩類錯誤間的關(guān)系

如圖所示,圖中左邊曲線是為真時,的分布密度曲線;右邊曲線是為真時,的分布密度曲線()。因此,在檢驗(yàn)選用顯著水平時,應(yīng)考慮到這兩種錯誤推斷后果的嚴(yán)重性大小,還應(yīng)考慮到試驗(yàn)的難易,試驗(yàn)結(jié)果的重要程度。兩類錯誤示意圖

由圖不難看出,當(dāng)α值變小時,β值變大;反之,α值變大時,β值變小。也就是說Ⅰ型錯誤α的降低必然伴隨著Ⅱ型錯誤β的升高。若一個試驗(yàn)耗費(fèi)大,可靠性要求高,不允許反復(fù),那么α值應(yīng)取小些;當(dāng)一個試驗(yàn)結(jié)論的使用事關(guān)重大,容易產(chǎn)生嚴(yán)重后果,如藥物的毒性試驗(yàn),α值亦應(yīng)取小些。對于一些試驗(yàn)條件不易控制,試驗(yàn)誤差較大的試驗(yàn),可將α值放寬到0.1,甚至放寬到0.25。在提高顯著水平,即減小α值時,為了減小犯Ⅱ型錯誤的概率,可適當(dāng)增大樣本含量。增大樣本含量可以同時降低犯兩類錯誤的可能性。

兩類錯誤的關(guān)系

客觀實(shí)際否定接受成立Ⅰ型錯誤(α)推斷正確(1-α)不成立推斷正確(1-β)Ⅱ型錯誤(β)小結(jié):因?yàn)轱@著性檢驗(yàn)是根據(jù)“小概率事件實(shí)際不可能性原理”來否定或接受無效假設(shè)的,所以不論是接受還是否定無效假設(shè),都沒有100%的把握。

若經(jīng)t檢驗(yàn)“差異顯著”,對此結(jié)論有95%的把握,同時要冒5%下錯結(jié)論的風(fēng)險;

“差異極顯著”,對此結(jié)論有99%的把握,同時要冒1%下錯結(jié)論的風(fēng)險;

“差異不顯著”,是指在本次試驗(yàn)條件下,無效假設(shè)未被否定。

“差異不顯著”不一定是“沒有差異”。這有兩種可能:

或者這兩個樣本所在的總體確實(shí)沒有差異;

或者這兩個樣本所在總體平均數(shù)有差異而因?yàn)樵囼?yàn)誤差大被掩蓋了。因而不能僅憑統(tǒng)計推斷就作出絕對肯定或絕對否定的結(jié)論?!坝泻艽蟮目煽啃?,但有一定的錯誤率”,這是統(tǒng)計推斷的基本特點(diǎn)。四、雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(一)雙側(cè)檢驗(yàn)

(two-sidedtest)

在顯著性檢驗(yàn)中,無效假設(shè)為,備擇假設(shè)為。此時備擇假設(shè)包括了或兩種可能。這個假設(shè)的目的在于判斷與有無差異,而不考慮誰大誰小。此時,在α水平上否定域?yàn)?-∞,-)和[,+∞],對稱地分配在t分布曲線的兩側(cè)尾部,每側(cè)的概率為α/2,如下圖所示。這種利用兩尾概率進(jìn)行的檢驗(yàn)叫雙側(cè)檢驗(yàn),也叫雙尾檢驗(yàn),為雙側(cè)檢驗(yàn)的臨界t值。單側(cè)檢驗(yàn)

雙側(cè)檢驗(yàn)圖A圖B(二)單側(cè)檢驗(yàn)(one-sidedtest)

但在有些情況下,雙側(cè)檢驗(yàn)不一定符合實(shí)際情況。如采用某種新的配套技術(shù)措施以期提高雞的產(chǎn)蛋量,已知此種配套技術(shù)的實(shí)施不會降低產(chǎn)蛋量。若進(jìn)行新技術(shù)與常規(guī)技術(shù)的比較試驗(yàn),無效假設(shè)應(yīng)為,即假設(shè)新技術(shù)的實(shí)施沒有提高產(chǎn)蛋量,備擇假設(shè)應(yīng)為,即新配套技術(shù)的實(shí)施使產(chǎn)蛋量有所提高。

檢驗(yàn)?zāi)康脑谟谕茢鄬?shí)施新技術(shù)是否提高了產(chǎn)蛋量,這時的否定域在t分布曲線的右尾。在α水平上,的否定域?yàn)閇,+∞],右側(cè)的概率為α,如圖A所示。若無效假設(shè)為,備擇假設(shè)為,此時的否定域在t分布曲線的左尾。在α水平上,的否定域?yàn)?-∞,-),左側(cè)的概率為α。如圖B所示。這種利用一尾概率進(jìn)行的檢驗(yàn)叫單側(cè)檢驗(yàn)也叫單尾檢驗(yàn)。此時為單側(cè)檢驗(yàn)的臨界t值。

(三)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn)的關(guān)系單側(cè)檢驗(yàn)的tα=雙側(cè)檢驗(yàn)的t2α若對同一資料進(jìn)行雙側(cè)檢驗(yàn)也進(jìn)行單側(cè)檢驗(yàn),那么在α水平上單側(cè)檢驗(yàn)顯著,只相當(dāng)于雙側(cè)檢驗(yàn)在2α水平上顯著。所以,同一資料雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)所得的結(jié)論不一定相同。雙側(cè)檢驗(yàn)顯著,單側(cè)檢驗(yàn)一定顯著;反之,單側(cè)檢驗(yàn)顯著,雙側(cè)檢驗(yàn)未必顯著。

(四)應(yīng)用選用單側(cè)檢驗(yàn)還是雙側(cè)檢驗(yàn)應(yīng)根據(jù)專業(yè)知識及問題的要求(分析的目的)在試驗(yàn)設(shè)計時就確定。一般若事先不知道所比較的兩個處理效果誰好誰壞,分析的目的在于推斷兩個處理效果有無差別,則選用雙側(cè)檢驗(yàn);若根據(jù)理論知識或?qū)嵺`經(jīng)驗(yàn)判斷甲處理的效果不會比乙處理的效果差(或相反),分析的目的在于推斷甲處理是否比乙處理好(或差),則用單側(cè)檢驗(yàn)。

一般情況下,如不作特殊說明均指雙側(cè)檢驗(yàn)。第二節(jié)樣本均數(shù)與總體均數(shù)的差異顯著性檢驗(yàn)——t檢驗(yàn)

在實(shí)際工作中往往需要檢驗(yàn)一個樣本均數(shù)與已知總體均數(shù)是否有顯著差異,即檢驗(yàn)樣本是否屬于某一總體。這里的一般為一些公認(rèn)的指標(biāo)。如畜禽正常生理生化指標(biāo)、生產(chǎn)性能指標(biāo)、經(jīng)大量調(diào)查所得的平均值、經(jīng)驗(yàn)數(shù)或規(guī)定的某種指標(biāo)值。

檢驗(yàn)的基本步驟:

(一)建立假設(shè),其中μ為樣本所在總體均值。

(二)在無效假設(shè)成立的條件下,計算t值。其中,n為樣本含量,為樣本標(biāo)準(zhǔn)誤。

(三)根據(jù)計算出的自由度,查得臨界值:。將計算所得t值的絕對值與其比較,作出推斷。

若,則P>0.05,不能否定,表明樣本均數(shù)與總體均數(shù)差異不顯著;

若,則0.01<P≤0.05,否定,接受,表明樣本均數(shù)與總體均數(shù)差異顯著;

若,則P≤0.01,否定,接受,表明樣本均數(shù)與總體均數(shù)差異極顯著。【例】在魚塘中10個點(diǎn)取水樣,測定水中含氧量,得數(shù)據(jù):4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.48,4.55,4.26(mg/l),能否認(rèn)為該魚塘中平均含氧量為4.50(mg/l)。顯然,本例應(yīng)進(jìn)行雙側(cè)t檢驗(yàn)。

1.建立假設(shè)

2.計算t值

經(jīng)計算得:=4.421,S=0.267所以

3.查臨界t值,并作出推斷由df=10-1=9查t值表(附表3)得,=2.262。因?yàn)?,P>0.05,故不能否定,可以認(rèn)為該魚塘中平均含氧量為4.50(m

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論