第三章 spss 生物統(tǒng)計學_第1頁
第三章 spss 生物統(tǒng)計學_第2頁
第三章 spss 生物統(tǒng)計學_第3頁
第三章 spss 生物統(tǒng)計學_第4頁
第三章 spss 生物統(tǒng)計學_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章統(tǒng)計推斷

前面第四章第六節(jié)講了樣本平均數(shù)抽樣分布的問題。抽樣研究的目的是用樣本信息來推斷總體特征,這就是我們將重點討論的統(tǒng)計推斷問題。所謂統(tǒng)計推斷是指根據(jù)樣本以及問題的條件和假定模型對未知事物(即總體)作出的以概率形式表述的推斷,它主要包括假設檢驗和參數(shù)估計兩個內(nèi)容。

假設檢驗又叫顯著性檢驗,其方法很多,常用的有t檢驗、F檢驗和χ2檢驗等。盡管這些檢驗方法的用途及使用條件不同,但其檢驗的基本原理是相同的。本章以平均數(shù)的差異顯著性檢驗為例闡明顯著性檢驗的原理,介紹幾種t檢驗的方法,然后介紹總體均數(shù)的區(qū)間估計。第一節(jié)

顯著性檢驗的基本原理第二節(jié)

樣本均數(shù)與總體均數(shù)的差異顯著性檢驗第三節(jié)

兩樣本平均數(shù)的差異顯著性檢驗第四節(jié)

顯著性檢驗中應注意的問題第五節(jié)

總體均數(shù)的區(qū)間估計第一節(jié)顯著性檢驗的基本原理一、顯著性檢驗的意義二、顯著性檢驗的基本步驟三、顯著水平與兩類錯誤四、雙側(cè)檢驗與單側(cè)檢驗一、顯著性檢驗的意義

本節(jié)的內(nèi)容主要是解決這樣幾個問題,即進行顯著性檢驗的目的、檢驗對象、基本思想和基本前提是什么?下面結(jié)合具體例子來說明。

(一)為什么要進行顯著性檢驗?在某種豬場隨機抽測了甲、乙兩品種經(jīng)產(chǎn)母豬各10頭的產(chǎn)仔初生窩重:甲品種10頭母豬產(chǎn)仔平均初生窩重標準差;乙品種10頭母豬產(chǎn)仔平均初生窩重,標準差。問題:能否僅憑這兩個樣本均數(shù)差值立即得出甲、乙兩品種母豬經(jīng)產(chǎn)仔初生窩重不同的結(jié)論呢?

統(tǒng)計學認為,這樣得出的結(jié)論是不可靠的。這是因為試驗指標既受處理因素的影響,又受試驗誤差(或抽樣誤差)的影響。如果我們再分別隨機抽測10頭甲、乙兩品種豬母豬產(chǎn)仔初生窩重,又可得到兩個樣本資料。兩樣本均數(shù)就不一定是13.5kg和11.63kg,其差值也不一定是1.87kg。

怎樣通過樣本來推斷總體呢?——這正是顯著性檢驗要解決的問題。

(二)檢驗對象

設甲品種豬經(jīng)產(chǎn)母豬產(chǎn)仔初生窩重的總體均數(shù)為,乙品種的總體均數(shù)為。試驗研究(本例為抽樣比較)的目的,就是要給、是否相同做出推斷,由于總體均數(shù)、未知,在進行顯著性檢驗時只能以樣本均數(shù)、作為檢驗對象,更確切地說,是以作為檢驗對象。事實上,因為樣本均數(shù)具有下述特征:

離均差的平方和最小。說明樣本平均數(shù)與樣本各個觀察值最接近,平均數(shù)是資料的代表數(shù)。

樣本平均數(shù)是總體均數(shù)的無偏估計值,

統(tǒng)計學中心極限定理,樣本平均數(shù)服從或逼近正態(tài)分布。所以,以樣本平均數(shù)作為檢驗對象,由兩個樣本均數(shù)差異的大小去推斷樣本所屬總體平均數(shù)是否相同是有其依據(jù)的。由上所述,一方面我們有依據(jù)由樣本均數(shù)的差異來推斷總體均數(shù)、相同與否,另一方面又不能僅據(jù)樣本均數(shù)表面上的差異直接作出結(jié)論,其根本原因在于試驗誤差(或抽樣誤差)的不可避免性。(三)基本思想

我們所得到的觀察值由兩部分組成,即若樣本含量為n,則可得到n個觀察值。于是樣本平均數(shù)。說明樣本均數(shù)并非總體均數(shù),它還包含試驗誤差的成分。對于接受不同處理的兩個樣本來說,則有:

兩個樣本均數(shù)之差試驗的處理效應試驗誤差樣本平均數(shù)的差包含有試驗誤差,它不只是試驗的表面效應。因此,僅憑就對總體均數(shù)、是否相同下結(jié)論是不可靠的。只有通過顯著性檢驗才能從中提取結(jié)論。

對進行顯著性檢驗就是要分析:

主要由處理效應引起的,還是主要由試驗誤差所造成?雖然處理效應未知,但試驗的表面效應是可以計算的,借助數(shù)理統(tǒng)計方法試驗誤差又是可以估計的。所以,可從試驗的表面效應與試驗誤差的權(quán)衡比較中間接地推斷處理效應是否存在,這就是顯著性檢驗的基本思想。(四)基本前提

為了通過樣本對其所在的總體作出符合實際的推斷,要求合理進行試驗設計,準確地進行試驗與觀察記載,盡量降低試驗誤差,避免系統(tǒng)誤差,使樣本盡可能代表總體。只有從正確、完整而又足夠的資料中才能獲得可靠的結(jié)論。若資料中包含有較大的試驗誤差與系統(tǒng)誤差,有許多遺漏、缺失甚至錯誤,再好的統(tǒng)計方法也無濟于事。因此,收集到正確、完整而又足夠的資料是通過顯著性檢驗獲得可靠結(jié)論的基本前提。小結(jié):(一)顯著性檢驗要解決的問題——如何通過樣本來推斷估計總體。(二)檢驗的對象及其依據(jù)——樣本平均數(shù)(根據(jù)有三條)。(三)顯著性檢驗的基本思想——從試驗的表面效應與試驗誤差的權(quán)衡比較中間接地推斷處理效應是否存在。(四)通過檢驗獲得可靠結(jié)論的基本前提——收集到正確、完整而又足夠的資料。二、顯著性檢驗的基本步驟

(一)首先對試驗樣本所在的總體作假設。這里假設,即假設甲、乙兩品種豬經(jīng)產(chǎn)母豬仔豬初生重的總體均數(shù)相等,其意義是試驗的表面效應系試驗誤差,處理無效,故稱為無效假設(nullhypothesis),記作。

無效假設是被檢驗的假設,通過檢驗可能被接受,也可能被否定。提出的同時,相應地有一對應假設,稱為備擇假設(alternativehypothesis),記作。

備擇假設是在無效假設被否定時準備接受的假設。

本例的備擇假設是:甲、乙兩品種豬經(jīng)產(chǎn)母豬仔豬初生窩重的總體均數(shù)不相等,記作亦即存在處理效應,試驗的表面效應除包含試驗誤差外,主要的是含有處理效應在內(nèi)。

(二)在無效假設成立的前提下,構(gòu)造合適的統(tǒng)計量,并研究試驗所得統(tǒng)計量的抽樣分布。

就我們的例子,研究在無效假設成立的前提下,統(tǒng)計量的抽樣分布。經(jīng)統(tǒng)計學研究,得到一個的t分布。(請聯(lián)系上一章的內(nèi)容思考如何得出該結(jié)論的??)其中為均數(shù)差異標準誤;分別為兩樣本的含量、平均數(shù)、均方。根據(jù)前面兩個樣本的數(shù)據(jù),計算得:

于是下面進一步估計出的兩尾概率,即估計是多少。查附表3,在時,兩尾概率為0.05的臨界t值,兩尾概率為0.01的臨界t值,即:由于根據(jù)兩樣本數(shù)據(jù)計算所得的t值為2.234,介于二個臨界t值之間,所以,|t|≥2.234的概率P介于0.01和0.05之間,即:0.01<P<0.05

(三)根據(jù)“小概率事件實際不可能性原理”否定或接受無效假設。當一事件發(fā)生的概率很小(例如小于0.05或0.01)時,在一次試驗中可以認為其實際上不可能發(fā)生,這叫小概率事件實際不可能性原理。|t|≥2.234的兩尾概率

說明試驗處理效應不存在,即試驗的表面效應為試驗誤差的可能性在0.01~0.05之間。在生物學研究中常以0.05和0.01兩個概率作為

某事件是否是小概率事件的標準。若本例中,按所建立的,表面效應為試驗誤差的概率在0.01~0.05之間,即無效假設屬于小概率事件,根據(jù)小概率原理,故有理由否定,從而接受可以認為甲、乙兩品種經(jīng)產(chǎn)母豬的仔豬初生窩重總體平均數(shù)不相同。小概率事件不認為是小概率事件小結(jié)(顯著性檢驗的基本步驟):

首先對試驗樣本所在的總體作假設(無效假設和備擇假設)。

在無效假設成立的前提下,構(gòu)造合適的統(tǒng)計量,并研究試驗所得統(tǒng)計量的抽樣分布。(得出無效假設成立的概率)

根據(jù)“小概率事件實際不可能性原理”否定或接受無效假設。(在一定的概率保證下,對無效假設是否成立作出判斷)綜上所述,顯著性檢驗,從建立假設到最后依概率的大小來決定接受還是否定假設,這一過程實際上應用所謂“概率性質(zhì)的反證法”對試驗樣本所屬總體所作假設的統(tǒng)計證明。對于各種顯著性檢驗的方法,除明確其應用條件,掌握有關(guān)統(tǒng)計運算方法外,正確的邏輯推理是不可忽視的。三、顯著水平與兩類錯誤

(一)顯著水平(Significancelevel)在顯著性檢驗中,否定或接受無效假設的依據(jù)是“小概率事件實際不可能性原理”。用來確定否定或接受無效假設的概率標準叫顯著水平,記作α。在生物學研究中常取α=0.05或α=0.01。

(二)顯著水平α在顯著性檢驗(t檢驗)中的應用

若,則說明試驗的表面效應屬于試驗誤差的概率P>0.05,即表面效應屬于試驗誤差的可能性大,不能否定。這時稱“差異不顯著”,記為“ns”或不標記;

若,則說明試驗的表面效應屬于試驗誤差的概率P在0.01~0.05之間,即0.01<P<0.05,亦即表面效應屬于試驗誤差的可能性較小,應否定,接受,這時稱“差異顯著”,記為“*”;

若,則說明試驗的表面效應屬于試驗誤差的概率P不超過0.01,即P≤0.01。亦即表面效應屬于試驗誤差的可能性更小,應否定,接受,這時稱“差異極顯著”,記為“**”。(三)兩類錯誤因為顯著性檢驗是根據(jù)“小概率事件實際不可能性原理”來否定或接受無效假設的,所以不論是接受還是否定無效假設,都沒有100%的把握。也就是說,在檢驗一個假設時可能犯兩類錯誤。

第一類錯誤是真實情況為成立,卻否定了它,犯了“棄真”錯誤,也叫Ⅰ型錯誤(typeⅠerror)

犯Ⅰ型錯誤的概率不會超過α,Ⅰ型錯誤也叫α錯誤,在醫(yī)學上還稱為假陽性錯誤。

第二類錯誤是實際不成立,卻接受了它,犯了“納偽”錯誤,也叫Ⅱ型錯誤(typeⅡerror)。犯Ⅱ型錯誤的概率記為β。Ⅱ型錯誤又叫β錯誤,在醫(yī)學上還稱為假陰性錯誤。犯Ⅱ型錯誤可能性β的大小與α取值的大小、兩均數(shù)差異大小等因素有關(guān)。

兩類錯誤間的關(guān)系

如圖所示,圖中左邊曲線是為真時,的分布密度曲線;右邊曲線是為真時,的分布密度曲線()。因此,在檢驗選用顯著水平時,應考慮到這兩種錯誤推斷后果的嚴重性大小,還應考慮到試驗的難易,試驗結(jié)果的重要程度。兩類錯誤示意圖

由圖不難看出,當α值變小時,β值變大;反之,α值變大時,β值變小。也就是說Ⅰ型錯誤α的降低必然伴隨著Ⅱ型錯誤β的升高。若一個試驗耗費大,可靠性要求高,不允許反復,那么α值應取小些;當一個試驗結(jié)論的使用事關(guān)重大,容易產(chǎn)生嚴重后果,如藥物的毒性試驗,α值亦應取小些。對于一些試驗條件不易控制,試驗誤差較大的試驗,可將α值放寬到0.1,甚至放寬到0.25。在提高顯著水平,即減小α值時,為了減小犯Ⅱ型錯誤的概率,可適當增大樣本含量。增大樣本含量可以同時降低犯兩類錯誤的可能性。

兩類錯誤的關(guān)系

客觀實際否定接受成立Ⅰ型錯誤(α)推斷正確(1-α)不成立推斷正確(1-β)Ⅱ型錯誤(β)小結(jié):因為顯著性檢驗是根據(jù)“小概率事件實際不可能性原理”來否定或接受無效假設的,所以不論是接受還是否定無效假設,都沒有100%的把握。

若經(jīng)t檢驗“差異顯著”,對此結(jié)論有95%的把握,同時要冒5%下錯結(jié)論的風險;

“差異極顯著”,對此結(jié)論有99%的把握,同時要冒1%下錯結(jié)論的風險;

“差異不顯著”,是指在本次試驗條件下,無效假設未被否定。

“差異不顯著”不一定是“沒有差異”。這有兩種可能:

或者這兩個樣本所在的總體確實沒有差異;

或者這兩個樣本所在總體平均數(shù)有差異而因為試驗誤差大被掩蓋了。因而不能僅憑統(tǒng)計推斷就作出絕對肯定或絕對否定的結(jié)論。“有很大的可靠性,但有一定的錯誤率”,這是統(tǒng)計推斷的基本特點。四、雙側(cè)檢驗與單側(cè)檢驗

(一)雙側(cè)檢驗

(two-sidedtest)

在顯著性檢驗中,無效假設為,備擇假設為。此時備擇假設包括了或兩種可能。這個假設的目的在于判斷與有無差異,而不考慮誰大誰小。此時,在α水平上否定域為(-∞,-)和[,+∞],對稱地分配在t分布曲線的兩側(cè)尾部,每側(cè)的概率為α/2,如下圖所示。這種利用兩尾概率進行的檢驗叫雙側(cè)檢驗,也叫雙尾檢驗,為雙側(cè)檢驗的臨界t值。單側(cè)檢驗

雙側(cè)檢驗圖A圖B(二)單側(cè)檢驗(one-sidedtest)

但在有些情況下,雙側(cè)檢驗不一定符合實際情況。如采用某種新的配套技術(shù)措施以期提高雞的產(chǎn)蛋量,已知此種配套技術(shù)的實施不會降低產(chǎn)蛋量。若進行新技術(shù)與常規(guī)技術(shù)的比較試驗,無效假設應為,即假設新技術(shù)的實施沒有提高產(chǎn)蛋量,備擇假設應為,即新配套技術(shù)的實施使產(chǎn)蛋量有所提高。

檢驗目的在于推斷實施新技術(shù)是否提高了產(chǎn)蛋量,這時的否定域在t分布曲線的右尾。在α水平上,的否定域為[,+∞],右側(cè)的概率為α,如圖A所示。若無效假設為,備擇假設為,此時的否定域在t分布曲線的左尾。在α水平上,的否定域為(-∞,-),左側(cè)的概率為α。如圖B所示。這種利用一尾概率進行的檢驗叫單側(cè)檢驗也叫單尾檢驗。此時為單側(cè)檢驗的臨界t值。

(三)單側(cè)檢驗與雙側(cè)檢驗的關(guān)系單側(cè)檢驗的tα=雙側(cè)檢驗的t2α若對同一資料進行雙側(cè)檢驗也進行單側(cè)檢驗,那么在α水平上單側(cè)檢驗顯著,只相當于雙側(cè)檢驗在2α水平上顯著。所以,同一資料雙側(cè)檢驗與單側(cè)檢驗所得的結(jié)論不一定相同。雙側(cè)檢驗顯著,單側(cè)檢驗一定顯著;反之,單側(cè)檢驗顯著,雙側(cè)檢驗未必顯著。

(四)應用選用單側(cè)檢驗還是雙側(cè)檢驗應根據(jù)專業(yè)知識及問題的要求(分析的目的)在試驗設計時就確定。一般若事先不知道所比較的兩個處理效果誰好誰壞,分析的目的在于推斷兩個處理效果有無差別,則選用雙側(cè)檢驗;若根據(jù)理論知識或?qū)嵺`經(jīng)驗判斷甲處理的效果不會比乙處理的效果差(或相反),分析的目的在于推斷甲處理是否比乙處理好(或差),則用單側(cè)檢驗。

一般情況下,如不作特殊說明均指雙側(cè)檢驗。第二節(jié)樣本均數(shù)與總體均數(shù)的差異顯著性檢驗——t檢驗

在實際工作中往往需要檢驗一個樣本均數(shù)與已知總體均數(shù)是否有顯著差異,即檢驗樣本是否屬于某一總體。這里的一般為一些公認的指標。如畜禽正常生理生化指標、生產(chǎn)性能指標、經(jīng)大量調(diào)查所得的平均值、經(jīng)驗數(shù)或規(guī)定的某種指標值。

檢驗的基本步驟:

(一)建立假設,其中μ為樣本所在總體均值。

(二)在無效假設成立的條件下,計算t值。其中,n為樣本含量,為樣本標準誤。

(三)根據(jù)計算出的自由度,查得臨界值:。將計算所得t值的絕對值與其比較,作出推斷。

若,則P>0.05,不能否定,表明樣本均數(shù)與總體均數(shù)差異不顯著;

若,則0.01<P≤0.05,否定,接受,表明樣本均數(shù)與總體均數(shù)差異顯著;

若,則P≤0.01,否定,接受,表明樣本均數(shù)與總體均數(shù)差異極顯著。【例】在魚塘中10個點取水樣,測定水中含氧量,得數(shù)據(jù):4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.48,4.55,4.26(mg/l),能否認為該魚塘中平均含氧量為4.50(mg/l)。顯然,本例應進行雙側(cè)t檢驗。

1.建立假設

2.計算t值

經(jīng)計算得:=4.421,S=0.267所以

3.查臨界t值,并作出推斷由df=10-1=9查t值表(附表3)得,=2.262。因為,P>0.05,故不能否定,可以認為該魚塘中平均含氧量為4.50(m

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論