浙江大學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方差分析舉例_第1頁
浙江大學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方差分析舉例_第2頁
浙江大學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方差分析舉例_第3頁
浙江大學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方差分析舉例_第4頁
浙江大學(xué)醫(yī)學(xué)統(tǒng)計(jì)學(xué)方差分析舉例_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章方差分析方差分析(analysis of varianee, ANOV A)是R.A. Fisher提出的,是數(shù)理統(tǒng)計(jì)的基本方法之 一,是醫(yī)學(xué)研究中分析數(shù)據(jù)的一種工具。目前各種實(shí)驗(yàn)設(shè)計(jì)的方法在醫(yī)學(xué)領(lǐng)域中得到越來越廣泛的應(yīng)用,取得了可喜的效果。方差分析就是實(shí)驗(yàn)設(shè)計(jì)中分析數(shù)據(jù)的一種有效方法。方差分析主要應(yīng)用范圍是:兩個(gè)及兩個(gè)以上樣本均數(shù)所代表的總體均數(shù)之間差異的比 較;同時(shí)可分析多個(gè)因素的作用;可以分析因素間的交互作用等。實(shí)際上,檢驗(yàn)兩個(gè)樣本均數(shù)代表的總體均數(shù)差異的t檢驗(yàn)是方差分析的特例。方差分析的應(yīng)用條件: 各個(gè)樣本來自正態(tài)總體; 各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本; 各樣 本代表的總體方差齊性

2、等。 方差分析可以說是檢驗(yàn)幾個(gè)樣本代表的具有相同方差、相互獨(dú)立的正態(tài)總體均數(shù)是否相等的問題的一種統(tǒng)計(jì)分析方法。第一節(jié) 單因素方差分析在醫(yī)學(xué)領(lǐng)域中經(jīng)常會遇到這樣的問題,有幾種不同的治療方案,要比較它們的治療效果;幾位檢驗(yàn)員檢查同一份血樣,想了解他們的檢驗(yàn)技術(shù)是否有所不同;給藥的不同時(shí)間對病人的治療效果是否有影響。這里研究的對象:治療方案、檢驗(yàn)員、給藥時(shí)間稱為因素。當(dāng)研究 的因素只有一個(gè)時(shí), 稱為單因素問題, 所做的實(shí)驗(yàn)叫單因素實(shí)驗(yàn)。相應(yīng)的設(shè)計(jì)叫單因素設(shè)計(jì)(完全隨機(jī)設(shè)計(jì)/成組設(shè)計(jì)),在實(shí)驗(yàn)研究,將受試對象按照完全隨機(jī)方法分配到各處理組或 對照組之中;在抽樣研究中,指研究對象從相互獨(dú)立的總體中按隨機(jī)

3、化的方法抽樣得到。此類資料的組間總體均數(shù)的比較可以考慮用單因素方差分析(one-way ANOV A)。一、問題的提出先看一個(gè)例子。例4.1將24名貧血患者隨機(jī)分為三組,分別用甲、乙、丙三種方案治療,治療一月后血紅 蛋白變化量見表4-1,要分析三種治療方案對貧血患者的療效是否有差異。表4-1三種方案治療貧血患者血紅蛋白的變化量(g%)ABC0.51.42.12.3-0.21.93.72.32.0Xij2.40.7-0.31.10.21.12.71.20.93.60.00.53.2-0.40.8刀刀Xj19.55.29.033.7(刀 X)ni88824( n)2.43750.65001.125

4、0Xi1.1042( X )256.699.4215.02281.13 (刀 X )二 X ij(*資料來自:劉玉秀等主編新藥臨床研究設(shè)計(jì)與統(tǒng)計(jì)分析)從平均值來看,治療方案不同對貧血患者的療效是有一定影響的,但仔細(xì)觀察一下數(shù) 據(jù)就會發(fā)現(xiàn)如下問題:(1)同一治療方案下患者血紅蛋白的變化量并不完全一樣,產(chǎn)生這種變異的原因是由 于患者之間個(gè)體變異的存在以及由于各種偶然因素引起的隨機(jī)測量誤差所致。(2)不同治療方案下患者血紅蛋白的變化量并不完全一樣,產(chǎn)生這種變異的原因包括 治療方案的不同、患者之間個(gè)體變異的存在以及由于各種偶然因素引起的隨機(jī)測量誤差等。由于患者之間個(gè)體變異的存在以及由于各種偶然因素引起

5、的隨機(jī)測量誤差的存在,對于不同治療方案下得到的不同療效是由于方案不同引起的呢,還是有患者之間個(gè)體變異的存在以及由于各種偶然因素引起的隨機(jī)測量誤差造成的?因此,應(yīng)做仔細(xì)的分析以后再下結(jié)論為好。由于治療方案不同引起的患者血紅蛋白的變化量的變異叫做處理變異。例4-1的全部24個(gè)數(shù)據(jù),參差不齊,它們的變異叫做總變異。產(chǎn)生總變異的原因一是 隨機(jī)測量誤差,一是處理變異。方差分析解決這類問題的思想是:1. 由數(shù)據(jù)的總變異中分解出處理變異和隨機(jī)測量誤差,并賦予它們的數(shù)量表示。2. 用處理變異和隨機(jī)測量誤差在一定意義上進(jìn)行比較,如果兩者相差不大,說明處理的不同對研究指標(biāo)的影響不大;如處理變異比隨機(jī)測量誤差大得多

6、,說明處理的不同影響是很大的,不可忽視。3. 選擇較好的處理或確定進(jìn)一步實(shí)驗(yàn)的方向。 因此,首要的問題是如何給變異一個(gè)數(shù)量表示。 最后再介紹兩個(gè)常用的術(shù)語。1. 水平一一因素在實(shí)驗(yàn)時(shí)所分的等級或組分叫水平。在例4-1中,治療方案分三個(gè)水平:A、B、C。2. 處理一一在一項(xiàng)實(shí)驗(yàn)中,同一實(shí)驗(yàn)條件下的實(shí)驗(yàn)叫做一個(gè)處理,不同實(shí)驗(yàn)條件下的實(shí)驗(yàn)叫做不同處理。在例 4-1中有三個(gè)處理。二、變異的數(shù)量表示有n個(gè)參差不齊的數(shù)據(jù)X1,X2,Xn,它們之間的差異稱為變異。如何給變異一個(gè)數(shù)量表示 呢?一個(gè)最直觀的想法就是用極差R表示.極差簡單直觀,便于計(jì)算,但是其缺點(diǎn)是對數(shù)據(jù)提供的信息利用不夠。人們后來有想出另一種表

7、達(dá)的方法一一離均差平方和,以SS記之,n即 SS八(Xj _X)2i =4SS是每個(gè)數(shù)據(jù)離平均值有多遠(yuǎn)的一個(gè)測度,它越大表示數(shù)據(jù)間的差異越大。由于求和符號后面的部分是非負(fù)數(shù), 所以,在同樣的波動程度下,數(shù)據(jù)多的平方和要大 于數(shù)據(jù)少的平方和,因此僅用平方和來反映波動的大小還是不夠的。我們要設(shè)法消去數(shù)據(jù)個(gè)數(shù)的多少給平方和帶來的影響。為此引進(jìn)自由度的概念。一個(gè)直觀的想法是用平方和除以相應(yīng)的項(xiàng)數(shù),但是從數(shù)理統(tǒng)計(jì)的理論上可以證明這不是一個(gè)最好的辦法,而應(yīng)把項(xiàng)數(shù)加以修正,這個(gè)修正的數(shù)叫做自由度。設(shè)有n個(gè)數(shù)Xj,i=1,2,,n。如果有m個(gè)(Ow m< n)線形約束關(guān)系,并且這 m個(gè)方程是互n相獨(dú)立的

8、,即方程系數(shù)矩陣的秩等于m,則S=Xi2的自由度是n-m。i很容易可以證明,對于 n個(gè)數(shù)據(jù)的離均差平方和的自由度v =n-1。這么來確定自由度似乎還是比較麻煩,對于常見的方差分析類型,在以后各節(jié)均有簡單的確定自由度的方法,這里只要知道自由度的概念就行。下面引進(jìn)均方的概念, 所謂均方是指一定的自由度條件下的離均差平方和。常用MS表示,即MS=SSV。其實(shí)MS亦是方差。它的值越大,說明數(shù)據(jù)變異越大;它的值越小,說明 數(shù)據(jù)變異越小。它在反映數(shù)據(jù)波動的大小更加合理??梢赃m用于不同組之間波動程度或說是變異程度的比較。三、單因素方差分析的基本思想和方差分析表的產(chǎn)生方差分析的基本思想就是把所有數(shù)據(jù)的總變異(

9、離均差平方和) 分解成幾個(gè)部分,然后將各部分的變異進(jìn)行比較。 在單因素方差分析中,總變異可分成組間變異和組內(nèi)變異兩部分。(總變異就是所有數(shù)據(jù)對總均數(shù)的離均差平方和,總變異產(chǎn)生的原因是處理因素和隨機(jī)測量誤差;組間變異包括處理因素和隨機(jī)測量誤差;組內(nèi)變異就是包括隨機(jī)測量誤差。這里所說的隨機(jī)測量誤差也包括個(gè)體差異。)然后,把組間變異和組內(nèi)變異分別除以相應(yīng)的自由度得 到組間均方和組內(nèi)均方。在理論上,如果H0成立,則統(tǒng)計(jì)量F=MS組間/MS組內(nèi)應(yīng)該為1;如果H0不成立,則F值大于1。反過來,我們可以從計(jì)算得到的F值大小,來推斷 H0是否成立。F值究竟大于多少時(shí),H0不成立,就要查方差分析的 F臨界值來判

10、斷。下面以例4-1為例來說明方差分析表的產(chǎn)生的基本步驟:1.建立假設(shè)并給定檢驗(yàn)水準(zhǔn) aH。123 (不同治療方案對貧血患者的療效無影響)1 ,不等或不全相等(不同治療方案對貧血患者的療效有影響)H km22SS、八X廠X八X C '總二N 1 斗 j #J12' 3:-=0.052 計(jì)算F值2(1)列計(jì)算表(見表4-1下部),計(jì)算各組刀Xj, n, Xi ,、Xjj(2)計(jì)算離均差平方和 SS及自由度XjnSS,自由度'、均方MS和F值4-2表示。a)求校正數(shù)CCb)計(jì)算各離均差平方和整個(gè)計(jì)算過程可用表表4-2 單因素方差分析計(jì)算表變異來源SSMSF值P值SS組間 f

11、M S組間組間SS組間:組間=k -1 MS組間一:組間一 M s組內(nèi)組內(nèi) (誤差)SS組內(nèi)S&內(nèi)二SS -SS且間組內(nèi)二匕總-組間蟲&MSw-內(nèi)V組內(nèi)總計(jì)S S總:總二N 一1kSS且間八Ni Xi X八ni' Xijj=1Jn-c;TLc,_k_i $ Ni-組間SS&內(nèi)=SS、一 SSa間,:組內(nèi)=總i組間二N K本例:33.72C=47.324i 4i 42SS、八 X C =81.1300-47.3204=33.8096,:總=24-仁232 2 2(195)(52) (90)ss間888憶3204 二i3-715 組間二 3亠2SS內(nèi)二 SS、一 S

12、S間=33.8096-13.7158=20.0938112.971 2,組內(nèi)二24 一3 =21 代入方差分析表中(表 4-2),求出相應(yīng)的MS及F值,見表4-3。3 .查F值表,確定P值,并作出推斷下結(jié)論。由附表 4 查得 F 0.05(2,21)=3.47,,因 F=7.1675> 尸0.05(2,21)= 3.47,,所以 PV0.05。結(jié)論:按=0.05水準(zhǔn),拒絕Ho,可以認(rèn)為3種不同治療方案對貧血患者血紅蛋白的 療效是有影響。以上方差分析的結(jié)果常以方差分析表的形式表達(dá),如表 4-3所示。表4-3 表4-1資料的方差分析表變異來源SSVMSF值P值組間13.715826.8579

13、7.1675<0.05組內(nèi)20.0938210.9568總33.809623第二節(jié) 雙因素方差分析一、問題的提出在醫(yī)學(xué)研究中,影響我們所關(guān)心的某個(gè)研究指標(biāo)的因素往往不止一個(gè),而是許多因素。它們相互聯(lián)結(jié),相互滲透,相互對立,又相互依存。隨著因素的增多,要透過表面現(xiàn)象抓住事物的本質(zhì),揭示出事物發(fā)展的內(nèi)部規(guī)律就愈加困難,這里有兩個(gè)方面的問題: 一是如何進(jìn)行實(shí)驗(yàn)設(shè)計(jì),使得實(shí)驗(yàn)次數(shù)既少,獲得的信息又多;一是如何分析數(shù)據(jù)。多因素實(shí)驗(yàn)最簡單 的設(shè)計(jì)是全面實(shí)驗(yàn),即把每個(gè)因素的水平一切可能的組合都做一遍,這種方法的優(yōu)點(diǎn)是揭示事物內(nèi)部的規(guī)律性比較清楚。但是,全面實(shí)驗(yàn)一般實(shí)驗(yàn)次數(shù)太多,當(dāng)因素較多時(shí),在實(shí)際上是

14、行不通的,因此是不值得提倡的。當(dāng)只有兩個(gè)因素時(shí), 我們一般采用隨機(jī)區(qū)組設(shè)計(jì)、交叉設(shè)計(jì)、析因設(shè)計(jì)等等。先看下面三個(gè)例子:4窩不同種系的大白鼠例4-2為研究注射不同劑量雌激素對大白鼠子宮重量的影響,取表4-4大白鼠注射不同劑量雌激素后的子宮重量/g合計(jì)縫合方法1個(gè)月2個(gè)月1030(b=4),每窩3只,隨機(jī)地分配到3個(gè)組內(nèi)k=3)接受不同劑量雌激素的注射,然后測定其 子宮重量,結(jié)果見表 4-4。問注射不同劑量的雌激素對大白鼠子宮重量是否有影響?大白鼠7r 、 BT Xj' iy 丿種類0.20.40.80A106116145367B4268115225C70111133314D4263871

15、92n °縫合后時(shí)間)44412(N )E65.089.5120.091.5(X )bTV"J壬2603584801 098 近 X )bQT Xjj壬19 66434 37059 508113 542吃 X?)(*資料來自徐勇勇主編醫(yī)學(xué)統(tǒng)計(jì)學(xué))例4-3為了研究蒸餾水的PH值和硫酸銅溶液濃度對化驗(yàn)血清中白蛋白與球蛋白的影響,將蒸餾水PH值和硫酸銅濃度分成如表4-5所示的水平進(jìn)行實(shí)驗(yàn):表4-5蒸餾水的PH值和硫酸銅溶液濃度兩因素的水平分組情況水平因素1234PH值5.405.605.705.80硫酸銅濃度0.040.080.10實(shí)驗(yàn)米取交叉分組,即同一種血清,在不同的PH值和

16、不同的硫酸銅濃度配比之下各做一次,實(shí)驗(yàn)結(jié)果(白蛋白與球蛋白之比)如表4-6所示:表4-6血清實(shí)驗(yàn)結(jié)果(白蛋白與球蛋白之比)PH值硫酸銅濃度5.405.605.705.800.043.52.62.01.40.082.32.01.50.80.102.01.91.20.3對于這樣一個(gè)實(shí)驗(yàn)該如何分析?例4-4將20只神經(jīng)損傷的家兔隨機(jī)等分4組,分別用兩種神經(jīng)縫合方法、在縫合后兩個(gè)時(shí)間觀察縫合后神經(jīng)的軸突通過率,試驗(yàn)結(jié)果見表4-7。試進(jìn)行統(tǒng)計(jì)分析。表4-7家兔神經(jīng)縫合后軸突通過率(%)A雌激素劑量/ug *100g10403070外膜縫合5060103010502050束膜縫合307050603030(

17、*資料來自郭祖超主編醫(yī)學(xué)統(tǒng)計(jì)學(xué))以上三個(gè)例子,均是研究兩個(gè)因素對觀察指標(biāo)的影響情況的問題,但是從設(shè)計(jì)角度來看,是稍微有點(diǎn)不同的, 例4-2的設(shè)計(jì)是隨機(jī)區(qū)組設(shè)計(jì)(randomized block design )又稱配伍組設(shè)計(jì)。這種設(shè)計(jì)相當(dāng)于配對設(shè)計(jì)的擴(kuò)大。具體做法是將受試對象按性質(zhì)(如實(shí)驗(yàn)動物的性別、 體重,病人的性別、年齡及病情)相同或相近者組成b個(gè)單位組(配伍組),每個(gè)單位組中有k個(gè)受試對象,分別隨機(jī)地分配到 k個(gè)處理組。這樣,各個(gè)處理組所用受試對象不僅數(shù)量 相同,生物學(xué)特點(diǎn)也較均衡。例4-3是利用交叉分組無重復(fù)設(shè)計(jì),方法是:先將兩個(gè)因素的各個(gè)水平全面組合,然后在不同組合條件下只做一次實(shí)驗(yàn)

18、。而例4-4所采取的是交叉分組有重復(fù)設(shè)計(jì),即析因設(shè)計(jì),方法與交叉分組無重復(fù)設(shè)計(jì)基本相同,不同之處就在于在不同組合條件下是進(jìn)行重復(fù)實(shí)驗(yàn)的,即實(shí)驗(yàn)次數(shù)不止一次。對于以上不同的設(shè)計(jì)情況,其分析數(shù)據(jù)的方法也各不相同,但是其基本思想大多來自方差分析,所以方差分析是分析雙因素?cái)?shù)據(jù)的一個(gè)基本方法。二、無交互作用的雙因素方差分析象例4-2隨機(jī)區(qū)組設(shè)計(jì)資料,或者例 4-3交叉分組無重復(fù)設(shè)計(jì)的資料,均可以使用無交互作用的雙因素方差分析的方法。其基本思想類似于單因素的方差分析的方法,將總變異分解成處理變異、區(qū)組變異和誤差(或者說:因素1的變異、因素2的變異和誤差)。下面以例4-2為例介紹其方差分析的步驟-(雌激素對

19、大白鼠子宮重量無影響);0123H/ /不等或不全相等(雌激素對大白鼠子宮重量有影響);11 '2 '3 - 0.012 計(jì)算F值列方差分析表,計(jì)算各離均差平方和SS,自由度;,均方MS和F值。表4-8隨機(jī)區(qū)組設(shè)計(jì)的方差分析計(jì)算表SSMS處理處理二 k -1MS處理 SS處理處理F處理MS處理MS誤差區(qū)組二b 1SS組SS組區(qū)組F區(qū)組 MS區(qū)組MS區(qū)組SS誤差誤差S9差二SS、一 SS理-、S誤差區(qū)蛋' 總一處理一區(qū)組 MS誤差=N - k 一 b 1誤差總計(jì)SS、=N -117fb、瓦X ijli =1丿k區(qū)組二 b -1處理組間離均差平方和 s$理及自由度、處理的計(jì)

20、算與單因素方差分析的一樣,單位組間離均差平方和按下式計(jì)算:b 2SS立八k X j - x八j 生j =1各部分均方的計(jì)算方法也同完全隨機(jī)設(shè)計(jì)資料。注意,在計(jì)算f處理值時(shí),分母是誤差均方MS誤差,分子是MS處理。本例:C= 1098 2 =100 467,12SS、 = 113 542 -00 467=13 075 ,2 2 2SS理二 260一358480 -100 467=6 074SS且2 2 2 2367 225 314 1923-100 467 =6 457.67S3差工 13 075-6 074-6 457.67=543.33。列方差分析表:按表 4-8填入離均差平方和并計(jì)算相應(yīng)的

21、自由度;、均方MS和F值,得表4-9。變異來源SSVMSF值P值處理6 074.0023 037.0033.540.01區(qū)組6 457.6732 152.5623.77<0.01誤差543.33690.55總計(jì)13 075.0011表4-9例4-2資料方差分析3 .查F值(附表4)表,確定P值,下結(jié)論本例+處理=2 ,”誤差二6 ,查附表4得,F(xiàn)0.01(2,6)= 10.92,因F 處理 > F 0.0i(2,)= 10.92,所以 P 0.01 。結(jié)論;按=o.oi水準(zhǔn),拒絕 h 0,可以認(rèn)為3個(gè)劑量組的大白鼠子宮重量的差別具 有統(tǒng)計(jì)學(xué)意義,即注射不同劑量的雌激素對大白鼠子宮的

22、重量有影響。若想進(jìn)一步了解哪兩組間有差別,可進(jìn)行多個(gè)均數(shù)的兩兩比較,具體見本章第三節(jié)。隨機(jī)區(qū)組設(shè)計(jì)在進(jìn)行方差分析時(shí)將區(qū)組間的變異從組內(nèi)變異中分解出來,當(dāng)區(qū)組之間差異有統(tǒng)計(jì)學(xué)意義時(shí),其誤差較完全隨機(jī)設(shè)計(jì)小,使試驗(yàn)效率提高。三、有交互作用的雙因素方差分析在一些實(shí)驗(yàn)中,不僅因素對研究指標(biāo)有影響,而且因素之間還會聯(lián)合起來對研究指標(biāo)產(chǎn)生作用,這個(gè)聯(lián)合的作用叫做交互作用。先看先面兩個(gè)實(shí)驗(yàn):A1A2A1A2B125B125B2710B273左邊一個(gè)實(shí)驗(yàn),當(dāng)A從A1變化到A2時(shí),研究指標(biāo)都增加3,與B取B1或B2無關(guān);同樣,B從B1變化到B2時(shí),研究指標(biāo)都增加5,與A的水平無關(guān),即A2-A1B2-B 1B13

23、A15B23A25我們將A與B沒有交互作用。而右邊一個(gè)實(shí)驗(yàn)情況則大不一樣,且看A2-A1B2-B 1B13A15B2-4A2-2這就是說,因素A對指標(biāo)的影響與 B取什么水平有關(guān),因素B對指標(biāo)的影響與 A取什 么水平也有關(guān),這時(shí)我們就稱 A和B之間有交互作用,記作 A X B。現(xiàn)在以例4-4的資料為例來介紹最簡單的2 X 2析因設(shè)計(jì)方差分析。所謂2X 2析因設(shè)計(jì)(factorial experiment),就是有G個(gè)處理組由2個(gè)因素(每個(gè)因素 有2個(gè)水平)全面組合而成,對此就有4個(gè)處理組。然后,采用完全隨機(jī)設(shè)計(jì)安排4個(gè)處理組。2X 2析因設(shè)計(jì)方差分析的基本思想:是在前面單因素方差分析和無交互作用

24、的方差分 析的基礎(chǔ)上對誤差進(jìn)一步分解。將總變異分解成因素A的變異、因素B的變異、交互作用AX B的變異和誤差四項(xiàng)。注意: 2X2析因設(shè)計(jì)實(shí)驗(yàn)要求各組例數(shù)相等,每組例數(shù)不少于2例,否則無法分析因素之間的交互作用。2X 2析因設(shè)計(jì)方差分析的基本步驟:1. 建立假設(shè)和給定檢驗(yàn)水準(zhǔn)H 0:神經(jīng)縫合方法對縫合后神經(jīng)的軸突通過率無影響H 1:神經(jīng)縫合方法對縫合后神經(jīng)的軸突通過率有一定的影響H 0:縫合后時(shí)間對縫合后神經(jīng)的軸突通過率無的影響H1:縫合后時(shí)間對縫合后神經(jīng)的軸突通過率有一定的影響H 0:神經(jīng)縫合方法和縫合后時(shí)間無交互作用H神經(jīng)縫合方法和縫合后時(shí)間有交互作用,/. =0.052. 按表4-10 2

25、 X 2析因設(shè)計(jì)的方差分析表計(jì)算表4-10 2 X 2析因設(shè)計(jì)的方差分析表變異來源VSSmsfp處理間31 2SStr=Ti _Cr主效應(yīng)a11 八 2"2SSa=A1 ' A22r-CMS aFa= MS a/ MSeB11 4 2 = 2 SSb=B1' B22r-CMSbFb= MSb/ MSe交互作用A X B1SSab =SStr -SSa-SSbMS abFab =MS ab/MSe誤差N-4SSe=SSt-SStrMSe合計(jì)N-12SSt=匕 X -C注:A1、A2表示A因素兩水平的小計(jì);B1> B2表示B因素兩水平的小計(jì),Tj(i=1,2,3,4

26、)為4個(gè)處理組小計(jì);r為每組的例數(shù);c=' X 2N本例中,i=j=2,r=5,T i=120,T2=220,T3=140,T4=260,Ai=340,A2=400,Bi=260,B2=480,代入表4-10,得到表4-11的結(jié)果表4-11例4-4析因?qū)嶒?yàn)的方差分析表變異來源ssVmsFP處理26203a18011800.60>0.05B2420124208.07<0.05A X B201200.07>0.05誤差480016300總7420193. 查F臨界值表,確定P值4. 推斷下結(jié)論。根據(jù)表4-11結(jié)果,在=0.05的水準(zhǔn)下,只有縫合時(shí)間(B因素)對神經(jīng)的軸突通

27、過率 有影響。第三節(jié) 多組間的兩兩比較當(dāng)方差分析結(jié)果為p<0.05時(shí),只說明k組總體均數(shù)之間不同或不完全相同。若想進(jìn)一步了解哪兩組的差別有統(tǒng)計(jì)學(xué)意義,需進(jìn)行多個(gè)均數(shù)間的兩兩比較或稱均數(shù)間的多重比較 (multiple compariso n)。若用上一章學(xué)習(xí)的兩均數(shù)比較的t檢驗(yàn)進(jìn)行多重比較,將會加大I類錯(cuò)誤的概率,從而可能把本無差別的兩個(gè)總體均數(shù)判為有差別。例如,有4個(gè)均數(shù),兩兩組合數(shù)為 C42=6,若用t檢驗(yàn)做6次比較,且每次比較的檢驗(yàn)水準(zhǔn)選為二=0.05,則每次比較不犯I類錯(cuò)誤的概率為(1-0.05 ), 6次均不犯I類錯(cuò)誤的概率為 (1-0.05) 6,這時(shí), 總的檢驗(yàn)水準(zhǔn)為1-(

28、1-0.05) 6=0.26,比0.05大多了。因此,均數(shù)間的多重比較不能直接用 兩均數(shù)t檢驗(yàn)的檢驗(yàn)水準(zhǔn)和標(biāo)準(zhǔn)誤。多重比較檢驗(yàn)的方法很多,如最小顯著差異檢驗(yàn)(Least significant differenee test,LSDtest)、Duca n 多界值檢驗(yàn)(Ducan 'multiple range test),亦稱 Duncan 新法、Newma n-Keuls 檢 驗(yàn)(Student-Newman-Keuls test,SNK test)、Tukey 檢驗(yàn)(Tukey ' honest significant differenee test,HSD test)、

29、Scheffe 檢驗(yàn)(Scheffe'test)和 Dunnett 檢驗(yàn)(Dunnett test)等,這些方法的 原理基本相似,不同的是其檢驗(yàn)界值有所不同,SNK檢驗(yàn)的敏感性居中。沒有一種檢驗(yàn)在任何情況下都是最好的。目前對多個(gè)均數(shù)兩兩之間的全面比較,最常選用SNK檢驗(yàn)法;LSD檢驗(yàn)法適用于一對或幾對在專業(yè)上有特殊意義的均數(shù)間差別的比較;Dunnett檢驗(yàn)法適用于幾個(gè)處理組與一個(gè)對照組均數(shù)差別的多重比較,該檢驗(yàn)有專門與之對應(yīng)的檢驗(yàn)臨界值。另外還可以通過校正檢驗(yàn)水準(zhǔn)Bonferroni校正檢驗(yàn)(Bonferroni correction test )。下面介紹四種多重比較的常用方法: S

30、NK檢驗(yàn)、LSD檢驗(yàn)、Dunnett檢驗(yàn)和Bonferroni校正檢驗(yàn)法。1、SNK檢驗(yàn)SNK檢驗(yàn),亦稱q檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量q的計(jì)算方法見下式XiXj其中M S誤差'丄+丄)2 e nj 丿式中,X i , ni為第i組的樣本均數(shù)及樣本例數(shù),x i , ni為第j組的樣本均數(shù)及樣本例數(shù),m s誤差為方差分析表中的誤差均方。完全隨機(jī)設(shè)計(jì)資料,m s誤差即是m s組內(nèi)。例4-6 續(xù)例4-1。試比較3種治療方案療效兩兩之間的差別。i.建立假設(shè)并確定檢驗(yàn)水準(zhǔn):H 0 :J j (即任兩對比組的血紅蛋白含量的總體均數(shù)相等);H1:J j (即各對比組的血紅蛋白含量的總體均數(shù)不等或不全相等);:=0

31、.052 計(jì)算q值將3個(gè)樣本均數(shù)從小到大排列,并賦予秩次:均數(shù)0.65001.12502.4375組別B萬案C萬案A萬案秩次123列出對比組(見表4-16 第(1)欄),并計(jì)算兩對比組均數(shù)之差的絕對值(見表4-16第(2)欄)。如第一行兩對比組均數(shù)之差的絕對值為:|0.6500-1.1250| =0.475。 寫出兩對比組所包含的組數(shù):-(見表4-16第(3)欄)。如第2行,1與3比,包含了 1,2,3三個(gè)組,故=3。 計(jì)算檢驗(yàn)統(tǒng)計(jì)量 q值。本例已求得 MS誤差=0.9568 (見表4-3),又各組列數(shù)均為10,所以,由公式4-5計(jì)算q值,其中sx=y警(8+8卜0.3458。結(jié)果見表4-16

32、第(4)欄。表4-163個(gè)均數(shù)兩兩比較q值表比較組秩次XiXjaqP值(1)(2)(3)(4)(5)1 , 20.475021.374>0.051 , 31.787535.169<0.012, 31.312523.796<0.053.查界q值表(附表5),確定P值,下結(jié)論已知、.誤差二21,查附表5,=2 時(shí),q=2.95 ;0.05(20,3)=3 時(shí),q3.58 ,q4.64。0.05(20,3)0.01(20,3)以實(shí)際的q值和相應(yīng)的q界值做比較,確定對應(yīng)的P值(見表4-16第(5)列)。結(jié)論:按=0.05水準(zhǔn),除了 1與2組外均拒絕H。,可以認(rèn)為血紅蛋白上升克數(shù)在A方

33、案和B方案、A方案和C方案之間有統(tǒng)計(jì)學(xué)意義,而B方案和C方案之間沒有統(tǒng)計(jì)學(xué)意義。2、LSD檢驗(yàn)LSD檢驗(yàn),即最小顯著差異(Least significant differenee ) t檢驗(yàn)。其統(tǒng)計(jì)量 t的計(jì)算 公式為:XiXjSr巳誤差其中,MS誤差注意,這里的LSD檢驗(yàn)中t統(tǒng)計(jì)量的計(jì)算公式與成組設(shè)計(jì)兩樣本均數(shù)代表的總體均數(shù)比較的t檢驗(yàn)公式是不同的,區(qū)別就在于兩樣本均數(shù)差值的標(biāo)準(zhǔn)誤S和自由度的計(jì)X i -X j算上,在成組設(shè)計(jì)兩樣本均數(shù)代表的總體均數(shù)比較的t檢驗(yàn)公式里是用合并方差s2來計(jì)算,v =ni n2 - 2,而這里是用方差分析表中的誤差均方MS誤差來計(jì)算XiX誤差3、Dunnett

34、檢驗(yàn)Dunnett檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為 q ', q 的計(jì)算公式如下Xi-X。Sx-x;其中SXi殺In n。丿這里,Xni分別為第i個(gè)實(shí)驗(yàn)組的樣本均數(shù)和樣本例數(shù),X。,n。分別為對照組的樣本均數(shù)和樣本例數(shù)。4、Bonferroni校正檢驗(yàn)多重比較的次數(shù)不多(如不超過 5次)時(shí),可以考慮用 Bonferroni校正檢驗(yàn)的方法。假 設(shè)原來所給的檢驗(yàn)水準(zhǔn)為,所用的檢驗(yàn)統(tǒng)計(jì)量是成組設(shè)計(jì)的兩樣本比較的t (或u)統(tǒng)計(jì)量,需要進(jìn)行兩兩比較的次數(shù)為m次,則單次的兩兩比較應(yīng)以:-/m作為檢驗(yàn)的實(shí)際水準(zhǔn),這種校正方法稱為Bonferroni校正檢驗(yàn)。例如,3組均數(shù)之間的兩兩比較,原定=0.05,現(xiàn)在進(jìn)行

35、了 3次t檢驗(yàn),則其每次t檢驗(yàn)的檢驗(yàn)水準(zhǔn)該取 :/3=0.0167,而不是0.05。第四節(jié)方差分析中的若干問題一、題的提出前面已介紹了方差分析的一些常見的一些常見類型,以及這些類型的分析方法。在醫(yī)學(xué)研究的實(shí)際問題中有時(shí)會提出許多如下的問題:數(shù)據(jù)缺失了怎么辦?數(shù)據(jù)不符合方差分析的模型怎么辦?當(dāng)某個(gè)因素是有統(tǒng)計(jì)學(xué)意義時(shí),能否進(jìn)一步判斷這個(gè)因素的各水平之間兩兩也有統(tǒng) 計(jì)學(xué)意義,等等。以上這些問題,就在本節(jié)中展開討論。二、數(shù)據(jù)的處理方差分析的數(shù)據(jù)一般都是通過精心安排的試驗(yàn)而獲得的,當(dāng)研究因素超過一個(gè)時(shí),要求的數(shù)據(jù)很整齊的,否則分析時(shí)會帶來很多麻煩。有時(shí),某些試驗(yàn)不幸做壞了,或者數(shù)據(jù)丟失了,客觀條件不允

36、許重做。 例如,在實(shí)驗(yàn)中,一只實(shí)驗(yàn)動物不是處理之故而生病或突然死亡, 或由于測量儀器發(fā)生故障, 致使實(shí)驗(yàn)數(shù)據(jù)發(fā)生缺失,這時(shí)就要考慮有無統(tǒng)計(jì)學(xué)方法進(jìn)行彌補(bǔ)。 彌補(bǔ)數(shù)據(jù)可以有各種各樣的原則,最常用的是使SSe達(dá)到最小的辦法。 下面分兩種情況進(jìn)行討論1、 試驗(yàn)有重復(fù),并且每個(gè)處理至少有一個(gè)數(shù)據(jù)沒有缺失。這種情況最簡單,既然每種處理都有數(shù)據(jù),那么缺失的數(shù)據(jù)就是同處理而沒有丟失數(shù)據(jù)的平均值來代替。如果總共丟失了m個(gè)數(shù)據(jù),則誤差的自由度等于原誤差自由度減去m,2、 有些處理的數(shù)據(jù)缺失。這種情況主要以隨機(jī)區(qū)組設(shè)計(jì)和正交設(shè)計(jì)為多見。即補(bǔ)上去的m個(gè)數(shù)不能算在自由度之內(nèi)。C大白鼠,劑量0.2和B大白鼠,劑量0.4

37、對應(yīng)的兩個(gè)數(shù)據(jù)缺失,分別記為a和b,按表4-12進(jìn)行計(jì)算。表4-12大白鼠注射不冋劑量雌激素后的子宮重量/g大白鼠 種類雌激素劑量/ugJ*100g3、Xij0.20.40.80i =4A106116145367B42b115157+bCa111133244+aD4263871924- X ij j 1190+a290+b480960+a+b2由表 4-12 得, C=( 960+a+b) /121 2 2 2SStr=x (190+a) +(290+b) +480 -C先看一個(gè)例子,假如例4-2中缺失了1 2 2 2 2SSb=x 367 +(157+b) +(244+a) +192 -C42 2 2 2 2SSt=106 +116 + +87 +a +b -CSSe= SSt- SStr- SSb現(xiàn)在SS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論