醫(yī)學(xué)統(tǒng)計學(xué)第講方差分析_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)第講方差分析_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)第講方差分析_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)第講方差分析_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)第講方差分析_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

章方差分析——多組均數(shù)的比較節(jié)方差分析的基本思想和應(yīng)用條件一、方差分析的基本思想2020/12/181

例8-1某大學(xué)營養(yǎng)與食品衛(wèi)生研究所將800只條件一致的雌性果蠅隨機分配到4種不同濃度的某受試物培養(yǎng)基組,各組200只。經(jīng)2至3月的培養(yǎng)試驗,得各組壽命最高的10只果蠅的生存天數(shù)如下,試比較各最高壽命組的平均生存天數(shù)。

2020/12/182濃度生存天數(shù)合計0%:616364646565666668686500.022%:626364646566676970706600.067%:636464656768686970706680.600%:65666667686870727476692

表8-1某受試物不同濃度組最高壽命果蠅的生存天數(shù):i組第j個數(shù)據(jù)

:i組的樣本均數(shù)g:處理組數(shù)

:全部數(shù)據(jù)的樣本均數(shù)

:i個處理組的例數(shù)

2020/12/183各組樣本均數(shù)各不相等,可能由兩種原因引起:①隨機誤差(抽樣誤差、測量誤差等);②處理因素,即不同的處理引起不同的作用或效果。2020/12/184三種變異:

⑴總變異:全部數(shù)據(jù)大小不同所引起的總變異程度。⑵(處理)組間變異:各處理組樣本均數(shù)間的變異,由隨機誤差及各處理組總體均數(shù)(可能)不同所引起。2020/12/185⑶組內(nèi)變異:各組內(nèi)部數(shù)據(jù)的變異,由隨機誤差引起。2020/12/186

方差分析的原假設(shè)H0為各組的總體均數(shù)相等。若H0成立,則組間變異和組內(nèi)變異均只反映隨機誤差,此時理論上,F(xiàn)=1。反之,若各樣本不是來自同一總體(處理因素有效應(yīng)),則組間變異不僅反映隨機誤差,還包括處理因素的效應(yīng),此時組間均方應(yīng)明顯大于組內(nèi)均方,即,F(xiàn)>1。根據(jù)F分布的分布規(guī)律,通過查F界值表,由P值作出統(tǒng)計推斷。拒絕H0,接受H1,可認為各總體均數(shù)不等或不全相等;反之,則差別無統(tǒng)計學(xué)意義,尚不能認為各總體均數(shù)不等或不全相等。2020/12/1872020/12/188

完全隨機設(shè)計方差分析的基本思想:將全部測量值總的離均差(總變異)平方和分解為處理組間(組間變異)平方和與組內(nèi)(誤差)平方和兩部分,將總變異的自由度分解為組間變異自由度與組內(nèi)變異自由度兩部分。用各平方和除以各自的自由度,分別得到組間均方、誤差均方。用組間均方除以誤差均方得F值。根據(jù)F分布的規(guī)律推論處理因素的作用。2020/12/189二、方差分析的應(yīng)用條件

理論上要求數(shù)據(jù)滿足以下兩個條件:(1)各樣本相互獨立,均服從正態(tài)分布;(2)各樣本的總體方差相等,即具有方差齊性(homogeneityofvariance)。2020/12/1810

第二節(jié)

完全隨機設(shè)計多組均數(shù)比較的方差分析

2020/12/1811

分析步驟1.建立檢驗假設(shè)、確定檢驗水準H0:μ1=μ2=μ3=μ4

H1:各μi不全等或全不等

α=0.052.計算各自由度ν、均方MS及F值2020/12/18122020/12/1813平方和的計算:2020/12/1814=399.50-96.30=303.20ν總=N-1=39,ν組間

=g-1=3,ν總=N-g=362020/12/18152020/12/18163.查表確定P值、下結(jié)論查附表(方差分析用)F界值表(P322單側(cè)):<3.81,P<0.05,可認為4處理組總體平均生存天數(shù)不全等或全不等。2020/12/1817方差分析表2020/12/1818datali8_1;doc=1to4;doi=1to10;inputx@@;output;end;end;cards;61636464656566666868626364646566676970706364646567686869707065666667686870727476;proc

univariatenormal;CLASSC;varx;proc

anova;classc;modelx=c;meansc/hovtestdunnett;run;2020/12/1819Levene'sTestforHomogeneityofxVarianceANOVAofSquaredDeviationsfromGroupMeansSumofMeanSourceDFSquaresSquareFValuePr>Fc3362.9121.01.680.1896Error362599.472.20532020/12/1820SumofSourceDFSquaresMeanSquareFValuePr>FModel396.300000032.10000003.810.0180Error36303.20000008.4222222Corrected39399.5000000Total2020/12/1821Comparisonssignificantatthe0.05levelareindicatedby***.DifferenceSimultaneouscBetween95%ConfidenceComparisonMeansLimits4-14.2001.0177.383***3-11.800-1.3834.9832-11.000-2.1834.1832020/12/1822第三節(jié)隨機區(qū)組設(shè)計多個樣本均數(shù)比較的方差分析

隨機區(qū)組設(shè)計

(randomizedblockdesign)

將條件一致的試驗對象編入同一區(qū)組,再隨機分配到各個處理組。2020/12/1823一、實例及符號例8-2.為研究氯化鎘CdCl2對細胞的毒性作用,分別以V79(中國倉鼠肺成纖維細胞)、WI38(人肺細胞株)、L929(小鼠成纖維細胞)、CHO(中國倉鼠卵巢成纖維細胞)、SHE(敘利亞地鼠胚胎細胞株)5種不同細胞作為5個區(qū)組,以3種不同的染毒時間作為3個處理組,觀察細胞的克隆率,資料如表8-3。試比較不同染毒時間組的細胞克隆率。2020/12/18242020/12/1825n:區(qū)組個數(shù)g:處理組個數(shù)

:j區(qū)組內(nèi)第i處理組的數(shù)據(jù)

:j區(qū)組全部數(shù)據(jù)的和

:第j區(qū)組的樣本均數(shù)

SS總=SS處理+SS區(qū)組+SS誤差

總=處理+區(qū)組+誤差2020/12/1826二、分析步驟2020/12/1827

各區(qū)組樣本均數(shù)間的變異,由隨機誤差及各區(qū)組總體均數(shù)可能不同所引起。區(qū)組間變異的大小用區(qū)組間平方和表示。

2020/12/1828=0.0897/4=0.0224=0.0068/8=0.0009

F=0.0094/0.0009=10.442020/12/18293.查表查表確定P值、下結(jié)論2020/12/1830datali8_2;doa=1to3;dob=1to5;inputx@@;output;end;end;cards;0.8800.8230.7630.7110.6690.8230.7900.7480.7010.6430.7740.7650.7070.6700.505;proc

anova;classab;modelx=ab;meansab/snk;run;2020/12/1831Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNbA0.8256731ABA0.7926732BBC0.7393333CC0.6940034D0.60567352020/12/1832第四節(jié)多個樣本均數(shù)的兩兩比較

2020/12/1833多重比較(1)在研究設(shè)計階段未預(yù)先考慮到是否進行均數(shù)的兩兩比較,但經(jīng)假設(shè)檢驗得出多個總體均數(shù)不全相等的提示后,才決定進行多個均數(shù)的兩兩事后比較,這類研究多屬于探索性研究??刹捎肧NK-q檢驗、Bonfferonit檢驗等。(2)在設(shè)計階段就根據(jù)研究目的或?qū)I(yè)知識而計劃好的某些均數(shù)間的兩兩比較,常用于事先有明確假設(shè)的證實性研究,如多個處理組與對照組的比較;某一對或某幾對在專業(yè)上有特殊意義的均數(shù)間的比較等,可采用Dunnett-t檢驗、LSD-t檢驗、Bonfferonit檢驗等。2020/12/1834一、SNK-q檢驗2020/12/1835②計算差值的標準誤:③列表計算q統(tǒng)計量:2020/12/1836⑶確定P

值,做出統(tǒng)計推斷

2020/12/1837二、LSD-t檢驗LSD-t檢驗即最小顯著性差異(leastsignificantdifference)t檢驗,適用于某一對或某幾對在專業(yè)上有特殊意義的均數(shù)間的比較,如多個處理組與對照組的比較,或某幾個處理組間的比較,一般在設(shè)計階段確定哪些均數(shù)需進行多重比較。2020/12/18381.建立檢驗假設(shè),確定檢驗水準2020/12/18392020/12/1840

第五節(jié)析因設(shè)計的方差分析

一、析因分析的基本概念2020/12/18412020/12/18421.單獨效應(yīng):單獨效應(yīng)是指其它因素水平固定,同一因素不同水平間指標平均值的差別。如表8-8中,B因素固定在1水平時A因素1水平的指標平均值為24,B因素固定在1水平時A因素2水平的指標平均值為28,則得B因素固定在1水平時A因素的單獨效應(yīng)為28-24=4。2020/12/18432.主效應(yīng):主效應(yīng)是指某因素各單獨效應(yīng)的

平均值。A因素的主效應(yīng)=(4+8)/2=6(%)

B因素的主效應(yīng)=(20+24)/2=22(%)3.交互效應(yīng):某因素的各單獨效應(yīng)隨另一因素變化而變化時,稱兩因素間存在交互作用。因素A的各單獨效應(yīng)隨因素B的水平變化而變化的大小稱交互效應(yīng),記作AB或BA。

AB=BA=[(a2b2-a1b2)-(a2b1-a1b1)]/2=(24-20)/2=2(%)2020/12/1844二、變異分解2020/12/18452020/12/1846三、析因設(shè)計方差分析的基本步驟

2020/12/18472020/12/1848datali8_4;doa=1to2;dob=1to2;dof=1to5;inputx@@;y=x/100;output;end;end;end;cards;1010405010303070603010203050305050706030;proc

anova;classab;modely=ab;run;2020/12/1849TheANOVAProcedureDependentVariable:ySumofSourceDFSquaresMeanSquareFValuePr>FModel20.260000000.130000004.590.0256Error170.482000000.02835294CorrectedTotal190.74200000R-SquareCoeffVarRootMSEyMean0.35040445.509000.1683830.370000SourceDFAnovaSSMeanSquareFValuePr>Fa10.018000000.018000000.630.4366b10.242000000.242000008.540.00952020/12/1850

三因素析因設(shè)計舉例用5×2×2析因設(shè)計研究5種類型的軍裝在兩種環(huán)境、兩種活動狀態(tài)下的散熱效果,觀察指標是從“冷”到“熱”按等級評分,每種處理重復(fù)實驗5次。試作方差分析。2020/12/1851datab3ys;doa=1to5;dob=1to2;doc=1to2;doi=1to5;inputx@@;output;end;end;end;end;cards;2020/12/18520.25-0.251.25-0.750.404.753.454.004.854.55/*a1b1c1、c2×5*/0.502.102.751.002.353.754.004.004.254.60/*a1b2c1、c2×5*/0.300.100.50-0.350.054.604.804.005.204.30/*a2b1c1、c2×5*/1.501.501.251.372.554.004.054.154.104.25/*a2b2c1、c2×5*/0.75-0.500.600.40-0.204.553.504.254.104.40/*a3b1c1、c2×5*/0.752.653.000.051.174.105.004.204.154.175/*a3b2c1、c2×5*/0.20-1.000.85-0.500.904.253.104.005.004.20/*a4b1c1、c2×5*/-0.750.900.950.6251.053.2754.254.004.254.25/*a4b2c1、c2×5*/-0.100.002.500.10-0.104.7254.304.104.803.60/*a5b1c1、c2×5*/1.752.401.753.052.754.804.024.154.754.80/*a5b2c1、c2×5*/;proc

anova;classabc;modelx=abca*ba*cb*ca*b*c;run;2020/12/1853

TheANOVAProcedureDependentVariable:xSumofSourceDFSquaresMeanSquareFValuePr>FModel19316.205804016.642410738.72<.0001Error8034.38446000.4298057CorrectedTotal99350.5902640R-SquareCoeffVarRootMSExMean0.90192425.503610.6555962.570600SourceDFAnovaSSMeanSquareFValuePr>Fa45.20898651.30224663.030.0222b19.92880109.928801023.10<.0001c1283.3498890283.3498890659.25<.0001a*b41.94127150.48531791.130.3488a*c41.47950850.36987710.860.4914b*c112.687844012.687844029.52<.0001a*b*c41.60950350.40237590.940.44742020/12/1854補充:正交設(shè)計與方差分析析因設(shè)計是全面試驗,各因素各水平的全面組合得到g個處理。正交設(shè)計是非全面試驗。2020/12/18552020/12/18562020/12/18572020/12/18582020/12/18592020/12/1860ABABCD2020/12/1861databzhj;inputabcdx@@;cards;111186112295121291122194211291212196221183222288;proc

anova;classabcd;modelx=abcda*b;run;2020/12/1862

TheANOVAProcedureDependentVariable:xSumofSourceDFSquaresMeanSquareFValuePr>FModel5141.000000028.200000011.280.0834Error25.00000002.5000000CorrectedTotal7146.0000000R-SquareCoeffVarRootMSExMean0.9657531.7471151.58113990.50000SourceDFAnovaSSMeanSquareFValuePr>Fa18.000000008.000000003.200.2155b118.0000000018.000000007.200.1153c160.5000000060.5000000024.200.0389d14.500000004.500000001.800.3118a*b150.0000000050.0000000020.000.04652020/12/1863第六節(jié)重復(fù)測量資料的方差分析

一、重復(fù)測量資料的數(shù)據(jù)特征重復(fù)測量資料(repeatedmeasurementdata)是指同一觀查對象被給予某種處理后,在不同時間點上對某指標進行多次測量所得的資料;有時是指從同一觀查對象不同部位(或組織)上重復(fù)測得某指標的資料。(一)重復(fù)測量資料的類型1.單因素重復(fù)測量設(shè)計資料2020/12/1864例8-5.從6名健康人抽血后制成血濾液。每個受試者的血濾液分成4份,把4份血濾液隨機分別放置0、45、90、135分鐘,測定其血糖濃度如表8-10。2020/12/18652.兩因素重復(fù)測量設(shè)計資料例8-6.為比較兩種同類藥物A、B在體內(nèi)的代謝速度,將10名受試對象隨機分為兩組,一組給予A藥,另一組給予B藥。分別在服藥后1、2、4、6小時測定血中的藥物濃度,結(jié)果見表8-11。2020/12/18662020/12/1867(二)重復(fù)測量設(shè)計與隨機區(qū)組設(shè)計的區(qū)別1.重復(fù)測量設(shè)計中,各觀察對象各時間點是固定的,同一觀察對象依次接受各時間點的測量。兩因素重復(fù)測量設(shè)計中,處理(如例8-6中的藥物因素)是在觀察對象間隨機分配,不能在各時間點隨機分配。在隨機區(qū)組設(shè)計中,各區(qū)組內(nèi)有多個條件一致的觀察對象,每個觀察對象隨機分配給一種處理。2.隨機區(qū)組設(shè)計中,各區(qū)組內(nèi)各處理水平相互獨立,各區(qū)組內(nèi)各觀察對象所得數(shù)據(jù)相互獨立。重復(fù)測量設(shè)計中各區(qū)組內(nèi)的數(shù)據(jù)重復(fù)測自同一觀察對象,他們之間往往有較高的相關(guān)性。3.為了有效地處理重復(fù)測量資料間的相關(guān)性,須使用特定模型的多元方法。如對單因素重復(fù)測量設(shè)計資料,必須滿足“球?qū)ΨQ”(sphericity)的假設(shè)條件,方可采用完全隨機設(shè)計方差分析,否則會增大Ⅰ型錯誤的概率。2020/12/1868二、重復(fù)測量資料的變異平方和及自由度分解

(-)單因素重復(fù)測量設(shè)計資料2020/12/1869(二)兩因素重復(fù)測量設(shè)計資料2020/12/1870

三、重復(fù)測量設(shè)計資料的方差分析

(-)單因素重復(fù)測量設(shè)計資料對例8-5的資料,進行SAS編程:datali8_5;inputgrptime1-time4@@;cards;15.275.274.944.61 15.315.264.934.70 15.885.835.385.01 15.495.435.325.04 15.665.445.384.88 16.225.725.615.22;proc

glm;/*調(diào)用一般線性模型*/2020/12/1871classgrp;modeltime1-time4=grp/*將time1-time4按一整體作反應(yīng)變量*//nouni;/*不把time1-time4作4個獨立變量*/repeatedtime4/*重復(fù)測量因素的變量名為

time,水平為4*//printe;/*作球性檢驗*/run;2020/12/1872TheGLMProcedureRepeatedMeasuresAnalysisofVarianceSphericityTestsMauchly'sVariablesDFCriterionChi-SquarePr>ChiSqTransformedVariates50.30674174.39873320.4935OrthogonalComponents50.43474523.10059280.68452020/12/1873TheGLMProcedureRepeatedMeasuresAnalysisofVarianceUnivariateTestsofHypothesesforWithinSubjectEffectsAdjPr>FSourceDFTypeIIISSMeanSquareFValuePr>FG-GH-Ftime31.814433330.6048111147.00<.0001<.0001<.0001time*grp00.00000000.....Error(time)150.193016670.012867782020/12/1874(二)兩因素重復(fù)測量設(shè)計資料

對例8-6的資料,進行SAS編程:datali8_6;inputgt1-t4@@;cards;19.1253.1654.8945.8815.1048.7877.3961.2913.3720.6571.2275.0816.5130.0774.2675.6911.995.8480.2669.82213.5527.1046.8853.2121.0225.1254.0344.1522.1514.2368.7464.6526.1825.8345.7054.2521.6840.2932.3471.00;2020/12/1875proc

glm;classg;modelt1-t4=g/nouni;repeatedt4/printe;run;2020/12/1876TheGLMProcedureRepeatedMeasuresAnalysisofVarianceSphericityTestsMauchly'sVariablesDFCriterionChi-SquarePr>ChiSqTransformedVariates50.141838713.1289340.0222OrthogonalComponents50.24516149.45035990.09242020/12/1877TheGLMProcedureRepeatedMeasuresAnalysisofVarianceTestsofHypothesesforBetweenSubjectsEffectsSourceDFTypeIIISSMeanSquareFValuePr>Fg1794.5048225794.504822519.320.0023Error8328.999680041.12496002020/12/1878TheGLMProcedureRepeatedMeasuresAnalysisofVarianceUnivariateTestsofHypothesesforWithinSubjectEffectsAdjPr>FSourceDFTypeIIISSMeanSquareFValuePr>FG-GH-Ft322209.527317403.1757746.04<.0001<.0001<.0001t*g3654.25557218.085191.360.27990.28590.2838Error(t)243859.28040160.803352020/12/1879思考題1.t檢驗與方差分析的異同點?相同點:⑴計量資料⑵單因素研究⑶實驗設(shè)計:①完全隨機②配對與區(qū)組⑷條件:①正態(tài)②方差齊性不同點:⑴水平數(shù)⑵檢驗方法⑶多組比較不能兩兩t檢驗2020/12/18802.完全隨機設(shè)計方差分析與隨機區(qū)組設(shè)計方差

分析的異同點?相同點:⑴計量資料⑵單因素研究⑶多水平⑷方差分析⑸修正數(shù),總平方和、組間平方和及其自由度計算不同點:⑴實驗設(shè)計⑵平方和、自由度的分解⑶區(qū)組因素⑷組內(nèi)平方和,區(qū)組、誤差平方和⑸檢驗效能2020/12/1881單選題:1.完全隨機設(shè)計資料的方差分析中,必然有()A.SS組間>SS組內(nèi)

B.MS組間<MS組內(nèi)

C.MS總=MS組間+MS組內(nèi)D.SS總=SS組間+SS組內(nèi)E.組間>組內(nèi)2.在完全隨機設(shè)計資料的方差分析中,有()A.MS組內(nèi)>MS誤差

B.MS組間<MS誤差

C.MS組內(nèi)=MS誤差

D.MS組間=MS誤差E.MS組內(nèi)<MS組間2020/12/18823.方差分析結(jié)果,F(xiàn)處理>,則統(tǒng)計推斷是()。A.各總體均數(shù)不全相等或全不相等B.各總體均數(shù)都不相等C.各樣本均數(shù)都不相等D.各樣本均數(shù)間差別都有顯著性E.各總體方差不全相等4.完全隨機設(shè)計方差分析的實例中有()。A.組間SS不會小于組內(nèi)SSB.組間MS不會小于組內(nèi)MSC.F值不會小于1D.F值不會是負數(shù)E.F值不會是正數(shù)2020/12/18835.完全隨機設(shè)計方差分析中的組間均方是()的統(tǒng)計量A.表示抽樣誤差大小B.表示N個數(shù)據(jù)的離散程度C.表示某處理因素的效應(yīng)作用大小D.表示某處理因素的效應(yīng)和隨機誤差兩者綜合影響的結(jié)果E.表示隨機因素的效應(yīng)大小6.配對設(shè)計資料,若滿足正態(tài)性,要對兩樣本均數(shù)的差別做比較,可選擇()A.隨機區(qū)組設(shè)計的方差分析B.u檢驗C.成組t檢驗D.卡方檢驗E.秩和檢驗2020/12/1884練習(xí)題1、湖水中不同季節(jié)氯化物含量測量值(mg/L)如下,試分析不同季節(jié)氯化物平均含量是否不同。春季:22.6

22.8

21.0

16.9

20.0

21.9

21.5;夏季:21.2

19.1

22.8

24.5

18.0

15.2

18.4

20.1

21.2;秋季:18.9

13.6

17.2

15.1

16.6

14.2

16.719.6

19.0;冬季:16.9

17.6

14.8

13.1

16.9

16.2

14.8

完全隨機設(shè)計方差分析2020/12/1885(1)該題應(yīng)采用方法()。(2分)A完全隨機設(shè)計的方差分析B配伍組隨機設(shè)計的方差分析C兩兩比較的q(snk)檢驗D重復(fù)測量數(shù)據(jù)的方差分析(2)總平方和的計算公式為()。(2分)A.B.C.D.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論