醫(yī)用SAS統(tǒng)計分析(二).ppt_第1頁
醫(yī)用SAS統(tǒng)計分析(二).ppt_第2頁
醫(yī)用SAS統(tǒng)計分析(二).ppt_第3頁
醫(yī)用SAS統(tǒng)計分析(二).ppt_第4頁
醫(yī)用SAS統(tǒng)計分析(二).ppt_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2020年5月15日,1,醫(yī)用SAS統(tǒng)計分析,第二講,醫(yī)用SAS統(tǒng)計分析,第二講,2020年5月15日,2,一、單變量的統(tǒng)計描述,統(tǒng)計分析內(nèi)容回顧統(tǒng)計描述:集中趨勢、離散趨勢統(tǒng)計推斷:參數(shù)估計:總體參數(shù)估計(可信區(qū)間)假設(shè)檢驗資料類型計量資料-數(shù)值變量計數(shù)資料-分類變量資料的分布正態(tài)分布和偏態(tài)分布,2020年5月15日,3,一般統(tǒng)計描述-MEANS過程,MEANS過程除了能對數(shù)值型變量進(jìn)行一般的統(tǒng)計描述之外,還可以作配對設(shè)計資料的t檢驗。語句格式:Procmeans操作選項統(tǒng)計量列表;VAR;/*指定分析的變量名列,缺省為所有數(shù)值變量*/BY;/*按變量名列分組統(tǒng)計,要求已按變量名列排序*/CLASS;/*按變量名列分組統(tǒng)計,不要求排序*/FREQ;/*表明該變量為分析變量的頻數(shù)*/OUTPUT關(guān)鍵字=;/*指定統(tǒng)計量的輸出數(shù)據(jù)集名和統(tǒng)計量對應(yīng)的新變量名*/Run;,2020年5月15日,4,Procmeans操作選項:data=指定要分析的數(shù)據(jù)集名maxdec=指定輸出結(jié)果最大的小數(shù)位數(shù),默認(rèn)為7位noprint禁止統(tǒng)計結(jié)果在output窗輸出alpha=設(shè)定計算可信區(qū)間的水平,默認(rèn)為0.05注:在proc語句中的選項直接跟在proc名后,以空格分隔,中間不加“/”,其他命令語句的選項需以“/”分隔。統(tǒng)計量列表選項:(缺省時只輸出N、MEAN、STD、MIN、MAX),2020年5月15日,5,例1書中例3-1例2某克山病區(qū)測得11名克山病患者與13名健康人的血磷值(mmol/L)如下,試求兩組的平均血磷值和標(biāo)準(zhǔn)差。dataL12;inputgx;cards;10.8411.0511.2011.2011.3911.5311.6711.8011.8712.0712.1120.5420.6420.6420.7520.7620.8121.1621.2021.3421.3521.4821.5821.87;procmeans;varx;byg;run;,2020年5月15日,6,AnalysisVariable:X-G=1-NMeanStdDevMinimumMaximum-111.52090910.42179270.84000002.1100000-G=2-NMeanStdDevMinimumMaximum-131.08615380.42405850.54000001.8700000-,2020年5月15日,7,例3書中例3-3:幾何均數(shù)的計算,SAS程序沒有直接計算幾何均數(shù)的模塊。,datalogmean;inputxf;y=log10(x);cards;20240380616013201;procmeans;vary;freqf;,procprintdata=outmean;datageomean;setoutmean;g=10*logmean;procprintdata=geomean;varg;run;,outputout=outmeanmean=logmean;,2020年5月15日,8,TheSASSystemAnalysisVariable:YNMeanStdDevMinimumMaximum-131.81046540.33396281.30103002.5051500-TheSASSystemOBS_TYPE_FREQ_LOGMEAN10131.81047TheSASSystemOBSG164.6346,2020年5月15日,9,詳細(xì)統(tǒng)計描述-UNIVARIATE過程,Univariate過程可對數(shù)值變量進(jìn)行詳細(xì)的統(tǒng)計描述。除了提供means過程所有的統(tǒng)計描述外,還可以給出了變量的峰度、偏度、眾數(shù)、中位數(shù)及四分位數(shù)等更詳盡的統(tǒng)計描述,同時還可進(jìn)行正態(tài)性檢驗,以及幾個描述分布的圖。,2020年5月15日,10,PROCUNIVARIATE操作選項;VAR;指定分析的變量名列表,缺省為所有數(shù)值變量BY;按變量名列分組統(tǒng)計,要求排序FREQ;表明該變量為分析變量的頻數(shù)OUTPUT關(guān)鍵字=;/*指定統(tǒng)計量的輸出數(shù)據(jù)集名和統(tǒng)計量對應(yīng)的新變量名*/Run;procunivariate語句的操作選項;data=指定要分析的數(shù)據(jù)集名noprint禁止統(tǒng)計結(jié)果在output窗輸出freq詳細(xì)的頻數(shù)表normal進(jìn)行正態(tài)性檢驗plot生成統(tǒng)計圖:莖葉圖,盒狀圖,正態(tài)概率圖,2020年5月15日,11,例4程序3-2dataunil;inputx;cards;39865573108104;procunivariatenormalplot;run;,2020年5月15日,12,MomentsN(樣本含量)12SumWgts(總權(quán)重)12Mean(均數(shù))6.5Sum(合計)78StdDev(標(biāo)準(zhǔn)差)2.54058Variance(方差)6.454545Skewness(偏度g1)0Kurtosis(峰度g2)-1.39044USS(平方和)578CSS(離均差平方和)71CV(變異系數(shù))39.08584StdMean(標(biāo)準(zhǔn)誤)0.733402T:Mean=0(均數(shù)是否為0的檢驗)8.862804Pr|T|(t值對應(yīng)的p值)0.0001Num=0(不等于0的樣本數(shù))12Num0(大于0的樣本數(shù))12M(Sign)(符號檢驗)6Pr=|M|(符號檢驗的p值)0.0005SgnRank(符號秩和檢驗)39Pr=|S|(符號秩和檢驗的p值).0005W:Normal(正態(tài)性檢驗W檢驗)0.932772Pr=182THENY=183;PROCUNIVARIATEFREQ;VARY;RUN;,2020年5月15日,18,AnalysisVariable:XMeanStdDevMinimumMaximum-172.67100004.0756308162.9000000183.5000000-univariate過程略FrequencyTablePercentsPercentsValueCountCellCumValueCountCellCum16311.01.01751515.081.016544.05.017788.089.016777.012.017977.096.01691212.024.018133.099.01711818.042.018311.0100.01732424.066.0,2020年5月15日,19,方法2:語句格式:procfreq;tables變量名;說明:該語句是根據(jù)定義的變量產(chǎn)生頻數(shù)分布表。例7:上例資料DATApsb1;INFILEd:sassas2psb.txt;INPUTX;L=162;/*定義第一組的下限值*/i=2;/*定義組距*/z=(x-mod(x-L,i)+(i/2);/*z值就是將原始變量轉(zhuǎn)化成該數(shù)據(jù)所在組段的組中值*/procfreq;/*根據(jù)z值產(chǎn)生頻數(shù)分布表*/tablesz;procunivariatenormalplot;varz;RUN;mod(x,y)為算術(shù)函數(shù),求x/y的余數(shù)。如mod(10,3)=1,mod(6,2)=0,2020年5月15日,20,CumulativeCumulativeZFrequencyPercentFrequencyPercent-16311.011.016544.055.016777.01212.01691212.02424.01711818.04242.01732424.06666.01751515.08181.017788.08989.017977.09696.018133.09999.018311.0100100.0,2020年5月15日,21,UnivariateProcedureVariable=ZMomentsQuantiles(Def=5)N100SumWgts100100%Max18399%182Mean172.7Sum1727075%Q317595%179StdDev4.013865Variance16.1111150%Med17390%179Skewness0.102995Kurtosis-0.1005625%Q117110%167USS2984124CSS15950%Min1635%166CV2.324183StdMean0.4013861%164T:Mean=0430.2586Pr|T|0.0001Range20Num=0100Num0100Q3-Q14M(Sign)50Pr=|M|0.0001Mode173SgnRank2525Pr=|S|0.0001W:Normal0.9671Pr|T|-6.80000005.2042717-1.30661890.2237-,程序中如無vard;TheSASSystemVariableMeanStdErrorTProb|T|-X1125.90000005.162794224.38601930.0001X2132.70000003.415812938.84873200.0001D-6.80000005.2042717-1.30661890.2237-,2020年5月15日,28,成組t檢驗,原理:H0:SAS程序:procttest;procttest;/*過程名*/class;/*分組變量名*/var;/*分析變量名*/run;,2020年5月15日,29,例9:程序4-3datattest3;doc=1to2;/*c循環(huán)開始,循環(huán)次數(shù)為2*/inputn;/*輸入n值*/doi=1ton;/*i循環(huán)開始,循環(huán)次數(shù)為n*/inputx;/*輸入x值,注意的合理使用*/output;/*output將x輸出,循環(huán)語句中必須使用。*/end;/*i循環(huán)結(jié)束*/end;/*c循環(huán)結(jié)束*/cards;52793343033381983229274310;procprint;procttest;classc;varx;run;,2020年5月15日,30,/*循環(huán)的結(jié)果*/OBSCNIX11512792152334315330341543385155198623122972322748233310,TTESTPROCEDUREVariable:XCNMeanStdDevStdError-15290.4000000056.9938593225.4884287523271.0000000040.5832477823.43074903VariancesTDFProb|T|-Unequal0.56035.60.5971Equal0.50996.00.6284ForH0:Variancesareequal,F=1.97DF=(4,2)ProbF=0.7272,2020年5月15日,31,兩樣本含量相等時,可去除inputn;例10:datat;doc=1to2;doi=1to5;inputx;output;end;end;cards;279334303338198229274310345344;procprint;procttest;classc;varx;run;,2020年5月15日,32,OBSCIX1112792123343133034143385151986212297222748233109243451025344,TTESTPROCEDUREVariable:XCNMeanStdDevStdError-15290.4000000056.9938593225.4884287525300.4000000049.4398624622.11017865VariancesTDFProb|T|-Unequal-0.29647.80.7747Equal-0.29648.00.7745ForH0:Variancesareequal,F=1.33DF=(4,4)ProbF=0.7896,2020年5月15日,33,兩樣本幾何均數(shù)的比較在data語句中進(jìn)行對數(shù)變換:x=log10(x)例11:王潔貞主編,dataG;doc=1to2;inputn;doi=1ton;inputx;x=log10(x);output;end;end;cards;,11100200400400400400800160016001600320091001001002002002002004001600;procttest;classc;varx;run;,2020年5月15日,34,TTESTPROCEDUREVariable:XCNMeanStdDevStdError-112.793624530.452000870.1362833992.334477770.382096020.12736534VariancesTDFProb|T|-Unequal2.461518.00.0242Equal2.418618.00.0264ForH0:Variancesareequal,F=1.40DF=(10,8)ProbF=0.6470,2020年5月15日,35,三、方差分析(一),統(tǒng)計回顧應(yīng)用:兩個或兩個以上均數(shù)的比較條件:樣本來自正態(tài)總體;方差齊;相互獨立的隨機(jī)樣本基本原理:變異分解SS總=SS組內(nèi)+SS組間;自由度分解總=組間+組內(nèi)組內(nèi)均方MS組內(nèi)=SS組內(nèi)/v組內(nèi)組間均方MS組間=SS組間/v組間F=MS組間/MS組內(nèi)當(dāng)FF(1,2),則P,拒絕H0,接受H1當(dāng)F,接受H0,。,2020年5月15日,36,方差分析-基本語句,Procanovadata=;Class分組變量;/*指明分組變量,必須放在model語句前*/Model因變量=分組變量;/*規(guī)定按分組變量對因變量作方差分析*/means分組變量/多重比較的方法;/*計算每個分組變量所對應(yīng)的因變量均值,對分組變量進(jìn)行多重比較,其方法可用snk(q檢驗)、dunnett、LSD法等。該語句可多次使用*/means分組變量/hovtest=方法;/*進(jìn)行方差齊性檢驗(homogeneityofvariancetest),常用方法為Bartlett和Levenes法,默認(rèn)為Levenes法*/freq變量名;/*規(guī)定頻數(shù)變量*/,2020年5月15日,37,分組變量:把要考察的處理因素做為分組變量。它的取值即為分組變量的水平,可以是數(shù)值型,也可是字符型。例5-1中,衣料就是分類變量,其取值有四個水平。因變量:也稱響應(yīng)變量,為連續(xù)的數(shù)值型變量。例5-1中,因變量為十硼氫的吸附量效應(yīng):方差分析模型中規(guī)定的各分組變量組合代表其相應(yīng)的效應(yīng)。主效應(yīng):由分組變量本身引起,不考慮其他因素的影響,可以用分組變量本身表示。例5-1中,只有一個效應(yīng),即衣料的效應(yīng)。如果對某一因變量,它的研究因素為A、B兩個,主效應(yīng)就是由A、B兩個分組變量引起的,不考慮A對B的作用。在model語句中表示為AB。,方差分析-幾個概念,2020年5月15日,38,交叉效應(yīng):即交互作用。用*連接兩個變量以表示它們之間的交互作用。在model語句中可用A*B表示。檢驗在A因素的各個水平B因素的效應(yīng)是否相同,即一個因素的效應(yīng)是否依賴于交叉項里其他因素。相應(yīng)的模型有主效應(yīng)模型(完全隨機(jī)、隨機(jī)區(qū)組、拉丁方等)和含交互作用項的模型(析因設(shè)計、正交設(shè)計),2020年5月15日,39,完全隨機(jī)設(shè)計資料的方差分析例12:程序5-1,dataanova1;doc=1to4;doi=1to5;inputx;output;end;end;cards;2.332.002.932.732.332.482.342.682.342.223.063.063.002.663.064.005.134.612.803.60;,procanova;classc;/*分組變量為c*/modelx=c;/*按變量c分組對因變量X進(jìn)行方差分析*/meansc/snk;/*對變量c的各水平用snk法作均數(shù)的多重比較*/Meansc/hovtest/*進(jìn)行方差齊性檢驗*/run;,2020年5月15日,40,方差分析結(jié)果ClassLevelInformationClassLevelsValuesC41234Numberofobservationsindataset=20,在class語句中規(guī)定的分組變量名分組變量的水平數(shù)分組變量的取值,DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePrF變異來源自由度離均差平方和均方F值P值模型Model38.433760002.8112533311.160.0003誤差Error164.029160000.25182250總變異CorrectedTotal1912.46292000R-SquareC.V.RootMSEXMean變異系數(shù)因變量的均值0.67670816.907650.501819192.96800000決定系數(shù)R2,反映了在總變異中由模型解釋的變異所占的比例,越接近1,表明模型對這批數(shù)據(jù)擬合越好。誤差均方的平方根,剩余標(biāo)準(zhǔn)差SourceDFAnovaSSMeanSquareFValuePrFC38.433760002.8112533311.160.0003,2020年5月15日,41,SNK法兩兩比較結(jié)果:Student-Newman-Keulstestforvariable:XNOTE:ThistestcontrolsthetypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullhypotheses.Alpha=0.05df=16MSE=0.251823誤差的均方NumberofMeans234均數(shù)間相隔組數(shù)CriticalRange0.6728120.81894120.9080258相差有無意義的臨界值Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNCSNK分組標(biāo)志均數(shù)樣本數(shù)分類變量值(水平數(shù))A4.028054B2.968053B2.464051B2.412052SNK分組標(biāo)志:相同字母代表組間差別無統(tǒng)計學(xué)意義。如c=3和c=1以及c=2組的標(biāo)志均為B,表明這三組的均數(shù)無差別;而c=4組的標(biāo)志為A,因此它與其它三組的差別均有統(tǒng)計學(xué)意義。,2020年5月15日,42,LevenesTestforEqualityofXVarianceANOVAofSquaredDeviationsfromGroupMeansSumofMeanSourceDFSquaresSquareFValuePrFC31.35850.45283.93390.0280Error161.84180.1151AnalysisofVarianceProcedureLevelof-X-CNMeanSD152.464000000.36712396252.412000000968000000028000000.90070528,2020年5月15日,43,例13:程序5-3樣本含量不等時方差分析,dataanova3;doc=1to3;inputn;doi=1ton;inputx;output;end;end;cards;,527933430333819832292743103210285117;procanova;classc;modelx=c;run;,2020年5月15日,44,隨機(jī)區(qū)組設(shè)計資料的方差分析,dataanova4;doa=1to4;dob=1to8;inputx;output;end;end;cards;5.275.275.885.445.666.225.835.275.275.225.835.385.446.225.725.114.944.885.385.275.385.615.385.004.614.665.005.004.885.224.884.44;procanova;classab;modelx=ab;meansa/snk;run;,例14程序5-4,2020年5月15日,45,方差分析結(jié)果,AnalysisofVarianceProcedureClassLevelInformationClassLevelsValuesA41234B812345678Numberofobservationsindataset=32,2020年5月15日,46,AnalysisofVarianceProcedureDependentVariable:XSourceDFSumofSquaresMeanSquareFValuePrFModel105.402375000.5402375043.140.0001Error210.262975000.01252262Total315.66535000R-SquareC.V.RootMSEXMean0.9535822.1119040.111904515.29875000SourceDFAnovaSSMeanSquareFValuePrFA32.904375000.9681250077.310.0001B72.498000000.3568571428.500.0001,2020年5月15日,47,AnalysisofVarianceProcedureStudent-Newman-Keulstestforvariable:XNOTE:ThistestcontrolsthetypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullhypotheses.Alpha=0.05df=21MSE=0.012523NumberofMeans234CriticalRange0.11635920.14103160.1559574Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNAA5.6050081A5.5237582B5.2300083C4.8362584,2020年5月15日,48,拉丁方設(shè)計資料的方差分析,拉丁方設(shè)計的方差分析主要適用于:三個處理水平數(shù)相同且無交互作用。亦稱三因素方差分析。利用拉丁方陣安排試驗,拉丁方陣亦稱r階拉丁方,是用r個拉丁字母排成r行r列的方陣,每個字母在每行每列中只出現(xiàn)一次。如55拉丁方:ABCDEBCDEACDEABDEABCEABCD,2020年5月15日,49,如例5-5,5種防護(hù)服(cloth),有5個人(person)個在不同的5天(date)中穿著,測定脈搏數(shù)。如表5.5所示。試驗就5種防護(hù)服對脈搏數(shù)有無作用。,表5可見,5種防護(hù)服在5個不同的日期和5個不同的受試者各出現(xiàn)一次;在同一日期和不同受試者5種防護(hù)服各不相同。,2020年5月15日,50,例15程序5-5,dataanova5;dodate=1to5;doperson=1to5;inputcloth$x;output;end;end;cards;A129.8B116.2C114.8D104.0E100.6B144.4C119.2D113.2E132.8A115.2C143.0D118.0E115.8A123.0B103.8D133.4E110.8A114.0B98.0C110.6E142.8A110.6B105.8C120.0D109.8;,procanova;classdatepersoncloth;modelx=datepersoncloth;run;,2020年5月15日,51,SAS分析結(jié)果,AnalysisofVarianceProcedureClassLevelInformationClassLevelsVa

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論