版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
SAS程序操作
SAS語句以一個關鍵詞開始,以分號(;)結束;
dataa;
inputx;
cards;
323544565;proc
print;
run;SAS程序的基本結構數(shù)據步:創(chuàng)建數(shù)據過程步:調用數(shù)據分析過程看一個SAS程序DATAHW;
INPUTNAME$SEX$AGEHEIGHTWEIGHT;CARDS;WANGXIAF121.6356LILIF111.5849CHENLINGHEM111.5744WANGWENQINGM101.4842LIUHAIQINGM101.4235ZHOULIF111.5340ZHAOXINM.1.4233LINLINF121.5844;PROCPRINT;RUN;SAS程序的基本結構dataHW;/*建立數(shù)據庫,命名為HW*/inputNAME$SEX$AGEHEIGHTWEIGHT@@;/*輸入變量名,如果變量是字符型變量,變量名后加$,如果是數(shù)值型的變量就直接寫變量名,在所有變量輸入完以后加上@@,表示多行數(shù)據同時讀入;如果沒有沒加@@,則表示每行只輸入第一個數(shù)據,第一個數(shù)據之后的忽略*/cards;/*輸入數(shù)據的標記*/WANGXIAF121.6356LILIF111.5849CHENLINGHEM111.5744WANGWENQINGM101.4842LIUHAIQINGM101.4235ZHOULIF111.5340ZHAOXINM.1.4233LINLINF121.5844;/*數(shù)據輸結束的標記*/proc
print;/*運行打印過程*/run;datachild;inputidx1$x2x3x4x5x6;cards;1m3295.514.053.549.642m35.13.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;proc
means;/*調用means過程,可以求出均值方差標準誤置信區(qū)間等*/run;Means過程dataa;inputx@@;cards;75.0 54.8 64.0 64.8 47.462.2 66.9 52.0 62.2 65.062.2 65.0 58.7 57.5 63.555.2 66.6 73.5 64.0 57.057.0 63.9 69.0 58.0 56.957.5 50.0 52.2 72.0 57.055.4 48.5 57.0 75.5 50.562.9 63.4 61.0 58.5 61.552.5 61.0 69.5 62.5 52.660.0 63.9 56.8 54.0 66.260.0 66.2 55.9 54.4 58.472.8 58.0 65.3 62.2 49.846.5 66.7 58.0 63.2 52.265.7 59.3 66.3 68.6 74.959.5 61.5 63.1 77.0 65.550.0 58.5 59.8 75.5 63.357.0 58.4 67.0 71.8 49.863.0 68.3 55.5 58.5 64.059.0 68.0 55.5 64.8 62.064.0 69.9 48.6 70.5 58.5;procunivariatedata=anormalplot;/*調用univariate過程,進行正態(tài)性檢驗,并畫圖*/run;正態(tài)性檢驗方法1:(粗略判斷)看偏度skewness和峰度kurtosis是否接近于0如何判斷是否正態(tài)?當均值不知道時,可以用中位數(shù)代替均值原假設是:均值=0這里做了三個檢驗檢驗均值是否為0這個有四個檢驗正態(tài)性的檢驗(原假設是:服從正態(tài)分布):這四個檢驗只要有一個拒絕就拒絕原假設,如果四個檢驗p值大于0.05,接受原假設,服從正態(tài)分布。方法2:看4個檢驗P值越接近1,數(shù)據的正態(tài)性越能肯定pp圖呈現(xiàn)為一條直線,那么可以認為數(shù)據服從正態(tài)分布,畫出分布形態(tài)圖,從直觀上檢驗數(shù)據的是否正態(tài)分布,當*與+重合較多表明數(shù)據基本符合正態(tài)分布方法3:pp圖qq圖呈現(xiàn)為一條直線,那么可以認為數(shù)據服從正態(tài)分布方法4:看QQ(Quantile-quantile)圖直方圖如果是成正態(tài)分布密度曲線形狀,即拱形,我們可以初步判斷數(shù)據服從正態(tài)分布方法5:看直方圖在運行了之前的程序之后Solutions->Analysis->Analystfile->OpenbySASname此時彈出selectamember的窗口,在窗口下面的libraries中點擊work,右方會出現(xiàn)一些數(shù)據庫名(即我們變成時data后面的名字,例如這里的A),然后雙擊我們要選的數(shù)據庫名,就會出現(xiàn)一個表格。下面就可以畫我們想畫的圖了1:直方圖Graphs->histogram->將變量選入analysis中,在選項fix中選中normal,就會在直方圖畫出正態(tài)密度圖,用來比較直方圖與正態(tài)密度圖的擬合程度。2:QQ圖Stastics->Desriptive->Distributions,將變量選入Analysis中,在plots選項中選擇Quantile-quantileplot,然后ok即可3:pp圖,同qq圖同樣的方法,在plots中選probabilityplot直方圖與QQ圖畫法菜單操作注意:這里證明正態(tài)的方法并不是獨立的,一般圖形只是根據直觀經驗判斷,我們只能初步判斷是否是正態(tài)分布,真正的判斷標準是那些檢驗!單個正態(tài)總體期望的檢驗例1
某切割機在正常工作時,切割每段金屬棒的平均長度為10.5cm,標準差是0.15cm,今從一批產品中隨機的抽取15段進行測量,其結果如下:假定切割的長度X服從正態(tài)分布,且標準差沒有變化,試問該機工作是否正常?dataread;inputl@@;cards;10.410.610.110.410.510.310.310.210.910.610.810.510.710.210.7;proc
ttestdata=readh0=10.5;/*調用ttest過程,比較均值是否與給出的均值相等*/run;方法1:用procttestdataread;inputL@@;L=L-10.5cards;10.4
10.6
10.1
10.4
10.5
10.3
10.3
10.210.9
10.6
10.8
10.5
10.7
10.2
10.7;proc
meansnmeanstderrtprt;/*調用means過程,n表示計算樣本量,mean表示計算均值,stderr表示計算標準誤,t表示進行進行t檢驗,prt表示將p值表示出來*/run;方法2:用procmeansSolution→Analysis→Analyst(分析員系統(tǒng))(出現(xiàn)空白數(shù)據表)→File→OpenBySasName…
(在Makeoneselection窗口中)→work→選中數(shù)據名(DataE3212見V8文件)→(OK)→Statistics→HypothesisTestsOneSamplez—testforaMean…→待分析變量x→Variable→std.dev.of(即σ)填入0.01(或Variance(即σ2)內填入0.012)→Tests→Interval→OK→OK已知方差時單變量總體均值檢驗的菜單操作把上面的步驟OneSamplez—testforaMean變?yōu)镺ne-Samplet-TestforaMean
方差未知時單變量總體均值檢驗的菜單操作例3
某廠生產的某種型號的電池,其壽命長期以來服從方差
=5000(小時2)的正態(tài)分布,現(xiàn)有一批這種電池,從它生產情況來看,壽命的波動性有所變化.現(xiàn)隨機的取26只電池,測出其壽命的樣本方差=9200(小時2).問根據這一數(shù)據能否推斷這批電池的壽命的波動性較以往的有顯著的變化?單個正態(tài)總體方差的檢驗這里我只知道怎樣用菜單操作,如何編寫程序暫時不知道。下面是菜單操作過程:Solutions->Analysis->Analyst然后在出現(xiàn)的表格中輸入數(shù)據,或者導入數(shù)據,stastics->Hypothesistests->onesampletestforaVariance然后將變量選入Variable,在Var窗口中填入要檢驗的數(shù)值。注意!這里填入的是方差,不是標準差!例如上例中就應該填入5000.單個正態(tài)總體方差的檢驗兩個正態(tài)分布總體均值和方差的檢驗1.非配對(即兩個樣本量不一樣,又或者說是試驗次數(shù)不相等)有性系產量PB8669
97
106
51
97
65
73
83
79
41
92GL132
61
50
46
73
43
80
61
46
56
60
29
38
48
26
23
61實例:今有某種作物的兩個有性系PB86與GL1,均在同一環(huán)境、同一管理下生長,產量列于下表,試測定其產量均值差的置信區(qū)間并作成組法試驗資料的顯著性。datayild;inputstrain$yield@@;cards;a69a97a106a51a97a65a73a83a79a41a92b32b61b50b46b73b43b80b61b56b60b29b38b48b26b23b61b46;proc
ttest;classstrain;varyield;run;VariablestrainNLowerCL
MeanMeanUpperCL
MeanLowerCL
StdDevStd
DevUpperCL
StdDevStd
ErrMinimumMaximumyielda1163.94477.54591.14614.14620.24535.5296.104241106yieldb1740.664957.3412.08116.22124.6873.93422380yieldDiff(1-2)
14.32728.54542.76414.07817.87624.4986.9173
T-TestsVariableMethodVariancesDFt
ValuePr
>
|t|yieldPooledEqual264.130.0003yieldSatterthwaiteUnequal18.13.930.0010EqualityofVariancesVariableMethodNum
DFDen
DFFValuePr
>
FyieldFoldedF10161.560.4141先看第三個結果即,是檢驗方差是否相等的檢驗,p值>0.05,那么接受原假設,即方差相等,那么看第二個結果的第二行,equal相的p值,這個結果檢驗均值是否相等,p值<0.05,所以拒絕原假設,認為均值不相等。與之前單變量的菜單類似在運行了之前的程序之后Solutions->Analysis->Analystfile->OpenbySASname此時彈出selectamember的窗口,在窗口下面的libraries中點擊work,右方會出現(xiàn)一些數(shù)據庫名(即我們變成時data后面的名字,例如這里的A),然后雙擊我們要選的數(shù)據庫名,就會出現(xiàn)一個表格。Statistics→HypothesisTests->TwoSamplet—testforMeans,然后把組的名字選到group中,把因變量的名字宣導dependent中,如果要檢驗兩樣本均值是否相等,則將mean1-mean2設為0,如果是別的自己可以設定。非配對的均值檢驗的菜單操作Solutions->Analysis->Analyst然后在出現(xiàn)的表格中輸入數(shù)據,或者導入數(shù)據,(又或者,如果剛剛運行了程序,那么可以在file中的openbySASname中找到剛剛運行過的數(shù)據集名,點擊即可)stastics->Hypothesistests->two-sampletestforaVariances,然后把組的名字選到group中,把因變量的名字選到dependent中,點擊ok即可。非配對兩個正態(tài)分布方差的檢驗菜單操作2.配對(即兩個樣本量一樣,試驗是一對一的)datac;inputab@@;diff=a-b;cards;24272728262321312426;proc
meanstprt;vardiff;run;方法1:procmeansdatac;inputab@@;cards;24272728262321312426;proc
ttest;paireda*b;/*a和b的配對均值檢驗*/run;方法2:procttest在運行了之前的程序之后Solutions->Analysis->Analystfile->OpenbySASname此時彈出selectamember的窗口,在窗口下面的libraries中點擊work,右方會出現(xiàn)一些數(shù)據庫名(即我們變成時data后面的名字,例如這里的A),然后雙擊我們要選的數(shù)據庫名,就會出現(xiàn)一個表格。Statistics→HypothesisTests->TwoSamplepairedt—testforMeans,然后把組的名字分別選到group1和group2中,如果要檢驗兩樣本均值是否相等,則將group1-group2設為0,如果是別的自己可以設定。配對的均值檢驗的菜單操作菜單操作SAS分為臨時文件和永久文件永久數(shù)據集名必須由兩部分組成:前一部分是它的庫名,后一部分是才是數(shù)據集名,兩部分中間用小數(shù)點連接。比如放在mylib庫中的數(shù)據集teach必須用mylib。Teach表示。我們在關閉SAS后,它不會被自動刪除。SAS的保存問題有時候做試驗的數(shù)據量十分大,我們需要導入數(shù)據,使用INFILE語句指定從哪一文件中讀入數(shù)據。datac;infile'c:/dolly.xls';inputa@@;Procprint;run;之前運行不到是因為excel表的后綴名弄錯了!現(xiàn)在的可以運行了~從外部文件讀取數(shù)據方差分析的本質是:要解決的問題在諸個水平的因素的組合尋找出優(yōu)化的組合。方差分析的目的是:分析或檢驗總體間的均值是否不同方差分析方差分析和協(xié)方差分析SAS過程ANOVA過程
-----速度快,功能有限,平衡資料GLM過程
-----速度慢,但功能強大(非平衡資料協(xié)方差分析)dataf;inputlevel$pig@@;cards;a51a40a43a48b23b25b26c23c28;proc
anova;classlevel;modelpig=level;run;
例1以A、B、C三種飼料喂豬,得一個月后每豬所增體重(單位:500g)于下表,試作方差分析。(與書p42頁例子類似)飼料ABC增重514043482325262328單因素方差分析,只有一個因素飼料的不同,有三個水平A,B,C,水平A做了4次試驗。菜單操作可以參考書上p43,或者張老師的課件單因素方差分析只討論自變量a和b獨自對因變量的影響;另一種,不僅要研究自變量a和b獨自對因變量的影響,而且還要同時考慮a、b兩個自變量交互地影響因變量。雙因素方差分析1.無重復試驗雙因素方差分析
例2設甲、乙、丙、丁四個工人操作機器Ⅰ、Ⅱ、Ⅲ各一天,其產品產量如下表,問工人和機器對產品產量是否有顯著影響?(與書p44的例子類似)工人A機器B甲乙丙?、瘼颌骴ataff;doa=1to4;dob=1to3;inputn@@;output;end;end;cards;506352475442475741535848;proc
anova;classab;modeln=ab;/*對兩個因子模擬模型*/run;菜單操作可以參考書上p45或者張老師的課件多因素方分析的SAS程序例:DATASTEAK;INPUTW$NY@@;CARDS;A150A263A352 B147B254B342 C147C257C341D153D258D348;PROCGLM;CLASSWN;MODELY=WN;RUN;
工人機器123甲(A)506352 乙(B)475442 丙(C)
475741丁(D)535848
多因素方差分析多因素無交互作用的方差分析例3用某新藥治療血吸蟲患者,采用三天療法,在治療前及治療后分別定期測定患者的血清谷丙轉氨酶的變化,以觀察該藥對肝功能的影響,測定結果如下表。試分析不同階段血清谷丙轉氨酶是否有差異?表3某新藥治療血吸蟲患者血清谷丙轉氨酶的變化情況因子1:有7個水平因子2:有6個水平datali_3;doi=1to7;/*對因子1做循環(huán)*/doj=1to6;/*對因子2做循環(huán)*/inputx@@;output;end;end;cards;6336188138635490200238220188144543630083100924572140213144100545417515010036726330016314490647720718512287;procanova;classij;modelx=ij;run;
區(qū)組IIIIIITB處理A1B1C1C2C31214133912111134109928B2C1C2C31099289982666719A2B1C1C2C332494341176720B2C1C2C322373451257719Tr838287252T區(qū)組和處理兩向表2:有重復的雙因素方差分析(考慮交互作用)DATASTEAK;INPUTA$B$C$Y;CARDS;A1B1C112A1B1C114A1B1C113 A1B1C212A1B1C211A1B1C211 A1B1C310A1B1C39A1B1C39 A1B2C110A1B2C19A1B2C19 A1B2C29A1B2C29A1B2C28 A1B2C36A1B2C36A1B2C37A2B1C13A2B1C12A2B1C14 A2B1C24A2B1C23A2B1C24 A2B1C37A2B1C36A2B1C37 A2B2C12A2B2C12A2B2C13 A2B2C23A2B2C24A2B2C25 A2B2C35A2B2C37A2B2C37;PROC
GLM;CLASSABC;MODELY=ABCA*BB*C;/*這個模型包括了三個因子,還有因子之間的交互作用*/RUN;多重比較F測驗是一個整體的概念。僅能測出不同處理效應的平均數(shù)的顯著差異性。但是,是否各個平均數(shù)間都有顯著差異性?還是僅有部分平均數(shù)間有顯著差異而另一部分平均數(shù)間沒有顯著差異?它不曾提供任何信息。要明確各個平均數(shù)間的差異顯著性,還必須對各平均數(shù)進行多重比較。包裝方式123總和均值甲12183015乙1412133913丙1917215719丁24305427例:研究某糖果包裝方式與銷售量的關系(四水平不等重復)來源SSDFMSFF0.05(3,6)包裝25838611.214.76誤差4667.67總和3049方差分析表
DATAglm;INPUTX$Y@@;CARDS;a12a18b14b12b13c19c17c21d24d30;
PROC
glm;classX;modely=x;meansx/lsd;meansx/lsdalpha=0.01;meansx/duncan;meansx/scheffecldiff;meansx/snk;meansx/tukeycldiff;run;12345均值A(15)77151199.8B(20)121712181815.4C(25)141818191917.6D(30)192522192321.6E(35)71011151110.8例:研究合成纖維中棉花含量對抗拉強度的影響(五水平5重復)來源SSDFMSFF0.01(4,20)含棉率475.764118.9414.764.43誤差161.20208.06總和636.9624方差分析表
DATAglm;INPUTX$Y@@;CARDS;157157151515111592012201720122018201825142518251825192519301930253022301930233573510351135153511;
PROC
glm;classX;modely=x;meansx/lsd;meansx/lsdalpha=0.01;meansx/duncan;meansx/scheffecldiff;meansx/snk;meansx/tukeycldiff;run;(1方差分析表)DependentVariable:YSumofSourceDFSquaresMeanSquareFValuePr>FModel4475.7600000118.940000014.76<.0001Error20161.20000008.0600000CorrectedTotal24636.9600000R-SquareCoeffVarRootMSEYMean0.74692318.876422.83901415.04000SourceDFTypeISSMeanSquareFValuePr>FX4475.7600000118.940000014.76<.0001(2。LSD多重比較分析表)tTests(LSD)forYNOTE:ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06CriticalValueoft2.08596LeastSignificantDifference3.7455Meanswiththesameletterarenotsignificantlydifferent.tGroupingMeanNXA21.600530B17.600525BB15.400520C10.800535CC9.80051521.6-17.6=4>3.7455,說明30和25之間存在差異
TheGLMProcedure(3。Duncan多重比較分析表(LSR法))Duncan'sMultipleRangeTestforYNOTE:ThistestcontrolstheTypeIcomparisonwiseerrorrate,nottheexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06NumberofMeans2345CriticalRange3.7453.9314.0504.132Meanswiththesameletterarenotsignificantlydifferent.DuncanGroupingMeanNXA21.600530B17.600525BB15.400520C10.800535CC9.800515TheGLMProcedure(4。謝菲多重比較分析表)
Scheffe'sTestforYNOTE:ThistestcontrolstheTypeIexperimentwiseerrorrate.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06CriticalValueofF2.86608MinimumSignificantDifference6.0796Meanswiththesameletterarenotsignificantlydifferent.ScheffeGroupingMeanNXA21.600530ABA17.600525BBC15.400520CC10.800535CC9.800515TheGLMProcedure(5.q多重比較分析表)
Student-Newman-KeulsTestforYNOTE:ThistestcontrolstheTypeIexperimentwiseerrorrateunderthecompletenullhypothesisbutnotunderpartialnullhypotheses.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06NumberofMeans2345CriticalRange3.74545414.54270985.02563185.3729606Meanswiththesameletterarenotsignificantlydifferent.SNKGroupingMeanNXA21.600530B17.600525BB15.400520C10.800535CC9.800515TheGLMProcedure(6。Tukey's多重比較分析表)Tukey'sStudentizedRange(HSD)TestforYNOTE:ThistestcontrolstheTypeIexperimentwiseerrorrate,butitgenerallyhasahigherTypeIIerrorratethanREGWQ.Alpha0.05ErrorDegreesofFreedom20ErrorMeanSquare8.06CriticalValueofStudentizedRange4.23186MinimumSignificantDifference5.373Meanswiththesameletterarenotsignificantlydifferent.TukeyGroupingMeanNXA21.600530ABA17.600525BBC15.400520CDC10.800535DD9.800515(4。謝菲多重比較差比較分析表)Comparisonssignificantatthe0.05levelareindicatedby***.DifferenceXBetweenSimultaneous95%ComparisonMeansConfidenceLimits30-254.000-2.08010.08030-206.200
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024鋁合金材料研發(fā)與應用項目合同范本3篇
- 二零二五年度網絡安全事件應急處理與響應計劃合同2篇
- 二零二五版辦公場地租賃信息咨詢服務合同2篇
- 2024年高端設備采購與技術轉讓合同
- 2024水磨石新型裝飾材料研發(fā)與應用承包合同3篇
- 二零二五年度5人合伙人工智能教育培訓合同3篇
- 二零二五年度遺產分配與境外遺產繼承協(xié)議3篇
- 二零二五年度出租車承包合同標準條款3篇
- 二零二五年度建筑安全責任協(xié)議范本解析3篇
- 2024版勞務分包合同(保潔類)2篇
- 深圳2024-2025學年度四年級第一學期期末數(shù)學試題
- 混凝土澆筑申請表
- 山丹丹開花紅艷艷教案
- 中風后認知障礙中醫(yī)臨床路徑
- 罌粟湯_朱氏集驗方卷十_方劑加減變化匯總
- 《我相信---楊培安》歌詞-勵志歌曲
- 做一個幸福班主任
- 初中班主任案例分析4篇
- 公司7s管理組織實施方案
- Q∕GDW 12147-2021 電網智能業(yè)務終端接入規(guī)范
- 仁愛英語單詞默寫本(全六冊)英譯漢
評論
0/150
提交評論