SAS統(tǒng)計分析系統(tǒng)操作手冊(ppt 123頁).ppt_第1頁
SAS統(tǒng)計分析系統(tǒng)操作手冊(ppt 123頁).ppt_第2頁
SAS統(tǒng)計分析系統(tǒng)操作手冊(ppt 123頁).ppt_第3頁
SAS統(tǒng)計分析系統(tǒng)操作手冊(ppt 123頁).ppt_第4頁
SAS統(tǒng)計分析系統(tǒng)操作手冊(ppt 123頁).ppt_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、SAS 統(tǒng)計分析系統(tǒng) Statistical Analysis System,公共衛(wèi)生學院信息數(shù)據(jù)處理教學實驗室,SAS軟件簡介,1966年美國North Carolina大學的兩位生物統(tǒng)計學研究生開始研制SAS系統(tǒng),直至1976年成立了SAS軟件研究所,正式推出了SAS軟件,1985年推出微機版SAS。 SAS是用于決策支持的大型集成信息系統(tǒng),軟件系統(tǒng)最早的功能限于統(tǒng)計分析,現(xiàn)在統(tǒng)計分析功能也仍是它的重要組成部分和核心功能。SAS現(xiàn)在的最新版本為9.0版,大小約為1GB。,在數(shù)據(jù)處理和統(tǒng)計分析領(lǐng)域,SAS系統(tǒng)被譽為國際上的標準軟件系統(tǒng),并在9697年度被評選為建立數(shù)據(jù)庫的首選產(chǎn)品,堪稱統(tǒng)計軟

2、件界的巨無霸。 經(jīng)過多年的發(fā)展,SAS已經(jīng)被全世界120多個國家和地區(qū)的近三萬家機構(gòu)所采用,直接用戶超過三百萬人,遍及金融、醫(yī)藥衛(wèi)生、生產(chǎn)、運輸、通訊、政府和教育科研等領(lǐng)域。,由于SAS系統(tǒng)是從大型機上的系統(tǒng)發(fā)展而來,在設(shè)計上也是完全針對專業(yè)用戶進行設(shè)計,因此操作以SAS語言編程為主,另外也有非編程方式的菜單系統(tǒng),但人機對話的界面不太友好。 學習SAS軟件時,需要用戶有基本的統(tǒng)計學知識,對所選用的統(tǒng)計方法有較清楚的了解,沒有統(tǒng)計學基礎(chǔ)知識要掌握SAS軟件較為困難。,第一節(jié) SAS軟件的使用基礎(chǔ),一、SAS的啟動和退出 啟動SAS 雙擊桌面SAS圖標 開始菜單 程序 The Sas System

3、 The Sas System for Windows V*.* 直接雙擊SAS應(yīng)用程序 退出SAS 標題欄關(guān)閉按鈕 菜單欄 File Exit 在命令框鍵入“Bye”或“Endsas”,標題欄、菜單欄、工具欄 PROGRAM EDITOR 程序編輯窗口 LOG 運行過程日志窗口 OUTPUT 結(jié)果輸出窗口 SAS常用功能鍵,二、SAS的工作窗口,例:一組體檢資料,包括姓名、性別、年齡、身高、體重,要求分性別計算身高、體重的均數(shù)、標準差、最大值、最小值。 姓名 性別 年齡 身高 體重 ZHANGLIN F 47 156.3 47.1 ZHAOHUA M 38 172.4 61.5 WANGQA

4、NG M 41 169.2 64.5 LIULI F 52 158.2 53.6 SHIDONG F 39 160.1 48.0 KONGYING M 29 174.1 64.6 LILING F 37 152.3 42.2 GUANFEN M 32 166.2 60.2 MIAOQING M 26 180.3 74.3 NIUHUA M 31 178.2 80.2 TANGJIE F 35 169.2 60.8 GAOJUN M 24 176.0 73.3 SUNHONG F 27 158.3 49.9,三、SAS程序構(gòu)成,DATA AA1; INPUT NAME$ SEX AGE HEIG

5、HT WEIGHT; CARDS; ZHANGLIN 2 47 156.3 47.1 ZHAOHUA 1 38 172.4 61.5 WANGQANG 1 41 169.2 64.5 LIULI 2 52 158.2 53.6 SHIDONG 2 39 160.1 48.0 KONGYING 1 29 174.1 64.6 LILING 2 37 152.3 42.2 GUANFEN 1 32 166.2 60.2 MIAOQING 1 26 180.3 74.3 NIUHUA 1 31 178.2 80.2 TANGJIE 2 35 169.2 60.8 GAOJUN 2 24 176.0

6、73.3 SUNHONG 2 27 158.3 49.9 ; PROC MEANS; CLASS SEX; VAR HEIGHT WEIGHT; RUN;,數(shù)據(jù)步,過程步,DATA STEP(數(shù)據(jù)步) 以DATA語句開始 將數(shù)據(jù)讀入SAS系統(tǒng),建立SAS數(shù)據(jù)集 PROCEDURE STEP(過程步) 以PROC語句開始 調(diào)用各種已編好的過程處理和分析數(shù)據(jù) RUN (結(jié)束) 整個程序的最后必須要有RUN語句結(jié)束,表示要執(zhí)行以上全部任務(wù)。,1. 必須在PGM窗口。SAS語句書寫格式自由,每個語句以“;”結(jié)束,可以在一行中寫幾個語句或一個語句寫在幾行中,不區(qū)分字母大小寫。,2. 運行SAS程序 工具

7、欄執(zhí)行按鈕 功能鍵“F8”( Submit ) 菜單欄 Locals Submit 命令框鍵入“Submit”命令 自動激活OUTPUT窗口,出現(xiàn)程序運行結(jié)果,四、SAS程序編寫、運行、調(diào)試、保存,3. 調(diào)試SAS程序 沒出現(xiàn)結(jié)果窗口,或結(jié)果不理想時。 激活LOG窗口(F6) 查看運行過程及出錯信息 黑色文字:源程序及運行情況 藍色文字:程序運行情況說明信息 紅色文字:出錯信息 綠色文字:警告信息 激活PGM窗口(F5) 調(diào)回SAS程序 (F4) 修改錯誤后重新發(fā)送,4. 保存SAS程序或其他窗口內(nèi)容,激活相應(yīng)窗口 常用工具欄 存盤按鈕 菜單欄 File Save(或Save as) 命令框輸

8、入File命令 可以分別保存程序、運行結(jié)果、日志,5. 打開已保存的程序、結(jié)果等 只能在PGM窗口 常用工具欄 打開按鈕 菜單欄 File Open 命令框輸入Include命令 可打開以前保存的程序、運行結(jié)果、日志等文件及其他文本格式的文件。,第二節(jié) SAS數(shù)據(jù)集,SAS數(shù)據(jù)集(SAS Dataset) 數(shù)據(jù)值被安排在一個矩陣式的表格結(jié)構(gòu)中 每一行數(shù)據(jù)表示一個觀測(Observation) 每一列數(shù)據(jù)表示一個變量(Variable) 變量命名:18個字符,第1個字符必須是字母,后面 可以是字母、數(shù)字和下劃線 變量類型:數(shù)值型、字符型和日期時間型 字符型變量名后加“$”表示, 日期型: 16O

9、CT98 D,時間型: 9:25:30T 變量缺失值:用“”表示,一、SAS數(shù)據(jù)集的種類,臨時SAS數(shù)據(jù)集 不保存,一旦退出SAS就消失。 數(shù)據(jù)集名稱為1個單詞,如DATA AA; 永久SAS數(shù)據(jù)集 保存在用戶指定的文件夾里。 數(shù)據(jù)集名稱為2個單詞,中間用“.”分開,也稱二級名,如DATA NEW.AA;,LIBNAME NEW D:MY DATA; DATA NEW.AA; 在數(shù)據(jù)集的二級名稱 NEW.AA中; 第1個詞NEW是庫標記,代表用戶指定的保存SAS數(shù)據(jù)文件的位置,前面要用LIBNAME語句指定它代表的文件夾和位置。 第2個詞AA是保存的SAS數(shù)據(jù)集的文件名。 執(zhí)行這個過程的結(jié)果將

10、會在D:MY DATA文件夾中產(chǎn)生1個永久SAS數(shù)據(jù)文件 AA.SD2 SD2是自動產(chǎn)生的SAS數(shù)據(jù)文件默認擴展名,二、創(chuàng)建SAS數(shù)據(jù)集,1.在PGM窗口創(chuàng)建數(shù)據(jù)集 DATA AA; 命名將要創(chuàng)建的數(shù)據(jù)集名 INPUT X1-X4; 描述數(shù)據(jù)集中的變量名 CARDS; 以下開始是數(shù)據(jù) 2 47 156.3 47.1 1 38 172.4 61.5 ; 數(shù)據(jù)結(jié)束 INPUT X Y;連續(xù)讀數(shù)據(jù)不換行 INPUT NAME$ AGE; 字符型變量名加,2.在VIEWTABLE窗口創(chuàng)建數(shù)據(jù)集,菜單欄Globals Manage Open tables 打開VIEWTABLE窗口直接輸入數(shù)據(jù) 保存數(shù)據(jù)

11、:File Save(或Save as) 在Tables右邊框中輸入數(shù)據(jù)集名稱 在Path右邊框中 選默認位置 *:sassaswork 建立臨時數(shù)據(jù)集 用戶指定位置可以建立永久數(shù)據(jù)集,3.用分析員模塊創(chuàng)建數(shù)據(jù)集,菜單欄 Globals Analyze Sta- tistical Analysis 打開Analyze(分析員)窗口直接輸入數(shù)據(jù) 保存數(shù)據(jù):File Save Library:庫標記名(代表要保存文件的 位置,選Work可以建臨時數(shù)據(jù)集) Table Name:數(shù)據(jù)集文件名 Description:可以對文件進行描述,4.由其它類型數(shù)據(jù)文件轉(zhuǎn)換成SAS數(shù)據(jù)集,菜單欄 File im

12、portSAS可以直接與下列格式文件互相轉(zhuǎn)換 dBASE/FoxBASE File (*.dbf) Excel 4.0/5.0 File (*.xls) Lotus 1/3/4 File (*.wk1/3/4) Delimited File (*.*) 空格分隔 Tab Delimited File (*.txt) 制表符分隔 Comma Separated Velues(*.csv)逗號分隔,注意: Visual Foxpro的數(shù)據(jù)表(*.dbf) 在VFP系統(tǒng)中通過菜單欄 文件 導(dǎo)出 類型選 dBASE、FoxBASE、Excel 5.0、 Delimited File 均可以 Excel

13、 97/2000/2002的文件(*.xls) 在Excel系統(tǒng)中通過菜單欄 文件 另存為 保存類型選 Excel5.0/4.0 (*.xls)或逗號分隔(*.csv) 制表符分隔(*.txt) 均可以 Excel文件中要求第1行是變量名,另外: 在寫字板、記事簿、Word 或 Excel 中的數(shù)據(jù)也可以直接采用復(fù)制、粘貼的方式,通過PGM窗口創(chuàng)建SAS數(shù)據(jù)集。 通過 菜單欄 File Export 也可以把SAS數(shù)據(jù)集轉(zhuǎn)換成相應(yīng)的其它類型數(shù)據(jù)文件,5 .從已有的SAS數(shù)據(jù)集中創(chuàng)建新數(shù)據(jù)集,DATA A1(子集);SET AA(原數(shù)據(jù)集); (1)選擇部分變量(列) 保留部分變量:KEEP D

14、ATA A1;SET AA;KEEP X1 X2; 去掉部分變量:DROP DATA A1;SET AA;DROP X3 X4; 賦值新的變量 Y=X3+X4; LY=LOG(Y);,常用SAS函數(shù): LOG(x) 以e為底的自然對數(shù) LOG10(x) 以10為底的常用對數(shù) EXP(x) 以e為底的反對數(shù) SQRT(x) 平方根 ABS(x) 絕對值 INT(x) 取整數(shù)(不四舍五入) MOD(x,y) 取x/y的余數(shù) SIN(x) 正弦 COS(x) 余弦 三角函數(shù)(x是弧度) TAN(x) 正切,(2) 選擇部分觀測(行) 建子集語句:IF DATA A1;SET AA;IF SEX=1;

15、 DATA A1;SET AA;IF AGE40; IF X1=3 (不等于) IF SEX=1 AND AGE60 IF AGE20 AND AGE40,(3) 數(shù)據(jù)集連接 縱向連接 A1 DATA AA;SET A1 A2; A2 要求 A1和 A2中的變量相同 A1中有10行,A2中有15行,則AA有25行。 橫向合并 A1 A2 DATA AA;MERGE A1 A2; BY Num; 匹配合并時,要求 A1和 A2中必須有1個相同的變量,且排列順序也相同,作為標識變量用 BY 語句指定。,(4)數(shù)據(jù)集轉(zhuǎn)置(行列互換) PROC TRANSPOSE;BY G;VAR X1-X4;,OB

16、S X1 X2 X3 1 2 3 4 5 6 7 8 9,OBS _Name_ Col1 Col2 Col3 X1 1 4 7 X2 2 5 8 X3 3 6 9,選擇項有: OUT=新數(shù)據(jù)集名(缺省按DATA n自動命名) PREFIX=新變量名前綴(缺省按Col n自動命名) NAME=為原變量名列命名(缺省自動命名為_Name_),第三節(jié) 統(tǒng)計描述,一、定量資料的統(tǒng)計描述 簡單描述:MEANS過程 輸出樣本含量、均數(shù)、標準差、最小值、最大值 ( N、Mean、Std Dev、Minimum、Maximum) 詳細描述:UNIVARIATE過程 輸出更多指標:樣本含量、均數(shù)、標準差、最小值

17、、最大值、方差、標準誤 、中位數(shù)、四分位數(shù)間距、常用百分位數(shù)、眾數(shù)、平方和、離均差平方和等,可以作正態(tài)性檢驗 另外還顯示原數(shù)據(jù)中的部分極端值,PROC MEANS; CLASS SEX; VAR HEIGHT WEIGHT; RUN; CLASS 指定分組變量(可以不寫) VAR 指定需要分析的變量(不寫即分析全部變量) MAXDEC=n 指定計算結(jié)果保留小數(shù)位數(shù)(默認2位) 可加的選項有:標準誤(StdErr)、方差(Var)、總和(Sum)、平方和(USS)、離均差平方和(CSS)、全距(Range)、變異系數(shù)(CV)、偏度系數(shù)(Skewness)、峰度系數(shù)(Kurtosis)、可信區(qū)間(

18、CLM)等 還可以計算總體均數(shù)=0的 t 檢驗(T、Prt) 不加任何選項時,自動輸出5項結(jié)果: N、Mean、Std Dev、Minimum、Maximum,MEANS過程,頻數(shù)表資料:,DATA AA2; INPUT X F; CARDS; 2.5 5 2.7 10 2.9 12 3.1 23 3.3 24 3.5 22 3.7 17 3.9 7 4.1 3 ; PROC MEANS N MEAN STD STDERR CLM ; VAR X;FREQ F;RUN; 數(shù)據(jù)步中:X 是組中值,F(xiàn)是頻數(shù) 過程步中:VAR X;指定分析變量是 X FREQ F;指定 F 是頻數(shù),計算幾何均數(shù),D

19、ATA AA3; INPUT X F; Y=LOG10(X); CARDS; 4 1 8 5 16 6 32 2 64 7 128 10 256 4 512 5 ; PROC MEANS; VAR Y; FREQ F; OUTPUT OUT=C MEAN=M; BY SEX; PROC UNIVARIATE; BY SEX; VAR HEIGHT WEIGHT; RUN; BY 指定分組變量(可以不寫) SORT 用BY之前必須先按分組變量排序 加選項 NORMAL 可以作正態(tài)性檢驗(W) 在已知資料不服從正態(tài)分布時或?qū)Y料的分布類型不確定時可以用UNIVARIATE過程作探索性分析。,UNI

20、VARIATE過程,Moments 樣本含量 N 7 頻數(shù)之和 Sum Wgts 7 均數(shù) Mean 53.55714 X Sum 374.9 標準差Std Dev 10.46564 方差Variance 109.5295 偏度系數(shù)Skewness 1.246 峰度系數(shù)Kurtosis 1.376 X2 USS 20735.75 CSS 657.1771 變異系數(shù) CV 19.54106 標準誤 Std Mean 3.955638 =0的t檢驗 T:Mean=0 13.53944 Pr|T| 0.0001 非0變量個數(shù) Num = 0 7 0變量個數(shù) Num 0 7 符號檢驗 M(Sign)

21、3.5 Pr=|M| 0.0156 符號秩和檢驗 Sgn Rank 14 Pr=|S| 0.0156 正態(tài)性檢驗 W:Normal 0.900687 PrW 0.3488,Quantiles(Def=5) P100 100% Max 73.3 P99 99% 73.3 P75 75% Q3 60.8 P95 95% 73.3 M 50% Med 49.9 P90 90% 73.3 P25 25% Q1 47.1 P10 10% 42.2 P0 0% Min 42.2 P5 5% 42.2 P1 1% 42.2 全距 Range 31.1 四分位數(shù)間距 Q3-Q1 13.7 眾數(shù) Mode 42

22、.2,極端值Extremes Lowest Obs Highest Obs 最小 序號 最大 序號 42.2 ( 4) 48 ( 3) 47.1 ( 1) 49.9 ( 7) 48 ( 3) 53.6 ( 2) 49.9 ( 7) 60.8 ( 5) 53.6 ( 2) 73.3 ( 6),定量資料統(tǒng)計描述非編程方式(分析員模塊),(1 )打開分析員窗口 菜單欄 Globals Analyze Statistical Analysis (2 )打開SAS數(shù)據(jù)集 菜單欄 File Open by SAS name (3 )作簡單統(tǒng)計分析 菜單欄 Statistics Descriptive Su

23、mmary Statistics 在Analysis窗口選入要分析的變量 在Classification窗口選入分組變量 用Statistics可以選更多的統(tǒng)計分析結(jié)果 用Variables可以對變量有更多的選擇方式 選OK完成,二、定性資料統(tǒng)計描述,FREQ 過程 可以產(chǎn)生頻數(shù)表和 n 維列聯(lián)表 PROC FREQ;TABLES A ;RUN; TABLES 指定要分析的定性變量 TABLES A 產(chǎn)生一維頻數(shù)表 TABLES A*B 產(chǎn)生二維列聯(lián)表(A是行B是列) TABLES A*B*C 產(chǎn)生三維列聯(lián)表 (A是分層,B是行,C是列) TABLES A*(B C) 產(chǎn)生A*B、A*C兩個二

24、維表 TABLES X1-X3 產(chǎn)生X1、X2、X3三個一維表 TABLES (X1-X4)*Y 產(chǎn)生X1*Y X2*Y X3*Y X4*Y 四個二維表,如描述以下三個定性變量(258人) A文化程度(1=文盲2=初中以下3=高中4=大學) B工作強度(1=輕 2=中 3=重) C月收入 (1=300 2=300- 3=500- 4=1000-) DATA AA4; INPUT A B C; CARDS; 3 2 3 4 1 4 4 1 3 ; PROC FREQ; TABLES A B C; PROC FREQ; TABLES A*B; PROC FREQ; TABLES A*B*C; PR

25、OC FREQ; TABLES A*(B C); RUN;,一維頻數(shù)表 Cumulative Cumulative A Frequency Percent Frequency Percent 頻數(shù) 構(gòu)成比 累計頻數(shù) 累計構(gòu)成比 2 78 30.2 78 30.2 3 85 32.9 163 63.2 4 95 36.8 258 100.0,二維頻數(shù)表 A=4 Frequency| Percent | C Row Pct | Col Pct | 1 | 2 | 3 | 4 | Total -+-+-+-+-+ 1 | 0 | 6 | 37 | 26 | 69 B | 0.00 | 6.32 |

26、38.95 | 27.37 | 72.63 | 0.00 | 8.70 | 53.62 | 37.68 | | . | 75.00 | 67.27 | 81.25 | -+-+-+-+-+ 2 | 0 | 2 | 18 | 6 | 26 | 0.00 | 2.11 | 18.95 | 6.32 | 27.37 | 0.00 | 7.69 | 69.23 | 23.08 | | . | 25.00 | 32.73 | 18.75 | -+-+-+-+-+ Total 0 8 55 32 95 0.00 8.42 57.89 33.68 100.00,頻數(shù) 構(gòu)成比 行構(gòu)成比 列構(gòu)成比,定性資料統(tǒng)計

27、描述非編程方式(分析員模塊),菜單欄 Globals Analyze Statistical Analysis 菜單欄 File Open by SAS name 作一維頻數(shù)表 菜單欄 Statistics Descriptive Freguency counts 把變量選入Frequencies 窗口,OK 作二維頻數(shù)表 菜單欄 Statistics Table Analysis 分別把變量選入Row、Column、Strata窗口,OK 用Tables可以選每個格中出現(xiàn)更多的結(jié)果,三、定量資料頻數(shù)表,先用MEANS過程找出最大值和最小值 MIN=2.5 MAX=5.71 RANGE=3.2

28、1 確定組距(I=0.3)和第一組段的下限(L=2.5) 然后用數(shù)據(jù)步分組 賦值新的變量:Y=INT(X-L)/I)*I+L 用FREQ過程作頻數(shù)表: DATA AA; SET AA5; Y=INT(X-2.5)/0.3)*0.3+2.5; PROC FREQ; TABLES Y; RUN;,定量資料作直方圖 PROC GCHART; VBAR X/LEVELS=11 SPACE=0 ; RUN; GCHART過程作圖 VBAR 作縱向條圖 ; HBAR作橫向條圖 常用選項有: LEVELS 分組的數(shù)目 WIDTH 指定豎條的寬度,以字符寬度為單位 SPACE 指定豎條之間的距離,直方圖=0

29、MIDPOINTS=2.65 TO 5.65 BY 0.3 指定組中值,直方圖非編程方式(分析員模塊),菜單欄 Globals Analyze Statistical Analysis 菜單欄 File Open by SAS name 菜單欄 Graphs Histogram 把變量選入Analysis窗口,OK 用 Display 可以增加更多的選項,第四節(jié) 定量資料假設(shè)檢驗,一、樣本均數(shù)與總體均數(shù)比較 以往新生兒出生體重平均為3000g,某醫(yī)院對產(chǎn)婦開展孕期保健指導(dǎo)后,測得15名新生兒出生體重如下,問開展孕期保健指導(dǎo)后對新生兒體重是否有影響? 2800 3400 2900 2750 30

30、00 3100 4600 3900 2350 3500 2600 3700 3800 2950 3200,樣本均數(shù)與總體均數(shù)比較用MEANS過程,DATA AA6; INPUT X; Y=X-3000; CARDS; 2800 3400 2900 2750 3000 3100 4600 3900 2350 3500 2600 3700 3800 2950 3200 ; PROC MEANS MEAN STD STDERR T PRT; VAR Y; RUN; 結(jié)果 Mean Std Dev Std Error T Prob|T| 236.67 586.60 151.46 1.56 0.1405

31、 P0.05,不拒絕H0,尚不能認為開展孕期保健指導(dǎo)對新生兒體重有影響 。,二、配對設(shè)計 t 檢驗,為了比較新舊兩個測聲計的測定效果,隨機選定10個場地,在每地同時用新舊兩個測聲計測量數(shù)據(jù)如下,問新舊兩個測聲計的測量結(jié)果是否不同? 場地 1 2 3 4 5 6 7 8 9 10 舊: 87 65 74 95 65 55 63 88 61 54 新: 86 66 77 95 60 53 62 85 59 55,配對設(shè)計 t 檢驗用MEANS過程,DATA AA7; INPUT X1 X2 ; Y=X1-X2;CARDS; 87 86 65 66 74 77 95 95 65 60 55 53 6

32、3 62 88 85 61 59 54 55 ; PROC MEANS MEAN STD STDERR T PRT; VAR Y; RUN; 結(jié)果 Mean Std Dev Std Error T Prob|T| 0.90 2.28 0.72 1.25 0.2440 P0.05,不拒絕H0,尚不能認為新舊兩個測聲計的測定結(jié)果有差別。,三、兩樣本均數(shù)比較,試比較克山病人與健康人的血磷值(mmol/L)是否不同? 克山病人 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人 0.54 0.64 0.64 0.75 0.76 0.81

33、 1.16 1.20 1.34 1.35 1.48 1.56 1.87,兩樣本均數(shù)比較用TTEST過程,DATA AA8; INPUT X; IF _N_11 THEN G=1; ELSE G=0; CARDS; 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 ; PROC TTEST; CLASS G; VAR X; RUN; 在TTEST過程中,分類變量G只能是兩分類。,條件語句 IF THEN /

34、ELSE,IF 后面是條件的表達式,如果滿足條件就執(zhí)行 THEN 后面操作,否則(不滿足條件),就執(zhí)行 ELSE 后面的操作(ELSE可選)。 IF X4=0 THEN X4=. ; IF CJ2 AND X5=1 THEN Y=1; ELSE Y=2; _N_ 是SAS數(shù)據(jù)步中自定義的變量,它的值表示觀測的序號。 IF _N_11 THEN G=1; ELSE G=0; 也可用G=(_N_11);賦值分組變量G:前11個觀測G=0,超過11時G=1。,t 檢驗結(jié)果 (1) G N Mean Std Dev Std Error 1 11 1.52 0.4218 0.1272 2 13 1.08

35、 0.4221 0.1171 (2) Variances方差 T DF Prob|T| Unequal 不齊 2.5239 21.4 0.0196 Equal 齊 2.5237 22.0 0.0193 (3) For H0: Variances are equal, 方差齊性檢驗 F = 1.00 DF = (12,10) ProbF = 1.00 結(jié)論:P0.05,拒絕H0,接受H1,可以認為兩組人群血磷值不同,克山病人血磷值較高。,兩大樣本均數(shù)比較時,如只有均數(shù)標準差,而無原始數(shù)據(jù)時,無法直接調(diào)用SAS軟件中的某個過程進行分析,只能在數(shù)據(jù)步中按照計算公式編寫程序完成。 調(diào)查健康人群紅細胞數(shù)

36、 (1012/L)資料如下: 男性360人,均數(shù)466.02,標準差57.46; 女性255人,均數(shù)417.80,標準差29.10。 試比較男女紅細胞數(shù)有無差別?,DATA BB; INPUT N1 X1 S1 N2 X2 S2; SE=SQRT(S1*S1/N1+S2*S2/N2); U=ABS(X1-X2)/SE; P1=1-PROBNORM(U); P=2*P1; U=ROUND(U,0.001); P=ROUND(P,0.00001); IF P0.0001 THEN P=0.0001; FILE PRINT; PUT #2 10 U= 25 P= ; CARDS; 360 466.0

37、2 57.46 255 417.80 29.10 ; RUN;,定量資料假設(shè)檢驗非編程方式(分析員模塊),菜單欄 Globals Analyze Statistical Analysis 菜單欄 File Open by SAS name (1)樣本均數(shù)與總體均數(shù)比較 菜單欄 Statistics Hypothesis Tasts One-Sample t-test for Means 往Variable窗口選入變量,Mean 窗口輸入,OK 和己知時可選 One-Sample z-test for Means Mean 窗口輸入, Std Dev 窗口輸入。,(2)配對 t檢驗 菜單欄 St

38、atistics Hypothesis Tasts Two-Sample Paired t-test for Means 分別選入第一組和第二組變量 ,OK (3)兩樣本均數(shù)比較 t檢驗 菜單欄 Statistics Hypothesis Tasts Two-Sample t-test for Means 往Dependent窗口選入要分析的變量 往Group窗口選入分類變量,OK,四、單因素方差分析,用于完全隨機設(shè)計(成組設(shè)計)資料 例:比較三組人群載脂蛋白測定值有無差別?,單因素方差分析用ANOVA過程,DATA AA9; INPUT X; IF _N_20 THEN G=3; ELSE

39、G=2; CARDS; 85.7 105.2 109.5 96.0 115.2 95.3 ; PROC MEANS; CLASS G; VAR X; PROC ANOVA; CLASS G; MODEL X=G; MEANS G/SNK ; RUN; 在SNK后面加HOVTEST可以作方差齊性檢驗,Analysis of Variance Procedure Dependent Variable: X Source DF Sum of Squares Mean Square F Value Pr F 變異來源 自由度 SS MS F P Model模型 2 2384.02550505 1192

40、.01275253 5.85 0.0077 Error誤差 27 5497.83616162 203.62356154 Total總 29 7881.86166667 R-Square R2 C.V. Root MSE Sy.x X Mean 0.302470 12.93519 14.26967279 110.31666667 Source DF Anova SS Mean Square F Value Pr F 變異來源 自由度 SS MS F P G組間 2 2384.02550505 1192.01275253 5.85 0.0077 P0.01,拒絕H0,接受H1,可以認為三組人群載脂

41、蛋白不同。,Student-Newman-Keuls test for variable: X 均數(shù)間兩兩比較q檢驗(SNK法) Means with the same letter are not significantly different. 相同字母表示的均數(shù)無顯著性差別 SNK Grouping Mean N G A 122.800 10 3 B 105.455 11 1 B B 102.389 9 2 第三組高于前兩組,即健康人的載脂蛋白高于兩組病人。,單因素方差分析時,如只有各組的均數(shù)、標準差,而無原始數(shù)據(jù)時,無法直接調(diào)用SAS軟件中的某個過程進行分析,只能在數(shù)據(jù)步中按照計算公式

42、編寫程序完成。 例:研究不同季節(jié)人體腎上腺皮質(zhì)3-HSD活性變化,DATA AA; INPUT K XX; DO I=1 TO K; INPUT N X S; OUTPUT; SS1+(XX-X)*(XX-X)*N; SS2+S*S*(N-1);NN+N; END; SS1=SS1/(K-1); SS2=SS2/(NN-K); F=SS1/SS2; P=1-PROBF(F,K-1,NN-K); F=ROUND(F,0.001); P=ROUND(p,0.00001); IF P0.0001 THEN P=0.0001; FILE PRINT; PUT #2 10 F= 25 P= ; CARD

43、S; 4 0.6867(總均數(shù)) 42 0.78 0.13 40 0.69 0.22 32 0.68 0.14 36 0.58 0.20 ; RUN;,五、兩因素方差分析,用于隨機區(qū)組設(shè)計(配伍組設(shè)計)資料 例:取同品系同體重24只小鼠分為8組,每組3只小鼠來自同一窩,分別用A、B、C三種營養(yǎng)素喂養(yǎng),問三周后所增體重有無差別。,兩因素方差分析用ANOVA過程,DATA AA10; DO I=1 TO 3; DO J=1 TO 8; INPUT X; OUTPUT; END; END; CARDS; 50.1 47.8 53.1 63.5 71.2 41.4 61.9 42.2 58.2 48.

44、5 53.8 64.2 68.4 45.7 53.0 39.8 64.5 62.4 58.6 72.5 79.3 38.4 51.2 46.2 ; PROC MEANS; CLASS I ; VAR X; PROC ANOVA; CLASS I J ; MODEL X=I J ; RUN;,Analysis of Variance Procedure Dependent Variable: X Source DF Sum of Squares Mean Square F Value Pr F Model模型 9 2521.29375 280.14375 11.52 0.0001 Error誤差

45、 14 340.54250 24.32446 Total總 23 2861.83625 R-Square C.V. Root MSE X Mean 0.881006 8.860514 4.93198381 55.6625 Source DF Anova SS Mean Square F Value Pr F I 處理間 2 144.9175 72.45875 2.98 0.0836 J 區(qū)組間 7 2376.37625 339.48232 13.96 0.0001 處理間P0.05,不拒絕H0,尚不能認為三種營養(yǎng)素喂養(yǎng)小鼠增重有差別;區(qū)組間P0.01,拒絕H0,接受H1,可以認為8組小鼠體重增

46、加有差別。,循環(huán)語句,在數(shù)據(jù)步的執(zhí)行中反復(fù)地執(zhí)行某一部分語句。 DO 循環(huán)變量=初值 TO 終值 BY 增值 ;END; 增量=1時可省略。 DATA B1; DATA B2; DO I=1 TO 10; DO I=1 TO 10 BY 2; S+I; S+I; OUTPUT; OUTPUT; END; END; PROC PRINT; PROC PRINT; RUN; RUN;,循環(huán)語句可以嵌套(多重循環(huán)) 如打印乘法表: 1*1=1 DATA BB; 2*1=2 2*2=4 DO I=1 TO 9; 3*1=3 3*2=6 3*3=9 DO J=1 TO I; 4*1=4 4*2=8 4*

47、3=12 4*4=16 X=I*J; 5*1=5 5*2=10 5*3=15 OUTPUT; 6*1=6 6*2=12 6*3=18 END; 7*1=7 7*2=14 7*3=21 END; 8*1=8 8*2=16 8*3=24 PROC PRINT; 9*1=9 9*2=18 9*3=27 RUN;,單因素方差分析的數(shù)據(jù)也可以用雙重循環(huán)語句編寫,在各組樣本含量不等時,加缺失值 “.”補滿。,DATA BB; DO I=1 TO 11; DO J=1 TO 3; INPUT X; OUTPUT; END; END; CARDS; 85.7 96 144 105.2 124.5 117 10

48、9.5 105.1 110 96 76.4 109 115.2 95.3 103 95.3 110 123 110 95.2 127 106.5 99 121 125.6 120 115 100 . 159 111 . . ; PROC ANOVA; CLASS J; MODEL X=J; RUN;,六、三因素方差分析,用于拉丁方設(shè)計資料 例:比較動物對不同藥物和用藥次序的反應(yīng) 拉丁方設(shè)計要求三因素水平數(shù)相同,因有四種藥物A、B、C、D,故取4只動物,反復(fù)用藥4次。,DATA AA11; DO CX=1 TO 4; DO DW=1 TO 4; INPUT YW$ X ; OUTPUT; END

49、; END; CARDS; A 75 B 29 C 27 D 42 B 45 D 71 A 81 C 53 C 25 A 71 D 80 B 23 D 47 C 31 B 48 A 87 ; PROC ANOVA; CLASS CX DW YW; MODEL X=CX DW YW; MEANS YW/ SNK; RUN;,Dependent Variable: X Source DF Sum of Squares Mean Square F Value Pr F Model 9 6396.5625 710.7292 4.02 0.0521 Error 6 1059.8750 176.6458

50、Total 15 7456.4375 R-Square C.V. Root MSE X Mean 0.857858 25.46743 13.29081763 52.1875 Source DF Anova SS Mean Square F Value Pr F CX 3 773.1875 257.7292 1.46 0.3167 DW 3 270.68750 90.2292 0.51 0.6894 YW 3 5352.68750 1784.2292 10.10 0.0092 四種藥物之間PB、C。而動物之間和用藥次序均無影響。,七、析因試驗設(shè)計的方差分析,可以分析各因素之間的交互作用。 例:用

51、新、舊兩法分別提取某食品中甲、乙兩種化合物,觀察回收率有無差別(包括方法間、化合物間及方法與化合物間交互作用)。,DATA AA12; DO A=1 TO 2; DO B=1 TO 2; DO I=1 TO 4; INPUT X ; OUTPUT; END; END; END; CARDS; 52 48 44 44 84 88 90 88 52 44 40 26 47 64 52 45 ; PROC ANOVA; CLASS A B; MODEL X=A B A*B; RUN;,Dependent Variable: X Source DF Sum of Squares Mean Square

52、 F Value Pr F Model 3 5309.00 1769.67 33.39 0.0001 Error 12 636.00 53.00 Total 15 5945.00 R-Square C.V. Root MSE X Mean 0.893019 12.82839 7.28 56.75 Source DF Anova SS Mean Square F Value Pr F A 1 1764.00 1764.00 33.28 0.0001 B 1 2704.00 2704.00 51.02 0.0001 A*B 1 841.00 841.00 15.87 0.0018 不同方法、不同化

53、合物間均有差別,且交互作用也有統(tǒng)計學意義。 新法高于舊法,乙物高于甲物,以新法+乙物為最佳組合。,八、交叉試驗設(shè)計的方差分析,研究新藥催醒寧對麻醉劑的作用,將6只大鼠配成3對,隨機決定每對中1只接受處理的順序(催醒寧或生理鹽水),等動物完全清醒3天后將實驗組和對照組動物互換,同法重復(fù)試驗一次。結(jié)果如下: (Y 藥物組 D 對照組),DATA AA13; DO CX=1 TO 2; DO DW=1 TO 6; INPUT YW$ X ; OUTPUT; END; END; CARDS; Y 15 D 31 Y 17 D 30 D 25 Y 5 D 27 Y 25 D 28 Y 14 Y 18 D

54、 26 ; PROC ANOVA; CLASS CX DW YW; MODEL X=CX DW YW; RUN;,Dependent Variable: X Source DF Sum of Squares Mean Square F Value Pr F Model 7 621.5833 88.7976 5.85 0.0535 Error 4 60.6667 15.1667 Total 11 682.2500 R-Square C.V. Root MSE X Mean 0.911079 17.90547 3.8944 21.75 Source DF Anova SS Mean Square F Value Pr F CX 1 18.75 18.75 1.24 0.3285 DW 5 158.75 31.75 2.09 0.2470 YW 1 444.08 444.08 29.28 0.0057 藥物間P0.01,拒絕H0,接受H1,可以認為實驗組與對照組不同,催醒寧有效。,方差分析非編程方式(分析員模塊),菜單欄 Globals Analyze Statistical Analysis 菜單欄 File Open by SAS name (1)單因素方差分析 菜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論