SAS數(shù)據(jù)分析完整筆記_第1頁
SAS數(shù)據(jù)分析完整筆記_第2頁
SAS數(shù)據(jù)分析完整筆記_第3頁
SAS數(shù)據(jù)分析完整筆記_第4頁
SAS數(shù)據(jù)分析完整筆記_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 SAS數(shù)據(jù)分析完整筆記。收藏2013-08-11ice數(shù)據(jù)分析數(shù)據(jù)分析1.SASINSIGHT啟動:方法1:SolutiomAnalysisInteractiveDateAnalysis方法2:在命令欄內(nèi)輸入insight方法3:程序編輯窗口輸入以下代碼,然后單擊Submit按鈕;Procinsight;Run;一維數(shù)據(jù)分析用sasinsight做直方圖、盒形圖、馬賽克圖。直方圖:AnalysisHistogram/BarChart盒形圖:AnalysisBoxplot馬賽克圖:AnalysisBoxplot/Mosaicplot(Y)二維數(shù)據(jù)分析散點圖:AnalysisScatterypl

2、ot(YX)曲線圖:AnalysisLineplot(YX)三維數(shù)據(jù)分析旋轉(zhuǎn)圖:AnalysisRotationgPlot曲面圖:AnalysisRotationgPlot設(shè)置FitSurface等高線圖:AnalysisCountorplot分布分析驗。包括:直方圖、盒形圖、各階矩、分位數(shù)表,直方圖擬合密度曲線,對特定分布進行檢1.4.1AnalysisDistribution(Y)第一部分為盒形圖,第二部分為直方圖,第三部分為各階矩,第四部分為分位數(shù)表。添加密度估計A:參數(shù)估計:給出各種已知分布(正態(tài),指數(shù)等),只需要對其中參數(shù)進行估計;CurvesParametricDensityB:核

3、估計:對密度函數(shù)沒有做假設(shè),曲線性狀完全依賴于數(shù)據(jù);CurvesKernelDensity1.4.3分布檢驗CurvesCDFconfidencebandCurvesTestforDistribution曲線擬合AnalysisFit(YX):分析兩個變量之間的關(guān)系多變量回歸AnalysisFit(YX)方差分析AnalysisFit(YX)相關(guān)系數(shù)計算AnalysisMultivariate主成分分析AnalysisMultivariate2.SASANALYST啟動:方法1:SolutionAnalysisAnalyst方法2:在命令欄內(nèi)輸入analyst分類計算統(tǒng)計量:DataSumma

4、rizebygroup隨機抽樣:DataRandomSample生成報表:ReportTables變量計算:DateTransform繪制統(tǒng)計圖條形圖:GraphBarChartHorizontal餅圖:GraphPieChart直方圖:GraphHistogram概率圖:GraphProbalityplot散點圖:GraphScatterplot2.6統(tǒng)計分析與計算2.6.1計算描述性統(tǒng)計量StatisticsDescriptiveSummartStatistics只計算簡單統(tǒng)計量StatisticsDescriptiveDistribution可計算一個變量的分布信息StatisticsD

5、escriptiveCorrelations可計算變量之間的相關(guān)關(guān)系StatisticsDescriptiveFrequencycounts可計算頻數(shù)列聯(lián)表分析StatisticsTableAnalysis2.7假設(shè)檢驗2.7.1單樣本均值Z檢驗:檢驗單樣本均值與某個給定的數(shù)值之間的關(guān)系StatisticsHypothesistestsOne-SampleZ-testforamean2.7.2單樣本均值t檢驗:適用于不了解變量的方差情形推斷該樣本來自的總體均數(shù)卩與已知的某一總體均屬卩0是否相等StatisticsHypothesistestsOne-Samplet-testforamean2.

6、7.3單樣本比例檢驗:檢驗取離散值的變量取某個值的比例StatisticsHypothesistestsOne-Sampletestforaproportion2.7.4單樣本方差檢驗:檢驗樣本方差是否等于給定的值。零假設(shè)方差等于某個給定的StatisticsHypothesistestsOne-Sampletestforavariance2.7.5兩樣本均值t檢驗:獨立的兩個總體的均值是否相等或者是否相差給定的值StatisticsHypothesistestsTwo-Samplet-testformeans2.7.6成對樣本均值t檢驗:成對樣本檢驗中總體是相關(guān)的。StatisticsHyp

7、othesistestsTwo-Samplepairedt-testformeans兩樣本比例檢驗:檢驗兩個總體中某個比例的值是否相等。StatisticsHypothesistestsTwo-Sampletestforproportions兩樣本方差檢驗StatisticsHypothesistestsTwoSampletestforvariance2.8ANOVA過程2.8.1單因素ANOVA過程StatisticsANOVAOne-WayAnova2.8.2非參數(shù)的單因素方差分析:適用于正態(tài)分布假定或方差相等假設(shè)不能滿足的單因素問題StatisticsANOVAnonparametero

8、ne-wayAnovatestWilcoxon法、Median法、VanderWaerden法、Savage法。2.8.2因素方差分析:實驗結(jié)果是連續(xù)數(shù)值而分類變量是兩個以上的離散型數(shù)值。StatisticsANOVAFactorialAnova2.8.3線性模型:用最小二乘法擬合一般線性模型StatisticsANOVALinearModel2.9回歸分析:StatisticsRegression2.9.1simple回歸:簡單一類回歸分析,單一的自變量,單一的因變量,模型可以是一次、二次、三次。StatisticsRegressionsimple2.9.21inear回歸:線性回歸,回歸模

9、型可以有多個因變量,多個自變量,但是對因變量分別進行回歸StatisticsRegressionlinear2.9.3logistic回歸:用于解決因變量是一個二元變量StatisticsRegressionlogistic3.報表以及圖形輸出3.1print過程Procprintdata=sasuser.score;/數(shù)據(jù)庫.數(shù)據(jù)集Run;Procprintdata=sasuser.score;VarnamemathChinese;/變量Run;Procprintdata=sasuser.scorenoobs;/去掉第一列(觀測序號)VarnamemathChinese;Run;Procpr

10、intdata=sasuser.score;Wheresexin(F);/通過where語句Run;Procprintdata=sasuser.scorenoobslabel;Title女生成績單;Labelname=姓名Sex=性別,Math=數(shù)學(xué),Chinese=語文,English=英語飛Wheresexin(f5);Run;Title“thesassystem”;/恢復(fù)系統(tǒng)標題Procprintdata=sasuser.score;Footnote=分數(shù)列表5;/加分數(shù)列表的腳注Run;Procsortdata=sasuser.score;Bysex;Run;Procprintdata

11、=sasuser.score;/使用by分組輸出前用sort排序Bysex;Run;Procprintdata=sasuser.score;Summath;Run;tabulate過程Proctabulatedata=數(shù)據(jù)集名稱;Class分類變量;Var分析變量;Table頁面說明行維說明列維說明/選項Run;sort過程Procsortdata=數(shù)據(jù)集名稱;/默認升序排列By變量名;Run;Procsortdata=數(shù)據(jù)集名稱;Bydescending變量名;/降序排列Run;means過程:數(shù)量(N)、均值(Mean)、標準差(StdDev)、最大值(Maximum)、最小值(Minim

12、um)Procmeansdata=sasuser.stock;Varprice;Run;univariate過程Procunivariatedata=數(shù)據(jù)集;Var分析變量;Run;結(jié)果:Moments:統(tǒng)計量的各階矩,例如一階矩就是均值,二階矩就是方差等;BasicStatisticalMeasures:基本統(tǒng)計量;Testsforlocation:檢驗均值是否為零;Quantiles:分位數(shù)表;ExtremeObservations:極端觀測值。3.6freq過程:離散變量的分布情況Procfreqdata=數(shù)據(jù)集名;Tables變量名;Run;結(jié)果:變量取值、頻數(shù)、百分比、累計頻數(shù)、;累

13、計百分比3.7corr過程:相關(guān)系數(shù)Proccorrdata=數(shù)據(jù)集;Var變量名變量名;Run;結(jié)果:簡單統(tǒng)計量相關(guān)系數(shù)及p值gplot過程:繪制散點圖和曲線圖,繪制回歸曲線。Procgplotdata=數(shù)據(jù)集名稱;Symbol曲線類型;Plot豎軸變量*橫軸變量;Run;Procgplotdata=sasuser.score;SymbolI=nonev=star;PlotEnglish*Chinese;Run;gchart過程:繪制直方圖、餅圖、三維直方圖等。Procgchartdata=數(shù)據(jù)集名稱;Vbar/pie/block=變量;Run;3.10G3D過程繪制三維曲面Procg3dd

14、ata=數(shù)據(jù)集;Plot變量x*變量y=變量z;Run;gcontour過程:畫出曲面的等高線Procgcontourdata=數(shù)據(jù)集名;Plotx*y=z;Run;4.基本統(tǒng)計分析4.1正態(tài)性檢驗:univariate過程Procunivariatedata=sasuser.stocknormal;Vareps;Run;Procunivariatedata=sasuser.stocknormal;Vareps;Histogrameps;/畫出直方圖Probploteps;/畫出概率分布圖Run;4.2單變量均值檢驗4.2.1如果一個變量服從正態(tài)分布,那么可以用t檢驗來對變量進行均值檢驗Pro

15、cttestdata=數(shù)據(jù)集ho=均值;Var檢驗變量;Run;4.2.2t檢驗還可以檢驗方差相同的兩個獨立樣本均值是否相等Procttestdata=數(shù)據(jù)集;Class分類變量;Var檢驗變量;Run;結(jié)果第一部分簡單統(tǒng)計量第二部分t檢驗結(jié)果第三部分兩者方差是否相等檢驗T檢驗要求兩個獨立樣本都必須服從正態(tài)分布,如果不服從正態(tài)分布,則無法進行t檢驗。這時可用非參數(shù)的方法,常用的非參數(shù)方法是NPAR1WAY過程,它是noparameter1way縮寫。4.3成對總體均值檢驗4.4回歸分析:reg(回歸)過程、rsreg(二次響應(yīng)面回歸)過程、orthoreg(病態(tài)數(shù)據(jù)回歸)過程、nlin(非線性

16、回歸)過程、transreg(變換回歸)過程、calis(線性結(jié)果方程和路徑分析)過程、glm(一般線性回歸)過程、genmod(廣義線性回歸)過程REG過程Procregdata=輸入數(shù)據(jù)集選項;Var變量列表;Model因變量=自變量列表;Print輸出結(jié)果;Plot診斷圖形;Run;nlin過程指明模型的表達式并給定系數(shù)初值4.4.3glm過程:使用最小二乘法回歸線性模型,還可以進行回歸,分差,協(xié)方差,多變量方差、偏相關(guān)系數(shù)分析方差分析4.5.1單因素方差分析Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實驗結(jié)果=因素;Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實驗結(jié)果=因素;Meansbrand;Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實驗結(jié)果=因素;Meansbrand/t;/t檢驗Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model實驗結(jié)果=因素;Meansbrand/bon;/bonferronit檢驗控制第一類錯誤的概率,但是具有較大第二類錯誤概率Run;Procanovadata=數(shù)據(jù)集名稱;Class因素;Model

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論