




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 SAS數據分析完整筆記。收藏2013-08-11ice數據分析數據分析1.SASINSIGHT啟動:方法1:SolutiomAnalysisInteractiveDateAnalysis方法2:在命令欄內輸入insight方法3:程序編輯窗口輸入以下代碼,然后單擊Submit按鈕;Procinsight;Run;一維數據分析用sasinsight做直方圖、盒形圖、馬賽克圖。直方圖:AnalysisHistogram/BarChart盒形圖:AnalysisBoxplot馬賽克圖:AnalysisBoxplot/Mosaicplot(Y)二維數據分析散點圖:AnalysisScatterypl
2、ot(YX)曲線圖:AnalysisLineplot(YX)三維數據分析旋轉圖:AnalysisRotationgPlot曲面圖:AnalysisRotationgPlot設置FitSurface等高線圖:AnalysisCountorplot分布分析驗。包括:直方圖、盒形圖、各階矩、分位數表,直方圖擬合密度曲線,對特定分布進行檢1.4.1AnalysisDistribution(Y)第一部分為盒形圖,第二部分為直方圖,第三部分為各階矩,第四部分為分位數表。添加密度估計A:參數估計:給出各種已知分布(正態(tài),指數等),只需要對其中參數進行估計;CurvesParametricDensityB:核
3、估計:對密度函數沒有做假設,曲線性狀完全依賴于數據;CurvesKernelDensity1.4.3分布檢驗CurvesCDFconfidencebandCurvesTestforDistribution曲線擬合AnalysisFit(YX):分析兩個變量之間的關系多變量回歸AnalysisFit(YX)方差分析AnalysisFit(YX)相關系數計算AnalysisMultivariate主成分分析AnalysisMultivariate2.SASANALYST啟動:方法1:SolutionAnalysisAnalyst方法2:在命令欄內輸入analyst分類計算統計量:DataSumma
4、rizebygroup隨機抽樣:DataRandomSample生成報表:ReportTables變量計算:DateTransform繪制統計圖條形圖:GraphBarChartHorizontal餅圖:GraphPieChart直方圖:GraphHistogram概率圖:GraphProbalityplot散點圖:GraphScatterplot2.6統計分析與計算2.6.1計算描述性統計量StatisticsDescriptiveSummartStatistics只計算簡單統計量StatisticsDescriptiveDistribution可計算一個變量的分布信息StatisticsD
5、escriptiveCorrelations可計算變量之間的相關關系StatisticsDescriptiveFrequencycounts可計算頻數列聯表分析StatisticsTableAnalysis2.7假設檢驗2.7.1單樣本均值Z檢驗:檢驗單樣本均值與某個給定的數值之間的關系StatisticsHypothesistestsOne-SampleZ-testforamean2.7.2單樣本均值t檢驗:適用于不了解變量的方差情形推斷該樣本來自的總體均數卩與已知的某一總體均屬卩0是否相等StatisticsHypothesistestsOne-Samplet-testforamean2.
6、7.3單樣本比例檢驗:檢驗取離散值的變量取某個值的比例StatisticsHypothesistestsOne-Sampletestforaproportion2.7.4單樣本方差檢驗:檢驗樣本方差是否等于給定的值。零假設方差等于某個給定的StatisticsHypothesistestsOne-Sampletestforavariance2.7.5兩樣本均值t檢驗:獨立的兩個總體的均值是否相等或者是否相差給定的值StatisticsHypothesistestsTwo-Samplet-testformeans2.7.6成對樣本均值t檢驗:成對樣本檢驗中總體是相關的。StatisticsHyp
7、othesistestsTwo-Samplepairedt-testformeans兩樣本比例檢驗:檢驗兩個總體中某個比例的值是否相等。StatisticsHypothesistestsTwo-Sampletestforproportions兩樣本方差檢驗StatisticsHypothesistestsTwoSampletestforvariance2.8ANOVA過程2.8.1單因素ANOVA過程StatisticsANOVAOne-WayAnova2.8.2非參數的單因素方差分析:適用于正態(tài)分布假定或方差相等假設不能滿足的單因素問題StatisticsANOVAnonparametero
8、ne-wayAnovatestWilcoxon法、Median法、VanderWaerden法、Savage法。2.8.2因素方差分析:實驗結果是連續(xù)數值而分類變量是兩個以上的離散型數值。StatisticsANOVAFactorialAnova2.8.3線性模型:用最小二乘法擬合一般線性模型StatisticsANOVALinearModel2.9回歸分析:StatisticsRegression2.9.1simple回歸:簡單一類回歸分析,單一的自變量,單一的因變量,模型可以是一次、二次、三次。StatisticsRegressionsimple2.9.21inear回歸:線性回歸,回歸模
9、型可以有多個因變量,多個自變量,但是對因變量分別進行回歸StatisticsRegressionlinear2.9.3logistic回歸:用于解決因變量是一個二元變量StatisticsRegressionlogistic3.報表以及圖形輸出3.1print過程Procprintdata=sasuser.score;/數據庫.數據集Run;Procprintdata=sasuser.score;VarnamemathChinese;/變量Run;Procprintdata=sasuser.scorenoobs;/去掉第一列(觀測序號)VarnamemathChinese;Run;Procpr
10、intdata=sasuser.score;Wheresexin(F);/通過where語句Run;Procprintdata=sasuser.scorenoobslabel;Title女生成績單;Labelname=姓名Sex=性別,Math=數學,Chinese=語文,English=英語飛Wheresexin(f5);Run;Title“thesassystem”;/恢復系統標題Procprintdata=sasuser.score;Footnote=分數列表5;/加分數列表的腳注Run;Procsortdata=sasuser.score;Bysex;Run;Procprintdata
11、=sasuser.score;/使用by分組輸出前用sort排序Bysex;Run;Procprintdata=sasuser.score;Summath;Run;tabulate過程Proctabulatedata=數據集名稱;Class分類變量;Var分析變量;Table頁面說明行維說明列維說明/選項Run;sort過程Procsortdata=數據集名稱;/默認升序排列By變量名;Run;Procsortdata=數據集名稱;Bydescending變量名;/降序排列Run;means過程:數量(N)、均值(Mean)、標準差(StdDev)、最大值(Maximum)、最小值(Minim
12、um)Procmeansdata=sasuser.stock;Varprice;Run;univariate過程Procunivariatedata=數據集;Var分析變量;Run;結果:Moments:統計量的各階矩,例如一階矩就是均值,二階矩就是方差等;BasicStatisticalMeasures:基本統計量;Testsforlocation:檢驗均值是否為零;Quantiles:分位數表;ExtremeObservations:極端觀測值。3.6freq過程:離散變量的分布情況Procfreqdata=數據集名;Tables變量名;Run;結果:變量取值、頻數、百分比、累計頻數、;累
13、計百分比3.7corr過程:相關系數Proccorrdata=數據集;Var變量名變量名;Run;結果:簡單統計量相關系數及p值gplot過程:繪制散點圖和曲線圖,繪制回歸曲線。Procgplotdata=數據集名稱;Symbol曲線類型;Plot豎軸變量*橫軸變量;Run;Procgplotdata=sasuser.score;SymbolI=nonev=star;PlotEnglish*Chinese;Run;gchart過程:繪制直方圖、餅圖、三維直方圖等。Procgchartdata=數據集名稱;Vbar/pie/block=變量;Run;3.10G3D過程繪制三維曲面Procg3dd
14、ata=數據集;Plot變量x*變量y=變量z;Run;gcontour過程:畫出曲面的等高線Procgcontourdata=數據集名;Plotx*y=z;Run;4.基本統計分析4.1正態(tài)性檢驗:univariate過程Procunivariatedata=sasuser.stocknormal;Vareps;Run;Procunivariatedata=sasuser.stocknormal;Vareps;Histogrameps;/畫出直方圖Probploteps;/畫出概率分布圖Run;4.2單變量均值檢驗4.2.1如果一個變量服從正態(tài)分布,那么可以用t檢驗來對變量進行均值檢驗Pro
15、cttestdata=數據集ho=均值;Var檢驗變量;Run;4.2.2t檢驗還可以檢驗方差相同的兩個獨立樣本均值是否相等Procttestdata=數據集;Class分類變量;Var檢驗變量;Run;結果第一部分簡單統計量第二部分t檢驗結果第三部分兩者方差是否相等檢驗T檢驗要求兩個獨立樣本都必須服從正態(tài)分布,如果不服從正態(tài)分布,則無法進行t檢驗。這時可用非參數的方法,常用的非參數方法是NPAR1WAY過程,它是noparameter1way縮寫。4.3成對總體均值檢驗4.4回歸分析:reg(回歸)過程、rsreg(二次響應面回歸)過程、orthoreg(病態(tài)數據回歸)過程、nlin(非線性
16、回歸)過程、transreg(變換回歸)過程、calis(線性結果方程和路徑分析)過程、glm(一般線性回歸)過程、genmod(廣義線性回歸)過程REG過程Procregdata=輸入數據集選項;Var變量列表;Model因變量=自變量列表;Print輸出結果;Plot診斷圖形;Run;nlin過程指明模型的表達式并給定系數初值4.4.3glm過程:使用最小二乘法回歸線性模型,還可以進行回歸,分差,協方差,多變量方差、偏相關系數分析方差分析4.5.1單因素方差分析Procanovadata=數據集名稱;Class因素;Model實驗結果=因素;Run;Procanovadata=數據集名稱;Class因素;Model實驗結果=因素;Meansbrand;Run;Procanovadata=數據集名稱;Class因素;Model實驗結果=因素;Meansbrand/t;/t檢驗Run;Procanovadata=數據集名稱;Class因素;Model實驗結果=因素;Meansbrand/bon;/bonferronit檢驗控制第一類錯誤的概率,但是具有較大第二類錯誤概率Run;Procanovadata=數據集名稱;Class因素;Model
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 計算機基礎考試常識解析試題及答案2024
- 實驗室考試試題及答案
- 汽車美容師消費者心理研究試題及答案
- 食品安全培訓課程的設計思路試題及答案
- 汽車維修技能綜合測試試題及答案
- 公務員考試中常見的車輛管理難點試題及答案
- 探討2024年食品質檢員考試的關鍵內容及答案
- 深度解析汽車維修工考試內容及答案
- 2024年語文學習輔導試題及答案
- 聽力廣播測試題及答案解析
- 促銷員銷售技巧培訓課件
- 車廂銷售合同范本
- 萬科客戶滿意度調查及方案
- 2024-2030年中國乳腺疾病預防與治療行業(yè)供求分析及投資戰(zhàn)略研究報告
- 《25 黃帝的傳說》公開課一等獎創(chuàng)新教學設計及反思
- 人教A版(新教材)高中數學選擇性必修第三冊學案:習題課 兩個計數原理及排列組合
- 配網標準化建設技術規(guī)范(福建電網)
- 半導體芯片產品供應鏈分析
- 挑戰(zhàn)杯調研報告正文
- 《天潤乳業(yè)公司償債能力存在的問題及對策9000字》
- 電動摩托車項目可行性實施報告
評論
0/150
提交評論