第三講、用SAS作回歸分析ppt課件_第1頁
第三講、用SAS作回歸分析ppt課件_第2頁
第三講、用SAS作回歸分析ppt課件_第3頁
第三講、用SAS作回歸分析ppt課件_第4頁
第三講、用SAS作回歸分析ppt課件_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、回歸分析中SAS的運用11、回歸分析計算PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量;RUN;PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量名列/ p cli clm RUN;22、回歸線作圖PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p cli clm r; PLOT y變量*x變量/選項;RUN;利用plot語句可以繪制與擬合數(shù)據(jù)有關(guān)散點圖、回歸線和置信曲線、預(yù)測區(qū)間曲線3回歸線作圖PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p cli clm r; PLOT y變量*x變量/選項;RUN;y變量和x

2、變量可以是應(yīng)變量、自變量和其它與回歸分析有關(guān)的變量:p.(predicted) 預(yù)測值r. (residual) 余差U95., L95. 預(yù)測值置信限U95M.,L95M.預(yù)測均值置信限選項:conf 95作預(yù)測均值置信曲線pred95作預(yù)測值置信曲線overlay將語句中規(guī)定的圖迭置在一幅圖上AIC CP MSE SSE在圖上顯示相應(yīng)的統(tǒng)計量43、逐漸回歸分析計算-變量選擇PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量名列/p cli clm r selection=stepwise slentry=0.05 slstay=0.05 details;RUN;54、回歸診

3、斷例外值(outliers)或異常作用點的檢查從已擬合回歸的數(shù)據(jù)中分析線性模型的假定能否被破壞:應(yīng)變量的均值能否是獨立變量的線性函數(shù),能否需求對變量進(jìn)展變換或擬合曲線回歸余差(residuals)能否同方差,不相關(guān),正態(tài)分布獨立變量間能否存在線性關(guān)系(僅多元有)調(diào)查余差散點圖是進(jìn)展回歸診斷的必要步驟6回歸診斷7回歸診斷回歸分析的余差值是回歸診斷的重要工具rYYiii = - 個預(yù)測值為第其中 :余差的定義為iYYYriiii 利用余差可以調(diào)查余差和預(yù)測值的散點圖也可以檢驗余差分布的正態(tài)性8回歸診斷3.4.1.2.模型適宜模型適宜應(yīng)改曲線模應(yīng)改曲線模型型不等方差不等方差觀測值不獨立觀測值不獨立9

4、回歸診斷生成余差在PROC REG的model語句加上選項 p,就會輸出預(yù)測值和相應(yīng)的余差PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p; PLOT y變量*x變量/選項;RUN;利用plot語句 plot r.*p. ; 就可得到余差-預(yù)測散點圖,其中可以把p值換成自變量x,就得到相應(yīng)的散點圖。10回歸診斷識別異常觀測值在PROC REG的model語句加上選項 r,就會輸出與預(yù)測值和余差有關(guān)的一些統(tǒng)計量。他們可用于識別異常數(shù)據(jù)(outlier)及其影響PROC REG DATA=數(shù)據(jù)集名 ; MODEL 應(yīng)變量=自變量/r;RUN;Predict Value 預(yù)測值

5、Std Err Predict 預(yù)測值規(guī)范差Residual 余差Std Err Predict 余差規(guī)范差Student Residual student化的余差-2 -1 0 1 2 余差顯著性圖Cooks D Cooks D統(tǒng)計量其中D是間隔 的縮寫。11回歸診斷余差分布正態(tài)性有了余差的數(shù)據(jù),就可對其運用圖形方法或正式的分布正態(tài)性的檢驗在INSIGHT中可直接對數(shù)據(jù)表中的預(yù)測余差變量進(jìn)展分析在PROC REG可利用以下語句用圖形分析余差分布正態(tài)性PROC REG DATA=數(shù)據(jù)集名 graphics ; MODEL 應(yīng)變量=自變量; PLOT nqq.*student.(nqq.*r.)

6、;RUN;12回歸診斷識別有影響的觀測Cook D統(tǒng)計量度量一個觀測從分析中剔除時參數(shù)估計值的變化對一個觀測值其 Cook D 統(tǒng)計量的值超過 4/n 時(n為樣本容量),這個觀測存在反常效應(yīng), 其中4/n只是閱歷,沒有一致的規(guī)范。13回歸診斷識別有影響的觀測Dffitsi 度量第i 個觀測對預(yù)測值的影響iY第i個觀測的預(yù)測值 )(iY用排除第i個觀測的回歸對第i個觀測的預(yù)測值 )(iYS第i個觀測的預(yù)測值的規(guī)范差,是為了把數(shù)據(jù)規(guī)范化。其中Dffits越大越好,D是different和fit的縮寫闡明,)(Dffits)(iiiiYsYY npi/2? |Dffits|p 為模型中參數(shù)的個數(shù),

7、 n 為樣本容量其中14回歸診斷識別有影響的觀測Proc REG 的 Model語句加選項 r 可獲得 Cook D 統(tǒng)計量Proc REG 的 Model語句加選項 influence 可獲得 Dffits 等反映觀測值影響的統(tǒng)計量PROC REG DATA=數(shù)據(jù)集名 ; MODEL 應(yīng)變量=自變量/r influence;RUN;15選項 influence 生成的統(tǒng)計量 Hat diag:帽子矩陣,可以把杠桿點找出來,用的較多。Dbet:表示某個點刪除前后統(tǒng)計量的變化。16五、影響點診斷proc reg data=e4;model y1=x1-x4/influence r;run;其中選

8、項其中選項influence 同上一頁。同上一頁。R主要給主要給出出Cook-distance.前面已有。前面已有。17六、共線性診斷共線性(collinearity, multicollinearity)問題是指獨立變量間存在線性關(guān)系1.變量間的線性關(guān)系會隱蔽變量的顯著性2.也會添加參數(shù)估計的方差3.產(chǎn)生不穩(wěn)定的模型只需擬合多元回歸才會發(fā)生這一問題共線性的診斷可運用方差膨脹因子、條件指數(shù)和方差比例18回歸診斷共線性診斷-VIF方差膨脹因子(VIF)是對由于共線性而引起的參數(shù)估計量的方差添加的一個相對度量r2rTOL111VIFrR獨立時系數(shù)方差系數(shù)方差Rr2 是Xr關(guān)于模型中其它獨立變量回歸的R2普通采用 VIF 10 闡明存在共線性問題Proc REG 的Model語句加選項 VIF19回歸診斷共線性診斷-條件指數(shù)和方差比例條件指數(shù)(condition index)和方差比例(variance proportion)結(jié)合運用可確認(rèn)存在線性關(guān)系的變量組條件指數(shù)(hi=(lmax/li)1/2)在10-30間為弱相關(guān)在30-100間為中度相關(guān)大于100闡明有強(qiáng)相關(guān)大的條件指數(shù)伴隨方差比例 0.5 可確認(rèn)有共線性的獨立變量子集Proc REG: Model語句加選項collin 或 col

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論