版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、實驗五回歸分析SAS過程(2)實驗目的:.會對實際問題建立有效的多元回歸模型,能對回歸模型進行殘差分析;.掌握SAS輸出結果用于判別回歸方程優(yōu)良性的不同統(tǒng)計量,能對回歸模型進 行運用,對實際問題進行預測或控制.實驗要求:編寫程序,結果分析.實驗內容:1.誤差的正態(tài)性檢驗有幾種方法,何時認為誤差項服從正態(tài)分布?答:1.學生化殘差2.殘差正態(tài)性的頻率檢驗3.殘差的正態(tài)QQ圖檢驗 判斷若散點(q(i),)(i =1,2,n)大致在一條直線上(r(i)-r)(q(i)-q)相關系數: D= i / 32 ;1 n_ n_% (r(i)-r)2 (q(i)-q)i 1i 1認為ri (i =1,2,n)
2、來自正態(tài)分布,接受誤差正態(tài)性檢驗2.回歸方程的選取的窮舉法中,評價回歸方程優(yōu)良性的準則有哪些?根據準則何 時方程最優(yōu)?答:1)修正的復相關系數準則或均方殘差準則(R2(p)或MSEp準則)Cp準則p3)預測平方和準則(PRES3準則)擬合所有可能的2M J-1個回歸方程,畫出 Cp圖:(p,Cp),在Cp圖中選取最接近參考直線Cp = p的點所對應的回歸方程為最優(yōu)方程.p3,簡述逐步回歸方法的思想和步驟.基本思想:逐個引入自變量建立回歸方程,每次引入對Y影響最顯著的自變量,并對方程中舊變量逐個進行檢驗,把變?yōu)椴伙@著的變量逐個從方程中剔除掉,最終得到的方程中,既不漏掉對丫顯著影響的變量,又不包含
3、對丫影響不顯著的變量,添加或刪除某個自變量的準則 是用殘差平方和的相對減少或增加來衡量.步驟:(1)修正的復相關系數準則、Cd準則選擇模型p(2)預測平方和準則選擇PRESS炭優(yōu)回歸方程(3)最優(yōu)模型的擬合檢驗4,做 2.6 2.8 (選作)2.9注意:可以選課外綜合題目2.6程序:data examp2_6;input x1 x2 y;cards;8.3 70 10.38.6 65 10.38.8 63 10.272 16.481 18.883 19.766 15.675 18.280 22.675 19.979 24.276 21.076 21.469 21.375 19.174 22.2
4、85 33.886 27.471 25.72 / 3264 24.978 34.580 31.774 36.372 38.377 42.681 55.482 55.780 58.380 51.580 51.020.6 87 77.0 ; run;proc reg data= examp2_6;model y=x1-x2;output out=a p=predict r=resid h=h student=r; run;data b;set a;drop x1-x2;run;proc print data=b; run;proc capability graphics noprint data=
5、a; /*對數據集 a 調用 capability過程,高分辨圖,不打印輸出 */qqplot r/normal; /*作 student 數據的正態(tài) QQ圖 */run;goptions reset=all; /*將圖形的設置恢復為默認狀態(tài)*/proc gplot data=a; /*對數據集a作出畫高分辨的散點圖或曲線圖*/plot resid*predict; /*畫縱坐標為殘差、橫坐標為yi散點圖*/symbol v=dot i=none; /*散點表示符號圓點?,不畫連線*/run;3 / 32*/*此處至Quit是計算學生化殘差對應的標準正態(tài)分布的分位數 proc sort dat
6、a=a;by r; /*按r排序*/proc iml; /*調用iml矩陣分析模塊,計算數據*/use a;/*打開數據集a */read all varr into rr; /*讀入集a中變量r(學生化殘差)各觀測值到矩陣rr中*/do i=1 to 31;/*此循環(huán)計算*/qi=probit(i-0.375)/54.25);q=q/qi; /* 矩陣 qi 上下連接而成,即得 54*1 階矩 q= (q(1),q(2),q(30) ) T */end;rq=rr|q;/*表示矩陣 rq= (rr q ) */create correl varr q;/*創(chuàng)建數據集 correl, 變量為
7、r、q */append from rq; /*從矩陣rq讀取數據()*/quit;/* iml過程結束*/proc corr data=correl; /*計算學生化殘差與對應的標準正態(tài)分布的分位數的相關系數*/run;4 / 32年08月01日 星期五 下午。的小8分羽秒 2predictresidrh4.83775.46234L496490.11S834.5居35.74615LC029E0.147214.81705.389021.528480J788616.87410.525890.139670.0591919.3SS0-1,D6901-0.29368Q.1Z06621.1183-1.3
8、1838*Q.389S?0.1557516,1327-0.59269-0.162280.1148019.246S-1.04535-0.276660.0614021.41901.188980.820900.0920120J37S-0.28753-0.075330.0479722.01642.134600.534770.0730321.4685-0.4S84S-Q.123690.0460921.4即 5-0.06046-0.01B080.0480920.506Z0.793855.212370.0727628,9541-4.85411-1.274890.0878627.8522-5.BE220-1.
9、4S2750.0356731.58402.21B030.612500J313138.8065-6.4Q648-1.7B9240J434B30.G0I0-4.S009S-1,306850.066G623.6370-3.73704-1J01370.2112434.38820.111820.02933o.oaeei3S.00S3-4.30632-1.135960.C454235,38530.S14740.241760.049954L7690-3.46300-0.948080.1114344.8777-2.27770*Q.S08210.06S3150.94294.457131.202&00.08842
10、52.22383.476250.941080.0980953.42854.871491.92767O.ia4253.8993-2.39933-0.655110.1098353.3983-2.09993-0.731630.10S83Ga.51538.484702.496141.2270S皚系統(tǒng)3324876?6 92Q4312B473573364735-OQ*u u o _nD co 9 ru Ou 2 _QM 4 4 i JI Qu ofc Ou 7 5 41 4 1 , CO 2 ru _b n_o i JI 7 1111111121222212322233334555557JI n Qu
11、4- RD no TI1 8- Qu fi- JI n &- 4 rD Ab 7 no Ad au JI -2 Ou 4 Ru Du 7r Qu Qu -u 1 1111111111222222222233EJP 一冶工工 Ft% ILHA-url-s(a)學生化殘差的正態(tài) QQ圖5 / 32J 4jRAPH|Res IduaI1 O 1-3-11PrqdiGttd V炳U罩 0f (b)擬合值?的殘差圖1.000000.94091,0001結果分析:1)2)0.94091差較大.因此,若擬合線性回歸模型,則誤差分布與正態(tài)分布有較大的偏離3) 丫擬合值的殘差圖也表明Y與X1,X2不滿足線性關系
12、,且兩個擬合值還為負數.由此知,直接假定體積與直徑和樹干高度之間的線性回歸關系是不恰當的.(2)對因變量Y作Box-Cox變換第一步:確定變換參數鑒于(1)中的殘差分析結果,我們對 Y作Box-Cox變換6 / 32Yd九0 .對不同的入值,由式SSR九;Z),并利用SAS系統(tǒng)proc imllnY, =0過程計算SSB:兒;Z)的值.由圖2.5給出了 SSR九;Z)隨人的變化曲線.求變換參數K的程序:proc iml;n=31;t=1;use examp2_6;read all varx1 x2 y into m;do i=1 to n;t=t#mi,3;end;prod=t#(1/n);j
13、=j(n,1,1);xx=j|m,1:2;h=xx*inv(xx*xx)*xx;do lamb=-0.5 to 0.5 by 0.01;if lamb=0 then zlamb=prod#10g(m ,5);else zlamb=(m,3#lamb-j)/(lamb#(prod#(lamb-1);sse=zlamb*(i(n)-h)*zlamb;lsse=lsse/(lamb|sse);end;tt=prod#log(m ,3);sse0=tt*(i(n)-h)*tt;lsse30,1=0;lsse30,2=sse0;index=lsse: FModel264.5514432,27572BID
14、.81 IIIIntercept12.848300.51162-5.57.0001X n10.4104(0.015652$剛 !r! under HO: RhoOHRQQRR1.000000.96990 0001QQ0.969901,00000 It 1Intercept1162.8759025.775656.32 FModel Error CorrectedTotal319224133.6332220IL584176145.217391377.87774105.8728513.01 |t|Intercept1162.8759025.775656.32 |r|RD1.000000.96423.
15、0001L96428 FModel22,235811.1179019.23C0001Error201.16244O.OE912CorrectedTotal223.39S251Root MSEC.24108R-Square0.BE79DependentMeani.72?42Adj R-Sq0+6237Cm VarSJ05I 1Parameter Est iuwitesVariable DFPirfttnetsrEst isateStandardErrort YiluePr |t|Intercept17.491460,6911212. B0COOOIxl1-0.02690u.oom-3.930.0
16、008x21-0.08161D.01309-2 JI0.0258復相關系數平方和為 % =579與表2.8的結果相比較,可見均方殘差、回歸系數 估計及擬合優(yōu)度的度量值 R2均變化很小,即當占之在模型中時,&對Z的影響是很 小的.最優(yōu)回歸方程為2 = 7.391450 0269gxi -0.03151由上述三種模型的選擇結果可以看出各準則下的選擇結果不一致。)1)程序如下:data exam2_9;input x1-x3 y;cards;50 51 2.3 4836 46 2.3 5740 48 2.2 6626 / 3241 44 1.8 7028 43 1.8 8949 54 2.9 364
17、2 50 2.2 4645 48 2.4 5452 62 2.9 2629 50 2.1 7729 48 2.4 8943 53 2.4 6738 55 2.2 4734 51 2.3 5153 54 2.2 5736 49 2.0 6633 56 2.5 7929 46 1.9 8833 49 2.1 6055 51 2.4 4929 52 2.3 7744 58 2.9 5243 50 2.3 60data a;set exam2_9;z=(y*0.07-1)/0.07;/*作 Box-Cox 變換 z=(y0.07-1)/0.07 */run;proc reg data=a;model
18、z=x1-x3/selection=stepwise slentry=0.10 slstay=0.10 details;run;2)結果輸出第一步 1進:樣本容量n=23 ,統(tǒng)計量集 A =G , l = 1 ,添加自變量Xk(1 Wk W5-1),擬MSE(Xk)合模型 Y =P0 +BkXk +后,計算 Fk(1) = SSRXk),及 pj =P(F(1,23-2)之 Fk),結果如下:依次添加占X名后,的3個模型的輸出結果27 / 32The REG ProcedureModel: MODEL IDependent Variable: 2Number of Observations R
19、ead Number of Observat ions UsedStepwise Select ion: Step 1and C(p) = 6.5375Statist ics for EntryDF : 1,21ModelVariableToleranceR-SquereF ValuePr Fxl1.0000000.G5B726.591。叫x?1.0000000JS3613,630,0014x3K000Q000.4116144680.0010Variable xl Entered: R-Square - 0*6667第一步中,給出了偏F統(tǒng)計量的自由度“DF=1, n-2=23-2=21 ,F的
20、值和相應的p值.由五用二SS用三)二26 59此知,變量所對應 “SEiXJ值最大,且其p值為p =0.0001 FModelErrorCorrected Tota1121221.898721.499533.39826LS9A72 0.0714126.59 FIntercept.096590.2722535.80742501.46.0001xl*0.034690,00673L8937226.59,0001Boundson cond it ionnumber: 1, 128 / 32第二步 第一步選擇模型為 y =瓦十口X1十以A = X1, l = 22進:將其余3-1=2個自變量Xi,X2,
21、X3逐個添加到此模型中,擬合模型Y =兔+PkXk +P1X1 + /假設H0k : Pk =0 (k =1,2,3),并計算各自的偏 F統(tǒng)計量HokFk=SSR k| 1) F(1,23-3)值和相應 p 值 pk2) =P(F (1,20)1 Fk), MSE(Xi,Xk)聲=弟R-)=(k =2,3) .其中 X2對應 F 值-5.80 最大,p值P = 083 Fx20.7632780,65796.800J266x3(L7523UU0.85535.600.0262VariahIe x2 Entered: R-Square=D.B679and C(p)-S.79B7X2進入2出:進一步考
22、查上述模型有無自變量被剔除.擬合模型并計算X1,X2的偏F統(tǒng)計量小)SS呢品|名)J 百國(燈乂)/ n = - jr =- = r,=MSE(瑞冬)15.46和-也). 5.80的值和p值F 三4 gQp(2) =P(F(1, 20)2F),p22) =P(F(1, 20)主 F2(2) .由于 X3 偏 F 統(tǒng)計量一較,P 0,0258 FModel22.285S11.1179019.23 FIntercept7.391450.591129.0A75115 嘰 35 Fxl0.26440,393615.46o.oooex20.09920.55675.800.0258Xi,X2不被移除.第三步,第二步選擇模型 Y =久+P1X1+P2X2 + &, A = Xi,X2, l =3,3進:對不在模型中的自變量 X3 ,逐個添加到此模型中,擬合相應模型Y =也+BkXk +BiXi十久X2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年學生保險全保障協(xié)議
- 2025標識標牌行業(yè)發(fā)展趨勢分析與預測合同3篇
- 二零二五版辦公區(qū)域租賃合同(含物業(yè)增值服務)
- 二手住宅交易服務合同(2024年版)3篇
- 二零二五年度上市公司專項財務咨詢與輔導協(xié)議
- 二零二五年度股權分割協(xié)議書模板
- 2025年度礦業(yè)權出讓與地質安全監(jiān)管合同
- 2025年度車輛借出免責及車輛使用責任界定協(xié)議
- 二零二五年度文化藝術活動派遣協(xié)議范本
- 2025年度城市綜合體物業(yè)保安勞務管理合同
- 小兒甲型流感護理查房
- 霧化吸入療法合理用藥專家共識(2024版)解讀
- 2021年全國高考物理真題試卷及解析(全國已卷)
- 拆遷評估機構選定方案
- 趣味知識問答100道
- 鋼管豎向承載力表
- 2024年新北師大版八年級上冊物理全冊教學課件(新版教材)
- 人教版數學四年級下冊核心素養(yǎng)目標全冊教學設計
- JJG 692-2010無創(chuàng)自動測量血壓計
- 三年級下冊口算天天100題(A4打印版)
- CSSD職業(yè)暴露與防護
評論
0/150
提交評論