版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、實(shí)驗(yàn)五相關(guān)和回歸分析相關(guān)分析是指對變量之間的相關(guān)關(guān)系進(jìn)行描述與度量的一種分析方法,簡單相關(guān)分析通常指對兩變量間相關(guān)關(guān)系的研究, 其目的是確定兩個(gè)變量之間是否存在相關(guān)關(guān)系,并對其相關(guān)關(guān)系的強(qiáng)度進(jìn)行度量,常用方法是考察兩個(gè)變量的散點(diǎn)圖和計(jì)算變量間的相關(guān)系數(shù)。多元線性回歸分析研究多個(gè)變量的數(shù)量伴隨關(guān)系,內(nèi)容主要包括模型的假定與檢驗(yàn)、 參數(shù)的估計(jì)與檢驗(yàn)、回歸診斷與預(yù)測。很多非線性回歸問題都可以轉(zhuǎn)化為線性回歸問題處理,如多項(xiàng)式回歸、指數(shù)回歸、對數(shù)回歸、幕函數(shù)回歸等。5.1 實(shí)驗(yàn)?zāi)康恼莆帐褂肧AS進(jìn)行簡單相關(guān)分析和多元線性回歸分析及非線性回歸分析的方法。5.2 實(shí)驗(yàn)內(nèi)容一、用INSIGHT模塊作簡單相關(guān)分
2、析與一元線性回歸分析二、用“分析家”作多元線性回歸分析三、使用REG過程作回歸分析四、一元非線性回歸分析5.3 實(shí)驗(yàn)指導(dǎo)一、用INSIGHT模塊作簡單相關(guān)分析與一元線性回歸分析【實(shí)驗(yàn)5-1】比薩斜塔是一建筑奇跡,工程師關(guān)于塔的穩(wěn)定性作了大量研究工作,塔的斜度的測量值隨時(shí)間變化的關(guān)系提供了很多有用的信息,表5-1給出了 1975年至1987年的測量值(sy5_1.xls)。表中變量“斜度”表示塔上某一點(diǎn)的實(shí)際位置與假如塔為垂直時(shí)它所 處位置之偏差再減去 2900mm。表5-1比薩斜塔的斜度年份x75767778798081828384858687斜度 y(1/10mm)6426446566676
3、73688696698713717725742757試分析y(斜度)關(guān)于年份x的相關(guān)關(guān)系,寫出y關(guān)于x的線性回歸方程,并利用所建回 歸方程預(yù)測1988年時(shí)比薩斜塔的斜度值。1. 數(shù)據(jù)的導(dǎo)入首先將上表在 Excel中處理后導(dǎo)入成 SAS數(shù)據(jù)集Mylib.sy5_1 ,如圖5-1所示,其中x 表示年份y表示斜度。2. 制作散點(diǎn)圖制作斜度y與年份x的散點(diǎn)圖, 步驟如下:在INSIGHT中打開數(shù)據(jù)集(2) 選擇菜單"Analyze (分析) 點(diǎn)圖)”(3) 在打開的“ Scatter Plot (Y X)選定X變量:x,如圖5-2左所示。以便判斷變量之間的相關(guān)性。Mylib.sy5_1 。S
4、catter Plot (Y X)(散"對話框中選定 Y變量:Y; 單擊“ 0K”按鈕,得到斜度y與年份x的散點(diǎn)圖,如圖5-2右所示。 從散點(diǎn)圖中可以看出,斜度 y與年份x之間具有一定的線性關(guān)系。圖5-2 斜度y與年份x的散點(diǎn)圖3. 相關(guān)系數(shù)計(jì)算在INSIGHT中打開數(shù)據(jù)集Mylib.sy5_1。(1) 選擇菜單“ Analyze (分析)"宀“ Multivariate (Y X)(多變量)”(2) 在打開的“ Multivariate (Y X) ”對話框中選定 Y變量:y;選定X變量:x,如圖5-3 左所示。.i凰y :孑:N擰推國蚩星廿4S卑丿JS寸13x:1381
5、1-00*0 :玷9M :75J0BCC ;97»QDOV廠0.99W圖5-3計(jì)算相關(guān)系數(shù)Tables”' CORRlht- C-relftUtiriSiy0W1 |圖5-4相關(guān)系數(shù)的檢驗(yàn)(3) 單擊“ 0K ”按鈕,得到結(jié)果如圖 5-3右所示。 結(jié)果顯示斜度y與年份x的樣本相關(guān)系數(shù)很大,為0.994。為了檢驗(yàn)總體變量y與x的相關(guān)系數(shù)是否為零,選擇菜單:p-values”,得到相關(guān)系數(shù)為零的原假設(shè)的p值,如圖5-4所示。由于p值很小,應(yīng)拒絕原假設(shè),可以認(rèn)為斜度y與年份x之間均存在著顯著的正相關(guān)關(guān)系。4. 一元線性回歸在INSIGHT中打開數(shù)據(jù)集Mylib.sy5_1。(1)
6、選擇菜單“ AnalyzeFit(Y X)(擬合)”打開“ Fit(Y X) ”對話框。(2) 在“ Fit(Y X) ”對話框中,選擇變量Y,單擊“ Y”按鈕,將Y設(shè)為響應(yīng)變量;選擇變量x,單擊“ X”按鈕,將x設(shè)為自變量,如圖5-5左所示。(3)單擊Output按鈕,在“ Fit(Y X) ”輸出選項(xiàng)表中增加選中 要求輸出殘差的正態(tài) QQ圖,如圖5-5右所示。Residual Normal 復(fù)選項(xiàng),TfcUR?:3Fira»?iirT Tr-lii nte?jjT IhII Qras> i 1. / C. L f ildi1 !;£ F ax uic1. 9% I
7、二 L «訂沙 fy PETUrtET UUBBkrltF Dt&pwatiiu lotted 氏贈 latrlxiitiwstco 匚.it iarn*:.nj.i|pLLi *urLab.:EFJ “ Mix J by FTedi ctndIEEesL dm j H :ns.1 QQ ail grri貯 Errri-1 I-rt-il GE)口 拱IhUit亠匚丄訂忙.兀氏OPsra>ElTlc FrafileFi'arifiTii; -yr.M-tMcnpzu.:trie Cjot-te jCT jCdlJ-LGl1 ; I ' -(M | Wcc
8、l I IfrttlQtl fodtpjt j Reii"陽 |8ri latrlxSiaiiTyFSt1£宙 lbKla of Vir 5 ariLEi'Lifr-l 亦匚上Tpt I / 1CLK)liH lfl3TVT-G III / III1 Tai fl:l 1MT0 W HlOt) TWU圖5-5“ Fit(Y X) ”輸出選項(xiàng)設(shè)置(4)兩次單擊“ OK”按鈕,得到分析結(jié)果。顯示的結(jié)果分為若干張表,其中第二張表給出回歸方程:Y 61.1209 9.3187X方程表明回歸直線截距的估計(jì)值為-61.1209,斜率的估計(jì)值為 9.3187,如圖5-6左下?;貧w
9、系數(shù)9.3187表示比薩斜塔的“斜度”年平均增加 9.3187。XfrJal圖5-6 回歸方程與散點(diǎn)圖第三張表是帶有回歸直線的散點(diǎn)圖,給出了回歸的圖形表示,如圖5-6右。圖的下面是參數(shù)回歸擬合表(圖5-7)。PMEtrlr tgL'rM 沁n I1 LtiudciirrorCurveDi EJ-=e .Pol >TLCffi L 31J 5DI ”lean SqvareOFi 1-E-on Square R-Sq'xareI Stat肝 、H1 15BO4H8351: ;17.4805.汕恥膽蘇 13.腮IQL圖5-7參數(shù)回歸擬合表其中判定系數(shù) R-Square ( R2
10、) = 0.9880,指出x能夠解釋Y的98.8%的信息。還有1 -98.8% =1.2%的信息不能被解釋,這些信息由其他變量和隨機(jī)因素所解釋。第四張擬合匯總表(圖5-8 )中Mean of Response ti . 一知”廠Tmti c f Res-ponse 693 623 ;0. 9af A(響應(yīng)變量的均值) 693.6923是變量 Y 的樣本平均 “如 鮭程麗;啊 恤值,Root MSE (均方殘差平方根)4.181是對各觀測圖5-8擬合匯總表點(diǎn)在直線周圍分散程度的一個(gè)度量值,為隨機(jī)誤差£的標(biāo)準(zhǔn)差(也是實(shí)測值 Y的標(biāo)準(zhǔn)差)的無偏估計(jì)。Adj R-Sq是修正的判定系數(shù)。第五張
11、方差分析表(圖 5-9)包含對回歸方程的顯著檢驗(yàn),其中F統(tǒng)計(jì)量的值:904.12MSE17.4805MSM 15804.4835F檢驗(yàn)的p值 0.0001,表示模型 顯著有效。即認(rèn)為 Y與自變量x之間的 線性回歸關(guān)系顯著。第六張川型檢驗(yàn)表提供了與方差分 析表一樣的檢驗(yàn),如圖5-10所示。 An 3 lys.l t _ of. .arl.(-晝理空丄一 EL. _1 舸L 吐舸竺 n_L H 土上.'iodel'"'- T; 150Q4."+B3&-'TOBOL診廠-乙;頑i哄心1119Z2S57 :17. 49j>5C 血t&a
12、mp;I12 1599& T的2 :irTyrie 111 TesteD-Suj, of SumzJlc ±fi SiJlkLl tjF StatPi > FK115814. 48: j3.4,904.12右 0001圖5-9方差分析表圖5-10山型檢驗(yàn)表第七張參數(shù)估計(jì)表給出了回歸直線截距和斜率的估計(jì)值及其顯著性檢驗(yàn)等內(nèi)容。這里截距的t檢驗(yàn)的p值=0.0333 = 0.05,表明截距項(xiàng)是顯著非零的, 斜率的t檢驗(yàn)p值 0.0001 , 表明斜率顯著非零,即自變量 x對因變量Y有顯著的線性關(guān)系,如圖 5-11所示。rParanrttrHe tiraiespaildhlbD
13、FEstLnaleSil ErrortStEltFt >|t|T<idLnceVi±r "nflallIalerceul1-6L. l20i25. L298-2. <3 .0.03330| i1 .j0. 3W?L j,0?:<.00011.00001.C0W圖5-11參數(shù)估計(jì)表5.回歸診斷在顯示窗的底部有一個(gè)殘差R_Y和預(yù)測值P_Y的散點(diǎn)圖(圖5-12左)。從圖 中看出,數(shù)據(jù)點(diǎn)隨機(jī)地散布在零線附近, 表明模型中殘差等方差、 獨(dú)立性的假設(shè)沒 有問題。從殘差的QQ圖(圖7-12右)可以 初步判定殘差來自正態(tài)分布總體。為了進(jìn)一步檢驗(yàn)殘差為正態(tài)分布的
14、假定,回到數(shù)據(jù)窗口??梢钥吹綒埐?正殘差的正態(tài)性。圖5-12殘差和預(yù)測值的散點(diǎn)圖及殘差的QQ圖R_Y和預(yù)測值P_Y已加到數(shù)據(jù)集之中,可以用Distribution(Y)來驗(yàn)(1)選擇菜單"Analyze (分析)”"Distribution (Y)(分布)”,打開"Distribution (Y) ”對話框。在數(shù)據(jù)集 Mylib.sy5_1的變量列表中,選擇 R_Y,然后單擊“ Y ”按鈕,R_Y被選 為分析變量。單擊“ Output”按鈕,打開“ Distribution (Y)(分布)”對話框。 僅選中“ Tests for Normality ”復(fù)選框,如圖
15、 5-13所示。圖5-13 僅選中“ Tests for Normality ” 復(fù)選框*T竟昨Hi-iiiilltyTest StatlstU刊|j-iralucSWlmTilk0.0. B875KeHc fiorflv-血rn-ov0,1 kgg 1>B 1500Croier-von MisesCl屹硏缶>.2500AMeTSflrrDrliris以1 觸il? .>« 3W0圖5-14殘差分布的正態(tài)性檢驗(yàn)表(4)兩次單擊“ 0K”按鈕得到結(jié)果。在“ Tests for Normality ”(正態(tài)性檢驗(yàn))表(圖 5-14)中看到,4種檢驗(yàn)方法的p值均 大于0.
16、05,不能拒絕原假設(shè),表明可以接受殘差正態(tài)性的假定。6.利用回歸方程進(jìn)行預(yù)測當(dāng)回歸模型中各參數(shù)都通過了顯著性檢驗(yàn),模型整體的擬合效果也不錯(cuò)時(shí),就可以用所建立的模型進(jìn)行預(yù) 測了。即通過自變量 X的取值來預(yù)測因變量 y的取值,例如,年份X為88時(shí),計(jì)算斜度y的預(yù)測值(均值)可以進(jìn)行如下操作:(1)回到數(shù)據(jù)窗口,點(diǎn)擊數(shù)據(jù)表的底部,在第一個(gè)空行的X列中填入88,并按Enter鍵(圖5-15)。(2) Y的預(yù)測值被自動計(jì)算出并顯示在P_Y列之中。如此可以得到任意多個(gè)預(yù)測值。11 IfttJ ImJTI ntIB!14£ 1 TP ¥11,ITLIli !iT7._Jii-n . u.
17、jy ><?. Ofc? 閔W -I17§ 闘E H-m«f 1- 2曲Y &GL F匿生Kn- 2 3 f 5- S 6K4 6B4 即HE抵肌町盟Z-ElDUO 7fl3L UL1D応沖曲'IL71"-4 64S4 77T E4A4Z -T. 3Q. 5.7 D圖5-15 回歸預(yù)測從圖5-15可以看到,年份x為88時(shí),斜度y的預(yù)測值為758.9231。注意:僅當(dāng)擬合窗口打開時(shí)才可按上述方法計(jì)算預(yù)測值。二、用“分析家”作多元線性回歸分析【實(shí)驗(yàn)5-2】某研究人員需要分析我國固定資產(chǎn)投資狀況的影響因素,選取5個(gè)可能的影響因素:國內(nèi)生產(chǎn)總值
18、、商品房屋銷售額、財(cái)政支出、社會消費(fèi)品零售總額、 進(jìn)出口總額, 統(tǒng)計(jì)19872001共15年的各項(xiàng)指標(biāo)如表 5-2 所示(sy5_2.xls)所示。試在0.05的顯著性水 平下進(jìn)行多元回歸分析,判斷哪些因素對固定資產(chǎn)投資有著顯著影響,給出回歸方程。表5-215年的統(tǒng)計(jì)數(shù)據(jù)年度固定投資總額國內(nèi)生產(chǎn)總值商品房屋銷售額財(cái)政支出社會消費(fèi)品零售總額進(jìn)出口總額19873791.711962.511009672262.1858203084.219884753.814928.314721642491.2174403821.819894410.416909.216375422823.788101.44155.9
19、1990451718547.920182633083.598300.15560.119915594.521617.823785973386.629415.67225.819928080.126638.142659383742.210993.79119.6199313072.334634.486371414642.312462.111271199417042.146759.4101849505792.6216264.720381.9199520019.2658478.1125772696823.722062023499.9199622913.5567884.6142712927937.55247
20、74.124133.8199724941.1174462.6179947639233.5627298.926967.2199828406.1778345.22513302710798.1829152.526857.7199929854.7182067.462987873413187.6731134.729896.3200032917.7389442.23935442315886.534152.639274.2200137213.4995933.34862751718902.5837595.242193.31. 生成數(shù)據(jù)集在“分析家”中直接打開上面的Excel數(shù)據(jù)表(sy5_2.xls),選擇編
21、輯狀態(tài),修改每個(gè)變量的屬性,將變量名分別改為:年度:n、固定投資總額:y、國內(nèi)生產(chǎn)總值:x1、商品房屋銷售額:x2、財(cái)政支出:x3、社會消費(fèi)品零售總額:x4、進(jìn)出口總額:x5。以數(shù)據(jù)集Mylib.sy5_2存盤。2. 全回歸分析1)選擇主菜單“ Statistics (統(tǒng)計(jì))” f “ Regressio n (回歸)”f“ Lin ear (線性)”,打開"Lin ear Regression (線性回歸)”對話框。2)選擇變量列表中的變量y ,單擊 “ Depe nde nt ”按鈕,選定響應(yīng)變量,選擇變量列表中的變量 x1、x2、x3、x4、x5,單擊 “ Explanator
22、y ” 按鈕,選定解釋變量,如圖5-16所示。L3J1E4UTEXDn i; 5衫_2ysi:-fiMe ipdtliPrtEiiclJffxPiQlgJ 園mB foilTit ME圖 8-16 Linear Regressio n 對話框«1爭 tgffi4311. 1'<忑豐曲口 rfr:di卩.盜fc 4111251社H一0-冊創(chuàng) o. omnsi -0- 9腔u -O.?i£iD3 -0-O9&J6ra.r*iiEterIrrerr90E-TT137 n 1 HR" Ql MB1E11ZI). T7Q3A -:亠 .- HT <
23、;f&Lo£a. ob “ 九:aw-J 2T-E32-0-&1or 01 as0.CL1C0.4昶.3 I.13)單擊“ OK ”按鈕,得到分析結(jié)果如圖5-17所示。SoiUfCEBP5ul誡SqutrnsBeui SquareFlodAl注爲(wèi)E 別舵1E£7.%fir*r22ll4nE45T114I pETrder.t E=an r Hsf:* 6.171ESI2.剛SfiR-3qmrtE卵撫4Idj g-Sqfl. 99£2ihr RIG rrKEKVjre .:3eli rOEILlDtplfidtt1!. !J oj 1 dL>l
24、e : J/ d _' tftft 015Af.HLysL:!圖5-18選擇逐步回歸法回歸方程及x1和x2的系數(shù)檢驗(yàn)均為圖5-17多元回歸分析結(jié)果分析結(jié)果包括方差分析表、擬合的匯總信息以及回歸系數(shù)估計(jì)值與顯著性檢驗(yàn)。方差分析表中顯示模型的作用是顯著的( F統(tǒng)計(jì)量的值為1567.35, p值<0.0001<0.05 = a)。參數(shù)顯著性檢驗(yàn)表明,進(jìn)入回歸的5個(gè)自變量,其作用在其它變量進(jìn)入回歸的前提下并不都是顯著的。例如 x3、x4、x5的作用就不顯著。因此有必要適當(dāng)選擇變量建立一個(gè)“最 優(yōu)”的回歸方程。3. 逐步回歸分析1)重復(fù)上面 2 中 1),在“ Lin ear Reg
25、ression (線 性回歸)”對話框(圖 5-16)中,單擊“ Model ”按 鈕,打開“ Linear Regression: Model ” 對話框。在“ Method ”選項(xiàng)卡中選擇“ Stepwise selection (逐步 選擇法)”,如圖5-18所示。兩次單擊“ OK ”按鈕,得到分析結(jié)果。2)在顯示結(jié)果中,第1步記錄了只有x1進(jìn)入回 歸方程的回歸分析結(jié)果,其中回歸方程和系數(shù)的檢驗(yàn) 均為顯著,此時(shí)R2=0.9911, C(p)=58.5161 ;接著第2 步是自變量x1和x2進(jìn)入回歸方程后的回歸分析結(jié)果,顯著,但常數(shù)項(xiàng)檢驗(yàn)不顯著。接著第3步是自變量x1、x2和x3進(jìn)入回歸方
26、程后的回歸分析結(jié)果。其中回歸方程及所有系數(shù)檢驗(yàn)均為顯著,常數(shù)項(xiàng)檢驗(yàn)也顯著。且R2=0.9984提高了,C(p)=5.5226 減少了。由Q ffnivrH; R-San * 仏翔* Cgl 3】陸遮槪*hFBWkpI¥3 “園 TkliHFr > FTiifc-13IWZtTRZ?-盤跟皿<wOU|Srrsr狎aw»C-slie- led TueaJ4iiZTSSMtJPtrnB*'Frt>lLAr|i.Eh-jvig i s it UiuK h > F0申?duì)t»S.計(jì)H4M4< lainxl«. -31M13a飾UE
27、K+S& It - .'JWln2a M0?lt3iTTS1SWr TH u 4x3. .民虹由«4I-jrfitlM: iMDbr Ji* 旳,iBC7®'itpiLie Selmkffk.典第了VfcrLibh» iLnnd CCpi * U flAELMlyplsTorlftiwc-Eq侶FHF> A1BI3 0FTM5P齊WTT雅與itut a< QDL11-T AL421記交£詒TotiI14FirjimiiriJvirtue1?emrTvpb n 裁 TrviiLv rr > r-3S2S,rra,弭
28、laoesin電於 QkflQTfcilC- JIMJQ.'jauizIB1W7JS3LI ji&LZl LClElMrti : nndltlfltfiiTjlbiTTVu"Lhle- iZ Inejeii- R-squAj* = Q.seas ttij Etc1=za.-xa日F 'VaHvnctScutceCFLa «fS 口Sgujurtr ?iLn±F f : Fl«drlC«Tect e4 Tet iE.忖L<.1915957477:61H2.11Eillx-iteSi fclTHfI SS fTliir
29、Pr > Bci.ert-ept llK2K 3L«HCUT. Z5&L1 o. ami 0LljEZZ*l§LT»17942E. DfiMiiarii u. u<iQKi| (X SUHz-4n.d?r hUibM 7.二叭卻L3f】L wtkbLEA 3eil iTd Ike hwJe -u? i!|Jfl.h.jui 【IIje 臥Ofl從 Leve-L鼬 ociiHr rCkLe 和 ilie 山営同 i3urJfL«nce 沱氓】f«r ffliry lftT« rbt <飢irtrMltiftM*
30、刊T町機(jī)|>LtepitrttTedR-stwrflLfibrTuf In E-quhrett-Squrt匸誠r巧lhhr > F1HLOrML(I.LLSIL5LMBH :2*532.砒嚴(yán)EILUu.打d3即CLKfiEl 血 f<LtUa.«£>Li:圖5-19逐步回歸第1、2步、3步及最后結(jié)果在圖5-19右下中指出在0.05的檢驗(yàn)水平下,不能再有其它變量進(jìn)入模型。比較R2和C(p)的值(圖5-19右),應(yīng)取包含變量XI、X2和X3的第三個(gè)模型作為較優(yōu)的模型,對應(yīng)的回 歸方程是:y 3023.27814 0.36911x14.回歸診斷進(jìn)行回歸診斷
31、的步驟如下:1)重復(fù)上面2中1),在打開的“ Lin ear Regression (線性回歸)”對話框中,單擊“Plots” 按鈕。在打開的"Linear Regression :Plots”對話框中,選擇"Residual”選項(xiàng)卡, 按圖5-20所示選擇有關(guān)復(fù)選框。2)兩次單擊“ OK ”按鈕,得到回歸診 斷結(jié)果,在“分析家”窗口的項(xiàng)目管理器中 依次雙擊“ Residual Plots ” 下的“ Plot of STUDET vs PRED ” 和 “Plot of RESIDUAL vs NQQ ”得到標(biāo)準(zhǔn)化后的殘差圖(圖0.00078157x22.09048X35
32、-21左)和殘差的圖5-20 Linear Regression: Plots對話框QQ圖(圖5-21右)。從標(biāo)準(zhǔn)化后的殘差圖(圖5-21左)看出,數(shù)據(jù)點(diǎn)隨機(jī)地散布在零線附近,表明模型中誤差等方差、獨(dú)立性的假設(shè)沒有問題。殘差的QQ圖(圖5-21右)近似一條直線,可以初步判定殘差來自正態(tài)分布總體,所建回歸模型是有效的。3)對殘差作進(jìn)一步檢驗(yàn):在上述操作打開的"Lin ear Regressi on(線性回歸)”對話框中,單擊“ Save Data” 按鈕。在打開的" Lin ear Regressi on: Save Data”對話框中,選中"Create and
33、savediagnostics data”復(fù)選框,并將列表中的第 二項(xiàng)“ RESIDUAL Residuals ”添加到左邊方 框內(nèi),如圖5-22所示。兩次單擊“ 0K ”后得到分析結(jié)果。4)在“分析家”窗口的項(xiàng)目管理器中雙擊 “ Diagnostics ”下的 “ Diagnostics Table” 可以看到在數(shù)據(jù)集中生成了殘差數(shù)據(jù),如圖圖 5-22 Linear Regression : Save Data對話框5-23所示。圖5-23生成殘差數(shù)據(jù)將“ Diagnostics Table”存盤(sy5_2_r)后在“分析家”中打開。5)選擇主菜單“ Statistics (統(tǒng)計(jì))”“ D
34、escriptive (描述性統(tǒng)計(jì))”“ Distributions (分布)”,打開“ Distributions ”對話框,選擇變量列表中的_RESID,單擊“ Analysis ”按鈕,選定分析變量,如圖5-24左所示。圖5-24設(shè)置選項(xiàng)6) 單擊“ Fit (擬合)”按鈕,在打開的對話框中選擇擬合的分布類型:Normal,使用樣本估計(jì)量(Sample estimates),如圖5-24右所示。7) 兩次單擊“ OK”按鈕,并在分析家窗口的項(xiàng)目管理器中雙擊“Fitted Distributions ofsy5_2”項(xiàng),得到對殘差_RESID的正態(tài)分布檢驗(yàn)結(jié)果,如圖5-25所示。Tbr r
35、ig JVARTATF ProGcdureFitted Dlewlhutlc-n fw EE£1DPiraieter-j iar ElbnB) DistrlhiilliriFaraiwTi&r SyiM】 EdTlr)ai«I£e<m.n>_3Std Dev468.9158GocdTEEt Tets for H>ri-al Pi >IributicnTeelp TaluBrKcdih朋址眄SHm*00.1G317IM2Ft> D>0,1 COcriner-wn Nlsetv-sq0. O&&Z2H4Pr&
36、gt; r-SQXhSDQAnrierE<tT"DarltnEA-SqD. 3B4r399(31Ft> A-Sq>0.250圖5-25殘差分布檢驗(yàn)結(jié)果三種檢驗(yàn)均有p值0.05,因此不能拒絕殘差來自正態(tài)總體的假定。5. 預(yù)測通過回歸診斷得知模型:y 3023.278140.36911x10.00078157x22.09048x3是合適的,可以用于預(yù)測。1)假定02, 03年國內(nèi)生產(chǎn)總值(x1 )、商品房屋銷售額(x2)、財(cái)政支出(x3)的數(shù)據(jù) 已存入數(shù)據(jù)集Mylib.sy5_2_new中,如圖所示。fl-rl>31lacooc535ZT151T2CCi3150d
37、DDSTDOODi.tl圖5-26 數(shù)據(jù)集 Mylib.sy5_2_new2)重復(fù)上面逐步回歸步驟,并在圖 5-16所示的“ Lin ear Regression (線性回歸)”對話 框中,單擊“ predictio ns ”按鈕,打開“ Lin ear Regressio n: predictio ns ” 對話框。按圖 5-27 所示進(jìn)行預(yù)測的In put (輸入)、Output (輸出)設(shè)置。Pralioi Iqa I 帖吠一jjtlr口內(nèi)cOH vrj(inh| lafT'l*-HPhfedlri iddfitlaral dta<» Isle wi“Tie:_h
38、rutk碩匸趾廠fPprdi"i| 舊"fli+pu1*ElL 過 BK94lctlQneAdd rshfublls3Add Pf idictinrn I ni Ik圖5-27“Linear Regression: predictions” 對話框predict ions ”可以看至 U3) 兩次單擊“ OK”,得到結(jié)果。在分析家的項(xiàng)目管理器中點(diǎn)擊“ 預(yù)測結(jié)果,如圖5-28所示。-t .1 i'-i.-IliOt Tuesday, lay 11* 100ts國丸寧產(chǎn)總位a®-時(shí)政吏出1r120000十21 M221EOOOO5700000026StiOLo
39、verPpprFrdixtcdtrc-dictl-QEjpTCdi:li<?XlOte進(jìn)出口總剛rUiit 迓 y11 Jilty142G&3B0b41049.704477, 4224fi314faft442278. 3751MiLT2圖5-28預(yù)測結(jié)果三、使用REG過程作回歸分析【實(shí)驗(yàn)5-3】某種水泥在凝固時(shí)放出的熱量 y(cal/g)與水泥中四種化學(xué)成分 x1, x2, x3, x4有關(guān),現(xiàn)測得13組數(shù)據(jù),如表 5-3 (sy5_3.xls)所示。試從中選出主要的變量,建立y關(guān)于它們的線性回歸方程。表5-3熱量y與四種化學(xué)成分的實(shí)測數(shù)據(jù)x1x2x3x4y72666078.51
40、29155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.31068812109.41. 建立數(shù)據(jù)集輸入以下代碼建立數(shù)據(jù)集sy5_3并顯示:data mylib.sy5_3;input x1 x2 x3 x4 y;cards;72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182
41、293.12147426115.9140233483.81166912113.31068812109.4Title '數(shù)據(jù)集 sy5_3'Proc print ;run;運(yùn)行結(jié)果如圖所示。Qts-11?sea21155?a1bi:Il i.:4-1外曠億5752536552*iii.e13?!1?gine.?i1u1LBS2MIE13. V恂Z14/4i :. i111W23?48B12131?19rDiU101.J圖5-29 數(shù)據(jù)集sy5_32. 向后逐步剔出法進(jìn)行回歸執(zhí)行以下代碼:proc reg data = Mylib.sy5_3;var y x1 - x4;model
42、 y = x1 - x4/selection=backward;plot residual. * predicted.;run;輸出結(jié)果如下:Thr- RK FrediJT1-loctel: naoatit-jpcjjclrnt Tari.szle : yEliiinst i mn;1All TarinbLes Imered: JL Square and C(p - OQOOjUjalyshy船“曲uSourceUlM fi-fSnjiiaTQHSqu.ruF MLujeFr > ?Nodel電2&fiT. B9144閔吐8?4B&111.ISC. 0001Frrr8
43、171;7t 843645. 9B?35C'DITEC t cd Tol al12S71S. K3tflP.irafteierSt inck-rdTirliMeEsilnaTtErrsrTree II SS FOIU£ Pr ) FIntercom62. 4053770. D7O9t:k14552O'. 790. 3W111b 55110A 74477器心14- 34 CL 0TOg120. S3 CO 7Li. 7237Z'2i724Eolso cl mog*30.10151a 754710.109050; 02o.狛常-o.ice(X 7005Q 2469
44、75 04 o. 9441丄 euurJlir:二歸2圖5-30向后逐步剔除的第0步(全回歸)d r llLlxuallytLL 21 Ep 1?iri ihle kQ Rentowd:Square = Q 9S2Y and C(p) » 孔 01S2Ari-ilyj! h of 7 -iTi wpSaureeDFka cfKmdiSquireP 也lumPr > F32667. T4Q35卿.2&346lt&B3<i WttLError:譏屮:嚴(yán)5r 33IJ3UCaxxcted Ttai1.2T15. T49O9PaTolhetEFSiandardj
45、rEttotTyp* II 5S FValue Pr > FTem“Ttl emi14.1423S136. Bim25 6T & 0007X11F 1319+a lrroo3EO 5D7W ES.Ol < DOOl0.4LS11X 196613flJ弱甜IL 03 a Of 177如萌*0.1T3299. 93176i.es 0.2064Bound. £lumibdr! IS. 116. 6圖5-31向后逐步剔除的第1步H 曲扯業(yè)也丄irimatloa: Sten亠Bild mb 1 >=HeI oeeI: h Scfuar e &. 9767 at
46、uJ C(p) 2- 6702AnelT?!? frf Tar1 m<e9.a oflemDF旳UtTMSquareFPr > FF!. ilelZ263T- SE.E&?132B. 929SD22. 50<. DM1Errcir10BT. 9M4B9.TOMGCaireetefl Tc-lalU713. TfeSDEP.3T31-tl5TT*二陶l,T日VirUbleErrotType S£ f l&lueFt > IIntercept52. 57735乙 2SB173062- M41S52B. §1<aocoi11L <
47、;f-EM兀12130152X-a 6&235Q* OL56E1207b 782272W.58< waitn condl 11 百總應(yīng)虛匕甘丄;II. 22t)&圖5-32向后逐步剔除法第2步Iill variables left In the*re si golf lean l 和 tte (L1000zha.iary «>f E-o-tv-ard Ellnirati ?nStepVoTtiblrTirtbrrInPfl-TTiolASqu"旦ft-SqUiTEC(p)F 柏 lu1s0. oocoCl3. 0iIB2CL 02D. B9592
48、20B 00372, &劃1.860. 3DM圖5-33向后逐步剔除法結(jié)果匯總向后逐步剔除法的分析結(jié)果給出回歸模型:Y = 52.57735 + 1.46831x1 + 0.66225x2殘差對預(yù)測值的散點(diǎn)圖顯示如下:VOKK.CSiEG. KJ祐Iv : I2.I7TS'N13-9-十Heq U-97B?6+D.97U2卡PKTS-4JJI3!+U'-1-十1-Z1+-4i1 111TD?5£0嶼90351«価110IISPiredlicted 如 Ilf圖5-34殘差散點(diǎn)圖3. 結(jié)果分析采用向后逐步剔除法回歸的第0步是做全回歸,結(jié)果如圖5-30所
49、示,所有系數(shù)均未通過檢驗(yàn)(P值均大于0.05),向后逐步剔除法第1步將變量x3剔除,結(jié)果如圖5-31所示,其中x2和x4的系數(shù)仍不能通過檢驗(yàn),接下來第2步將變量x4剔除,結(jié)果如圖5-32所示,此時(shí)的回歸方程及 x1和x2的系數(shù)均能通過檢驗(yàn),殘差對預(yù)測值的散點(diǎn)圖(圖5-34)基本正常符合模型假定,所以方程Y = 52.57735 + 1.46831 X1 + 0.66225x2為有效回歸方程。四、一元非線性回歸分析【實(shí)驗(yàn)5-4】已知數(shù)據(jù)如表5-4(sy5_4.xls)所示。試分別采用指數(shù)回歸、對數(shù)回歸、幕 函數(shù)回歸和倒幕函數(shù)回歸4種非線性回歸方法進(jìn)行回歸分析,并選擇一個(gè)較好的回歸方程。表5-4
50、實(shí)驗(yàn)數(shù)據(jù)X1.11.21.31.41.51.61.71.81.922.12.22.32.4Y109.9540.4520.0924.5311.027.394.952.721.821.490.820.30.20.221. 生成數(shù)據(jù)集運(yùn)行下面程序生成并顯示數(shù)據(jù)集sy5_4,如圖5-35所示。data sy5_4;input x y;cards;lb;nir:1.1109.951.240.451.320.091.424.531.511.021.67.391.74.951.82.721.91.8221.492.10.822.20.32.30.22.40.22>run;title'數(shù)據(jù)集sy
51、5_4'proc print;run;fcfl-o I? 3 JI 1 1- I 1 1 1 *7L .U.L nvL. n.L HL40.4G :D,O 24.13 'L(2 倆 4.5!iLfl?LOJ.2 】日 U.2U 1J2圖5-35 數(shù)據(jù)集sy5_4%GSJC.GPlull2. 對x和y作相關(guān)分析執(zhí)行如下代碼:/*畫x和y的散點(diǎn)圖*/goptions ftext='宋體'proc gplot data = sy5_4;plot y*x;title 'x和y的散點(diǎn)圖' symbol v=dot i=none cv=orange ; run
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農(nóng)事服務(wù)協(xié)議書(2篇)
- 《將廣告加以完善》課件
- 2025年滬科版九年級化學(xué)下冊階段測試試卷
- 2025年滬科版七年級生物下冊階段測試試卷
- 2025年湘教版二年級語文上冊月考試卷
- 2024年華師大版九年級科學(xué)上冊階段測試試卷
- 2024年晉中眼科醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 2025年蘇教版八年級物理下冊階段測試試卷
- 《小學(xué)美術(shù)火柴人》課件
- 2024年昌吉州中醫(yī)醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點(diǎn)附帶答案
- 鐵路工程-軌道工程施工工藝及方案
- 福建省福州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)及行政區(qū)劃代碼
- 《高中語文文言斷句》一等獎優(yōu)秀課件
- 上海市中小學(xué)生學(xué)籍信息管理系統(tǒng)
- (完整版)自動感應(yīng)門施工方案
- [QC成果]提高剪力墻施工質(zhì)量一次合格率
- 8站小車呼叫的plc控制
- _ 基本粒子與宏觀物體內(nèi)在聯(lián)系
- 象棋比賽積分編排表
- 小學(xué)贛美版六年級美術(shù)上冊第二十課向往和平課件(16張)ppt課件
- DPP4抑制劑比較篇PPT課件
評論
0/150
提交評論