




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、實(shí)驗(yàn)五 相關(guān)和回歸分析 相關(guān)分析是指對變量之間的相關(guān)關(guān)系進(jìn)行描述與度量的一種分析方法,簡單相關(guān)分析通常指對兩變量間相關(guān)關(guān)系的研究,其目的是確定兩個(gè)變量之間是否存在相關(guān)關(guān)系,并對其相關(guān)關(guān)系的強(qiáng)度進(jìn)行度量,常用方法是考察兩個(gè)變量的散點(diǎn)圖和計(jì)算變量間的相關(guān)系數(shù)。多元線性回歸分析研究多個(gè)變量的數(shù)量伴隨關(guān)系,內(nèi)容主要包括模型的假定與檢驗(yàn)、參數(shù)的估計(jì)與檢驗(yàn)、回歸診斷與預(yù)測。 很多非線性回歸問題都可以轉(zhuǎn)化為線性回歸問題處理,如多項(xiàng)式回歸、指數(shù)回歸、對數(shù)回歸、冪函數(shù)回歸等。5.1 實(shí)驗(yàn)?zāi)康?掌握使用SAS進(jìn)行簡單相關(guān)分析和多元線性回歸分析及非線性回歸分析的方法。5.2 實(shí)驗(yàn)內(nèi)容 一、用INSIGHT模塊作簡單
2、相關(guān)分析與一元線性回歸分析二、用“分析家”作多元線性回歸分析 三、使用REG過程作回歸分析 四、一元非線性回歸分析5.3 實(shí)驗(yàn)指導(dǎo)一、用INSIGHT模塊作簡單相關(guān)分析與一元線性回歸分析【實(shí)驗(yàn)5-1】比薩斜塔是一建筑奇跡,工程師關(guān)于塔的穩(wěn)定性作了大量研究工作,塔的斜度的測量值隨時(shí)間變化的關(guān)系提供了很多有用的信息,表5-1給出了1975年至1987年的測量值(sy5_1.xls)。表中變量“斜度”表示塔上某一點(diǎn)的實(shí)際位置與假如塔為垂直時(shí)它所處位置之偏差再減去2900mm。表5-1 比薩斜塔的斜度年份x75767778798081828384858687斜度y(1/10mm)64264465666
3、7673688696698713717725742757 試分析y(斜度)關(guān)于年份x的相關(guān)關(guān)系,寫出y關(guān)于x的線性回歸方程,并利用所建回歸方程預(yù)測1988年時(shí)比薩斜塔的斜度值。1. 數(shù)據(jù)的導(dǎo)入 首先將上表在Excel中處理后導(dǎo)入成SAS數(shù)據(jù)集Mylib.sy5_1,如圖5-1所示,其中x1 / 30表示年份y表示斜度。圖5-1 數(shù)據(jù)集Mylib.sy5_12. 制作散點(diǎn)圖 制作斜度y與年份x的散點(diǎn)圖,以便判斷變量之間的相關(guān)性。步驟如下: (1) 在INSIGHT中打開數(shù)據(jù)集Mylib.sy5_1。 (2) 選擇菜單“Analyze(分析)”“Scatter Plot (Y X)(散點(diǎn)圖)”。
4、(3) 在打開的“Scatter Plot (Y X)”對話框中選定Y變量:Y;選定X變量:x,如圖5-2左所示。 (4) 單擊“OK”按鈕,得到斜度y與年份x的散點(diǎn)圖,如圖5-2右所示。 從散點(diǎn)圖中可以看出,斜度y與年份x之間具有一定的線性關(guān)系。 圖5-2 斜度y與年份x的散點(diǎn)圖3. 相關(guān)系數(shù)計(jì)算 在INSIGHT中打開數(shù)據(jù)集Mylib.sy5_1。 (1) 選擇菜單“Analyze(分析)”“Multivariate (Y X)(多變量)”。 (2) 在打開的“Multivariate (Y X)”對話框中選定Y變量:y;選定X變量:x,如圖5-3左所示。. 圖5-3 計(jì)算相關(guān)系數(shù) (3)
5、 單擊“OK”按鈕,得到結(jié)果如圖5-3右所示。 結(jié)果顯示斜度y與年份x的樣本相關(guān)系數(shù)很大,為0.994。 (4) 為了檢驗(yàn)總體變量y與x的相關(guān)系數(shù)是否為零,選擇菜單:“Tables”“CORR p-values”,得到相關(guān)系數(shù)為零的原假設(shè)的p值,如圖5-4所示。圖5-4 相關(guān)系數(shù)的檢驗(yàn) 由于p值很小,應(yīng)拒絕原假設(shè),可以認(rèn)為斜度y與年份x之間均存在著顯著的正相關(guān)關(guān)系。4. 一元線性回歸 在INSIGHT中打開數(shù)據(jù)集Mylib.sy5_1。 (1) 選擇菜單“Analyze”“Fit(Y X)(擬合)”,打開“Fit(Y X)”對話框。 (2) 在“Fit(Y X)”對話框中,選擇變量Y,單擊“Y
6、”按鈕,將Y設(shè)為響應(yīng)變量;選擇變量x,單擊“X”按鈕,將x設(shè)為自變量,如圖5-5左所示。 (3) 單擊Output按鈕,在“Fit(Y X)”輸出選項(xiàng)表中增加選中Residual Normal復(fù)選項(xiàng),要求輸出殘差的正態(tài)QQ圖,如圖5-5右所示。 圖5-5 “Fit(Y X)”輸出選項(xiàng)設(shè)置 (4) 兩次單擊“OK”按鈕,得到分析結(jié)果。 顯示的結(jié)果分為若干張表,其中第二張表給出回歸方程: 方程表明回歸直線截距的估計(jì)值為-61.1209,斜率的估計(jì)值為9.3187,如圖5-6左下?;貧w系數(shù)9.3187表示比薩斜塔的“斜度”年平均增加9.3187。 圖5-6 回歸方程與散點(diǎn)圖 第三張表是帶有回歸直線的
7、散點(diǎn)圖,給出了回歸的圖形表示,如圖5-6右。 圖的下面是參數(shù)回歸擬合表(圖5-7)。圖5-7 參數(shù)回歸擬合表其中判定系數(shù)R-Square(R2)= 0.9880,指出x能夠解釋Y的98.8%的信息。還有1 98.8% = 1.2%的信息不能被解釋,這些信息由其他變量和隨機(jī)因素所解釋。圖5-8 擬合匯總表 第四張擬合匯總表(圖5-8)中Mean of Response(響應(yīng)變量的均值)693.6923是變量Y的樣本平均值,Root MSE(均方殘差平方根)4.181是對各觀測點(diǎn)在直線周圍分散程度的一個(gè)度量值,為隨機(jī)誤差的標(biāo)準(zhǔn)差(也是實(shí)測值Y的標(biāo)準(zhǔn)差)s 的無偏估計(jì)。Adj R-Sq是修正的判定系
8、數(shù)。 第五張方差分析表(圖5-9)包含對回歸方程的顯著檢驗(yàn),其中F統(tǒng)計(jì)量的值:圖5-9 方差分析表 F檢驗(yàn)的p值 < 0.0001,表示模型顯著有效。即認(rèn)為Y與自變量x之間的線性回歸關(guān)系顯著。 第六張型檢驗(yàn)表提供了與方差分析表一樣的檢驗(yàn),如圖5-10所示。圖5-10 型檢驗(yàn)表 第七張參數(shù)估計(jì)表給出了回歸直線截距和斜率的估計(jì)值及其顯著性檢驗(yàn)等內(nèi)容。這里截距的t檢驗(yàn)的p值=0.0333 <a = 0.05,表明截距項(xiàng)是顯著非零的,斜率的t檢驗(yàn)p值 < 0.0001,表明斜率顯著非零,即自變量x對因變量Y有顯著的線性關(guān)系,如圖5-11所示。圖5-11 參數(shù)估計(jì)表圖5-12 殘差和預(yù)
9、測值的散點(diǎn)圖及殘差的QQ圖5. 回歸診斷 在顯示窗的底部有一個(gè)殘差R_Y和預(yù)測值P_Y的散點(diǎn)圖(圖5-12左)。從圖中看出,數(shù)據(jù)點(diǎn)隨機(jī)地散布在零線附近,表明模型中殘差等方差、獨(dú)立性的假設(shè)沒有問題。 從殘差的QQ圖(圖7-12右)可以初步判定殘差來自正態(tài)分布總體。為了進(jìn)一步檢驗(yàn)殘差為正態(tài)分布的假定,回到數(shù)據(jù)窗口??梢钥吹綒埐頡_Y和預(yù)測值P_Y已加到數(shù)據(jù)集之中,可以用Distribution(Y)來驗(yàn)正殘差的正態(tài)性。 (1) 選擇菜單“Analyze(分析)”“Distribution (Y)(分布)”,打開“Distribution (Y)”對話框。在數(shù)據(jù)集Mylib.sy5_1的變量列表中,
10、選擇R_Y,然后單擊“Y”按鈕,R_Y被選為分析變量。 (2) 單擊“Output”按鈕,打開“Distribution (Y)(分布)”對話框。 (3) 僅選中“Tests for Normality”復(fù)選框,如圖5-13所示。 圖5-13 僅選中“Tests for Normality”復(fù)選框 圖5-14 殘差分布的正態(tài)性檢驗(yàn)表 (4) 兩次單擊“OK”按鈕得到結(jié)果。 在“Tests for Normality”(正態(tài)性檢驗(yàn))表(圖5-14)中看到,4種檢驗(yàn)方法的p值均大于0.05,不能拒絕原假設(shè),表明可以接受殘差正態(tài)性的假定。6. 利用回歸方程進(jìn)行預(yù)測圖5-15 回歸預(yù)測 當(dāng)回歸模型中各
11、參數(shù)都通過了顯著性檢驗(yàn),模型整體的擬合效果也不錯(cuò)時(shí),就可以用所建立的模型進(jìn)行預(yù)測了。即通過自變量x的取值來預(yù)測因變量y的取值,例如,年份x為88時(shí),計(jì)算斜度y的預(yù)測值(均值),可以進(jìn)行如下操作: (1) 回到數(shù)據(jù)窗口,點(diǎn)擊數(shù)據(jù)表的底部,在第一個(gè)空行的X列中填入88,并按Enter鍵(圖5-15)。 (2) Y的預(yù)測值被自動(dòng)計(jì)算出并顯示在P_Y列之中。如此可以得到任意多個(gè)預(yù)測值。從圖5-15可以看到,年份x為88時(shí),斜度y的預(yù)測值為758.9231。注意:僅當(dāng)擬合窗口打開時(shí)才可按上述方法計(jì)算預(yù)測值。二、用“分析家”作多元線性回歸分析【實(shí)驗(yàn)5-2】某研究人員需要分析我國固定資產(chǎn)投資狀況的影響因素,
12、選取5個(gè)可能的影響因素:國內(nèi)生產(chǎn)總值、商品房屋銷售額、財(cái)政支出、社會(huì)消費(fèi)品零售總額、進(jìn)出口總額,統(tǒng)計(jì)19872001共15年的各項(xiàng)指標(biāo)如表5-2所示(sy5_2.xls)所示。試在0.05的顯著性水平下進(jìn)行多元回歸分析,判斷哪些因素對固定資產(chǎn)投資有著顯著影響,給出回歸方程。表5-2 15年的統(tǒng)計(jì)數(shù)據(jù)年度固定投資總額國內(nèi)生產(chǎn)總值商品房屋銷售額財(cái)政支出社會(huì)消費(fèi)品零售總額進(jìn)出口總額19873791.711962.511009672262.1858203084.219884753.814928.314721642491.2174403821.819894410.416909.216375422823.
13、788101.44155.91990451718547.920182633083.598300.15560.119915594.521617.823785973386.629415.67225.819928080.126638.142659383742.210993.79119.6199313072.334634.486371414642.312462.111271199417042.146759.4101849505792.6216264.720381.9199520019.2658478.1125772696823.722062023499.9199622913.5567884.61427
14、12927937.5524774.124133.8199724941.1174462.6179947639233.5627298.926967.2199828406.1778345.22513302710798.1829152.526857.7199929854.7182067.462987873413187.6731134.729896.3200032917.7389442.23935442315886.534152.639274.2200137213.4995933.34862751718902.5837595.242193.31. 生成數(shù)據(jù)集 在“分析家”中直接打開上面的Excel數(shù)據(jù)表
15、(sy5_2.xls),選擇編輯狀態(tài),修改每個(gè)變量的屬性,將變量名分別改為:年度:n、固定投資總額:y、國內(nèi)生產(chǎn)總值:x1、商品房屋銷售額:x2、財(cái)政支出:x3、社會(huì)消費(fèi)品零售總額:x4、進(jìn)出口總額:x5。圖8-16 Linear Regression對話框 以數(shù)據(jù)集Mylib.sy5_2存盤。2. 全回歸分析 1) 選擇主菜單“Statistics(統(tǒng)計(jì))”“Regression(回歸)”“Linear(線性)”,打開“Linear Regression(線性回歸)”對話框。 2) 選擇變量列表中的變量y,單擊“Dependent”按鈕,選定響應(yīng)變量,選擇變量列表中的變量x1、x2、x3、x
16、4、x5,單擊“Explanatory”按鈕,選定解釋變量,如圖5-16所示。 3) 單擊“OK”按鈕,得到分析結(jié)果如圖5-17所示。圖5-17 多元回歸分析結(jié)果 分析結(jié)果包括方差分析表、擬合的匯總信息以及回歸系數(shù)估計(jì)值與顯著性檢驗(yàn)。方差分析表中顯示模型的作用是顯著的(F統(tǒng)計(jì)量的值為1567.35,p值<0.0001<0.05 = )。 參數(shù)顯著性檢驗(yàn)表明,進(jìn)入回歸的5個(gè)自變量,其作用在其它變量進(jìn)入回歸的前提下并不都是顯著的。例如x3、x4、x5的作用就不顯著。因此有必要適當(dāng)選擇變量建立一個(gè)“最優(yōu)”的回歸方程。3. 逐步回歸分析圖5-18 選擇逐步回歸法 1) 重復(fù)上面2中1),在
17、“Linear Regression(線性回歸)”對話框(圖5-16)中,單擊“Model”按鈕,打開“Linear Regression:Model”對話框。在“Method”選項(xiàng)卡中選擇“Stepwise selection(逐步選擇法)”,如圖5-18所示。 兩次單擊“OK”按鈕,得到分析結(jié)果。 2) 在顯示結(jié)果中,第1步記錄了只有x1進(jìn)入回歸方程的回歸分析結(jié)果,其中回歸方程和系數(shù)的檢驗(yàn)均為顯著,此時(shí)R2=0.9911,C(p)=58.5161;接著第2步是自變量x1和x2進(jìn)入回歸方程后的回歸分析結(jié)果,回歸方程及x1和x2的系數(shù)檢驗(yàn)均為顯著,但常數(shù)項(xiàng)檢驗(yàn)不顯著。接著第3步是自變量x1、x
18、2和x3進(jìn)入回歸方程后的回歸分析結(jié)果。其中回歸方程及所有系數(shù)檢驗(yàn)均為顯著,常數(shù)項(xiàng)檢驗(yàn)也顯著。且R2=0.9984提高了,C(p)=5.5226減少了。 圖5-19 逐步回歸第1、2步、3步及最后結(jié)果 在圖5-19右下中指出在0.05的檢驗(yàn)水平下,不能再有其它變量進(jìn)入模型。比較R2和C(p)的值(圖5-19右),應(yīng)取包含變量x1、x2和x3的第三個(gè)模型作為較優(yōu)的模型,對應(yīng)的回歸方程是:4. 回歸診斷圖5-20 Linear Regression:Plots對話框 進(jìn)行回歸診斷的步驟如下: 1) 重復(fù)上面2中1),在打開的“Linear Regression(線性回歸)”對話框中,單擊“Plots
19、”按鈕。在打開的“Linear Regression:Plots”對話框中,選擇“Residual”選項(xiàng)卡,按圖5-20所示選擇有關(guān)復(fù)選框。 2) 兩次單擊“OK”按鈕,得到回歸診斷結(jié)果,在“分析家”窗口的項(xiàng)目管理器中依次雙擊“Residual Plots”下的“Plot of STUDET vs PRED”和“Plot of RESIDUAL vs NQQ”得到標(biāo)準(zhǔn)化后的殘差圖(圖5-21左)和殘差的QQ圖(圖5-21右)。 圖5-21 殘差圖和殘差的QQ圖 從標(biāo)準(zhǔn)化后的殘差圖(圖5-21左)看出,數(shù)據(jù)點(diǎn)隨機(jī)地散布在零線附近,表明模型中誤差等方差、獨(dú)立性的假設(shè)沒有問題。殘差的QQ圖(圖5-2
20、1右)近似一條直線,可以初步判定殘差來自正態(tài)分布總體,所建回歸模型是有效的。 3) 對殘差作進(jìn)一步檢驗(yàn):圖5-22 Linear Regression:Save Data對話框 在上述操作打開的“Linear Regression(線性回歸)”對話框中,單擊“Save Data”按鈕。在打開的“Linear Regression:Save Data”對話框中,選中“Create and save diagnostics data”復(fù)選框,并將列表中的第二項(xiàng)“RESIDUAL Residuals”添加到左邊方框內(nèi),如圖5-22所示。 兩次單擊“OK”后得到分析結(jié)果。 4) 在“分析家”窗口的項(xiàng)目
21、管理器中雙擊“Diagnostics”下的“Diagnostics Table”可以看到在數(shù)據(jù)集中生成了殘差數(shù)據(jù),如圖5-23所示。圖5-23 生成殘差數(shù)據(jù) 將“Diagnostics Table”存盤(sy5_2_r)后在“分析家”中打開。 5) 選擇主菜單“Statistics(統(tǒng)計(jì))”“Descriptive(描述性統(tǒng)計(jì))”“Distributions(分布)”,打開“Distributions”對話框,選擇變量列表中的_RESID,單擊“Analysis”按鈕,選定分析變量,如圖5-24左所示。 圖5-24 設(shè)置選項(xiàng) 6) 單擊“Fit(擬合)”按鈕,在打開的對話框中選擇擬合的分布類型
22、:Normal,使用樣本估計(jì)量(Sample estimates),如圖5-24右所示。 7) 兩次單擊“OK”按鈕,并在分析家窗口的項(xiàng)目管理器中雙擊“Fitted Distributions of sy5_2_r”項(xiàng),得到對殘差_RESID的正態(tài)分布檢驗(yàn)結(jié)果,如圖5-25所示。圖5-25 殘差分布檢驗(yàn)結(jié)果 三種檢驗(yàn)均有p值>0.05,因此不能拒絕殘差來自正態(tài)總體的假定。5. 預(yù)測 通過回歸診斷得知模型:是合適的,可以用于預(yù)測。 1) 假定02,03年國內(nèi)生產(chǎn)總值(x1)、商品房屋銷售額(x2)、財(cái)政支出(x3)的數(shù)據(jù)已存入數(shù)據(jù)集Mylib.sy5_2_new中,如圖所示。圖5-26 數(shù)
23、據(jù)集Mylib.sy5_2_new2) 重復(fù)上面逐步回歸步驟,并在圖5-16所示的“Linear Regression(線性回歸)”對話框中,單擊“predictions”按鈕,打開“Linear Regression:predictions”對話框。按圖5-27所示進(jìn)行預(yù)測的Input(輸入)、Output(輸出)設(shè)置。圖5-27 “Linear Regression:predictions”對話框 3) 兩次單擊“OK”,得到結(jié)果。在分析家的項(xiàng)目管理器中點(diǎn)擊“predictions”可以看到預(yù)測結(jié)果,如圖5-28所示。圖5-28 預(yù)測結(jié)果三、使用REG過程作回歸分析【實(shí)驗(yàn)5-3】某種水泥在
24、凝固時(shí)放出的熱量y(cal/g)與水泥中四種化學(xué)成分x1,x2,x3,x4有關(guān),現(xiàn)測得13組數(shù)據(jù),如表5-3(sy5_3.xls)所示。試從中選出主要的變量,建立y關(guān)于它們的線性回歸方程。表5-3 熱量y與四種化學(xué)成分的實(shí)測數(shù)據(jù)x1x2x3x4y72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.31068812109.41. 建立數(shù)據(jù)集 輸入以下代碼建立數(shù)據(jù)集sy5_3并顯示:da
25、ta mylib.sy5_3; input x1x2x3x4y; cards;72666078.5129155274.31156820104.3113184787.675263395.91155922109.2371176102.7131224472.5254182293.12147426115.9140233483.81166912113.3 1068812109.4;Title '數(shù)據(jù)集sy5_3'Proc print ;run; 運(yùn)行結(jié)果如圖所示。圖5-29 數(shù)據(jù)集sy5_32. 向后逐步剔出法進(jìn)行回歸 執(zhí)行以下代碼:proc reg data = Mylib.sy5_3
26、; var y x1 - x4; model y = x1 - x4/selection=backward; plot residual. * predicted.;run; 輸出結(jié)果如下:圖5-30 向后逐步剔除的第0步(全回歸)圖5-31 向后逐步剔除的第1步圖5-32 向后逐步剔除法第2步圖5-33 向后逐步剔除法結(jié)果匯總 向后逐步剔除法的分析結(jié)果給出回歸模型:Y = 52.57735 + 1.46831x1 + 0.66225x2 殘差對預(yù)測值的散點(diǎn)圖顯示如下:圖5-34 殘差散點(diǎn)圖3. 結(jié)果分析 采用向后逐步剔除法回歸的第0步是做全回歸,結(jié)果如圖5-30所示,所有系數(shù)均未通過檢驗(yàn)(P
27、值均大于0.05),向后逐步剔除法第1步將變量x3剔除,結(jié)果如圖5-31所示,其中x2和x4的系數(shù)仍不能通過檢驗(yàn),接下來第2步將變量x4剔除,結(jié)果如圖5-32所示,此時(shí)的回歸方程及x1和x2的系數(shù)均能通過檢驗(yàn),殘差對預(yù)測值的散點(diǎn)圖(圖5-34)基本正常符合模型假定,所以方程Y = 52.57735 + 1.46831x1 + 0.66225x2為有效回歸方程。四、一元非線性回歸分析【實(shí)驗(yàn)5-4】已知數(shù)據(jù)如表5-4(sy5_4.xls)所示。試分別采用指數(shù)回歸、對數(shù)回歸、冪函數(shù)回歸和倒冪函數(shù)回歸4種非線性回歸方法進(jìn)行回歸分析,并選擇一個(gè)較好的回歸方程。表5-4 實(shí)驗(yàn)數(shù)據(jù)X1.11.21.31.4
28、1.51.61.71.81.922.12.22.32.4Y109.9540.4520.0924.5311.027.394.952.721.821.490.820.30.20.221. 生成數(shù)據(jù)集圖5-35 數(shù)據(jù)集sy5_4 運(yùn)行下面程序生成并顯示數(shù)據(jù)集sy5_4,如圖5-35所示。data sy5_4; input x y; cards;1.1 109.951.2 40.451.3 20.091.4 24.531.5 11.021.6 7.391.7 4.951.8 2.721.9 1.822 1.492.1 0.822.2 0.32.3 0.22.4 0.22;run;title '
29、數(shù)據(jù)集sy5_4'proc print;run;2. 對x和y作相關(guān)分析 執(zhí)行如下代碼:/*畫x和y的散點(diǎn)圖*/goptions ftext='宋體'proc gplot data = sy5_4; plot y*x; title 'x和y的散點(diǎn)圖' symbol v=dot i=none cv=orange ; run;/*求x和y的相關(guān)系數(shù)*/proc corr data = sy5_4;var x y;run; 運(yùn)行上面程序,得到散點(diǎn)圖(圖5-36左)以及x與y的相關(guān)系數(shù)(圖5-36右): 圖5-36 x與y的散點(diǎn)圖與相關(guān)系數(shù) 由圖可見x和y有一定
30、的非線性關(guān)系,根據(jù)散點(diǎn)分布的形狀考慮用下面幾種非線性回歸方法建立非線性回歸方程,并從中選出較為合適的回歸方程。3. 倒冪函數(shù)回歸圖5-37 u和v的散點(diǎn)圖 首先考慮倒冪函數(shù)擬合,執(zhí)行如下代碼:goptions ftext='宋體'data new1; set sy5_4; u = 1/x; v = y;run;/*畫u和v的散點(diǎn)圖*/ title 'u和v的散點(diǎn)圖'proc gplot data = new1; plot v*u; symbol v=dot i=none cv=red ; run; 運(yùn)行結(jié)果得到散點(diǎn)圖5-37,由圖可見,u和v有著較弱的線性關(guān)系。
31、做線性回歸:proc reg data = new1; var v u; model v = u; print cli; title '殘差圖' plot residual. * predicted.;run; 運(yùn)行結(jié)果如圖5-38和圖5-39所示。圖5-38 倒冪函數(shù)回歸結(jié)果 倒冪函數(shù)回歸結(jié)果(圖5-38):方差分析表中顯示模型的作用是顯著的(F統(tǒng)計(jì)量的值為24.95,p值<0.0003<0.05 = )。參數(shù)顯著性檢驗(yàn)表明,自變量的作用是顯著的?;貧w方程為:v = -78.56560+156.53887u即: 殘差對預(yù)測值的散點(diǎn)圖(圖5-39)表明,殘差有一定趨
32、勢,不符合模型的假定,以上回歸方程無效。圖5-39 殘差對預(yù)測值的散點(diǎn)圖4. 冪函數(shù)回歸 考慮冪函數(shù)擬合,執(zhí)行如下代碼:data new2; set sy5_4; u = log(x); v = log(y);run;圖5-40 u與v的散點(diǎn)圖/*畫u和v的散點(diǎn)圖*/ title 'u和v的散點(diǎn)圖'proc gplot data = new2; plot v*u; symbol v=dot i=none cv=red ; run; title '殘差圖'proc reg data = new2; var v u; model v = u; print cli;
33、plot residual. * predicted.;run; 得到散點(diǎn)圖如圖5-40所示: 冪函數(shù)回歸的結(jié)果見圖5-41左: 圖5-41 冪函數(shù)回歸結(jié)果與殘差對預(yù)測值的散點(diǎn)圖 得回歸方程:v = 5.51053 7.93588u即: 殘差對預(yù)測值的散點(diǎn)圖(如圖5-41右)表明,殘差有微弱趨勢,不符合模型的假定,上面回歸方程不佳。5. 指數(shù)函數(shù)回歸 考慮指數(shù)函數(shù)擬合,執(zhí)行如下代碼:data new3; set sy5_4; u = x; v=log(y);run;圖5-42 u與v的散點(diǎn)圖/*畫u和v的散點(diǎn)圖*/ title 'u和v的散點(diǎn)圖'proc gplot data
34、= new3; plot v*u; symbol v=dot i=none cv=red ; run; title '殘差圖'proc reg data = new3; var v u; model v = u; plot residual. * predicted.;run; 得到散點(diǎn)圖如圖5-42所示: 指數(shù)函數(shù)回歸結(jié)果見圖5-43左: 圖5-43 指數(shù)函數(shù)回歸結(jié)果與殘差對預(yù)測值的散點(diǎn)圖 得回歸方程:v = 9.58399 4.73895u即: 從殘差對預(yù)測值的散點(diǎn)圖(如圖5-43右)可以看出,殘差基本符合模型的假定,上面回歸方程有效。6. 對數(shù)回歸 考慮對數(shù)函數(shù)擬合,執(zhí)行
35、如下代碼:data new4; set sy5_4; u = log(x); v = y;run;圖5-44 u與v的散點(diǎn)圖/*畫u和v的散點(diǎn)圖*/ title 'u和v的散點(diǎn)圖'proc gplot data = new4; plot v*u; symbol v=dot i=none cv=red ; run; title '殘差圖'proc reg data = new4; var v u; model v = u; plot residual. * predicted.;run; 得到散點(diǎn)圖如圖5-44所示。 對數(shù)函數(shù)回歸結(jié)果見圖5-45左。 圖5-45 對數(shù)函數(shù)回歸結(jié)果得回歸方程:v = 64.58847 91.11730u即:y = 64.58847 91.11730lnx 從殘差對預(yù)測值的散點(diǎn)圖(如圖5-45右)可以看出,殘差有二次趨勢,不符合模型的假定,上面回歸方程無效。7. 結(jié)論 比較上述4個(gè)回歸方程,第三種指數(shù)函數(shù)回歸的Root MSE(均方殘差平方根)最小(0.25991)、R-Square(判定系數(shù)R2)最大(0.9844),效果最好。 執(zhí)行下述代碼,得到模型的擬合圖形如圖5-46所示。data new5; set new1; y1 = 14530.28*exp(-4.73895*x);run; t
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版高考?xì)v史大一輪復(fù)習(xí)專題十六選修部分第43講歷史上重大改革回眸課型2高考命題與題型方法研討教案含解析人民版
- 2025上海市建筑安全員知識題庫附答案
- 辦學(xué)機(jī)構(gòu)合作合同范例
- 冷柜代加工合同范本
- 南京工廠食堂外包合同范本
- 制式服裝合同范本
- 第四代核能供熱系統(tǒng)協(xié)議
- 業(yè)務(wù)外包合同范本
- 數(shù)字遺產(chǎn)法定繼承執(zhí)行協(xié)議
- SY-T5252-2002巖樣的自然伽馬能譜分析方法
- 《大白菜種植栽培技》課件
- 北京工業(yè)大學(xué)《數(shù)據(jù)挖掘》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年物聯(lián)網(wǎng)安裝調(diào)試員(中級工)職業(yè)資格鑒定考試題庫(含答案)
- 標(biāo)準(zhǔn)化機(jī)房改造方案
- 珠海市第三人民醫(yī)院中醫(yī)智能臨床輔助診療系統(tǒng)建設(shè)方案
- 早產(chǎn)臨床診斷與治療指南
- 工程簽證單完整版
- 《義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2022年版)》初中內(nèi)容解讀
- 2025屆高三化學(xué)一輪復(fù)習(xí) 原電池 化學(xué)電源(第一課時(shí))課件
- 全院護(hù)理查房(食管裂孔疝)
- 川教版信息技術(shù)六年級下冊全冊教案【新教材】
評論
0/150
提交評論