數(shù)學(xué)建模公選課第六講_第1頁
數(shù)學(xué)建模公選課第六講_第2頁
數(shù)學(xué)建模公選課第六講_第3頁
數(shù)學(xué)建模公選課第六講_第4頁
數(shù)學(xué)建模公選課第六講_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)建模公選課數(shù)學(xué)建模公選課基礎(chǔ)教研室第六講第六講:回歸分析模型回歸分析模型一、數(shù)學(xué)模型一、數(shù)學(xué)模型 如:如:測16名成年女子的身高與腿長所得數(shù)據(jù)如下:以身高x為橫坐標(biāo),以腿長y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)(xI,yi)在平面直角坐標(biāo)系上標(biāo)出.1401451501551601658486889092949698100102散點(diǎn)圖cyabx 一般地,稱由一般地,稱由 確定的模型為一元確定的模型為一元線性回歸模型。其中,未知參數(shù)線性回歸模型。其中,未知參數(shù)a、b稱為回歸系稱為回歸系數(shù),自變量稱為回歸變量。數(shù),自變量稱為回歸變量。 稱為稱為y對對x的回歸直線方程。的回歸直線方程。一元線性回歸分析的一元線性回

2、歸分析的主要任務(wù)主要任務(wù)是:是:1.用試驗值(樣本值)對用試驗值(樣本值)對a、b和方差作矩估計;和方差作矩估計;2.對回歸系數(shù)對回歸系數(shù)a、b作假設(shè)檢驗;作假設(shè)檢驗;3.對對y作預(yù)測和區(qū)間估計。作預(yù)測和區(qū)間估計。cyabxcyabx二、模型參數(shù)估計二、模型參數(shù)估計1、回歸系數(shù)的最小二乘估計、回歸系數(shù)的最小二乘估計有有n組獨(dú)立觀測值:組獨(dú)立觀測值:1122(,),(,),(,)nnx yxyxy記21( , )()niiQQ a byabx最小二乘法就是選擇最小二乘法就是選擇a、b的估計值,使得的估計值,使得Q最小。根據(jù)最小。根據(jù)極值存在第二必要條件,得知此時極值存在第二必要條件,得知此時Q對

3、對a和和b的二階偏導(dǎo)的二階偏導(dǎo)數(shù)同時為零。數(shù)同時為零。22()aybxnxyxybnxx 得:檢驗檢驗(1)相關(guān)系數(shù)的檢驗;)相關(guān)系數(shù)的檢驗; (2)判定系數(shù);)判定系數(shù); (3)線性回歸方程的顯著性檢驗;)線性回歸方程的顯著性檢驗;2、2的的無無偏偏估估計計三、檢驗、預(yù)測與控制三、檢驗、預(yù)測與控制1、回歸方程的顯著性檢驗、回歸方程的顯著性檢驗 (1)相關(guān)系數(shù)的顯著性檢驗()相關(guān)系數(shù)的顯著性檢驗(t檢驗法)檢驗法)2222()()nxyxyrnxxnyy 其中提出假設(shè):01:0;:0HH(2)判定系數(shù))判定系數(shù)222222()() () nxyxyrnxxnyy 用來衡量是否存在依存關(guān)系的指標(biāo)

4、,究竟有多大的隨機(jī)影響可能性。(3)線性回歸方程的顯著性檢驗)線性回歸方程的顯著性檢驗假設(shè):01:0,0HH選回歸系數(shù)b的檢驗統(tǒng)計量:(2)bbbtt nSbS是回歸系數(shù)b的標(biāo)準(zhǔn)差。222()2( )byaybxynSxn x選顯著性水平,結(jié)合自由度查表得t臨界值2t確定拒絕域2Wtt2、預(yù)測與控制、預(yù)測與控制(1)預(yù)測)預(yù)測例:一位心理學(xué)家獲得了例:一位心理學(xué)家獲得了10個工人的智商值和個工人的智商值和勞動生產(chǎn)率的數(shù)據(jù),其結(jié)果如下表所示。試擬勞動生產(chǎn)率的數(shù)據(jù),其結(jié)果如下表所示。試擬合一條曲線,建立一個數(shù)學(xué)模型,并根據(jù)模型合一條曲線,建立一個數(shù)學(xué)模型,并根據(jù)模型和某一個人的智商值和某一個人的智

5、商值120,預(yù)測其勞動生產(chǎn)率。,預(yù)測其勞動生產(chǎn)率。序號序號智商智商x生產(chǎn)率生產(chǎn)率yx2y2xy11105.21210027.04572.0021206.01440036.00720.0031306.31690039.69819.0041265.71587632.49718.251224.81488423.04585.661214.21464117.64508.271033.0106099.00309.008982.996048.41284.209802.764007.29216.0010973.2940910.24310.40合計合計110744.0124823210.845042.60r=0

6、.867224.9211rntr四、逐步回歸分析四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個變量開始,把變量逐個引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法: “最優(yōu)最優(yōu)”的回歸方程的回歸方程就是包含所有對Y有影響的變量, 而不包含對Y影響不顯著的變量回歸方程。 以第四種方法,即逐步回歸分析法逐步回歸分析法在篩選變量方面較為理想. 這個過程反復(fù)進(jìn)行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止。逐步回歸分析法逐步回歸分析法的思想: 從一個自

7、變量開始,視自變量Y作用的顯著程度,從大到地依次逐個引入回歸方程。 當(dāng)引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉。 引入一個自變量或從回歸方程中剔除一個自變量,為逐步回歸的一步。 對于每一步都要進(jìn)行Y值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。返回返回1、多元線性回歸、多元線性回歸2、多項式回歸、多項式回歸3、非線性回歸、非線性回歸4、逐步回歸、逐步回歸返回返回多元線性回歸多元線性回歸 b=regress( Y, X )npnnppxxxxxxxxxX.1.1.1212222111211nYYYY.21pb.101、確定回歸系數(shù)的點(diǎn)估計值:確定回歸

8、系數(shù)的點(diǎn)估計值:ppxxy.110對一元線性回歸,取 p=1 即可3、畫出殘差及其置信區(qū)間:畫出殘差及其置信區(qū)間: rcoplot(r,rint)2、求回歸系數(shù)的點(diǎn)估計和區(qū)間估計、并檢驗回歸模型:求回歸系數(shù)的點(diǎn)估計和區(qū)間估計、并檢驗回歸模型: b, bint,r,rint,stats=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計殘差用于檢驗回歸模型的統(tǒng)計量,有三個數(shù)值:相關(guān)系數(shù)r2、F值、與F對應(yīng)的概率p置信區(qū)間 顯著性水平(缺省時為0.05) 相關(guān)系數(shù) r2越接近 1,說明回歸方程越顯著; F F1-(k,n-k-1)時拒絕 H0,F(xiàn) 越大,說明回歸方程越顯著; 與 F 對應(yīng)的概率

9、 p時拒絕 H0,回歸模型成立.1、輸入數(shù)據(jù):輸入數(shù)據(jù): x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164; X=ones(16,1) x; Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;解:解:例例1 測16名成年女子的身高與腿長所得數(shù)據(jù)如下:身高143145146147149150153154155156157158159160162164腿長88858891929393959698979698991001022、回歸分析及檢驗:回歸分析及檢驗: b,

10、bint,r,rint,stats=regress(Y,X) b,bint,stats得結(jié)果:b = bint = -16.0730 -33.7071 1.5612 0.7194 0.6047 0.8340 stats = 0.9282 180.9531 0.0000即7194. 0,073.1610;0的置信區(qū)間為-33.7017,1.5612, 1的置信區(qū)間為0.6047,0.834;r2=0.9282, F=180.9531, p=0.0000p0.05, 可知回歸模型 y=-16.073+0.7194x 成立.To MATLAB(liti11)3、殘差分析,作殘差圖:、殘差分析,作殘差

11、圖: rcoplot(r,rint) 從殘差圖可以看出,除第二個數(shù)據(jù)外,其余數(shù)據(jù)的殘從殘差圖可以看出,除第二個數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型回歸模型 y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第能較好的符合原始數(shù)據(jù),而第二個二個數(shù)據(jù)可視為異常點(diǎn)數(shù)據(jù)可視為異常點(diǎn). 4、預(yù)測及作圖:、預(yù)測及作圖:z=b(1)+b(2)*x plot(x,Y,k+,x,z,r)246810121416-5-4-3-2-101234Residual Case Order PlotResidualsCase

12、 NumberTo MATLAB(liti12)多多 項項 式式 回回 歸歸 (一)一元多項式回歸(一)一元多項式回歸 (1)確定多項式系數(shù)的命令:p,S=polyfit(x,y,m) 其中 x=(x1,x2,xn) ,y=(y1,y2,yn) ;p=(a1,a2,am+1)是多項式 y=a1xm+a2xm-1+amx+am+1的系數(shù);S 是一個矩陣,用來估計預(yù)測誤差.(2)一元多項式回歸命令:polytool(x,y,m)1、回歸:、回歸:y=a1xm+a2xm-1+amx+am+12、預(yù)測和預(yù)測誤差估計:、預(yù)測和預(yù)測誤差估計:(1)Y=polyval(p,x)求polyfit所得的回歸多項

13、式在x處 的預(yù) 測值Y; (2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得 的回歸多項式在x處的預(yù)測值Y及預(yù)測值的顯著性為1- alpha的置信區(qū)間Y DELTA;alpha缺省時為0.5. 例例 2 觀測物體降落的距離s 與時間t 的關(guān)系,得到數(shù)據(jù)如下表,求s關(guān)于 t 的回歸方程2ctbtas.t (s)1/302/303/304/305/306/307/30s (cm)11.8615.6720.6026.6933.7141.9351.13t (s)8/309/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.44

14、99.08113.77129.54146.48法一法一 直接作二次多項式回歸:直接作二次多項式回歸: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p,S=polyfit(t,s,2)To MATLAB(liti21)1329. 98896.652946.4892tts得回歸模型為 :法二法二化為多元線性回歸:化為多元線性回歸:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71

15、 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,statsTo MATLAB(liti22)22946.4898896.651329. 9tts得回歸模型為 :Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r)預(yù)測及作圖預(yù)測及作圖To MATLAB(liti23)(二)多元二項式回歸(二)多元二項式回歸命令:rstool(x,y,model, alpha)nm矩陣顯著性水平(缺省時為0.05)n

16、維列向量 例例3 設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價格的統(tǒng)計數(shù) 據(jù)如下,建立回歸模型,預(yù)測平均收入為1000、價格為6時 的商品需求量.需求量10075807050659010011060收入10006001200500300400130011001300300價格5766875439選擇純二次模型,即 2222211122110 xxxxy法一法一 直接用多元二項式回歸:x1=1000 600 1200 500 300 400 1300 1100 1300 300;x2=5 7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=

17、x1 x2; rstool(x,y,purequadratic) 在畫面左下方的下拉式菜單中選在畫面左下方的下拉式菜單中選”all”, 則則beta、rmse和和residuals都傳送到都傳送到Matlab工作區(qū)中工作區(qū)中.在左邊圖形下方的方框中輸入在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入,右邊圖形下方的方框中輸入6。 則畫面左邊的則畫面左邊的“Predicted Y”下方的數(shù)據(jù)變?yōu)橄路降臄?shù)據(jù)變?yōu)?8.47981,即預(yù)測,即預(yù)測出平均收入為出平均收入為1000、價格為、價格為6時的商品需求量為時的商品需求量為88.4791.在Matlab工作區(qū)中輸入命令: beta, r

18、mse得結(jié)果:beta = 110.5313 0.1464 -26.5709 -0.0001 1.8475 rmse = 4.5362故回歸模型為:2221218475. 10001. 05709.261464. 05313.110 xxxxy剩余標(biāo)準(zhǔn)差為 4.5362, 說明此回歸模型的顯著性較好.To MATLAB(liti31)X=ones(10,1) x1 x2 (x1.2) (x2.2);b,bint,r,rint,stats=regress(y,X);b,stats結(jié)果為: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stats = 0.

19、9702 40.6656 0.0005法二法二To MATLAB(liti32)返回返回 2222211122110 xxxxy將 化為多元線性回歸:非線性回非線性回 歸歸 (1)確定回歸系數(shù)的命令: beta,r,J=nlinfit(x,y,model, beta0)(2)非線性回歸命令:nlintool(x,y,model, beta0,alpha)1、回歸:、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為 矩陣和n維列向量,對一元非線性回歸,x為n維列向量。mn2、預(yù)測和預(yù)測誤差估計:、預(yù)測和預(yù)測誤差估計:Y,DELTA=

20、nlpredci(model, x,beta,r,J)求nlinfit 或nlintool所得的回歸函數(shù)在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間Y DELTA.例例 4 對第一節(jié)例2,求解如下:1、對將要擬合的非線性模型 y=axbe/,建立 m-文件 volum.m 如下: function yhat=volum(beta,x) yhat=beta(1)*exp(beta(2)./x);2、輸入數(shù)據(jù): x=2:16; y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76

21、; beta0=8 2;3、求回歸系數(shù): beta,r ,J=nlinfit(x,y,volum,beta0); beta得結(jié)果:beta = 11.6036 -1.0641即得回歸模型為:xey10641. 16036.11To MATLAB(liti41)4、預(yù)測及作圖: YY,delta=nlpredci(volum,x,beta,r ,J); plot(x,y,k+,x,YY,r)To MATLAB(liti42)例例5 財政收入預(yù)測問題:財政收入與國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝凇⒕蜆I(yè)人口、固定資產(chǎn)投資等因素有關(guān)。下表列出了1952-1981年的原始數(shù)據(jù),試構(gòu)造預(yù)測模型。 解

22、解 設(shè)國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財政收入為y,設(shè)變量之間的關(guān)系為:y= ax1+bx2+cx3+dx4+ex5+fx6使用非線性回歸方法求解。1 對回歸模型建立對回歸模型建立M文件文件model.m如下如下: function yy=model(beta0,X) a=beta0(1); b=beta0(2); c=beta0(3); d=beta0(4); e=beta0(5); f=beta0(6); x1=X(:,1); x2=X(:,2); x3=X(:,3); x4=X(:,4); x5=X(:,5); x

23、6=X(:,6); yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6; 2. 主程序主程序liti6.m如下如下:X=598.00 349.00 461.00 57482.00 20729.00 44.00 . 2927.00 6862.00 1273.00 100072.0 43280.00 496.00;y=184.00 216.00 248.00 254.00 268.00 286.00 357.00 444.00 506.00 . 271.00 230.00 266.00 323.00 393.00 466.00 352.00 303.00 447.00 . 564.0

24、0 638.00 658.00 691.00 655.00 692.00 657.00 723.00 922.00 . 890.00 826.00 810.0;beta0=0.50 -0.03 -0.60 0.01 -0.02 0.35;betafit = nlinfit(X,y,model,beta0)To MATLAB(liti6) betafit = 0.5243 -0.0294 -0.6304 0.0112 -0.0230 0.3658即y= 0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230 x5+0.3658x6結(jié)果為結(jié)果為:逐逐 步步 回回 歸歸

25、逐步回歸的命令是: stepwise(x,y,inmodel,alpha) 運(yùn)行stepwise命令時產(chǎn)生三個圖形窗口:Stepwise Plot,Stepwise Table,Stepwise History. 在Stepwise Plot窗口,顯示出各項的回歸系數(shù)及其置信區(qū)間. Stepwise Table 窗口中列出了一個統(tǒng)計表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集(缺省時設(shè)定為全部自變量)顯著性水平(缺省時為0.5)自變量數(shù)據(jù), 階矩陣mn因變量數(shù)據(jù), 階矩陣1n例例6 水泥凝固時放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、 x4 有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個 線性模 型. 序號12345678910111213x17111117113122111110 x226295631525571315447406668x3615886917221842398x46052204733226442

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論