![matlab回歸分析解讀課件_第1頁](http://file4.renrendoc.com/view/d7fc92f5b1aa778acc88e04fcef17905/d7fc92f5b1aa778acc88e04fcef179051.gif)
![matlab回歸分析解讀課件_第2頁](http://file4.renrendoc.com/view/d7fc92f5b1aa778acc88e04fcef17905/d7fc92f5b1aa778acc88e04fcef179052.gif)
![matlab回歸分析解讀課件_第3頁](http://file4.renrendoc.com/view/d7fc92f5b1aa778acc88e04fcef17905/d7fc92f5b1aa778acc88e04fcef179053.gif)
![matlab回歸分析解讀課件_第4頁](http://file4.renrendoc.com/view/d7fc92f5b1aa778acc88e04fcef17905/d7fc92f5b1aa778acc88e04fcef179054.gif)
![matlab回歸分析解讀課件_第5頁](http://file4.renrendoc.com/view/d7fc92f5b1aa778acc88e04fcef17905/d7fc92f5b1aa778acc88e04fcef179055.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2023/1/41數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)回歸分析2022/12/261數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)回歸分析實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問題。1、直觀了解回歸分析基本內(nèi)容。1、回歸分析的基本理論。3、實(shí)驗(yàn)作業(yè)。2、用數(shù)學(xué)軟件求解回歸分析問題。實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問題。1、直觀2023/1/43一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*檢驗(yàn)、預(yù)測與控制可線性化的一元非線性回歸(曲線回歸)數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*多元線性回歸中的檢驗(yàn)與預(yù)測逐步回歸分析2022/12/263一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模2023/1/44一、數(shù)學(xué)模型例1測16名成年女子的身高與腿長所得數(shù)據(jù)如下:以身高x為橫坐標(biāo),以腿長y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)(xI,yi)在平面直角坐標(biāo)系上標(biāo)出.散點(diǎn)圖解答2022/12/264一、數(shù)學(xué)模型例1測16名成年女子的身2023/1/45一元線性回歸分析的主要任務(wù)是:返回2022/12/265一元線性回歸分析的主要任務(wù)是:返回2023/1/46二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)2022/12/266二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘2023/1/47返回2022/12/267返回2023/1/48三、檢驗(yàn)、預(yù)測與控制1、回歸方程的顯著性檢驗(yàn)2022/12/268三、檢驗(yàn)、預(yù)測與控制1、回歸方程的顯著2023/1/49(Ⅰ)F檢驗(yàn)法
(Ⅱ)t檢驗(yàn)法2022/12/269(Ⅰ)F檢驗(yàn)法(Ⅱ)t檢驗(yàn)法2023/1/410(Ⅲ)r檢驗(yàn)法2022/12/2610(Ⅲ)r檢驗(yàn)法2023/1/4112、回歸系數(shù)的置信區(qū)間2022/12/26112、回歸系數(shù)的置信區(qū)間2023/1/4123、預(yù)測與控制(1)預(yù)測2022/12/26123、預(yù)測與控制(1)預(yù)測2023/1/413(2)控制返回2022/12/2613(2)控制返回2023/1/414四、可線性化的一元非線性回歸(曲線回歸)例2出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕,容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān)系.對一鋼包作試驗(yàn),測得的數(shù)據(jù)列于下表:解答2022/12/2614四、可線性化的一元非線性回歸例2出2023/1/415散點(diǎn)圖此即非線性回歸或曲線回歸
問題(需要配曲線)配曲線的一般方法是:2022/12/2615散此即非線性回歸或曲線回歸2023/1/416通常選擇的六類曲線如下:返回2022/12/2616通常選擇的六類曲線如下:返回2023/1/417一、數(shù)學(xué)模型及定義返回2022/12/2617一、數(shù)學(xué)模型及定義返回2023/1/418二、模型參數(shù)估計(jì)解得估計(jì)值
2022/12/2618二、模型參數(shù)估計(jì)解得估計(jì)值2023/1/419返回2022/12/2619返回2023/1/420三、多元線性回歸中的檢驗(yàn)與預(yù)測
(Ⅰ)F檢驗(yàn)法(Ⅱ)r檢驗(yàn)法(殘差平方和)2022/12/2620三、多元線性回歸中的檢驗(yàn)與預(yù)測(Ⅰ2023/1/4212、預(yù)測(1)點(diǎn)預(yù)測(2)區(qū)間預(yù)測返回2022/12/26212、預(yù)測(1)點(diǎn)預(yù)測(2)區(qū)間預(yù)測返2023/1/422四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個(gè)變量開始,把變量逐個(gè)引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:
“最優(yōu)”的回歸方程就是包含所有對Y有影響的變量,而不包含對Y影響不顯著的變量回歸方程。以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.2022/12/2622四、逐步回歸分析(4)“有進(jìn)有出”的2023/1/423這個(gè)過程反復(fù)進(jìn)行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法的思想:從一個(gè)自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個(gè)引入回歸方程。當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。對于每一步都要進(jìn)行Y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。返回2022/12/2623這個(gè)過程反復(fù)進(jìn)行,直至既無不顯著2023/1/424統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線性回歸2、多項(xiàng)式回歸3、非線性回歸4、逐步回歸返回2022/12/2624統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線2023/1/425多元線性回歸
b=regress(Y,X)1、確定回歸系數(shù)的點(diǎn)估計(jì)值:2022/12/2625多元線性回歸1、確定回歸系數(shù)的點(diǎn)估計(jì)2023/1/4263、畫出殘差及其置信區(qū)間:rcoplot(r,rint)2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:
[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對應(yīng)的概率p置信區(qū)間顯著性水平(缺省時(shí)為0.05)2022/12/26262、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并2023/1/427例1解:1、輸入數(shù)據(jù):x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回歸分析及檢驗(yàn):[b,bint,r,rint,stats]=regress(Y,X)b,bint,stats題目2022/12/2627例1解:1、輸入數(shù)據(jù):2、回歸分析及2023/1/4283、殘差分析,作殘差圖:rcoplot(r,rint)從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個(gè)數(shù)據(jù)可視為異常點(diǎn).4、預(yù)測及作圖:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')返回2022/12/26283、殘差分析,作殘差圖:2023/1/429多項(xiàng)式回歸(一)一元多項(xiàng)式回歸
(1)確定多項(xiàng)式系數(shù)的命令:[p,S]=polyfit(x,y,m)(2)一元多項(xiàng)式回歸命令:polytool(x,y,m)1、回歸:y=a1xm+a2xm-1+…+amx+am+12、預(yù)測和預(yù)測誤差估計(jì):(1)Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間YDELTA;alpha缺省時(shí)為0.5.2022/12/2629多項(xiàng)式回歸(一)一元多項(xiàng)式2023/1/430法一直接作二次多項(xiàng)式回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];
[p,S]=polyfit(t,s,2)ToMATLAB(liti21)得回歸模型為:2022/12/2630法一直接作二次多項(xiàng)式回歸2023/1/431法二化為多元線性回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,stats得回歸模型為:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')預(yù)測及作圖2022/12/2631法二化為多元線性回歸:得回歸模型為2023/1/432(二)多元二項(xiàng)式回歸命令:rstool(x,y,’model’,alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量2022/12/2632(二)多元二項(xiàng)式回歸命令:rstoo2023/1/433例3設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù)據(jù)如下,建立回歸模型,預(yù)測平均收入為1000、價(jià)格為6時(shí)的商品需求量.法一直接用多元二項(xiàng)式回歸:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')2022/12/2633例3設(shè)某商品的需求量與消費(fèi)者的2023/1/434在畫面左下方的下拉式菜單中選”all”,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。則畫面左邊的“PredictedY”下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測出平均收入為1000、價(jià)格為6時(shí)的商品需求量為88.4791.2022/12/2634在畫面左下方的下拉式菜單中選2023/1/435在Matlab工作區(qū)中輸入命令:beta,rmse為剩余標(biāo)準(zhǔn)差,表示應(yīng)變量Y值對于回歸直線的離散程度。2022/12/2635在Matlab工作區(qū)中輸入命令:b2023/1/436結(jié)果為:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二返回將化為多元線性回歸:2022/12/2636結(jié)果為:b=法二返回將化為多2023/1/437非線性回歸(1)確定回歸系數(shù)的命令:
[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非線性回歸命令:nlintool(x,y,’model’,beta0,alpha)1、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為矩陣和n維列向量,對一元非線性回歸,x為n維列向量。2、預(yù)測和預(yù)測誤差估計(jì):[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或nlintool所得的回歸函數(shù)在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間YDELTA.2022/12/2637非線性回歸(1)確定回歸系數(shù)的命2023/1/438例4對第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.5910.6010.8010.6010.9010.76];beta0=[82]';3、求回歸系數(shù):[beta,r,J]=nlinfit(x',y','volum',beta0);beta得結(jié)果:beta=11.6036-1.0641即得回歸模型為:題目2022/12/2638例4對第一節(jié)例2,求解如下:22023/1/4394、預(yù)測及作圖:[YY,delta]=nlpredci('volum',x',beta,r,J);plot(x,y,'k+',x,YY,'r')2022/12/26394、預(yù)測及作圖:2023/1/440例5財(cái)政收入預(yù)測問題:財(cái)政收入與國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資等因素有關(guān)。下表列出了1952-1981年的原始數(shù)據(jù),試構(gòu)造預(yù)測模型。
解設(shè)國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財(cái)政收入為y,設(shè)變量之間的關(guān)系為:y=ax1+bx2+cx3+dx4+ex5+fx6使用非線性回歸方法求解。2022/12/2640例5財(cái)政收入預(yù)測問題:財(cái)政收2023/1/4411.
對回歸模型建立M文件model.m如下:functionyy=model(beta0,X)a=beta0(1);b=beta0(2);c=beta0(3);d=beta0(4);e=beta0(5);f=beta0(6);x1=X(:,1);x2=X(:,2);x3=X(:,3);x4=X(:,4);x5=X(:,5);x6=X(:,6);yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6;
2022/12/26412023/1/4422.
主程序liti6.m如下:X=[598.00349.00461.0057482.0020729.0044.00…………..2927.006862.001273.00100072.043280.00496.00];y=[184.00216.00248.00254.00268.00286.00357.00444.00506.00...271.00230.00266.00323.00393.00466.00352.00303.00447.00...564.00638.00658.00691.00655.00692.00657.00723.00922.00...890.00826.00810.0]';beta0=[0.50-0.03-0.600.01-0.020.35];betafit=nlinfit(X,y,'model',beta0)2022/12/26422.主程序liti6.m如下:X2023/1/443betafit=0.5243-0.0294-0.63040.0112-0.02300.3658即y=0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230x5+0.3658x6結(jié)果為:返回2022/12/2643結(jié)果為:返回2023/1/444逐步回歸逐步回歸的命令是:stepwise(x,y,inmodel,alpha)運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信區(qū)間.StepwiseTable窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集(缺省時(shí)設(shè)定為全部自變量)顯著性水平(缺省時(shí)為0.5)自變量數(shù)據(jù),階矩陣因變量數(shù)據(jù),階矩陣2022/12/2644逐步回歸逐步回歸的命令是:2023/1/445例6水泥凝固時(shí)放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、x4
有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè)線性模型.1、數(shù)據(jù)輸入:x1=[7111117113122111110]';x2=[26295631525571315447406668]';x3=[615886917221842398]';x4=[6052204733226442226341212]';y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';x=[x1x2x3x4];2022/12/2645例6水泥凝固時(shí)放出的熱量y與水泥中2023/1/4462、逐步回歸:(1)先在初始模型中取全部自變量:stepwise(x,y)得圖StepwisePlot和表StepwiseTable圖StepwisePlot中四條直線都是虛線,說明模型的顯著性不好從表StepwiseTable中看出變量x3和x4的顯著性最差.2022/12/26462、逐步回歸:圖StepwiseP2023/1/447(2)在圖StepwisePlot中點(diǎn)擊直線3和直線4,移去變量x3和x4移去變量x3和x4后模型具有顯著性.
雖然剩余標(biāo)準(zhǔn)差(RMSE)沒有太大的變化,但是統(tǒng)計(jì)量F的值明顯增大,因此新的回歸模型更好.ToMATLAB(liti51)2022/12/2647(2)在圖StepwisePlot2023/1/448(3)對變量y和x1、x2作線性回歸:X=[ones(13,1)x1x2];b=regress(y,X)得結(jié)果:b=52.57731.46830.6623故最終模型為:y=52.5773+1.4683x1+0.6623x2返回2022/12/2648(3)對變量y和x1、x2作線性回歸2023/1/449作業(yè)1、考察溫度x對產(chǎn)量y的影響,測得下列10組數(shù)據(jù):求y關(guān)于x的線性回歸方程,檢驗(yàn)回歸效果是否顯著,并預(yù)測x=42℃時(shí)產(chǎn)量的估值及預(yù)測區(qū)間(置信度95%).2、某零件上有一段曲線,為了在程序控制機(jī)床上加工這一零件,需要求這段曲線的解析表達(dá)式,在曲線橫坐標(biāo)xi處測得縱坐標(biāo)yi共11對數(shù)據(jù)如下:求這段曲線的縱坐標(biāo)y關(guān)于橫坐標(biāo)x的二次多項(xiàng)式回歸方程.2022/12/2649作業(yè)1、考察溫度x對產(chǎn)量y的影響2023/1/4502022/12/26502023/1/4514、混凝土的抗壓強(qiáng)度隨養(yǎng)護(hù)時(shí)間的延長而增加,現(xiàn)將一批混凝土作成12個(gè)試塊,記錄了養(yǎng)護(hù)日期x(日)及抗壓強(qiáng)度y(kg/cm2)的數(shù)據(jù):2022/12/26514、混凝土的抗壓強(qiáng)度隨養(yǎng)護(hù)時(shí)間的延長謝謝大家謝謝大家2023/1/453四軟件開發(fā)人員的薪金問題:一家高技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度等因素之間的關(guān)系,要建立一個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為新聘用人員工資的參考。他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名開發(fā)人員的檔案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué)程度,3表示更高程度(研究生)2022/12/2653四軟件開發(fā)人員的薪金問題:2023/1/454編號薪金資歷管理教育編號薪金資歷管理教育0113876111131980031302116081031411417401031870111315202634130411283102161323140305117671031712844402062087221218132455020711772202191367750308105352012015965511091219520321123666011012313302222135261311149753112313839602122137131224228846122022/12/2654編號薪金資歷管理教育編號薪金資歷管理2023/1/455編號薪金資歷管理教育編號薪金資歷管理教育251697871136168821202261480380237241701213271740481138159901301282218481339263301312291354880140179491402301446710014125685151331159421002422783716123223174101343188381602332378010124417483160134254101112451920717023514861110146193462001開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度2022/12/2655編號薪金資歷管理教育編號薪金資歷管理2023/1/456分析與假設(shè):按照常識,薪金自然按照資歷(年)的增長而增加,管理人員的薪金高于非管理人員,教育程度越高薪金越高。薪金記作,資歷(年)記作,為了表示是否為管理人員定義1,管理人員0,非管理人員為了表示三種教育程度,定義1,中學(xué)0,其它1,大學(xué)0,其它這樣,中學(xué)用表示,大學(xué)用表示,研究生則用表示。2022/12/2656分析與假設(shè):按照常識,薪金自然按照資2023/1/457為了簡單起見,我們假定資歷(年)對薪金的作用是線性的,即資歷每加一年,薪金的增長是常數(shù);管理責(zé)任、教育程度、資歷諸因素之間沒有交互作用,建立線性回歸模型?;灸P停盒浇鹋c資歷,管理責(zé)任,教育程度之間的多元線性回歸模型為其中,是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。利用MATLAB的系統(tǒng)工具箱可以得到回歸系數(shù)及其置信區(qū)間(置信水平)、檢驗(yàn)統(tǒng)計(jì)量的結(jié)果,見表。2022/12/2657為了簡單起見,我們假定資歷(年)對薪2023/1/458參數(shù)參數(shù)估計(jì)值置信區(qū)間11032[1025811807]546[484608]6883[62487517]-2994[-3826-2162]148[-636931]2022/12/2658參數(shù)參數(shù)估計(jì)值置信區(qū)間11032[12023/1/459結(jié)果分析:從表中,,即因變量(薪金)的95.7%可由模型確定,值超過檢驗(yàn)的臨界值,遠(yuǎn)小于,因而模型從整體來看是可用的。比如,利用模型可以估計(jì)(或估計(jì))一個(gè)大學(xué)畢業(yè)、有2年資歷、管理人員的薪金為模型中各個(gè)回歸系數(shù)的含義可初步解釋如下:的系數(shù)為546,說明資歷每增加一年,薪金增長546;的系數(shù)為6883,說明管理人員的薪金比非管理人員多6883;的系數(shù)為-2994,說明中學(xué)程度的薪金比研究生少2994;的系數(shù)為148,說明大學(xué)程度的薪金比研究生多148,但是應(yīng)該注意到的置信區(qū)間包含零點(diǎn),所以這個(gè)系數(shù)的解釋是不可靠的。注意:上述解釋是就平均值來說的,并且,一個(gè)因素改變引起的因變量的變化量,都是在其它因素不變的條件下才成立的。2022/12/2659結(jié)果分析:從表中,,即因變量(薪金)2023/1/460進(jìn)一步討論:的置信區(qū)間包含零點(diǎn),說明上述基本模型存在缺點(diǎn)。為了尋找改進(jìn)的方向,常用殘差分析法(殘差指薪金的實(shí)際值與模型估計(jì)的薪金之差,是基本模型中隨機(jī)誤差的估計(jì)值,這里用同一個(gè)符號)。我們將影響因素分成資歷與管理—教育組合兩類,管理--教育組合定義如表。組合123456管理010101教育112233管理—教育組合2022/12/2660進(jìn)一步討論:的置信區(qū)間包含零點(diǎn),說明2023/1/461為了對殘差進(jìn)行分析,下圖給出與資歷的關(guān)系,及與管理--教育組合間的關(guān)系。與資歷的關(guān)系與組合的關(guān)系從左圖看,殘差大概分成3個(gè)水平,這是由于6種管理—教育組合混在一起,在模型中未被正確反映的結(jié)果;從右圖看,對于前4個(gè)管理—教育組合,殘差或者全為正,或者全為負(fù),也表明管理--教育組合在模型中處理不當(dāng)。在模型中,管理責(zé)任和教育程度是分別起作用的,事實(shí)上,二者可能起著交互作用,如大學(xué)程度的管理人員的薪金會比二者分別的薪金之和高一點(diǎn)。2022/12/2661為了對殘差進(jìn)行分析,下圖給出與資歷的2023/1/462以上分析提示我們,應(yīng)在基本模型中增加管理更好的模型:與教育的交互項(xiàng),建立新的回歸模型。增加與的交互項(xiàng)后,模型記作利用MATLAB的統(tǒng)計(jì)工具箱得到的結(jié)果如表:2022/12/2662以上分析提示我們,應(yīng)在基本模型中增加2023/1/463參數(shù)參數(shù)估計(jì)值置信區(qū)間11204[1104411363]497[486508]7048[68417255]-1727[-1939-1514]-348[-545-152]-3071[-3372-2769]1836[15712101]2022/12/2663參數(shù)參數(shù)估計(jì)值置信區(qū)間11204[12023/1/464由上表可知,這個(gè)模型的做該模型的兩個(gè)殘差分析圖,可以看出,已經(jīng)消除了不正常現(xiàn)象,這也說明了模型的適用性。和值都比上一個(gè)模型有所改進(jìn),并且所有回歸系數(shù)的置信區(qū)間都不含零點(diǎn),表明這個(gè)模型完全可用。與的關(guān)系與組合的關(guān)系2022/12/2664由上表可知,這個(gè)模型的做該模型的兩個(gè)2023/1/465從上圖,還可以發(fā)現(xiàn)一個(gè)異常點(diǎn):具有10年資歷、大學(xué)程度的管理人員(編號33)的實(shí)際薪金明顯低于模型的估計(jì)值,也明顯低于與他有類似經(jīng)歷的其他人的薪金。這可能是由我們未知的原因造成的。為了使個(gè)別數(shù)據(jù)不致影響整個(gè)模型,應(yīng)該將這個(gè)異常數(shù)據(jù)去掉,對模型重新估計(jì)回歸系數(shù),得到的結(jié)果如表。殘差分析見圖??梢钥吹?,去掉異常數(shù)據(jù)后結(jié)果又有改善。2022/12/2665從上圖,還可以發(fā)現(xiàn)一個(gè)異常點(diǎn):具有12023/1/466參數(shù)參數(shù)估計(jì)值置信區(qū)間11200[1113911261]498[494503]7041[69627120]-1737[-1818-1656]-356[-431-281]-3056[-3171-2942]1997[18942100]2022/12/2666參數(shù)參數(shù)估計(jì)值置信區(qū)間11200[12023/1/467與的關(guān)系與組合的關(guān)系模型的應(yīng)用:對于第二個(gè)模型,用去掉異常數(shù)據(jù)(33號)后估計(jì)出的系數(shù)得到的結(jié)果是滿意的。模型的應(yīng)用之一,可以用來“制訂”6種管理—教育組合人員的“基礎(chǔ)”薪金(即資歷為零的薪金),這是平均意義上的。利用第二個(gè)模型和去掉異常數(shù)據(jù)后得到的回歸系數(shù),可以得到如下結(jié)果:2022/12/2667與的關(guān)系與組合的關(guān)系模型的應(yīng)用:對于2023/1/468組合管理教育系數(shù)“基礎(chǔ)”薪金101946321113448302108444121988250311200613182412022/12/2668組合管理教育系數(shù)“基礎(chǔ)”薪金10192023/1/469可以看出,大學(xué)程度的管理人員薪金比研究生程度管理人員
薪金高,而大學(xué)程度的非管理人員薪金比研究生程度非管理
人員薪金略低。當(dāng)然,這是根據(jù)這家公司實(shí)際數(shù)據(jù)建立的模
型得到的結(jié)果,并不具普遍性。評注:從建立回歸模型的角度,通過這個(gè)問題的求解我們學(xué)習(xí)了:1)對于影響因變量的定性因素(管理、教育),可以引入0—1變量來處理,0—1變量的個(gè)數(shù)比定性因素的水平少1(如教育程度有3個(gè)水平,引入2個(gè)0—1變量)。2)用殘差分析法可以發(fā)現(xiàn)模型的缺陷,引入交互作用項(xiàng)常常可以得到改善。3)若發(fā)現(xiàn)異常值應(yīng)剔除,有助于結(jié)果的合理性。思考:在這里我們由簡到繁,先分別引進(jìn)管理和教育因素,再引入交互項(xiàng)。試直接對6種管理-教育組合引入5個(gè)0—1變量,建立模型,看結(jié)果如何。2022/12/2669可以看出,大學(xué)程度的管理人員薪金比研2023/1/470五教學(xué)評估為了考評教師的教學(xué)質(zhì)量,教學(xué)研究部門設(shè)計(jì)了一個(gè)教學(xué)評估表,對學(xué)生進(jìn)行一次問卷調(diào)查,要求學(xué)生對12位教師的15門課程(其中3為教師有兩門課程)按以下7項(xiàng)內(nèi)容打分,分值為1—5分(5分最好,1分最差):問題:~課程內(nèi)容組織的合理性;~主要問題展開的邏輯性;~回答學(xué)生問題的有效性;~課下交流的有助性;~教科書的幫助性;~考試評分的公正性;~對教師的總體評價(jià)。2022/12/2670五教學(xué)評估為了考評教師的教學(xué)質(zhì)量2023/1/471收回問卷調(diào)查表后,得到了學(xué)生對12為教師、15門課程各項(xiàng)評分的平均值,見表。
教師編號課程編號12014.464.424.234.104.564.374.1122244.113.823.293.603.993.823.3833013.583.313.243.764.393.753.1743014.424.374.344.403.634.274.3953014.624.474.534.674.634.574.692022/12/2671收回問卷調(diào)查表后,得到了學(xué)生對12為2023/1/472教師編號課程編號63093.183.823.923.623.504.143.2573112.472.793.583.502.843.842.8483114.293.924.053.762.764.113.9593124.414.364.274.754.594.114.18103124.594.344.244.392.644.384.44113334.554.454.434.574.454.404.47124244.674.644.524.393.484.214.6133513.713.413.394.184.064.063.1744114.284.454.104.073.764.434.1594244.244.384.354.484.154.504.332022/12/2672教師編號課程編號63093.183.2023/1/473不一定每項(xiàng)都對教師總體評價(jià)有顯著影響,并且各項(xiàng)內(nèi)容之間也可能存在很強(qiáng)的相關(guān)性,他們希望得到一個(gè)總體評價(jià)與各項(xiàng)具體內(nèi)容之間的模型,模型應(yīng)盡量簡單和有效,并且由此能給教師一些合理的建議,以提高總體評價(jià)。準(zhǔn)備知識:逐步回歸這個(gè)問題給出了6個(gè)自變量,但我們希望從中選出對因變量影響顯著的那些來建立回歸模型。變量選擇的標(biāo)準(zhǔn)應(yīng)該是將所有對因變量影響顯著的自變量都選入模型,而影響不顯著的自變量都不選入模型,從便于應(yīng)用的角度,應(yīng)使模型中的自變量個(gè)數(shù)盡量少。逐步回歸就是一種從眾多自變量中有效的選擇重要變量的方法。教學(xué)研究部門認(rèn)為,所列各項(xiàng)具體內(nèi)容2022/12/2673不一定每項(xiàng)都對教師總體評價(jià)有顯著影響2023/1/474逐步回歸的基本思路是,先確定一個(gè)包含若干自變量的初始集合,然后每次從集合外的變量中引入一個(gè)對因變量影響最大的,再對集合中的變量進(jìn)行檢驗(yàn),從變得不顯著的變量中移出一個(gè)影響最小的,依次進(jìn)行,直到不能引入和移出為止。引入和移出都以給定的顯著性水平為標(biāo)準(zhǔn)。利用MATLAB系統(tǒng)工具箱中的逐步回歸命令stepwise可以實(shí)現(xiàn)逐步回歸。Stepwise提供人機(jī)交互式畫面,可以在畫面上自由引入和移出變量,進(jìn)行統(tǒng)計(jì)分析。具體用法參見MATLAB叢書回歸模型的建立與求解:我們利用MATLAB命令得到各個(gè)變量的回歸系數(shù),置信區(qū)間,及剩余標(biāo)準(zhǔn)差(RMSE),決定系數(shù)(R-square),值,值。見表。2022/12/2674逐步回歸的基本思路是,先確定一個(gè)包含2023/1/475參數(shù)參數(shù)估計(jì)值置信區(qū)間10.5162[0.015460.019]2-0.05469[-0.8530.7436]30.6706[-0.037951.379]40.1245[-0.4620.6751]5-0.04335[-0.25140.1647]60.1363[-0.69580.9684]RMSER-squareFp0.11250.980667.292.071e-006可以看到,除外其他自變量的回歸系數(shù)置信區(qū)間都包含零點(diǎn)在臨界狀態(tài),將一一移去(與次序無關(guān)),當(dāng)模型中僅含時(shí)結(jié)果見下表。2022/12/2675參數(shù)參數(shù)估計(jì)值置信區(qū)間10.51622023/1/476參數(shù)參數(shù)估計(jì)值置信區(qū)間10.5099[0.3260.6938]2-0.1137[-0.6890.4616]30.7678[-0.51241.023]40.0833[-0.27670.4433]5-0.018[-0.15650.1205]60.1109[-0.55940.7811]RMSER-squareFp0.10.977254.71.487e-010可以看到,僅含模型的回歸系數(shù)置信區(qū)間遠(yuǎn)離零點(diǎn),對的影響是顯著的,與上個(gè)結(jié)果比較,剩余標(biāo)準(zhǔn)差由0.1125減少到0.1,雖然略有下降,但值大大提高。這些表明僅含模型是合適的。但MATLAB命令并未給出回歸模型的常數(shù)項(xiàng)。我們由以下方法計(jì)算得到:2022/12/2676參數(shù)參數(shù)估計(jì)值置信區(qū)間10.50992023/1/477終得到的模型為在最終模型里回歸變量只有其中,分別是的平均值。利用逐步回歸最模型解釋:,是一個(gè)簡單易用的模型,據(jù)此可把課程內(nèi)容組織的合理性()和回答學(xué)生問題的有效性()列入考評的重點(diǎn)。上式表明,的分值每增加一分,對教師的總體評價(jià)就增加約0.5分;的分值每增加一分,對教師的總體評價(jià)就增加約0.77分。應(yīng)建議教師注重這兩方面的工作。為了分析其它變量沒有進(jìn)入最終模型的原因,可以計(jì)算的相關(guān)系數(shù),利用MATLAB系統(tǒng)工具箱中的corrcoef命令直接得到這7個(gè)變量的相關(guān)系數(shù)矩陣:2022/12/2677終得到的模型為在最終模型里回歸變量只2023/1/4781.00000.90080.67520.73610.29100.64710.89730.90081.00000.85040.73990.27750.80260.93630.67520.85041.00000.74990.08080.84900.91160.73610.73990.74991.00000.43700.70410.82190.29100.27750.08080.43701.00000.18720.17830.64710.80260.84900.70410.18721.00000.82460.89730.93630.91160.82190.17830.82461.0000一般認(rèn)為,兩個(gè)變量的相關(guān)系數(shù)超過0.85時(shí)才具有顯著的相關(guān)關(guān)系。由上面的結(jié)果知,與相關(guān)關(guān)系顯著的只有而未進(jìn)入最終模型,是由于它與的相關(guān)系數(shù)顯著(相關(guān)系數(shù)),可以說,模型中有了以后2022/12/26781.00000.90080.67522023/1/479變量如果初步看來影響因變量的因素較多,并得到了大量的數(shù)據(jù)。為了建立一個(gè)有效的、便于應(yīng)用的模型,可以利用逐步回歸只選擇那些影響顯著的變量“入圍”。如果懷疑原有變量的平方項(xiàng)、交叉項(xiàng)等也會對變量有顯著影響也可以將這些項(xiàng)作為新的自變量加入到候選行列,用逐步回歸來處理。是多余的,應(yīng)該去掉。評注:2022/12/2679變量如果初步看來影響因變量的因素較多2023/1/480練習(xí):下表給出了某工廠產(chǎn)品的生產(chǎn)批量與單位成本(元)的數(shù)據(jù),從散點(diǎn)圖,可以明顯的發(fā)現(xiàn),生產(chǎn)批量在500以內(nèi)時(shí),單位成本對生產(chǎn)批量服從一種線性關(guān)系,生產(chǎn)批量超過500時(shí)服從另一種線性關(guān)系,此時(shí)單位成本明顯下降。希望你構(gòu)造一個(gè)合適的回歸模型全面地描述生產(chǎn)批量與單位成本的關(guān)系。生產(chǎn)批量650340400800300600720480440540750單位成本2.484.454.521.384.652.962.184.044.203.101.502022/12/2680練習(xí):下表給出了某工廠產(chǎn)品的生產(chǎn)批量2023/1/481數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)回歸分析2022/12/261數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)回歸分析實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問題。1、直觀了解回歸分析基本內(nèi)容。1、回歸分析的基本理論。3、實(shí)驗(yàn)作業(yè)。2、用數(shù)學(xué)軟件求解回歸分析問題。實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問題。1、直觀2023/1/483一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*檢驗(yàn)、預(yù)測與控制可線性化的一元非線性回歸(曲線回歸)數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)*多元線性回歸中的檢驗(yàn)與預(yù)測逐步回歸分析2022/12/263一元線性回歸多元線性回歸回歸分析數(shù)學(xué)模2023/1/484一、數(shù)學(xué)模型例1測16名成年女子的身高與腿長所得數(shù)據(jù)如下:以身高x為橫坐標(biāo),以腿長y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)(xI,yi)在平面直角坐標(biāo)系上標(biāo)出.散點(diǎn)圖解答2022/12/264一、數(shù)學(xué)模型例1測16名成年女子的身2023/1/485一元線性回歸分析的主要任務(wù)是:返回2022/12/265一元線性回歸分析的主要任務(wù)是:返回2023/1/486二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)2022/12/266二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘2023/1/487返回2022/12/267返回2023/1/488三、檢驗(yàn)、預(yù)測與控制1、回歸方程的顯著性檢驗(yàn)2022/12/268三、檢驗(yàn)、預(yù)測與控制1、回歸方程的顯著2023/1/489(Ⅰ)F檢驗(yàn)法
(Ⅱ)t檢驗(yàn)法2022/12/269(Ⅰ)F檢驗(yàn)法(Ⅱ)t檢驗(yàn)法2023/1/490(Ⅲ)r檢驗(yàn)法2022/12/2610(Ⅲ)r檢驗(yàn)法2023/1/4912、回歸系數(shù)的置信區(qū)間2022/12/26112、回歸系數(shù)的置信區(qū)間2023/1/4923、預(yù)測與控制(1)預(yù)測2022/12/26123、預(yù)測與控制(1)預(yù)測2023/1/493(2)控制返回2022/12/2613(2)控制返回2023/1/494四、可線性化的一元非線性回歸(曲線回歸)例2出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕,容積不斷增大.我們希望知道使用次數(shù)與增大的容積之間的關(guān)系.對一鋼包作試驗(yàn),測得的數(shù)據(jù)列于下表:解答2022/12/2614四、可線性化的一元非線性回歸例2出2023/1/495散點(diǎn)圖此即非線性回歸或曲線回歸
問題(需要配曲線)配曲線的一般方法是:2022/12/2615散此即非線性回歸或曲線回歸2023/1/496通常選擇的六類曲線如下:返回2022/12/2616通常選擇的六類曲線如下:返回2023/1/497一、數(shù)學(xué)模型及定義返回2022/12/2617一、數(shù)學(xué)模型及定義返回2023/1/498二、模型參數(shù)估計(jì)解得估計(jì)值
2022/12/2618二、模型參數(shù)估計(jì)解得估計(jì)值2023/1/499返回2022/12/2619返回2023/1/4100三、多元線性回歸中的檢驗(yàn)與預(yù)測
(Ⅰ)F檢驗(yàn)法(Ⅱ)r檢驗(yàn)法(殘差平方和)2022/12/2620三、多元線性回歸中的檢驗(yàn)與預(yù)測(Ⅰ2023/1/41012、預(yù)測(1)點(diǎn)預(yù)測(2)區(qū)間預(yù)測返回2022/12/26212、預(yù)測(1)點(diǎn)預(yù)測(2)區(qū)間預(yù)測返2023/1/4102四、逐步回歸分析(4)“有進(jìn)有出”的逐步回歸分析。(1)從所有可能的因子(變量)組合的回歸方程中選擇最優(yōu)者;(2)從包含全部變量的回歸方程中逐次剔除不顯著因子;(3)從一個(gè)變量開始,把變量逐個(gè)引入方程;選擇“最優(yōu)”的回歸方程有以下幾種方法:
“最優(yōu)”的回歸方程就是包含所有對Y有影響的變量,而不包含對Y影響不顯著的變量回歸方程。以第四種方法,即逐步回歸分析法在篩選變量方面較為理想.2022/12/2622四、逐步回歸分析(4)“有進(jìn)有出”的2023/1/4103這個(gè)過程反復(fù)進(jìn)行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法的思想:從一個(gè)自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個(gè)引入回歸方程。當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。對于每一步都要進(jìn)行Y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。返回2022/12/2623這個(gè)過程反復(fù)進(jìn)行,直至既無不顯著2023/1/4104統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線性回歸2、多項(xiàng)式回歸3、非線性回歸4、逐步回歸返回2022/12/2624統(tǒng)計(jì)工具箱中的回歸分析命令1、多元線2023/1/4105多元線性回歸
b=regress(Y,X)1、確定回歸系數(shù)的點(diǎn)估計(jì)值:2022/12/2625多元線性回歸1、確定回歸系數(shù)的點(diǎn)估計(jì)2023/1/41063、畫出殘差及其置信區(qū)間:rcoplot(r,rint)2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:
[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對應(yīng)的概率p置信區(qū)間顯著性水平(缺省時(shí)為0.05)2022/12/26262、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并2023/1/4107例1解:1、輸入數(shù)據(jù):x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回歸分析及檢驗(yàn):[b,bint,r,rint,stats]=regress(Y,X)b,bint,stats題目2022/12/2627例1解:1、輸入數(shù)據(jù):2、回歸分析及2023/1/41083、殘差分析,作殘差圖:rcoplot(r,rint)從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型y=-16.073+0.7194x能較好的符合原始數(shù)據(jù),而第二個(gè)數(shù)據(jù)可視為異常點(diǎn).4、預(yù)測及作圖:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')返回2022/12/26283、殘差分析,作殘差圖:2023/1/4109多項(xiàng)式回歸(一)一元多項(xiàng)式回歸
(1)確定多項(xiàng)式系數(shù)的命令:[p,S]=polyfit(x,y,m)(2)一元多項(xiàng)式回歸命令:polytool(x,y,m)1、回歸:y=a1xm+a2xm-1+…+amx+am+12、預(yù)測和預(yù)測誤差估計(jì):(1)Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間YDELTA;alpha缺省時(shí)為0.5.2022/12/2629多項(xiàng)式回歸(一)一元多項(xiàng)式2023/1/4110法一直接作二次多項(xiàng)式回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];
[p,S]=polyfit(t,s,2)ToMATLAB(liti21)得回歸模型為:2022/12/2630法一直接作二次多項(xiàng)式回歸2023/1/4111法二化為多元線性回歸:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,stats得回歸模型為:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')預(yù)測及作圖2022/12/2631法二化為多元線性回歸:得回歸模型為2023/1/4112(二)多元二項(xiàng)式回歸命令:rstool(x,y,’model’,alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量2022/12/2632(二)多元二項(xiàng)式回歸命令:rstoo2023/1/4113例3設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù)據(jù)如下,建立回歸模型,預(yù)測平均收入為1000、價(jià)格為6時(shí)的商品需求量.法一直接用多元二項(xiàng)式回歸:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')2022/12/2633例3設(shè)某商品的需求量與消費(fèi)者的2023/1/4114在畫面左下方的下拉式菜單中選”all”,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。則畫面左邊的“PredictedY”下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測出平均收入為1000、價(jià)格為6時(shí)的商品需求量為88.4791.2022/12/2634在畫面左下方的下拉式菜單中選2023/1/4115在Matlab工作區(qū)中輸入命令:beta,rmse為剩余標(biāo)準(zhǔn)差,表示應(yīng)變量Y值對于回歸直線的離散程度。2022/12/2635在Matlab工作區(qū)中輸入命令:b2023/1/4116結(jié)果為:b=110.53130.1464-26.5709-0.00011.8475stats=0.970240.66560.0005法二返回將化為多元線性回歸:2022/12/2636結(jié)果為:b=法二返回將化為多2023/1/4117非線性回歸(1)確定回歸系數(shù)的命令:
[beta,r,J]=nlinfit(x,y,’model’,beta0)(2)非線性回歸命令:nlintool(x,y,’model’,beta0,alpha)1、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為矩陣和n維列向量,對一元非線性回歸,x為n維列向量。2、預(yù)測和預(yù)測誤差估計(jì):[Y,DELTA]=nlpredci(’model’,x,beta,r,J)求nlinfit或nlintool所得的回歸函數(shù)在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間YDELTA.2022/12/2637非線性回歸(1)確定回歸系數(shù)的命2023/1/4118例4對第一節(jié)例2,求解如下:2、輸入數(shù)據(jù):x=2:16;y=[6.428.209.589.59.7109.939.9910.4910.5910.6010.8010.6010.9010.76];beta0=[82]';3、求回歸系數(shù):[beta,r,J]=nlinfit(x',y','volum',beta0);beta得結(jié)果:beta=11.6036-1.0641即得回歸模型為:題目2022/12/2638例4對第一節(jié)例2,求解如下:22023/1/41194、預(yù)測及作圖:[YY,delta]=nlpredci('volum',x',beta,r,J);plot(x,y,'k+',x,YY,'r')2022/12/26394、預(yù)測及作圖:2023/1/4120例5財(cái)政收入預(yù)測問題:財(cái)政收入與國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資等因素有關(guān)。下表列出了1952-1981年的原始數(shù)據(jù),試構(gòu)造預(yù)測模型。
解設(shè)國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財(cái)政收入為y,設(shè)變量之間的關(guān)系為:y=ax1+bx2+cx3+dx4+ex5+fx6使用非線性回歸方法求解。2022/12/2640例5財(cái)政收入預(yù)測問題:財(cái)政收2023/1/41211.
對回歸模型建立M文件model.m如下:functionyy=model(beta0,X)a=beta0(1);b=beta0(2);c=beta0(3);d=beta0(4);e=beta0(5);f=beta0(6);x1=X(:,1);x2=X(:,2);x3=X(:,3);x4=X(:,4);x5=X(:,5);x6=X(:,6);yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6;
2022/12/26412023/1/41222.
主程序liti6.m如下:X=[598.00349.00461.0057482.0020729.0044.00…………..2927.006862.001273.00100072.043280.00496.00];y=[184.00216.00248.00254.00268.00286.00357.00444.00506.00...271.00230.00266.00323.00393.00466.00352.00303.00447.00...564.00638.00658.00691.00655.00692.00657.00723.00922.00...890.00826.00810.0]';beta0=[0.50-0.03-0.600.01-0.020.35];betafit=nlinfit(X,y,'model',beta0)2022/12/26422.主程序liti6.m如下:X2023/1/4123betafit=0.5243-0.0294-0.63040.0112-0.02300.3658即y=0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230x5+0.3658x6結(jié)果為:返回2022/12/2643結(jié)果為:返回2023/1/4124逐步回歸逐步回歸的命令是:stepwise(x,y,inmodel,alpha)運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:StepwisePlot,StepwiseTable,StepwiseHistory.在StepwisePlot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信區(qū)間.StepwiseTable窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差(RMSE)、相關(guān)系數(shù)(R-square)、F值、與F對應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集(缺省時(shí)設(shè)定為全部自變量)顯著性水平(缺省時(shí)為0.5)自變量數(shù)據(jù),階矩陣因變量數(shù)據(jù),階矩陣2022/12/2644逐步回歸逐步回歸的命令是:2023/1/4125例6水泥凝固時(shí)放出的熱量y與水泥中4種化學(xué)成分x1、x2、x3、x4
有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè)線性模型.1、數(shù)據(jù)輸入:x1=[7111117113122111110]';x2=[26295631525571315447406668]';x3=[615886917221842398]';x4=[6052204733226442226341212]';y=[78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.4]';x=[x1x2x3x4];2022/12/2645例6水泥凝固時(shí)放出的熱量y與水泥中2023/1/41262、逐步回歸:(1)先在初始模型中取全部自變量:stepwise(x,y)得圖StepwisePlot和表StepwiseTable圖StepwisePlot中四條直線都是虛線,說明模型的顯著性不好從表StepwiseTable中看出變量x3和x4的顯著性最差.2022/12/26462、逐步回歸:圖StepwiseP2023/1/4127(2)在圖StepwisePlot中點(diǎn)擊直線3和直線4,移去變量x3和x4移去變量x3和x4后模型具有顯著性.
雖然剩余標(biāo)準(zhǔn)差(RMSE)沒有太大的變化,但是統(tǒng)計(jì)量F的值明顯增大,因此新的回歸模型更好.ToMATLAB(liti51)2022/12/2647(2)在圖StepwisePlot2023/1/4128(3)對變量y和x1、x2作線性回歸:X=[ones(13,1)x1x2];b=regress(y,X)得結(jié)果:b=52.57731.46830.6623故最終模型為:y=52.5773+1.4683x1+0.6623x2返回2022/12/2648(3)對變量y和x1、x2作線性回歸2023/1/4129作業(yè)1、考察溫度x對產(chǎn)量y的影響,測得下列10組數(shù)據(jù):求y關(guān)于x的線性回歸方程,檢驗(yàn)回歸效果是否顯著,并預(yù)測x=42℃時(shí)產(chǎn)量的估值及預(yù)測區(qū)間(置信度95%).2、某零件上有一段曲線,為了在程序控制機(jī)床上加工這一零件,需要求這段曲線的解析表達(dá)式,在曲線橫坐標(biāo)xi處測得縱坐標(biāo)yi共11對數(shù)據(jù)如下:求這段曲線的縱坐標(biāo)y關(guān)于橫坐標(biāo)x的二次多項(xiàng)式回歸方程.2022/12/2649作業(yè)1、考察溫度x對產(chǎn)量y的影響2023/1/41302022/12/26502023/1/41314、混凝土的抗壓強(qiáng)度隨養(yǎng)護(hù)時(shí)間的延長而增加,現(xiàn)將一批混凝土作成12個(gè)試塊,記錄了養(yǎng)護(hù)日期x(日)及抗壓強(qiáng)度y(kg/cm2)的數(shù)據(jù):2022/12/26514、混凝土的抗壓強(qiáng)度隨養(yǎng)護(hù)時(shí)間的延長謝謝大家謝謝大家2023/1/4133四軟件開發(fā)人員的薪金問題:一家高技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度等因素之間的關(guān)系,要建立一個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為新聘用人員工資的參考。他們認(rèn)為目前公司人員的薪金總體上是合理的,可以作為建模的依據(jù),于是調(diào)查了46名開發(fā)人員的檔案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),管理一列中1表示管理人員,0表示非管理人員,教育一列中1表示中學(xué)程度,2表示大學(xué)程度,3表示更高程度(研究生)2022/12/2653四軟件開發(fā)人員的薪金問題:2023/1/4134編號薪金資歷管理教育編號薪金資歷管理教育0113876111131980031302116081031411417401031870111315202634130411283102161323140305117671031712844402062087221218132455020711772202191367750308105352012015965511091219520321123666011012313302222135261311149753112313839602122137131224228846122022/12/2654編號薪金資歷管理教育編號薪金資歷管理2023/1/4135編號薪金資歷管理教育編號薪金資歷管理教育251697871136168821202261480380237241701213271740481138159901301
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中央司法警官學(xué)院《老年生活規(guī)劃》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶外語外事學(xué)院《預(yù)防醫(yī)學(xué)進(jìn)展》2023-2024學(xué)年第二學(xué)期期末試卷
- 中央美術(shù)學(xué)院《西方社會思潮評價(jià)》2023-2024學(xué)年第二學(xué)期期末試卷
- 建議書和可行性研究報(bào)告
- 金陵科技學(xué)院《工程制圖A(2)》2023-2024學(xué)年第二學(xué)期期末試卷
- 晉城職業(yè)技術(shù)學(xué)院《中國傳統(tǒng)蒙養(yǎng)教育》2023-2024學(xué)年第二學(xué)期期末試卷
- 云南輕紡職業(yè)學(xué)院《國畫工筆人物》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年豪華防搶運(yùn)鈔車行業(yè)深度研究分析報(bào)告
- 江西工業(yè)貿(mào)易職業(yè)技術(shù)學(xué)院《中醫(yī)藥信息檢索》2023-2024學(xué)年第二學(xué)期期末試卷
- 板鴨生產(chǎn)加工及冷鏈物流項(xiàng)目可行性研究報(bào)告
- 不銹鋼金屬邊框施工方案
- 民企與央企合作協(xié)議
- 醫(yī)院一站式服務(wù)中心建設(shè)實(shí)施方案
- 超實(shí)用可編輯版中國地圖全圖及分省地圖
- 尿路結(jié)石腔內(nèi)碎石患者圍手術(shù)期并發(fā)尿膿毒癥護(hù)理專家共識
- 交換機(jī)工作原理詳解(附原理圖)
- 小學(xué)總復(fù)習(xí)非連續(xù)性文本教學(xué)課件
- 2023年考研考博考博英語福建師范大學(xué)考試高頻考點(diǎn)參考題庫帶答案
- DLT1123-2023年《火力發(fā)電企業(yè)生產(chǎn)安全設(shè)施配置》
- 新人教版八年級數(shù)學(xué)下冊全冊教案-八年級下冊人教版全冊教案
- 山西陽城陽泰集團(tuán)西馮街煤業(yè)有限公司煤炭資源開發(fā)利用方案和礦山環(huán)境保護(hù)與土地復(fù)墾方案
評論
0/150
提交評論