實驗13 回歸分析_第1頁
實驗13 回歸分析_第2頁
實驗13 回歸分析_第3頁
實驗13 回歸分析_第4頁
實驗13 回歸分析_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、實驗13 回歸分析【實驗目的】1. 了解回歸分析的基本原理,掌握MATLAB實現(xiàn)的方法; 2. 練習用回歸分析解決實際問題。【實驗內(nèi)容】【題目2】 電影院調(diào)查電視廣告費用和報紙廣告費用對每周收入的影響,得到下面的數(shù)據(jù)(見下表), 建立回歸模型并進行檢驗,診斷異常點的存在并進行處理。每周收入9690959295959494電視廣告費用1.52.01.52.53.32.34.22.5報紙廣告費用5.02.04.02.53.03.52.53.02.1 模型分析本題研究電視廣告費用與報紙廣告費用對電影收入的影響。我們首先嘗試線性回歸,由R2 值判斷回歸模型是否合理。如果不合理, 再采取其他方法進行回歸

2、分析。設電視廣告費用為,報紙廣告費用為,每周電影院收入為y。建立如下模型: 2.2 matlab求解y=96 90 95 92 95 95 94 94;x1=1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5;x2=5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0;n=8;m=2;X=ones(8,1),x1',x2'b,bint,r,rint,s=regress(y',X);b,bint,srcoplot(r,rint)得到如下結(jié)果:b = 83.2116 1.2985 2.3372bint = 78.8058 87.61741 / 14 0

3、.4007 2.1962 1.4860 3.1883s = 0.9089 24.9408 0.0025 0.4897 整理成表格如下:回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間083.211678.8058 87.617411.29850.4007 2.196222.33721.4860 3.1883R2=0.9089 , F=24.9408 , p=0.0025 , s2=0.4897 在殘差及置信區(qū)間的圖中,第一個點的殘差的置信區(qū)間不包含零點,以紅色標出。殘差應該服從均值為0的正態(tài)分布,可以認為這個數(shù)據(jù)是異常的,偏離了數(shù)據(jù)整體的變化趨勢,給模型的有效性的精度帶來不利影響,應予以剔除。2.3 剔

4、除點后重新計算刪除第一個點后重新計算,將輸出結(jié)果同樣以表格表示?;貧w系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間081.488178.7878 84.188311.28770.7964 1.779022.97662.3281 3.6250R2=0.9768 , F=84.3842 , 0.0005 , s2=0.1257剔除第一個異常點后,R2=0.97685,相比之前有了增加,擬合的線性性有了提高;相比之前的模型,p值也有了明顯的減少,遠小于顯著性水平,這表示置信概率大大提高了;s2 也有了減小,說明了偏差減小。綜合以上幾點,說明這個二元線性的模型比較合理,回歸效果很好。 擬合公式為y=81.4881

5、+1.2877x1+2.9766x2+=2.4 小結(jié)本題是個較為直觀的線性回歸題,在它的計算中出現(xiàn)了異常點。剔除后計算可以得到一個回歸效果相當好的模型。【題目8】汽車銷售商認為汽車銷售量與汽油價格、貸款利率有關(guān),兩種類型汽車(普通型和豪華型)18個月的調(diào)查資料如表,其中y1是普通型汽車售量(千輛),y2是豪華型汽車售量(千輛),x1是汽油價格(元/gal),x2是貸款利率(%)(1)對普通型和豪華型汽車分別建立如下模型:y1=0(1)+1(1)x1+2(1)x2,y2=0(2)+1(2)x1+2(2)x2給出的估計值和置信區(qū)間,決定系數(shù)R2,F值及剩余方差等。(2)用x3=0,1表示汽車類型,

6、建立統(tǒng)一模型y=0+1x1+2x2 +3x3 ,給出給出的估計值和置信區(qū)間,決定系數(shù)R2,F值及剩余方差等。以x3=0,1帶入統(tǒng)一模型,將結(jié)果與(1)的兩個模型的結(jié)果比較,解釋二者的區(qū)別。(3)對統(tǒng)一模型就每種類型汽車分別作x1和x2與殘差的散點圖,有什么現(xiàn)象,說明模型有何缺陷?(4)對統(tǒng)一模型增加二次項和交互相,考察結(jié)果有什么改進。8.1 根據(jù)模型分別求解 由題意,對普通型和豪華型汽車分別建立如下模型:y1=0(1)+1(1)x1+2(1)x2,y2=0(2)+1(2)x1+2(2)x2此為二元線性回歸,可用matlab編寫程序如下:y1=22.1,15.4,11.7,10.3,11.4,7

7、.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6

8、,3.1,1.8,2.3;n=18;m=2;X=ones(n,1),x1',x2'b1,bint1,r1,rint1,s1=regress(y1',X);b2,bint2,r2,rint2,s2=regress(y2',X);subplot(2,1,1)rcoplot(r1,rint1)subplot(2,1,2)rcoplot(r2,rint2)得到如下圖:在殘差及置信區(qū)間的圖中,有三個點的殘差的置信區(qū)間不包含零點,以紅色標出。殘差應該服從均值為0的正態(tài)分布,可以認為這個數(shù)據(jù)是異常的,偏離了數(shù)據(jù)整體的變化趨勢,給模型的有效性的精度帶來不利影響,應予以剔除。8.

9、2 剔除點后的模型求解(1)對于y1=0(1)+1(1)x1+2(1)x2剔除第14、18個點后繼續(xù)自此基礎上剔除第11個點(2)對于y2=0(2)+1(2)x1+2(2)x2剔除第14個點后繼續(xù)剔除第七個點,得到殘差及置信區(qū)間圖如下:將輸出結(jié)果匯總成下表:普通型回歸系數(shù)回歸系數(shù)估值回歸系數(shù)置信區(qū)間0(1)107.560175.3160 139.80421(1)-37.9283-57.2842 -18.57232(1)-3.0314-3.7862 -2.2767R2=0.9334 F=84.0758 p<0.0001 s2=9.2746豪華型回歸系數(shù)回歸系數(shù)估值回歸系數(shù)置信區(qū)間0(2)2

10、9.758316.2864 43.23031(2)-6.7738-14.9774 1.42992(2)-1.6367-1.9680 -1.3054R2=0.9450 F=103.1152 p<0.0001 s2=1.5413可得模型如下:普通型:y=107.5601-37.9283x1-3.0314x2豪華型:y=29.7583-6.7738x1-1.6367x28.3 建立統(tǒng)一模型 建立統(tǒng)一模型y=0+1x1+2x2 +3x3 ,用x3=0表示普通型,x3=1表示豪華型,此時為三元線性回歸,可用matlab編寫程序如下:y=22.1,15.4,11.7,10.3,11.4,7.5,13

11、.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.

12、61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3=zeros(1,18),ones(1,18);n=36;m=3;X=ones(n,1),x1',x2',x3'b,bint,r,rint,s=regress(y',X);b,bint,srcoplot(r,rint)輸出如下

13、結(jié)果:b = 64.5753 -16.1436 -2.3322 -14.4222bint = 33.5007 95.6499 -35.1193 2.8320 -3.0705 -1.5939 -17.6546 -11.1898s = 0.8366 54.6111 0.0000 22.6642回歸系數(shù)回歸系數(shù)估值回歸系數(shù)置信區(qū)間064.575333.5007 95.64991-16.1436-35.1193 2.83202-2.3322-3.0705 -1.59393-14.4222-17.6546 -11.1898R2=0.8366 F=54.6111 p<0.0001 s2= 22.66

14、42可得模型為:y=64.5753-16.1436-2.3322x2 -14.4222x3,x3=0表示普通型,x3=1表示豪華型。即:普通型:y=64.5753-16.1436-2.3322x2 豪華型:y=50.1531-16.1436-2.3322x2 可以看出:統(tǒng)一模型相當于將分立模型進行了統(tǒng)一:(1)統(tǒng)一模型的值趨近于給分立模型的“平均”;(2)統(tǒng)一模型的殘差較大;(3)統(tǒng)一模型的決定系數(shù)較?。?4)統(tǒng)一模型的拒絕概率較小,到達了10的-12次方量級,說明模型更加有效;總體上講,將兩者統(tǒng)一后進行回歸分析的結(jié)果有其優(yōu)點,但是仍有許多不理想的成分。8.4 就每種類型汽車分別作x1和x2與

15、殘差的散點圖y=22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.7

16、6,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3=zeros(1,18),ones(1,18);n=36;m=3;X=ones(n,1),x1',x2',x3'b,bint,r,rint,s=regres

17、s(y',X);x11=x1(:,1:18);x22=x2(:,1:18);r1=r(1:18,:);r2=r(19:36,:);subplot(2,2,1)plot(x11,r1,'r+')title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx1µÄÉ¢µãͼ')subplot(2,2,2)plo

18、t(x22,r1,'r+')title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µãͼ')subplot(2,2,3)plot(x11,r2,'r+')title('ºÀ»ªÐÍÆû³

19、;µ£º²Ð²îÓëx1µÄÉ¢µãͼ')subplot(2,2,4)plot(x22,r2,'r+')title('ºÀ»ªÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µ

20、;ãͼ')得到如下圖形對比以上各圖,發(fā)現(xiàn)針對同一變量(x1或x2),兩種類型汽車所得的殘差變化趨勢不一致,說明x1、x2與x3有交互作用,即模型的缺陷是缺少二次項和交互項。8.5 對統(tǒng)一模型增加二次項和交互相進行回歸(1)增加交互項,改用模型:y=0+1x1+2x2+3x3+4x1x2+5x2x3+6x3x1進行回歸分析x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.

21、3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3 = zeros(1,length(x1),ones(1,length(x2);x1 = x1,x1;x2 = x2,x2;x1x2 = x1.*x2;x1x3 = x1.*x3;x2x3 = x2.*x3;x12 = x1.*x1;x22 = x2.*x2;y1=22.1,15.4,11.7,10.3,11.4,7.5,13,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,

22、4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;X=ones(length(x1),1),x1',x2',x3',x1x2',x2x3',x1x3'Y = y1,y2;b,bint,r,rint,s=regress(Y',X);b,bint,s得到如下結(jié)果:b = 141.1004 -57.4368 -12.5875 -65.6343 5.3855 1.7923 23.0304bint = 39.5625 242.6383 -117.0970 2.2235 -30.2968 5.1

23、218 -111.3383 -19.9303 -4.7953 15.5663 0.7050 2.8796 -4.9166 50.9774s = 0.9203 55.8474 0.0000 12.1906發(fā)現(xiàn)R2、F和s2都有所改善,模型有效的概率也有所提高,但是x1,x2的置信區(qū)間都包含0,這應當是由于引入交互項x1x3和x2x3導致的。(2)增加二次項改用模型:y=0+1x1+2x2+3x3+4x12+5x22這里不增加x32是因為它和x3一樣。將程序改為X=ones(length(x1),1),x1',x2',x3',x12',x22'得到如下結(jié)果:b = -140.9671 217.3994 -6.0022 -14.4222 -62.6018 0.2625bint = -741.4504 459.5163 -456.1560 890.9548 -9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論