第八講MATLAB中多元線性回歸_第1頁(yè)
第八講MATLAB中多元線性回歸_第2頁(yè)
第八講MATLAB中多元線性回歸_第3頁(yè)
第八講MATLAB中多元線性回歸_第4頁(yè)
第八講MATLAB中多元線性回歸_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2.線性回歸b=regress(y,X)b,bint,r,rint,s=regress(y,X,alpha)輸入:y因變量(列向量),X1與自變量組成的矩陣, Alpha顯著性水平a (缺省時(shí)設(shè)定為0.05) 輸出:b= ( Bo點(diǎn),bint: b的置信區(qū)間,:殘差(列向量),rint:啲置信區(qū)間s: 3個(gè)統(tǒng)計(jì)量:決定系數(shù)人2, F值,耳1小2)分布大于 F值的概率P,pva時(shí)回歸模型有效'rcoplot(r,rint)殘差及其置信區(qū)間作圖序號(hào)血 壓年齡體重 指數(shù)序 號(hào)血 壓年齡體重 指數(shù)煙慣 吸習(xí)11443924.20211363625.0022154731.11221425026.

2、2131384522.60231203923.50 101545619.30301756927.41回歸模型 例3:血壓與年齡、體重指數(shù)、吸煙習(xí)慣體重指數(shù)二體重(kg) /身高(m)的平方 吸煙習(xí)慣:0表示不吸煙,1表示吸煙建立血壓與年齡、體重指數(shù)、吸煙習(xí)慣之間的回歸模型模型建立血壓y,體重指數(shù)X2,吸煙習(xí)慣X3y與X?的散點(diǎn)圖y與x的散點(diǎn)圖線性回歸模型y = 00 + 0X + 02兀2 + 03兀3 +£回歸系數(shù)00, 01, 02,爲(wèi)由數(shù)據(jù)估計(jì),疑隨機(jī)誤差n=30;m=3;y=i44215138145162142170124158154 162 1501401101281301

3、35114116124 136 142120120160158144130125175;xl=39474547654667426756 64565934424845182019 36503921445363292569;x2=24.2 31.1 22.6 24.0 25.9 25.1 29.5 19.7 27.2 19.3 2&0 25.8 27.320.1 21.7 22.2 27.4 18.8 22.6 21.5 25.0 26.2 23.5 20.3 27.1 28.6 28.3 22.0 25.3 27.4;x3=0101101010100001 0 0 0.001001101

4、0 1;X=ones(n,l)? xT,x2',x3'bbint rint,s=regress(y1 ,X); s2=sum(r.A 2)/(n-m-1);b,bint,s,s2rcoplot(r9rint)模型求解xueyaO1.m剔除異常點(diǎn)(第2點(diǎn)和第10點(diǎn))后回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間AAliA45.36360.36043.090611.82463.55377.1736-0.0758 0.7965 1.0530 5.1281-0.1482 23.7973R2= 0.6855 F= 18.8906 p<0.0001 s2 =169.7917回歸系數(shù)回歸系數(shù)

5、估計(jì)值回歸系數(shù)置信區(qū)間AAliA58.51010.43032.344929.90647.11380.1273 0.73320.8509 3.838910.30653.3878 17.2253R2= 0.8462 F= 44.0087 p<0.0001 s2 =53.6604y = 5&5101+0.430丸 + 2.344% +10.306%6050403020100-10-20-30-40Residual Case Order Plot51015202530Case Number此時(shí)可見(jiàn)第二與第十二個(gè)點(diǎn)是異常點(diǎn),于是刪除上述兩點(diǎn),再次進(jìn)行回歸得到改進(jìn)后的回歸模型的系 數(shù)、系數(shù)置

6、信區(qū)間與統(tǒng)計(jì)量回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間例58.510129.9064 87.11380.43030.1273 0.73322.34490.8509 3.838910.30653.3878 17.2253R2= 0.8462 F= 44.0087 pvO.OOOl s2 =53.6604這時(shí)置信區(qū)間不包含零點(diǎn),F(xiàn)統(tǒng)計(jì)量增大,可決系 數(shù)從0.6855增大到0.8462 ,我們得到回歸模型為:$ = 58.5101+0.430% + 2.344%+10.3065r3通常,進(jìn)行多元線性回歸的步驟如下:(1) 做自變量與因變量的散點(diǎn)圖,根據(jù)散點(diǎn)圖的形 狀決定是否可以進(jìn)行線性回歸;(2) 輸

7、入自變量與因變量;(3) 利用命令:b,bint«int,s=regress(y,X,alpha), rcoplot(rrint) 得到回歸模型的系數(shù)以及異常點(diǎn)的情況;(4) 對(duì)回歸模型進(jìn)行檢驗(yàn)首先進(jìn)行殘差的正態(tài)性檢驗(yàn):jbtest, ttest其次進(jìn)行殘差的異方差檢驗(yàn):戈德菲爾德一匡特 (GoldfeldQuandt)檢驗(yàn)戈德菲爾德檢驗(yàn),簡(jiǎn)稱為G-Q檢驗(yàn)為了檢驗(yàn)異方差 性,將樣本按解釋變量排序后分成兩部分,再利用樣 本1和樣本2分別建立回歸模型,并求出各自的殘差平 方和RSS1和RSS2O如果誤差項(xiàng)的離散程度相同(即為 同方差的),貝URSS1和RSS2的值應(yīng)該大致相同;若兩 者之間存在顯著差異,則表明存在異方差檢驗(yàn)過(guò)程 中為了 “夸大”殘差的差異性,一般先在樣本中部去 掉C個(gè)數(shù)據(jù)(通常取c=n/4),再利用F統(tǒng)計(jì)量判斷差 異的顯著性:下面我們對(duì)模型進(jìn)行檢驗(yàn):(1)殘差的正態(tài)檢驗(yàn):由jbtest檢驗(yàn),h=0表明殘差服從正態(tài)分布,進(jìn)而由t檢 驗(yàn)可知h=0, p=l,故殘差服從均值為零的正態(tài)分布;(2)殘差的異方差檢驗(yàn):我們將28個(gè)數(shù)據(jù)從小到大排列,去掉中間的6個(gè)數(shù)據(jù),得到F統(tǒng)計(jì)量的觀測(cè)值為:f =1.9092,由F(7,7)=379,可知:f=1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論