回歸分析完整_第1頁
回歸分析完整_第2頁
回歸分析完整_第3頁
回歸分析完整_第4頁
回歸分析完整_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

科海拾貝—回歸分析在客觀世界中普遍存在著變量之間的關系。變量之間的關系一般來說可分為確定性的與非確定性的兩種。確定性關系是指變量之間的關系可以用函數關系來表達的。另一種非確定性的關系即所謂相關關系。例如,人的身高與體重之間存在著關系,一般來說,人高一些,體重要重一些,但同樣高度的人的體重往往不相同。人的血壓與年齡之間也存在著關系,但同年齡的人的血壓往往不相同。氣象中溫度與濕度之間的關系也是這樣。這是因為涉及的變量(如體重、血壓、濕度)是隨機變量。上面說的變量關系是非確定性的?;貧w分析是研究相關關系的一種數學方法。使用這種方法可以用一個變量取得的值去估計另一個變量所取的值,或者使用一個變量去解釋另外一個變量變化的原因。這兩個量,我們分別稱為自變量和因變量。回歸分析是數學建模的有力工具,那么我們要建立回歸分析的數學模型,需要以下幾個步驟:收集一組包含因變量和自變量的數據;選定因變量與自變量之間的模型,利用數據,按照最小二乘準則計算模型中的系數;利用統(tǒng)計分析方法對不同的模型進行比較,找出與數據擬合地最好的模型;判斷得到的模型是否適合于這組數據,診斷有無不適合回歸模型的異常數據;利用模型對因變量做出預測或解釋。注:在第二步中,選定因變量與自變量的模型時,一般是憑經驗選取模型,所以此模型又稱為經驗公式?;貧w分析主要包括一元線性回歸,多元線性回歸以及非線性回歸,這里主要是介紹一元線性回歸的MATLAB實現(xiàn)。實驗目的:了解回歸分析的基本原理,掌握MATLAB的實現(xiàn)方法;聯(lián)系實際用回歸分析方法解決實際問題。一元線性回歸模型例:用切削機床加工時,為實時地調整機床需測定刀具的磨損程度,先每隔一小時測量刀具的厚度得到以下的數據:時間(h)012345678910刀具厚度(cm)30.629.128.428.128.027.727.527.227.026.826.5試建立刀具厚度關于切削時間的回歸模型,對模型和回歸系數進行檢驗,預測15小時后刀具的厚度。分析:首先對原始數據進行觀察,確定回歸模型,然后通過計算最終確定模型和模型參數,并對模型和回歸系數進行檢驗。在進行回歸分析之前,現(xiàn)將刀具厚度和時間的關系繪圖,程序如下:>>x1=0:1:10;%定義橫坐標>>y=[30.629.128.428.128.027.727.527.227.026.826.5]';%定義縱坐標>>plot(x1,y,'+')%繪圖命令,在坐標面上用“+”描出上述坐標點運行結果:從原始數據上看,可以建立一元線性回歸模型:其中,然后,計算回歸系數,可以用MATLAB實現(xiàn)。二、一元線性回歸MATLAB實現(xiàn)1、確定回歸系數的點估計值:b=regress(y,x)其中,,2、求回歸系數的點估計和區(qū)間估計、并檢驗回歸模型:[b,bint,r,rint,stats]=regress(y,x,alpha)其中,bint為回歸系數的區(qū)間估計;r是殘差;rint是置信區(qū)間;stats是用于檢驗回歸模型的統(tǒng)計量,有四個數值:相關系數、F值、與F對應的概率P、以及方差估計誤差;alpha表示顯著性水平,缺省時為0.05相關系數越接近1,說明回歸方程越顯著;與F對應的概率P<alpha時拒絕,回歸模型成立。畫出殘差及其置信區(qū)間:rcoplot(r,rint)那么對于我們上面的例子有如下程序,計算回歸系數:>>alpha=0.05;>>x=[ones(11,1),x1'];%>>[b,bint,r,rint,stats]=regress(y,x,alpha);>>b,bint,stats,rcoplot(r,rint)運行結果:b=29.5455-0.3291Pbint=P28.976930.1140-0.4252-0.2330stats=0.869660.00180.00000.1985同時MATLAB繪出殘差圖,如下因為P<alpha,拒絕,回歸模型成立。觀察殘差分布,發(fā)現(xiàn)第一個數據(0,30.6)殘差的置信區(qū)間不包括零點,應視為異常點,將其剔除后,用剩余的數據點重新進行計算:>>alpha=0.05;>>x1=1:1:10;>>y=[29.128.428.128.027.727.527.227.026.826.5]';>>x=[ones(10,1),x1'];>>[b,bint,r,rint,stats]=regress(y,x,alpha);>>b,bint,stats,rcoplot(r,rint)運行結果:b=29.0533-0.2588bint=28.833429.2732-0.2942-0.2233stats=0.9726283.55990.00000.0195再次計算,發(fā)現(xiàn)原始數據中的第二個數據(1,29.1)殘差的置信區(qū)間也不包括零點,人將該點視為異常點,將其剔除,重新計算:>>alpha=0.05;>>x1=2:1:10;>>y=[28.428.128.027.727.527.227.026.826.5]';>>x=[ones(9,1),x1'];>>[b,bint,r,rint,stats]=regress(y,x,alpha);>>b,bint,stats,rcoplot(r,rint)運行結果:b=28.8667-0.2333bint=28.779628.9537-0.2467-0.2200stats=1.0e+003*0.00101.71500.00000.0000這次的數據殘差的置信區(qū)間全部包括零點,無異常點。對比分析:對比剔除前后的變化,發(fā)現(xiàn)置信區(qū)間明顯縮小,相關系數和F都明顯變大,表明異常點的剔除有利于更好的建立模型。于是,就可以輸出最終計算結果和圖形(上述程序的最后運行結果中的b即為最后輸出的b,即一元線性回歸模型中的未知參數),程序如下:>>x1=0:1:10;>>y=[30.629.128.428.128.027.727.527.227.026.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論