概率論與數(shù)理統(tǒng)計課程設(shè)計-一元線性回歸分析_第1頁
概率論與數(shù)理統(tǒng)計課程設(shè)計-一元線性回歸分析_第2頁
概率論與數(shù)理統(tǒng)計課程設(shè)計-一元線性回歸分析_第3頁
概率論與數(shù)理統(tǒng)計課程設(shè)計-一元線性回歸分析_第4頁
概率論與數(shù)理統(tǒng)計課程設(shè)計-一元線性回歸分析_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)摘要數(shù)理統(tǒng)計是具有廣泛應(yīng)用的數(shù)學(xué)分支,而區(qū)間估計和假設(shè)檢驗問題在其中占有很重要的地位。對于正態(tài)總體期望和方差的區(qū)間估計和假設(shè)檢驗問題已有完備的結(jié)論;對于非正態(tài)總體期望和方差的區(qū)間估計和假設(shè)檢驗問題,在大樣本的情況下,可利用中心極限定理轉(zhuǎn)化為正態(tài)總體來解決。但實際問題中常常碰到非正態(tài)總體,而且是小樣本的情況,因此對它的區(qū)間估計和假設(shè)檢驗是一個值得研究的問題本文利用概率綸與數(shù)理統(tǒng)計中的所學(xué)的回歸分析知識,對用切削機(jī)房進(jìn)行金屬品加工時為了適當(dāng)?shù)卣{(diào)整機(jī)床,測量刀具的磨損速度與測

2、量刀具的厚度間的關(guān)系建立數(shù)學(xué)模型,利用這些數(shù)據(jù)做出刀具厚度關(guān)于時間的線性回歸方程,并MATLAB 與EXCEL軟件對驗數(shù)據(jù)進(jìn)行分析處理,得出線性回歸系數(shù)與擬合系數(shù)等數(shù)據(jù),并用F檢驗法檢驗了方法的可行性,同時用分布參數(shù)置信區(qū)間和假設(shè)檢驗問題 ,得出了刀具厚度關(guān)于時間的線性關(guān)系顯著,并進(jìn)行了深入研究,提出了小樣本常用分布參數(shù)的置信區(qū)間與假設(shè)檢驗的解決方法。關(guān)鍵詞:統(tǒng)計量法;置信區(qū)間;假設(shè)檢驗;線性關(guān)系;回歸分析目錄 TOC o 1-3 h z u 一設(shè)計目的了解一元回歸方程,回歸系數(shù)的檢驗方法及應(yīng)用一元回歸方程進(jìn)行預(yù)測的方法;學(xué)會應(yīng)用MATLAB軟件進(jìn)行一元回歸實驗的分析方法。同時更好的了解概率論

3、與數(shù)理統(tǒng)計的知識,熟練掌握概率論與數(shù)理統(tǒng)計在實際問題上的應(yīng)用,并將所學(xué)的知識結(jié)合Excel對數(shù)據(jù)的處理解決實際問題。本設(shè)計是利用一元線性回歸理論對用切削機(jī)房進(jìn)行金屬品加工時為了適當(dāng)?shù)卣{(diào)整機(jī)床,測量刀具的磨損速度與測量刀具的厚度間的關(guān)系建立數(shù)學(xué)模型,并用Excel分析工具庫中的回歸分析軟件進(jìn)行解算。二設(shè)計問題 用切削機(jī)床進(jìn)行金屬加工時,為了適當(dāng)?shù)卣{(diào)節(jié)機(jī)床,需要測定刀具的磨損速度。在一定時間(例如每隔一小時)測量刀具的厚度,得到數(shù)據(jù)如下:切削時間刀具厚度切削時間刀具厚度030.01524.8129.11624.0228.41723.7328.11823.1428.01922.9527.72022.

4、6627.52122.3727.22222.1827.02321.7926.82421.51026.52521.31126.32621.01226.12720.61325.72820.31425.32920.1 由此,我們利用這些數(shù)據(jù)做出刀具厚度關(guān)于時間的線性回歸方程。三設(shè)計原理在實際問題中,經(jīng)常會出現(xiàn)兩個變量之間的相關(guān)關(guān)系不是線性的(即直線型),而是非線性的(即曲線型)。設(shè)其中有兩個變量與,我們可以用一個確定函數(shù)關(guān)系式:大致的描述與之間的相關(guān)關(guān)系,函數(shù)稱為關(guān)于的回歸函數(shù),方程成為關(guān)于的回歸方程。一元線性回歸處理的是兩個變量與之間的線性關(guān)系,可以設(shè)想的值由兩部分構(gòu)成:一部分由自變量的線性影響所

5、致,表示的線性函數(shù) ;另一部分則由眾多其他因素,包括隨機(jī)因素的影響所致,這一部分可以視為隨機(jī)誤差項,記為??傻靡辉€性回歸模型 (1)式中,自變量是可以控制的隨機(jī)變量,成為回歸變量;固定的未知參數(shù)a,b成為回歸系數(shù);稱為響應(yīng)變量或因變量。由于是隨機(jī)誤差,根據(jù)中心極限定理,通常假定,是未知參數(shù)。確定與之間的關(guān)系前,可根據(jù)專業(yè)知識或散點圖,選擇適當(dāng)?shù)那€回歸方程,而這些方程往往可以化為線性方程或者就是線性方程,因此我們可以用線性方程:大致描述變量與之間的關(guān)系;1)模型回歸系數(shù)的估計為了估計回歸系數(shù),假定試驗得到兩個變量 與 的 個數(shù)據(jù)對我們將這對觀測值代入式(1),得 這里互獨立的隨機(jī)變量,軍服從

6、正態(tài)分布,即 回歸系數(shù)估計的方法有多種,其中使用最廣泛的是最小二乘法,即要求選取的, 的值使得述隨機(jī)誤差 的平方和達(dá)到最小,即求使得函數(shù) 取得最小值的,。由于是,的二元函數(shù),利用微積分中的函數(shù)存在極值的必要條件,分別對求,偏導(dǎo)數(shù),并令其為0,構(gòu)成二元一次方程組,化簡后得到如下正規(guī)方程組 a解方程組得到總體參數(shù)估計量,這里, 均已有的觀測數(shù)據(jù)。由此得到回歸方程帶入觀測,得到值稱為回歸預(yù)測值。方程的直線稱為回歸直線。2)回歸方程顯著性檢驗建立一元線性回歸方程當(dāng)且僅當(dāng)變量之間存在線性相關(guān)關(guān)系時才是有意義的,因此必須對變量之間的線性相關(guān)的顯著性進(jìn)行檢驗,即對建立的回歸模型進(jìn)行顯著性檢驗。我們首先引入幾

7、個概念:,稱為總偏差平方和,它表示觀測值總的分散程度;,稱為回歸平方和,它是由回歸變量的變化引起的,放映了回歸變量對變量線性關(guān)系的密切程度;,稱為殘差(剩余)平方和,它是由觀測誤差等其他因素起誤差,它的值越小說明回歸方程與原數(shù)據(jù)擬合越好??梢宰C明下列關(guān)系成立 即 =+ 我們主要考慮回歸平方和在總偏差和中所占的比重,記。(0=R F(1,n-2),則認(rèn)為y與x之間的線性關(guān)系顯著;如果F= F(1,n-2),則認(rèn)為y與x之間的線性關(guān)系不顯著,或者不存在線性關(guān)系,在實際應(yīng)用中也可以通過F對應(yīng)的概率P y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8

8、26.5 26.3 26.1 25.7 25.3 24.8 24.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29; plot(x,y,*)生成圖(1),可以看出x和y大體成線性關(guān)系。圖 SEQ 圖 * ARABIC 1 散點圖(橫軸:X 縱軸Y)(2)作一元回歸分析,輸入: n=length(y); X=ones(n,1),x; b,bint,r

9、,rint,s=regress(y,X); b,bint,sb = 29.5501 -0.3329bint = 29.3326 29.7676 -0.3458 -0.3200s = 1.0e+003 *0.0010 2.8019 0 0.0001這個結(jié)果可整理成表1的形式?;貧w系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間29.550129.3326,29.7676-0.3329-0.3458,-0.3200 表 SEQ 表 * ARABIC 1 MATLAB回歸分析結(jié)果表一元回歸方程為: 從幾個方面都可以檢驗?zāi)P褪怯行У模簷z驗-接近于0;的置信區(qū)間不含零點;用MATLAB命令finv(0.95,1,28

10、)計算得到,F(xiàn)為統(tǒng)計量觀測值,所以X與Y的相關(guān)性顯著。殘差及其置信區(qū)間作圖代碼輸入:rcoplot(r,rint)結(jié)果如圖2所示:圖 SEQ 圖 * ARABIC 2 殘差圖(橫軸:削磨時間 縱軸:殘差分析值)所謂殘差是指實際觀察值與回歸估計值的差,殘差分析就是通過殘差所提供的信息,分析出數(shù)據(jù)的可靠性、周期性或其它干擾。從殘差圖可以看出,數(shù)據(jù)的殘差離零點較近,且殘差的置信區(qū)間均包含零點,這說明回歸模型能很好的符合原始數(shù)據(jù)。(3)講上面的回歸系數(shù)估計值,帶入回歸方程,刀具磨損速度的測試中,對時間間隔為30/h的刀具厚度進(jìn)行預(yù)測,得到 。在,刀具的厚度預(yù)測區(qū)間簡化為,輸入計算指令: t1=19.5

11、631-norminv(0.0975,0,1)*sqrt(sum(r.2)/16)t1 = 20.0742 t2=19.5631+norminv(0.0975,0,1)*sqrt(sum(r.2)/16)t2 = 19.0520即時間間隔為30/h的刀具磨損速度測試中,刀具厚度的置信度為0.95的預(yù)測區(qū)間為。也可以用命令: y=30 29.1 28.4 28.1 28.0 27.7 27.5 27.2 27.0 26.8 26.5 26.3 26.1 25.7 25.3 24.8 24.0 23.7 23.1 22.9 22.6 22.3 22.1 21.7 21.5 21.3 21.0 20

12、.6 20.3 20.1; x=0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29; polytool(x,y,1,0.05)作出散點圖及擬合曲線,并對時的y進(jìn)行預(yù)報,結(jié)果如圖 3 所示。圖 SEQ 圖 * ARABIC 3 散點圖及擬合曲線 如圖3所示,紅線表示為數(shù)據(jù)離合區(qū)間,藍(lán)色“+”表示為數(shù)據(jù)散點分布,綠色表示為擬合曲線。(4)下面用Excel“分析工具庫”提供的“回歸”工具,找出線性回歸方程,并檢驗其顯著性。1、具體步驟如下:1在【工具】菜單中選中【數(shù)據(jù)分析】,則會彈出【數(shù)據(jù)分析

13、】對話框,然后“分析工具”中選擇“回歸”選項,如圖二所示。單擊【確定】后,則彈出【回歸】對話框,如圖所示。2填寫【回歸】對話框。如圖所示,該對話框的內(nèi)容較多,可以根據(jù)需要,選擇相關(guān)項目。在“X值輸入?yún)^(qū)域”內(nèi)輸入隊因變量數(shù)據(jù)區(qū)域的引用,該區(qū)域必須有單列數(shù)據(jù)組成,如本題中組分B;在“Y只輸入?yún)^(qū)域”輸入對自變量數(shù)據(jù)區(qū)域的引用,如本題中組分C?!皹?biāo)志” :如果輸入?yún)^(qū)域的第一行中包含標(biāo)志項,則選中此復(fù)選框,本題中的輸入?yún)^(qū)域包含標(biāo)志項;如果在輸入?yún)^(qū)域中沒有標(biāo)志項,則應(yīng)清楚此復(fù)選框,Excel將在輸出表中生成合適的數(shù)據(jù)標(biāo)志?!爸眯哦取?:如果需要在匯總輸出表中包含附件的置信度信息,則選中此復(fù)選框,然后在右側(cè)

14、的編輯框中,輸入所要使用的置信度。Excel默認(rèn)的置信度為95%,相當(dāng)于顯著性水平a=0.05?!俺?shù)為零” :如果要強(qiáng)制回歸線通過原點,則選中此復(fù)選框?!拜敵鲞x項” :選擇“輸出區(qū)域”,在此輸出對輸出表左上角單元格的引用。3“殘差” :如果需要以殘差輸出表形式查看殘差,則選中此復(fù)選框。“標(biāo)準(zhǔn)殘差” :如果需要在殘差輸出表中包含標(biāo)準(zhǔn)殘差,則選中此復(fù)選框?!皻埐顖D” :如果需要生成一張圖表,繪制每個自變量及其殘差,則選中此復(fù)選框?!熬€性擬合圖” :如果需要為預(yù)測值和觀察值生成和觀測值生車一個圖表,則選中此復(fù)選框。“正態(tài)概率圖” :如果需要繪制正態(tài)概率圖,則選中此復(fù)選框。圖 SEQ 圖 * ARA

15、BIC 4 散點圖 圖 SEQ 圖 * ARABIC 5 Excel數(shù)據(jù)分析工具 圖Excel數(shù)據(jù)分析工具圖 SEQ 圖 * ARABIC 6 回歸分析工具界面回歸分析工具運(yùn)行結(jié)果: Multiple R0.R Square0.Adjusted R Square0.標(biāo)準(zhǔn)誤差0.觀測值30表 SEQ 表 * ARABIC 2 回歸統(tǒng)計 表2中,“Multiple R”是線性回歸的系數(shù)“R Square”是擬合系數(shù)“Adjusted R Square” 調(diào)整后的擬合系數(shù)。dfSSMSFSignificance F回歸分析1249.0449249.04492801.8981.29E-29殘差282.

16、0.總計29251.5337表 SEQ 表 * ARABIC 3 方差分析Coefficients標(biāo)準(zhǔn)誤差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept29.550110.278.25759.73E-5029.3325729.7676429.3325729.76764X Variable 1-0.332880.-52.9331.29E-29-0.34576-0.32-0.34576-0.32表 SEQ 表 * ARABIC 4 回歸分析結(jié)果1 RESIDUAL OUTPUTPROBABILITY OUTPUT觀測值預(yù)測 Y殘差標(biāo)

17、準(zhǔn)殘差百分比排位Y129.550110.1.1.20.1229.21723-0.11723-0.40016520.3328.88435-0.48435-1.653348.20.6428.55146-0.45146-1.541111.6666721528.21858-0.21858-0.746151521.3627.8857-0.1857-0.6339118.3333321.5727.55282-0.05282-0.1803121.6666721.7827.21994-0.01994-0.068072522.1926.887060.112940.28.3333322.31026.554180.0

18、.31.6666722.61126.22130.0.3522.91225.888420.1.38.3333323.11325.555540.1.8585641.6666723.71425.222650.1.45241524.889770.1.48.3333324.81624.556890.0.8298651.6666725.31724.22401-0.22401-0.764685525.71823.89113-0.19113-0.6524458.3333326.11923.55825-0.45825-1.5642661.6666726.32023.22537-0.32537-1.1106765

19、26.52122.89249-0.29249-0.9984268.3333326.82222.55961-0.25961-0.8861871.66667272322.22673-0.12673-0.432597527.22421.89385-0.19385-0.661778.3333327.52521.56096-0.06096-0.208181.6666727.72621.228080.0.85282720.89520.0.88.3333328.12820.562320.0.91.6666728.42920.229440.070560.240869529.13019.896560.0.98.

20、3333330表 SEQ 表 * ARABIC 5 回歸分析結(jié)果 殘差與標(biāo)準(zhǔn)殘差觀測值預(yù)測 Y殘差129.550110.229.21723-0.11723328.88435-0.48435428.55146-0.45146528.21858-0.21858627.8857-0.1857727.55282-0.05282827.21994-0.01994926.887060.112941026.554180.1126.22130.1225.888420.1325.555540.1425.222650.1524.889770.1624.556890.1724.22401-0.224011823.8

21、9113-0.191131923.55825-0.458252023.22537-0.325372122.89249-0.292492222.55961-0.259612322.22673-0.126732421.89385-0.193852521.56096-0.060962621.228080.2720.89520.2820.562320.2920.229440.070563019.896560.表 SEQ 表 * ARABIC 6 回歸分析結(jié)果3圖 SEQ 圖 * ARABIC 8 EXCEL處理數(shù)據(jù)得出的散點圖圖 SEQ 圖 * ARABIC 9 用EXCEL處理數(shù)據(jù)得出的殘差分布圖由表3所知,若保留四位有效數(shù)字,該回歸方程的截距是29.5501,斜率為-0.3329,所以回歸方程的表達(dá)式為:;根據(jù)回歸統(tǒng)計結(jié)果,知決定系數(shù)=0.9898,即相關(guān)系數(shù)r=0.9231,說明自變量與因變量之間有較高的相關(guān)性;根據(jù)方差分析的結(jié)果,F(xiàn)=2801.9,有效的F0.01,所以建立的回歸方程非常顯著。在表五中,除了列出了回歸系數(shù),還有標(biāo)準(zhǔn)誤差等項目。其中“標(biāo)準(zhǔn)誤差”表示的事對應(yīng)回歸系數(shù)的標(biāo)準(zhǔn)誤差,其中偏回歸系數(shù)的標(biāo)準(zhǔn)誤差?!皌 Stat

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論