北航數(shù)理統(tǒng)計回歸分析大作業(yè)_第1頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)_第2頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)_第3頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)_第4頁
北航數(shù)理統(tǒng)計回歸分析大作業(yè)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

學(xué)專1995-2012年的財政收入為因變量,選取了8個可能的影響因素,選用逐步回歸法對各影響因素進行了篩選分析,最終確定了其“最優(yōu)”回歸方程。關(guān)鍵字:多元線性回歸逐步回歸法財政收入SPSS1引言踐、指導(dǎo)實踐的科學(xué)方法。政收入的充裕狀況。之間的關(guān)系,總結(jié)主要影響因素,并對其作用、前景進行分析和展望。2多元線性回歸2.1多元線性回歸簡介行處理的。對多元線性回歸模型簡要介紹如下:如果隨機變量y與m(m2)個普通變量x,xx有關(guān),且滿足關(guān)系式:12mxmyxx01122mED(2.1)2其中,,,,是與x,xx無關(guān)的未知參數(shù),是不可觀測的2012m12m隨機變量,~N(0,I)。2N1式(2.1)為m元理論線性回歸模型,其中,,為回歸系數(shù),012mx,xx為回歸因子或設(shè)計因子。(,)實際上反映了因子im12mixi,)對觀測值y的作用,因此也稱m(,)為因子imiixi,)的效應(yīng)。mi(,)進行最小二乘估計后,可以得到m元經(jīng)驗通過對回歸系數(shù)imi回歸方程為:?????yxxx01122mm(2.2)????也稱式(2.2)為m元線性回歸方程。,稱012m為回歸系數(shù)。2.2逐步回歸法行篩選。本次選用的方法是逐步回歸法。1)回歸效果的顯著性檢驗y與變量x,xx線性相關(guān)的密切程度可以用回歸平方和U在總平方和L12myyU中所占的比例來衡量。稱R為y關(guān)于x,xx的樣本復(fù)相關(guān)系數(shù),L12myyUR2Lyy回歸方程對原有數(shù)據(jù)擬合程度的好壞。顯然0R21,其越接近1,回歸方程擬合程度越高。2)偏F檢驗檢驗?zāi)硞€自變量對y的影響是否顯著的正規(guī)方法是偏F檢驗。設(shè)原回歸方程(全模型)為:????????xxxxyxx01122i1i1iii1i1mm2去掉變量x后的新回歸方程(減模型)為:i???????xxxyxx01122i1i1i1i1mm全模型的復(fù)相關(guān)系數(shù)的平方為R2,減模型的復(fù)相關(guān)系數(shù)的平方為R,定義2iRRR。若R幾乎為零,則說明x對y沒有顯著影響,反之則表示x2222iii對y有其它變量不可替代的顯著影響。檢驗假設(shè):H:RH:R0220i1i當H為真時,檢驗統(tǒng)計量為0?R22F~FnmiiR)/(nmSci22ii對于給定顯著性水平FFFnm則拒ii絕H,說明x對y有顯著影響,應(yīng)在減模型中引入自變量x;反之則應(yīng)剔除x,0使之成為減模型。偏FF法進行檢驗的。3)逐步回歸法的步驟F檢驗量從回歸模型中剔除。具體步驟如下:??(0)1、對m個自變量分別與y建立回歸模型?,對它們分別計算xi(0)i0iF,得F中最大的那個值,比如F。ii1(Ⅰ)如果FF,則計算結(jié)束,即y與所有自變量均線性無關(guān);進1(Ⅱ)如果FF,則引入x,建立回歸方程進11???(2.3)y0x1132、建立y與自變量子集{x,x}(iL)的二元回歸模型Li11???(0)i?xx(2.4)(0)i0(0)1Li1以式(2.4)(2.3)為減模型求FFii如說F。L2⑴如果FF,則計算結(jié)束,這時建立的模型為式(2.3);L進2⑵如果FF,則引入x,建立回歸方程L進L22???(2)2?xx(2.5)(2)0(2)1L213、當引入x后,對x做偏F檢驗,看x是否需要剔除;LLL211⑴如果FF,則不剔除x,并繼續(xù)引入下一個變量;L出L11⑵如果FF,則從式2.4中剔除x,再繼續(xù)引入下一個變量。L出L11剔除為止。3財政收入回歸分析實例本次作業(yè)利用SPSS軟件和逐步回歸法,對原始數(shù)據(jù)進行了回歸分析,并最終獲得了最優(yōu)回歸方程,解決這個問題。3.1數(shù)據(jù)收集及處理人口數(shù)(萬人)等。本文從中選取了國內(nèi)生產(chǎn)總值(億元),人口數(shù)(萬人),能源生產(chǎn)總量(標準煤)(萬噸),農(nóng)作物總播種面積(千公頃),貨運量(萬噸),出口總額(億元),進口總額億元,建筑業(yè)總產(chǎn)值(億元)8個因素作1所示為所選取的自1995年至2012年18年間財政收入與所選變量的數(shù)據(jù)匯總。483427485374945384558139.31.013.2建立回歸模型過程為了研究財政收入與各種影響因素的關(guān)系,必須要建立二者之間的數(shù)學(xué)模型。數(shù)學(xué)模型可以有多種形式,比如線性模型,二次模型,指數(shù)模型,對數(shù)模型了便于研究,我們可以建立財政收入與各影響因素的線性回歸模型,模型如下:αXαX2+αXαXαXαXαXαX112334455667788其中,Y是因變量,X是自變量,是各個自變量的系數(shù)。各變量符號的定ii義見表2。Y83.3線性回歸模型的驗證6))))))7))1)財政收入與國內(nèi)生產(chǎn)總值散點圖;(23)財政收入與能源生產(chǎn)總量;(45)財政收入與貨運量散點圖;(67)財政收入與進口總額散點圖;(8圖1逐步分析方法進行進一步的顯著性判斷。3.4線性回歸的結(jié)果及分析利用統(tǒng)計數(shù)據(jù)建立回歸模型,用SPSS軟件的線性回歸分析功能,得到以下8表3輸入移去的變量輸入的變量移去的變量步進(準則:F-to-enter的概率<=.050,1F-to-remove的概率>=.100)。步進(準則:F-to-enter的概率<=.050,F(xiàn)-to-remove的概率>=.100)。步進(準則:F-to-enter的概率<=.050,F(xiàn)-to-remove的概率>=.100)。a.因變量:財政收入表4顯示三個模型的擬合情況,模型3的復(fù)相關(guān)系數(shù)R=1.000,可決系數(shù)R2=0.999,調(diào)整可決系數(shù)為0.999,估計值的標準差為916.74710,可見模型3的擬合度較高。RR標準估計的誤差21615.379291163.51991916.74710a.預(yù)測變量:(常量),貨運量(萬噸)b.預(yù)測變量:常量),),國內(nèi)生產(chǎn)總值(億元)c.預(yù)測變量:(常量),),能源生產(chǎn)總量(萬噸)d.因變量:財政收入(億元)從表5中看出方差分析結(jié)果可以看出,三個模型的值檢驗Sig值遠小于0.01,可見,最終模型的整體線性關(guān)系是成立的。9FSig..000a11161722.046E101.023E10.000b.000c1353778.5862.047E106.823E9840425.252如表6所示,包含的是進入模型的變量,主要描述模型的參數(shù)估計值,以及t檢驗Sig值都接近或小于0.010,因此,最終的回歸效果很好。tSig..000B(常量)1.999.000.000.000.001.103.0263.980(常量).003.002.000貨運量(萬噸)能源生產(chǎn)總量(萬噸)-.124-3.188.007tSig..000B1貨運量(萬噸)(常量).000.000.000.001.103.0263.980(常量).003.002.000.176.031-.060.019-.124-3.188.007a.因變量:財政收入(億元)如表7t檢驗的Sig值都大于0.1,這些變量對模型的貢獻都不明顯,所以它們都不包含在最終方程中。共線性統(tǒng)計量t.006.061.092.064.002.027.034.369.073.088.848.007.283.446.427-.050-.649-.2862出口總額(億元)3a.模型中的預(yù)測變量:(常量),貨運量(萬噸)b.模型中的預(yù)測變量:(常量),貨運量(萬噸),國內(nèi)生產(chǎn)總值(億元)N5652.1587116279.0000-1919.03113-.952圖2圖4從圖4在垂直圍繞的范圍內(nèi),預(yù)測值與標準化殘差值之間沒有明顯的關(guān)系,所以回歸方程應(yīng)該滿足線性關(guān)系與方差齊性的假設(shè)且擬和效果較好。3.5最優(yōu)回歸方程由以上多元回歸分析可得各個分量的影響關(guān)系,從而得出最優(yōu)方程為:Y=-15515.418+0.176X-0.060X+0.015X135其中R=0.999,F(xiàn)=8117.9992X代表國內(nèi)生產(chǎn)總值,X代表能源生產(chǎn)總量,X代表貨運量135代入2011年數(shù)據(jù),可得Y=-15515.418+0.176×473104.0-0.060×317987+0.015×3696961=104126.0820112008年實際財政收入為103874.43(億元)可算得誤差為e=(104126.081-103874.43)/103874.43×100%=0.24%,在可接受誤差范圍之內(nèi),可見擬合效果能夠滿足要求。4結(jié)論在本次作業(yè)中,結(jié)合過去的經(jīng)驗和學(xué)習(xí)結(jié)果,我選擇了影響財政收入的8個因素,通過查閱2013中國統(tǒng)計年鑒,利用IBMSPSSStatistics19.0軟件對所最終發(fā)現(xiàn)所選8個因素中有6個因素與國民總收入之間的的散點圖呈現(xiàn)良好的線很明顯。了主要、次要原因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論