北航數(shù)理統(tǒng)計(jì) 多元線性回歸分析_第1頁
北航數(shù)理統(tǒng)計(jì) 多元線性回歸分析_第2頁
北航數(shù)理統(tǒng)計(jì) 多元線性回歸分析_第3頁
北航數(shù)理統(tǒng)計(jì) 多元線性回歸分析_第4頁
北航數(shù)理統(tǒng)計(jì) 多元線性回歸分析_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

TOC\o"1-3"\h\u應(yīng)用數(shù)理統(tǒng)計(jì)多元線性回歸分析(第一次作業(yè))學(xué)院:姓名:學(xué)號:TOC\o"1-3"\h\u293251.引言 II)如果L1<出,則從模型中剔除XL1,再繼續(xù)引入下一個(gè)變量。重復(fù)上述步驟,直到所有模型外的變量都不能引入,模型內(nèi)的變量都不能被剔除為止。模型建立國內(nèi)生產(chǎn)總值作為國民經(jīng)濟(jì)核算的核心指標(biāo),與眾多因素相關(guān)。以下選取了居民消費(fèi)價(jià)格指數(shù)、城鄉(xiāng)居民人民幣儲蓄存款年底余額、能源生產(chǎn)總量、進(jìn)出口總額、農(nóng)林牧漁業(yè)增加值、工業(yè)增加值、總?cè)丝谶@七個(gè)因素對國名生產(chǎn)總值進(jìn)行多元線性回歸分析。3.1符號說明變量符號居民消費(fèi)價(jià)格指數(shù)(上年=100)城鄉(xiāng)居民人民幣儲蓄存款年底余額/億元能源生產(chǎn)總量/萬噸標(biāo)準(zhǔn)煤進(jìn)出口總額/億元農(nóng)林牧漁業(yè)增加值/億元工業(yè)增加值/億元總?cè)丝?萬人國內(nèi)生產(chǎn)總值/億元3.2數(shù)據(jù)的收集與整理本文所用數(shù)據(jù)均來源于《中國統(tǒng)計(jì)年鑒》(2015年),選取1995年-2014年數(shù)據(jù)作為回歸模型樣本。數(shù)據(jù)見表1所示。表12005年-2014年各變量數(shù)據(jù)x1x2x3x4x5x6x7y年份居民消費(fèi)價(jià)格指數(shù)(上年=100)城鄉(xiāng)居民人民幣儲蓄存款年底余額/億元能源生產(chǎn)總量/萬噸標(biāo)準(zhǔn)煤進(jìn)出口總額/億元農(nóng)林牧漁業(yè)增加值/億元工業(yè)增加值/億元總?cè)丝?萬人國內(nèi)生產(chǎn)總值/億元1995117.129662.3060987.0523499.9012134.724887.212112161129.81996108.338520.8089239.8024133.8014014.129372.712238971572.31997102.846279.80109876.9026967.2014440.132837.712362679429.5199899.253407.47112567.8026849.7014815.633931.912476184883.7199998.659621.83123643.9829896.3014767.835770.312578690187.72000100.464332.38138569.7039273.2014942.439931.812674399776.32001100.773762.43147424.9942183.6015778.643469.8127627110270.4200299.286910.65156277.0151378.2016534.047310.7128453121002.02003101.2103617.65178298.7870483.5017378.654805.8129227136564.62004103.9119555.39206107.7395539.1021408.165044.2129988160714.42005101.8141050.99229036.72116921.8022412.977034.4130756185895.82006101.5161587.30244762.87140974.0024032.291078.8131448217656.2007104.8172534.19264172.55166863.7028618.6110253.9132129268019.42008105.9217885.35277419.41179921.4733692.7129929.1132802316751.200999.3260771.66286092.22150648.0635215.3135849.0133450345629.22010103.3303302.50312124.75201722.1540521.8162376.4134091408903.2011105.4343635.89340177.51236401.9547472.9191570.8134735484123.52012102.6399551.04351040.75244160.2052358.8204539.5135404534123.02013102.6447601.60358783.76258168.9056966.0217263.9136072588018.82014102.0485261.34360000.00264334.4960158.0228122.9136782636138.74.數(shù)據(jù)處理與分析本文基于表1數(shù)據(jù)樣本建立多元線性回歸模型并進(jìn)行檢驗(yàn),研究思路為:首先對解釋變量進(jìn)行相關(guān)性分析篩選主要影響因素,然后利用逐步回歸法,取顯著性水平采用SPSS軟件對回歸系數(shù)進(jìn)行估計(jì),最后從回歸方程顯著性、擬合度以及殘差三個(gè)方面對模型進(jìn)行檢驗(yàn),證實(shí)模型的有效性。4.1初步確定理論回歸模型研究指標(biāo)變量與各個(gè)解釋變量的相關(guān)性可以利用散點(diǎn)圖直觀分析剔除相關(guān)性不顯著的因素,也可以利用SPSS軟件直接計(jì)算Pearson相關(guān)系數(shù)篩選主要影響因素。本文利用SPSS軟件計(jì)算各因素相關(guān)系數(shù)如表2所示。表SEQ表\*ARABIC2各影響因素與指標(biāo)變量的相關(guān)系數(shù)相關(guān)系數(shù)可以數(shù)值的方式精確的反應(yīng)兩個(gè)變量間線性關(guān)系的強(qiáng)弱,樣本相關(guān)系數(shù)為r,|r|>0.8時(shí)認(rèn)為高度相關(guān),0.5<|r|<0.8中度相關(guān),0.3<|r|<0.5低度相關(guān),|r|<0.3相關(guān)程度極弱,可視為不相關(guān)。從表2中可知因變量y與都是高度相關(guān),而與中度相關(guān)。圖一y與的散點(diǎn)圖2y與的散點(diǎn)圖圖3y與圖4y與圖5y與圖6y與圖7y與圖1至圖7分別是y與到的散點(diǎn)圖,從圖中可以明顯看出y與各自變量之間線性相關(guān)的程度。國內(nèi)生產(chǎn)總值與居民消費(fèi)價(jià)格指數(shù)的線性相關(guān)程度比較弱,這是因?yàn)榫用裣M(fèi)價(jià)格指數(shù)反映的是一定時(shí)期內(nèi)城鄉(xiāng)居民做購買的生活消費(fèi)品和服務(wù)價(jià)格變動(dòng)趨勢和程度,居民消費(fèi)水平受到多種因素影響,不能以它作為影響國內(nèi)生產(chǎn)總值的主要因素。其中國內(nèi)生產(chǎn)總值的發(fā)展主要取決于工業(yè)和農(nóng)業(yè)發(fā)展并且影響著城鄉(xiāng)居民的收入水平,因此選取作為回歸模型的主要參數(shù)自變量,得到如下回歸模型方程:。4.2模型參數(shù)估計(jì)確定主要影響因素、和后,采用逐步回歸法,取顯著性水平使用SPSS軟件對原始數(shù)據(jù)作線性回歸分析,得到最優(yōu)回歸方程,逐步回歸法得到回歸系數(shù)表如表3、表4所示以及模型概況表5。表3表4逐步回歸模型中采用F檢驗(yàn)引入解釋變量顯著性水平閾值,剔除解釋變量顯著性水平。從表3可知逐步回歸剔除了關(guān)于及的模型而得到表4中的最終的三個(gè)模型。方程分別為:(1)(4.1)(2)(4.2)(3)(4.3)4.3模型檢驗(yàn)4.3.1回歸方程的顯著性檢驗(yàn)對回歸方程的顯著性檢驗(yàn)就是要看自變量從整體上對隨機(jī)變量是否有明顯的影響,顯著性檢驗(yàn)有兩種方法:一是回歸方程顯著性的檢驗(yàn),二是回歸系數(shù)顯著性的檢驗(yàn)。這里僅對檢驗(yàn)進(jìn)行論述,檢驗(yàn)原理相同。假設(shè)檢驗(yàn)問題為不全為零由分布的定義,當(dāng)成立時(shí),構(gòu)造函數(shù):(4.4)當(dāng)成立時(shí)有偏小的趨勢,否則拒絕原假設(shè),當(dāng)接受時(shí),對給定顯著性水平,假設(shè)檢驗(yàn)問題的拒絕域?yàn)椋海?.5)由樣本觀測值計(jì)算出的值,若,則拒絕,認(rèn)為與之間有顯著線性關(guān)系,此時(shí)稱線性回歸效果顯著;否則,接受,認(rèn)為與之間沒有有顯著線性關(guān)系,此時(shí)稱線性回歸效果不顯著。選定顯著性水平,利用SPSS軟件計(jì)算出的方差分析表如表6所示表6從表6可知,顯著性水平均小于0.05,因此拒接原假設(shè),回歸方程線性回歸效果顯著。4.3.2擬合度檢驗(yàn)擬合度用于檢驗(yàn)回歸方程對樣本觀測值的擬合程度,其值越大說明隨機(jī)誤差所占的比重越小,回歸的效果越顯著??蓻Q系數(shù)也稱擬合優(yōu)度定義為:(4.6)通常定義相關(guān)系數(shù)為:(4.7)它描述了指標(biāo)變量與解釋變量之間的線性相關(guān)程度。與值越接近1,說明回歸方程對樣本觀測值擬合得很好,表7所示為模型相關(guān)系數(shù)值。由表6可知,模型3相關(guān)系數(shù)和比模型1,2的相關(guān)系數(shù)大,表明模型2擬合效果最好,得到模型3中方程是最優(yōu)回歸方程,因此問題的最優(yōu)回歸方程模型為:(4.8)4.3.3殘差檢驗(yàn)如圖8和圖9分別是殘差分布直方圖和觀測量累計(jì)概率圖。在回歸分析中,總是假定殘差服從正態(tài)分布,這兩個(gè)圖就是根據(jù)樣本數(shù)據(jù)的計(jì)算結(jié)果顯示殘差分析的實(shí)際情況。從圖8殘差分布的直方圖與附于其上的正態(tài)分布曲線的比較,可以觀察出殘差分析的正態(tài)性。觀測量累計(jì)概率圖也是用來比較殘差分布與正態(tài)分布差異的圖形,圖9的縱坐標(biāo)為期望累計(jì)概率分布,橫坐標(biāo)為觀測累計(jì)概率分布,圖中的斜線對應(yīng)著一個(gè)均值為0的正態(tài)分布,證明樣本確實(shí)是來自正態(tài)總體。否則應(yīng)懷疑隨機(jī)變量殘差的正態(tài)性。圖SEQ圖\*ARABIC3殘差分布直方圖圖SEQ圖\*ARABIC4觀測量累計(jì)概率P-P圖4.4結(jié)果分析根據(jù)以上的一系列分析利用逐步回歸法得出了關(guān)于國內(nèi)生產(chǎn)總值的多元線性回歸的最優(yōu)模型,其自變量分別為城鄉(xiāng)居民人民幣儲蓄存款年底余額,農(nóng)林牧漁業(yè)增加值和工業(yè)增加值,最優(yōu)模型方程為:(4.9)利用模型和實(shí)際分析可知工業(yè)和農(nóng)業(yè)產(chǎn)值以及城鄉(xiāng)居民存款數(shù)對國內(nèi)生產(chǎn)總值有極高的相關(guān)性,利用該模型可以一定程度上反映國內(nèi)生產(chǎn)總值的趨勢,該模型可以為制定相關(guān)政策方案提供一定的參考??偨Y(jié)通過自己切身搜集數(shù)據(jù)整理分析數(shù)據(jù),利用軟件spss來幫助分析數(shù)據(jù),我學(xué)到了很多知識,也豐富了自己對數(shù)理統(tǒng)計(jì)的理解,更加深入地理解了回歸分析對于實(shí)際生活中的數(shù)據(jù)的處理中所體現(xiàn)出的優(yōu)勢。在寫論文的過程中熟練掌握了多元回歸分析,逐步分析的方法以及利用各種統(tǒng)計(jì)方法來評價(jià)自己得到模型的優(yōu)劣。由于數(shù)據(jù)的隨機(jī)性,文章所得到的模型還存在許多需要改

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論