回歸分析課程設(shè)計_第1頁
回歸分析課程設(shè)計_第2頁
回歸分析課程設(shè)計_第3頁
回歸分析課程設(shè)計_第4頁
回歸分析課程設(shè)計_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用回歸分析課程設(shè)計指導(dǎo)書一、 課程設(shè)計的目的 (1)鞏固應(yīng)用回歸分析的理論知識,掌握其思想精髓; (2)運用回歸分析研究方法,加強解決實際問題的能力; (3)熟練使用spss軟件對數(shù)據(jù)進行回歸分析。 二、 設(shè)計名稱:研究貨運總量y(萬噸)與工業(yè)總產(chǎn)值x1(億元)、農(nóng)業(yè)總產(chǎn)值x2(億元)、居民非商品支出x3(億元)的關(guān)系三、 設(shè)計要求 (1)正確運用spss軟件對數(shù)據(jù)進行處理 (2)正確分析數(shù)據(jù),嘗試選擇不同的模型擬合數(shù)據(jù) (3)課程設(shè)計中,遇到問題要翻閱課本去努力解決問題 (4)要有耐心,對于模型的顯著性和回歸系數(shù)都要進行檢驗 (5)認(rèn)真并獨立完成四、 設(shè)計過程 (1)思考課程設(shè)計的目的,尋

2、找來源真實的數(shù)據(jù) (2)上網(wǎng)搜集并整理數(shù)據(jù)資料 (3)根據(jù)數(shù)據(jù)確定研究對象 (4)應(yīng)用統(tǒng)計軟件來處理數(shù)據(jù)信息 (5)選擇通過各種檢驗的線性模型 (6)寫出相應(yīng)的實驗報告,并對結(jié)果進行分析五、設(shè)計細則 (1)搜集數(shù)據(jù)階段,數(shù)據(jù)不能過于繁雜,也不能太少; (2)做課程設(shè)計前,認(rèn)真看書和筆記,及平時的實驗報告,掌握豐富的理論; (3)有耐心,不緊不慢;要細心,一絲不茍; (4)寫報告書時,語言簡潔易懂又不失完整,尤其操作過程要正確完整,要清楚明了。分析結(jié)果要正確與實際問題背景相符。六、說明 (1)書寫報告時,有些特殊的數(shù)學(xué)符號需要利用mathtype(公式編輯器)這款小軟件進行編輯; (2)有些sp

3、ss輸出表格不整齊,需要導(dǎo)出在excel中,然后在復(fù)制到word文檔里; (3)認(rèn)真仔細的完成課程設(shè)計課程設(shè)計任務(wù)書姓 名xxx學(xué) 號00000000班 級09統(tǒng)計課程名稱 應(yīng)用回歸分析課程性質(zhì)統(tǒng)計學(xué)設(shè)計時間 2011年11月 1 日 2011 年 11 月 15 日設(shè)計名稱 研究貨運總量y(萬噸)與工業(yè)總產(chǎn)值x1(億元)、農(nóng)業(yè)總產(chǎn)值x2(億元)、居民非商品支出x3(億元)的關(guān)系設(shè)計要求(1)正確運用spss軟件對數(shù)據(jù)進行處理(2)正確分析數(shù)據(jù),嘗試選擇不同的模型擬合數(shù)(3)課程設(shè)計中,遇到問題要翻閱課本去努力解決問題(4)要有耐心,對模型的顯著性和回歸系數(shù)要進行檢驗(5)認(rèn)真并獨立完成 設(shè)計

4、思路與設(shè)計過程 思路:(1) 建立一個回歸方程后,要檢驗方程顯著性和回歸系數(shù)的顯著性(2) 將理論應(yīng)用到實際問題中去 過程:(1)思考課程設(shè)計的目的,尋找來源真實的數(shù)據(jù)(2)上網(wǎng)搜集并整理數(shù)據(jù)資料(3)根據(jù)數(shù)據(jù)確定研究對象(4)應(yīng)用統(tǒng)計軟件來處理數(shù)據(jù)信息(5)選擇通過各種檢驗的線性模型(6)寫出相應(yīng)的實驗報告,并對結(jié)果進行分析計劃與進度(1)11月1日-11月3日,思考準(zhǔn)備研究課題。(2)11月4日-11月7日,確立課題,搜集數(shù)據(jù)。(3)11月8日-11月13日,分析處理數(shù)據(jù),編寫課程設(shè)計報告書。(4)11月13日-11月15日,檢查報告是否完整正確并裝訂成冊任課教師意 見說 明(1)對wor

5、d文檔進行編輯的時候,有些特殊的數(shù)學(xué)符號需要利用mathtype (公式編輯器)這款小軟件進行編輯。(2)有些spss輸出表格不整齊,需要要到處在excel中,然后在復(fù)制到word文檔里設(shè)計名稱:研究貨運總量y(萬噸)與工業(yè)總產(chǎn)值x1(億元)、農(nóng)業(yè)總產(chǎn)值x2(億元)、居民非商品支出x3(億元)的關(guān)系日期:2011年 11 月 13 日 (1) 設(shè)計內(nèi)容:研究貨運總量y(萬噸)與工業(yè)總產(chǎn)值x1(億元)、農(nóng)業(yè)總產(chǎn)值x2(億元)、居民非商品支出x3(億元)的關(guān)系。數(shù)據(jù)見表如下:編號貨運總量y(萬噸)工業(yè)總產(chǎn)值x1(億元)農(nóng)業(yè)總產(chǎn)值x2(億元)居民非商品支出x3(億元)1160.0070.0035.0

6、01.002260.0075.0040.002.403210.0065.0040.002.004265.0074.0042.003.005240.0072.0038.001.206220.0068.0045.001.507275.0078.0042.004.008160.0066.0036.002.009275.0070.0044.003.2010250.0065.0042.003.00(1) 計算出y,x1,x2,x3的相關(guān)系數(shù)矩陣;(2) 求y關(guān)于x1,x2,x3的三元線性回歸方程;(3) 對所求的得方程做擬合優(yōu)度檢驗;(4) 對回歸方程做顯著性檢驗;(5) 對每一個回歸系數(shù)做顯著性檢驗;

7、(6) 如果有的回歸系數(shù)沒有通過顯著性檢驗,將其剔除,重新建立回歸方程,再作回歸方程的顯著性檢驗和回歸系數(shù)的顯著性檢驗;(7) 求出每一個回歸系數(shù)的置信水平為95%的置信區(qū)間;(8) 求標(biāo)準(zhǔn)化方程;設(shè)計目的與要求:目的:(1)鞏固課本上學(xué)到的知識,提高處理實際問題的能力; (2)掌握對多元線性回歸問題的模型選擇; (3)對軟件輸出的結(jié)果要學(xué)會分析要求:(1)熟練使用spss軟件對回歸數(shù)據(jù)進行模型擬合; (2)認(rèn)真獨立完成設(shè)計環(huán)境或器材、原理與說明:設(shè)計環(huán)境和器材:計算機,minitab軟件,課本,筆記設(shè)計原理與說明:(1) 多元回歸分析中,檢驗回歸系數(shù)是否為0的時候,先用f檢驗,考慮整體回歸系

8、數(shù),再對每個系數(shù)是否為零進行t檢驗(2) t檢驗:原假設(shè):統(tǒng)計量: 其中為回歸標(biāo)準(zhǔn)差當(dāng)原假設(shè):成立時,構(gòu)造的統(tǒng)計量服從自由度為n-p-1的t分布。給定顯著性水平,查出雙側(cè)檢驗的臨界值。當(dāng)時拒絕原假設(shè):,認(rèn)為顯著不為零。自變量是對y的線性效果是顯著的;當(dāng)時接受原假設(shè):,認(rèn)為顯著為零。自變量是對y的線性效果不顯著的(3) f檢驗對線性回歸方程顯著性的另一種檢驗是f檢驗,f檢驗是根據(jù)平方和分解式,直接從回歸效果檢驗方程的顯著性。平方和分解式是其中,稱為總平方和,簡記為sst或,sst表示sum of squares for total。稱為回歸平方和,簡記為ssr或,r表示regression稱為殘

9、差平方和,簡記為sse或,e表示error因此平方和分解式可以簡記為sst=ssr+sse原假設(shè):統(tǒng)計量: 當(dāng)原假設(shè)成立時,構(gòu)造的統(tǒng)計量服從自由度為(p,n-p-1)的f分布。給定顯著性水平。當(dāng)大于臨界值時,拒絕原假設(shè),認(rèn)為回歸方程顯著。 方差分析表方差來源自由度平方和均方f值p值回歸殘差總和sst(4) 擬合優(yōu)度 擬合優(yōu)度用于檢驗回歸方程對樣本觀測值的擬合優(yōu)度。在多元線性回歸中,決定系數(shù)為樣本決定系數(shù)的取值在區(qū)間內(nèi),越近1,表明回歸擬合的效果越好;越接近0,表明回歸擬合的效果越差。與f檢驗相比,可以清楚直觀的反應(yīng)回歸擬合的效果,但是并不能作為嚴(yán)格的顯著性檢驗。(5) 復(fù)相關(guān)系數(shù)稱為y關(guān)于的樣

10、本復(fù)相關(guān)系數(shù)。在兩個變量的簡單相關(guān)系數(shù)中,相關(guān)系數(shù)沒有正負(fù)之分,而復(fù)相關(guān)系數(shù)表示的是因變量y對全體自變量之間的線性關(guān)系,它的符號不能由某一個自變量的回歸系數(shù)的符號來確定,因而復(fù)相關(guān)系數(shù)都取正號。(6) 多重共線性 多元線性回歸方程模型中有一個基本假設(shè),就是要求設(shè)計矩陣x的秩rank(x)=p+1,即要求x中的列向量之間線性無關(guān),如果存在不全為0的p+1個數(shù),使得則自變量之間存在著多重共線性。多重共線性的診斷:(方差擴大因子法)對自變量做中心標(biāo)準(zhǔn)化,則為自變量的相關(guān)陣。記稱其主對角線元素為自變量的方差擴大因子(variance inflation factor,vif)。當(dāng)就說明自變量與其他自變

11、量之間有嚴(yán)重的多重共線性,且這種多重共線性可能會過度的影響最小二乘估計值。設(shè)計過程(步驟)或程序代碼:(1) 打開spss軟件,導(dǎo)出數(shù)據(jù)(2) 分析相關(guān)雙變量相關(guān)變量:y,x1,x2,x3確定(3) 分析回歸線性回歸(因變量:y;自變量:x1,x2,x3)確定(4) 分析相關(guān)雙變量相關(guān)變量:y,x1,x2確定(5) 分析回歸線性回歸(因變量:y;自變量:x1,x2)確定(6) 分析-回歸-線性回歸(因變量:y;自變量:x1,x2,x3;統(tǒng)計量:選中共線性診斷;繼續(xù))-確定(7) 分析-回歸-線性回歸(因變量:y;自變量:x1,x2,x3;保存:預(yù)測值:未標(biāo)準(zhǔn)化;殘差:未標(biāo)準(zhǔn)化;預(yù)測區(qū)間:均值,

12、置信水平為95%;繼續(xù))-確定設(shè)計結(jié)果與分析(可以加頁):(2)相關(guān)性yx1x2x3ypearson 相關(guān)性1.556.731*.724*顯著性(雙側(cè)).095.016.018n10101010x1pearson 相關(guān)性.5561.113.398顯著性(雙側(cè)).095.756.254n10101010x2pearson 相關(guān)性.731*.1131.547顯著性(雙側(cè)).016.756.101n10101010x3pearson 相關(guān)性.724*.398.5471顯著性(雙側(cè)).018.254.101n10101010*. 在 0.05 水平(雙側(cè))上顯著相關(guān)。(3)輸入移去的變量模型輸入的變量

13、移去的變量方法1x3, x1, x2a.輸入a. 已輸入所有請求的變量。模型匯總模型rr 方調(diào)整 r 方標(biāo)準(zhǔn) 估計的誤差1.898a.806.70823.44188a. 預(yù)測變量: (常量), x3, x1, x2。復(fù)相關(guān)系數(shù)r=0.898,決定系數(shù)=0.806,由決定系數(shù)看回歸方程高度顯著。anovab模型平方和df均方fsig.1回歸13655.37034551.7908.283.015a殘差3297.1306549.522總計16952.5009a. 預(yù)測變量: (常量), x3, x1, x2。b. 因變量: y由方差分析表可以知道,f=8.283,p值=0.015,表明回歸方程高度顯

14、著,說明x1,x2,x3整體上對y有顯著的線性影響。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tsig.b標(biāo)準(zhǔn) 誤差試用版1(常量)-348.280176.459-1.974.096x13.7541.933.3851.942.100x27.1012.880.5352.465.049x312.44710.569.2771.178.284a. 因變量: y1.回歸方程為 :2.回歸系數(shù)的顯著性檢驗:自變量x2對y有影響,其中x3的p值=0.284。 因此,這個模型通過了顯著性檢驗但沒有通過回歸系數(shù)的檢驗,自變量x3對因變量y不顯著,所以下一步要剔除不顯著的回歸系數(shù)x3,重新建立回歸模型.(4)相關(guān)性yx1x2

15、ypearson 相關(guān)性1.556.731*顯著性(雙側(cè)).095.016n101010x1pearson 相關(guān)性.5561.113顯著性(雙側(cè)).095.756n101010x2pearson 相關(guān)性.731*.1131顯著性(雙側(cè)).016.756n101010*. 在 0.05 水平(雙側(cè))上顯著相關(guān)。(5)輸入移去的變量模型輸入的變量移去的變量方法1x2, x1a.輸入a. 已輸入所有請求的變量。模型匯總模型rr 方調(diào)整 r 方標(biāo)準(zhǔn) 估計的誤差1.872a.761.69224.08112a. 預(yù)測變量: (常量), x2, x1。anovab模型平方和df均方fsig.1回歸12893

16、.19926446.60011.117.007a殘差4059.3017579.900總計16952.5009a. 預(yù)測變量: (常量), x2, x1。b. 因變量: y系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tsig.b標(biāo)準(zhǔn) 誤差試用版1(常量)-459.624153.058-3.003.020x14.6761.816.4792.575.037x28.9712.468.6763.634.008a. 因變量: y實驗分析: 1.復(fù)相關(guān)系數(shù)r=0.872,決定系數(shù)=0.761,由決定系數(shù)看回歸方程高度顯著。2. 由方差分析表可以知道,f=11.117,p值=0.007,表明回歸方程高度顯著,說明x1,x2

17、整體上對y有顯著的線性影響。 3.回歸系數(shù)的顯著性檢驗,自變量x1,x2對y有影響,其中x1的p值=0.037最大。 4。標(biāo)準(zhǔn)化回歸方程為 : 綜上所訴,這個回歸模型即通過了方程顯著性檢驗,也通過了回歸系數(shù)顯著行檢驗,所以次模型是有效的(6)系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tsig.共線性統(tǒng)計量b標(biāo)準(zhǔn) 誤差試用版容差vif1(常量)-348.280176.459-1.974.096x13.7541.933.3851.942.100.8251.211x27.1012.880.5352.465.049.6871.455x312.44710.569.2771.178.284.5861.708a. 因變

18、量: y從上圖可知,次模型中,自變量自變量x1,x2,x3的多重共線性的vif統(tǒng)計量的值都很小,小于10,說明建立的回歸模型不存在多重共線性問題。(7)殘差統(tǒng)計量a極小值極大值均值標(biāo)準(zhǔn) 偏差n預(yù)測值175.4748292.5545231.500038.9520610標(biāo)準(zhǔn) 預(yù)測值-1.4381.567.0001.00010預(yù)測值的標(biāo)準(zhǔn)誤差10.46620.19114.5263.12710調(diào)整的預(yù)測值188.3515318.1067240.183549.8391410殘差-25.1975933.22549.0000019.1402210標(biāo)準(zhǔn) 殘差-1.0751.417.000.81610student 化 殘差-2.1161.754-.1231.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論