最新應(yīng)用回歸分析-課后習(xí)題參考答案_第1頁
最新應(yīng)用回歸分析-課后習(xí)題參考答案_第2頁
最新應(yīng)用回歸分析-課后習(xí)題參考答案_第3頁
最新應(yīng)用回歸分析-課后習(xí)題參考答案_第4頁
最新應(yīng)用回歸分析-課后習(xí)題參考答案_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精品文檔精品文檔第9章含定性變量的回歸模型思考與練習(xí)參考答案9.1 一個學(xué)生使用含有季節(jié)定性自變量的回歸模型,對春夏秋冬四個季節(jié)引入 4個0-1型自變量,用SPSS軟件計算的結(jié)果中總是自動刪除了其中的一個自變量, 他為此感到困惑不解。出現(xiàn)這種情況的原因是什么? 答:假如這個含有季節(jié)定性自變量的回歸模型為:X = % + 3梯牡 + UXkt 山牡 +sD2t +SD3F其中含有k個定量變量,記為X。對春夏秋冬四個季節(jié)引入4個0-1型自變量, 記為D,只取了 6個觀測值,其中春季與夏季取了兩次,秋、冬各取到一次觀測 值,則樣本設(shè)計矩陣為:1YaX11Xk11000、1VX12Xk20100(X,

2、 D )=1VX13Xk300101YX14Xk400011YaX15X k501007YaX16Xk61000顯然,(X,D)中的第1列可表示成后4列的線性組合,從而(X,D)不滿秩,參 數(shù)無法唯一求出。這就是所謂的 虛擬變量陷井”,應(yīng)避免當(dāng)某自變量xj對其余p-1個自變量的復(fù)判定系數(shù)R2超過一定界限時,SPSS 軟件將拒絕這個自變量 為進入回歸模型。稱Tolj=1- R2為自變量為的容忍度(Toleranee ),SPSS軟件的默認容忍度為 0.0001。也就是說,當(dāng)R2 0.9999 時,自變量Xj將被自動拒絕在回歸方程之外,除非我們修改容忍度的默認值。而在這個模型中出現(xiàn)了完全共線性,所

3、以SPSS軟件計算的結(jié)果中總是自動刪除了其中的一個定性自變量。9.2對自變量中含有定性變量的問題,為什么不對同一屬性分別建立回歸模型, 而采取設(shè)虛擬變量的方法建立回歸模型?答:原因有兩個,以例9.1說明。一是因為模型假設(shè)對每類家庭具有相同的斜率 和誤差方差,把兩類家庭放在一起可以對公共斜率做出最佳估計;二是對于其他統(tǒng)計推斷,用一個帶有虛擬變量的回歸模型來進行也會更加準確,這是均方誤差的自由度更多。9.3研究者想研究采取某項保險革新措施的速度y對保險公司的規(guī)模xi和保險公司類型的關(guān)系(參見參考文獻【3】)。因變量的計量是第一個公司采納這項 革新和給定公司采納這項革新在時間上先后間隔的月數(shù)。第一個

4、自變量公司的 規(guī)模是數(shù)量型的,用公司的總資產(chǎn)額(百萬美元)來計量;第二個自變量公司 是定性變量,由兩種類型構(gòu)成,即股份公司和互助公司。數(shù)據(jù)資料見表9.8,試建立y對公司規(guī)模和公司類型的回歸。表9.8iyX1公司類型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份解:對定型變量“公司類型”進行數(shù)量化處理:引入虛擬變量X

5、2:公司類型為“互助”時,X2=1,為“股份”時,X 2=0則表9.5中數(shù)據(jù)轉(zhuǎn)換成以下數(shù)據(jù):iyX1公司類型1171511226921321175143031152210416027717122101819120194290110162381112816401215272013112950143868015318501621224017201660181330501930124020142460建立回歸方程y = b0+b1X1+b2X2+ e用SPSS軟件作線性回歸,得到輸出結(jié)果如下:Model Summ aryModelRR SquareAdjusted R SquareStd. E rr

6、or of the Estimate1.946 a.895.8833.221a. Predictors: (Constant),公司類型,x1R檢驗:擬合優(yōu)度R=0.883,接近1,說明回歸擬合的效果較好ANOVA bModelSum of SquaresdfMean SquareFSig.1Regressi on1504.4132752.20772.497.000 aResidual176.3871710.376Total1680.80019a. Predictors: (Constant),公司類型,x1b. Depe ndent Variable: yF檢驗:F值=72.497, Sig

7、.值為0,說明回歸方程通過F檢驗Coe fficientsModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd. ErrorBeta1(Co nsta nt)41.9302.01020.859.000x1-.102.009-.911-11.443.000公司類型-8.0551.459-.439-5.521.000a. Depe ndent Variable: yT檢驗:回歸系數(shù)通過t檢驗,回歸方程為:y= 41.930 - 0.102 x 1 8.055 x 2說明:若引入虛擬變量X2,當(dāng)公司類型為“互助

8、”時,X2=0,為“股份”時,X 2 = 1則回歸方程為:y= 33.874 - 0.102x1 + 8.055x2結(jié)果分析:(1) 股份制公司采取保險革新措施的積極性比互助型公司高,原因可能在于股 份制公司建立在共同承擔(dān)風(fēng)險上,所以更愿意革新;(2) 公司規(guī)模越大,采取保險革新措施的傾向越大:大規(guī)模公司的保險制度的 更新對公司的影響程度比小規(guī)模公司大,因此大規(guī)模公司更傾向于比較更新措施 和現(xiàn)有政策帶來的效益,最終表現(xiàn)在采納革新措施的時間間隔較短。9.4 .表9.9的數(shù)據(jù)是我國歷年鐵路里程數(shù)據(jù),根據(jù)散點圖觀察在某時間點有折 點,用折線回歸擬合這個數(shù)據(jù)。解:由散點圖9(見下圖)可看出在1995年

9、(t=16)有折點,考慮由兩段構(gòu)成的 分段線性回歸,這可以通過引入一個 0-1型虛擬自變量實現(xiàn)。由散點圖可知該折點為t=16,則引入虛擬自變量x,0,t 蘭 16X =t 16,t 16由SPSS俞出的調(diào)整后的決定系數(shù)RS 0.980,說明擬合優(yōu)度較好由輸出的系數(shù)表可以得出回歸方程為:0 =5.183 0.055t 0.106x由SPSS俞出方程分析表可知,F(xiàn)值為594.524,且P值約為零,說明回歸方程非 常顯著;系數(shù)表中回歸參數(shù)對應(yīng)的t檢驗P值都約等于零,說明回歸參數(shù)均通過了顯著性 檢驗。因此,折線方程成立。7.50-G.50-.00-5.5020250散點圖方差分析表ANOVA bMod

10、elSum of SquaresdfMean SquareFSig.1Regressi on11.11325.557594.524.000 aResidual.20622.009Total11.31924a Predictors: (Con sta nt), x, tb. Depe ndent Variable: y系數(shù)表Coe fficientsModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt)5.183.049106.303.000t.055.005.5

11、8911.859.000x.106.012.4509.065.000a. Depe ndent Variable: y9.5某省統(tǒng)計局1990年9月在全省范圍內(nèi)進行了一次公眾安全感問卷調(diào)查,參 考文獻【10】選取了調(diào)查表中的一個問題進行分析。本題對其中的數(shù)據(jù)做了適當(dāng)?shù)暮喜?。?391人填寫的問卷設(shè)計:“一人在家是否害怕生人來”。因變量 y=1表示害怕,y=2表示不害怕。2個自變量:x1是年齡,x2是文化程度。各變 量的取值含義如表9.10所示。表 9.10是否害怕y年齡x1文化程度x2害怕11628歲22文盲0不害怕 02945歲37小學(xué)14660歲53中學(xué)261歲以上68中專以上3現(xiàn)在的問題

12、是:公民一人在家害怕生人來這個事件,與公民的年齡x1、文化程度x2有沒有關(guān)系呢?調(diào)查數(shù)據(jù)見表 9.11 o表 9.11序 號X1X2niy=1y=0pi12203090.12500222111380.2916732223891462430.3756442238326570.3154853704310.700006371271890.6607173724871962910.40266837310327760.264429535309450.45000105316330.5000011532188731150.38889126834718290.38542136802020.16667146811

13、0370.3181815682187110.394741634040.10000其中,pi是根據(jù)(9.44)式計算的。(1) 把公民的年齡x1、文化程度x2作為數(shù)值型變量,建立y對x1、x2的 logistic 回歸。(2) 把公民的年齡x1、文化程度x2作為定性型變量,用0-1變量將其數(shù)量化, 建立y對公民的年齡和文化程度的logistic 回歸。(3) 你對回歸的效果是否滿意,你認為主要的問題是什么?解: 先對P進行邏輯變換,令p=ln(-B),則1- PiPi = -0 -必1 -2X2;i直接用SPSS!行y與x1、x2的logistic回歸,輸出結(jié)果如下:ANOVA bModelSu

14、m ofSquaresdfMean SquareFSig.1Regressi on.5622.281.386.687 aResidual9.45913.728Total10.02015a. Predictors: (Con sta nt), x2, x1b. Depe ndent Variable: ppiModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt)-.144.662-.218.831x1-.006.012-.137-.510.619x2-.136.1

15、91-.193-.715.487Coe fficientsaa. Depe ndent Variable: ppi由SPSS輸出系數(shù)表結(jié)果得到回歸方程:p =-0.144-0.006 x1-0.136 x2則還原后logistic回歸方程為:exo( -0.144 - 0.006捲 一 0.136x2)?=1 exp(-0.144 -0.006x1 - 0.136x2)由方差分析表知F值=0.386,P值=0.687,大于5%說明回歸方程不顯著;由系數(shù)表知回歸參數(shù)的t檢驗均沒有通過,因為P值都大于5%說明回歸參數(shù) 未通過顯著性檢驗。由于logistic回歸模型存在異方差,所以采用加權(quán)最小二乘法

16、重新擬合,權(quán)重:i =niP/1 - pjSPS輸出結(jié)果如下:ANOVA b,cModelSum of SquaresdfMean SquareFSig.1Regressi on8.39324.1974.304.037 aResidual12.67613.975Total21.06915a. Predictors: (Co nsta nt), x2, x1b. Depe ndent Variable: ppic. Weighted Least Squares Regressi on - Weighted by w iCoe fficientsModelUn sta ndardized Coef

17、ficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt).146.309.472.645x1.002.005.086.398.697x2-.331.116-.617-2.858.013a. Depe ndent Variable: ppib. Weighted Least Squares Regressi on - Weighted by w i由輸出結(jié)果得到回歸方程:f? =0.146 0.002捲-0.33俶2exp( 0.1460.002x1-0.331x2)還原后的回歸萬程:B=-1 +exp(0.146

18、+0.002x1 -0.331x2)由方差分析表結(jié)果知:F值=4.304 , P值=0.037,小于5%說明回歸方程顯著; 由系數(shù)表知捲對應(yīng)的回歸系數(shù)相應(yīng)的 P值=0.697,大于5%說明捲對應(yīng)的回歸 系數(shù)沒有通過檢驗,不顯著;X2對應(yīng)的回歸系數(shù)相應(yīng)的P值=0.013,小于5%說明X2對應(yīng)的回歸系數(shù)通過檢 顯著性驗,且該回歸系數(shù)為-0.331,表明文化程度越高越不害怕。(2)把公民的年齡x1、文化程度x2作為定性型變量,引入6個0-1變量表示年齡x1=22I0,x22x2 =乜7=37JI0,x=37x3 = 53,片=53.0,x 式 531,x2 = 00X2“1,冷=1x231,皆20,

19、x2 - 21)直接進行y與6個虛擬變量的未加權(quán)的logistic 回歸,SPSS俞出結(jié)果如下:由方差分析表知F=2.472 , P值=0.106,大于5%說明回歸方程不顯著;且 除了外,其它自變量對應(yīng)的回歸系數(shù)都沒通過檢驗。ANOVA bModelSum ofSquaresdfMean SquareFSig.1Regressi on4.74341.1862.472.106aResidual5.27711.480Total10.02015a. Predictors: (Co nsta nt), x13, x2, x12, x11b. Depe ndent Variable: ppiModelU

20、nstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E rrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.073Coe fficientsaa. Dependent Variable: ppi下面通過后退法選擇變量對上述模型改進SPSS俞出結(jié)果如下表:ANOVAdModelSum of SquaresdfMean S

21、quareFSig.1Regressi on4.74341.1862.472.106aResidual5.27711.480Total10.020152Regressi on4.64731.5493.459.051 bResidual5.37412.448Total10.020153Regressi on4.27422.1374.835.027 cResidual5.74613.442Total10.02015a Predictors: (Co nsta nt), x13, x2, x12, x11b. Predictors: (Co nsta nt), x13, x2, x12c. Pred

22、ictors: (Con sta nt), x13, x12d. Depe ndent Variable: ppiCoe fficients aModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E rrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.0732(Constant)-.934.326-2.86

23、5.014x2-.136.150-.193-.912.380x121.163.410.6362.838.015x13.859.410.4702.097.0583(Constant)-1.139.235-4.846.000x121.163.407.6362.857.013x13.859.407.4702.110.055a Dependent Variable: ppi后退法的過程中剔除了 x11, x2 ,留下了 x12, x13,但是x13對應(yīng)的回歸系數(shù)未通過檢驗,將其剔除,最后留下了 x12 ;而且回歸方程顯著,2)加權(quán)回歸:用后退法選擇變量,由輸出結(jié)果(如下)可知最后只留下了X2ANOVA

24、ModelSum of SquaresdfMean SquareFSig.1Regression9.97942.4952.475.106 aResidual11.090111.008Total21.069152Regression9.52633.1753.301.058 bResidual11.54312.962Total21.069153Regression8.87024.4354.726.029 cResidual12.19913.938Total21.069154Regression8.23818.2388.989.010dResidual12.83114.916Total21.0691

25、5a. Predictors: (Constant), x13, x2, x11, x12b. Predictors: (Constant), x13, x2, x12c. Predictors: (Constant), x2, x12d. Predictors: (Constant), x2e. Dependent Variable: ppif. Weighted Least Squares Regression - Weighted by w iCoe fficients a,bModelUnstandardizedCoefficientsStandardized CoefficientstSig.BStd.ErrorBeta1(Constant)-.092.425-.217.832x2-.344.118-.641-2.901.014x11.263.392.490.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論