




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第4章 違背基本假設的情況思考與練習參考答案4.1 試舉例說明產(chǎn)生異方差的原因。答:例4.1:截面資料下研究居民家庭的儲蓄行為 Yi=b0+b1Xi+i其中:Yi表示第i個家庭的儲蓄額,Xi表示第i個家庭的可支配收入。由于高收入家庭儲蓄額的差異較大,低收入家庭的儲蓄額則更有規(guī)律性,差異較小,所以i的方差呈現(xiàn)單調(diào)遞增型變化。 例4.2:以某一行業(yè)的企業(yè)為樣本建立企業(yè)生產(chǎn)函數(shù)模型 Yi=Aib1 Kib2 Lib3ei被解釋變量:產(chǎn)出量Y,解釋變量:資本K、勞動L、技術(shù)A,那么每個企業(yè)所處的外部環(huán)境對產(chǎn)出量的影響被包含在隨機誤差項中。由于每個企業(yè)所處的外部環(huán)境對產(chǎn)出量的影響程度不同,造成了隨機誤差
2、項的異方差性。這時,隨機誤差項的方差并不隨某一個解釋變量觀測值的變化而呈規(guī)律性變化,呈現(xiàn)復雜型。4.2 異方差帶來的后果有哪些?答:回歸模型一旦出現(xiàn)異方差性,如果仍采用OLS估計模型參數(shù),會產(chǎn)生下列不良后果:1、參數(shù)估計量非有效2、變量的顯著性檢驗失去意義3、回歸方程的應用效果極不理想總的來說,當模型出現(xiàn)異方差性時,參數(shù)OLS估計值的變異程度增大,從而造成對Y的預測誤差變大,降低預測精度,預測功能失效。4.3 簡述用加權(quán)最小二乘法消除一元線性回歸中異方差性的思想與方法。答:普通最小二乘估計就是尋找參數(shù)的估計值使離差平方和達極小。其中每個平方項的權(quán)數(shù)相同,是普通最小二乘回歸參數(shù)估計方法。在誤差項
3、等方差不相關(guān)的條件下,普通最小二乘估計是回歸參數(shù)的最小方差線性無偏估計。然而在異方差的條件下,平方和中的每一項的地位是不相同的,誤差項的方差大的項,在殘差平方和中的取值就偏大,作用就大,因而普通最小二乘估計的回歸線就被拉向方差大的項,方差大的項的擬合程度就好,而方差小的項的擬合程度就差。由OLS求出的仍然是的無偏估計,但不再是最小方差線性無偏估計。所以就是:對較大的殘差平方賦予較小的權(quán)數(shù),對較小的殘差平方賦予較大的權(quán)數(shù)。這樣對殘差所提供信息的重要程度作一番校正,以提高參數(shù)估計的精度。加權(quán)最小二乘法的方法:4.4簡述用加權(quán)最小二乘法消除多元線性回歸中異方差性的思想與方法。答:運用加權(quán)最小二乘法消
4、除多元線性回歸中異方差性的思想與一元線性回歸的類似。多元線性回歸加權(quán)最小二乘法是在平方和中加入一個適當?shù)臋?quán)數(shù) ,以調(diào)整各項在平方和中的作用,加權(quán)最小二乘的離差平方和為: (2)加權(quán)最小二乘估計就是尋找參數(shù)的估計值使式(2)的離差平方和達極小。所得加權(quán)最小二乘經(jīng)驗回歸方程記做 (3) 多元回歸模型加權(quán)最小二乘法的方法:首先找到權(quán)數(shù),理論上最優(yōu)的權(quán)數(shù)為誤差項方差的倒數(shù),即 (4)誤差項方差大的項接受小的權(quán)數(shù),以降低其在式(2)平方和中的作用; 誤差項方差小的項接受大的權(quán)數(shù),以提高其在平方和中的作用。由(2)式求出的加權(quán)最小二乘估計就是參數(shù)的最小方差線性無偏估計。一個需要解決的問題是誤差項的方差是未
5、知的,因此無法真正按照式(4)選取權(quán)數(shù)。在實際問題中誤差項方差通常與自變量的水平有關(guān)(如誤差項方差隨著自變量的增大而增大),可以利用這種關(guān)系確定權(quán)數(shù)。例如與第j個自變量取值的平方成比例時, 即=k時,這時取權(quán)數(shù)為 (5)更一般的情況是誤差項方差與某個自變量(與|ei|的等級相關(guān)系數(shù)最大的自變量)取值的冪函數(shù)成比例,即=k,其中m是待定的未知參數(shù)。此時權(quán)數(shù)為 (6)這時確定權(quán)數(shù) 的問題轉(zhuǎn)化為確定冪參數(shù)m的問題,可以借助SPSS軟件解決。4.5(4.5)式一元加權(quán)最小二乘回歸系數(shù)估計公式。證明:由得:4.6驗證(4.8)式多元加權(quán)最小二乘回歸系數(shù)估計公式。證明:對于多元線性回歸模型 (1) ,即存
6、在異方差。設,用左乘(1)式兩邊,得到一個新的的模型:,即。因為,故新的模型具有同方差性,故可以用廣義最小二乘法估計該模型,得原式得證。4.7 有同學認為當數(shù)據(jù)存在異方差時,加權(quán)最小二乘回歸方程與普通最小二乘回歸方程之間必然有很大的差異,異方差越嚴重,兩者之間的差異就越大。你是否同意這位同學的觀點?說明原因。答:不同意。當回歸模型存在異方差時,加權(quán)最小二乘估計(WLS)只是普通最小二乘估計(OLS)的改進,這種改進可能是細微的,不能理解為WLS一定會得到與OLS截然不同的方程來,或者大幅度的改進。實際上可以構(gòu)造這樣的數(shù)據(jù),回歸模型存在很強的異方差,但WLS 與OLS的結(jié)果一樣。加權(quán)最小二乘法不
7、會消除異方差,只是消除異方差的不良影響,從而對模型進行一點改進。4.8 對例4.3的數(shù)據(jù),用公式計算出加權(quán)變換殘差,繪制加權(quán)變換殘差圖,根據(jù)繪制出的圖形說明加權(quán)最小二乘估計的效果。解:用公式計算出加權(quán)變換殘差,分別繪制加權(quán)最小二乘估計后的殘差圖和加權(quán)變換殘差圖(見下圖)。根據(jù)繪制出的兩個圖形可以發(fā)現(xiàn)加權(quán)最小二乘估計沒有消除異方差,只是對原OLS的殘差有所改善,而經(jīng)過加權(quán)變換后的殘差不存在異方差。4.9 參見參考文獻2,表4.12(P138)是用電高峰每小時用電量y與每月總用電量x的數(shù)據(jù)。(1)用普通最小二乘法建立y與x的回歸方程,并畫出殘差散點圖。解:SPSS輸出結(jié)果如下:由上表可得回歸方程為
8、:殘差圖為:(2)診斷該問題是否存在異方差;解:a由殘差散點圖可以明顯看出存在異方差,誤差的方差隨著的增加而增大。b用SPSS做等級相關(guān)系數(shù)的檢驗,結(jié)果如下表所示:得到等級相關(guān)系數(shù),P值=0.021,認為殘差絕對值與自變量顯著相關(guān),存在異方差。(3)如果存在異方差,用冪指數(shù)型的權(quán)函數(shù)建立加權(quán)最小二乘回歸方程;解:SPSS輸出結(jié)果如圖:Coefficientsa,b-.683.298-2.296.026.004.000.8129.930.000(Constant)xModel1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoeffic
9、ientstSig.Dependent Variable: ya. Weighted Least Squares Regression - Weighted by Weight for y from WLS, MOD_2x* -1.500b. 由上述表可得,在時對數(shù)似然函數(shù)達到最大,則冪指數(shù)的最優(yōu)取值為。加權(quán)后的回歸方程為:。計算加權(quán)后的殘差,并對殘差絕對值和自變量做等級相關(guān)系數(shù)分析,結(jié)果如下表所示:,P值為0.019<0.05,即加權(quán)最小二乘法沒有消除異方差,只是消除異方差的不良影響,從而對模型進行一點改進。Correlations1.000.321*.0195353.321*1.00
10、0.019.5353Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NxabseiwSpearman's rhoxabseiwCorrelation is significant at the 0.05 level (2-tailed).*. (4)用方差穩(wěn)定變換消除異方差。解:對應變量做方差穩(wěn)定變換()后,用最小二乘法做回歸,SPSS結(jié)果如下表:Coefficientsa.582.1304.481.000.001.000.8059.699.000(Constant)xModel1
11、BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: sqrtya. 則回歸方程為:。保存預測值,計算出殘差的絕對值后,計算等級相關(guān)系數(shù),見下表:其中,P值=0.254>0.05,說明異方差已經(jīng)消除。4.10 試舉一可能產(chǎn)生隨機誤差項序列相關(guān)的經(jīng)濟例子。答:例如,居民總消費函數(shù)模型: Ct=b0+b1Yt+ t t=1,2,n由于居民收入對消費影響有滯后性,而且今年消費水平受上年消費水平影響,則可能出現(xiàn)序列相關(guān)性。另外由于消費習慣的影響被包含在隨機誤差項中,則可能
12、出現(xiàn)序列相關(guān)性(往往是正相關(guān) )。4.11 序列相關(guān)性帶來的嚴重后果是什么?答:直接用普通最小二乘法估計隨機誤差項存在序列相關(guān)性的線性回歸模型未知參數(shù)時,會產(chǎn)生下列一些問題:1. 參數(shù)估計量仍然是無偏的,但不具有有效性,因為有自相關(guān)性時參數(shù)估計值的方差大于無自相關(guān)性時的方差。2. 均方誤差MSE可能嚴重低估誤差項的方差3. 變量的顯著性檢驗失去意義:在變量的顯著性檢驗中,統(tǒng)計量是建立在參數(shù)方差正確估計基礎之上的,當參數(shù)方差嚴重低估時,容易導致t值和F值偏大,即可能導致得出回歸參數(shù)統(tǒng)計檢驗和回歸方程檢驗顯著,但實際并不顯著的嚴重錯誤結(jié)論。4. 當存在序列相關(guān)時, 仍然是的無偏估計,但在任一特定的
13、樣本中, 可能嚴重歪曲b的真實情況,即最小二乘法對抽樣波動變得非常敏感5. 模型的預測和結(jié)構(gòu)分析失效。4.12 總結(jié)DW檢驗的優(yōu)缺點。答:優(yōu)點:1.應用廣泛,一般的計算機軟件都可以計算出DW值; 2.適用于小樣本; 3.可用于檢驗隨機擾動項具有一階自回歸形式的序列相關(guān)問題。缺點:1. DW檢驗有兩個不能確定的區(qū)域,一旦DW值落入該區(qū)域,就無法判斷。此時,只有增大樣本容量或選取其他方法; 2.DW統(tǒng)計量的上、下界表要求n>15,這是由于樣本如果再小,利用殘差就很難對自相關(guān)性的存在做出比較正確的診斷; 3.DW檢驗不適應隨機項具有高階序列相關(guān)性的檢驗。4.13 表4.13中是某軟件公司月銷售
14、額數(shù)據(jù),其中,x為總公司的月銷售額(萬元);y為某分公司的月銷售額(萬元)。(1)用普通最小二乘法建立y與x的回歸方程;由上表可知:用普通二乘法建立的回歸方程為(2)用殘差圖及DW檢驗診斷序列的相關(guān)性; 1.以自變量x為橫軸,普通殘差為縱軸畫殘差圖如下:從圖中可以看到,殘差有規(guī)律的變化,呈現(xiàn)大致反W形狀,說明隨機誤差項存在自相關(guān)性。2.以(殘差1)為橫坐標,(殘差)為縱坐標,繪制散點圖如下:由殘差圖可見大部分的點落在第一、三象限內(nèi),表明隨機擾動項存在著正的序列相關(guān);3.從下表可知DW值為0.663,查DW表,n=20,k=2,顯著性水平=0.05,得=1.20,=1.41,由于0.663<
15、;1.20,知DW值落入正相關(guān)區(qū)域,即殘差序列存在正的自相關(guān)。(3)用迭代法處理序列相關(guān),并建立回歸方程。自相關(guān)系數(shù)令,然后用對作普通最小二乘回歸可得輸出結(jié)果如下:可看到新的回歸方程的DW=1.360.且1.18<1.360<1.40,因而DW檢驗落入不確定區(qū)域此時,一步迭代誤差項的標準差為0.07296,小于的標準差0.097對的回歸方程為=-0.3+0.173,將=-0.6685,=-0.6685代人,還原為原始變量的方程=-0.3+0.6685+0.173-0.1157由于一步迭代的DW檢驗落入不確定區(qū)域,因而可以考慮對數(shù)據(jù)進行二步迭代,也就是對和重復以上迭代過程。進行回歸結(jié)
16、果如下:此時DW的值為1.696,查DW表,n=18,k=2,顯著性水平=0.05,得=1.16,=1.39, DW值大于,小于2,落入無自相關(guān)區(qū)域。誤差標準項0.0849,略小于一步迭代的標準差0.7296。但是在檢驗都通過的情況下,由于一步迭代的值和F值均大于兩步迭代后的值,且根據(jù)取模型簡約的原則,最終選擇一步迭代的結(jié)果,即:=-0.3+0.6685+0.173-0.1157(4)用一階差分的方法處理數(shù)據(jù),建立回歸方程;先計算差分=-,=-,然后用對做過原點的最小二乘回歸,結(jié)果如下:由上面表,可知DW值為1.462>1.40=,即DW落入不相關(guān)區(qū)域,可知殘差序列不存在自相關(guān),一階差分
17、法成功地消除了序列自相關(guān)。同時得到回歸方程為=0.169,將=-,=-,代人,還原原始變量的方程=+0.169(-)(5)比較普通最小二乘法所得的回歸方程和迭代法、一階差分法所建立回歸方程的優(yōu)良性。答:本題中自相關(guān)系數(shù)0.6685,不接近于1,不適宜用差分法,另外由迭代法的F值及都大于差分法的值,故差分法的效果低于迭代法的效果;而普通最小二乘法的隨機誤差項標準差為0.09744,大于迭代的隨機誤差項標準差0.07296,所以迭代的效果要優(yōu)于普通最小二乘法,所以本題中一次迭代法最好。4.14 某樂隊經(jīng)理研究其樂隊CD盤的銷售額(y),兩個有關(guān)的影響變量是每周出場次x1和樂隊網(wǎng)站的周點擊率x2,數(shù)
18、據(jù)見表4.14。(1)用普通最小二乘法建立y與x1、x2的回歸方程,用殘差圖及DW檢驗診斷序列的自相關(guān)性;解:將數(shù)據(jù)輸入SPSS,經(jīng)過線性回歸得到結(jié)果如下:Model Summary(b)ModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Watson1.541(a).293.264329.69302.745a Predictors: (Constant), x2, x1b Dependent Variable: yANOVA(b)Model Sum of SquaresdfMean SquareFSig.1Regre
19、ssion2205551.67821102775.83910.145.000(a) Residual5326177.03649108697.491 Total7531728.71451 a Predictors: (Constant), x2, x1b Dependent Variable: y由以上3個表可知普通最小二乘法建立y與x1、x2的回歸方程,通過了r、F、t檢驗,說明回歸方程顯著。y與x1、x2的回歸方程為:y=-574.062+191.098x1+2.045x2殘差圖ei(et)ei1(et-1)為:從殘差圖可以看出殘差集中在1、3象限,說明隨機誤差項存在一階正自相關(guān)。DW=0.
20、745查表得dl=1.46 du=1.63, 0<DW<dl, 所以隨機誤差項存在一階正自相關(guān)。(2)用迭代法處理序列相關(guān),并建立回歸方程。=1-0.5DW=0.6275做變換:x1t=x1t-x1(t-1), x2t=x2t-x2(t-1)yt=yt-yt-1建立yt與x1t, x2t的回歸方程,SPSS輸出為:DW=1.716>du 所以誤差項間無自相關(guān)性。=257.86回歸方程為:yt=-178.775+211.11x1t+1.436x2t還原為:yt-0.627y(t-1)= -178.775+211.11*(x1t-0.627x1(t-1) +1.436*( x2t
21、-0.627x2(t-1)(3)用一階差分法處理序列相關(guān),建立回歸方程。Model Summary(c,d)ModelRR Square(a)Adjusted R SquareStd. Error of the EstimateDurbin-Watson1.715(b).511.491280.989952.040a For regression through the origin (the no-intercept model), R Square measures the proportion of the variability in the dependent variable abo
22、ut the origin explained by regression. This CANNOT be compared to R Square for models which include an intercept.b Predictors: DIFF(x2,1), DIFF(x1,1)c Dependent Variable: DIFF(y,1)d Linear Regression through the OriginDW=2.040>du,所以消除了自相關(guān)性,=280.99差分法回歸方程為: ytyt-1=210.117(x1t-x1(t-1)1.397(x2t-x2(t
23、-1).(4)用最大似然法處理序列相關(guān),建立回歸方程。用SPSS軟件的自回歸功能,analyze>time series>autoregression: =0.631, =258.068, (5)用科克倫-奧克特迭代法處理序列相關(guān),建立回歸方程 =0.632, =260.560 , DW1.748。(6)用普萊斯-溫斯登迭代法處理序列相關(guān),建立回歸方程。 =0.632, =258.066 , DW1.746。(7)比較以上各方法所建回歸方程的優(yōu)良性。綜合以上各方法的模型擬合結(jié)果如下表所示:自回歸方法DW迭代法0.6275-179.0211.11.4371.716257.86差分法0
24、210.11.3972.040280.99精確最大似然0.631-481.7211.01.436258.07科克倫-奧克特0.632-479.3211.11.4351.748260.560普萊斯-溫斯登0.631-487.1211.01.4351.746258.066由上表可看出:DW值都落在了隨機誤差項無自相關(guān)性的區(qū)間上,一階差分法消除自相關(guān)最徹底,但因為=0.627,并不接近于1,故得到的方差較大,擬合效果不理想。將幾種方法所得到的值進行比較,就可知迭代法的擬合效果最好,以普萊斯-溫斯登法次之,差分法最差。4.15 說明引起異常值的原因和消除異常值的方法。答:通常引起異常值的原因和消除異常
25、值的方法有以下幾條,見表4.10:4.16 對第3章習題11做異常值檢驗。研究貨運總量y(萬噸)與工業(yè)總產(chǎn)值x1(億元)、農(nóng)業(yè)總產(chǎn)值x2(億元)、居民非商品支出x3(億元)的關(guān)系。(1)利用SPSS建立y與x1,x2,x3的三元回歸方程,分別計算普通殘差,學生化殘差,刪除殘差,刪除學生化殘差,中心化杠桿值,庫克距離,見下表:從表中看到絕對值最大的學生化殘差為SRE=2.11556,小于3,但有超過3的個別值,因而根據(jù)學生化殘差診斷認為存在異常值。絕對值最大的刪除學生化殘差為3.832,對應為第6個數(shù)據(jù),因此判斷它為為異常值。第6個數(shù)據(jù)的中心化杠桿值為0.64,位于第一大,大于2=2=0.6,且
26、庫克距離為3.21位于第一大,因而從杠桿值看是第6個數(shù)據(jù)是自變量的異常值,同時庫克距離大于1,故第6個數(shù)據(jù)為異常值的原因是由自變量異常與因變量異常兩個共同原因引起的。編號yX1X2X3殘差學生化殘差刪除殘差刪除學生化殘差12345678910 160 260 210 265 240 220 275 160 275 250 70 75 65 74 72 68 78 66 70 65 35 40 40 42 38 45 42 36 44 42 1.0 2.4 2.0 3.0 1.2 1.5 4.0 2.0 3.2 3.0 -15.47481 12.82499 5.34434 -0.09088 33.22549 -25.19759 -17.55450 -20.00684 8.23435 18.69545-.893530.627670.26517-.004331.75400-2.11566-1.17348-1.162810.409351.06462 -28.35150 16.880527.22979-0.1135150.88273-97.61523-43.10665-37.1386811.1828733.31486-0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學科學實踐:自制凈水裝置在校園水資源保護中的應用與推廣論文
- 高中校園垃圾分類智能化管理策略與實施路徑探索論文
- 校園花卉觀賞價值與城市綠地生態(tài)功能研究論文
- 藝考生口腔管理制度
- 蘇泊爾專利管理制度
- 觸電事故專項應急預案總結(jié)
- 財務管理模擬習題(附參考答案)
- 江南布衣女裝服飾品牌策劃方案
- 自動控制原理教學大綱 (自動化專業(yè)、電氣工程及其自動化專業(yè))
- 2025年android通知!2024中級Android開發(fā)面試解答最強技術(shù)實現(xiàn)
- 2025年統(tǒng)編版小學語文五年級下冊期末綜合測試題及參考答案
- 浙江臨安招聘事業(yè)編制筆試真題2024
- 2024-2025學年人教版八年級數(shù)學下冊期末綜合復習解答壓軸題培優(yōu)提升專題訓練+
- DB62T 4130-2020 公路混凝土構(gòu)件蒸汽養(yǎng)護技術(shù)規(guī)程
- 洗浴中心保安合同范本
- 行政人事部所需各類表格模板
- 2024北京西城區(qū)六年級畢業(yè)考英語試題及答案
- SH3508標準培訓課件
- 2025-2026學年建德市數(shù)學三年級第一學期期末試題含解析
- 江蘇省泰州市靖江市2024-2025學年八年級下學期期中地理試題(含答案)
評論
0/150
提交評論