第4章 多重共線性_第1頁
第4章 多重共線性_第2頁
第4章 多重共線性_第3頁
第4章 多重共線性_第4頁
第4章 多重共線性_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四章多重共線性計量經(jīng)濟學1引子:發(fā)展農(nóng)業(yè)和建筑業(yè)會減少財政收入嗎?為了分析各主要因素對財政收入的影響,建立財政收入模型:其中:CS財政收入(億元);NZ農(nóng)業(yè)增加值(億元);GZ工業(yè)增加值(億元);JZZ建筑業(yè)增加值(億元);TPOP總人口(萬人);CUM最終消費(億元);SZM受災面積(萬公頃)根據(jù)某樣本數(shù)據(jù),采用普通最小二乘法得到以下估計結果2

VariableCoefficientStd.Errort-StatisticProb.農(nóng)業(yè)增加值NZ-1.5350900.129778-11.828610.0000工業(yè)增加值GZ0.8987880.2454663.6615580.0017建筑業(yè)增加值JZZ-1.5270891.206242-1.2659890.2208總人口TPOP0.1511600.0337594.4776460.0003最終消費CUM0.1015140.1053290.9637830.3473受災面積SZM-0.0368360.018460-1.9953820.0605截距項-11793.343191.096-3.6957040.0015R-squared0.995015

Meandependentvar5897.824AdjustedR-squared0.993441

S.D.dependentvar5945.854S.E.ofregression481.5380

Akaikeinfocriterion15.41665Sumsquaredresid4405699.

Schwarzcriterion15.75537Loglikelihood-193.4165

F-statistic632.0999Durbin-Watsonstat1.873809

Prob(F-statistic)0.000000財政收入模型的EViews估計結果3

●可決系數(shù)為0.995,校正的可決系數(shù)為0.993,模型擬合很好。模型對財政收入的解釋程度高達99.5%。

●F統(tǒng)計量為632.10,說明0.05水平下回歸方程整體上顯著。

t

檢驗結果表明,除了農(nóng)業(yè)增加值、工業(yè)增加值和總人口以外,其他因素對財政收入的影響均不顯著。

●農(nóng)業(yè)增加值和建筑業(yè)增加值的回歸系數(shù)是負數(shù)。

農(nóng)業(yè)和建筑業(yè)的發(fā)展反而會使財政收入減少嗎?!

這樣的異常結果顯然與理論分析和實踐經(jīng)驗不相符。若模型設定和數(shù)據(jù)真實性沒問題,問題出在哪里呢?模型估計與檢驗結果分析4第六章多重共線性本章討論四個問題:

●什么是多重共線性●多重共線性產(chǎn)生的后果●多重共線性的檢驗●多重共線性的補救措施5第一節(jié)什么是多重共線性

本節(jié)基本內容:

●多重共線性的含義

●產(chǎn)生多重共線性的背景

6

在計量經(jīng)濟學中所謂的多重共線性(Multi-Collinearity),不僅包括完全的多重共線性,還包括不完全的多重共線性。對于解釋變量,如果存在不全為0的數(shù),使得則稱解釋變量之間存在著完全的多重共線性。一、多重共線性的含義7當

時,表明在數(shù)據(jù)矩陣

中,至少有一個列向量可以用其余的列向量線性表示,則說明存在完全的多重共線性。8不完全的多重共線性

實際中,常見的情形是解釋變量之間存在不完全的多重共線性。

對于解釋變量,存在不全為0的數(shù),使得

為隨機變量。這表明解釋變量只是一種近似的線性關系。其中,9,解釋變量間毫無線性關系,變量間相互正交。這時已不需要作多元回歸,每個參數(shù)j都可以通過Y對Xj

的一元回歸來估計。回歸模型中解釋變量的關系可能表現(xiàn)為三種情形:(1),解釋變量間完全共線性。此時模型參數(shù)將無法確定。,解釋變量間存在一定程度的線性關系。實際中常遇到的情形。(2)(3)

10

二、產(chǎn)生多重共線性的背景

多重共線性產(chǎn)生的經(jīng)濟背景主要有幾種情形:

1.經(jīng)濟變量之間具有共同變化趨勢。

2.模型中包含滯后變量。

3.利用截面數(shù)據(jù)建立模型也可能出現(xiàn)多重共線性。

4.樣本數(shù)據(jù)自身的原因。

11第二節(jié)多重共線性產(chǎn)生的后果本節(jié)基本內容:●完全多重共線性產(chǎn)生的后果●不完全多重共線性產(chǎn)生的后果12一、完全多重共線性產(chǎn)生的后果1.參數(shù)的估計值不確定當解釋變量完全線性相關時——OLS估計式不確定

▲從偏回歸系數(shù)意義看:在和完全共線性時,無法保持不變,去單獨考慮對的影響(和的影響不可區(qū)分)

▲從OLS估計式看:可以證明此時2.參數(shù)估計值的方差無限大OLS估計式的方差成為無窮大:

13

二、不完全多重共線性產(chǎn)生的后果

如果模型中存在不完全的多重共線性,可以得到參數(shù)的估計值,但是對計量經(jīng)濟分析可能會產(chǎn)生一系列的影響。

1.參數(shù)估計值的方差增大

當增大時也增大

142.對參數(shù)區(qū)間估計時,置信區(qū)間趨于變大3.假設檢驗容易作出錯誤的判斷4.可能造成可決系數(shù)較高,但對各個參數(shù)單獨的t檢驗卻可能不顯著,甚至可能使估計的回歸系數(shù)符號相反,得出完全錯誤的結論。

15

第三節(jié)多重共線性的檢驗

本節(jié)基本內容:

●簡單相關系數(shù)檢驗法●方差擴大(膨脹)因子法●直觀判斷法

●逐步回歸法16一、簡單相關系數(shù)檢驗法含義:簡單相關系數(shù)檢驗法是利用解釋變量之間的線性相關程度去判斷是否存在嚴重多重共線性的一種簡便方法。判斷規(guī)則:一般而言,如果每兩個解釋變量的簡單相關系數(shù)(零階相關系數(shù))比較高,例如大于0.8,則可認為存在著較嚴重的多重共線性。17

注意:

較高的簡單相關系數(shù)只是多重共線性存在的充分條件,而不是必要條件。特別是在多于兩個解釋變量的回歸模型中,有時較低的簡單相關系數(shù)也可能存在多重共線性。因此并不能簡單地依據(jù)相關系數(shù)進行多重共線性的準確判斷。18

二、方差擴大(膨脹)因子法

統(tǒng)計上可以證明,解釋變量的參數(shù)估計式的方差可表示為

其中的是變量(VarianceInflationFactor),即的方差擴大因子其中是多個解釋變量輔助回歸的可決系數(shù)

19經(jīng)驗規(guī)則●方差膨脹因子越大,表明解釋變量之間的多重共性越嚴重。反過來,方差膨脹因子越接近于1,多重共線性越弱?!窠?jīng)驗表明,方差膨脹因子≥10時,說明解釋變量與其余解釋變量之間有嚴重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。20三、直觀判斷法

1.當增加或剔除一個解釋變量,或者改變一個觀測值時,回歸參數(shù)的估計值發(fā)生較大變化,回歸方程可能存在嚴重的多重共線性。

2.從定性分析認為,一些重要的解釋變量的回歸系數(shù)的標準誤差較大,在回歸方程中沒有通過顯著性檢驗時,可初步判斷可能存在嚴重的多重共線性。213.有些解釋變量的回歸系數(shù)所帶正負號與定性分析結果違背時,很可能存在多重共線性。4.解釋變量的相關矩陣中,自變量之間的相關系數(shù)較大時,可能會存在多重共線性問題。22四、逐步回歸檢測法

逐步回歸的基本思想將變量逐個的引入模型,每引入一個解釋變量后,都要進行F檢驗,并對已經(jīng)選入的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入而變得不再顯著時,則將其剔除。以確保每次引入新的變量之前回歸方程中只包含顯著的變量。在逐步回歸中,高度相關的解釋變量,在引入時會被剔除。因而也是一種檢測多重共線性的有效方法。23第四節(jié)多重共線性的補救措施本節(jié)基本內容:

●修正多重共線性的經(jīng)驗方法●逐步回歸法24一、修正多重共線性的經(jīng)驗方法

1.剔除變量法把方差擴大因子最大者所對應的自變量首先剔除再重新建立回歸方程,直至回歸方程中不再存在嚴重的多重共線性。注意:

若剔除了重要變量,可能引起模型的設定誤差。25

2.增大樣本容量如果樣本容量增加,會減小回歸參數(shù)的方差,標準誤差也同樣會減小。因此盡可能地收集足夠多的樣本數(shù)據(jù)可以改進模型參數(shù)的估計。問題:增加樣本數(shù)據(jù)在實際計量分析中常面臨許多困難。26

3.變換模型形式一般而言,差分后變量之間的相關性要比差分前弱得多,所以差分后的模型可能降低出現(xiàn)共線性的可能性,此時可直接估計差分方程。問題:差分會丟失一些信息,差分模型的誤差項可能存在序列相關,可能會違背經(jīng)典線性回歸模型的相關假設,在具體運用時要慎重。27

4.利用非樣本先驗信息通過經(jīng)濟理論分析能夠得到某些參數(shù)之間的關系,可以將這種關系作為約束條件,將此約束條件和樣本信息結合起來進行約束最小二乘估計。28

5.橫截面數(shù)據(jù)與時序數(shù)據(jù)并用首先利用橫截面數(shù)據(jù)估計出部分參數(shù),再利用時序數(shù)據(jù)估計出另外的部分參數(shù),最后得到整個方程參數(shù)的估計。注意:這里包含著假設,即參數(shù)的橫截面估計和從純粹時間序列分析中得到的估計是一樣的。

29

6.變量變換變量變換的主要方法:(1)計算相對指標(2)將名義數(shù)據(jù)轉換為實際數(shù)據(jù)(3)將小類指標合并成大類指標變量數(shù)據(jù)的變換有時可得到較好的結果,但無法保證一定可以得到很好的結果。30

二、逐步回歸法(1)用被解釋變量對每一個所考慮的解釋變量做簡單回歸。(2)以對被解釋變量貢獻最大的解釋變量所對應的回歸方程為基礎,按對被解釋變量貢獻大小的順序逐個引入其余的解釋變量。若新變量的引入改進了

和檢驗,且回歸參數(shù)的t檢驗在統(tǒng)計上也是顯著的,則在模型中保留該變量。31若新變量的引入未能改進和檢驗,且對其他回歸參數(shù)估計值的t檢驗也未帶來什么影響,則認為該變量是多余變量。若新變量的引入未能改進和檢驗,且顯著地影響了其他回歸參數(shù)估計值的數(shù)值或符號,同時本身的回歸參數(shù)也通不過t檢驗,說明出現(xiàn)了嚴重的多重共線性。32

第五節(jié)案例分析一、研究的目的要求提出研究的問題——為了規(guī)劃中國未來國內旅游產(chǎn)業(yè)的發(fā)展,需要定量地分析影響中國國內旅游市場發(fā)展的主要因素。二、模型設定及其估計影響因素分析與確定——影響因素主要有國內旅游人數(shù),城鎮(zhèn)居民人均旅游支出,農(nóng)村居民人均旅游支出,并以公路里程次和鐵路里程

作為相關基礎設施的代表

理論模型的設定其中:——第t年全國國內旅游收入33數(shù)據(jù)的收集與處理年份國內旅游收入Y(億元)國內旅游人數(shù)X2(萬人次)城鎮(zhèn)居民人均旅游支出X3(元)農(nóng)村居民人均旅游支出X4(元)公路里程X5(萬公里)鐵路里程X6(萬公里)19941023.552400414.754.9111.785.9019951375.762900464.061.5115.705.9719961638.463900534.170.5118.586.4919972112.764400599.8145.7122.646.6019982391.269450607.0197.0127.856.6419992831.971900614.8249.5135.176.7420003175.574400678.6226.6140.276.8720013522.478400708.3212.7169.807.0120023878.487800739.7209.1176.527.1920033442.387000684.9200.0180.987.3034該模型,可決系數(shù)很高,F(xiàn)檢驗值173.3525,明顯顯著。但是當時、不僅、系數(shù)的t檢驗不顯著,而且系數(shù)的符號與預期的相反,這表明很可能存在嚴重的多重共線性。

OLS法估計的結果35計算各解釋變量的相關系數(shù)

表明各解釋變量間確實存在嚴重的多重共線性36三、消除多重共線性采用逐步回歸法檢驗和解決多重供線性問題。分別作Y對X2、X3、X4、X5、X6的一元回歸

變量X2X3X4X5X6參數(shù)估計值0.08429.052311.667334.33242014.146t統(tǒng)計量8.665913.15985.19676.46758.74870.90370.95580.77150.83940.9054的大小排序為:X3、X6、X2、X5、X4。以X3為基礎,順次加入其他變量逐步回歸。37以X3為基礎,順次加入其他變量逐步回歸,結果如下變量X2X3X4X5X6adj.R-squaredX3、X20.0298

(2.153)6.194

(4.287)

0.9659X3、X4

8.021

(5.751)1.711

(0.855)

0.9486X3、X5

6.736

(6.652)

10.912

(2.663)

0.9718X3、X6

7.851

(2.91)

285.012

(0.462)0.94538以X3、X5為基礎,順次加入其他變量逐步回歸,結果如下變量X2X3X4X5X6adj.R-squaredX3、X5、X20.0091

(0.423)6.355

(4.528)

8.574

(1.218)

0.9681X3、X5、X4

4.220

(3.950)3.216

(3.063)

13.628

(4.695)

0.9872X3、X5、X6

8.099

(4.085)

12.924

(2.645)

-424.906

(-0.807)0.970339以X3、X5、X4為基礎,順次加入其他變量逐步回歸,結果如下變量X2X3X4X5X6adj.R-squaredX3、X5、X4、X20.008

(0.515)3.923

(3.072)3.194

(2.848)

11.680

(2.390)

0.9854X3、X5、X4、X6

5.704

(4.181)3.292

(3.469)

15.970

(5.269)

-481.019

(-1.538)0.989640

最后消除多重共線性的結果

這說明,在其他因素不變的情況下,當城鎮(zhèn)居民人均旅游支出

和農(nóng)村居民人均旅游支出分別增長1元時,國內旅游收入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論