版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
問題一:多重共線性Multi-Collinearity一、多重共線性的概念二、實際經濟問題中的多重共線性三、多重共線性的后果四、多重共線性的檢驗五、克服多重共線性的方法六、案例*七、分部回歸與多重共線性一、多重共線性的概念對于模型
Yi=0+1X1i+2X2i++kXki+i
i=1,2,…,n其基本假設之一是解釋變量是互相獨立的。
如果某兩個或多個解釋變量之間出現了相關性,則稱為多重共線性(Multicollinearity)。
如果存在
c1X1i+c2X2i+…+ckXki=0
i=1,2,…,n
其中:ci不全為0,則稱為解釋變量間存在完全共線性(perfectmulticollinearity)。
如果存在
c1X1i+c2X2i+…+ckXki+vi=0
i=1,2,…,n
其中ci不全為0,vi為隨機誤差項,則稱為
近似共線性(approximatemulticollinearity)或交互相關(intercorrelated)。二、實際經濟問題中的多重共線性
一般地,產生多重共線性的主要原因有以下三個方面:(1)經濟變量相關的共同趨勢
時間序列樣本:經濟繁榮時期,各基本經濟變量(收入、消費、投資、價格)都趨于增長;衰退時期,又同時趨于下降。
橫截面數據:生產函數中,資本投入與勞動力投入往往出現高度相關情況,大企業(yè)二者都大,小企業(yè)都小。(2)滯后變量的引入在經濟計量模型中,往往需要引入滯后經濟變量來反映真實的經濟關系。例如,消費=f(當期收入,前期收入)顯然,兩期收入間有較強的線性相關性。(3)樣本資料的限制
由于完全符合理論模型所要求的樣本數據較難收集,特定樣本可能存在某種程度的多重共線性。
一般經驗:
時間序列數據樣本:簡單線性模型,往往存在多重共線性。
截面數據樣本:問題不那么嚴重,但多重共線性仍然是存在的。
二、多重共線性的后果1、完全共線性情況下的后果(1)完全共線性下參數估計量不存在(2)參數估計量的方差無限大(1)參數估計值的方差增大(2)對參數區(qū)間估計時,置信區(qū)間趨于變大(3)嚴重多重共線時,假設檢驗容易做出錯誤的判斷(4)當多重共線性嚴重時,可能造成可決系數R2較高經F檢驗的參數聯合顯著性也很高,但對各個參數單獨的t檢驗卻可能不顯著,甚至可能使估計的回歸系數相反,得出完全錯誤的結論。注意:
除非是完全共線性,多重共線性并不意味著任何基本假設的違背;因此,即使出現較高程度的多重共線性,OLS估計量仍具有線性性等良好的統(tǒng)計性質。
問題在于,即使OLS法仍是最好的估計方法,它卻不是“完美的”,尤其是在統(tǒng)計推斷上無法給出真正有用的信息。1、檢驗多重共線性是否存在
(1)對兩個解釋變量的模型,采用簡單相關系數法求出X1與X2的簡單相關系數r,若|r|接近1,則說明兩變量存在較強的多重共線性。(2)對多個解釋變量的模型,采用綜合統(tǒng)計檢驗法若在OLS法下:R2與F值較大,但t檢驗值較小,說明各解釋變量對Y的聯合線性作用顯著,但各解釋變量間存在共線性而使得它們對Y的獨立作用不能分辨,故t檢驗不顯著。2、判明存在多重共線性的范圍
如果存在多重共線性,需進一步確定究竟由哪些變量引起。(1)判定系數檢驗法使模型中每一個解釋變量分別以其余解釋變量為解釋變量進行回歸,并計算相應的擬合優(yōu)度。如果某一種回歸Xji=1X1i+2X2i+LXLi的判定系數較大,說明Xj與其他X間存在共線性。具體可進一步對上述回歸方程作F檢驗:
式中:Rj?2為第j個解釋變量對其他解釋變量的回歸方程的決定系數,若存在較強的共線性,則Rj?2較大且接近于1,這時(1-Rj?2)較小,從而Fj的值較大。因此,給定顯著性水平,計算F值,并與相應的臨界值比較,來判定是否存在相關性。
構造如下F統(tǒng)計量
在模型中排除某一個解釋變量Xj,估計模型;如果擬合優(yōu)度與包含Xj時十分接近,則說明Xj與其它解釋變量之間存在共線性。另一等價的檢驗是:(2)逐步回歸法
以Y為被解釋變量,逐個引入解釋變量,構成回歸模型,進行模型估計。根據擬合優(yōu)度的變化決定新引入的變量是否獨立。
如果擬合優(yōu)度變化顯著,則說明新引入的變量是一個獨立解釋變量;
如果擬合優(yōu)度變化很不顯著,則說明新引入的變量與其它變量之間存在共線性關系。經驗規(guī)則●方差膨脹因子越大,表明解釋變量之間的多重共性越嚴重。反過來,方差膨脹因子越接近于1,多重共線性越弱?!窠涷灡砻?,方差膨脹因子≥10時,說明解釋變量與其余解釋變量之間有嚴重的多重共線性,且這種多重共線性可能會過度地影響最小二乘估計。③有些解釋變量的回歸系數所帶正負號與定性分析結果違背時,很可能存在多重共線性。④解釋變量的相關矩陣中,自變量之間的相關系數較大時,可能會存在多重共線性問題。找出引起多重共線性的解釋變量,將它排除出去。以逐步回歸法(stepwise)得到最廣泛的應用。
注意:這時,剩余解釋變量參數的經濟含義和數值都發(fā)生了變化。
如果模型被檢驗證明存在多重共線性,則需要發(fā)展新的方法估計模型,最常用的方法有三類。四、克服多重共線性的方法1、第一類方法:排除引起共線性的變量一般而言,差分后變量之間的相關性要比差分前弱得多,所以差分后的模型可能降低出現共線性的可能性,此時可直接估計差分方程。問題:差分會丟失一些信息,差分模型的誤差項可能存在序列相關,可能會違背經典線性回歸模型的相關假設,在具體運用時要慎重。
例
如:由表中的比值可以直觀地看到,增量的線性關系弱于總量之間的線性關系。
進一步分析:Y與C(-1)之間的判定系數為0.9988,△Y與△C(-1)之間的判定系數為0.9567②橫截面數據與時序數據并用首先利用橫截面數據估計出部分參數,再利用時序數據估計出另外的部分參數,最后得到整個方程參數的估計。注意:這里包含著假設,即參數的橫截面估計和從純粹時間序列分析中得到的估計是一樣的。
③變量變換變量變換的主要方法:(1)計算相對指標(2)將名義數據轉換為實際數據(3)將小類指標合并成大類指標變量數據的變換有時可得到較好的結果,但無法保證一定可以得到很好的結果。*④嶺回歸法(RidgeRegression)
70年代發(fā)展的嶺回歸法,以引入偏誤為代價減小參數估計量的方差,受到人們的重視。具體方法是:引入矩陣D,使參數估計量為
其中矩陣D一般選擇為主對角陣,即
D=aI
a為大于0的常數。(*)顯然,與未含D的參數B的估計量相比,(*)式的估計量有較小的方差。六、案例——中國糧食生產函數
根據理論和經驗分析,影響糧食生產(Y)的主要因素有:農業(yè)化肥施用量(X1);糧食播種面積(X2)成災面積(X3);農業(yè)機械總動力(X4);農業(yè)勞動力(X5)已知中國糧食生產的相關數據,建立中國糧食生產函數:Y=0+1X1+2X2+3X3
+4X4
+4X5
+
1、用OLS法估計上述模型:R2接近于1;給定=5%,得F臨界值F0.05(5,12)=3.11
F=638.4>15.19,故認上述糧食生產的總體線性關系顯著成立。但X4
、X5
的參數未通過t檢驗,且符號不正確,故解釋變量間可能存在多重共線性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)2、檢驗簡單相關系數發(fā)現:X1與X4間存在高度相關性。列出X1,X2,X3,X4,X5的相關系數矩陣:3、找出最簡單的回歸形式可見,應選第1個式子為初始的回歸模型。分別作Y與X1,X2,X4,X5間的回歸:
(25.58)(11.49)R2=0.8919F=132.1DW=1.56
(-0.49)(1.14)R2=0.075F=1.30DW
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 承攬房屋裝修工程合同
- 房地產轉讓合同集錦
- 兼職勞務合同
- 人力資源服務合同
- 德漢翻譯服務合同
- 節(jié)能設備購銷合同協議
- 禽蛋類采購合同
- 物業(yè)管理市場分析與競爭策略
- 爆破工程技術服務合同
- 軟件銷售代理合作合同
- 全國大學生英語競賽詞匯大綱
- 情緒障礙跨診斷治療的統(tǒng)一方案
- 聚焦幼兒作品分析的游戲觀察與評價
- 胸外科手術圍手術期處理
- 《企業(yè)管理課件:團隊管理知識點詳解PPT》
- 配網設備缺陷分類及管理重點標準
- 反腐倡廉廉潔行醫(yī)
- UI與交互設計人機交互設計(第二版)PPT完整全套教學課件
- 《插畫設計》課程標準
- 高考作文答題卡(作文)
- 在鄉(xiāng)村治理中深化推廣運用清單制、積分制、一張圖工作方案
評論
0/150
提交評論