第六講工具變量回歸_第1頁
第六講工具變量回歸_第2頁
第六講工具變量回歸_第3頁
第六講工具變量回歸_第4頁
第六講工具變量回歸_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、工具變量回歸Ill八OLS經(jīng)典假設(shè)岳有的解釋變量心與隨機誤 差項彼此之間不相關(guān)。Cov(皿 Xi) = 0若解釋變量Xi和Hi相關(guān),貝!IOLS估計量是非一致的,也就是即使當樣本容量很大時,OLS估|=MB flBk計量也不會接近回歸系數(shù)的真值。當解釋變量和隨機誤差項相關(guān)時,模型存在著 內(nèi)生性問題。在計量經(jīng)濟學(xué)中,把所有與擾動項相關(guān) 的解釋變量都稱為“內(nèi)生變量”。這與 一般經(jīng)濟學(xué)理論中的定義有所不同。廠1。與誤差項相關(guān)的變量稱為內(nèi)生變量 (endogenous variable) o廣2。與誤差項不相關(guān)的變量稱為外生變量(exogenous variable)。因很多,但我們主要考慮如下幾個方

2、面: 曠遺漏變量偏差 曠變量有測量誤差雙向因果關(guān)系。遺漏變量偏差假設(shè)真實的模型為V. = X, 3 +乙乩八Zb 1/2'21 I而實際估計的模型為x- = xiA + ui遺漏變量(omitted vai-inbbs)尤;0被歸入新擾動項色中去了??紤]以下兩種情形,(1)遺漏變量血與解釋變量殲不相關(guān),即Cov(£“2)二0。在這種情況下,擾動 項冷與解釋變量以不相關(guān),根據(jù)大樣本理論,OLS依然可以一致地估計何。但由于遺漏變 量曲2被歸入擾動項冷中,可能增大擾動項的方弟,從而影響OLS估計的精確度。(2)遺漏變量如與解釋變量州相關(guān),即Cov(嗎“2)工0。在這種情況下,根據(jù)大

3、 樣本理論,OLS不再是一致的,其偏差被稱為“遺漏變量偏差” (omittedvariablebias)0這 種偏差在計量實賤中較常見,成為某些實證研究的致命傷。比如,在研究教育投資回報時, 個體的先天能力因為無法觀測血披遺漏,但能力與受教育年限很可能存在正相關(guān)。°變量有測量誤差測量數(shù)據(jù)正確時:假設(shè)方程為:Yi 00 + 0Xi + Hi當存在測量誤差時:方程為:X = 0O + 01 + W所以我們有:X = 0o + 0i 常+ H=00 + 01 常 + 0i(Xi 常)+ UiM = 01(X-施)+ /可知,誤差項中包含 Xi-所以可以得到:如果Coy(Xi 老,老)H0

4、則回歸結(jié)果有偏,非一致我們假設(shè)豬=Xi + Wi則有八(J2XCY 兀 + b wc: lo 由,因此A即使在大樣本下也偏向于o2o回歸的性質(zhì)決定于w的標準差a八(T X(y2W00 0”>22a x +awc八CT xcr2w0 二cr x +cr w雙商因果萸系7之前我們假定因果關(guān)系是從回歸變量到因變 量的(X導(dǎo)致了Y)。但如果因果關(guān)系同時也 是從因變量到一個或多個回歸變量(Y導(dǎo)致 了X)的呢?如果是這樣的話,因果關(guān)系是 向前的也是“向后”的,即存在雙向因果 關(guān)系,如果存在雙向因果關(guān)系,貝!IOLS回歸 中同時包含了這兩個效應(yīng),因此OLS估計量 是有偏的、非一致的。(“口 - D /

5、= (rn 吆)4。9也+丈乂 + “ 二?x 呦+ X射+唱='A1歸中加入遺漏變,量的方法加以解決,但前提是只有當你有遺漏 變量數(shù)據(jù)時上述方法才可行。廣雙向因果關(guān)系偏差是指如果有時因果關(guān)系是從 X到Y(jié)又從Y到X時,此時僅用多元回歸無法消 除這一偏差。同樣,r變量有測量誤差也無法用我們前面學(xué)過的方法 解決。r因此我們就必須尋找一種新的方法。工具變量(instrumehtabvariable, IV)回 *"" 歸是當回歸變量X與誤差項u相關(guān)時獲得總體回歸方程未知系數(shù)一致估計量的一般方法O 我們經(jīng)常稱其為IV估計。廠其基本思想是:假設(shè)方程是:Yt =金 +直&

6、; +叫,匚=1, 2, , n我們假設(shè)w與X湘關(guān),則OLS估計量一定是 有偏的和非一致的。工具變量估計是利用另 曠我們的工作就是要尋找相應(yīng)的工具變量將解一個“工具”變量Z將X份離成與u湘關(guān)和不相關(guān)的兩部分。釋變量分解成內(nèi)生變量和外生變量,然后利用兩階段最小二乘法(TSLS)進行估計。工具變量的選取一個有效的工具變量必須滿足稱為工具變量相關(guān) 性和工具變量外生性兩個條件:即(1)工具變量相關(guān)性:工具變量與所替代 的隨機解釋變量高度相關(guān);Cov(Zi, X)豐 0(2)工具變量外生性:工具變量與隨機誤差 項不相關(guān);CoV(Ui Zi) = 0么廠兩階段最小二乘估計量曠若工具變量Z滿足工具變量相關(guān)性

7、和外生性的 條件,貝!I可用稱為兩階段最小二乘(TSLS)的 IV估計量估計系數(shù)屍。兩階段最小二乘估計量分兩階段計算:廠第一階段把X分解成兩部分:即與回歸誤差項相關(guān)的1部分以及與誤差項無關(guān)的一部分。r第二階段是利用與誤差項無關(guān)的那部分進行估計。一般IV回歸模型一般IV回歸模型為y< = A)+01X” +直x缸+0屮昭口+介卄w< + %1因變量丫遷2.外生解釋變量W1P W2P .Wrio3內(nèi)生解釋變量X1P X2P .Xkio4我們引入工具變量、Z2P .Zmio第一階段回歸:利用OLS建立每個內(nèi)生變量 (X" X2P .Xki)關(guān)于工具變量(為、Z2P和外生變量(W

8、1P W2P的回歸,并得到所有回歸結(jié)果的擬合值Xhato 第二階段回歸:用Xi_hat取代原有的為,與原有 的外生變量W起進行第二次回歸,得到TSLS 統(tǒng)計量B tsls。注意:工具變量出現(xiàn)在第一階段回歸,但不出 現(xiàn)在第二階段回歸。引入工具變量的個數(shù)=存假設(shè)我們有n個內(nèi)生解釋變量,引入了m個工 具變量,n和m的關(guān)系是什么?n=m恰好識別曠nvm過度識別n>m不可識別曠只有恰好識別和過度識別才能用IV方法估計。f兩階段最小二乘法的st ata命令:I=Jr ivregress 2sls depvar varlistl (varlist2 =instlist)/r/firstr其中,“dep

9、var,為被解釋變量,varlistl為外生解釋變量,varlist2為所有的內(nèi)生解釋變量集合,instlist為工具變量集合。廠選擇項表示使用異方差穩(wěn)健的標準誤,選擇項“first,表示顯示第一階段的回歸。Q工具變量有效性的檢驗廣工具變量相關(guān)性r工具變量相關(guān)性越強,也就是工具變量能解釋越多 的X變動,則:IV回歸中能用的信息就越多,因此利用 相關(guān)性更強的工具變量得到的估計量也更精確Or弱工具變量:如果雖然Cov(Zi. Xi)主0 c但是 Cov(Zi, X) q 0 r弱工具變量幾乎不能解釋X的變動。弱工具變量檢驗準則r 1.偏R2 (Shea's partial R2)廣含義:在

10、第一階段回歸中,在控制外生變量 影響的前提下,看其它變量對某內(nèi)生變量的 解釋力,或者說,在第一階段回歸中,剔除 掉外生變量的影響。曠2最小特征值統(tǒng)計量F:經(jīng)驗上F應(yīng)該大于10。Stata命令:r estat firststagezall forcenonrobust廣 3 Cragg-Donald Wald F 統(tǒng)計量 r 4 Kleibergen-Paap Wald rk F 統(tǒng)計量”r Stata命令:ivreg2=J廣1.如果有很多工具變量,有部分強工具變量和部分 弱工具變量,可以舍棄較弱的工具變量而選用相關(guān)性 較強的工具變量子集。在stata中,可以使用ivreg2 命令進行“冗余檢驗

11、”,以決定選擇舍棄哪個工具變 量。(直觀上,冗余工具變量是那些第一階段回歸中 不顯著的變量。)2.如果系數(shù)是恰好識別的,則你不能略去弱工具變量。在這種情況下,有兩個選擇: 廣第一個選擇是尋找其他較強的工具變量。(難度較大) 第二個選擇是利用弱工具變量繼續(xù)進行實證分 析,但采用的方法不再是TSLS。而是對弱工 具變量不太敏感的有限信息極大似然法(LIML)o在大樣本下,LIML與2SLS是漸近 等價的,但在存在弱工具變量的情況下,LIML的小樣本性質(zhì)可能優(yōu)于2SLS。LIML的Stata命令為 ivregress liml depvar varlistl (varlist2 =instlist)

12、Q工具變量外生性的檢驗=廣剛才我們提到:只有恰好識別和過度識別才 能用IV方法估計。=1=1曠一個很重要的命題是:只有過度識別情況下 才能檢驗工具變量的外生性,而恰好識別情 況下無法檢驗。廣基本思想:假設(shè)有一個內(nèi)生回歸變量,兩個工具變量且沒 有包含的外生變量。則你可以計算兩個不同的 TSLS估計量:其中一個利用第一個工具變量, 而另一個利用第二個工具變量。由于抽樣變異 性,這兩個估計量不會相同,但如果兩個工具 變量都是外生的,則這兩個估計量往往比較接 近。如果由這兩個工具變量得到估計非常不同, 則你可以得出其中一個或兩個工具變量都有內(nèi) 生性問題的結(jié)論。識別標準:廠Sargan統(tǒng)計量 廣J統(tǒng)計量

13、 廣C統(tǒng)計量 曠過度識別檢驗的Statar estat over id命令:曠豪斯曼檢驗 廠原假設(shè)為: 廠H0 :所有解釋變量均為外生變量reg y xl x2est store ols廣 ivregress 2sls y xl (x2=zl z2) est store ivr hausman iv olsz sigmamore=j=1力上述檢驗的缺點是,它假設(shè)在HO成立的情況三 下,OLS最有效率。但如果存在異方差, OLS并不最有效率(不是BLUE)O故傳統(tǒng)的 豪斯曼檢驗不適用于異方差的情形。了此時可以使用杜賓-吳-豪斯曼檢驗(DWH), 該檢驗在異方差的情況下也適用,更為穩(wěn)健。stata

14、 命令:r estat endogenous廣義矩估計法? GMM基本思想:求解如下一般化目標函數(shù),使之最小化J(b_GMM) = n*g(b_GMM),*W*g(b_GMM)其中,W為權(quán)重矩陣 廣在球型擾動項的假定下,2SLS是最有效的。但如果擾動項存在異方差或自相關(guān),則廣義矩估計方法效 果更好。r GMM方法又分為兩步GMM法和迭代GMM方法。曠有關(guān)GMM的Stata命令為r ivregress gmm y xl (x2=zl z2)(兩步 GMM)r ivregress gmm y xl (x2=zl z2)figmm (迭代GMM)r estat overid (過度識別檢驗)Minc

15、er (1958)最早研究了工資與受教育年限的正相關(guān)關(guān)系,但遺漏了 “能力”這個變量,導(dǎo)致遺漏變量偏差。針對美國面板調(diào)查數(shù)據(jù)中的年輕男子組群(Young Men5sCohort of the National Longitudinal Survey,簡記 NLS-Y), Griliches (1976) 采用工具變量法對遺漏變量問題進行了校正O Blackburn and Neumark (1992)更新r 了 Griliches (1976)的數(shù)據(jù),即這個例子中 將要使用的數(shù)據(jù)集grilic.dta。力該數(shù)據(jù)集中包括以下變量:(工資對數(shù)rH|S(受教育年限),age(年齡),exp(工齡),

16、 tenure(在現(xiàn)革位的工作年數(shù)),iq(智商), med(母親的受教育年限),kww(社“knowledge of the World of Work”測試中的成績),mrt(婚姻虛擬變量,已婚"), ns(美國南方虛擬變量,住在南方=1), smsa(大城市虛擬變量,住在大城市=1), year (有數(shù)據(jù)的最早年份,19661973年中 的某一年)。LU.。這是一個兩期面板數(shù)據(jù),初始期為當以上變量 有數(shù)據(jù)的最早年份,結(jié)束期為1980年。不帶 80字樣的變量名為初始期,帶80字樣的變量名為1980年數(shù)據(jù)。比如,iq指的是初始期的 智商,而lw80指的是1980年的工資對數(shù)。use

17、 grilic.dta,clear sumr (2)考察智商與受教育年限的相關(guān)關(guān)系。pwcorr iq szsig (3)建立如下方程:Zw80 = 0S8O + 02 exp r80 + j33tenure80 + wreg lw80 s80 expr80 tenure80刖我們發(fā)現(xiàn)了如下問題;'rlo遺漏變量問題:認為方程遺漏了 “能力” 這個變量,加入iq (智商)作為“能力”的代 理變量。reg lw80 s80 iq expr80 tenure80在誤差。3。變量內(nèi)生性問題:S80可能與擾動項中除“能力” 以外的其他因素相關(guān),因此是內(nèi)生變量。解決方法:引入四個變量med,kw

18、w, mrt, age, 作為內(nèi)生解釋變量iq與s80的工具變量。r然后使用TSLS方法進行回歸。ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age), first廣使用兩步GMM oivreg (s80ress gmm lw80 expr80 tenure80 iq=med kww mrt age)廠使用迭代GMM oivreg (s80ress gmm lw80 expr80 tenure80 iq=med kww mrt age)zigrnm-勺幾點注意事“ Srio first選項的目的是顯示TSLS第一階段的 結(jié)果,

19、如果省略,則僅顯示第二階段的結(jié)果。曠2。命令的用法比較嚴格,將被解釋變量和 所有外生解釋變量放到括號外面,內(nèi)生解釋 變量放到括號里面,等號后面為所有工具變r3o 2SLS只能通過stata完成,利用定義手 動計算的結(jié)果是錯誤的,因為殘差序列是錯 誤的。的工具變量,而是給所有內(nèi)生變量指定一系列工具變量O 廣5。所有外生變變量都作為自己的工具變量。 曠6。為了檢驗工具變量的外生性,本題為過度 識別。<7o在大樣本下,IV估計是一致的,但在小 樣本下,IV估計并非無偏估計量,有些情況 下偏誤可能很嚴重。鄉(xiāng)X弱工具變量檢驗=;廣檢驗方法:rlo初步判斷可以用偏R2(partial IV)(剔除掉

20、模型中原有外生變量的影響)。2o Minimum eigenvalue statistic(最小 特征值統(tǒng)計量),經(jīng)驗上此數(shù)應(yīng)該大于10。 這個方法類似于與書上的“第一階段F統(tǒng)計O么乞壬宣變量外生性礎(chǔ)曠我們一般稱為過度識別約束J檢驗。廣檢驗工具變量是否與干擾項相關(guān),即工具變量 是否為外生變量。TSLS根據(jù)Sargan統(tǒng)計量進行過度識別檢驗。 命令為:estat overid 檢驗工具變量的外H0:所有工具變量都是外生的。H1:至少有一個工具變量不是外生的,與擾 動項相關(guān)。ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age)f

21、firstestat firststagefall forcenonrobustestat firststage estat overid么廠究竟該用OLS還是IV曠解釋變量是否真的存在內(nèi)生性?假設(shè)能夠找到方程外的工具變量。廣1。如果所有解釋變量都是外生變量,貝!IOLS比IV更有效。在這種情況下使用IV,雖然估 計量仍然是一致的,會增大估計量的方差。2O如果存在內(nèi)生解釋變量,則OLS是不一 致的,而IV是一致的。檢驗方法:豪斯曼檢驗檢驗二* 曠豪斯曼檢驗(Hausman specification test) HO:所有解釋變量均為外生變量。Hl:至少有一個解釋變量為內(nèi)生變量。quietly

22、 reg lw80 s80 expr80 tenure80 iq est store olsquietly ivregress 2sls lw80 expr80 tenure80 (s80 iq=med kww mrt age) est store ivhausman iv olsIw = 0S + 02 exp r + tenure + J34rns + /35smsa + wreg Iw s expr tenure rns smsa,r引入智商(iq)作為“能力”的代理變量,再 進行OLS回歸。reg Iw s iq expr tenure rns smsafr7 r(2)由于用iq來度量

23、能力存在“測量誤差”, 敲iq是內(nèi)生交量,考慮使用變量(me* kww, mrt, age)作為iq的工具變量,建行2SLS回 歸,并使用穩(wěn)健標準誤。r ivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age)fr first廣(3)進行過度識別檢驗,考察是否所有工具變量均外生,即與擾動項不相關(guān)。r estat overid/ (4)我們懷疑(m九age)不滿足外生性,故使用C統(tǒng)計量檢驗這兩個工具變量的外生性。findit ivreg2廠 ivreg2 lw s expr tenure rns smsa (iq=med kww

24、mrt age)zr orthog(mrt age)f (5)考慮僅使用變量(med丿kww)作為iq的 工具變量,再次進行2SLS回歸。ivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first2再次進行過度識別檢驗:estat overidr(6)弱工具變量檢驗estat firststage,all forcenonrobust廠(7)為了穩(wěn)健起見,下面使用對弱工具變量更 不敏感的有限信息最大似然法(LIML):ivregress liml lw s expr tenure rns smsa (iq=med kww),rf ' (8)進一步考察翡工具變量問題,對工具變 量kww進行冗奈檢驗r ivreg2 lw s expr tenure rns smsa (iq=med kww)fr redundant(kww)廣(9)利用豪斯曼檢驗判斷是否存在內(nèi)生解釋 變量。廣 qui reg lw iq s expr tenure rns smsa rest store olslrqui ivregress 2sls lw s expr tenure rns smsa (iq=med kww)estimates store ivl么No)由于穆統(tǒng)的豪斯曼檢驗在異方差的情形*

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論