第三講 內(nèi)生性專題 高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用課件_第1頁
第三講 內(nèi)生性專題 高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用課件_第2頁
第三講 內(nèi)生性專題 高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用課件_第3頁
第三講 內(nèi)生性專題 高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用課件_第4頁
第三講 內(nèi)生性專題 高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用課件_第5頁
已閱讀5頁,還剩118頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2200119-90-70-178-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201411高級(jí)計(jì)量經(jīng)濟(jì)學(xué)及Stata應(yīng)用第三講內(nèi)生性專題陳強(qiáng)山東大學(xué)經(jīng)濟(jì)學(xué)院qiang2chen2@126.com2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20142內(nèi)生性專題IV2SLSGMM隨機(jī)實(shí)驗(yàn)與自然實(shí)驗(yàn)雙重差分法傾向得分匹配例:農(nóng)產(chǎn)品市場均衡模型令供給等于需要可得:2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20143需求函數(shù)還是供給函數(shù)?2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20144聯(lián)立方程偏差求解聯(lián)立方程可得: 故解釋變量與擾動(dòng)項(xiàng)相關(guān),得不到一致估計(jì),稱為“聯(lián)立方程偏差”(simultaneitybias)或“內(nèi)生性偏差”(endogenietybias)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201452019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20146內(nèi)生變量 在計(jì)量經(jīng)濟(jì)學(xué)中,把所有與擾動(dòng)項(xiàng)相關(guān)的解釋變量都稱為“內(nèi)生變量”(endogenousvariables)。 如果我們能夠?qū)?nèi)生變量分成兩部分,一部分與擾動(dòng)項(xiàng)相關(guān),而另一部分與擾動(dòng)項(xiàng)不相關(guān),則有希望用與擾動(dòng)項(xiàng)不相關(guān)的那一部分得到一致估計(jì)。 對(duì)內(nèi)生變量的這種分離可以借助于另外一個(gè)“工具變量”(InstrumentalVariable,IV)來實(shí)現(xiàn)。工具變量的思想 假設(shè)存在某個(gè)因素(變量)使得供給曲線經(jīng)常移動(dòng),而需求曲線基本不動(dòng)。此時(shí),可以估計(jì)需求曲線。這個(gè)使供給曲線移動(dòng)的變量就是工具變量。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20147氣溫作為工具變量 假設(shè)影響供給方程擾動(dòng)項(xiàng)的因素可以分解為兩部分,即可觀測的氣溫x與不可觀測的其他因素:氣溫為前定變量,與兩個(gè)擾動(dòng)項(xiàng)都不相關(guān)。氣溫的變化使得供給函數(shù)沿著需求函數(shù)移動(dòng),故可估計(jì)出需求函數(shù)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201482019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20149工具變量的定義一個(gè)有效(valid)的工具變量應(yīng)滿足以下兩個(gè)條件:相關(guān)性:工具變量與內(nèi)生解釋變量相關(guān)外生性:工具變量與擾動(dòng)項(xiàng)不相關(guān)。也被稱為“排他性約束”(exclusionrestriction),因?yàn)橥馍砸馕吨?工具變量影響被解釋變量的唯一渠道是通過與其相關(guān)的內(nèi)生解釋變量,它排除了所有其他的可能影響渠道。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201410氣溫滿足工具變量的定義氣溫滿足工具變量的兩個(gè)條件:相關(guān)性:氣溫影響供給,而供給影響價(jià)格(需求方程中的內(nèi)生解釋變量),故氣溫與價(jià)格相關(guān)外生性:氣溫為前定變量,故與擾動(dòng)項(xiàng)不相關(guān)。二階段最小二乘法 傳統(tǒng)的工具變量法通過“二階段最小二乘法”(TwoStageLeastSquare,簡記2SLS或TSLS)來實(shí)現(xiàn)。 第一階段回歸:用內(nèi)生解釋變量p對(duì)工具變量回歸x,得到擬合值 。 第二階段回歸:用被解釋變量q對(duì)第一階段回歸的擬合值進(jìn)行回歸 。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014112019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014122SLS的原理 第一階段回歸的擬合值為工具變量的線性函數(shù),故也是外生的(因?yàn)楣ぞ咦兞渴峭馍模?因此,在第二階段回歸中,第一階段回歸的擬合值與擾動(dòng)項(xiàng)不相關(guān),故可得到一致估計(jì)。 2SLS的實(shí)質(zhì)是把內(nèi)生解釋變量分成兩部分,即由工具變量所造成的外生部分,以及與擾動(dòng)項(xiàng)相關(guān)的其余部分。把被解釋變量對(duì)此外生部分進(jìn)行回歸,即得到一致估計(jì)。例:宏觀模型中的消費(fèi)函數(shù) 其中,Y,C,I,G分別代表國民收入、總消費(fèi)、總投資、政府凈支出與凈出口。第一個(gè)方程為消費(fèi)方程,第二個(gè)方程為國民收入恒等式。 可以證明,如果單獨(dú)對(duì)消費(fèi)方程進(jìn)行OLS估計(jì),將得到不一致的估計(jì)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014132019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201414多個(gè)內(nèi)生變量與多個(gè)工具變量可識(shí)別的階條件(必要條件): 不可識(shí)別(unidentified):工具變量個(gè)數(shù)小于內(nèi)生解釋變量個(gè)數(shù)恰好識(shí)別(justorexactlyidentified):工具變量個(gè)數(shù)等于內(nèi)生解釋變量個(gè)數(shù)過度識(shí)別(overidentified):工具變量個(gè)數(shù)大于內(nèi)生解釋變量個(gè)數(shù)2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201415弱工具變量 如果工具變量與內(nèi)生解釋變量僅微弱相關(guān),將導(dǎo)致工具變量法估計(jì)量的漸近方差變得很大。 由于工具變量中僅包含很少與解釋變量有關(guān)的信息,利用這部分信息進(jìn)行的工具變量法估計(jì)就很不準(zhǔn)確,即使樣本容量很大也很難收斂到真實(shí)的參數(shù)值。這種工具變量稱為“弱工具變量”(weakinstruments)。 弱工具變量的后果類似于樣本容量過小,會(huì)導(dǎo)致的小樣本性質(zhì)變得很差,而的大樣本分布也可能離正態(tài)分布相去甚遠(yuǎn),致使統(tǒng)計(jì)推斷失效。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201416弱工具變量的檢驗(yàn) 在第一階段回歸中,檢驗(yàn)所有工具變量的聯(lián)合顯著性,得到F統(tǒng)計(jì)量。 經(jīng)驗(yàn)規(guī)則:如果F<10,則存在弱工具變量;反之,則不存在弱工具變量。 弱工具變量的解決方法:(1)尋找強(qiáng)工具變量;(2)如果工具變量足夠多,可舍棄弱工具變量。(3)使用有限信息最大似然估計(jì)(LimitedInformationMaximumLikelihoodEstimation,簡記LIML)2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201417工具變量的外生性 在恰好識(shí)別的情況下,無法檢驗(yàn)工具變量的外生性。只能進(jìn)行定性討論或依賴于專家的意見。 定性討論:如果工具變量是外生的,則其對(duì)被解釋變量發(fā)生影響的唯一渠道就是通過內(nèi)生變量,除此以外別無其他渠道。此條件被稱為“排他性約束”(exclusionrestriction)。 在實(shí)踐中,需要找出工具變量影響被解釋變量的所有其他可能渠道,然后一一排除,才能比較信服地說明工具變量的外生性。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201418過度識(shí)別檢驗(yàn) 在過度識(shí)別的情況下,則可進(jìn)行“過度識(shí)別檢驗(yàn)”(overidentificationtest)。 此檢驗(yàn)的大前提(maintainedhypothesis)是該模型至少是恰好識(shí)別的,即有效工具變量至少與內(nèi)生解釋變量一樣多。 在此大前提下,過度識(shí)別檢驗(yàn)的原假設(shè)為“所有工具變量都是外生的”。過度識(shí)別檢驗(yàn)的步驟 把2SLS的殘差對(duì)工具變量及外生解釋變量進(jìn)行回歸,檢驗(yàn)工具變量的系數(shù)是否聯(lián)合為0。記此輔助回歸的擬合優(yōu)度為R2。Sargan統(tǒng)計(jì)量:其中,m為工具變量個(gè)數(shù),r為內(nèi)生解釋變量個(gè)數(shù) 如果恰好識(shí)別,則m-r=0(自由度為0),義,故無法使用“過度識(shí)別檢驗(yàn)”。無定2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014192019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201420對(duì)解釋變量內(nèi)生性的檢驗(yàn)究竟該用OLS還是工具變量法? “豪斯曼檢驗(yàn)”(Hausmanspecificationtest)的原假設(shè)為“所有解釋變量均為外生變量”。如果原假設(shè)成立,則OLS比工具變量法更有效。此時(shí)使用IV,雖然是一致估計(jì)量,但“無病用藥”,反而增大估計(jì)量方差。反之,如果存在內(nèi)生解釋變量,則OLS不一致,而IV是一致的。豪斯曼檢驗(yàn)的原理 如果原假設(shè)成立,則OLS與IV都一致,即在大樣本下 與 都收斂于真實(shí)的參數(shù)值 ,因此依概率收斂于0。反之,如果不成立,則IV一致而OLS不一致,故不會(huì)收斂于0。 如果二者距離很大,則傾向于拒絕原假設(shè)。以二次型度量此距離可得:2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201421矩估計(jì)傳統(tǒng)的矩估計(jì)(MethodofMoments,MM) 假設(shè)隨機(jī)變量 ,其中 為待估參數(shù)。因?yàn)橛袃蓚€(gè)待估參數(shù),故須使用兩個(gè)總體矩條件(populationmomentconditions):一階原點(diǎn)矩:二階原點(diǎn)矩:2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201422矩估計(jì)的求解 用對(duì)應(yīng)的樣本矩(samplemoments)替代總體矩條件可得以下聯(lián)立方程組,求解可得: 矩估計(jì)的缺點(diǎn):更高階矩可能也包含有用信息,但被棄而不用。廣義矩估計(jì)(GMM)可彌補(bǔ)此缺點(diǎn)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201423IV法作為矩估計(jì) 假設(shè)最后一個(gè)解釋變量為內(nèi)生變量,其工具變量為w: 記工具向量為 ,其中外生解釋變量為自己的工具變量(符合工具變量的定義)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201424總體與樣本矩條件 “總體矩條件”或“正交條件”(orthogonalitycondition):以樣本矩代替上總體矩,即得到IV估計(jì)量:2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201425OLS也是IV矩估計(jì) 如果所有解釋變量都是前定變量,則可以將自己作為自己的工具變量。因此,X=Z。?2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014262019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201427IV矩估計(jì)的局限性傳統(tǒng)的IV矩估計(jì)僅適用于恰好識(shí)別的情形。在過度識(shí)別情況下,則一般使用2SLS。 在球型擾動(dòng)項(xiàng)(同方差、無自相關(guān))的情況下,2SLS是最有效率的。 如果存在異方差或自相關(guān),則存在更有效率的方法,即廣義矩估計(jì)。矩條件的再考察與總體矩條件 相對(duì)應(yīng)的樣本矩條件為:將上式看成聯(lián)立方程組,則未知數(shù)共有K個(gè),而方程個(gè)數(shù)為L個(gè)(的維度)。如果L<K,為不可識(shí)別,有無窮多解。如果L=K,為恰好識(shí)別,有唯一解,即 。如果L>K,為過度識(shí)別,無解;此時(shí)傳統(tǒng)的矩估計(jì)法行不通。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201428廣義矩估計(jì)的定義腦筋急轉(zhuǎn)彎:雖然無法找到 使得但總可以讓向量 盡可能地接近0。定義最小化的目標(biāo)函數(shù)為, 其中,為根據(jù)數(shù)據(jù)估計(jì)的“權(quán)重矩陣”(weightingmatrix)。所得估計(jì)量就是廣義矩估計(jì)(GeneralizedMethodofMoments,GMM)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014292019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201430廣義矩估計(jì)的優(yōu)點(diǎn) 可選擇最優(yōu)權(quán)重矩陣,使得估計(jì)量的漸近方差最小;稱為“最優(yōu)GMM”(optimalGMM)。但需要先估計(jì)最優(yōu)權(quán)重矩陣。 兩步最優(yōu)GMM:(1)進(jìn)行2SLS估計(jì)(2SLS也是一致估計(jì)),得到殘差,估計(jì)最優(yōu)權(quán)重矩陣;(2)使用此最優(yōu)權(quán)重矩陣進(jìn)行GMM估計(jì)。 迭代GMM:使用GMM殘差,估計(jì)最優(yōu)權(quán)重矩陣;重復(fù)以上步驟,直至收斂。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201431GMM與2SLS在同方差情況下,GMM=2SLS。在恰好識(shí)別情況下,GMM=2SLS。 在異方差、過度識(shí)別情況下,GMM比2SLS更有效率。GMM的過度識(shí)別檢驗(yàn) 在恰好識(shí)別的情況下,GMM的目標(biāo)函數(shù)=0。在過度識(shí)別的情況下,如果所有過度識(shí)別約束都成立,則目標(biāo)函數(shù)J應(yīng)該離0不遠(yuǎn)。如果J大于0很多,則可傾向于認(rèn)為某些過度識(shí)別約束不成立。 在原假設(shè)“所有矩條件均成立”的情況下,目標(biāo)函數(shù)本身就是檢驗(yàn)統(tǒng)計(jì)量:在同方差的情況下,J統(tǒng)計(jì)量等于Sargan統(tǒng)計(jì)量。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014322019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201433如何獲得工具變量尋找工具變量可大致分兩步:列出與內(nèi)生解釋變量相關(guān)的盡可能多的變量 的清單(這一步較容易);從這一清單中剔除與擾動(dòng)項(xiàng)相關(guān)的變量(使用exclusionrestriction的邏輯)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201434例:滯后變量作為IV 對(duì)于時(shí)間序列或面板數(shù)據(jù),常使用內(nèi)生變量的滯后變量作為IV。顯然,內(nèi)生變量與其滯后值相關(guān)。另一方面,由于滯后變量已經(jīng)發(fā)生,故為“前定”,可能與當(dāng)期擾動(dòng)項(xiàng)不相關(guān)。 Grovesetal(1994)考察國企改革(員工獎(jiǎng)金激勵(lì)制度)對(duì)企業(yè)生產(chǎn)率的作用。一般地,獎(jiǎng)金占員工中報(bào)酬比重越高,則越能促進(jìn)生產(chǎn)率的提高。但,生產(chǎn)率越高的企業(yè)越有能力給員工發(fā)獎(jiǎng)金,故存在雙向因果關(guān)系。使用獎(jiǎng)金比重的滯后值作為當(dāng)期獎(jiǎng)金比重的工具變量。二者的相關(guān)性是顯然的。另一方面,當(dāng)期的生產(chǎn)率不可能影響過去的獎(jiǎng)金比重,故獎(jiǎng)金比重的滯后值具有外生性。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201435例:警察人數(shù)與犯罪率 一般認(rèn)為,警察人數(shù)越多,執(zhí)法力度越大,則犯罪率應(yīng)該越低。但直接把犯罪率對(duì)警察人數(shù)進(jìn)行回歸,以此度量警察人數(shù)對(duì)犯罪率的作用,就會(huì)出現(xiàn)內(nèi)生變量偏差。警察人數(shù)是內(nèi)生變量;某市犯罪率越高,市政府越會(huì)增加警察人數(shù)。 Levitt(1997)創(chuàng)造性地使用“市長選舉的政治周期”作為犯罪率的工具變量。在市長連任時(shí),為了拉選票,會(huì)增加警察人數(shù),故滿足相關(guān)性。另一方面,選舉周期以機(jī)械方式確定,除了對(duì)警察人數(shù)有影響外,不會(huì)單獨(dú)地對(duì)犯罪率起作用,故滿足外生性。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201436例:制度對(duì)經(jīng)濟(jì)增長的影響 好制度能促進(jìn)增長,但制度變遷也依賴于經(jīng)濟(jì)增長。Acemogluetal(2001)使用“殖民者死亡率”(settlermortality)作為制度的工具變量。 近代歐洲殖民者在全世界殖民時(shí),由于各地氣候及疾病環(huán)境不同,歐洲殖民者的死亡率十分不同。在死亡率高的地方(比如,非洲),殖民者難以定居,故在當(dāng)?shù)亟⒙訆Z性制度。而在死亡率低的地方(比如,北美),則建立有利于經(jīng)濟(jì)增長的制度(比如,較好的產(chǎn)權(quán)保護(hù))。這種初始制度上的差異一直延續(xù)到今天。因此,殖民者死亡率與今天的制度相關(guān),滿足相關(guān)性。另一方面,殖民者死亡率除了對(duì)制度有影響外,不再對(duì)當(dāng)前的經(jīng)濟(jì)增長有任何直接影響,故滿足外生性。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201437例:看電視過多引發(fā)小兒自閉癥? 在美國,電視的普及與小兒自閉癥(autism)發(fā)生率的攀升幾乎同步。Waldmanetal(2006,2008)研究過多觀看電視是否引發(fā)小兒自閉癥。但有自閉傾向的兒童更經(jīng)??措娨?而不喜戶外活動(dòng)或與人交往;故存在雙向因果關(guān)系。 Waldmanetal(2006,2008)使用降雨量作為電視觀看時(shí)間的工具變量。二者存在相關(guān)性,即降雨越多的地區(qū),人們呆在室內(nèi)的時(shí)間越長,故看電視時(shí)間也越長;而降雨量很可能是外生的。研究結(jié)果支持多看電視為小兒自閉癥的誘因。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201438實(shí)例:年輕男子的教育回報(bào)率 Mincer(1958)最早研究了工資與受教育年限的正相關(guān)關(guān)系,但遺漏了“能力”這個(gè)變量,導(dǎo)致遺漏變量偏差。 針對(duì)美國面板調(diào)查數(shù)據(jù)中的年輕男子組群(YoungMen’sCohortoftheNationalLongitudinalSurvey,簡記NLS-Y),Griliches(1976)采用工具變量法對(duì)遺漏變量問題進(jìn)行了校正。 BlackburnandNeumark(1992)更新了Griliches(1976)的數(shù)據(jù),即本例的數(shù)據(jù)集“grilic.dta”。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201439數(shù)據(jù)集grilic.dta中的變量 lw(工資對(duì)數(shù)),s(受教育年限),age(年齡),expr(工齡),tenure(在現(xiàn)單位的工作年數(shù)),iq(智商),med(母親的受教育年限),kww(在“knowledgeoftheWorldofWork”測試中的成績),mrt(婚姻虛擬變量,已婚=1),rns(美國南方虛擬變量,住在南方=1),smsa(大城市虛擬變量,住在大城市=1),year(有數(shù)據(jù)的最早年份,1966-1973年中的某一年)。 兩期面板數(shù)據(jù),初始期為當(dāng)以上變量有數(shù)據(jù)的最早年份,結(jié)束期為1980年。不帶“80”字樣的變量名為初始期,帶“80”字樣的變量名為1980年數(shù)據(jù)。比如,iq指的是初始期的智商,而lw80指的是1980年的工資對(duì)數(shù)。數(shù)據(jù)特征use

grilic.dta,clearsum2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201440智商與教育年限的相關(guān)關(guān)系pwcorr

iq

s,sig2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201441不考慮智商(能力的代理變量)的OLSreg

lw

s

expr

tenure

rns

smsa,r2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014422019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201443解讀(1) 回歸結(jié)果顯示,教育投資的年回報(bào)率為10.26%,而且在1%的水平上顯著地不為0。這意味著,多受一年教育,則未來的工資將高出10.26%,這個(gè)教育投資回報(bào)率似乎太高了。 可能的原因是,由于遺漏變量“能力”與受教育年限正相關(guān),故“能力”對(duì)工資的貢獻(xiàn)也被納入教育的貢獻(xiàn),因此高估了教育的回報(bào)率。引入智商(iq)的OLSreg

lw

s

iq

expr

tenure

rns

smsa,r2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014442019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201445解讀(2) 加入“能力”的代理變量iq后,教育投資的回報(bào)率下降為9.28%,變得更為合理些,但仍然顯得過高。 由于用iq來度量能力存在“測量誤差”,故iq是內(nèi)生變量,考慮使用變量(med,kww)作為iq的工具變量,進(jìn)行2SLS回歸,并使用穩(wěn)健標(biāo)準(zhǔn)誤。2SLSivregress

2sls

lw

s

expr

tenure

rns

smsa (iq=med

kww),r

first2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014462019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014472019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201448解讀(3) 上表顯示,教育投資回報(bào)率降為6.08%,比較合理。下面,進(jìn)行過度識(shí)別檢驗(yàn)。過度識(shí)別檢驗(yàn)estat

overid2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014492019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201450弱工具變量檢驗(yàn) 考察有效工具變量的第二個(gè)條件,即工具變量與內(nèi)生變量的相關(guān)性。從第一階段的回歸結(jié)果可以看出,工具變量(med,kww)對(duì)內(nèi)生變量iq均有較好的解釋力,p值都小于0.05。正式的檢驗(yàn)可以通過如下命令進(jìn)行:estatfirststageF統(tǒng)計(jì)量為13.40(超過10),故不存在弱工具變量。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014512019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201452豪斯曼檢驗(yàn) 工具變量法的前提是存在內(nèi)生解釋變量。為此須進(jìn)行豪斯曼檢驗(yàn),其原假設(shè)為“所有解釋變量均為外生”,即不存在內(nèi)生變量。quietlyreglwiqsexprtenurernssmsaestimatesstoreolsquietlyivregress2slslwsexprtenurerns smsa(iq=medkww)estimatesstoreivhausmanivols,constantsigmamore 傳統(tǒng)的豪斯曼檢驗(yàn)建立在同方差的前提下,故在此不使用穩(wěn)健標(biāo)準(zhǔn)誤。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201453異方差穩(wěn)健的DWH檢驗(yàn) (接上頁)可在5%水平上拒絕“所有解釋變量均為外生”的原假設(shè),即認(rèn)為iq為內(nèi)生變量。 由于傳統(tǒng)的豪斯曼檢驗(yàn)在異方差情形下不成立,下面進(jìn)行異方差穩(wěn)健的Durbin-Wu-Hausman檢驗(yàn):estatendogenous2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014542019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201455GMM估計(jì) 如果存在異方差,則GMM比2SLS更有效率。為此,進(jìn)行如下最優(yōu)GMM估計(jì)。ivregressgmmlwsexprtenurernssmsa (iq=medkww)兩步最優(yōu)GMM的系數(shù)估計(jì)值與2SLS很接近。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201456過度識(shí)別檢驗(yàn)estat

overid由于p值為0.70,故認(rèn)為所有工具變量均為外生。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014572019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201458迭代GMMivregressgmmlwsexprtenurernssmsa (iq=medkww),igmm結(jié)果參見下頁。容易看出,迭代GMM與兩步 GMM的系數(shù)估計(jì)值相差無幾。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014592019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201460存儲(chǔ)回歸結(jié)果quietly

reg

lw

s

expr

tenure

rns

smsa,restimates

store

ols_no_iqquietly

reg

lw

iq

s

expr

tenure

rns

smsa,restimates

store

ols_with_iqquietly

ivregress

2sls

lw

s

expr

tenure

rns smsa

(iq=med

kww),restimates

store

tslsquietly

ivregress

gmm

lw

s

expr

tenure

rns smsa

(iq=med

kww)estimates

store

gmmquietly

ivregress

gmm

lw

s

expr

tenure

rns smsa

(iq=med

kww),igmmestimates

store

igmm2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201461輸出回歸結(jié)果下載非官方命令estout。ssc

install

estoutesttab

ols_no_iq

ols_with_iq

tsls

gmm

igmm,se r2

mtitle

star(*

0.1

**

0.05

***

0.01)2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201462實(shí)驗(yàn)與因果關(guān)系實(shí)驗(yàn)方法是研究因果關(guān)系的有力工具。假設(shè)我們要研究變量是否導(dǎo)致y,以及因果關(guān)系的強(qiáng)弱假定包含所有可能影響y

的因素。 不同學(xué)科可能依條件的不同而采用不同的實(shí)驗(yàn)方法,大致可以分為以下幾類。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201463實(shí)驗(yàn)的類別 (1)控制實(shí)驗(yàn)(controlledexperiment):在理想的物理實(shí)驗(yàn)中,對(duì)除 以外的因素全部控制不變,單獨(dú)讓 變化,然后觀察y變化的情況。 (2)隨機(jī)(控制)實(shí)驗(yàn)(randomizedcontrolledexperiment):比如,醫(yī)學(xué)上對(duì)新藥療效的實(shí)驗(yàn)。由于參加實(shí)驗(yàn)者的體質(zhì)與生活方式不同,不可能完全控制所有其他因素。通常將實(shí)驗(yàn)人群隨機(jī)分為兩組,“實(shí)驗(yàn)組”或“處理組”(treatmentgroup)服用真藥,“控制組”(controlgroup,對(duì)照組)服用“安慰藥”(placebo)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014642019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201465實(shí)驗(yàn)的類別(續(xù)) 例:在農(nóng)學(xué)中將地塊隨機(jī)地分成三組(因?yàn)楹茈y找到土壤條件完全一樣的地塊),分別給予不同的施肥量,然后考察施肥的效果。 (3)自然實(shí)驗(yàn)或準(zhǔn)實(shí)驗(yàn)(naturalexperimentorquasiexperiment):由于某些并非為了實(shí)驗(yàn)?zāi)康亩l(fā)生的外部突發(fā)事件,使得當(dāng)事人仿佛被隨機(jī)地分在了實(shí)驗(yàn)組或控制組。比如,一個(gè)州通過某法律,但相鄰州未通過此法律。兩州民眾事先不知道哪個(gè)州會(huì)通過此法,故無法自我選擇住在哪個(gè)州。可近似認(rèn)為民眾隨機(jī)選擇住在哪個(gè)州,或者被隨機(jī)地分在實(shí)驗(yàn)組(通過法律)與控制組(沒通過法律)。理想的隨機(jī)實(shí)驗(yàn) 實(shí)驗(yàn)組與控制組的成員決定完全隨機(jī),比如,通過拋硬幣或電腦隨機(jī)數(shù)來決定。因此,個(gè)體被分在哪一組或得到多大實(shí)驗(yàn)“處理水平”(treatmentlevel),與個(gè)體特征或其他因素完全獨(dú)立。 故解釋變量“處理水平”與被遺漏的擾動(dòng)項(xiàng)不相關(guān),可避免遺漏變量偏差(omittedvariablebias)或內(nèi)生變量偏差(endogenietybias)。例:由于 完全隨機(jī),無論遺漏多少解釋變量,OLS都一致2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201466因果效應(yīng) 在隨機(jī)實(shí)驗(yàn)中,因果效應(yīng)(causaleffect)有著清晰的定義。 在理想的隨機(jī)實(shí)驗(yàn)中,X對(duì)y的因果效應(yīng)表現(xiàn)在條件期望的差別。 即 ,也稱“處理效應(yīng)”(treatmenteffect)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201467差分估計(jì)量 如果 為虛擬變量,方程的OLS估計(jì)量為?為實(shí)驗(yàn)組的樣本均值, 為控制組的樣本均值。在回歸方程加入虛擬變量的效果相當(dāng)于給予實(shí)驗(yàn)組與控制組不同的截距項(xiàng)。另一方面,對(duì)常數(shù)項(xiàng)回歸時(shí),系數(shù)估計(jì)值便是樣本均值。故 ,?等于實(shí)驗(yàn)組均值與控制組均值之差,故稱“差分估計(jì)量”(differencesestimator)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014682019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201469例:班級(jí)規(guī)模與學(xué)習(xí)成績 美國田納西州進(jìn)行了為期四年的隨機(jī)實(shí)驗(yàn)(稱為ProjectSTAR,即Student-TeacherAchievementRatio),將幼兒園至小學(xué)三年級(jí)的學(xué)生隨機(jī)分為三組。 第一組為普通班,每班22-25名學(xué)生;第二組為小班,每班13-17名學(xué)生;第三組也為小班,但配備一名教學(xué)助理(teacher’saide)。教師也隨機(jī)分到這三類班級(jí)。 實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),盡管班級(jí)規(guī)模對(duì)學(xué)習(xí)成績的影響在統(tǒng)計(jì)上顯著,但在經(jīng)濟(jì)上并不顯著(即此效應(yīng)本身比較小,普通班與小班的成績差距類似于男生與女生的成績差距)。引入更多解釋變量 雖然在理想的隨機(jī)實(shí)驗(yàn)條件下,OLS估計(jì)量(差分估計(jì)量)是一致的,但由于遺漏了較多變量,故的方差可能較大,OLS估計(jì)效率可能不高。如果引入某些遺漏變量,可提高估計(jì)效率。也提供了檢驗(yàn) 是否完全隨機(jī)的機(jī)會(huì)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014702019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201471隨機(jī)實(shí)驗(yàn)執(zhí)行過程中可能出現(xiàn)的問題內(nèi)部有效性問題(internal

validity)外部有效性問題(external

validity)2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201472內(nèi)部有效性問題未能完全隨機(jī)分組(failure

to

randomize)未能完全遵從實(shí)驗(yàn)設(shè)計(jì)(partial

compliance)中途退出實(shí)驗(yàn)(attrition)實(shí)驗(yàn)效應(yīng)或霍桑效應(yīng)(experimental

effect或Hawthorne

effect)樣本過小2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201473外部有效性問題樣本的代表性不足(non-representative

sample)小型實(shí)驗(yàn)的條件與大規(guī)模推廣時(shí)的現(xiàn)實(shí)條件不同一般均衡效應(yīng)(general

equilibrium

effect)自我選擇效應(yīng)2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201474自然實(shí)驗(yàn) 隨機(jī)實(shí)驗(yàn)說服力強(qiáng),但成本高。自然實(shí)驗(yàn)為自然發(fā)生(非為實(shí)驗(yàn)?zāi)康亩l(fā)生),幾乎沒有成本,說服力類似于隨機(jī)實(shí)驗(yàn),為研究者青睞。 自然實(shí)驗(yàn)可分為兩類。第一類:個(gè)體的分組或處理水平完全由自然實(shí)驗(yàn)所決定,可直接用OLS估計(jì)因果效應(yīng)。 第二類:個(gè)體的分組或處理水平只是部分地由自然實(shí)驗(yàn)所決定,此時(shí)應(yīng)以自然實(shí)驗(yàn)所帶來的隨機(jī)變動(dòng)作為工具變量進(jìn)行估計(jì)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201475第一類自然實(shí)驗(yàn)的例子最低工資如何影響對(duì)低技能工人的需求? CardandKrueger(1994):在1992年,美國新澤西州通過法律將最低工資從每小時(shí)$4.25提高到$5.05,但在相鄰的賓夕法尼亞州最低工資卻保持不變。 這兩個(gè)州的雇主仿佛被隨機(jī)地分配到實(shí)驗(yàn)組(新澤西州)與控制組(賓夕法尼亞州) 收集了兩個(gè)州的快餐店在實(shí)施新法前后雇傭人數(shù)的數(shù)據(jù),發(fā)現(xiàn)提高最低工資對(duì)低技能工人的就業(yè)幾乎沒有影響。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201476第二類自然實(shí)驗(yàn)的例子服兵役是否影響退役后的長期收入? Angrist(1990)考察越戰(zhàn)期間的參軍者,當(dāng)時(shí)美國對(duì)全國年輕男子以生日抽簽的方式進(jìn)行征兵。盡管抽簽結(jié)果完全隨機(jī),但是否參軍還取決于體檢,且有些人得到豁免,另一些人未抽中卻自愿參軍。 個(gè)體分組僅部分地由自然實(shí)驗(yàn)決定,應(yīng)使用抽簽結(jié)果作為參軍與否的工具變量進(jìn)行估計(jì)。結(jié)果表明,服兵役會(huì)減少白人的長期收入,但不影響非白人的長期收入。雙重差分法做隨機(jī)實(shí)驗(yàn)或自然實(shí)驗(yàn)時(shí),實(shí)驗(yàn)效果常需一段時(shí)間才顯現(xiàn)??紤]兩期面板數(shù)據(jù)(t=1實(shí)驗(yàn)前,t=2實(shí)驗(yàn)后): 為實(shí)驗(yàn)期虛擬變量(實(shí)驗(yàn)后=1;實(shí)驗(yàn)前=0), 為不可觀測的個(gè)體特征,政策虛擬變量(policydummy)為 如果實(shí)驗(yàn)未能完全隨機(jī)化(如觀測數(shù)據(jù)),則 可能與被遺漏的個(gè)體特征 相關(guān),導(dǎo)致OLS不一致。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201477雙重差分法(續(xù))對(duì)方程進(jìn)行一階差分(第二期減第一期),以消掉 :OLS為一致估計(jì)。根據(jù)與差分估計(jì)量同樣的推理: 故稱為“雙重差分估計(jì)量”(Difference-in-Differencesestimator,簡記DD),即實(shí)驗(yàn)組的平均變化與控制組的平均變化之差。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201478雙重差分估計(jì)量示意圖2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201479擴(kuò)展對(duì)于雙重差分估計(jì)量,也可引入其他解釋變量:用OLS估計(jì)上式。 以 為被解釋變量的雙重差分法不適用于多期的數(shù)據(jù),需回到以 為被解釋變量的面板模型。仍以兩期數(shù)據(jù)為例,并忽略其他解釋變量。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201480DD的兩種形式方程與以下面板模型等價(jià): 為實(shí)驗(yàn)組虛擬變量(實(shí)驗(yàn)組=1,控制組=0); 為實(shí)驗(yàn)期虛擬變量(實(shí)驗(yàn)后=1,實(shí)驗(yàn)前=0),互動(dòng)項(xiàng)(實(shí)驗(yàn)組在實(shí)驗(yàn)期取值為1,反之為0)。 分組虛擬變量 刻畫的是實(shí)驗(yàn)組與控制組本身的差異(即使不進(jìn)行實(shí)驗(yàn),也存在此差異),實(shí)驗(yàn)期虛擬變量 刻畫的是實(shí)驗(yàn)前后兩期本身的差異(即使不進(jìn)行實(shí)驗(yàn),也存在此時(shí)間趨勢),互動(dòng)項(xiàng) 度量實(shí)驗(yàn)組的政策效應(yīng)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201481推導(dǎo)原方程:t=1時(shí),方程可寫為t=2時(shí),方程可寫為的系數(shù)就是雙重差分二者相減: 兩方程完全相同,故互動(dòng)項(xiàng)估計(jì)量。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201482推廣到多期假設(shè)共有4期數(shù)據(jù):?分別為第2-4期的時(shí)間虛擬變量(以捕捉即使沒有政策變化也可能存在的時(shí)間效應(yīng))。政策虛擬變量為 雙重差分法的優(yōu)點(diǎn)在于,同時(shí)控制了分組效應(yīng)(group-specificeffects)與時(shí)間效應(yīng)(time-specificeffects)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201483雙重差分的Stata命令sscinstalldiff (下載安裝命令diff)diffy,treat(varname)period(varname) cov(z1z2)robustreporttest “y”為結(jié)果變量( ),“treat(varname)”指定處理變量( ),“period(varname)”指定實(shí)驗(yàn)期虛擬變量( )。 “robust”表示匯報(bào)穩(wěn)健標(biāo)準(zhǔn)誤?!癱ov(z1z2)”指定其他解釋變量,“cov”表示協(xié)變量(covariate);“report”表示匯報(bào)對(duì)協(xié)變量系數(shù)的估計(jì)結(jié)果?!皌est”表示檢驗(yàn)在基期時(shí),各變量在實(shí)驗(yàn)組與控制組的均值是否相等。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014842019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201485例:最低工資的自然實(shí)驗(yàn)以數(shù)據(jù)集cardkrueger1994.dta為例被解釋變量:fte(fulltimeemployment人數(shù)) 實(shí)驗(yàn)組虛擬變量treated(treated=1,快餐店在新澤西;treated=0,快餐店在賓州),實(shí)驗(yàn)期虛擬變量t(t=1,1992年11月;t=0,1992年2月)。 其他解釋變量:bk(BurgerKing=1),kfc(KentuckyFriedChicken=1),roys(RoyRogers=1),wendys(Wendy’s=1)。手工計(jì)算雙重差分法use

cardkrueger1994,cleargen

gd=t*treated (定義交叉項(xiàng)gd)reg

fte

gd

treated

t,r處理效應(yīng)(互動(dòng)項(xiàng)gd)系數(shù)為2.914,p值為0.0942019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014862019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201487使用命令diffdifffte,t(treated)p(t)robust結(jié)果見下頁:處理效應(yīng)的系數(shù)估計(jì)值為2.914,p值為 0.094,與手工回歸的結(jié)果完全相同。 表中將“t=0”的時(shí)期稱為“Baseline”(基期),將“t=1”的時(shí)期稱為“Follow-up”(跟蹤期)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014882019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201489引入快餐品牌虛擬變量regftegdtreatedtbkkfcroys,r結(jié)果見下頁:引入其他解釋變量(即快餐品牌虛擬變量)后,處理效應(yīng)的系數(shù)估計(jì)值增大為2.935,并接近5%的顯著性水平(p值為0.058)。difffte,t(treated)p(t)cov(bkkfcroys) robust結(jié)果見下頁:與手工回歸完全一樣。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014902019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201491雙重差分法的局限性 將雙重差分法應(yīng)用于觀測數(shù)據(jù)時(shí),如果政策虛擬變量 為內(nèi)生,則依然得不到一致估計(jì)。 比如,政府提供的就業(yè)培訓(xùn)項(xiàng)目,完全由個(gè)人決定是否參與。由于實(shí)際處理水平 存在自我選擇(selfselection),并非隨機(jī)分組,導(dǎo)致不一致估計(jì) 解決方法之一:傾向得分匹配(propensityscorematching),使實(shí)驗(yàn)組與控制組在各方面特征盡可能接近。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201492Rubin’s

counterfactual

framework “處理變量”(treatmentvariable)項(xiàng)目(1=參與,0=未參與)。表示個(gè)體i是否參與未來收入或其他感興趣的結(jié)果(outcomeofinterest)為個(gè)體i的未來收入有兩種狀態(tài),取決于是否參加項(xiàng)目:為未參加項(xiàng)目的未來收入,為參加項(xiàng)目的未來收入2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201493處理效應(yīng)個(gè)體i的處理效應(yīng)(treatmenteffect):平均處理效應(yīng)(AverageTreatmentEffect,簡記ATE): 參與者平均處理效應(yīng)(AverageTreatmentEffectontheTreated,簡記ATT): 非參與者平均處理效應(yīng)(AverageTreatmentEffectontheUntreated,簡記ATU):2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201494選擇難題 個(gè)體通常會(huì)根據(jù)參加項(xiàng)目的預(yù)期收益 而自我選擇是否參加項(xiàng)目,導(dǎo)致對(duì)平均處理效應(yīng)的估計(jì)帶來困難,稱為“選擇難題”(theselectionproblem)。 與樣本選擇問題(Heckman,1979)的區(qū)別:樣本選擇問題通常不考慮某項(xiàng)目或政策的效應(yīng),故個(gè)體間的差異不在于是否得到處理,而在于是否能進(jìn)入樣本(即被解釋變量是否可觀測)隨機(jī)分組可解決選擇難題,但不適用于觀測數(shù)據(jù)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201495依可測變量選擇 除 外,還可觀測到其他個(gè)體特征,比如年齡、性別、培訓(xùn)前收入,記 ,也稱“協(xié)變量”(covariates)。 如果個(gè)體的選擇完全取決于可觀測的 ,稱為“依可測變量選擇”(selectiononobservables),則可進(jìn)行傾向得分匹配。對(duì)于“依不可測變量選擇”(selectiononunobservables),處理更為困難。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201496可忽略性假設(shè)RosenbaumandRubin(1983)引入“可忽略性”假設(shè):給定 ,則 獨(dú)立于 ,記 。 可忽略性也稱為“無混淆性”(unconfoundedness),“條件獨(dú)立假定”(ConditionalIndependenceAssumption,簡記CIA),或“依可測變量選擇”(selectiononobservables)。 可忽略性是個(gè)很強(qiáng)的假定,除非有較豐富的協(xié)變量(arichsetofcovariates)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201497匹配估計(jì)量的思想 假設(shè)個(gè)體i屬于處理組,找到屬于控制組的某個(gè)體j,使得個(gè)體j與個(gè)體i的可測變量取值盡可能相似(匹配),即 基于可忽略性假設(shè),則個(gè)體i與個(gè)體j進(jìn)入處理組的概率相近,具有可比性;故可將 作為 的估計(jì)量,即將作為對(duì)個(gè)體i處理效應(yīng)的度量。 對(duì)控制組每位個(gè)體也進(jìn)行匹配,然后對(duì)每位個(gè)體的處理效應(yīng)平均,即得到“匹配估計(jì)量”(matchingestimators)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201498傾向得分高維匹配不容易,希望用單一指標(biāo)進(jìn)行匹配。 RosenbaumandRubin(1983)使用“傾向得分”(propensityscore)來度量 與 距離。 個(gè)體i的傾向得分為,在給定組的條件概率,即的情況下,個(gè)體i進(jìn)入處理,簡記 使用傾向得分作為距離函數(shù)進(jìn)行匹配,稱為“傾向得分匹配”(PropensityScoreMatching,簡記PSM)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)201499傾向得分定理把高維數(shù)據(jù)壓縮為一維,通常會(huì)損失信息。但 傾向得分定理:如果可忽略性假定成立,則只須在給定 的情況下, 就獨(dú)立于 。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014100重疊假定 為了能夠進(jìn)行匹配,需要在 的每個(gè)可能取值上都同時(shí)存在處理組與控制組的個(gè)體,即“重疊假定”(overlapassumption)或“匹配假定”(matchingassumption)。重疊假定:對(duì)于 的任何可能取值,都有 。 重疊假定保證處理組與控制組的傾向得分取值范圍有相同部分(commonsupport)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014101控制組處理組傾向得分共同取值范圍(Common

Support)2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)20141022019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014103傾向得分匹配的步驟(1)選擇協(xié)變量 。盡量包括可能影響關(guān)變量,以滿足可忽略性假設(shè)。與 的相估計(jì)傾向得分,一般使用logit回歸。RosenbaumandRubin(1985)建議使用形式靈活的logit模型,比如包括的高次項(xiàng)與互動(dòng)項(xiàng)。進(jìn)行傾向得分匹配。匹配的具體方法見下頁。根據(jù)匹配后樣本(matchedsample)計(jì)算平均處理效應(yīng)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014104k近鄰匹配 “k近鄰匹配”(k-nearestneighbormatching),即尋找傾向得分最近的k個(gè)不同組個(gè)體。 如果k=1,則為“一對(duì)一匹配”(one-to-onematching)。 缺點(diǎn):即使“最近鄰居”也可能相去甚遠(yuǎn),從而失去可比性。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014105卡尺匹配限制傾向得分的絕對(duì)距離。一般建議,為傾向得分的樣本標(biāo)準(zhǔn)差; 稱為“卡尺匹配”(calipermatching)或“半徑匹配”(radiusmatching)。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014106卡尺內(nèi)最近鄰匹配 “卡尺內(nèi)最近鄰匹配”(nearest-neighbormatchingwithincaliper),即在給定的卡尺范圍尋找最近匹配,此法較為流行。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014107傾向得分匹配的Stata命令sscinstallpsmatch2,replace選擇項(xiàng)“replace”表示以最新版命令替代可能的舊命令psmatch2Dx1x2x3,outcome(y)logittiesate commonoddspscore(varname)quietly “D”為處理變量(treatmentvariable),“x1x2x3”為協(xié)變量,“outcome(y)”來指定結(jié)果變量“y”。選擇項(xiàng)“l(fā)ogit”表示使用logit估計(jì)傾向得分,默認(rèn)probit “ties”表示包括傾向得分相同的并列個(gè)體,默認(rèn)按排序選擇其中一位個(gè)體。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014108傾向得分匹配的Stata命令(續(xù))“ate”表示同時(shí)匯報(bào)ATE,ATU與ATT,默認(rèn)僅匯報(bào)ATT 選擇項(xiàng)“common”表示僅對(duì)共同取值范圍(commonsupport)內(nèi)個(gè)體進(jìn)行匹配,默認(rèn)對(duì)所有個(gè)體進(jìn)行匹配。 選擇項(xiàng)“odds”表示使用幾率比(oddsratio,即)進(jìn)行匹配;默認(rèn)使用傾向得分p進(jìn)行匹配。 選擇項(xiàng)“pscore(varname)”用來指定某變量作為傾向得分,默認(rèn)通過“x1x2x3”來估計(jì)傾向得分。選擇項(xiàng)“quietly”表示不匯報(bào)對(duì)傾向得分的估計(jì)過程。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014109k近鄰匹配的Stata命令psmatch2Dx1x2x3,outcome(y)neighbor(k) noreplacement 選擇項(xiàng)“neighbor(k)”表示進(jìn)行k近鄰匹配(k為正整數(shù));默認(rèn)k=1,即一對(duì)一匹配。 選擇項(xiàng)“noreplacement”表示無放回匹配,默認(rèn)為有放回;該選項(xiàng)只能用于一對(duì)一匹配。2019-07-18陳強(qiáng)計(jì)量及Stata應(yīng)用

(c)2014110卡尺匹配的Stata命令psmatch2Dx1x2x3,outcome(y)radius caliper(real)選擇項(xiàng)“radius”表示進(jìn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論