面板數(shù)據(jù)回歸_第1頁
面板數(shù)據(jù)回歸_第2頁
面板數(shù)據(jù)回歸_第3頁
面板數(shù)據(jù)回歸_第4頁
面板數(shù)據(jù)回歸_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、面板數(shù)據(jù)回歸時間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù)。例如時間序列數(shù)據(jù)是變量按時間得到的數(shù)據(jù);截面數(shù)據(jù)是變量在截面空間上的數(shù)據(jù)。面板數(shù)據(jù)是同時在時間和截面上取得的二維數(shù)據(jù)。所以,面板數(shù)據(jù)(panel data)也稱時間序列截面數(shù)據(jù)(time series and cross section data)或混合數(shù)據(jù)(pool data)。 面板數(shù)據(jù),簡言之是時間序列和截面數(shù)據(jù)的混合。嚴(yán)格地講是指對一組個體(如居民、國家、公司等) 連續(xù)觀察多期得到的資料。所以很多時候我們也稱其為“追蹤資料”。近年來,由于面板數(shù)據(jù)資料的獲得變得相對容易,使其應(yīng)用范圍也不斷擴(kuò)大。1996-2002年中國15個省級地區(qū)的居民家

2、庭人均消費數(shù)據(jù)(不變價格) (例一)地區(qū)人均消費1996199719981999200020012002CP-AH(安徽) 3282.466 3646.150 3777.410 3989.581 4203.555 4495.174 4784.364CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北) 3197.339 3868.319 3896

3、.778 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龍江) 2904.687 3077.989 3289.990 3596.839 3890.580 4159.087 4493.535CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江蘇) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西) 2714.124 3136.873 3234.465 3531.

4、775 3612.722 3914.080 4544.775CP-LN(遼寧) 3237.275 3608.060 3918.167 4046.582 4360.420 4654.420 5402.063CP-NMG(內(nèi)蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山東) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.8

5、93 9336.100 10411.94CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 4787.561CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210面板數(shù)據(jù)的格式(例二)companyyearinvestmvalue11951755.9483311952891.24924.9

6、119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.631954189.62759.9當(dāng)描述截面數(shù)據(jù)時,我們用下標(biāo)表示個體,如Yi表示第i個個體的變量Y。當(dāng)描述面板數(shù)據(jù)時,我們需要其他符號來同時表示個體和時期。為此我們采用雙下標(biāo)而不是單下標(biāo),其中第一個下標(biāo)i表示個體,第二個下標(biāo)t表示觀測時間。于是Yit表示n個個體中第i個個體在T期中的第t個時期內(nèi)變量Y的觀測值。

7、面板數(shù)據(jù)用雙下標(biāo)變量表示。例如 Yit, i = 1, 2, , N; t = 1, 2, , TN表示面板數(shù)據(jù)中含有N個個體。T表示時間序列的最大長度。 對于樣本點來說:Stata中面板數(shù)據(jù)的表示companyyearinvestmvalue11951755.9483311952891.24924.9119531304.46241.7119541486.75593.621951588.22289.521952645.52159.4219536412031.321954459.32115.531951135.21819.431952157.32079.731953179.52371.63195

8、4189.62759.9短面板和長面板如果面板數(shù)據(jù) T 較小,而n 較大,這種面板數(shù)據(jù)被稱為“短面板”(short panel)。(大n小T)如fatality.dta 反之,如果T 較大,而n 較小,則被稱為“長面板”(long panel)。 (大T小n)如Grunfeld.dta 靜態(tài)面板和動態(tài)面板在面板模型中,如果解釋變量包含被解釋變量的滯后值,則稱為“動態(tài)面板”(dynamic panel);反之,則稱為“靜態(tài)面板”(static panel)。我們僅關(guān)注靜態(tài)面板。平衡面板和非平衡面板如果在面板數(shù)據(jù)中,每個時期在樣本中的個體完全一樣,則稱為“平衡面板”(balanced panel)

9、;反之,則稱為“非平衡面板”(unbalanced panel)。我們主要關(guān)注平衡面板。在stata中,首先使用xtset命令指定個體特征和時間特征,然后可以用xtdes命令顯示面板數(shù)據(jù)的結(jié)構(gòu)。 use fatality,clear xtset state year xtdes use nlswork,clear xtset idcode year xtdes 面板數(shù)據(jù)的優(yōu)勢(1)可以解決遺漏變量問題:遺漏變量偏差是一個普遍存在的問題。雖然可以用工具變量法解決,但有效的工具變量常常很難找。遺漏變量常常是由于不可觀測的個體差異或“異質(zhì)性”(heterogeneity)所造成,如果這種個體差異“不

10、隨時間而改變”(time invariant),則面板數(shù)據(jù)提供了解決遺漏變量問題的又一利器。(2)提供更多個體動態(tài)行為的信息:由于面板數(shù)據(jù)同時有截面與時間兩個維度,有時它可以解決單獨的截面數(shù)據(jù)或時間序列數(shù)據(jù)所不能解決的問題。比如,如何區(qū)分規(guī)模效應(yīng)與技術(shù)進(jìn)步對企業(yè)生產(chǎn)效率的影響。在截面數(shù)據(jù)中,由于沒有時間維度,故無法觀測到技術(shù)進(jìn)步。然而,對于單個企業(yè)的時間序列數(shù)據(jù)來說,我們無法區(qū)分其生產(chǎn)效率的提高究竟有多少是由于規(guī)模擴(kuò)大,有多少是由于技術(shù)進(jìn)步。(3)樣本容量較大:由于同時有截面維度與時間維度,通常面板數(shù)據(jù)的樣本容量更大,可以提高估計的精確度。面板數(shù)據(jù)的建模方法主要有三種:混合回歸模型固定效應(yīng)回歸

11、模型隨機(jī)效應(yīng)回歸模型實例:交通事故死亡人數(shù)和酒精稅由此我們就能得出增加啤酒稅收會導(dǎo)致更多的交通事故死亡人數(shù)嗎?不一定,這是因為這些回歸中可能存在著巨大的遺漏變量偏差。影響死亡率的因素有很多,包括:1。州內(nèi)駕駛的汽車質(zhì)量;2。高速公路的維修情況是否良好;3。大部分駕駛的路程是在鄉(xiāng)下還是市內(nèi);4。路上的汽車密度;5。社會文化能否接受酒后駕車等。這些因素都有可能與酒精稅有關(guān)。若相關(guān),則會導(dǎo)致遺漏變量偏差。一種解決這些導(dǎo)致遺漏變量偏差潛在根源的方法是收集這些變量的數(shù)據(jù),并把它們加入到上式中。不幸的是,我們很難或不可能度量諸如酒后駕車的文化接受度等變量。解決方法:固定效應(yīng)OLS回歸具有兩個時期的面板數(shù)據(jù)

12、:“前后”比較特別注意:Zi不隨時間變化結(jié)論: 兩期的變化(差分)表示的回歸消除了隨時間不變的不可觀測變量Zi的效應(yīng)。換言之,分析Y和X的變化可以控制隨時間不變的變量,于是就消除了這種產(chǎn)生遺漏變量偏差的來源。第二個式子減第一個式子,得:當(dāng)數(shù)據(jù)是在兩個不同年份里觀測得到的時候,這種“前后”分析很有效。但我們的數(shù)據(jù)集中包含7個不同年份里的觀測值,即當(dāng)T2時不能直接應(yīng)用這種“前后”比較方法。為了分析該面板數(shù)據(jù)集中的所有觀測值,我們使用固定效應(yīng)回歸方法。面板數(shù)據(jù)模型對于特定的個體i而言,Zi 表示那些不隨時間改變的影響因素,如個人的消費習(xí)慣、國家的社會制度、地區(qū)的特征、性別等,一般稱其為“個體效應(yīng)”

13、(individual effects)?;旌匣貧w模型混合回歸直接利用reg命令即可。需要注意的是,如果個體異質(zhì)性的截距項不相同,混合回歸的結(jié)果會是有偏的,甚至可能符號相反。下面的例子假設(shè)n個個體的截距不同。固定效應(yīng)模型的估計算法“個休中心化”O(jiān)LS算法或者組內(nèi)離差估計法固定效應(yīng)模型:LSDV法LSDV估計法又稱為虛擬變量法。基本思想:固定效應(yīng)模型實質(zhì)上就是在傳統(tǒng)的線性回歸模型中加入 N-1 個虛擬變量,使得每個截面都有自己的截距項。由于固定效應(yīng)模型假設(shè)存在著“個體效應(yīng)”,每個個體都有其單獨的截距項。這就相當(dāng)于在原方程中引入n1個虛擬變量(如果省略常數(shù)項,則引入n個虛擬變量)來代表不同的個體,

14、獲得每個個體的截?fù)?jù)項。如何理解個體效應(yīng)、個體截距項的不同以及虛擬變量的引入?我們用一份模擬的數(shù)據(jù)來分析: use example,clear xtset company year xtdes 1。 畫出散點圖和擬合線,并建立OLS回歸方程。2。加入虛擬變量,并重新畫出建立OLS回歸方程。gen d1=0gen d2=0gen d3=0replace d1=1 if id=1replace d2=1 if id=2replace d3=1 if id=3reg y x d1 d2reg y x固定效應(yīng)模型的stata實現(xiàn)組內(nèi)離差估計法 use fatality,clear xtset state

15、 year xtdes xtline FatalityRate固定效應(yīng)模型: xtreg FatalityRate beertax,fe回歸結(jié)果解讀1。三個R2哪個重要? 2。固定效應(yīng)為什么有兩個F檢驗?3。corr(u_i, Xb) 的含義。4。 sigma_u、sigma_e、rho的含義。1。因為固定效應(yīng)模型是組內(nèi)估計量(離差),因此,只有within是一個真正意義上的R2,其他兩個是組間相關(guān)系數(shù)的平方。2。右側(cè)的F統(tǒng)計量表示除常數(shù)項外其他解釋變量的聯(lián)合顯著性。最后一個F檢驗,原假設(shè)所有U_i=0,即不存在個體效應(yīng),不必使用固定效應(yīng)模型。首先注意:結(jié)果中的u_i不表示殘差,而是表示個體效

16、應(yīng)。3。corr(u_i, Xb) 個體效應(yīng)與解釋變量的相關(guān)系數(shù),相關(guān)系數(shù)為0或者接近于0,可以使用隨機(jī)效應(yīng)模型;相關(guān)系數(shù)不為0,需要使用固定效應(yīng)模型。4。sigma_u:表示個體效應(yīng)的標(biāo)準(zhǔn)差sigma_e:表示干擾項的標(biāo)準(zhǔn)差rho:rho = sigma_u2 / (sigma_u2 + sigma_e2) 個體效應(yīng)的波動占整個波動的比例。 LSDV法:顯示每個個體截距的方法: 方法1 tab state,gen(dum) reg FatalityRate beertax dum*,nocons 方法2 drop dum1 reg FatalityRate beertax dum* 方法3

17、xi: reg FatalityRate beertax i.state時間固定效應(yīng)回歸 個體固定效應(yīng)模型解決了不隨時間而變(time invariant)但隨個體而異的遺漏變量問題。 但還可能存在不隨個體而變(individual invariant),但隨時間而變(time varying)的遺漏變量問題。 和個體固定效應(yīng)能控制不隨時問變化但個體間不同的變量一樣,時間固定效應(yīng)能控制個體間相同但隨時間變化的變量。 比如,企業(yè)經(jīng)營的宏觀經(jīng)濟(jì)環(huán)境。 再比如:由于新車安全性能的提高是發(fā)生在全國范圍內(nèi)的。因此它們能夠減少所有州的交通死亡事故。故把汽車安全性能視為隨時間變化但對所有州都相同的遺漏變量是

18、合理的。加入用St表示的汽車安全性能的效應(yīng)后,得以下方程:其中St是只隨時間改變,不隨個體改變的變量,稱為時間固定效應(yīng)。對于此方程,可使用LSDV法來估計,即對每個時期定義一個虛擬變量,然后把T-1個時間虛擬變量包括在回歸方程中(未包括的時間虛擬變量即為基期):雙向固定效應(yīng)如果方程既考慮了個體固定效應(yīng),又考慮了時間固定效應(yīng),可以稱為“雙向固定效應(yīng)”(Two-way FE)。此時,可以分別加入個體虛擬變量和時間虛擬變量,并可通過檢驗這些虛擬變量的聯(lián)合顯著性來判斷是否應(yīng)使用雙向固定效應(yīng)模型。在上述例子中加入時間固定效應(yīng)。實際上添加了t-1個時間虛擬變量。主要反映隨著時間變化的一些特征。use fa

19、tality,clear tab year,gen(yr) edit drop yr1 reg FatalityRate beertax yr*幾乎所有時間虛擬變量均不顯著,說明本例子的時間固定效應(yīng)不明顯。在交通死亡人數(shù)中的應(yīng)用 上述形式中包含了啤灑稅,47個州二元變量(州固定效應(yīng)),6個年二元變量(時間固定效應(yīng))和截距項,所以這個模型的解釋變量個數(shù)多達(dá)55個,這將帶來大量的自由度的損失。比較參數(shù)發(fā)現(xiàn)加入時間效應(yīng)后啤酒稅的系數(shù)由-0.66變?yōu)?0.64,可見加入時間效應(yīng)對結(jié)果影響不大。隨機(jī)效應(yīng)模型對于面板數(shù)據(jù)而言,除了我們前面講的混合回歸和固定效應(yīng)模型以外,還存在另外一種模型形式:隨機(jī)效應(yīng)模型

20、。為了區(qū)別固定效應(yīng)模型和隨機(jī)效應(yīng)模型,隨機(jī)效應(yīng)模型的方程可寫為:模型貌似和固定效應(yīng)模型一樣,但不同的是:在隨機(jī)效應(yīng)模型中,ui不再作為個體效應(yīng),而是作為隨機(jī)誤差項的一部分。隨機(jī)誤差項分成兩部分,一部分是不隨時間變化的誤差項 ui,另一部分是隨時間變化的誤差項it ,即:因此:隨機(jī)效應(yīng)模型的最重要的條件是:這樣才能保證OLS是無偏的,在固定效應(yīng)模型中沒有上述要求,這也成為判別到底使用哪種模型的重要標(biāo)準(zhǔn)。關(guān)于隨機(jī)效應(yīng)模型:1。隨機(jī)效應(yīng)模型將固定效應(yīng)模型的個體效應(yīng)歸入到隨機(jī)誤差項中,因此更加靈活。2。固定效應(yīng)模型通過組內(nèi)離差的方法消除掉不隨時間改變的變量,這一方面保證了模型的無偏性,另一方面模型無法

21、估計不隨時間改變的變量之影響,這在隨機(jī)效應(yīng)模型中可以實現(xiàn)。3?;貧w的結(jié)果是隨機(jī)效應(yīng)模型的所有的個體具有相同的截距項,個體的差異主要反應(yīng)在隨機(jī)干擾項的設(shè)定上。4。由于上述特性,隨機(jī)效應(yīng)模型比固定效應(yīng)模型結(jié)果更加有效,同時,條件更加苛刻。隨機(jī)效應(yīng)模型必須滿足下列條件:其中,個體效應(yīng) u與解釋變量X和Z 均不相關(guān)。一般在固定效應(yīng)模型中,它們是相關(guān)的。隨機(jī)效應(yīng)模型:xtreg FatalityRate beertax ,re回歸結(jié)果解讀。與固定效應(yīng)模型的結(jié)果比較。3。固定效應(yīng)還是隨機(jī)效應(yīng)? Hausman檢驗基本思想:如果 , Fe 和 Re 都是一致的,但Re更有效。 如果 , Fe 仍然一致,但Re是有偏的。 因此 原假設(shè): 即應(yīng)該采用隨機(jī)效應(yīng)。 備則假設(shè) 應(yīng)該采用固定效應(yīng)。 xtreg FatalityRate beertax ,fe est store fix1 xtreg FatalityRate beertax ,re est store random1 hausman fix1 random1 hausman fix1 random1,sigmamore 本題拒絕原假設(shè),即應(yīng)該用固定效應(yīng)模型。多數(shù)實證研究都采用固定效應(yīng)模型或雙向固定效應(yīng)模型一個完整的例子 use grunfeld,clear xtset company year xtdes xtline invest xt

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論