第十三章 面板數(shù)據(jù)原理(共14頁)_第1頁
第十三章 面板數(shù)據(jù)原理(共14頁)_第2頁
第十三章 面板數(shù)據(jù)原理(共14頁)_第3頁
第十三章 面板數(shù)據(jù)原理(共14頁)_第4頁
第十三章 面板數(shù)據(jù)原理(共14頁)_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、PAGE PAGE 18面板(min bn)數(shù)據(jù)模型1面板(min bn)數(shù)據(jù)定義。時間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù)。例如時間序列數(shù)據(jù)是變量按時間得到(d do)的數(shù)據(jù);截面數(shù)據(jù)是變量在截面空間上的數(shù)據(jù)。面板數(shù)據(jù)(panel data)也稱時間序列截面數(shù)據(jù)(time series and cross section data)或混合數(shù)據(jù)(pool data)。面板數(shù)據(jù)是同時在時間和截面空間上取得的二維數(shù)據(jù)。面板數(shù)據(jù)示意圖見圖1。面板數(shù)據(jù)從橫截面(cross section)上看,是由若干個體(entity, unit, individual)在某一時刻構(gòu)成的截面觀測值,從縱剖面(longit

2、udinal section)上看是一個時間序列。面板數(shù)據(jù)用雙下標變量表示。例如yi t, i = 1, 2, , N; t = 1, 2, , TN表示面板數(shù)據(jù)中含有N個個體。T表示時間序列的最大長度。若固定t不變,yi ., ( i = 1, 2, , N)是橫截面上的N個隨機變量;若固定i不變,y. t, (t = 1, 2, , T)是縱剖面上的一個時間序列(個體)。圖1 N=7,T=50的面板數(shù)據(jù)示意圖例如1990-2000年30個省份的農(nóng)業(yè)總產(chǎn)值數(shù)據(jù)。固定在某一年份上,它是由30個農(nóng)業(yè)總產(chǎn)總值數(shù)字組成的截面數(shù)據(jù);固定在某一省份上,它是由11年農(nóng)業(yè)總產(chǎn)值數(shù)據(jù)組成的一個時間序列。面板數(shù)

3、據(jù)由30個個體組成。共有330個觀測值。對于面板數(shù)據(jù)yi t, i = 1, 2, , N; t = 1, 2, , T來說,如果從橫截面上看,每個變量都有觀測值,從縱剖面上看,每一期都有觀測值,則稱此面板數(shù)據(jù)為平衡面板數(shù)據(jù)(balanced panel data)。若在面板數(shù)據(jù)中丟失若干個觀測值,則稱此面板數(shù)據(jù)為非平衡面板數(shù)據(jù)(unbalanced panel data)。注意:EViwes 3.1、4.1、5.0既允許用平衡面板數(shù)據(jù)也允許用非平衡面板數(shù)據(jù)估計模型。例1(file:panel02):1996-2002年中國東北、華北、華東(Hudng)15個省級地區(qū)的居民家庭人均消費(不變價

4、格)和人均收入數(shù)據(jù)見表1和表2。數(shù)據(jù)是7年的,每一年都有15個數(shù)據(jù),共105組觀測值。人均消費和收入(shur)兩個面板數(shù)據(jù)都是平衡面板數(shù)據(jù),各有15個個體。人均消費和收入的面板數(shù)據(jù)從縱剖面觀察分別見圖2和圖3。從橫截面觀察分別見圖4和圖5。橫截面數(shù)據(jù)散點圖的表現(xiàn)與觀測值順序有關(guān)。圖4和圖5中人均消費和收入觀測值順序是按地區(qū)名的漢語拼音字母順序排序的。表1 1999-2002年中國(zhn u)東北、華北、華東15個省級地區(qū)的居民家庭人均消費數(shù)據(jù)(不變價格)地區(qū)人均消費1996199719981999200020012002CP-AH(安徽) 3282.466 3646.150 3777.41

5、0 3989.581 4203.555 4495.174 4784.364CP-BJ(北京) 5133.978 6203.048 6807.451 7453.757 8206.271 8654.433 10473.12CP-FJ(福建) 4011.775 4853.441 5197.041 5314.521 5522.762 6094.336 6665.005CP-HB(河北) 3197.339 3868.319 3896.778 4104.281 4361.555 4457.463 5120.485CP-HLJ(黑龍江) 2904.687 3077.989 3289.990 3596.839

6、 3890.580 4159.087 4493.535CP-JL(吉林) 2833.321 3286.432 3477.560 3736.408 4077.961 4281.560 4998.874CP-JS(江蘇) 3712.260 4457.788 4918.944 5076.910 5317.862 5488.829 6091.331CP-JX(江西) 2714.124 3136.873 3234.465 3531.775 3612.722 3914.080 4544.775CP-LN(遼寧) 3237.275 3608.060 3918.167 4046.582 4360.420 46

7、54.420 5402.063CP-NMG(內(nèi)蒙古) 2572.342 2901.722 3127.633 3475.942 3877.345 4170.596 4850.180CP-SD(山東) 3440.684 3930.574 4168.974 4546.878 5011.976 5159.538 5635.770CP-SH(上海) 6193.333 6634.183 6866.410 8125.803 8651.893 9336.100 10411.94CP-SX(山西) 2813.336 3131.629 3314.097 3507.008 3793.908 4131.273 478

8、7.561CP-TJ(天津) 4293.220 5047.672 5498.503 5916.613 6145.622 6904.368 7220.843CP-ZJ(浙江) 5342.234 6002.082 6236.640 6600.749 6950.713 7968.327 8792.210資料來源:中國統(tǒng)計年鑒1997-2003。表2 1999-2002年中國東北、華北、華東15個省級地區(qū)的居民家庭人均收入數(shù)據(jù)(不變價格)地區(qū)人均收入1996199719981999200020012002IP-AH(安徽) 4106.251 4540.247 4770.470 5178.528 525

9、6.753 5640.597 6093.333IP-BJ(北京) 6569.901 7419.905 8273.418 9127.992 9999.700 11229.66 12692.38IP-FJ(福建) 4884.731 6040.944 6505.145 6922.109 7279.393 8422.573 9235.538IP-HB(河北) 4148.282 4790.986 5167.317 5468.940 5678.195 5955.045 6747.152IP-HLJ(黑龍江) 3518.497 3918.314 4251.494 4747.045 4997.843 5382

10、.808 6143.565IP-JL(吉林) 3549.935 4041.061 4240.565 4571.439 4878.296 5271.925 6291.618IP-JS(江蘇) 4744.547 5668.830 6054.175 6624.316 6793.437 7316.567 8243.589IP-JX(江西) 3487.269 3991.490 4209.327 4787.606 5088.315 5533.688 6329.311IP-LN(遼寧) 3899.194 4382.250 4649.789 4968.164 5363.153 5797.010 6597.08

11、8IP-NMG(內(nèi)蒙古) 3189.414 3774.804 4383.706 4780.090 5063.228 5502.873 6038.922IP-SD(山東) 4461.934 5049.407 5412.555 5849.909 6477.016 6975.521 7668.036IP-SH(上海) 7489.451 8209.037 8773.100 10770.09 11432.20 12883.46 13183.88IP-SX(山西) 3431.594 3869.952 4156.927 4360.050 4546.785 5401.854 6335.732IP-TJ(天津)

12、 5474.963 6409.690 7146.271 7734.914 8173.193 8852.470 9375.060IP-ZJ(浙江) 6446.515 7158.288 7860.341 8530.314 9187.287 10485.64 11822.00資料來源:中國統(tǒng)計年鑒1997-2003。 圖2 15個省級地區(qū)(dq)的人均消費序列(縱剖面) 圖3 15個省級地區(qū)(dq)的人均收入序列(file:4panel02) 圖4 15個省級地區(qū)(dq)的人均消費散點圖 圖5 15個省級地區(qū)的人均收入散點圖(7個橫截面疊加)(每條連線表示同一年度15個地區(qū)的消費值) (每條連線表示

13、同一年度15個地區(qū)的收入值)用CP表示消費,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分別表示安徽省、北京市、福建省、河北省、黑龍江省、吉林省、江蘇省、江西省、遼寧省、內(nèi)蒙古自治區(qū)、山東省、上海市、山西省、天津市、浙江省。15個地區(qū)7年人均消費對收入的面板數(shù)據(jù)散點圖見圖6和圖7。圖6中每一種符號代表一個省級地區(qū)的7個觀測點組成的時間序列。相當于觀察15個時間序列。圖7中每一種符號代表一個年度的截面散點圖(共7個截面)。相當于觀察7個截面散點圖的疊加。圖6 用15個時間序列(xli)表示的人均消費對收入的

14、面板數(shù)據(jù)圖7 用7個截面(jimin)表示的人均消費對收入的面板數(shù)據(jù)(7個截面疊加) 為了觀察得更清楚一些(yxi),圖8給出北京和內(nèi)蒙古1996-2002年消費對收入散點圖。從圖中可以看出,無論是從收入還是從消費看內(nèi)蒙古的水平都低于北京市。內(nèi)蒙古2002年的收入與消費規(guī)模還不如北京市1996年的大。圖9給出該15個省級地區(qū)1996和2002年的消費對收入散點圖。可見6年之后15個地區(qū)的消費和收入都有了相應(yīng)的提高。 圖8 北京和內(nèi)蒙古1996-2002年消費對收入時序圖 圖9 1996和2002年15個地區(qū)的消費對收入散點圖2面板(min bn)數(shù)據(jù)的估計。用面板數(shù)據(jù)建立的模型通常有3種。即混

15、合估計(gj)模型、固定效應(yīng)模型和隨機效應(yīng)模型。2.1 混合估計(gj)模型。如果從時間上看,不同個體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS)估計參數(shù)。如果從時間和截面看模型截距都不為零,且是一個相同的常數(shù),以二變量模型為例,則建立如下模型, yit = +1 xit +it, i = 1, 2, , N; t = 1, 2, , T (1) 和1不隨i,t變化。稱模型(1)為混合估計模型。以例1中15個地區(qū)1996和2002年數(shù)據(jù)建立關(guān)于消費的混合估計模型,得結(jié)果如下:圖10 EViwes估計方法:在打開工

16、作文件窗口的基礎(chǔ)上,點擊主功能菜單中的Objects鍵,選New Object功能,從而打開New Object(新對象)選擇窗。在Type of Object選擇區(qū)選擇Pool(混合數(shù)據(jù)庫),點擊OK鍵,從而打開Pool(混合數(shù)據(jù))窗口。在窗口中輸入15個地區(qū)標識AH(安徽)、BJ(北京)、ZJ(浙江)。工具欄中點擊Sheet鍵,從而打開Series List(列寫序列名)窗口,定義變量CP?和IP?,點擊OK鍵,Pool(混合或合并數(shù)據(jù)庫)窗口顯示面板數(shù)據(jù)。在Pool窗口的工具欄中點擊Estimate鍵,打開Pooled Estimation(混合估計)窗口如下圖。圖11在Dependen

17、t Variable(相依變量)選擇窗填入CP?;在Common coefficients(系數(shù)相同)選擇窗填入IP?;Cross section specific coefficients(截面系數(shù)不同)選擇窗保持(boch)空白;在Intercept(截距項)選擇窗點擊(din j)Common;在Weighting(權(quán)數(shù)(qunsh))選擇窗點擊No weighting。點擊Pooled Estimation(混合估計)窗口中的OK鍵。得輸出結(jié)果如圖10。相應(yīng)表達式是= 129.6313 +0.7587 IPit (2.0) (79.7) R2 = 0.98, SSEr = 482458

18、8, t0.05 (103) = 1.9915個省級地區(qū)的人均支出平均占收入的76%。如果從時間和截面上看模型截距都為零,就可以建立不含截距項的( = 0)的混合估計模型。以二變量模型為例,建立混合估計模型如下, yit = 1 xit +it, i = 1, 2, , N; t = 1, 2, , T (2)對于本例,因為上式中的截距項有顯著性(t = 2.0 t0.05 (103) = 1.99),所以建立截距項為零的混合估計模型是不合適的。EViwes估計方法:在Pooled Estimation(混合估計)對話框中Intercept(截距項)選擇窗中選None,其余選項同上。2.2 固

19、定效應(yīng)模型。在面板數(shù)據(jù)散點圖中,如果對于不同的截面或不同的時間序列,模型的截距是不同的,則可以采用在模型中加虛擬變量的方法估計回歸參數(shù),稱此種模型為固定效應(yīng)模型(fixed effects regression model)。固定效應(yīng)模型分為3種類型,即個體固定效應(yīng)模型(entity fixed effects regression model)、時刻固定效應(yīng)模型(time fixed effects regression model)和時刻個體固定效應(yīng)模型(time and entity fixed effects regression model)。下面分別介紹。(1)個體固定效應(yīng)模型。個

20、體固定效應(yīng)模型(mxng)就是對于不同的個體有不同截距的模型。如果對于不同的時間序列(個體)截距是不同的,但是對于不同的橫截面,模型的截距沒有顯著性變化,那么就應(yīng)該建立個體固定效應(yīng)模型,表示如下, yit = 1 xit +1 W1 + 2 W2 + +N WN +it, t = 1, 2, , T (3)其中(qzhng)Wi =it, i = 1, 2, , N; t = 1, 2, , T,表示(biosh)隨機誤差項。yit, xit, i = 1, 2, , N; t = 1, 2, , T分別表示被解釋變量和解釋變量。模型(3)或者表示為 y1t = 1 +1 x1t +1t, i

21、 = 1(對于第1個個體,或時間序列),t = 1, 2, , T y2t = 2 +1 x2t +2 t, i = 2(對于第2個個體,或時間序列),t = 1, 2, , T yN t = N +1 xN t + N t, i = N(對于第N個個體,或時間序列),t = 1, 2, , T寫成矩陣形式,y1 = (1 x1)+1 = 1 + x1 +1yN = (1 xN)+N = N + xN +N上式中yi,i,i,xi都是N1階列向量。為標量。當模型中含有k個解釋變量時,為k1階列向量。進一步寫成矩陣形式,= + + 上式中的元素1,0都是T1階列向量。 面板數(shù)據(jù)模型用OLS方法估

22、計時應(yīng)滿足如下5個假定條件:(1)E(it|xi1, xi2, , xiT, i) = 0。以xi1, xi2, , xiT, i為條件的it的期望等于零。(2)(xi1, xi2, , xiT), ( yi1, yi2, , yiT), i = 1, 2, , N分別來自于同一個聯(lián)合分布總體,并相互獨立。(3)(xit, it)具有非零的有限值4階矩。(4)解釋變量之間不存在完全共線性。(5)Cov(it is|xit,xis, i) = 0, t s。在固定效應(yīng)模型中隨機誤差項it在時間上是非自相關(guān)的。其中xit代表一個或多個解釋變量。對模型(1)進行(jnxng)OLS估計,全部參數(shù)估計

23、量都是無偏的和一致的。模型的自由度是N T 1N。 當模型(mxng)含有k個解釋(jish)變量,且N很大,相對較小時,因為模型中含有k + N個被估參數(shù),一般軟件執(zhí)行OLS運算很困難。在計量經(jīng)濟學(xué)軟件中是采用一種特殊處理方式進行OLS估計。估計原理是,先用每個變量減其組內(nèi)均值,把數(shù)據(jù)中心化(entity-demeaned),然后用變換的數(shù)據(jù)先估計個體固定效應(yīng)模型的回歸系數(shù)(不包括截距項),然后利用組內(nèi)均值等式計算截距項。這種方法計算起來速度快。具體分3步如下。(1)首先把變量中心化(entity-demeaned)。仍以單解釋變量模型(3)為例,則有 = i + 1+, i = 1, 2,

24、 , N (4)其中=,=,=, i = 1, 2, , N。公式(1)、(4)相減得, (yit -) = 1(xit -) + (it -) (5)令(yit -) =,(xit -) =,(it -) =,上式寫為 = 1+ (6)用OLS法估計(1)、(6)式中的1,結(jié)果是一樣的,但是用(6)式估計,可以減少被估參數(shù)個數(shù)。(2)用OLS法估計回歸參數(shù)(不包括截距項,即固定效應(yīng))。 在k個解釋變量條件下,把用向量形式表示,則利用中心化數(shù)據(jù),按OLS法估計公式計算個體固定效應(yīng)模型中回歸參數(shù)估計量的方差協(xié)方差矩陣估計式如下,() = ()-1 (7)其中=,是相對于的殘差向量。(3)計算回歸

25、模型截距項,即固定效應(yīng)參數(shù)i。=- (8)以例1(file:panel02)為例得到的個體固定效應(yīng)模型估計結(jié)果如下:注意:個體固定效應(yīng)模型的EViwes輸出(shch)結(jié)果中沒有公共截距項。圖12EViwes估計(gj)方法:在EViwes的Pooled Estimation對話框中Intercept選項中選(zhng xun)Fixed effects。其余選項同上。注意:(1)EViwes輸出結(jié)果中沒有給出描述個體效應(yīng)的截距項相應(yīng)的標準差和t值。不認為截距項是模型中的重要參數(shù)。(2)當對個體固定效應(yīng)模型選擇加權(quán)估計時,輸出結(jié)果將給出加權(quán)估計和非加權(quán)估計兩種統(tǒng)計量評價結(jié)果。(3)點擊View

26、選Residuals/Table, Graphs, Covariance Matrix, Correlation Matrix功能可以分別得到按個體計算的殘差序列表,殘差序列圖,殘差序列的方差協(xié)方差矩陣,殘差序列的相關(guān)系數(shù)矩陣。從結(jié)果看,北京、上海、浙江是消費函數(shù)截距(自發(fā)消費)最大的3個地區(qū)。相對于混合估計模型來說,是否有必要建立個體固定效應(yīng)模型可以通過F檢驗來完成。原假設(shè)H0:不同個體的模型截距項相同(建立混合估計模型)。備擇假設(shè)(jish)H1:不同個體(gt)的模型截距項不同(建立個體固定效應(yīng)模型)。F統(tǒng)計(tngj)量定義為:F= (9)其中SSEr,SSEu分別表示約束模型(混合估

27、計模型)和非約束模型(個體固定效應(yīng)模型)的殘差平方和。非約束模型比約束模型多了N-1個被估參數(shù)。(混合估計模型給出公共截距項。)注意:當模型中含有k個解釋變量時,F(xiàn)統(tǒng)計量的分母自由度是NT-N-k。 用上例計算,已知SSEr = 4824588,SSEu = 2270386,F(xiàn)= 7.15F0.05(14, 89) = 1.81因為F= 7.15 F0.05(14, 89) = 1.81,所以,拒絕原假設(shè)。結(jié)論是應(yīng)該建立個體固定效應(yīng)模型。(2)隨機效應(yīng)模型在固定效應(yīng)模型中采用虛擬變量的原因是解釋被解釋變量的信息不夠完整。也可以通過對誤差項的分解來描述這種信息的缺失。 yit = + 1 xit

28、 + it (14)其中誤差項在時間上和截面上都是相關(guān)的,用3個分量表示如下。it = ui + vt + wit (15)其中ui N(0, u2)表示截面隨機誤差分量;vt N(0, v2)表示時間隨機誤差分量;wit N(0, w2)表示混和隨機誤差分量。同時還假定ui,vt,wit之間互不相關(guān),各自分別不存在截面自相關(guān)、時間自相關(guān)和混和自相關(guān)。上述模型稱為隨機效應(yīng)模型。隨機效應(yīng)模型和固定效應(yīng)模型比較,相當于把固定效應(yīng)模型中的截距項看成兩個隨機變量。一個是截面隨機誤差項(ui),一個是時間隨機誤差項(vt)。如果這兩個隨機誤差項都服從正態(tài)分布,對模型估計時就能夠節(jié)省自由度,因為此條件下只

29、需要估計兩個隨機誤差項的均值和方差。假定固定效應(yīng)模型中的截距項包括了截面隨機誤差項和時間隨機誤差項的平均效應(yīng),而且對均值的離差分別是ui和vt,固定效應(yīng)模型就變成了隨機效應(yīng)模型。為了容易理解,先假定模型中只存在截面隨機誤差項ui,不存在時間隨機誤差分量(vt), yit = + 1 xit + (wit+ ui) = + 1 xit +it (16)截面隨機誤差項ui是屬于第個個體的隨機波動分量,并在整個時間范圍(t = 1,2, , T)保持不變。隨機誤差項ui, wit應(yīng)滿足如下條件:E(ui) =0, E(wit) = 0E(wit 2) = w2, E(ui 2)= u2,E(wit

30、uj) =0, 包括(boku)所有的i, t, j。E(wit wjs) =0, i j, t sE(ui uj) =0, i j因為(yn wi)根據(jù)上式有it = wit+ ui所以這種隨機效應(yīng)模型又稱為(chn wi)誤差分量模型(error component model)。有結(jié)論,E(it ) = E(wit +uj) = 0,(16)式,yit = + 1 xit + (wit+ ui),也可以寫成yit = ( + ui) + 1 xit + wit。服從正態(tài)分布的截距項的均值效應(yīng)u被包含在回歸函數(shù)的常數(shù)項中。E(it 2) = E(wit +uj)2 = w2 +u2,E(i

31、t is) = E(wit+ ui)(wis+ ui) = E(wit wis + ui wis + wit ui + ui2) =u2, t s 令i = (i1, i2, iT)則 = E(ii) = =w2 I(TT) +u2 1(T1) 1(T1) 其中I(TT)是(TT)階單位陣,1(T1)是(T1)階列向量。因為第i期與j期觀測值是相互獨立的,所以NT個觀測值所對應(yīng)的隨機誤差項的方差與協(xié)方差矩陣V是V = = = INN 其中INN表示由(T1)階列向量為元素構(gòu)成的單位陣,其中每一個元素1或0都是(T1)階列向量。表示科羅內(nèi)克積(Kronecker product)。其運算規(guī)則是 ANKB =檢驗個體隨機效應(yīng)的原假設(shè)與檢驗統(tǒng)計量是H0:u2 = 0。(混合估計模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論