計量經(jīng)濟(jì)學(xué)第九章 面板數(shù)據(jù)模型_第1頁
計量經(jīng)濟(jì)學(xué)第九章 面板數(shù)據(jù)模型_第2頁
計量經(jīng)濟(jì)學(xué)第九章 面板數(shù)據(jù)模型_第3頁
計量經(jīng)濟(jì)學(xué)第九章 面板數(shù)據(jù)模型_第4頁
計量經(jīng)濟(jì)學(xué)第九章 面板數(shù)據(jù)模型_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章面板數(shù)據(jù)模型第一節(jié)面板數(shù)據(jù)和面板數(shù)據(jù)模型

混合數(shù)據(jù)(pooleddata)是將橫截面數(shù)據(jù)和時間序列數(shù)據(jù)結(jié)合在一起的數(shù)據(jù)。我們在第一章中曾介紹,橫截面數(shù)據(jù)模型使用同一時點不同個體(entity)的觀測值,數(shù)據(jù)可來自不同地區(qū)、公司、人員或其它個體;時間序列數(shù)據(jù)則是跨越不同時期的同一地區(qū)、同一公司、同一個人或其它同一個體的數(shù)據(jù)。橫截面時間序列混合數(shù)據(jù)則包含不同橫截面?zhèn)€體不同時期的數(shù)據(jù),或者說,混合數(shù)據(jù)包含既跨越時間又跨越空間的數(shù)據(jù)。

如果混合數(shù)據(jù)包含的觀測值來自同一批地區(qū)、公司、人員或其它橫截面?zhèn)€體的不同時期數(shù)據(jù),則此類混合數(shù)據(jù)稱為面板數(shù)據(jù)(paneldata)。面板數(shù)據(jù)通常比非面板混合數(shù)據(jù)更有用,這是因為面板數(shù)據(jù)中的地區(qū)、公司、人員等橫截面?zhèn)€體在各時期中一直保持不變,這使得我們更易于對隨著時間的推移所發(fā)生的變動進(jìn)行比較。我們將基于面板數(shù)據(jù)的回歸模型稱為面板數(shù)據(jù)模型(paneldatamodel)。面板數(shù)據(jù)模型正在得到日益廣泛的應(yīng)用,文獻(xiàn)也很多。限于篇幅,我們在這里只能做一個入門性的介紹。需要深入研究的讀者,請參閱有關(guān)參考文獻(xiàn)。Baltagi,B.H.(2001),EconometricAnalysisofPaneldata,(Wiley:Chichester)HsiaoC.(2003),AnalysisofPanelData,2ndEdition,(CambridgeUniversityPress)影印版由北京大學(xué)出版社出版,2005

本章中,我們將用一個貫穿始終的例子來說明估計面板數(shù)據(jù)模型的各種方法。我們的數(shù)據(jù)來自以下4個產(chǎn)業(yè):產(chǎn)業(yè)1:鋼鐵;產(chǎn)業(yè)2:橡膠、塑料;產(chǎn)業(yè)3:石制品、陶瓷制品和玻璃制品;產(chǎn)業(yè)4:紡織模型中用到的變量是:Yit=i產(chǎn)業(yè)第t年出口額,單位:百萬美元,不變價EMPit=i產(chǎn)業(yè)第t年就業(yè)人數(shù),單位:千人OTMit=i產(chǎn)業(yè)第t年平均每周加班小時數(shù)

我們收集了上述4個產(chǎn)業(yè)這3個變量1980-2000各年的數(shù)據(jù)。事實上,對于這3個變量中的每一個,都有84個觀測值(4個產(chǎn)業(yè)乘以21年)。由于在每個時期(每一年)都是這4個產(chǎn)業(yè),因此這些混合數(shù)據(jù)是面板數(shù)據(jù),如表9-1所示。我們可以通過分別運行4個回歸來分析這些數(shù)據(jù),每個產(chǎn)業(yè)一個回歸:

使用表9-1的數(shù)據(jù)估計(9.1)-(9.4),由于每個產(chǎn)業(yè)有21年的數(shù)據(jù),因此每個回歸中觀測值個數(shù)都是21。這種分別對4個產(chǎn)業(yè)進(jìn)行回歸的缺點在于可能錯失包含在混合數(shù)據(jù)集中的那種一個產(chǎn)業(yè)影響另一個產(chǎn)業(yè)的信息。換句話說,一個產(chǎn)業(yè)的數(shù)據(jù)中可能包含有對于估計其它某個產(chǎn)業(yè)的回歸系數(shù)有價值的信息,而這種分別估計每個產(chǎn)業(yè)方程的做法無法利用這些信息,這意味著估計值不夠準(zhǔn)確。如果我們能夠?qū)?個產(chǎn)業(yè)的數(shù)據(jù)結(jié)合在一起,我們的樣本規(guī)模就會增大,從而可以使用所有可獲得的信息估計系數(shù)。

因此,我們需要討論那些允許我們使用混合數(shù)據(jù)的全部信息的估計技術(shù),將跨時間跨空間的數(shù)據(jù)結(jié)合在一起,而不是分別進(jìn)行時間序列和橫截面數(shù)據(jù)的回歸。要做到這一點,最簡單的方法是,假定截距和斜率對于所有產(chǎn)業(yè)和所有時期都是一樣的,進(jìn)行下面的回歸:

這里每個變量的觀測值個數(shù)都是84。我們用表9-1中全部數(shù)據(jù)估計此方程,結(jié)果如下:

這種方法的致命缺陷是,估計出來的系數(shù)只有在我們前面關(guān)于截距和斜率對于所有產(chǎn)業(yè)和所有時期都是同樣的值的假設(shè)成立的情況下才有用,實際情況當(dāng)然不是如此,比如說,很難想象每個時期中每個產(chǎn)業(yè)的就業(yè)人數(shù)與其出口額之間的關(guān)系都相同,增加1000名工人對不同產(chǎn)業(yè)出口額的影響應(yīng)當(dāng)是不同的。因此,采用模型(9.5)是不合適的,我們下面討論可用于面板數(shù)據(jù)模型的其它估計方法。第二節(jié)表面不相關(guān)回歸表面不相關(guān)回歸(Seeminglyunrelatedregression,SUR)是一組似乎不相關(guān)但實際上相關(guān)的回歸方程。表面不相關(guān)回歸方程看上去不相關(guān)是因為它們類似于方程(9.1)-(9.4)。在前面說到可以分別對它們運行四個回歸時,我們事實上有一個冒失而錯誤的假設(shè):各產(chǎn)業(yè)互不相干,因而我們可以分別估計每一個回歸方程?;氐椒匠蹋?.1)-(9.4):

在表面不相關(guān)回歸中,各個回歸之間實際上確實有關(guān)聯(lián)。表面不相關(guān)回歸容許各個回歸方程的擾動項之間存在跨方程相關(guān),如上面四個方程中的諸u在任何一個時期中不必相互獨立,即不同方程的擾動項之間可以存在同期相關(guān)。這樣,SUR估計程序就可以使用擾動項的相關(guān)來改善估計值。各個回歸之間任何的相關(guān)都是有價值的信息,它可能是告訴我們某時期中發(fā)生了某些不止影響一個產(chǎn)業(yè)的變化或事件,這一變化并沒有被任何一個自變量捕捉到,而只能反映在擾動項中。SUR程序用此信息來改善系數(shù)估計值。大多數(shù)計量經(jīng)濟(jì)分析軟件都有運行SUR的命令,表面不相關(guān)回歸步驟如下:1.用OLS法分別估計每個方程,計算和保存回歸中得到的殘差;2.用這些殘差來估計擾動項方差和不同回歸方程擾動項之間的協(xié)方差;3.上一步估計的擾動項方差和協(xié)方差被用于執(zhí)行廣義最小二乘法,得到各方程系數(shù)的估計值。

表面不相關(guān)回歸得到的估計值是一致估計值。在下面兩種情況下,表面不相關(guān)回歸與分別運行OLS回歸結(jié)果相同:(1)若各方程的擾動項之間的協(xié)方差都等于0;(2)若各方程的自變量都相同,并且每個自變量的每個觀測值亦相同。例如,在方程(9.1)-(9.4)中都加上一個自變量-貨幣供給,該變量在任何一年的觀測值都相同,與所研究是哪個產(chǎn)業(yè)無關(guān)。如果所有的自變量都是如此,表面不相關(guān)回歸與普通最小二乘回歸結(jié)果相同。用SUR方法和表9-1中的數(shù)據(jù)估計方程(9.1)-(9.4),結(jié)果如下:

初看上去,這些結(jié)果似乎是分別回歸的結(jié)果,但它們不是??绠a(chǎn)業(yè)擾動項協(xié)方差的估計值被SUR程序用來改善估計值,如前面所說的那樣,這是為什么說表面不相關(guān)回歸實際上是由相關(guān)的回歸組成。在我們的例子中,SUR結(jié)果與四個方程的OLS結(jié)果差不多。然而,在很多情況下,表面不相關(guān)回歸顯著改善用最小二乘法得到得估計值。第三節(jié)固定影響模型固定影響模型(Fixedeffectsmodel)將橫截面?zhèn)€體之間的差異解釋為截距不同,而斜率系數(shù)相同。它處理地區(qū)、公司、人員或其它橫截面?zhèn)€體之間差異的思路是允許截距變動,不同的橫截面?zhèn)€體(如我們例子中的不同產(chǎn)業(yè))的截距是不同的,但每個產(chǎn)業(yè)的截距在各個時期則保持不變。在固定影響模型的假定下,面板數(shù)據(jù)中所有橫截面數(shù)據(jù)和時間序列數(shù)據(jù)都可用于同一個回歸。固定影響模型類似于上一節(jié)中所有數(shù)據(jù)簡單結(jié)合在一起的混合模型(9.5)式,不同的是,這里橫截面中每一個體有它自己的截距:

固定影響模型通過使用虛擬變量的方法來解決截距變動問題。對于我們的例子,有4個產(chǎn)業(yè)部門,我們應(yīng)當(dāng)設(shè)3個虛擬變量,因為設(shè)3個就可以區(qū)分4個產(chǎn)業(yè)的截距,并且,如果設(shè)4個虛擬變量的話,我們會掉進(jìn)所謂“虛擬變量陷阱”,而造成完全的多重共線性。在固定影響模型中,我們有另一種避開虛擬變量陷阱的方法,就是在模型中去掉常數(shù)項,然后為每個產(chǎn)業(yè)設(shè)一個虛擬變量:D1=1觀測值來自產(chǎn)業(yè)1;0其它產(chǎn)業(yè)D2=1觀測值來自產(chǎn)業(yè)2;0其它產(chǎn)業(yè)D3=1觀測值來自產(chǎn)業(yè)3;0其它產(chǎn)業(yè)D4=1觀測值來自產(chǎn)業(yè)4;0其它產(chǎn)業(yè)

可寫出本章例子的固定影響模型如下:

4個產(chǎn)業(yè)的截距項分別為產(chǎn)業(yè)1:β3產(chǎn)業(yè)2:β4產(chǎn)業(yè)3:β5產(chǎn)業(yè)4:β6回歸結(jié)果如下:

從結(jié)果中看到R2很高,對于固定影響模型來說,通常如此。這是因為各截距項虛擬變量捕捉了橫截面?zhèn)€體之間的差異。固定影響模型的高R2會造成一種虛假的表象,但實際并不象R2的值所展示的那么好?;貧w結(jié)果中沒有給出各虛擬變量系數(shù)的t值或標(biāo)準(zhǔn)誤差,這是因為EViews軟件不報告固定影響模型中虛擬變量的t值或標(biāo)準(zhǔn)誤差。

我們可以利用回歸結(jié)果來檢驗4個產(chǎn)業(yè)的截距是否相同,原假設(shè)和備擇假設(shè)是:

檢驗的具體做法與我們在第四章中介紹的涉及多個系數(shù)的聯(lián)合假設(shè)檢驗類似,即首先進(jìn)行約束回歸和無約束回歸,然后用得到的兩個殘差平方和計算F檢驗量,進(jìn)行檢驗。

本例中約束回歸就是回歸(9.5)式:(9.5)式中只有一個截距項,這與本例原假設(shè)(各產(chǎn)業(yè)截距相等)是一樣的。而無約束回歸就是固定影響模型(9.6)式:因為它允許不同產(chǎn)業(yè)的截距取不同值。

約束回歸和無約束回歸的殘差平方和可從(9.5)式和(9.6)式的回歸結(jié)果中查出,分別為2,675,700,466和790,590,705。約束的數(shù)目為3而不是4,這是因為在原假設(shè)中,任何一個虛擬變量的系數(shù),如,可取任意值,但其它3個則必須取和相同的值,這表明有3個約束。無約束回歸的殘差平方和的自由度并非n-k-1,而是n-k,這是因為無約束回歸模型中沒有常數(shù)項。本例中F檢驗量計算如下:

查表,5%顯著性水平下,F(xiàn)(3,78)=2.77,因為F=61.99>Fc=2.77,故拒絕原假設(shè)H0。結(jié)論:4個產(chǎn)業(yè)的截距不全相等。

由于使用虛擬變量,固定影響模型(9.6)式亦稱為最小二乘虛擬變量模型(LSDV模型)。固定影響模型可通過再加上斜率虛擬變量的辦法推廣到一般情形。然而,既包含截距虛擬變量又包含斜率虛擬變量的模型幾乎等同于各產(chǎn)業(yè)分別回歸的方法。二者的區(qū)別是,加上斜率虛擬變量的固定影響模型中,擾動項方差對于整個樣本必須是相同的,因為是一個回歸方程。而分別回歸,則每個回歸的擾動項方差可以不同,即每個產(chǎn)業(yè)或每個橫截面?zhèn)€體的擾動項方差可以不同。第四節(jié)隨機(jī)影響模型隨機(jī)影響模型(randomeffectsmodel)像固定影響模型一樣,通過允許截距變動來處理橫截面?zhèn)€體之間的差異,但變動的數(shù)量是隨機(jī)的。如果橫截面?zhèn)€體是隨機(jī)地被選擇出來以代表一個較大的總體,則采用隨機(jī)影響模型比較合適。不同的橫截面?zhèn)€體的不同截距被認(rèn)為是從一個正態(tài)分布總體中隨機(jī)抽取的。

固定影響模型假定不同產(chǎn)業(yè)截距間的差異是確定的,而不是隨機(jī)的,它假定截距的不同是因為各產(chǎn)業(yè)有一些不同的特性。隨機(jī)影響模型則假定我們例子中的每一個產(chǎn)業(yè)是從一個總體中抽取的,截距之間的差異是因為隨機(jī)變差引起的。隨機(jī)影響模型通常用于諸橫截面?zhèn)€體是某個總體的一個樣本的情況,例如,家計調(diào)查得到的面板數(shù)據(jù)。隨機(jī)影響模型將所有數(shù)據(jù)放在一起回歸,初看上去很像常規(guī)的OLS回歸:

這里沒有截距虛擬變量,這使得它的自由度要大于固定影響模型。應(yīng)注意的是,上式中截距項與OLS回歸中的截距項不同,這里代表的是截距的均值,真實的截距隨產(chǎn)業(yè)或其它橫截面?zhèn)€體而變,產(chǎn)業(yè)間截距的差異反映在擾動項u中。擾動項u有兩個分量,其中一個滿足OLS關(guān)于擾動項的假設(shè)條件,另一個分量代表每個產(chǎn)業(yè)的截距與截距均值之間的差異,這個分量不隨時間而變,但對于每個產(chǎn)業(yè)都不同。由于擾動項的這個分量不隨時間而變,因此隨機(jī)影響模型中的擾動項u將不滿足OLS關(guān)于各期擾動項互不相關(guān)的假設(shè)條件,這意味著OLS不能使用。

很多計量經(jīng)濟(jì)軟件讓你能夠方便地運行隨機(jī)影響模型,步驟如下:對整個橫截面時間序列混合樣本執(zhí)行OLS回歸;用第一步得到的殘差估計擾動項的方差和協(xié)方差;用第二步得到的方差協(xié)方差估計值執(zhí)行GLS回歸,給出隨機(jī)影響模型的GLS估計值;某些軟件使用第三步的結(jié)果,估計每個橫截面?zhèn)€體的截距與截距均值的差異。

將隨機(jī)影響方法應(yīng)用于我們的產(chǎn)業(yè)模型,回歸模型為:此式看上去像是(5)式中OLS回歸,所有產(chǎn)業(yè)的截距都相同??墒?,這里各產(chǎn)業(yè)都有自己的截距,截距的均值和真值間的差異包含在擾動項u中。正如上面所說,這意味著擾動項u不滿足OLS假設(shè)。按前述四步回歸,結(jié)果如下:

將隨機(jī)影響和固定影響的結(jié)果比較一下,發(fā)現(xiàn)兩組自變量系數(shù)的估計值差別很小,并且都在1%顯著性水平顯著,說明在本例的情況下,使用兩種方法均可。但在其他情況下,就可能有較大差別。

有些計量經(jīng)濟(jì)程序還給出讓你能夠求出每個產(chǎn)業(yè)截距的信息。本例中每個·產(chǎn)業(yè)截距與常數(shù)項(均值)的差異如下:產(chǎn)業(yè)1:5178.14產(chǎn)業(yè)2:4748.35產(chǎn)業(yè)3:-3361.66產(chǎn)業(yè)4:-6564.83由此可知,鋼鐵產(chǎn)業(yè)截距與之差為5178.14。這表明,鋼鐵產(chǎn)業(yè)截距的估計值為-22,831.07+5178.14=-17,652.93小結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論