12.面板數(shù)據(jù)回歸ppt課件.ppt_第1頁(yè)
12.面板數(shù)據(jù)回歸ppt課件.ppt_第2頁(yè)
12.面板數(shù)據(jù)回歸ppt課件.ppt_第3頁(yè)
12.面板數(shù)據(jù)回歸ppt課件.ppt_第4頁(yè)
12.面板數(shù)據(jù)回歸ppt課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

面板數(shù)據(jù)回歸 1 時(shí)間序列數(shù)據(jù)或截面數(shù)據(jù)都是一維數(shù)據(jù) 例如時(shí)間序列數(shù)據(jù)是變量按時(shí)間得到的數(shù)據(jù) 截面數(shù)據(jù)是變量在截面空間上的數(shù)據(jù) 面板數(shù)據(jù)是同時(shí)在時(shí)間和截面上取得的二維數(shù)據(jù) 所以 面板數(shù)據(jù) paneldata 也稱(chēng)時(shí)間序列截面數(shù)據(jù) timeseriesandcrosssectiondata 或混合數(shù)據(jù) pooldata 2 面板數(shù)據(jù) 簡(jiǎn)言之是時(shí)間序列和截面數(shù)據(jù)的混合 嚴(yán)格地講是指對(duì)一組個(gè)體 如居民 國(guó)家 公司等 連續(xù)觀察多期得到的資料 所以很多時(shí)候我們也稱(chēng)其為 追蹤資料 近年來(lái) 由于面板數(shù)據(jù)資料的獲得變得相對(duì)容易 使其應(yīng)用范圍也不斷擴(kuò)大 3 1996 2002年中國(guó)15個(gè)省級(jí)地區(qū)的居民家庭人均消費(fèi)數(shù)據(jù) 不變價(jià)格 例一 4 面板數(shù)據(jù)的格式 例二 5 當(dāng)描述截面數(shù)據(jù)時(shí) 我們用下標(biāo)表示個(gè)體 如Yi表示第i個(gè)個(gè)體的變量Y 當(dāng)描述面板數(shù)據(jù)時(shí) 我們需要其他符號(hào)來(lái)同時(shí)表示個(gè)體和時(shí)期 為此我們采用雙下標(biāo)而不是單下標(biāo) 其中第一個(gè)下標(biāo)i表示個(gè)體 第二個(gè)下標(biāo)t表示觀測(cè)時(shí)間 于是Yit表示n個(gè)個(gè)體中第i個(gè)個(gè)體在T期中的第t個(gè)時(shí)期內(nèi)變量Y的觀測(cè)值 6 面板數(shù)據(jù)用雙下標(biāo)變量表示 例如Yit i 1 2 N t 1 2 TN表示面板數(shù)據(jù)中含有N個(gè)個(gè)體 T表示時(shí)間序列的最大長(zhǎng)度 對(duì)于樣本點(diǎn)來(lái)說(shuō) 7 Stata中面板數(shù)據(jù)的表示 8 在stata中 首先使用xtset命令指定個(gè)體特征和時(shí)間特征 然后可以用xtdes命令顯示面板數(shù)據(jù)的結(jié)構(gòu) usefatality clearxtsetstateyearxtdes 9 短面板和長(zhǎng)面板 如果面板數(shù)據(jù)T較小 而n較大 這種面板數(shù)據(jù)被稱(chēng)為 短面板 shortpanel 大n小T 如fatality dta反之 如果T較大 而n較小 則被稱(chēng)為 長(zhǎng)面板 longpanel 大T小n 如Grunfeld dta 10 面板數(shù)據(jù)的優(yōu)勢(shì) 1 可以解決遺漏變量問(wèn)題 遺漏變量偏差是一個(gè)普遍存在的問(wèn)題 雖然可以用工具變量法解決 但有效的工具變量常常很難找 遺漏變量常常是由于不可觀測(cè)的個(gè)體差異或 異質(zhì)性 heterogeneity 所造成 如果這種個(gè)體差異 不隨時(shí)間而改變 timeinvariant 則面板數(shù)據(jù)提供了解決遺漏變量問(wèn)題的又一利器 2 提供更多個(gè)體動(dòng)態(tài)行為的信息 由于面板數(shù)據(jù)同時(shí)有截面與時(shí)間兩個(gè)維度 有時(shí)它可以解決單獨(dú)的截面數(shù)據(jù)或時(shí)間序列數(shù)據(jù)所不能解決的問(wèn)題 11 比如 如何區(qū)分規(guī)模效應(yīng)與技術(shù)進(jìn)步對(duì)企業(yè)生產(chǎn)效率的影響 在截面數(shù)據(jù)中 由于沒(méi)有時(shí)間維度 故無(wú)法觀測(cè)到技術(shù)進(jìn)步 然而 對(duì)于單個(gè)企業(yè)的時(shí)間序列數(shù)據(jù)來(lái)說(shuō) 我們無(wú)法區(qū)分其生產(chǎn)效率的提高究竟有多少是由于規(guī)模擴(kuò)大 有多少是由于技術(shù)進(jìn)步 3 樣本容量較大 由于同時(shí)有截面維度與時(shí)間維度 通常面板數(shù)據(jù)的樣本容量更大 可以提高估計(jì)的精確度 12 面板數(shù)據(jù)的建模方法主要有三種 固定效應(yīng)回歸模型隨機(jī)效應(yīng)回歸模型混合回歸模型 13 實(shí)例 交通事故死亡人數(shù)和酒精稅 14 15 由此我們就能得出增加啤酒稅收會(huì)導(dǎo)致更多的交通事故死亡人數(shù)嗎 不一定 這是因?yàn)檫@些回歸中可能存在著巨大的遺漏變量偏差 16 影響死亡率的因素有很多 包括 1 州內(nèi)駕駛的汽車(chē)質(zhì)量 2 高速公路的維修情況是否良好 3 大部分駕駛的路程是在鄉(xiāng)下還是市內(nèi) 4 路上的汽車(chē)密度 5 社會(huì)文化能否接受酒后駕車(chē)等 這些因素都有可能與酒精稅有關(guān) 若相關(guān) 則會(huì)導(dǎo)致遺漏變量偏差 一種解決這些導(dǎo)致遺漏變量偏差潛在根源的方法是收集這些變量的數(shù)據(jù) 并把它們加入到上式中 不幸的是 我們很難或不可能度量諸如酒后駕車(chē)的文化接受度等變量 17 解決方法 固定效應(yīng)OLS回歸 具有兩個(gè)時(shí)期的面板數(shù)據(jù) 前后 比較 特別注意 Zi不隨時(shí)間變化 18 結(jié)論 兩期的變化 差分 表示的回歸消除了隨時(shí)間不變的不可觀測(cè)變量Zi的效應(yīng) 換言之 分析Y和X的變化可以控制隨時(shí)間不變的變量 于是就消除了這種產(chǎn)生遺漏變量偏差的來(lái)源 19 20 當(dāng)數(shù)據(jù)是在兩個(gè)不同年份里觀測(cè)得到的時(shí)候 這種 前后 分析很有效 但我們的數(shù)據(jù)集中包含7個(gè)不同年份里的觀測(cè)值 即當(dāng)T 2時(shí)不能直接應(yīng)用這種 前后 比較方法 為了分析該面板數(shù)據(jù)集中的所有觀測(cè)值 我們使用固定效應(yīng)回歸方法 21 固定效應(yīng)模型 對(duì)于特定的個(gè)體i而言 ai表示那些不隨時(shí)間改變的影響因素 如個(gè)人的消費(fèi)習(xí)慣 國(guó)家的社會(huì)制度 地區(qū)的特征 性別等 一般稱(chēng)其為 個(gè)體效應(yīng) individualeffects 如果把 個(gè)體效應(yīng) 當(dāng)作不隨時(shí)間改變的固定性因素 相應(yīng)的模型稱(chēng)為 固定效應(yīng) 模型 22 23 24 對(duì)于固定效應(yīng)模型 可采用虛擬變量法 基本思想 固定效應(yīng)模型實(shí)質(zhì)上就是在傳統(tǒng)的線性回歸模型中加入N 1個(gè)虛擬變量 使得每個(gè)截面都有自己的截距項(xiàng) 由于固定效應(yīng)模型假設(shè)存在著 個(gè)體效應(yīng) 每個(gè)個(gè)體都有其單獨(dú)的截距項(xiàng) 這就相當(dāng)于在原方程中引入n 1個(gè)虛擬變量 如果省略常數(shù)項(xiàng) 則引入n個(gè)虛擬變量 來(lái)代表不同的個(gè)體 獲得每個(gè)個(gè)體的截?fù)?jù)項(xiàng) 25 26 如何理解個(gè)體效應(yīng) 個(gè)體截距項(xiàng)的不同以及虛擬變量的引入 我們用一份模擬的數(shù)據(jù)來(lái)分析 useexample clearxtsetcompanyyearxtdes1 畫(huà)出散點(diǎn)圖和擬合線 并建立OLS回歸方程 2 加入虛擬變量 并重新畫(huà)出建立OLS回歸方程 27 regyx 28 29 gend1 0gend2 0gend3 0replaced1 1ifid 1replaced2 1ifid 2replaced3 1ifid 3regyxd1d2 30 固定效應(yīng)模型的估計(jì)算法 個(gè)休中心化 OLS算法或者組內(nèi)離差估計(jì)法假設(shè)原方程為 式1 給定第i個(gè)個(gè)體 將 式1 兩邊對(duì)時(shí)間取平均可得 式2 31 式1 式2 得 可以用OLS方法一致地估計(jì) 稱(chēng)為 固定效應(yīng)估計(jì)量 FixedEffectsEstimator 記為 由于主要使用了每個(gè)個(gè)體的組內(nèi)離差信息 故也稱(chēng)為 組內(nèi)估計(jì)量 withinestimator 32 固定效應(yīng)模型的優(yōu)勢(shì)和劣勢(shì) 面板固定效應(yīng)模型的優(yōu)勢(shì)是 即使個(gè)體特征ui與解釋變量Xit相關(guān) 只要使用組內(nèi)估計(jì)量 就可以得到一致估計(jì) 即即使存在不隨時(shí)間改變的遺漏變量 也可得到無(wú)偏一致的估計(jì) 面板固定效應(yīng)模型的劣勢(shì)是 模型無(wú)法估計(jì)不隨時(shí)間而變的變量之影響 這需要用隨機(jī)效應(yīng)模型 33 在交通事故死亡人數(shù)中的應(yīng)用 由于 10 8 式中的 差分 回歸只用了1982年和1988年的數(shù)據(jù) 具體講就是這兩年的差額 而 10 15 式中的固定效應(yīng)回歸用到了所有7年的數(shù)據(jù) 因此這兩個(gè)回歸是不同的 由于利用了更多的數(shù)據(jù) 因此 10 15 式中的標(biāo)準(zhǔn)誤差小于 10 8 式中的標(biāo)準(zhǔn)誤差 34 固定效應(yīng)模型的stata實(shí)現(xiàn) usefatality clearxtsetstateyearxtdesxtlineFatalityRate固定效應(yīng)模型 xtregFatalityRatebeertax fe 35 回歸結(jié)果解讀 1 三個(gè)R2哪個(gè)重要 2 固定效應(yīng)為什么有兩個(gè)F檢驗(yàn) 3 corr u i Xb 的含義 4 sigma u sigma e rho的含義 36 1 因?yàn)楣潭ㄐ?yīng)模型是組內(nèi)估計(jì)量 離差 因此 只有within是一個(gè)真正意義上的R2 其他兩個(gè)是組間相關(guān)系數(shù)的平方 2 右側(cè)的F統(tǒng)計(jì)量表示除常數(shù)項(xiàng)外其他解釋變量的聯(lián)合顯著性 最后一個(gè)F檢驗(yàn) 原假設(shè)所有U i 0 即不存在個(gè)體效應(yīng) 不必使用固定效應(yīng)模型 首先注意 結(jié)果中的u i不表示殘差 而是表示個(gè)體效應(yīng) 37 3 corr u i Xb 個(gè)體效應(yīng)與解釋變量的相關(guān)系數(shù) 相關(guān)系數(shù)為0或者接近于0 可以使用隨機(jī)效應(yīng)模型 相關(guān)系數(shù)不為0 需要使用固定效應(yīng)模型 4 sigma u 表示個(gè)體效應(yīng)的標(biāo)準(zhǔn)差sigma e 表示干擾項(xiàng)的標(biāo)準(zhǔn)差rho rho sigma u 2 sigma u 2 sigma e 2 個(gè)體效應(yīng)的波動(dòng)占整個(gè)波動(dòng)的比例 38 顯示每個(gè)個(gè)體截距的方法 tabstate gen dum dropdum1regFatalityRatebeertaxdum 39 例二 usegrunfeld clearxtsetcompanyyearxtdesxtlineinvest固定效應(yīng)模型 xtreginvestmvaluekstock fe 40 顯示每個(gè)個(gè)體截距的方法 tabcompany gen dum reginvestmvaluekstockdum noconsdropdum1reginvestmvaluekstockdum 分析每個(gè)公司的截距 41 時(shí)間固定效應(yīng)回歸 其中St是只隨時(shí)間改變 不隨個(gè)體改變的變量 和個(gè)體固定效應(yīng)能控制不隨時(shí)問(wèn)變化但個(gè)體間不同的變量一樣 時(shí)間固定效應(yīng)能控制個(gè)體間相同但隨時(shí)間變化的變量 由于新車(chē)安全性能的提高是發(fā)生在全國(guó)范圍內(nèi)的 因此它們能夠減少所有州的交通死亡事故 故把汽車(chē)安全性能視為隨時(shí)間變化但對(duì)所有州都相同的遺漏變量是合理的 于是加入用St表示的汽車(chē)安全性能的效應(yīng)后 得 42 只有時(shí)間效應(yīng) 我們暫時(shí)假設(shè)Zi不出現(xiàn) 方程變?yōu)?我們的目的是在控制St條件下估計(jì) 1 43 44 在上述例子中加入時(shí)間固定效應(yīng) 實(shí)際上添加了t 1個(gè)時(shí)間虛擬變量 主要反映隨著時(shí)間變化的一些特征 usefatality cleartabyear gen yr editdropyr1regFatalityRatebeertaxyr 幾乎所有時(shí)間虛擬變量均不顯著 說(shuō)明FatalityRate不隨時(shí)間的變動(dòng)呈現(xiàn)變動(dòng)的趨勢(shì) 45 個(gè)體和時(shí)間固定效應(yīng) 雙向固定效應(yīng)模型 如果某些遺漏變量不隨時(shí)間變化但隨州變化 如對(duì)酒后駕車(chē)的文化接受度 而其他遺漏變量不隨州變化但隨時(shí)間變化 如國(guó)家安全標(biāo)準(zhǔn) 則在模型中同時(shí)加入個(gè)體 州 和時(shí)間效應(yīng)更為恰當(dāng) 我們稱(chēng)為雙向固定效應(yīng)模型 固定效應(yīng)模型 Yit ai Xit 1 it雙向固定效應(yīng)模型 Yit ai t Xit 1 it 46 47 雙向固定效應(yīng)模型的估計(jì) 雙向固定效應(yīng)模型可以通過(guò)加入n 1個(gè)個(gè)體二元變量和T 1個(gè)時(shí)間二元變量進(jìn)行OLS估計(jì) 但這會(huì)使解釋變量的數(shù)目變得極為龐大 所以一般我們還是采用組內(nèi)離差法進(jìn)行估計(jì) 方法一 可以通過(guò)先從Y和X中減去個(gè)體和時(shí)間平均值 然后估計(jì)被減后的Y關(guān)于被減后的X的多元回歸方程的方法來(lái)估計(jì)X的系數(shù) 這種方法可以避免二元變量的出現(xiàn) 方法二 從Y X和時(shí)間指示變量中減去個(gè)體 不是時(shí)間 均值然后估計(jì) 被減后的Y對(duì)被減后的X和被減后的時(shí)間指示變量的多元回歸中的k T個(gè)系數(shù) 48 在交通死亡人數(shù)中的應(yīng)用 上述形式中包含了啤灑稅 47個(gè)州二元變量 州固定效應(yīng) 6個(gè)年二元變量 時(shí)間固定效應(yīng) 和截距項(xiàng) 所以這個(gè)模型的解釋變量個(gè)數(shù)多達(dá)55個(gè) 這將帶來(lái)大量的自由度的損失 因?yàn)闀r(shí)間和州二元變量和截距項(xiàng)的系數(shù)不是我們主要感興趣的 所以我們?cè)谶@里沒(méi)有列出 比較參數(shù)發(fā)現(xiàn)加入時(shí)間效應(yīng)后啤酒稅的系數(shù)由 0 66變?yōu)?0 64 可見(jiàn)加入時(shí)間效應(yīng)對(duì)結(jié)果影響不大 49 固定效應(yīng)回歸假設(shè)和固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差 本章給出的標(biāo)準(zhǔn)誤差是利用一般異方差穩(wěn)健公式計(jì)算得到的 當(dāng)T中等大小或較大時(shí) 在稱(chēng)為固定效應(yīng)回歸假設(shè)的五個(gè)假設(shè)條件下面板數(shù)據(jù)中的這些異方差穩(wěn)健標(biāo)準(zhǔn)誤差都是正確的 50 固定效應(yīng)回歸假設(shè) 51 自相關(guān) 序列相關(guān) 如果違反 則出現(xiàn)自相關(guān) 52 固定效應(yīng)回歸的標(biāo)準(zhǔn)誤差 如果重要概念10 3中的假設(shè)5成立 則給定回歸變量條件下 誤差u在時(shí)間上不相關(guān) 在這種情況下如果T中等大小或較大時(shí) 則常用 異方差穩(wěn)健 標(biāo)準(zhǔn)誤差是正確的 如果誤差自相關(guān) 則常用標(biāo)準(zhǔn)誤差公式不正確 理解這一點(diǎn)的一種方法是同異方差做類(lèi)比 在截面數(shù)據(jù)回歸中 如果誤差異方差 則由于同方差適用的標(biāo)準(zhǔn)誤差是在同方差的錯(cuò)誤假設(shè)下導(dǎo)出的 因此是不正確的 類(lèi)似地 如果面板數(shù)據(jù)中的誤差自相關(guān) 則由于常用標(biāo)準(zhǔn)誤差是在它們沒(méi)有自相關(guān)的錯(cuò)誤假設(shè)下導(dǎo)出的 因此也是不正確的 53 由于面板數(shù)據(jù)具有潛在異方差且在給定個(gè)休的不同時(shí)間上潛在相關(guān)時(shí) 正確的標(biāo)準(zhǔn)誤差稱(chēng)為異方差和自相關(guān)一致的標(biāo)準(zhǔn)誤差 HAC 這種標(biāo)準(zhǔn)誤差由稱(chēng)為群標(biāo)準(zhǔn)誤差 在時(shí)間序列中使用的命令是newey在面板數(shù)據(jù)中使用的命令是xtgls 54 有關(guān)酒后駕車(chē)的法律規(guī)定和交通事故死亡人數(shù) 酒精稅只是抑制酒后駕車(chē)的一種方法 如果某州想要打擊酒后駕車(chē) 可以通過(guò)增加稅收和嚴(yán)酷的法律來(lái)做到這一點(diǎn) 因此 即使在包含州和時(shí)間固定效應(yīng)的模型中遺漏這些有關(guān)酒后駕車(chē)的法律也會(huì)導(dǎo)致啤酒稅對(duì)交通死亡事故效應(yīng)的OLS估計(jì)量中存在遺漏變量偏差 此外 是否開(kāi)車(chē)也部分取決于司機(jī)是否有工作 同時(shí) 稅收變化也反映了經(jīng)濟(jì)狀況 如州預(yù)算赤字會(huì)增加稅收 所以遺漏州的經(jīng)濟(jì)狀況也會(huì)導(dǎo)致遺漏變量偏差 55 本節(jié)中我們將前面的分析推廣到保持經(jīng)濟(jì)狀況不變條件下有關(guān)酒后駕車(chē)的法律規(guī)定 包括啤酒稅 對(duì)交通死亡事故效應(yīng)的研究 為此 我們需要估計(jì)包含其他酒后駕車(chē)法律和州經(jīng)濟(jì)狀況的回歸變量的面板數(shù)據(jù)回歸 這些結(jié)果刻畫(huà)了一幅抑制酒后駕車(chē)和交通死亡事故措施引發(fā)爭(zhēng)議的畫(huà)面 這些估計(jì)值表明嚴(yán)厲的處罰和提高最低法定喝酒年齡對(duì)死亡率都不會(huì)產(chǎn)生重要作用 相反 有證據(jù)表明提高類(lèi)似啤酒稅這樣的酒精稅會(huì)減少交通死亡率 但這個(gè)效應(yīng)的估計(jì)仍是不精確的 56 隨機(jī)效應(yīng)模型 對(duì)于面板數(shù)據(jù)而言 除了我們前面講的混合回歸和固定效應(yīng)模型以外 還存在另外一種模型形式 隨機(jī)效應(yīng)模型 為了區(qū)別固定效應(yīng)模型和隨機(jī)效應(yīng)模型 我們把兩個(gè)模型的方程分別寫(xiě)成 固定效應(yīng)模型 隨機(jī)效應(yīng)模型 57 兩個(gè)模型看似一樣 但模型形式截然不同 在固定效應(yīng)模型中 作為一個(gè)隨機(jī)變量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論