《虛擬變量》PPT課件.ppt_第1頁
《虛擬變量》PPT課件.ppt_第2頁
《虛擬變量》PPT課件.ppt_第3頁
《虛擬變量》PPT課件.ppt_第4頁
《虛擬變量》PPT課件.ppt_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1 第七章 虛擬變量Dummyvariables 2 本章將主要考慮虛擬的自變量的情況 即解釋變量出現(xiàn)虛擬變量 在現(xiàn)實(shí)中 模型中可能會出現(xiàn)一些定性的變量作為解釋變量 通常將虛擬變量取值0或1 所以虛擬變量又稱為二分變量 用虛擬變量來表示某一性質(zhì)或?qū)傩猿霈F(xiàn)或不出現(xiàn) 3 例如 收入決定模型中 除了可以量化的工作年限和受教育年限這兩個變量以外 我們還包括了性別這一定性的變量 用0表示女性 1表示男性 模型可以寫成 y 1x 2D 其中 D為虛擬變量D 0 表示女性 D 1表示男性模型中加入虛擬變量后 更加貼近經(jīng)濟(jì)的真實(shí)情況 也更加靈活 收入決定模型我們不僅要考察一般人口的狀況 也關(guān)注不同性別的收入決定模型的差異 從而更有利于政策的制定和調(diào)整 4 一般情況下 一個定性變量所需要的虛擬變量的個數(shù)取決于該定性的變量的類別 如果有n個類別 所引進(jìn)的虛擬變量的個數(shù)時(shí)m 1 比總體類別的數(shù)量少1 例如性別變量 分為兩類男性或女性 需要一個虛擬變量就可以了 如果地區(qū)發(fā)展問題 考慮地區(qū)差異 假設(shè)把全國分為東部 中部和西部 就需要2個虛擬變量 令1東部D1 0其他 5 1中部D2 0其他全集分為三類 所以需要兩個虛擬變量 6 第一節(jié)臨時(shí)虛擬 為了更好地對模型進(jìn)行估算 經(jīng)常要在模型中排除一些又突發(fā)時(shí)間產(chǎn)生的異常值 outlier 及其對模型的影響 例如戰(zhàn)爭 地震 內(nèi)亂 罷工等 例如 y 1x 2D 其中 D為臨時(shí)虛擬變量D 1 異常時(shí)期D 0 平時(shí) 7 例題下表是日本1985 1995年水稻產(chǎn)量Y和耕種面積的數(shù)據(jù)X 年份產(chǎn)量 10萬噸 Y耕種面積 萬公頃 X116232116228106212992091032081052069620310520978213120220107211 8 1 估計(jì)模型y x 2 受1993年凍害的影響 水稻收成指數(shù)為戰(zhàn)后最低 出現(xiàn)了歉收 因此設(shè)D 1為1993年 D 0為其他年份 估計(jì)下列模型y 1x 2D 9 根據(jù)數(shù)據(jù)計(jì)算結(jié)果如下 X 2351 Y 1151 XY 246601 X2 503313 Y2 121757n 11Y 48 224 0 71521X 73 4 0 3432 R2 0 3255 10 引入臨時(shí)虛擬變量后 即1993年為異常年份 計(jì)算結(jié)果如下 X 2351 Y 1151 XY 246601 X2 503313 Y2 121757n 11 D 1 XD 213 YD 78Y 40 292 0 69033X 28 748D 30 90 0 1444 4 389 經(jīng)過校正的R2 0 8675 11 如果直接去掉1993年的數(shù)據(jù) 回歸的結(jié)果為Y 40 292 0 69033X 30 898 0 1450 R2 0 7408經(jīng)過校正的R2 0 7084 12 第二節(jié)季度虛擬 季度虛擬是通過回歸模型中的常數(shù)項(xiàng)的變化 斜率不變 來掌握季度和月度等季節(jié)變化對模型的不同影響 例如 根據(jù)研究人們發(fā)現(xiàn) 利用季度數(shù)據(jù) 消費(fèi)對收入回歸時(shí) 在夏季和冬季 第二和第四季度 發(fā)半年獎和年終獎時(shí) 收入異乎尋常地高 為了消除這種季節(jié)變化的影響 引入季度虛擬變量D1 D2 D3 估計(jì)下列多元回歸模型 y 1x 2D1 3D2 4D3 13 1第一季度D1 0其他1第二季度D2 0其他1第三季度D3 0其他 14 季度數(shù)據(jù)需要3個虛擬變量 月度數(shù)據(jù)用11個虛擬變量 實(shí)際估計(jì)時(shí) 會根據(jù)t檢驗(yàn)結(jié)果去掉不顯著的季度或月度虛擬變量 然后用剩下的虛擬變量再重新估計(jì)就可以了 15 例題 下面時(shí)日本飲食消費(fèi)總額 食品 飲料等 Y與國內(nèi)家庭最終消費(fèi)支出X的變化數(shù)據(jù) 首先估計(jì)下面的模型 y x 宏觀恩格爾函數(shù) 引入季度虛擬變量 估計(jì)模型y 1x 2D1 3D2 4D3 16 1第一季度D1 0其他1第二季度D2 0其他1第三季度D3 0其他 17 年 季度飲食消費(fèi)Y國內(nèi)最終消費(fèi)支出X1990年1 3月10 053 54 6月11 054 47 9月12 256 410 12月13 360 61991年1 3月10 254 74 6月11 055 47 9月12 357 610 12月13 262 41992年1 3月10 556 54 6月11 156 47 9月12 358 310 12月13 462 61993年1 3月10 456 74 6月11 256 87 9月12 258 910 12月13 463 71994年1 3月10 458 2 18 X 983 10 Y 198 10 XY 11505 46 X2 56993 83 Y2 2331 77Y 8 5246 0 34891XR2 0 73985 19 季度虛擬變量數(shù)據(jù)表 年 季度D1D2D31990年1 3月1004 6月0107 9月00110 12月0001991年1 3月1004 6月0107 9月00110 12月0001992年1 3月1004 6月0107 9月00110 12月0001993年1 3月1004 6月0107 9月00110 12月0001994年1 3月100 20 估計(jì)結(jié)果如下 Y 9 0681 0 068301X 2 05875D1 1 8009D2 0 76594D3所有t值都在1 的水平顯著經(jīng)過校正的R2 0 99390將第一季度D1 1 D2 0 D3 0代入上述模型 得到第一季度的子模型Y 9 0681 2 5875 0 068301X 6 4806 0 068301X 21 將第二季度D1 0 D2 1 D3 0代入上述模型 得到第二季度的子模型Y 9 0681 1 8009 0 068301X 7 2672 0 068301X將第三季度D1 0 D2 0 D3 1代入上述模型 得到第三季度的子模型Y 9 0681 0 76594 0 068301X 8 3022 0 068301X將第四季度D1 0 D2 0 D3 0代入上述模型 得到第四季度的子模型Y 9 0681 0 068301X 22 第三節(jié)運(yùn)用虛擬變量改變回歸直線的截距 加入虛擬變量后 回歸模型中解釋變量前面的系數(shù) 斜率 沒有變化 只有截距發(fā)生改變 事實(shí)上 臨時(shí)虛擬和季度 月度 虛擬中都是是截距發(fā)生了改變 看下面的例子 23 例子1 在收入決定模型中 除了假設(shè)教齡以外 性別和膚色也是影響大學(xué)教授收入的重要因素 模型為 y 1x 2D1 3D2 y為收入x為教齡 24 1男性D1 0女性1白色D2 0有色人種 25 黑人女教授的平均工資 Ey 1x黑人男教授的平均工資 Ey 2 1x白人女教授的平均工資 Ey 3 1x白人男教授的平均工資 Ey 2 3 1x估計(jì)上述包括性別和膚色虛擬變量的模型 如果它們的t值顯著 表明這兩個因素的確影響了收入 26 例子2 假設(shè)我們具有消費(fèi)C和收入Y的數(shù)據(jù) 同時(shí)有一些定性的變量 S 性別 A 年齡 50 E 教育 高中以下 高中以上 但大學(xué)以下 大學(xué)及以上 27 所估計(jì)的模型為 C Y 1D1 2D2 3D3 4D4 5D5 1男性D1 0女性 28 1如果年齡小于25D2 0其他1年齡在25到50之間D3 0其他1教育在高中以下D4 0其他 29 1學(xué)歷在高中以上但大學(xué)以下D5 0其他這是一個典型的截距發(fā)生改變的例子 例如 1 男性 年齡在25歲以下 大學(xué)畢業(yè)C 1 2 Y 相當(dāng)于D1 1 D2 1 D3 0 D4 0 D5 0 2 女性 年齡在50以上 大學(xué)學(xué)歷C Y 相當(dāng)于D1 0 D2 0 D3 0 D4 0 D5 0 30 例子3 蘭普森研究一些定性變量對電影票價(jià)的影響 他估計(jì)了下列模型 Y 4 13 5 77D1 8 21D2 7 68D3 1 13D4 27 09D5 31 46logX1 0 81X2其中Y成人晚間入場票 美分 1郊區(qū)D1電影院位置 0城中心 31 1建成后或大修后10年內(nèi)D2電影院年齡 0其他1露天D3電影院類型 0室內(nèi)1有D4停車場 0無 32 1首映D5上映政策 0其他X1平均每場放映的空位率X2平均影片片租 以分?jǐn)偟矫繌堧娪捌鄙系拿婪謨r(jià)計(jì)算 33 解釋模型 計(jì)算下列子模型 1 城中心 電影院年齡在10年以上 無停車場 室內(nèi) 非首映 即虛擬變量取值全部為0 Y 4 13 31 46logX1 0 81X2 34 2 城郊 10年內(nèi)的影院 露天 有停車場 首映Y 4 13 5 77 8 21 7 68 1 13 27 09 31 46logX1 0 81X2 36 39 31 46logX1 0 81X2大家還可以計(jì)算其他組合下的子模型 35 例題 持有兩份或多份工作 即一份主業(yè)和一份或多份副業(yè)的人被稱為 moonlighter 即兼職者 兩個學(xué)者試圖發(fā)現(xiàn)什么決定這些兼職者的工資 它們根據(jù)318個兼職者的樣本 估計(jì)如下回歸模型 Wm 37 07 0 403W0 90 06race 75 51urban 47 33hisch 113 64reg 2 26age 36 Wm為兼職者工資 美元 小時(shí) W0為主業(yè)工資 美元 小時(shí) Race 0白人1非白人Urban 0非城里人1城市人 37 Reg 0非西部1西部Hisch 0非中學(xué)畢業(yè) 即中學(xué)以下 1中學(xué)畢業(yè)Age年齡模型中包括了2個定量的解釋變量和4個定性的變量 所有變量的系數(shù)在5 的水平都是顯著的 38 當(dāng)所有的虛擬變量均取值為0時(shí) 白人 非城鎮(zhèn) 非西部 非中學(xué)畢業(yè) Wm 37 07 0 403W0 2 26age當(dāng)所有的虛擬變量均取值為1時(shí) 非白人 城鎮(zhèn) 西部 中學(xué)畢業(yè) Wm 37 07 75 51 47 33 113 64 90 06 0 403W0 2 26age 183 49 0 403W0 2 26age 39 作業(yè) 計(jì)算虛擬變量不同取值下模型 1 白人 非城鎮(zhèn) 西部居民 中學(xué)畢業(yè)2 非白人 城鎮(zhèn) 非西部居民 非中學(xué)畢業(yè)3 白人 非城鎮(zhèn) 非西部居民 中學(xué)畢業(yè) 40 第四節(jié)通過虛擬變量改變斜率 系數(shù)虛擬 研究通貨膨脹率 I 和工業(yè)增長率 G 之間的關(guān)系為例 假設(shè)1988年與其他年份有所不同 在這一年劇烈上漲 I 1G 2 DG 11988年D 0其他年份 41 這樣可以用上面的模型表示下列兩種情況 1 2 G D 1I 1G D 0不論是哪種情況 截距都沒有發(fā)生改變 42 例題下表是某國在1965年到1979年以指數(shù)表示 1965年 100 初次能源需求和實(shí)際GDP的數(shù)據(jù) 43 年份初次能源需求Y實(shí)際GDPXDDX100100001061080011511700122123001291320013614100141145001435400114150115011715611561211611161 44 1231691169129174117413017711771341831183 X 2190 Y 1860 XY 274178 X2 328940 Y2 232764Y 82 453 0 28457XR2 0 35075經(jīng)過校正的R2 0 30081 45 模型為Y 1X 2 DX 0石油沖擊前 1965 1972 D 1石油沖擊后 1973 1979 DX 1170 DX 2 196412 X DX 196412 Y DX 145598Y 17 095 0 83864X 0 19918DX 46 經(jīng)過校正的R2 0 98263石油沖擊前的系數(shù)是0 83864 石油沖擊后的系數(shù)為0 63946 可見石油沖擊后 經(jīng)濟(jì)增長模式向節(jié)能方向轉(zhuǎn)變 47 第五節(jié)虛擬變量使截距和斜率均發(fā)生改變 仍舊是通貨膨脹率I和工業(yè)增長率G之間的關(guān)系 可以假設(shè)模型為 I 1 2D 1G 2GD 1 2 1 2 G D 1 1988 I 1 1G D 0 其他 48 2被稱為級差截距 2是級差斜率系數(shù) 49 例題 下面是根據(jù)1958年4季度到1971年2季度英國失業(yè)率和職位空缺率的數(shù)據(jù)估計(jì)的模型 從最初的散點(diǎn)圖中發(fā)現(xiàn) 1966年4季度開始失業(yè)和空缺之間的關(guān)系發(fā)生了明顯的變化 為了證實(shí)判斷的情形 估計(jì)了下列的模型 UNt 1 2Dt 1Vt 2 DtVt t其中UNt為失業(yè)率 Vt為職位空缺率 D 11966年4季度開始以后的時(shí)期01966年4季度以前的時(shí)期 50 估計(jì)的結(jié)果如下 UNt 2 7491 1 1507Dt 1 5294Vt 0 8511 DtVt 0 1022 0 3171 0 1218 0 4294 從上面的估計(jì)結(jié)果中可以發(fā)現(xiàn) 級差截距和級差斜率系數(shù)在5 的水平都是顯著的 表明1966年4季度開始發(fā)生了明顯的變化 從上面的回歸可以導(dǎo)出下列回歸 1958年4季度到1966年3季度 UNt 2 7491 1 5294Vt1966年4季度到1971年2季度 Unt 2 7491 1 1507 1 5294 0 8511 Vt 3 8998 2 3805Vt 51 UNV 52 第六節(jié)帶折點(diǎn)的回歸 在實(shí)際中可能會遇到折線回歸的情況 例如 IG0G 53 上面的圖表示的是當(dāng)工業(yè)增長率達(dá)到一定的程度后會大幅度上升 假設(shè)為1988年以后的工業(yè)增長率 定義 1 t 1988 D 0 其他年份 模型可以表示成 1Gi 2 Gi G0 Di i t 1988 Ii 1Gi i 其他年份 G0被稱為門檻值 發(fā)生轉(zhuǎn)折的點(diǎn) 是已知的 54 例子1 假設(shè)某公司對其銷售人員按下列方式發(fā)放酬金 即在銷售額到達(dá) 目標(biāo) 或門檻值之前實(shí)行一種酬勞結(jié)構(gòu) 超過這個事先確定的門檻值之后 實(shí)行另一種結(jié)構(gòu) yi 1Xi 2 Xi X0 Di iX X0 1Xi iX X0 55 其中yi是銷售傭金Xi是銷售額X0事先確定的門檻值Di 1 Xi X0 0 Xi X0 56 E yi Di 0 XiX0 1XiE yi Di 0 XiX0 2X0 1 2 Xi 57 例題2 根據(jù)總成本 Y 和總產(chǎn)出 X 之間的關(guān)系估計(jì)的模型為 Y 145 72 0 2791X 0 0945 X X DD 1X 55000X 5500X 5500 單位 產(chǎn)出為5500單位以前 邊際成本為0 2791即28美分 超過5500單位之后 邊際成本為37美分 0 2791 0 0945 58 例題3 Sen等人根據(jù)70年代早期101個國家的人均收入X和平均預(yù)期壽命Y數(shù)據(jù)估計(jì)的模型如下 Yi 2 4 9 39lnXi 3 36Di lnXi 7 Di 1lnXi 70其他 59 當(dāng)lnXi 7時(shí) X 1097美元假定1097美元的人均收入是貧窮和較富裕國家的分界線 推導(dǎo)出人均收入低于1097美元和高于1097美元的國家的模型E yi Xi Di 1 2 4 9 39lnXi 3 36lnXi 3 36 7 21 12 6 03lnXiE yi Xi Di 0 2 4 9 39lnXi 60 表明隨著人均收入水平的提高 平均預(yù)期壽命的增加趨緩 61 第七節(jié)全部是定性變量的回歸 有時(shí) 模型中包括的全部是定性的變量 解釋變量 可以通過虛擬變量的形式來處理 例如 研究收入問題時(shí) 可以從性別 學(xué)歷 年齡 工作單位性質(zhì) 企業(yè)規(guī)模等方面考察 可以找出不同類別人群的收入差距 62 例題現(xiàn)擁有15個工人的月收入和相應(yīng)的性別 年齡 30多 40多 學(xué)歷 大學(xué) 高中 初中 企業(yè)規(guī)模 大型 中型 小型 的資料 估計(jì)的模型為 Y 1S 2A 3E1 4E2 5F1 6F2 S 1男性0女性A 140多030多 63 E1 1大學(xué)畢業(yè)0其他E2 1高中畢業(yè)0其他F1 1大型企業(yè)0其他F2 1中型企業(yè)0其他 64 YSAE1E2F1F2010000100000280101003001010031100001321001003400100136100101390010104010010143101000 65 461010015211001054011010110110估計(jì)的結(jié)果為 Y 11 966 14 385S 12 643A 15 873E1 5 083E2 12 152F1 5 544F2 66 所有回歸系數(shù)在1 的水平都是顯著的 常數(shù)項(xiàng)為11 966表示的是小型企業(yè) 30多歲女性初中畢業(yè)工人的月收入 即所有的虛擬變量取值均為0 1 大型企業(yè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論