第6章虛擬變量回歸模型_第1頁
第6章虛擬變量回歸模型_第2頁
第6章虛擬變量回歸模型_第3頁
第6章虛擬變量回歸模型_第4頁
第6章虛擬變量回歸模型_第5頁
已閱讀5頁,還剩53頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、經(jīng)濟(jì)計(jì)量學(xué)經(jīng)濟(jì)計(jì)量學(xué)Chp 6 虛擬變量回歸模型虛擬變量回歸模型主要內(nèi)容主要內(nèi)容l虛擬變量的性質(zhì)虛擬變量的性質(zhì)l方差分析模型(方差分析模型(ANCOVA)模型)模型l包含一個(gè)定量變量、一個(gè)多分定性變量的包含一個(gè)定量變量、一個(gè)多分定性變量的回歸回歸l包含一個(gè)定量變量和多個(gè)定性變量的回歸包含一個(gè)定量變量和多個(gè)定性變量的回歸l回歸的比較回歸的比較l虛擬變量在季節(jié)分析中的應(yīng)用虛擬變量在季節(jié)分析中的應(yīng)用l應(yīng)變量也是虛擬變量的情形:應(yīng)變量也是虛擬變量的情形:LPMl小結(jié)小結(jié)6.1虛擬變量的性質(zhì)虛擬變量的性質(zhì)l 許多經(jīng)濟(jì)變量是許多經(jīng)濟(jì)變量是可以定量度量可以定量度量的,如:商品需求的,如:商品需求量、價(jià)格、收

2、入、產(chǎn)量等量、價(jià)格、收入、產(chǎn)量等稱之為定量變量,稱之為定量變量, quantitative (numerical) explanatory variables 。l 但也有一些影響經(jīng)濟(jì)變量的因素但也有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量無法定量度量,如:職業(yè)、性別對(duì)收入的影響等如:職業(yè)、性別對(duì)收入的影響等稱之為變性稱之為變性變量,變量, qualitative explanatory variables 。l 為了在模型中能夠反映這些因素的影響,并提高為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們模型的精度,需要將它們“量化量化”。l定性變量通常表示為具備或不具備某種性定性變量

3、通常表示為具備或不具備某種性質(zhì),如男性或女性;黑人或白人;黨員或質(zhì),如男性或女性;黑人或白人;黨員或非黨員等。非黨員等。l把定性因素把定性因素“定量化定量化”的一個(gè)方法是建立的一個(gè)方法是建立人工變量(也稱為虛擬變量,人工變量(也稱為虛擬變量,Dummy variable),并賦值和:),并賦值和:不具備某種性質(zhì);:不具備某種性質(zhì);:具備某種性質(zhì)。:具備某種性質(zhì)。虛擬變量常用變量虛擬變量常用變量D表示。表示。l稱虛擬變量也稱二元變量(稱虛擬變量也稱二元變量(binary variable)l 例如例如,反映文化程度的虛擬變量可取為:,反映文化程度的虛擬變量可取為: 1, 本科學(xué)歷本科學(xué)歷 D=

4、0, 非本科學(xué)歷非本科學(xué)歷l方差分析模型方差分析模型(Analysis of variance models,ANOVA):僅包含定性變量或):僅包含定性變量或虛擬變量的回歸模型,其形式如下:虛擬變量的回歸模型,其形式如下:Yi=B1+B2Di+uil假定假定Y:每年食品支出(美元);:每年食品支出(美元);Di=1表示表示女性;女性;Di=0表示男性,則:表示男性,則:l男性食品支出的期望:男性食品支出的期望:E(Yi|Di=0)=B0l女性食品支出的期望:女性食品支出的期望: E(Yi|Di=1)=B0+B1l上述模型的含義:上述模型的含義:l截距截距B1表示男性平均食品支出,斜率系數(shù)表示

5、男性平均食品支出,斜率系數(shù)B2表示女性平均食品支出與男性的差異,表示女性平均食品支出與男性的差異, B1 + B2表示女性平均食品支出。表示女性平均食品支出。l對(duì)這類模型,零假設(shè)為:對(duì)這類模型,零假設(shè)為:H0:B2=0表示男女平均食品支出沒有差異。我們可根據(jù)表示男女平均食品支出沒有差異。我們可根據(jù)t檢驗(yàn)判定是否統(tǒng)計(jì)顯著。檢驗(yàn)判定是否統(tǒng)計(jì)顯著。l 例例10-1(P213):性別差異對(duì)食品消費(fèi)支出的影:性別差異對(duì)食品消費(fèi)支出的影響響表表 6-2 食品支出與稅后收入和性別的關(guān)系食品支出與稅后收入和性別的關(guān)系23176.833-503.1667D(233.0446)(329.5749)t(13.631

6、8)( 1.5267)r0.1890D1iiYseY 食食品品支支出出, (女女)0 0(男男)回歸結(jié)果回歸結(jié)果:23176.833-503.1667D(233.0446)(329.5749)t(13.6318)( 1.5267)r0.1890D1iiYseY 食食品品支支出出, (女女)0 0(男男)回歸結(jié)果回歸結(jié)果:結(jié)果表明:女性平均食品支出約為結(jié)果表明:女性平均食品支出約為3177.833-503.1667=2673.6663美元;男性平均食品支出約為美元;男性平均食品支出約為3177美元。但是美元。但是t統(tǒng)計(jì)量不顯著,意味著雖然男、統(tǒng)計(jì)量不顯著,意味著雖然男、女食品支出有差異,但是差異

7、不顯著。女食品支出有差異,但是差異不顯著。l幾個(gè)問題:幾個(gè)問題:1. 基準(zhǔn)類(基礎(chǔ)類,參照類或比較類):取值為基準(zhǔn)類(基礎(chǔ)類,參照類或比較類):取值為0的那類變量的那類變量基準(zhǔn)類的選擇根據(jù)研究目的而定基準(zhǔn)類的選擇根據(jù)研究目的而定來自于社會(huì)學(xué)、心理學(xué)等研究的需要來自于社會(huì)學(xué)、心理學(xué)等研究的需要l幾個(gè)問題:幾個(gè)問題:2. 既然有兩種分類,為什么不引入兩個(gè)虛擬變量。既然有兩種分類,為什么不引入兩個(gè)虛擬變量??聪旅娴睦???聪旅娴睦?。l幾個(gè)問題:幾個(gè)問題:3. 虛擬變量虛擬變量D的系數(shù)稱為差別截距系數(shù)的系數(shù)稱為差別截距系數(shù)(differential intercept coefficient),表明

8、了取值為表明了取值為1的類的截距值與基準(zhǔn)類截距值的類的截距值與基準(zhǔn)類截距值的差距。的差距。l例例102(P136):工會(huì)化程度與工作權(quán)利法:工會(huì)化程度與工作權(quán)利法本例研究工作權(quán)利法(是否通過)對(duì)私營(yíng)部分本例研究工作權(quán)利法(是否通過)對(duì)私營(yíng)部分的工會(huì)化程度的影響的工會(huì)化程度的影響6.2協(xié)方差分析模型協(xié)方差分析模型(ANCOVA):包含:包含一個(gè)定量變量和一個(gè)兩分定性變量的回歸一個(gè)定量變量和一個(gè)兩分定性變量的回歸l例:考慮例:考慮可支配收入可支配收入(定量變量)與性別(定量變量)與性別食品消費(fèi)支出對(duì)的回歸模型食品消費(fèi)支出對(duì)的回歸模型回歸模型:回歸模型: Yi=B1+B2Xi+B3Di+ui式中,式

9、中,Y食品支出,食品支出,X稅后收入;稅后收入;D1(女性)(女性)0(男性)(男性)結(jié)果表明:結(jié)果表明:(1)在模型()在模型(6-2)中虛擬變量是)中虛擬變量是統(tǒng)計(jì)不顯著的,但在這里統(tǒng)計(jì)不顯著的,但在這里是統(tǒng)計(jì)顯著的,說明模型(是統(tǒng)計(jì)顯著的,說明模型(6-2)的模型設(shè)定有錯(cuò)誤,忽略了)的模型設(shè)定有錯(cuò)誤,忽略了稅后收入對(duì)食品支出的影響;稅后收入對(duì)食品支出的影響;(2)當(dāng)稅后收入為常數(shù)時(shí),男性平均食品支出為)當(dāng)稅后收入為常數(shù)時(shí),男性平均食品支出為1506美元,美元,女性平均食品消費(fèi)為女性平均食品消費(fèi)為1506.244-228.9866=1277美元,并且這美元,并且這兩個(gè)均值的顯著性不同。兩個(gè)

10、均值的顯著性不同。(3)若不考慮性別差異,收入系數(shù))若不考慮性別差異,收入系數(shù)0.0589表示稅后收入沒增表示稅后收入沒增加加1美元,平均食品消費(fèi)支出增加美元,平均食品消費(fèi)支出增加6美分。美分。21506.244288.9868D +0.0589X(188.0096)(107.0582)t(8.0115)(-2.1388) 9.6417 r0.9284P=0.0000.000D1iiiYseY (0.00610.0061)()()(0.06110.0611)()食食品品支支出出, (女女)0 0(男男)回歸結(jié)果回歸結(jié)果:6.3 包含一個(gè)定量變量、一個(gè)多分定性變包含一個(gè)定量變量、一個(gè)多分定性變量

11、的回歸量的回歸l例:考查地區(qū)差異(三個(gè)地區(qū),分別是東例:考查地區(qū)差異(三個(gè)地區(qū),分別是東北和中北部(北和中北部(32個(gè)州)、南部(個(gè)州)、南部(22個(gè)州)個(gè)州)和西部(和西部(10個(gè)州)對(duì)研究生接受率的影個(gè)州)對(duì)研究生接受率的影響。響。先考慮地區(qū)差異模型如下:先考慮地區(qū)差異模型如下:Accepti=B1+B2D2i+B3D3i+ui (6-12) l其中,其中,Accept為研究生接受率;為研究生接受率;Di為虛擬變量,且為虛擬變量,且 D2=1表東北和中北部地區(qū),表東北和中北部地區(qū),D2=0為其它地區(qū)為其它地區(qū); D3=1表西部地區(qū),表西部地區(qū),D3=0為其它地區(qū)為其它地區(qū) 這是將南部地區(qū)看

12、成是基準(zhǔn)類。這是將南部地區(qū)看成是基準(zhǔn)類。l東北和中北部地區(qū)的平均接受率:東北和中北部地區(qū)的平均接受率: Accepti=B1+B2l西部地區(qū)的平均接受率:西部地區(qū)的平均接受率: Accepti=B1+B3l南部地區(qū)的平均接受率:南部地區(qū)的平均接受率: 【P140修改一下修改一下】 Accepti=B1232Accept44.451-10.68D -12.501Dt(14.38)(-2.67) -2.26 r0.9284P=0.0000.028iii ()()(0.010.01)()回歸結(jié)果回歸結(jié)果:結(jié)果表明:結(jié)果表明:(1)南部的平均接受率為)南部的平均接受率為45%;差別系數(shù)是統(tǒng)計(jì)顯著;差別

13、系數(shù)是統(tǒng)計(jì)顯著的,因此東北部、中北部地區(qū)間平均接受率與南部地區(qū)的,因此東北部、中北部地區(qū)間平均接受率與南部地區(qū)的接受率是顯著統(tǒng)計(jì)不同的。的接受率是顯著統(tǒng)計(jì)不同的。(2)虛擬變量?jī)H僅指出了存在差異,但沒有說明產(chǎn)生)虛擬變量?jī)H僅指出了存在差異,但沒有說明產(chǎn)生差異的原因。差異的原因。在模型在模型Accepti=B1+B2D2i+B3D3i+ui (6-12)中加入一個(gè)定量的解釋變量,比如學(xué)費(fèi),中加入一個(gè)定量的解釋變量,比如學(xué)費(fèi),根據(jù)表根據(jù)表6-4提供的數(shù)據(jù)得如下的回歸結(jié)果:提供的數(shù)據(jù)得如下的回歸結(jié)果: 232Accept79.033-5.670D -11.14D -0.0011Tutiont(15.

14、53)(-1.97) -2.79-r0.546P=0.0000.007iii ()( 7.557.55) ()(0.0610.061)()(0.0000.000)結(jié)果表明:結(jié)果表明:(1)如果學(xué)費(fèi)保持不變,如果學(xué)費(fèi)保持不變,5%的顯著性水平下,東北部的顯著性水平下,東北部/中中北部地區(qū)與南部地區(qū)的接受率沒有顯著不同(北部地區(qū)與南部地區(qū)的接受率沒有顯著不同(D2的的P值為值為0.061);西部地區(qū)與南部地區(qū)的接受率仍然存在顯著不同。);西部地區(qū)與南部地區(qū)的接受率仍然存在顯著不同。(2)學(xué)費(fèi)的系數(shù)表明:學(xué)費(fèi)每增加)學(xué)費(fèi)的系數(shù)表明:學(xué)費(fèi)每增加1美元,學(xué)校接受率就美元,學(xué)校接受率就會(huì)平均下降會(huì)平均下降

15、0.11%。6.4 包含一個(gè)定量變量和多個(gè)定性變量的包含一個(gè)定量變量和多個(gè)定性變量的回歸回歸l例:考慮如下回歸模型:例:考慮如下回歸模型:lYi=B1+B2D2i+B3D3i+B4Xi+uil其中:其中:Y=小時(shí)工資(美元)小時(shí)工資(美元)X=教育(受教育年限)教育(受教育年限)D2=1(女性),(女性),0(男性)(男性)D3=1(非白種人和非西班牙人),(非白種人和非西班牙人),0(其他)(其他)23i2528Y-0.261-2.3606D -1.7327D +0.802Xt(-0.2357)*(-5.4873)*-2.1803 *9.9094 * r0.2032iii 利利用用個(gè)個(gè)個(gè)個(gè)體

16、體數(shù)數(shù)據(jù)據(jù)得得如如下下回回歸歸結(jié)結(jié)果果()() 結(jié)果表明:結(jié)果表明:(1)基類是白種或西班牙裔男性;)基類是白種或西班牙裔男性;(2)如果教育水平和種族為常數(shù),則女性小時(shí)收入比)如果教育水平和種族為常數(shù),則女性小時(shí)收入比男性大約少男性大約少2.36美元;美元;(3)如果不考慮種族和性別的影響,則教育年限沒增)如果不考慮種族和性別的影響,則教育年限沒增加一年,平均小時(shí)收入增加加一年,平均小時(shí)收入增加80美分。美分。23i2528Y-0.261-2.3606D -1.7327D +0.802Xt(-0.2357)*(-5.4873)*-2.1803 *9.9094 * r0.2032iii 利利用

17、用個(gè)個(gè)個(gè)個(gè)體體數(shù)數(shù)據(jù)據(jù)得得如如下下回回歸歸結(jié)結(jié)果果()() 結(jié)果表明:結(jié)果表明:(1)基類是白種或西班牙裔男性;)基類是白種或西班牙裔男性;(2)如果教育水平和種族為常數(shù),則女性小時(shí)收入比男)如果教育水平和種族為常數(shù),則女性小時(shí)收入比男性大約少性大約少2.36美元;美元;(3)如果不考慮種族和性別的影響,則教育年限沒增加)如果不考慮種族和性別的影響,則教育年限沒增加一年,平均小時(shí)收入增加一年,平均小時(shí)收入增加80美分。美分。6.4.1交互影響交互影響l 交互影響:即不同虛擬變量之間存在的交互影響交互影響:即不同虛擬變量之間存在的交互影響l 對(duì)于上例而言,我們可以考慮如下模型:對(duì)于上例而言,我們

18、可以考慮如下模型:l Yi=B1+B2D2i+B3D3i+B4(D2iD3i)+B5Xi+uil 其中,其中,B2:女性的差別效應(yīng);女性的差別效應(yīng);B3:非白種非白種/非西班牙人的差別效應(yīng);非西班牙人的差別效應(yīng);B4:非白種非白種/非西班牙女性的差別效應(yīng)非西班牙女性的差別效應(yīng)B2+B3+B4:非白種非白種/非西班牙女性的平均小時(shí)工資函數(shù)。非西班牙女性的平均小時(shí)工資函數(shù)。(D2iD3i)兩個(gè)虛擬變量的乘積,稱為交互作用虛擬變量,兩個(gè)虛擬變量的乘積,稱為交互作用虛擬變量,表示兩個(gè)變量的聯(lián)合影響。表示兩個(gè)變量的聯(lián)合影響。6.4.2模型的一般化模型的一般化l 模型的一般化:模型的一般化:可以將模型擴(kuò)展

19、到包括多個(gè)定量變量和多個(gè)定性變量可以將模型擴(kuò)展到包括多個(gè)定量變量和多個(gè)定性變量的情形。但對(duì)于每個(gè)定性變量,虛擬變量的個(gè)數(shù)要比的情形。但對(duì)于每個(gè)定性變量,虛擬變量的個(gè)數(shù)要比該變量的分類數(shù)少一。該變量的分類數(shù)少一。例例103:政黨對(duì)競(jìng)選活動(dòng)的資助:政黨對(duì)競(jìng)選活動(dòng)的資助應(yīng)變量:應(yīng)變量:lPARTY(政黨對(duì)當(dāng)?shù)睾蜻x人的資助);(政黨對(duì)當(dāng)?shù)睾蜻x人的資助);自變量:自變量:l定量變量:定量變量:GAP(資助)(資助),VGAP(以往獲勝次數(shù))(以往獲勝次數(shù)),PU(政黨(政黨忠誠(chéng)度)忠誠(chéng)度)l定性變量:定性變量:OPEN(公開競(jìng)爭(zhēng)否)(公開競(jìng)爭(zhēng)否),DEMOCRAT(民主(民主黨)黨),COMM(共和黨)

20、(共和黨)6.5 回歸的比較回歸的比較l對(duì)于模型:對(duì)于模型:Yi=B1+B2Di+B3Xi+B4(DiXi)+uil給定給定Di=0,并對(duì)上式兩端取均值,得男性,并對(duì)上式兩端取均值,得男性平均食品支出函數(shù):平均食品支出函數(shù):E(Yi|D=0,Xi)=B1+B3Xil給定給定Di=1,并對(duì)上式兩端取均值,得女性,并對(duì)上式兩端取均值,得女性平均食品支出函數(shù):平均食品支出函數(shù):E(Yi|D=1,Xi)=(B1+B2)+(B3+B4)Xil我們稱我們稱B2為差別截距系數(shù),為差別截距系數(shù),B4為為差別斜率差別斜率系數(shù)系數(shù)l根據(jù)差別截距系數(shù)和差別斜率系數(shù)的統(tǒng)計(jì)根據(jù)差別截距系數(shù)和差別斜率系數(shù)的統(tǒng)計(jì)顯著性,可

21、以辨別出女性和男性食品支出顯著性,可以辨別出女性和男性食品支出函數(shù)是截距為同還是斜率不同,或是都不函數(shù)是截距為同還是斜率不同,或是都不同:同:b) 平均回歸平均回歸XYc) 并發(fā)回歸并發(fā)回歸XYd) 相異回歸相異回歸XYa) 一致回歸一致回歸XY截距和斜率都沒有差異截距不同,斜率相同截距相同,斜率不同截距和斜率都不同l模型的選擇:對(duì)于模型模型的選擇:對(duì)于模型6-1; 6-8; 6-23模型類型模型類型自變量自變量系數(shù)系數(shù)T統(tǒng)計(jì)量統(tǒng)計(jì)量6-1D(性別性別)503.16329.576-8D(性別性別)X(稅后收入)稅后收入)-288.980.0589-2.149.646-23DXDX-67.890

22、.062-0.0063-0.1947.376-0.484實(shí)踐中,應(yīng)考慮最全面的模型,再經(jīng)過適當(dāng)實(shí)踐中,應(yīng)考慮最全面的模型,再經(jīng)過適當(dāng)?shù)脑\斷檢驗(yàn)后,簡(jiǎn)化成較小的模型。的診斷檢驗(yàn)后,簡(jiǎn)化成較小的模型。l例例6-4:美國(guó):美國(guó)19701995儲(chǔ)蓄收入關(guān)系。儲(chǔ)蓄收入關(guān)系。由于由于1982年以來的經(jīng)濟(jì)衰退,有兩種方法年以來的經(jīng)濟(jì)衰退,有兩種方法可考查衰退對(duì)儲(chǔ)蓄的影響??煽疾樗ネ藢?duì)儲(chǔ)蓄的影響。法一:分兩個(gè)時(shí)期來作回歸;法一:分兩個(gè)時(shí)期來作回歸;法二:引入虛擬變量,將兩個(gè)回歸模型統(tǒng)一成法二:引入虛擬變量,將兩個(gè)回歸模型統(tǒng)一成一個(gè)。一個(gè)。模型的比較模型的比較1970-1995CDXDX1.016152.480

23、.0803-0.0650.054.615.54-4.0961970-1995CX62.4230.03764.898.891970-1981CX1.0160.08031982-1995CX153.49(1.016+152.479)0.0148(0.0803-0.0655)6.6 虛擬變量在季節(jié)分析中的應(yīng)用虛擬變量在季節(jié)分析中的應(yīng)用l例:冰箱的銷售量與季節(jié)性例:冰箱的銷售量與季節(jié)性lYt=B1+B2D2t+B3D3t+B4D4t+utl其中,其中,Yt: 冰箱銷售量(千臺(tái))冰箱銷售量(千臺(tái))D2,D3,D4分別表示每年的第二、第三和第四分別表示每年的第二、第三和第四季度取值為季度取值為1,第一季度

24、值為,第一季度值為0,即第一季度作,即第一季度作為基準(zhǔn)季度。為基準(zhǔn)季度。l回歸結(jié)果(回歸結(jié)果(630)的回歸模型的說明:)的回歸模型的說明:(1)第二季度和第三季度存在季節(jié)效應(yīng))第二季度和第三季度存在季節(jié)效應(yīng)(D2,D3的系數(shù)顯著不為的系數(shù)顯著不為0),第四季度則沒有通,第四季度則沒有通過顯著性檢驗(yàn)。過顯著性檢驗(yàn)。(2)利用該模型獲得經(jīng)季節(jié)調(diào)整后冰箱銷售)利用該模型獲得經(jīng)季節(jié)調(diào)整后冰箱銷售量的時(shí)間序列:量的時(shí)間序列:l用實(shí)際的用實(shí)際的Y減去從方程估計(jì)得到的減去從方程估計(jì)得到的Y,即回歸式的殘,即回歸式的殘差,再把這個(gè)殘差加上差,再把這個(gè)殘差加上Y的均值,得到的序列就是的均值,得到的序列就是經(jīng)季

25、節(jié)調(diào)整后的序列,該序列表現(xiàn)出時(shí)間序列的其經(jīng)季節(jié)調(diào)整后的序列,該序列表現(xiàn)出時(shí)間序列的其他成分(周期、趨勢(shì)和隨機(jī)等)他成分(周期、趨勢(shì)和隨機(jī)等)6.7 應(yīng)變量也是虛擬變量的情形:線性概應(yīng)變量也是虛擬變量的情形:線性概率模型(率模型(LPM)lLPM: 應(yīng)變量應(yīng)變量Y的取值只有兩種情形,的取值只有兩種情形,0或或1.這樣的這樣的Y稱為兩分變量稱為兩分變量l這種以情形下,不宜用這種以情形下,不宜用OLS估計(jì)方法:估計(jì)方法:雖然雖然Y的值為的值為1或或0,但無法保證,但無法保證Y的估計(jì)值介的估計(jì)值介于于01之間,實(shí)際上,之間,實(shí)際上,可能為負(fù)或大于可能為負(fù)或大于1;由于由于Y是一個(gè)二分變量,是一個(gè)二分變

26、量,u也是一個(gè)二分變量,也是一個(gè)二分變量,它不再服從正態(tài)分布,而是二項(xiàng)概率分布;它不再服從正態(tài)分布,而是二項(xiàng)概率分布;誤差項(xiàng)將是異方差的;誤差項(xiàng)將是異方差的;由于由于Y僅取值僅取值0和和1,慣用的,慣用的R2沒有實(shí)際意義了沒有實(shí)際意義了l對(duì)上述問題的解決:對(duì)上述問題的解決:隨著樣本容量的擴(kuò)大,二項(xiàng)分布收斂于正態(tài)分隨著樣本容量的擴(kuò)大,二項(xiàng)分布收斂于正態(tài)分布;布;異方差有其處理方法;異方差有其處理方法;估計(jì)的估計(jì)的Y可能在可能在01區(qū)間之外:區(qū)間之外:l實(shí)踐中有一個(gè)簡(jiǎn)單的處理方法(在實(shí)踐中有一個(gè)簡(jiǎn)單的處理方法(在01區(qū)間之外的區(qū)間之外的Y值不太多時(shí))值不太多時(shí)) 為負(fù)則取為負(fù)則取0; 大于大于1,

27、則取,則取1.lLogit model & Probit modell例:考慮食品支出與稅后收入、性別和年例:考慮食品支出與稅后收入、性別和年齡的關(guān)系(數(shù)據(jù)見表齡的關(guān)系(數(shù)據(jù)見表10-10)Yi=B1+B2Xi+u其中:其中:Y=1表示申請(qǐng)到了房貸,否則為表示申請(qǐng)到了房貸,否則為0; X表表示年家庭收入示年家庭收入估計(jì)結(jié)果:估計(jì)結(jié)果:i=-0.9456+0.0255Xi (相應(yīng)的相應(yīng)的t值和值和R2見見P232)對(duì)模型的解釋:對(duì)模型的解釋:l收入每增加收入每增加1美元,獲得房貸的概率大約增加美元,獲得房貸的概率大約增加0.03l實(shí)際中:房貸的概率隨收入水平以固定增速線性增實(shí)際中:房貸的

28、概率隨收入水平以固定增速線性增加,與實(shí)際不符加,與實(shí)際不符l例例6-6:借貸市場(chǎng)上的歧視:借貸市場(chǎng)上的歧視應(yīng)變量應(yīng)變量Y為二分變量,通過貸款申請(qǐng)賦值為為二分變量,通過貸款申請(qǐng)賦值為1,否則為否則為0;研究目的是為了判斷是否由于性別、種族和其研究目的是為了判斷是否由于性別、種族和其他一些定性因素導(dǎo)致了貸款市場(chǎng)上的歧視行為。他一些定性因素導(dǎo)致了貸款市場(chǎng)上的歧視行為?;貧w的結(jié)果:回歸的結(jié)果:*:p值等于或低于值等于或低于5%;* : p值大于值大于5%解釋變量解釋變量系數(shù)系數(shù)t值值截距截距0.501未給出未給出AI(收入)(收入)1.4894.69*XMD(債務(wù)減抵押貸款支出)(債務(wù)減抵押貸款支出)

29、-1.509-5.74*DF(性別)(性別)0.1400.78*DR(種族)(種族)-0.266-1.84*DS(婚否)(婚否)-0.238-1.75*DA(房屋年限)(房屋年限)-1.426-3.52*NNWP(領(lǐng)居中非的種人的比例)(領(lǐng)居中非的種人的比例)-1.7620.74*NMFI0.1500.23*NA (鄰居房屋的平均年限)(鄰居房屋的平均年限)-0.393-0.1346.8總結(jié)總結(jié)l虛擬變量的作用:虛擬變量的作用:“數(shù)據(jù)分類器數(shù)據(jù)分類器”l應(yīng)用虛擬變量應(yīng)注意的地方:應(yīng)用虛擬變量應(yīng)注意的地方:如果回歸模型包含了一個(gè)常數(shù)項(xiàng),則虛擬變量如果回歸模型包含了一個(gè)常數(shù)項(xiàng),則虛擬變量的個(gè)數(shù)必須

30、比每個(gè)定性變量的分類數(shù)少一;的個(gè)數(shù)必須比每個(gè)定性變量的分類數(shù)少一;虛擬變量系數(shù)的解釋與基準(zhǔn)類有關(guān);虛擬變量系數(shù)的解釋與基準(zhǔn)類有關(guān);若模型包含多個(gè)定性變量,且每個(gè)定性變量有若模型包含多個(gè)定性變量,且每個(gè)定性變量有多種分類,則引入模型的虛擬變量將消耗大量多種分類,則引入模型的虛擬變量將消耗大量的自由度,故應(yīng)權(quán)衡進(jìn)入模型中虛擬變量的個(gè)的自由度,故應(yīng)權(quán)衡進(jìn)入模型中虛擬變量的個(gè)數(shù)以免超過樣本觀察值的個(gè)數(shù)。數(shù)以免超過樣本觀察值的個(gè)數(shù)。l例:考察考察1990年前后的中國(guó)居民的總儲(chǔ)蓄年前后的中國(guó)居民的總儲(chǔ)蓄-收入關(guān)系是否已發(fā)生變化。收入關(guān)系是否已發(fā)生變化。下表給出了中國(guó)下表給出了中國(guó)19792001年以城鄉(xiāng)儲(chǔ)

31、蓄存款年以城鄉(xiāng)儲(chǔ)蓄存款余額代表的居民儲(chǔ)蓄以及以余額代表的居民儲(chǔ)蓄以及以GNP代表的居民收代表的居民收入的數(shù)據(jù)。入的數(shù)據(jù)。表:表:19792001中國(guó)儲(chǔ)蓄與中國(guó)儲(chǔ)蓄與GDP,單位:億元,單位:億元90年前年前儲(chǔ)蓄儲(chǔ)蓄GDP90年后年后儲(chǔ)蓄儲(chǔ)蓄GDP19792814038.21991910721662.51980399.54517.8199211545.426651.91981523.74860.3199314762.434560.51982675.45301.8199421518.8466701983892.55957.4199529662.357494.919841214.77206.7199

32、638520.866850.519851622.68989.1199746279.873142.719862237.610201.4199853407.576967.219873073.311954.5199959621.880579.419883801.514922.3200064332.488228.119895146.916917.8200173762.494346.419907034.218598.4 以以Y為儲(chǔ)蓄,為儲(chǔ)蓄,X為收入,可令:為收入,可令:l 1990年前:年前: Yi= 1+ 2Xi+ 1i i=1,2,n1 l 1990年后:年后: Yi= 1+ 2Xi+ 2i i=

33、1,2,n2 則有可能出現(xiàn)下述四種情況中的一種:則有可能出現(xiàn)下述四種情況中的一種:(1) 1= 1 ,且,且 2= 2 ,即兩個(gè)回歸相同,稱為,即兩個(gè)回歸相同,稱為一致回歸(Coincident Regressions););(2) 11 ,但但 2= 2 ,即兩個(gè)回歸的差異僅在其截距,即兩個(gè)回歸的差異僅在其截距,稱為稱為平行回歸(Parallel Regressions);(3) 1= 1 ,但,但 22 ,即兩個(gè)回歸的差異僅在其斜,即兩個(gè)回歸的差異僅在其斜率,稱為率,稱為并發(fā)回歸(Concurrent Regressions);(4) 11,且,且 22 ,即兩個(gè)回歸完全不同,稱為,即兩個(gè)

34、回歸完全不同,稱為相異回歸(Dissimilar Regressions)。)。這一問題也可通過引入乘法形式的虛擬變量來解決。這一問題也可通過引入乘法形式的虛擬變量來解決。將將n1與與n2次觀察值合并,并用以估計(jì)以下回歸:次觀察值合并,并用以估計(jì)以下回歸:iiiiiiXDDXY)(4310Di為引入的虛擬變量:為引入的虛擬變量:01iD年后年前9090 于是有:于是有:iiiiXXDYE10), 0|(iiiiXXDYE)()(), 1|(4130可分別表示可分別表示1990年年后期后期與與前期前期的儲(chǔ)蓄函數(shù)。的儲(chǔ)蓄函數(shù)。在統(tǒng)計(jì)檢驗(yàn)中,如果在統(tǒng)計(jì)檢驗(yàn)中,如果 4=0的假設(shè)被拒絕,則說的假設(shè)被拒絕,則說明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。l 具體的回歸結(jié)果為:具體的回歸結(jié)果為: (-6.11) (22.89) (4.33) (-2.55) 由由 3與與 4的的t檢驗(yàn)可知:參數(shù)顯著地不等于檢驗(yàn)可知:參數(shù)顯著地不等于0,強(qiáng)烈示出兩個(gè)時(shí)期的回歸是相異的,強(qiáng)烈示出兩個(gè)時(shí)期的回歸是相異的,儲(chǔ)蓄函儲(chǔ)蓄函數(shù)分別為:數(shù)分別為:1990年前:年前:1990年后:年后:iiiiiXDDXY476

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論