第十章定性選擇模型與受限因變量模型詳解演示文稿_第1頁(yè)
第十章定性選擇模型與受限因變量模型詳解演示文稿_第2頁(yè)
第十章定性選擇模型與受限因變量模型詳解演示文稿_第3頁(yè)
第十章定性選擇模型與受限因變量模型詳解演示文稿_第4頁(yè)
第十章定性選擇模型與受限因變量模型詳解演示文稿_第5頁(yè)
已閱讀5頁(yè),還剩51頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章定性選擇模型與受限因變量模型詳解演示文稿現(xiàn)在是1頁(yè)\一共有56頁(yè)\編輯于星期五優(yōu)選第十章定性選擇模型與受限因變量模型現(xiàn)在是2頁(yè)\一共有56頁(yè)\編輯于星期五第一節(jié)線性概率模型

因變量為虛擬變量的模型被稱為定性選擇模型或定性響應(yīng)模型。如果只有兩個(gè)選擇,我們可用0和1分別表示它們,如乘公交為0,自駕車為1,這樣的模型稱為二元選擇模型(binarychoiceModels),多于兩個(gè)選擇(如上班方式加上一種騎自行車)的定性選擇模型稱為多項(xiàng)選擇模型(Multinomialchoicemodels)。我們先從基礎(chǔ)的二元選擇模型入手,介紹定性選擇模型的設(shè)定和估計(jì)。最簡(jiǎn)單的二元選擇模型是線性概率模型(LinearProbabilityModels,LPM)?,F(xiàn)在是3頁(yè)\一共有56頁(yè)\編輯于星期五一、線性概率模型的概念下面用一個(gè)關(guān)于是否讀研究生的例子來(lái)說(shuō)明如何解釋線性概率模型的結(jié)果。模型為:其中:現(xiàn)在是4頁(yè)\一共有56頁(yè)\編輯于星期五

設(shè)回歸結(jié)果如下(所有系數(shù)值均在10%水平統(tǒng)計(jì)上顯著):

對(duì)每個(gè)觀測(cè)值,我們可根據(jù)(10.3)式計(jì)算因變量的擬合值或預(yù)測(cè)值。在常規(guī)OLS回歸中,因變量的擬合值或預(yù)測(cè)值的含義是,平均而言,我們可以預(yù)期的因變量的值。但在本例的情況下,這種解釋就不適用了。假設(shè)學(xué)生甲的平均分為3.5,家庭年收入為5萬(wàn)美元,Y的擬合值為現(xiàn)在是5頁(yè)\一共有56頁(yè)\編輯于星期五盡管因變量在這個(gè)二元選擇模型中只能取兩個(gè)值:0或1,可是該學(xué)生的的擬合值或預(yù)測(cè)值為0.8。我們將該擬合值解釋為該生決定讀研的概率的估計(jì)值。因此,該生決定讀研的可能性或概率的估計(jì)值為0.8。需要注意的是,這種概率不是我們能觀測(cè)到的數(shù)字,能觀測(cè)的是讀研還是不讀研的決定。對(duì)斜率系數(shù)的解釋也不同了。在常規(guī)回歸中,斜率系數(shù)代表的是其他解釋變量不變的情況下,該解釋變量的單位變動(dòng)引起的因變量的變動(dòng)。而在線性概率模型中,斜率系數(shù)表示其他解釋變量不變的情況下,該解釋變量的單位變動(dòng)引起的因變量等于1的概率的變動(dòng)?,F(xiàn)在是6頁(yè)\一共有56頁(yè)\編輯于星期五CPA的系數(shù)估計(jì)值0.4意味著家庭收入不變的情況下,一個(gè)學(xué)生的增加一個(gè)點(diǎn)(如從3.0到4.0),該生決定去讀研的概率的估計(jì)值增加0.4。INCOME的系數(shù)估計(jì)值0.002表明,一個(gè)學(xué)生的成績(jī)不變,而家庭收入增加1000美元(單位為千美元),該生決定去讀研的概率的估計(jì)值增加0.002。LPM模型中,解釋變量的變動(dòng)與虛擬因變量值為1的概率線性相關(guān),因而稱為線性概率模型?,F(xiàn)在是7頁(yè)\一共有56頁(yè)\編輯于星期五二、線性概率模型的估計(jì)和問(wèn)題第一個(gè)問(wèn)題是線性概率模型存在異方差性。擾動(dòng)項(xiàng)的方差是,這里p是因變量等于1的概率,此概率對(duì)于每個(gè)觀測(cè)值不同,因而擾動(dòng)項(xiàng)方差將不是常數(shù),導(dǎo)致異方差性??梢允褂肳LS法,但不是很有效,并且將改變結(jié)果的含義。第二個(gè)問(wèn)題是擾動(dòng)項(xiàng)不是正態(tài)分布的。事實(shí)上,線性概率模型的擾動(dòng)項(xiàng)服從二項(xiàng)分布。第三個(gè)問(wèn)題,它假定自變量與Y=1的概率之間存在線性關(guān)系,而此關(guān)系往往不是線性的。現(xiàn)在是8頁(yè)\一共有56頁(yè)\編輯于星期五

第四個(gè)問(wèn)題是,擬合值可能小于0或大于1,而概率值必須位于0和1的閉區(qū)間內(nèi)?;氐接嘘P(guān)讀研的例子。假設(shè)學(xué)生乙的為4.0,家庭收入為20萬(wàn)美元,則代入(10.3)式,Y的擬合值為

從而得到一個(gè)不可能的結(jié)果(概率值大于1)。假設(shè)另有一個(gè)學(xué)生丙的為1.0,家庭收入為5萬(wàn)元,則其Y的擬合值為-0.2,表明讀研的概率為負(fù)數(shù),這也是一個(gè)不可能的結(jié)果。現(xiàn)在是9頁(yè)\一共有56頁(yè)\編輯于星期五

解決此問(wèn)題的一種方法是,令所有負(fù)擬合值都等于0,所有大于1的擬合值都等于1。但也無(wú)法令人十分滿意,因?yàn)樵诂F(xiàn)實(shí)中很少會(huì)有決策前某人讀研的概率就等于1的情況,同樣,盡管某些人成績(jī)不是很好,但他去讀研的機(jī)會(huì)仍會(huì)大于0。線性概率模型傾向于給出過(guò)多的極端結(jié)果:估計(jì)的概率等于0或1。

現(xiàn)在是10頁(yè)\一共有56頁(yè)\編輯于星期五第五個(gè)問(wèn)題是在線性概率模型中,以及不再是合適的擬合優(yōu)度測(cè)度。事實(shí)上,此問(wèn)題不僅是線性概率模型的問(wèn)題,而是所有定性選擇模型的問(wèn)題。較好一點(diǎn)的測(cè)度是模型正確預(yù)測(cè)的觀測(cè)值的百分比。首先,我們將每一預(yù)測(cè)歸類為1或0。如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測(cè)值為1。若小于0.5,則認(rèn)為因變量的預(yù)測(cè)值為0。然后,將這些預(yù)測(cè)值與實(shí)際發(fā)生的情況相比較,計(jì)算出正確預(yù)測(cè)的百分比:

現(xiàn)在是11頁(yè)\一共有56頁(yè)\編輯于星期五

需要指出的是,這個(gè)測(cè)度也不是很理想,但預(yù)測(cè)結(jié)果的好壞,并非定性選擇模型唯一關(guān)心的事,這類模型常被用于研究影響人們進(jìn)行某個(gè)決策的因素。讓我們來(lái)看一個(gè)競(jìng)選的例子。假設(shè)候選人甲和乙二人競(jìng)選某市市長(zhǎng),我們可以用一個(gè)二元選擇模型來(lái)研究影響選民決策的因素,模型為:其中:現(xiàn)在是12頁(yè)\一共有56頁(yè)\編輯于星期五VariableCoefficientStandarderrort-Statisticp-ValueConstant-0.510.19-2.650.01INCOME0.00980.0033.250.00AGE0.0160.00533.080.00MALE0.00310.130.020.98表10.2兩候選人選舉線性概率模型回歸結(jié)果Dependentvariable:CAND1Observations:30=0.58Adjusted=0.53ResidualSumofSquares=3.15F-statistic=11.87現(xiàn)在是13頁(yè)\一共有56頁(yè)\編輯于星期五如表所示,INCOME的斜率估計(jì)值為正,且在1%的水平上顯著。年齡和性別不變的情況下,收入增加1000元,選擇候選人甲的概率增加0.0098。AGE的斜率估計(jì)值也在1%的水平上顯著。在收入和性別不變的情況下,年齡增加1歲,選擇候選人甲的概率增加0.016。的斜率系數(shù)統(tǒng)計(jì)上不顯著,因而沒(méi)有證據(jù)表明樣本中男人和女人的選票不同。我們可以得出如下結(jié)論:年老一些、富裕一些的選民更喜歡投票給候選人甲。表中給出CAND1的擬合值,每個(gè)大于等于0.5的擬合值計(jì)入CAND1為1的預(yù)測(cè),而小于0.5的擬合值則計(jì)入CAND1為0的預(yù)測(cè)?,F(xiàn)在是14頁(yè)\一共有56頁(yè)\編輯于星期五

從表可看出,30個(gè)觀測(cè)值中,27個(gè)(或90%)預(yù)測(cè)正確。選甲的14人中,12人(或85.7%)預(yù)測(cè)正確。選乙的16人中,15人(或93.8%)預(yù)測(cè)正確。是0.58,表明模型解釋了因變量的58%的變動(dòng),這與90%的正確預(yù)測(cè)比例相比,低了不少。注意表10-3中有一些擬合值大于1或小于0。這是我們前面指出的這類模型的缺點(diǎn)之一,這些擬合值是概率的估計(jì)值,而概率永遠(yuǎn)不可能大于1或小于0。現(xiàn)在是15頁(yè)\一共有56頁(yè)\編輯于星期五第二節(jié)Probit模型和Logit模型

雖然估計(jì)和使用線性概率模型很簡(jiǎn)單,但存在上面討論的幾個(gè)問(wèn)題,其中最嚴(yán)重的兩個(gè)問(wèn)題是擬合值小于0或大于1的問(wèn)題和假定自變量和的概率之間存在線性關(guān)系的假設(shè)不現(xiàn)實(shí)的問(wèn)題。使用更為復(fù)雜的二元響應(yīng)模型可以克服這些缺陷現(xiàn)在是16頁(yè)\一共有56頁(yè)\編輯于星期五一.Probit和Logit模型的設(shè)定估計(jì)二元選擇模型的另一類方法假定回歸模型為這里不可觀測(cè),通常稱為潛變量(latentvariable)。我們能觀測(cè)到的是虛擬變量:現(xiàn)在是17頁(yè)\一共有56頁(yè)\編輯于星期五這就是Probit和Logit方法的思路。Probit模型和Logit模型的區(qū)別在于對(duì)中擾動(dòng)項(xiàng)u的分布的設(shè)定,前者設(shè)定為正態(tài)分布,后者設(shè)定為logistic分布。與線性概率模型的區(qū)別是,這里假設(shè)潛變量的存在。例如,若被觀測(cè)的虛擬變量是某人買(mǎi)車還是不買(mǎi)車,將被定義為“買(mǎi)車的欲望或能力”,注意這里的提法是“欲望”和“能力”,因此解釋變量是解釋這些元素的??梢钥闯?,乘上任何正數(shù)都不會(huì)改變,因此這里習(xí)慣上假設(shè)Var(ui)=1,從而固定的規(guī)模。我們有現(xiàn)在是18頁(yè)\一共有56頁(yè)\編輯于星期五其中F是u的累積分布函數(shù)。如果u的分布是對(duì)稱的,則,我們可以將上式寫(xiě)成我們可寫(xiě)出似然函數(shù):現(xiàn)在是19頁(yè)\一共有56頁(yè)\編輯于星期五

上式中F的函數(shù)形式取決于有關(guān)擾動(dòng)項(xiàng)u的假設(shè),如果的累積分布是logistic分布,則我們得到的是logit模型。在這種情況下,累積分布函數(shù)為:因此現(xiàn)在是20頁(yè)\一共有56頁(yè)\編輯于星期五請(qǐng)注意,對(duì)于logit模型:上式的左端是機(jī)會(huì)(odds)的對(duì)數(shù),稱為對(duì)數(shù)機(jī)會(huì)比率(log-oddsratio),因而上式表明對(duì)數(shù)機(jī)會(huì)比率是各解釋變量的線性函數(shù),而對(duì)于線性概率模型,為各解釋變量的線性函數(shù)。如果服從正態(tài)分布,我們得到的是probit模型(或normit模型),在這種情況下,累積分布函數(shù)為:現(xiàn)在是21頁(yè)\一共有56頁(yè)\編輯于星期五

無(wú)論是probit模型還是logit模型,極大似然函數(shù)都伴隨著非線性估計(jì)方法,目前很多計(jì)量經(jīng)濟(jì)分析軟件已可用于probit和logit分析,用起來(lái)很方便。由于累積正態(tài)分布和累積logistic分布很接近,只是尾部有點(diǎn)區(qū)別,因此,我們無(wú)論logit法還是probit法,得到的結(jié)果都不會(huì)有很大不同??墒?,兩種方法得到的參數(shù)估計(jì)值不是直接可比的。由于logistic分布的方差為,因此,logit模型得到的的估計(jì)值必須乘以,才能與probit模型得到的估計(jì)值相比較(正態(tài)分布標(biāo)準(zhǔn)差為1)。現(xiàn)在是22頁(yè)\一共有56頁(yè)\編輯于星期五概率=F(Z)10ZProbit模型線性概率模型圖10-1線性概率模型和Probit模型現(xiàn)在是23頁(yè)\一共有56頁(yè)\編輯于星期五二、Probit模型和Logit模型的極大似然估計(jì)和假設(shè)檢驗(yàn)估計(jì)LPM,我們可以采用OLS或WLS。在Probit模型和Logit模型中,由于的非線性性質(zhì),OLS或WLS都不再適用。估計(jì)Probit模型和Logit模型,通常采用極大似然法。現(xiàn)在是24頁(yè)\一共有56頁(yè)\編輯于星期五極大似然估計(jì)量(MLE)即由極大化此對(duì)數(shù)似然函數(shù)得到。對(duì)于logit模型,G是標(biāo)準(zhǔn)logisticcdf,是logit估計(jì)量;對(duì)于probit模型,G是標(biāo)準(zhǔn)正態(tài)cdf,是probit估計(jì)量。由于此最大化問(wèn)題的非線性性質(zhì),我們很難寫(xiě)出Probit模型和Logit模型的參數(shù)的極大似然估計(jì)量的具體表達(dá)式。可以證明,在很一般的條件下,MLE是一致的、漸近正態(tài)和漸近有效的(一般性討論參見(jiàn)Woodridge(2002))?,F(xiàn)在是25頁(yè)\一共有56頁(yè)\編輯于星期五伴隨每一個(gè)極大似然估計(jì)值,有一個(gè)與之對(duì)應(yīng)的標(biāo)準(zhǔn)誤差。支持Probit和Logit的軟件包在給出系數(shù)估計(jì)值的同時(shí)會(huì)給出與之對(duì)應(yīng)的標(biāo)準(zhǔn)誤差。一旦我們從軟件包的報(bào)告中得到了標(biāo)準(zhǔn)誤差,就可以構(gòu)造(漸近的)t檢驗(yàn)和置信區(qū)間,與應(yīng)用OLS、2SLS估計(jì)量做檢驗(yàn)時(shí)一樣。例如要檢驗(yàn),我們做法是,構(gòu)造t統(tǒng)計(jì)量,然后按通常的檢驗(yàn)程序進(jìn)行檢驗(yàn)。我們也可以對(duì)Probit模型和Logit模型的參數(shù)的多重約束(即關(guān)于的多個(gè)線性或非線性約束)進(jìn)行檢驗(yàn),可以采用沃爾德檢驗(yàn)、拉格朗日乘數(shù)檢驗(yàn)和似然比檢驗(yàn),詳細(xì)討論見(jiàn)第4、5章有關(guān)內(nèi)容。現(xiàn)在是26頁(yè)\一共有56頁(yè)\編輯于星期五三、偏效應(yīng)在二元響應(yīng)模型的大多數(shù)應(yīng)用中,首要的目標(biāo)是解釋對(duì)響應(yīng)概率的影響。在潛變量模型中,對(duì)潛變量的偏效應(yīng)是,我們下面將看到對(duì)響應(yīng)概率的偏效應(yīng)是,對(duì)正態(tài)分布和logistic分布而言,總有,因而上述兩個(gè)效應(yīng)的符號(hào)相同,影響的方向總是一致的。潛變量極少有一個(gè)確定的度量單位,因而本身的大小,往往不是很有用的(相對(duì)于線性概率模型而言)。對(duì)于大多數(shù)應(yīng)用而言,我們要估計(jì)的是解釋變量對(duì)響應(yīng)概率的影響。由于的非線性本質(zhì),使得這個(gè)工作相當(dāng)復(fù)雜,通常需要區(qū)分為連續(xù)變量和離散變量?jī)煞N情況?,F(xiàn)在是27頁(yè)\一共有56頁(yè)\編輯于星期五(1)如果是一個(gè)大致連續(xù)的變量,則無(wú)論P(yáng)robit模型還是Logit模型,對(duì)響應(yīng)概率的偏效應(yīng)都在處取最大值:在Probit模型中,;在Logit模型中,(2)對(duì)于離散解釋變量,微分沒(méi)有實(shí)際意義。若離散解釋變量從變化到,則其對(duì)響應(yīng)概率的離散偏效應(yīng)可由下式表示現(xiàn)在是28頁(yè)\一共有56頁(yè)\編輯于星期五與LPM模型相比,偏效應(yīng)的值多出一個(gè)乘積項(xiàng),稱為比例因子(scalefactor)或調(diào)整因子(adjustmentfactor),它與全部解釋變量有關(guān),因而會(huì)隨的值而變。在計(jì)算偏效應(yīng)時(shí),為方便起見(jiàn),通常希望有一個(gè)適用于模型中所有斜率的比例因子。有兩種方法解決這個(gè)問(wèn)題:第一種方法是用解釋變量觀測(cè)值的均值計(jì)算偏效應(yīng)的表達(dá)式,比例因子為第二種方法是對(duì)每個(gè)觀測(cè)值計(jì)算偏效應(yīng),然后計(jì)算它們的樣本均值,這樣得到的是平均偏效應(yīng)(averagepartialeffect,APE)。現(xiàn)在是29頁(yè)\一共有56頁(yè)\編輯于星期五四、擬合優(yōu)度的測(cè)度從實(shí)際角度看,在現(xiàn)代計(jì)算機(jī)解決了復(fù)雜的計(jì)算問(wèn)題之后,Probit和Logit模型最困難之處就落在模型結(jié)果的提供和解釋方面。支持Probit和Logit的軟件包都會(huì)報(bào)告系數(shù)估計(jì)值、它們的標(biāo)準(zhǔn)誤差和對(duì)數(shù)似然函數(shù)值。如同在線性概率模型中討論的一樣,Probit模型和Logit模型也可以計(jì)算正確預(yù)測(cè)的百分比這一指標(biāo)作為擬合優(yōu)度的測(cè)度。首先,我們將每一預(yù)測(cè)歸類為1或0。如果擬合值大于等于0.5,則認(rèn)為因變量的預(yù)測(cè)值為1。若小于0.5,則認(rèn)為因變量的預(yù)測(cè)值為0。然后,將這些預(yù)測(cè)值與實(shí)際發(fā)生的情況相比較,計(jì)算出正確預(yù)測(cè)的百分比?,F(xiàn)在是30頁(yè)\一共有56頁(yè)\編輯于星期五盡管正確預(yù)測(cè)的百分比作為擬合優(yōu)度的測(cè)度是有用的,但它也可能造成誤導(dǎo),特別是在對(duì)小可能結(jié)果的預(yù)測(cè)非常糟糕的情況下仍能得到相當(dāng)高的正確預(yù)測(cè)的百分比。例如,假設(shè)n=200,160個(gè)觀測(cè)值為,這160個(gè)觀測(cè)值中,有140個(gè)預(yù)測(cè)值也是0,即使對(duì)于的那40個(gè)觀測(cè)值的預(yù)測(cè)都錯(cuò),正確預(yù)測(cè)全部結(jié)果的百分比仍高達(dá)70%!度量Probit和Logit模型的擬合優(yōu)度的測(cè)度還可以采用各種pseudo-R2。pseudo-原意是偽(假),這里采用它,意思是與常規(guī)R2類似但不相同,而不是說(shuō)它是假的。對(duì)于Probit模型和Logit模型,已經(jīng)開(kāi)發(fā)了幾種有用的pseudo-R2測(cè)度,其中最常用的是McFadden(1974)提出的pseudo-R2測(cè)度現(xiàn)在是31頁(yè)\一共有56頁(yè)\編輯于星期五表10-4兩候選人選舉模型的Probit回歸結(jié)果Dependentvariable:CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-5.191.70-3.060.00INCOME0.0710.0342.100.04AGE0.0730.0342.180.03MALE-0.700.90-0.780.44Observations:30McFaddenpseudo-R2=0.61ResidualSumofSquares=2.62現(xiàn)在是32頁(yè)\一共有56頁(yè)\編輯于星期五采用Probit模型估計(jì)的結(jié)果與前面用線性概率模型估計(jì)的結(jié)果有所不同。采用Probit模型的情況下,INCOME和AGE的系數(shù)估計(jì)值在5%的誤差水平上顯著,而在線性概率模型的情況下,在1%的水平上顯著。由于我們知道線性概率模型存在嚴(yán)重的問(wèn)題,因此Probit結(jié)果可能更準(zhǔn)確一些??墒?,如果是實(shí)際研究的話,要有一個(gè)大得多的樣本。Probit模型的系數(shù)估計(jì)值不能像線性概率模型那樣,解釋成概率的變動(dòng)(有些計(jì)量經(jīng)濟(jì)分析軟件程序可以將系數(shù)估計(jì)值轉(zhuǎn)換為與線性概率模型相當(dāng)?shù)母怕首儎?dòng))。使用Probit模型的一種有意思的方式是求出擬合值進(jìn)行預(yù)測(cè),如我們用線性概率模型所做的一樣?,F(xiàn)在是33頁(yè)\一共有56頁(yè)\編輯于星期五Probit模型中用McFadden的pseudo-R2作為擬合優(yōu)度的測(cè)度。pseudo-R2是用于虛擬因變量模型的擬合優(yōu)度的測(cè)度的名字。pseudo-原意是偽(假),這里采用它,意思是與常規(guī)R2類似但不相同,而不是說(shuō)它是假的。對(duì)于定性選擇模型,已經(jīng)開(kāi)發(fā)了幾種有用的pseudo-R2測(cè)度,這里所用的是McFadden開(kāi)發(fā)的。很多估計(jì)Probit或Logit模型的計(jì)量經(jīng)濟(jì)程序計(jì)算pseudo-R2。本例中給出的0.61的含義是,Probit模型解釋了因變量61%的變動(dòng)。現(xiàn)在是34頁(yè)\一共有56頁(yè)\編輯于星期五

與probit模型一樣,logit模型也不能用OLS法估計(jì),而要用極大似然法估計(jì)。采用表10-1中的同樣數(shù)據(jù)估計(jì)logit模型,回歸結(jié)果如表10-5所示。表10-5兩候選人選舉模型的Logit回歸結(jié)果Dependentvariable:CAND1VariableCoefficientStandarderrort-Statisticp-ValueConstant-8.963.23-2.770.01INCOME0.120.061.980.05AGE0.130.062.030.04MALE-1.031.54-0.670.51Observations:30McFaddenpseudo-R2=0.60ResidualSumofSquares=2.59現(xiàn)在是35頁(yè)\一共有56頁(yè)\編輯于星期五

McFaddenpseudo-R2和統(tǒng)計(jì)顯著性與probit模型的結(jié)果類似。INCOME和AGE的系數(shù)估計(jì)值亦在5%誤差水平上顯著。而MALE則在兩種模型回歸中均不顯著。而斜率系數(shù)估計(jì)值則不同,這是因?yàn)樗鼈兊囊饬x不一樣。例如,AGE的系數(shù)估計(jì)值0.13意味著收入和性別不變的情況下,年齡增大一歲,選舉候選人甲的機(jī)會(huì)的對(duì)數(shù)增加0.13。實(shí)際上,除了斜率系數(shù)的解釋不同,使用probit模型和logit模型并沒(méi)有多大區(qū)別。現(xiàn)在是36頁(yè)\一共有56頁(yè)\編輯于星期五六、多項(xiàng)選擇模型多項(xiàng)選擇模型是研究在多于兩個(gè)的選項(xiàng)中進(jìn)行決策的模型。一般可以依照選擇集分為有序和無(wú)序兩種寬泛的類型。比如,城市交通工具的選擇顯然是無(wú)序的,而投資者選擇公司債券(債券經(jīng)過(guò)評(píng)級(jí))是有序的。有關(guān)二元選擇的Logit模型可以推廣到因變量有兩個(gè)以上離散取值的情況,構(gòu)成多項(xiàng)Logit模型(multinomiallogitmodel),此模型的主要優(yōu)點(diǎn)是容易計(jì)算,選擇給定方案的概率易于被表示,并且極大似然函數(shù)可以用簡(jiǎn)單明了的方式產(chǎn)生和最大化?,F(xiàn)在是37頁(yè)\一共有56頁(yè)\編輯于星期五該模型的缺點(diǎn)是它以所謂的不相干選擇的獨(dú)立性(independenceofirrelevantalternatives,IIA)性質(zhì)為特征。假設(shè)一個(gè)幾乎與一個(gè)已有選項(xiàng)相同的新選項(xiàng)被加進(jìn)選擇集中,我們期望的是,從此模型得到的選擇這兩個(gè)幾乎相同的選項(xiàng)(如乘公共汽車時(shí)選老車型還是新車型)的概率將被分成兩半,而選擇其它選項(xiàng)的概率不受影響。不幸的是,情況不是這樣。因此當(dāng)兩個(gè)或多個(gè)選項(xiàng)是相近替代方案時(shí),采用多項(xiàng)Logit模型不適合。在這種情況下,可考慮多項(xiàng)Probit模型(multinomialProbitmodel)。多項(xiàng)Probit模型允許擾動(dòng)項(xiàng)跨選項(xiàng)相關(guān),從而繞過(guò)IIA困境。它的缺點(diǎn)是計(jì)算困難,計(jì)算四個(gè)以上選項(xiàng)的問(wèn)題幾乎不可行。隨著計(jì)算機(jī)能力和計(jì)算方法的改進(jìn),多項(xiàng)Probit模型的應(yīng)用前景會(huì)越來(lái)越好?,F(xiàn)在是38頁(yè)\一共有56頁(yè)\編輯于星期五如果因變量本質(zhì)上是有序的,多項(xiàng)Logit模型和多項(xiàng)Probit模型均無(wú)法解釋解釋因變量的序數(shù)性質(zhì)。因?yàn)闆Q策者選擇不同的方案所得到的效用也是排序的,一般多元離散選擇模型中的效用關(guān)系不再適用。處理有序離散因變量的常用方法是有序Probit模型與有序Logit模型?,F(xiàn)在是39頁(yè)\一共有56頁(yè)\編輯于星期五*第三節(jié)Censored模型Censored模型研究一類重要的受限因變量:在取正值時(shí)大致連續(xù),但總體中有一個(gè)不可忽略的部分取值為零。考察決定居民家庭用于耐用消費(fèi)品(如汽車等)支出的因素,或者研究居民每年用于慈善捐助支出的決定因素,或者研究居民每月用于特殊消費(fèi)品(如酒類等)支出的決定因素等等。這些研究都需要對(duì)總體進(jìn)行抽樣調(diào)查取得相關(guān)的數(shù)據(jù),而抽樣調(diào)查的結(jié)果有一個(gè)共同的特點(diǎn),那就是有相當(dāng)一部分個(gè)體用于這些方面支出的金額為零,同時(shí)不為零的支出數(shù)據(jù)會(huì)呈現(xiàn)出基本連續(xù)的形態(tài)?,F(xiàn)在是40頁(yè)\一共有56頁(yè)\編輯于星期五一、Censored模型的概念當(dāng)因變量在特定范圍內(nèi)的值都轉(zhuǎn)換成(或報(bào)告為)某個(gè)值時(shí),稱因變量被歸并(censoring),稱此變量為歸并變量(censoredvariable)。censored回歸模型的一般形式是現(xiàn)在是41頁(yè)\一共有56頁(yè)\編輯于星期五二、Tobit模型的估計(jì)為了計(jì)估模型參數(shù),我們推導(dǎo)Y的均值設(shè),稱為逆米爾斯比率(inverseMillsratio),它是標(biāo)準(zhǔn)正態(tài)pdf與標(biāo)準(zhǔn)正態(tài)cdf在c處的比值。則現(xiàn)在是42頁(yè)\一共有56頁(yè)\編輯于星期五有了上面的結(jié)果,我們可以計(jì)算從總體中隨機(jī)抽取的觀測(cè)值的均值因此,一旦有了的估計(jì)值,我們就可以確保Y的預(yù)測(cè)值為正。當(dāng)然,保證Y的預(yù)測(cè)值為正的代價(jià)是使用了更為復(fù)雜的非線性模型?,F(xiàn)在是43頁(yè)\一共有56頁(yè)\編輯于星期五Censored模型通常采用極大似然估計(jì)。由Y的分布,可得模型的對(duì)數(shù)似然函數(shù)為該對(duì)數(shù)似然函數(shù)由兩部分組成:一部分對(duì)應(yīng)于沒(méi)有限制的觀測(cè)值,是經(jīng)典回歸部分;一部分對(duì)應(yīng)于受到限制的觀測(cè)值。因而上式是一個(gè)非標(biāo)準(zhǔn)的對(duì)數(shù)似然函數(shù),實(shí)際上是離散分布與連續(xù)分布的混合。最大化對(duì)數(shù)似然函數(shù),可得極大似然估計(jì)量。這一估計(jì)量的性質(zhì)與普通MLE的性質(zhì)相同。一般情況下,需采用數(shù)值方法來(lái)求極大似然估計(jì)值?,F(xiàn)在是44頁(yè)\一共有56頁(yè)\編輯于星期五求標(biāo)準(zhǔn)誤差的矩陣表達(dá)式很復(fù)雜,詳細(xì)的討論見(jiàn)Wooldridge(2002)。利用Eviews軟件,很方便得到模型的參數(shù)估計(jì)值及標(biāo)準(zhǔn)誤差,因而可以進(jìn)行參數(shù)的假設(shè)檢驗(yàn)。我們還可以采用沃爾德統(tǒng)計(jì)量或似然比統(tǒng)計(jì)量同時(shí)檢驗(yàn)多個(gè)約束,其方法與一般的MLE相同。Censored模型的MLE需要兩個(gè)基本假定:潛變量模型中隨機(jī)干擾項(xiàng)的同方差性和正態(tài)性。如果存在異方差性或非正態(tài)性,那么MLE估計(jì)量便是不一致的。現(xiàn)在是45頁(yè)\一共有56頁(yè)\編輯于星期五在實(shí)踐中,研究人員估計(jì)Censored模型時(shí)往往采用OLS法,盡管OLS估計(jì)值不一致。人們發(fā)現(xiàn)OLS估計(jì)值通常小于ML估計(jì)值,幾乎沒(méi)有例外。一個(gè)值得注意的經(jīng)驗(yàn)規(guī)律是,極大似然估計(jì)值通常約等于OLS估計(jì)值除以樣本中非受限觀測(cè)值的比例。這恐怕是人們估計(jì)Censored模型時(shí)采用OLS法的原因?,F(xiàn)在是46頁(yè)\一共有56頁(yè)\編輯于星期五三、Tobit模型的偏效應(yīng)在潛變量模型中,參數(shù)的含義與線性模型相同,事實(shí)上但潛變量不可觀測(cè),因而這個(gè)結(jié)果通常沒(méi)有什么意義。我們更關(guān)心的是解釋變量如何影響可觀測(cè)變量??梢宰C明,在Tobit模型擾動(dòng)項(xiàng)正態(tài)分布的假設(shè)下,對(duì)的偏效應(yīng)為

現(xiàn)在是47頁(yè)\一共有56頁(yè)\編輯于星期五四、實(shí)例Wooldridge報(bào)告了一個(gè)美國(guó)已婚婦女工作時(shí)數(shù)的例子。樣本數(shù)據(jù)包括753個(gè)已婚婦女的年工作小時(shí)數(shù),其中有428個(gè)婦女小時(shí)數(shù)大于0,另外325個(gè)婦女的工作小時(shí)數(shù)為0。對(duì)工作時(shí)間為正的婦女而言,其工作時(shí)間范圍相當(dāng)寬,從12小時(shí)到4950小時(shí),可以看作連續(xù)變化。因此,年工作小時(shí)數(shù)很適合用Tobit模型,Wooldridge同時(shí)還用OLS估計(jì)了線性模型(使用全部753個(gè)數(shù)據(jù)),結(jié)果由下表給出?,F(xiàn)在是48頁(yè)\一共有56頁(yè)\編輯于星期五因變量:hours自變量線性模型(OLS)Tobit模型(MLE)Nwifeinc-3.45(2.54)-8.81(4.46)Educ28.76(12.95)80.65(21.58)Exper65.67(9.96)131.56(17.28)Exper2-0.70(.325)-1.86(0.54)Age-30.51(4.36)-54.41(7.42)Kidslt6-442.09(58.85)-894.02(111.88)Kidsge6-32.78(23.18)-16.22(38.64)Constant1330.48(270.78)965.31(446.44)ConstantLog-likelihoodvalue-3819.09R-squared0.2660.275750.181122.02現(xiàn)在是49頁(yè)\一共有56頁(yè)\編輯于星期五我們對(duì)比OLS估計(jì)與Tobit估計(jì),可以看出:(1)Tobit系數(shù)估計(jì)值與OLS估計(jì)值具有相同的符號(hào),而且統(tǒng)計(jì)顯著性也類似??赡艿睦獾氖莕wifeinc與kidsge6的系數(shù),nwifeinc在OLS估計(jì)中的t統(tǒng)計(jì)量為-1.41,在Tobit估計(jì)中的t統(tǒng)計(jì)量為-1.98。kidsge6在OLS估計(jì)中的t統(tǒng)計(jì)量為-1.41,在Tobit估計(jì)中的t統(tǒng)計(jì)量為-0.42。(2)本例的結(jié)果可以驗(yàn)證我們前面介紹的經(jīng)驗(yàn)法則。樣本中非受限觀測(cè)值的比例為428/753=0.568,除個(gè)別例外(kidsge6),OLS估計(jì)值除以0.568得到的值與Tobit估計(jì)值大致相當(dāng)。如將Exper的OLS系數(shù)估計(jì)值65.67除以0.568,得到115.62。除了kidsge6外,換算后的OLS估計(jì)值的絕對(duì)值都小于對(duì)應(yīng)的Tobit估計(jì)值的絕對(duì)值。現(xiàn)在是50頁(yè)\一共

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論