第四部分-其他-離散因變量和受限因變量模型_第1頁
第四部分-其他-離散因變量和受限因變量模型_第2頁
第四部分-其他-離散因變量和受限因變量模型_第3頁
第四部分-其他-離散因變量和受限因變量模型_第4頁
第四部分-其他-離散因變量和受限因變量模型_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第四部分離散被解釋變量和受限因變量模型

第一節(jié)離散被解釋變量一、一些離散被解釋變量的例子二元選擇模型(購買/不購買)多值選擇模型:對于交通方式的選擇,對汽車的選擇等無序有序2二、二元選擇模型定義:最簡單的在離散選擇模型,在兩個(gè)可供選擇的方案中選擇其一,此時(shí)被解釋變量只取兩個(gè)值,稱為二元選擇模型(binarychoicemodel)。例如學(xué)生是否選擇某選修課程,選或者不選消費(fèi)者對某種商品的選擇,買或者不買農(nóng)民是否加入合作醫(yī)療保險(xiǎn),加入或者不加入3(一)線性概率模型1、線性概率模型:例如,研究居民的收入與購買住房決策的關(guān)系

看上去和OLS回歸一樣,區(qū)別是Y只取0和1兩個(gè)值。52、線性概率模型的特點(diǎn)63、隨機(jī)擾動項(xiàng)的分布隨機(jī)擾動項(xiàng)不服從正態(tài)分布。對于參數(shù)估計(jì)不會產(chǎn)生影響,但會影響統(tǒng)計(jì)推斷。只有大樣本情況下,才可以利用正態(tài)分布假定進(jìn)行統(tǒng)計(jì)推斷。774、線性概率模型評價(jià)優(yōu)點(diǎn):計(jì)算簡單,結(jié)果易于解釋缺點(diǎn):預(yù)測概率值可能落在[0,1]之外。(解決方法:假設(shè)負(fù)的擬合值為0,大于1的擬合值為1.)線性概率模型假定自變量與Y=1的概率之間存在線性關(guān)系,而實(shí)際往往不是線性的。隨機(jī)誤差項(xiàng)不是正態(tài)分布隨機(jī)誤差項(xiàng)具有異方差。(方差為p(1-p),而P是Y=1的概率,此概率對不同觀測值不同。)8(二)非線性概率模型實(shí)際上,p與x可能是非線性關(guān)系。隨著X的增加,P(y=1)的概率在增加,但不超過[0,1]P和x的關(guān)系是非線性的.隨著x變大,p趨向1的速度也越慢。怎樣的函數(shù)有這個(gè)特性?累積分布函數(shù)考慮y的兩點(diǎn)分布根據(jù)累積分布函數(shù)形式如果F是正態(tài)分布的累積分布函數(shù),Probit模型如果F是邏輯分布的累積分布函數(shù),logit模型9Probit曲線,Logit曲線比較示意圖10logit曲線Probit曲線111、Probit模型分布函數(shù)取標(biāo)準(zhǔn)正態(tài)分布。稱為Probit模型或者概率單位模型利用極大似然估計(jì)方法求解12Probit模型參數(shù)的含義可以證明,x對y=1的概率的邊際影響為可見,系數(shù)本身并不是邊際影響,邊際影響也不是常數(shù)。但和邊際影響的符號相同。132、Logit模型隨機(jī)擾動項(xiàng)取Logistic分布,稱為Logit模型利用極大似然估計(jì)方法求解14Logit模型參數(shù)的含義Logit可以計(jì)算機(jī)會比,將[0,1]區(qū)間上的預(yù)測概率的問題轉(zhuǎn)化為在實(shí)數(shù)軸上預(yù)測一個(gè)事件發(fā)生的機(jī)會比的問題。153、非線性模型的擬合優(yōu)度不再使用常用三個(gè)指標(biāo)Pseudo-R2概率的正確預(yù)測率檢查Y=1或0的概率的正確性,判斷擬合的好壞預(yù)測值與真實(shí)值的相關(guān)系數(shù)相關(guān)系數(shù)高,表明擬合越好164、模型的選擇直接比較三種概率模型的系數(shù)是沒有意義的線性概率模型可用于問題的初步分析Logit模型,系數(shù)含義可以通過機(jī)會比得以jiesh解釋,可以擴(kuò)展到多元選擇模型Probit模型,可由隨機(jī)變量服從正態(tài)分布的假定得到,可以擴(kuò)展到Tobit模型1717三個(gè)模型估計(jì)系數(shù)的大概關(guān)系LPM*2.5=ProbitLPM*4=logitProbit*1.6=logit以上只是一個(gè)大概的關(guān)系.18(三)二值選擇模型的微觀基礎(chǔ)Probit模型和Logit模型的潛變量模型推導(dǎo):這里不可觀測,通常稱為潛變量(latentvariable)。我們能觀測到的是虛擬變量:19如果隨機(jī)項(xiàng)服從正態(tài)分布,則為Probit如果隨機(jī)項(xiàng)服從邏輯分布,則為logit20

三、排序模型

當(dāng)因變量不止是兩種選擇時(shí),就要用到多元選擇模型(multiplechoicemodel)。多元離散選擇問題普遍存在于經(jīng)濟(jì)生活中。例如:

(1)一個(gè)人面臨多種職業(yè)選擇,將可供選擇的職業(yè)排隊(duì),用0,1,2,3表示。影響選擇的因素有不同職業(yè)的收入、發(fā)展前景和個(gè)人偏好等;

(2)同一種商品,不同的消費(fèi)者對其偏好不同。例如,十分喜歡、一般喜歡、無所謂、一般厭惡和十分厭惡,分別用0,1,2,3,4表示。而影響消費(fèi)者偏好的因素有商品的價(jià)格、性能、收入及對商品的需求程度等;

(3)一個(gè)人選擇上班時(shí)所采用的方式——自己開車,乘出租車,乘公共汽車,還是騎自行車。21所謂“排序”是指在各個(gè)選擇項(xiàng)之間有一定的順序或級別種類。如果離散數(shù)據(jù)有天然的排序,需要建立排序選擇模型(orderedchoicemodel)。如:公司的評級

受到的教育程度

22

與二元選擇模型類似,設(shè)有一個(gè)潛在變量yi*,是不可觀測的,可觀測的是yi

,設(shè)yi有0,1,2,…,M等M+1個(gè)取值。(1)其中:ui*是獨(dú)立同分布的隨機(jī)變量,yi可以通過yi*按下式得到

(2)

23

設(shè)ui*的分布函數(shù)為F(x),可以得到如下的概率

(3)根據(jù)分布函數(shù)F(x)的不同可以有有序Probit模型、有序Logit模型。采用極大似然方法估計(jì)參數(shù)需要指出的是,M個(gè)臨界值c1,c2,…,cM事先也是不確定的,所以也作為參數(shù)和回歸系數(shù)一起估計(jì)。計(jì)數(shù)模型(CountModel)被解釋變量表示次數(shù)時(shí),離散模型變?yōu)橛?jì)數(shù)模型例如:某地區(qū)發(fā)生沙塵暴的次數(shù)公司申請專利數(shù)量常見模型泊松分布負(fù)二項(xiàng)回歸等

24離散因變量STATA操作案例1、二元選擇模型。命令191~193數(shù)據(jù)文件:womenwk.dta主要變量:work——0,1(1=就業(yè))age——年齡Married——(1=已婚)Children——子女?dāng)?shù)目Education——受教育年限25考慮模型26線性概率回歸(LPM)usewomenwk.dta,clearregworkagemarriedchildreneducationestimatesstorelpm27Probit回歸probitworkagemarriedchildreneducationestimatesstoreprobit

計(jì)算邊際效應(yīng)mfx計(jì)算準(zhǔn)確預(yù)測的比率estatclas28Logit回歸logitworkagemarriedchildreneducation,nologestimatesstorelogit

計(jì)算邊際效應(yīng)mfx計(jì)算準(zhǔn)確預(yù)測的比率estatclas29回歸結(jié)果比較estimatestablelpmprobitlogit3031離散因變量STATA操作案例2。有序選擇模型。命令P202(helpologit)數(shù)據(jù)文件:panel184extract.dta,公司債券評級模型主要變量:rating83——83年的債券評級,2-5,5為最優(yōu)ia83——83年的incometoasset比率dia——ia比率1982-1983年的變化3132Orderedlogit估計(jì)usepanel184extract.dta,clearologitrating83cia83dia,nolog預(yù)測每個(gè)公司的評級概率predictr2r3r4r5(預(yù)測評級概率,并命名)listr2r3r4r5in1/1(僅顯示第一個(gè)公司評級概率)3233Orderedprobit估計(jì)usepanel184extract.dta,clearoprobitrating83cia83dia,nolog預(yù)測每個(gè)公司的評級概率predictp2p3p4p5listp2p3p4p5in1/13334第二節(jié)受限因變量模型

在某些情況下,被解釋變量的取值范圍可能受到限制,稱為受限因變量模型(limiteddependentvariablemodels)。

本節(jié)研究兩類受限因變量模型審查回歸,截取回歸,歸并問題(censored)

截?cái)嗷貧w,斷尾回歸(truncated)。35“歸并”

(censoring)問題

將被解釋變量的處于某一范圍的樣本觀測值都用一個(gè)相同的值代替。例如:需求函數(shù)模型中用實(shí)際消費(fèi)量作為需求量的觀測值,如果存在供給限制,就出現(xiàn)“歸并”問題。被解釋變量觀測值存在最高和最低的限制。例如考試成績,最高100,最低0,出現(xiàn)“歸并”問題。36“截?cái)唷保╰runcation)問題

由于條件限制,樣本不能隨機(jī)抽取,即不能從全部個(gè)體,而只能從一部分個(gè)體中隨機(jī)抽取被解釋變量的樣本觀測值,而這部分個(gè)體的觀測值都大于或者小于某個(gè)確定值。

“掐頭”或者“去尾”。例如:銀行貸款,我們只能觀察到獲得銀行貸款的企業(yè)的數(shù)據(jù)。(實(shí)際上是選擇性樣本)通常表現(xiàn)為“截?cái)鄻颖尽?。原因:問題的局限。37一、審查回歸模型(censoredregressionmodels)定義1:對于線性回歸模型,當(dāng)或者時(shí),所有y都被記錄為c。

即:當(dāng)被解釋變量為截取數(shù)據(jù)時(shí),我們雖然有全部觀察數(shù)值,但對于某些觀察數(shù)據(jù),被解釋變量被壓縮再一個(gè)點(diǎn)上了。

此時(shí)Y的概率分布變成由一個(gè)離散點(diǎn),與一個(gè)連續(xù)分布所組成的混合分布38一、審查回歸模型(censoredregressionmodels)例如:買車開支。如果買車,那么買車開支為正,不買車開支為0企業(yè)R&D支出。有相當(dāng)部分企業(yè)的R&D支出為0.有R&D支出的企業(yè)數(shù)據(jù)大致連續(xù)分布假設(shè)真實(shí)情況為3940Tobit模型(一類特殊,代表性的截取回歸模型)一類重要的限制因變量模型,在嚴(yán)格為正時(shí)大致連續(xù),但總體中有一個(gè)不可忽略的部分取值為零。例如,某人在一個(gè)月中酒方面的花費(fèi)就是一個(gè)例子。有相當(dāng)多的人在酒方面的花費(fèi)為零。我們不是簡單的將這些觀測從樣本中去掉,而是建立Tobit模型。

41TOBIT模型的理論基礎(chǔ),考慮下面的潛在因變量回歸模型

(1)其中:

是比例系數(shù);y*是潛在變量。被觀察的數(shù)據(jù)y與潛在變量y*的關(guān)系如下:

(2)數(shù)據(jù)的現(xiàn)實(shí):問題是可以得到全部觀察值,但是信息可能不全面。對估計(jì)的影響如果用OLS,無論是用整個(gè)樣本,還是去掉離散點(diǎn)后的子樣本,都不能得到一致估計(jì)4243審查回歸模型的極大似然估計(jì)

可以采用極大似然法估計(jì)審查回歸模型的參數(shù),對數(shù)似然函數(shù)為

(4)求式(4)的最大值即可得參數(shù)

,

的估計(jì)。這里f,F分別是u的密度函數(shù)和分布函數(shù)。

44二、

截?cái)啵〝辔玻┗貧w模型(truncatedRegression)定義:對于線性模型,,假設(shè)只有的數(shù)據(jù)才能觀測到。形象地說:就是掐頭或者去尾。即在很多實(shí)際問題中,不能從全部個(gè)體中抽取因變量的樣本觀測值,而只能從大于或小于某個(gè)數(shù)的范圍內(nèi)抽取樣本的觀測值

45例如,在研究與收入有關(guān)的問題時(shí),收入作為被解釋變量。從理論上講,收入應(yīng)該是從零到正無窮,但實(shí)際中由于各種客觀條件的限制,只能獲得處在某個(gè)范圍內(nèi)的樣本觀測值。這就是一個(gè)截?cái)鄦栴}。數(shù)據(jù)存在的問題數(shù)據(jù)缺失估計(jì)方法MLE但是要利用條件密度函數(shù)46斷尾前Y的概率密度函數(shù)為:樣本被觀察到的概率斷尾后的條件密度為474849求解該1階極值條件,即可以得到模型的參數(shù)估計(jì)量。由于這是一個(gè)復(fù)雜的非線性問題,需要采用迭代方法求解,例如牛頓法。受限因變量模型的STATA操作案例3、censored回歸。命令見P215數(shù)據(jù)文件:womenwk.dta主要數(shù)據(jù)lwf——不工作0;工作:工資的對數(shù)Age——年齡Married——婚否Children——子女?dāng)?shù)目Education——教育年限50OLS估計(jì)usewomenwk.dta,clearreglwfage

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論