第四部分-其他-離散因變量和受限因變量模型

上傳人：翰*** IP屬地：廣西上傳時(shí)間：2023-09-04 格式：PPT 頁數(shù)：56 大小：553.50KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩51頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第四部分離散被解釋變量和受限因變量模型

第一節(jié)離散被解釋變量一、一些離散被解釋變量的例子二元選擇模型（購買/不購買）多值選擇模型：對于交通方式的選擇，對汽車的選擇等無序有序2二、二元選擇模型定義：最簡單的在離散選擇模型，在兩個(gè)可供選擇的方案中選擇其一，此時(shí)被解釋變量只取兩個(gè)值，稱為二元選擇模型（binarychoicemodel）。例如學(xué)生是否選擇某選修課程，選或者不選消費(fèi)者對某種商品的選擇，買或者不買農(nóng)民是否加入合作醫(yī)療保險(xiǎn)，加入或者不加入3（一）線性概率模型1、線性概率模型：例如，研究居民的收入與購買住房決策的關(guān)系

看上去和OLS回歸一樣，區(qū)別是Y只取0和1兩個(gè)值。52、線性概率模型的特點(diǎn)63、隨機(jī)擾動項(xiàng)的分布隨機(jī)擾動項(xiàng)不服從正態(tài)分布。對于參數(shù)估計(jì)不會產(chǎn)生影響，但會影響統(tǒng)計(jì)推斷。只有大樣本情況下，才可以利用正態(tài)分布假定進(jìn)行統(tǒng)計(jì)推斷。774、線性概率模型評價(jià)優(yōu)點(diǎn)：計(jì)算簡單，結(jié)果易于解釋缺點(diǎn)：預(yù)測概率值可能落在[0,1]之外。（解決方法：假設(shè)負(fù)的擬合值為0，大于1的擬合值為1.）線性概率模型假定自變量與Y=1的概率之間存在線性關(guān)系，而實(shí)際往往不是線性的。隨機(jī)誤差項(xiàng)不是正態(tài)分布隨機(jī)誤差項(xiàng)具有異方差。（方差為p(1-p),而P是Y=1的概率，此概率對不同觀測值不同。）8（二）非線性概率模型實(shí)際上，p與x可能是非線性關(guān)系。隨著X的增加，P(y=1)的概率在增加，但不超過[0,1]P和x的關(guān)系是非線性的.隨著x變大，p趨向1的速度也越慢。怎樣的函數(shù)有這個(gè)特性？累積分布函數(shù)考慮y的兩點(diǎn)分布根據(jù)累積分布函數(shù)形式如果F是正態(tài)分布的累積分布函數(shù)，Probit模型如果F是邏輯分布的累積分布函數(shù)，logit模型9Probit曲線，Logit曲線比較示意圖10logit曲線Probit曲線111、Probit模型分布函數(shù)取標(biāo)準(zhǔn)正態(tài)分布。稱為Probit模型或者概率單位模型利用極大似然估計(jì)方法求解12Probit模型參數(shù)的含義可以證明，x對y=1的概率的邊際影響為可見，系數(shù)本身并不是邊際影響，邊際影響也不是常數(shù)。但和邊際影響的符號相同。132、Logit模型隨機(jī)擾動項(xiàng)取Logistic分布，稱為Logit模型利用極大似然估計(jì)方法求解14Logit模型參數(shù)的含義Logit可以計(jì)算機(jī)會比，將[0,1]區(qū)間上的預(yù)測概率的問題轉(zhuǎn)化為在實(shí)數(shù)軸上預(yù)測一個(gè)事件發(fā)生的機(jī)會比的問題。153、非線性模型的擬合優(yōu)度不再使用常用三個(gè)指標(biāo)Pseudo-R2概率的正確預(yù)測率檢查Y=1或0的概率的正確性，判斷擬合的好壞預(yù)測值與真實(shí)值的相關(guān)系數(shù)相關(guān)系數(shù)高，表明擬合越好164、模型的選擇直接比較三種概率模型的系數(shù)是沒有意義的線性概率模型可用于問題的初步分析Logit模型，系數(shù)含義可以通過機(jī)會比得以jiesh解釋，可以擴(kuò)展到多元選擇模型Probit模型，可由隨機(jī)變量服從正態(tài)分布的假定得到，可以擴(kuò)展到Tobit模型1717三個(gè)模型估計(jì)系數(shù)的大概關(guān)系LPM*2.5=ProbitLPM*4=logitProbit*1.6=logit以上只是一個(gè)大概的關(guān)系.18（三）二值選擇模型的微觀基礎(chǔ)Probit模型和Logit模型的潛變量模型推導(dǎo)：這里不可觀測，通常稱為潛變量（latentvariable）。我們能觀測到的是虛擬變量：19如果隨機(jī)項(xiàng)服從正態(tài)分布，則為Probit如果隨機(jī)項(xiàng)服從邏輯分布，則為logit20

三、排序模型

當(dāng)因變量不止是兩種選擇時(shí)，就要用到多元選擇模型(multiplechoicemodel)。多元離散選擇問題普遍存在于經(jīng)濟(jì)生活中。例如：

(1)一個(gè)人面臨多種職業(yè)選擇，將可供選擇的職業(yè)排隊(duì)，用0，1，2，3表示。影響選擇的因素有不同職業(yè)的收入、發(fā)展前景和個(gè)人偏好等；

(2)同一種商品，不同的消費(fèi)者對其偏好不同。例如，十分喜歡、一般喜歡、無所謂、一般厭惡和十分厭惡，分別用0，1，2，3，4表示。而影響消費(fèi)者偏好的因素有商品的價(jià)格、性能、收入及對商品的需求程度等；

(3)一個(gè)人選擇上班時(shí)所采用的方式——自己開車，乘出租車，乘公共汽車，還是騎自行車。21所謂“排序”是指在各個(gè)選擇項(xiàng)之間有一定的順序或級別種類。如果離散數(shù)據(jù)有天然的排序，需要建立排序選擇模型(orderedchoicemodel)。如：公司的評級

受到的教育程度

與二元選擇模型類似，設(shè)有一個(gè)潛在變量yi*，是不可觀測的，可觀測的是yi

，設(shè)yi有0，1，2，…，M等M+1個(gè)取值。（1）其中：ui*是獨(dú)立同分布的隨機(jī)變量，yi可以通過yi*按下式得到

（2）

設(shè)ui*的分布函數(shù)為F(x)，可以得到如下的概率

（3）根據(jù)分布函數(shù)F(x)的不同可以有有序Probit模型、有序Logit模型。采用極大似然方法估計(jì)參數(shù)需要指出的是，M個(gè)臨界值c1,c2,…,cM事先也是不確定的，所以也作為參數(shù)和回歸系數(shù)一起估計(jì)。計(jì)數(shù)模型（CountModel)被解釋變量表示次數(shù)時(shí)，離散模型變?yōu)橛?jì)數(shù)模型例如：某地區(qū)發(fā)生沙塵暴的次數(shù)公司申請專利數(shù)量常見模型泊松分布負(fù)二項(xiàng)回歸等

24離散因變量STATA操作案例1、二元選擇模型。命令191~193數(shù)據(jù)文件：womenwk.dta主要變量：work——0,1（1=就業(yè)）age——年齡Married——（1=已婚）Children——子女?dāng)?shù)目Education——受教育年限25考慮模型26線性概率回歸（LPM）usewomenwk.dta,clearregworkagemarriedchildreneducationestimatesstorelpm27Probit回歸probitworkagemarriedchildreneducationestimatesstoreprobit

計(jì)算邊際效應(yīng)mfx計(jì)算準(zhǔn)確預(yù)測的比率estatclas28Logit回歸logitworkagemarriedchildreneducation,nologestimatesstorelogit

計(jì)算邊際效應(yīng)mfx計(jì)算準(zhǔn)確預(yù)測的比率estatclas29回歸結(jié)果比較estimatestablelpmprobitlogit3031離散因變量STATA操作案例2。有序選擇模型。命令P202(helpologit)數(shù)據(jù)文件：panel184extract.dta,公司債券評級模型主要變量：rating83——83年的債券評級，2-5,5為最優(yōu)ia83——83年的incometoasset比率dia——ia比率1982-1983年的變化3132Orderedlogit估計(jì)usepanel184extract.dta,clearologitrating83cia83dia,nolog預(yù)測每個(gè)公司的評級概率predictr2r3r4r5（預(yù)測評級概率，并命名）listr2r3r4r5in1/1(僅顯示第一個(gè)公司評級概率）3233Orderedprobit估計(jì)usepanel184extract.dta,clearoprobitrating83cia83dia,nolog預(yù)測每個(gè)公司的評級概率predictp2p3p4p5listp2p3p4p5in1/13334第二節(jié)受限因變量模型

在某些情況下，被解釋變量的取值范圍可能受到限制，稱為受限因變量模型(limiteddependentvariablemodels)。

本節(jié)研究兩類受限因變量模型審查回歸，截取回歸,歸并問題(censored）

截?cái)嗷貧w,斷尾回歸(truncated)。35“歸并”

(censoring)問題

將被解釋變量的處于某一范圍的樣本觀測值都用一個(gè)相同的值代替。例如：需求函數(shù)模型中用實(shí)際消費(fèi)量作為需求量的觀測值，如果存在供給限制，就出現(xiàn)“歸并”問題。被解釋變量觀測值存在最高和最低的限制。例如考試成績，最高100，最低0，出現(xiàn)“歸并”問題。36“截?cái)唷保╰runcation）問題

由于條件限制，樣本不能隨機(jī)抽取，即不能從全部個(gè)體，而只能從一部分個(gè)體中隨機(jī)抽取被解釋變量的樣本觀測值，而這部分個(gè)體的觀測值都大于或者小于某個(gè)確定值。

“掐頭”或者“去尾”。例如：銀行貸款，我們只能觀察到獲得銀行貸款的企業(yè)的數(shù)據(jù)。（實(shí)際上是選擇性樣本）通常表現(xiàn)為“截?cái)鄻颖尽?。原因：問題的局限。37一、審查回歸模型(censoredregressionmodels）定義1：對于線性回歸模型,當(dāng)或者時(shí)，所有y都被記錄為c。

即：當(dāng)被解釋變量為截取數(shù)據(jù)時(shí)，我們雖然有全部觀察數(shù)值，但對于某些觀察數(shù)據(jù)，被解釋變量被壓縮再一個(gè)點(diǎn)上了。

此時(shí)Y的概率分布變成由一個(gè)離散點(diǎn)，與一個(gè)連續(xù)分布所組成的混合分布38一、審查回歸模型(censoredregressionmodels）例如：買車開支。如果買車，那么買車開支為正，不買車開支為0企業(yè)R&D支出。有相當(dāng)部分企業(yè)的R&D支出為0.有R&D支出的企業(yè)數(shù)據(jù)大致連續(xù)分布假設(shè)真實(shí)情況為3940Tobit模型（一類特殊，代表性的截取回歸模型）一類重要的限制因變量模型，在嚴(yán)格為正時(shí)大致連續(xù)，但總體中有一個(gè)不可忽略的部分取值為零。例如，某人在一個(gè)月中酒方面的花費(fèi)就是一個(gè)例子。有相當(dāng)多的人在酒方面的花費(fèi)為零。我們不是簡單的將這些觀測從樣本中去掉，而是建立Tobit模型。

41TOBIT模型的理論基礎(chǔ)，考慮下面的潛在因變量回歸模型

(1)其中：

是比例系數(shù)；y*是潛在變量。被觀察的數(shù)據(jù)y與潛在變量y*的關(guān)系如下：

(2)數(shù)據(jù)的現(xiàn)實(shí)：問題是可以得到全部觀察值，但是信息可能不全面。對估計(jì)的影響如果用OLS，無論是用整個(gè)樣本，還是去掉離散點(diǎn)后的子樣本，都不能得到一致估計(jì)4243審查回歸模型的極大似然估計(jì)

可以采用極大似然法估計(jì)審查回歸模型的參數(shù)，對數(shù)似然函數(shù)為

(4)求式(4)的最大值即可得參數(shù)

的估計(jì)。這里f,F分別是u的密度函數(shù)和分布函數(shù)。

44二、

截?cái)啵〝辔玻┗貧w模型（truncatedRegression)定義：對于線性模型，，假設(shè)只有的數(shù)據(jù)才能觀測到。形象地說：就是掐頭或者去尾。即在很多實(shí)際問題中，不能從全部個(gè)體中抽取因變量的樣本觀測值，而只能從大于或小于某個(gè)數(shù)的范圍內(nèi)抽取樣本的觀測值

45例如，在研究與收入有關(guān)的問題時(shí)，收入作為被解釋變量。從理論上講，收入應(yīng)該是從零到正無窮，但實(shí)際中由于各種客觀條件的限制，只能獲得處在某個(gè)范圍內(nèi)的樣本觀測值。這就是一個(gè)截?cái)鄦栴}。數(shù)據(jù)存在的問題數(shù)據(jù)缺失估計(jì)方法MLE但是要利用條件密度函數(shù)46斷尾前Y的概率密度函數(shù)為：樣本被觀察到的概率斷尾后的條件密度為474849求解該1階極值條件，即可以得到模型的參數(shù)估計(jì)量。由于這是一個(gè)復(fù)雜的非線性問題，需要采用迭代方法求解，例如牛頓法。受限因變量模型的STATA操作案例3、censored回歸。命令見P215數(shù)據(jù)文件：womenwk.dta主要數(shù)據(jù)lwf——不工作0；工作：工資的對數(shù)Age——年齡Married——婚否Children——子女?dāng)?shù)目Education——教育年限50OLS估計(jì)usewomenwk.dta,clearreglwfage

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第四部分-其他-離散因變量和受限因變量模型

文檔簡介

溫馨提示

最新文檔

評論

第四部分-其他-離散因變量和受限因變量模型

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔