回歸分析面板3多分類_第1頁
回歸分析面板3多分類_第2頁
回歸分析面板3多分類_第3頁
回歸分析面板3多分類_第4頁
回歸分析面板3多分類_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三講多分類回歸模 y1, ,J種(JJ種互相排斥的選擇;若J=2,即為二分類)第一節(jié)多分類Logit多分類logit模型(MNL,multinomiallogitmodel)事實上是將二分類logit模型進行擴展、是一種可以處理J種分類因變量的logit模型是一種把二分類logit模型一般化(generalized)JJ-1個(虛擬變量)彼此獨立的由J-1個二分類的logits計算而來的。將多分類ogt模型中任意兩個選擇單獨挑出來都是一個二分類的logit模型,這基于一個假定,即假定任意兩種結果之間彼此是獨立的(第mn類結果的發(fā)生比(odds)及其它可能的結果之間彼此獨立),稱之為“選擇結果的獨立不相關性”(indepndnceofirrelevntaltrnatve,IIA)的假定。一、模型原理假設因變量YJPr(yim|xi)若在上式加一個限制條件,即令B1=0,

exp(ximJexp(xijPr(yim|xi)

exp(xim 1exp(xij

form>Pr(y1|x) 1exp(xi2)exp(xi3exp(xi2Pr(yi2|xi)1exp(xi2)exp(xi3exp(xi3Pr(yi3|xi)1exp(xi2)exp(xi3Pryi1|xiPryi2|xiPryi3|xi1。

Pr(ym|

exp(xiJexp(xiBjJ

exp(xi

Pr(yn|x)

exp(x exp(xi ii iexp(xiBj (x)exp(xi[m lnm|n(xi)xi(mn注:若B1≠0時,多分類logit模型就會成為條件Logit模型二、案例分析①此數(shù)據(jù)未提供于練習數(shù)據(jù)中,有的朋友可參見中國生命史數(shù)據(jù) (一)STATA程序實現(xiàn).use 07.DTA",.dropif.recodeeduc_hiy-4/-.tab||||l|+|1Not||||||Middle|High|Low|Middle|High|||||Total .gen.recodeoccup-4/0=.1=12/4=25/7=38/10=4*=.(occup:3493changesmade).taboccup +1 2 3 4 +Total ①.labeldefineoccup1"farmer"2"worker"3"cadres"4.labelvalueoccup.taboccup +farmer worker cadres professional +Total . 1=1.recodeparty1=1.genage=96-.gen.recodefoccup-4/0=.1=12/4=25/7=38/10=4.labelvaluefoccup.tabfoccup +farmer worker cadres professional +Total 【Stata學習】可用“mlogit”命令來運行MNL模型.xi:mlogitoccup ageeduc_hiyMultinomiallogisticNumberof=LR=Prob>=Loglikelihood=-Pseudo=+|| |+|| | | | ..| ---|...|....|.---+ _Ifoccup_2| _Ifoccup_3| _Ifoccup_4|1.989938 |. age| educ_hiy| party _cons|- - - -+professional_Ifoccup_2| _Ifoccup_3| _Ifoccup_4|1.852744 |-. age| educ_hiy| party| _cons|- - - - eoccup==farmeristhecomparison(二)統(tǒng)計結果解釋對一個來說,成為工人相對于成為農民的發(fā)生比(odds)比女性高多少(odds)比非黨員高了11.06(=12.06-1)提高了近2倍(=2.94-1)(以員的回歸系數(shù)減去專家員的回歸系數(shù),再取其指者些微的差距來自計算過程的誤差:exp(-10.1+1.85-0.58+0.045*40+0.695*16)/{1+exp(-10.1+1.85-0.58+0.045*40+0.695*16)+注意:別漏了截距項。也可用以下Stata命令求. ce. ce.predictp1-p4 ==1&party==0&.listp1- p4 2.| (三)繪圖表現(xiàn) 的結.xi:mlogitoccupMultinomiallogisticNumberof=LR=Prob>=Loglikelihood=-Pseudo=occup+z educ_hiy party _cons|- - -+ educ_hiy party _cons|- - - -+professionaleduc_hiy party _cons|- - - - eoccup==farmeristhecomparison.predictp1-p4if.predictq1-q4if.labelvarp3"cadrefor.labelvarp4"professionalfor.labelvarq4"professionalfor.labelvarq3"cadrefor.graphp3q3p4q4educ_hiy,.version.graphp3q3p4q4educ_hiy,c(ssss) 18highestyearofschool【STATA學習提示】用“basecategory”這個命令來改變參照組|- --|- ---party- -..MultinomiallogisticNumberof=LR=Prob>=Loglikelihood=-Pseudo=occup+z_cons + educ_hiy....party _cons+professional -educ_hiy party _cons.- -6.584158- eoccup==workeristhecomparison.xi:mlogitoccupeduc_hiyparty,Multinomiallogisticregression Numberofobs LR Prob> Loglikelihood=- Pseudo occup Std. [95%Conf.+ educ_hiy party | +|| | | +|| | | -.. eoccup==farmeristhecomparison(四)假設檢驗檢驗個別回歸系數(shù)統(tǒng)計上是否顯著H0:k,1/rk,2/r k,J/rMNL模型同二分類logit模型一樣,同樣適用于Wald或似然比(likelihoodratio)檢驗,方似然比檢驗(likelihoodratiotestLR.xi:mlogitoccupeduc_hiyMultinomiallogisticregression Numberofobs= LR Prob> Loglikelihood=- Pseudo occup Std. [95%Conf.+|educ_hiy ..party -. -._cons|- -+ educ_hiy party - _cons+professionaleduc_hiy - ..party |- -_cons - eoccup==farmeristhecomparison去掉“”變量,再作一次MNL模型估計.xi:mlogitoccupeduc_hiyMultinomiallogistic Numberof LR=Prob>=Loglikelihood=-Pseudo=occup Std. [95%Conf.+ educ_hiy party - _cons|- - - -+ educ_hiy party _cons|- - -6.987857-+professionaleduc_hiy party _cons|- - -8.678753- eoccup==farmeristhecomparison.Mlogit:likelihood-ratio=Prob>=當似然比檢驗的p<.005時,我們可以限制條件模型(restrictedmodel),而接受未限制模型(non-restrictedmodel)的結果,也就是這個自變量應該被放入模型。Wald檢.xi:mlogitoccupeduc_hiyparty(outputsuppressed).(1) =(2) =(3)[professional]=chi2(3) Prob>chi2 檢驗因變量的兩種分類可否合并若多數(shù)自變量對于因變量中的兩類(m與n之間)或多類之間的發(fā)生比沒有顯著影響,H0:1,m/n2,m/n k,m/n(1Wald檢.xi:mlogitoccupeduc_hiyparty(outputsuppressed).test(1)[worker]educ_hiy=(2)[worker]party=(3) =chi2(3)=Prob>chi2 .test(1)[worker]educ_hiy=(2)[worker]party=(3)[worker]=chi2(3)=Prob>chi2 若檢驗結果中p>0.05,則可表明上述自變量對成為工人或農民兩類的發(fā)生比率(odds但在上述數(shù)據(jù)分析中,卻是p<0.05,即虛無假設被,也就是說工人與農民不能合成一類。同樣,在回歸分析中也可以看出,三個自變量(教育、黨員資格、)對成為工人加上[m=n],即可進行m與n類的比較。命令如下:.test(1)[cadres]educ_hiy-[professional]educ_hiy=0(2)[cadres]party-[professional]party=0(3)[cadres]-[professional]=chi2(3)=Prob>chi2 量(教育、黨員資格、)對成為或專家的發(fā)生比亦有顯著的影響。(2)利用LRtest檢驗限制條件.xi:mlogitoccupeduc_hiy.lrtest,saving.constraintdefine999.xi:mlogitoccupeduc_hiy ,(Multinomiallogisticregression Numberofobs= LR Prob> Loglikelihood=-(1)[worker]educ_hiy=(2)[worker]party=(3)[worker]=

Pseudo

occup Std. [95%Conf.+|educ_hiyparty|

_cons|- - - -+ educ_hiy party| | |+- ---|| ..| |- ---|- --- eoccup==farmeristhecomparison限制條件”的檢驗結果,然后利用lrtest命令得到檢驗結果:.Mlogit:likelihood-ratio chi2(3) Prob>chi2 若想直接得到模型檢驗的結果,可以從Stata“mlogtest”命令的程序。即在Stata命令窗口中鍵入“netsearchmlogtest”,打開網頁,找到程序的連接,安裝即可。在運用似然比檢驗時,也可以加入“b”選項指定LR方法一:用Waldtest得到各組比較時不同自變量的差異。.xi:mlogitoccupeduc_hiyHo:Allcoefficientsexceptinterceptsassociatedwithgivenpair esare0(i.e.,categoriescanbecollapsed).Categoriestested+

worker-cadres worker-professi3worker-farmer3cadres-professi3cadres-farmer3professi-farmer3方法二:用LRtest組比較時不同自變量. ****LRtestsfor eHo:Allcoefficientsexceptinterceptsassociatedwithgivenpair esare0(i.e.,categoriescanbecollapsed).CategoriestestedCategoriestestedworker-cadres|worker-professi33worker-farmer3cadres-professi3cadres-farmer3professi-farmer3第二節(jié)條件(Conditional)Logit模一、多分類 模型的結果獨立不相關性(IIA)的假性”(independenceofirrelevantalternative,IIA)假定。但是,若兩種結局具有可替代性或可Pr(ym|x) Pr(yn| 案例一:三選項“紅車藍車問題”(redbus-bluebus(bluebus)例如二:四選項“紅車藍車問題”(redbus-bluebus①該問題也被稱為“紅車藍車問題”(redbus-bluebusproblems)如:紅藍車問題(redbus/bluebus選 概 出租 選 概 出租 但是,請注意,若這三種交通工具中車比較便利的話,紅車停駛了,人們將會改乘藍車,即使是擠上車也在所不惜。此時,搭乘任意兩種交通工具的發(fā)生比將不再為選選 概 MNLIIA假定不符。這種問題的產生Logit模型(ConditionalLogitModel,CLM)來解決。需要的是,條件CLogit模型與普通MNL模型并沒有實質區(qū)別,也在一定程度上沿IIAIIA假設違背時,可以在其基礎上采用嵌套Logit模型(NestedMultinomialLogitModel,NMLM)進行分析。二、條件Logit模型(一)條件Logit模型概在多分類logit模型(MN)中估計的是彼此獨立(individulpifi)的自變量對既定某一類結果的概率的影響(如教育對職業(yè))loit模型(onditionaloitodl,M)模型中,①具有可替代性的自變量(altrntive-spificvrile)也可能會因結局不同而產生變化。可替代性的自變量是與獨立性變量(individualpifi)相對而言的,所謂獨立性變量是指某些自變量對因變量選擇的效果是一致的,而替代性變量是指一些自變量的效果則可根據(jù)選擇結果的不同而有所變化。這是因為人們有可能從預估到的結果中改變自己的選擇,即結果會影響你的選擇(反作用)例如,個人在使用交通系統(tǒng)時,可以選擇出租車、車或地鐵。人們等車時關心的 ①ClogitCLM也稱為固定效果(fixedeffect)logistic量)的影響。在以下的中,z表示設定條件的函數(shù),其數(shù)值是可以隨個人特質或外Pr(ym|z) exp(zim exp(zij而變化(IntheCLModdschangeaccordingtothedifferenceinthevaluesofvariables(z’s)associatedwiththe m|n(zi)exp([zimzin]若從一個選項擴展到多個選項,則可以令m=1到J(代表因變量中不同的類別),則在上述中,Zim可包括自變量,也就是樣本i對第m類結果偏好的數(shù)值。用交通的例子來說,Zim就是i運用某交通工具(如紅車)m的次數(shù)。γ則是獨立的參數(shù),用(二)CLM的數(shù)據(jù)管理方與前面介紹的模型不同,運用StataCLM估計必須改變其數(shù)據(jù)管理的方式。請注.use(Greene&Hensher1997dataontravelmodeContainsdatafrom Greene&Hensher1997dataontravelmodechoice 10Mar2001 10,032(99.9%of storagedis variable variable Identificationnumber Modeoftransportation 1=train0=othermode 1=bus0=other 1=car0=other Totaltraveling In-vehicle 1=optionselected0=notselected Terminaltime(0forcar) in-vehicle Generalizedcostsincludeinglostwages SizeoftravelingSortedby:.listidmodetrainbuscartimein1/6,nodis | time | 406| 452| 180| 398| 452 | 255 .clogitchoicetrainbusinvc,group(id)Conditional(fixed-effects)logistic Numberof LRLR=Prob>=Log=-Pseudo=choicez - |- -- -注:invc是指等車花費的時間,此處的理論假設為等車花費的時間會影響人們的交通工具選擇。出租車為參照組。CLM估計結果解釋若車等車時間提高1個單位而出租車時間與價錢固定時,其搭乘車的發(fā)生減低5%。在等地鐵需要31單位時間、等車需要25單位時間與搭出租車需要等10分鐘單位 0.045(0.053 .clogitinvc,group(id).Oddsof:1vschoice+bz trainbusinvc--.predict.lis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論