離散狀態(tài)變量的回歸_第1頁
離散狀態(tài)變量的回歸_第2頁
離散狀態(tài)變量的回歸_第3頁
離散狀態(tài)變量的回歸_第4頁
離散狀態(tài)變量的回歸_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

離散狀態(tài)變量的回歸第一頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸1、舉例(1)研究“一個人在家是否害怕生人來訪”,用Y表示,則:1,害怕

0,不害怕Y=第二頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸1、舉例(2)研究“人們對某項政策的態(tài)度”,用Y表示,則:1,贊同

2,無所謂

3,反對Y=第三頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸1、舉例(3)一只球隊的成績1,勝

2,負(fù)

3,平Y(jié)=第四頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸2、離散狀態(tài)因變量回歸方程的意義(兩狀態(tài)的情況)能否進(jìn)行這樣的回歸呢?第五頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸2、離散狀態(tài)因變量回歸方程的意義(兩狀態(tài)的情況)

Di的期望值:

第六頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸2、離散狀態(tài)因變量回歸方程的意義(只處理兩狀態(tài))

我們又知道:所以有,即,回歸值=“狀態(tài)1”出現(xiàn)的概率第七頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙可以對下式進(jìn)行OLS估計嗎?第八頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙答案:可以,但有問題!第九頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙(1)誤差非正態(tài)分布

而X是非隨機(jī)的,或者雖然是隨機(jī)的,但不一定是正態(tài)的。

即使X是隨機(jī)的且是正態(tài)的,εi也不會是正態(tài)的。第十頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙

(2)異方差當(dāng)X非隨機(jī)時,有第十一頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙(2)異方差顯然,方差隨X的變化而變化第十二頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙(2)異方差

所以,應(yīng)該采用“可行的廣義最小二乘法”,而不是“普通最小二乘法”第十三頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙(2)異方差步驟:

A.使用OLS進(jìn)行估計,并得到擬合值B.在原方程左右同時除以之后,再進(jìn)行OLS估計;第十四頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙(2)異方差

或者:依然用OLS,但使用懷特異方差一致標(biāo)準(zhǔn)誤來進(jìn)行T檢驗(yàn)、區(qū)間估計;

第十五頁,共四十二頁,編輯于2023年,星期日案例:全美橄欖球聯(lián)盟賽的預(yù)測比賽取勝的概率與“讓球數(shù)”(PointSpreads)之間的關(guān)系:第十六頁,共四十二頁,編輯于2023年,星期日WhatPointSpreadsSayAbouttheProbabilityofWinningintheNFL:I第十七頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸3、離散狀態(tài)因變量回歸遇到的障礙(3)取值的限制

無法保證的值在0到1之間!第十八頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

在線性回歸與二值結(jié)果之間,引入一個連續(xù)取值的潛變量(latentvariable)

例如,在前例中,引入一個“實(shí)力”潛變量,Z。第十九頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

“讓球數(shù)”直接的與“實(shí)力”相關(guān)聯(lián),而“實(shí)力”與“結(jié)果”相關(guān)聯(lián)。注意:閥值不一定為0!第二十頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

這意味著:

第二十一頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

取勝的概率:第二十二頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

同理,輸?shù)母怕剩旱诙?,共四十二頁,編輯?023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

這個F(w)會是什么樣呢?必需滿足如下特征:第二十四頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

這個F(w)會是什么樣呢?有兩種處理方法:(1)Probit模型(2)Logit模型第二十五頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

(1)Probit模型

設(shè)服從標(biāo)準(zhǔn)正態(tài)分布,從而有表示為:第二十六頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸4、解決方法

(2)Logit模型表示為:第二十七頁,共四十二頁,編輯于2023年,星期日Probit&LogisticModel第二十八頁,共四十二頁,編輯于2023年,星期日LogitModel&LinearProbability第二十九頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸5、參數(shù)估計極大似然估計(MLE:maximumlikelihoodestimate)

第三十頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸5、參數(shù)估計極大似然估計(MLE:maximumlikelihoodestimate)

第三十一頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸5、參數(shù)估計極大似然估計(MLE:maximumlikelihoodestimate)

通常沒有解析解,只有數(shù)值解!

第三十二頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸5、參數(shù)估計極大似然估計(MLE:maximumlikelihoodestimate)

參數(shù)估計量的標(biāo)準(zhǔn)差的估計(略)

第三十三頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(1)整體的顯著性檢驗(yàn)似然比

第三十四頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(1)整體的顯著性檢驗(yàn)預(yù)測成敗分析表:

預(yù)測值Y’=0Y’=1total真實(shí)值Y=047116487Y=118320203total65436690第三十五頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(1)整體的顯著性檢驗(yàn)

預(yù)測成功的比率=(471+20)/690但該指標(biāo)并不能說明太多的問題!

第三十六頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(1)整體的顯著性檢驗(yàn)

TPR(TruePositiveRate):正確預(yù)測D=1的比率。這里,TPR=20/203;該值表示“取真的概率”,所以該值越高越好

第三十七頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(1)整體的顯著性檢驗(yàn)

FPR(FalsePositiveRate):把D=0的個體,錯誤預(yù)測為D=1的比率。這里,F(xiàn)PR=16/487;該值表示“取偽錯誤”,所以越小越好。

第三十八頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(1)整體的顯著性檢驗(yàn)

但上述兩個指標(biāo)之間是“魚和熊掌”的關(guān)系,所以在選擇模型時,應(yīng)該勸和利弊!

第三十九頁,共四十二頁,編輯于2023年,星期日二、因變量是離散狀態(tài)的回歸6、顯著性檢驗(yàn)

(2)單個變量的顯著性檢驗(yàn)

Z統(tǒng)計量(單個變量的檢驗(yàn))LR檢驗(yàn)、Ward檢驗(yàn)(聯(lián)合檢驗(yàn))

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論