版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
會(huì)計(jì)學(xué)1Probit回歸概率單位回歸Logistic回歸因變量二項(xiàng)Logistic回歸多項(xiàng)Logistic回歸有序回歸Probit回歸第1頁/共29頁第15章Probit回歸(概率單位回歸)15.1Probit回歸的基本原理15.2Probit回歸的案例分析第2頁/共29頁15.1Probit回歸的基本原理Probit回歸即概率單位回歸,主要用來測(cè)試分析刺激強(qiáng)度與反應(yīng)比例之間關(guān)系的關(guān)系。例如,對(duì)于指定數(shù)量的病人,分析他們的給藥劑量與治愈比例之間的關(guān)系。此方法應(yīng)用的典型例子是分析殺蟲劑濃度和殺死害蟲數(shù)量之間的關(guān)系,并據(jù)此判斷什么樣的劑量濃度是最佳的。Probit回歸適用于對(duì)反應(yīng)變量(因變量)為分類變量的資料進(jìn)行統(tǒng)計(jì)分析,也存在反應(yīng)變量為二分類、有序多分類、無序多分類三種情況,但目前最常用的是二分類的情形,SPSS也僅能處理反應(yīng)變量為二分類的資料。第3頁/共29頁15.1Probit回歸的基本原理Probit回歸與Logistic回歸相似,也是擬合0-1型因變量回歸的方法,即把取值分布在實(shí)數(shù)范圍內(nèi)的變量通過累積概率函數(shù)轉(zhuǎn)換成取值分布在(0,1)區(qū)間的概率值。所得概率分布的表達(dá)式為:Probit回歸常用的累積概率函數(shù)有兩個(gè):(1)logit概率函數(shù):通過變換可以得到另一種等價(jià)形式:第4頁/共29頁(2)標(biāo)準(zhǔn)正態(tài)累計(jì)概率函數(shù):?jiǎn)我唤忉屪兞浚憾嘧兞浚悍謩e為標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)與密度函數(shù)。15.1Probit回歸的基本原理據(jù)此建立的Probit回歸模型:或第5頁/共29頁P(yáng)robit模型的邊際分析自變量的變化對(duì)響應(yīng)概率(p)的影響:
一般情況下對(duì)連續(xù)變量,X取樣本均值,指的是X在平均意義上每增加一個(gè)單位會(huì)導(dǎo)致事件發(fā)生的概率將會(huì)變化多少個(gè)單位。第6頁/共29頁15.1Probit回歸的基本原理Probit回歸的數(shù)據(jù)要求因變量(響應(yīng)變量)應(yīng)該是計(jì)數(shù)信息,記錄在指定的自變量條件下,有響應(yīng)的觀測(cè)個(gè)數(shù)。自變量(因子變量)必須是分類變量且須用整數(shù)編碼。觀測(cè)量應(yīng)該是獨(dú)立的。如果自變量值的數(shù)量與觀察值的數(shù)量相比過多,否則卡方檢驗(yàn)和擬合優(yōu)度檢驗(yàn)是不適宜的對(duì)Probit過程的參數(shù)估計(jì)同樣采用極大似然估計(jì)法,構(gòu)建Probit過程時(shí)要求樣本采取隨機(jī)抽取方式抽取,即要求樣本分布與總體分布具有同一性。概率回歸時(shí),最有用的是半數(shù)發(fā)生量。如收入到多少時(shí),有一半家庭會(huì)購買。毒素濃度達(dá)到多少時(shí),有一半的小白鼠會(huì)死亡。第7頁/共29頁15.1Probit回歸的基本原理Probit回歸與logistic回歸的關(guān)系當(dāng)Probit回歸過程選擇了Logit變換時(shí),進(jìn)行的統(tǒng)計(jì)分析過程就是Logistic回歸。Logistic模型強(qiáng)調(diào)因變量的最終結(jié)果是發(fā)生還是不發(fā)生,其取值有明顯的0~1分化。而概率回歸研究的是在因變量具有兩種相反屬性時(shí),隨著自變量的變化,因變量取某屬性的比例變化情況。如家庭購買電腦的比例與家庭人均收入之間的關(guān)系,研究的不是在某各收入水平下是否會(huì)購買,而是在不同的收入水平下購買的比例。一般情況下:Probit回歸更適用于從有計(jì)劃的試驗(yàn)中獲得的數(shù)據(jù),而Logistic回歸更適用于直接的觀測(cè)數(shù)據(jù)。Probit回歸輸出對(duì)各種響應(yīng)比例有效值的估計(jì),Logistic回歸輸出對(duì)自變量發(fā)生比(OR)的估計(jì)。第8頁/共29頁P(yáng)robit曲線和logit曲線很相似。兩條曲線都是在pi=0.5處有拐點(diǎn),但logit曲線在兩個(gè)尾部要比Probit曲線厚。累積正態(tài)概率分布曲線
Logistic分布函數(shù)第9頁/共29頁實(shí)際應(yīng)用中,對(duì)于同一資料用Probit回歸與Logistic回歸分析的結(jié)果非常接近。但Logistic回歸的應(yīng)用比Probit回歸更廣泛。這是因?yàn)椋篖ogistic回歸中的偏回歸系數(shù)可以計(jì)算其exp(b),即OR值,可以得到很好的直觀解釋與應(yīng)用。Probit回歸模型中偏回歸系數(shù)的含義為其他自變量取值保持不變時(shí)自變量每改變一個(gè)單位,出現(xiàn)某結(jié)果的概率密度函數(shù)值的改變量。顯然解釋起來比較麻煩,遠(yuǎn)不如Logistic模型中,這也導(dǎo)致了研究者更喜歡使用Logistic模型。目前有很多針對(duì)Logistic回歸模型的診斷及補(bǔ)救措施,而對(duì)于Probit回歸而言而有信方面相對(duì)缺乏。當(dāng)然,這類似"先有雞還是先有蛋"的問題,很難說是因?yàn)槟P驮\斷措施較多而導(dǎo)致了Logistic回歸的更多應(yīng)用,還是說因?yàn)長(zhǎng)ogistic回歸更多的應(yīng)用促進(jìn)了其模型診斷措施的發(fā)展。第10頁/共29頁15.2Probit回歸的案例分析例1:某醫(yī)師希望研究病人的年齡(歲)、性別co為女性,1為男性)、心電圖檢驗(yàn)是否異常(ST段壓低,0為正常、1為輕度異常、2為重度異常)與患冠心病是否有關(guān),數(shù)據(jù)文件為“冠心病影響.sav”擬合Logistic回歸模型因變量:ca;協(xié)變量:sex,ecg、ageexp(B):自變量增加一個(gè)單位,
總體研究對(duì)象患病率與未患病率的比值/倍數(shù)(優(yōu)勢(shì)比的變化率)。第11頁/共29頁15.2Probit回歸的案例分析擬合probit回歸模型SPSS默認(rèn)變量取值=1表示出現(xiàn)陽性結(jié)果(患?。┯捎赟PSS默認(rèn)的是對(duì)頻數(shù)表資料進(jìn)行Probit回歸分析,而本例資料并非各自變量不同取值水平組合的頻數(shù)表資料,每一條記錄表示一個(gè)觀察對(duì)象,此處需指定一個(gè)頻數(shù)變量count=1。其方法有如下幾種:直接定義頻數(shù)變量count,并錄入數(shù)據(jù)1轉(zhuǎn)換——計(jì)算變量:count=1語法:COMPUTEcount=1.
EXECUTE.第12頁/共29頁15.2Probit回歸的案例分析擬合probit回歸模型SPSS操作:分析——回歸——probit前者為用標(biāo)準(zhǔn)正態(tài)累計(jì)概率函數(shù)的反函數(shù)來轉(zhuǎn)換響應(yīng)比例,后者為logit變換代表在自變量的指定水平下,對(duì)有響應(yīng)的觀測(cè)的計(jì)數(shù)信息,取值非負(fù)代表在自變量的指定水平下,總的觀測(cè)計(jì)數(shù),取值不能小于相應(yīng)的響應(yīng)頻數(shù)變量值須為整數(shù)編碼的分類變量,須指定最大和最小值代表不同的實(shí)驗(yàn)刺激條件設(shè)置變量轉(zhuǎn)換函數(shù),當(dāng)協(xié)變量與概率之間不存在現(xiàn)行關(guān)系時(shí),需要選擇對(duì)協(xié)變量的轉(zhuǎn)換方式默認(rèn)為無,自動(dòng)給出控制組第13頁/共29頁輸出觀測(cè)頻數(shù)、預(yù)測(cè)頻數(shù)、觀測(cè)值的殘差等。輸出因素變量水平間的半數(shù)效應(yīng)及其致信區(qū)間對(duì)所有因子水平具有共同的斜率這一假設(shè)的檢驗(yàn),若沒有因子變量,則相關(guān)中位數(shù)力不可用輸出指定響應(yīng)比例的刺激劑量的置信區(qū)間當(dāng)選入多個(gè)些變量,相關(guān)中位數(shù)力和信仰置信區(qū)間不可用,只有選入一個(gè)因素變量,兩者才可以用指定在沒有刺激的條件下(即劑量為0),是否有一個(gè)自然響應(yīng)率無:沒有自然響應(yīng)率從樣本數(shù)據(jù)估計(jì)其自然響應(yīng)率值:輸入指定的自然響應(yīng)率,取值必須小于1。例如,如果當(dāng)激勵(lì)為0時(shí)響應(yīng)在10%的時(shí)間里發(fā)生,則輸入0.10。第14頁/共29頁共有78條非頻數(shù)表資料記錄納入分析,其中66條記錄出現(xiàn)陰性結(jié)果(ControlGroup)回歸系數(shù)/標(biāo)準(zhǔn)誤,即Z檢驗(yàn)統(tǒng)計(jì)量p=Φ(-3.364+0.804?sex+0.520?ecg+0.056?
age)或者寫成:probit(p)=-3.364+0.804?sex+0.520?ecg+0.0564?
age)顯著!第15頁/共29頁參數(shù)估計(jì)值得協(xié)方差和相關(guān)性卡方檢驗(yàn):原假設(shè)是模型能很好地?cái)M合數(shù)據(jù),根據(jù)P>a接受原假設(shè),故模型擬合較好平行檢驗(yàn):P>a,可以認(rèn)為因素變量個(gè)分組的回歸方程具有相同的斜率。第16頁/共29頁P(yáng)robit回歸系數(shù)的解釋問題:以年齡age為例,其偏回歸系數(shù)為0.056,表示當(dāng)性別、心電圖保持不變時(shí),年齡每增加一歲,患冠心病的概率密度函數(shù)值增加0.056。進(jìn)一步舉例如下:設(shè)對(duì)于性別為男性、心電圖檢驗(yàn)結(jié)果為輕度異常、年齡30歲的人患冠心病的概率為0.40,則相應(yīng)的概率密度函數(shù)值為-0.253,則相同性別、相同心電圖檢驗(yàn)結(jié)果,年齡為31歲者患冠心病的概率密度函數(shù)值為-0.253+0.056=-0.197,相應(yīng)的概率為0.422。則30歲、31歲時(shí)患病與未患病的比值比分別為0.4/(1-0.4)=0.667、0.422/(1-0.422)=0.729,此時(shí)的OR值為0.729/0.667=1.094,與Logistic回歸分析結(jié)果中的exp(β)=1.097一致。p=Φ(-3.364+0.804?sex+0.520?ecg+0.0564?
age)或者寫成:probit(p)=-3.364+0.804?sex+0.520?ecg+0.0564?
age)第17頁/共29頁15.2Probit回歸的案例分析例2:某公司在不同營(yíng)業(yè)所(網(wǎng)上、貨架、店鋪)采用了不同的促銷價(jià)格,請(qǐng)使用probit回歸對(duì)不同促銷價(jià)格和對(duì)促銷有反饋的顧客數(shù)量之間的關(guān)系進(jìn)行分析,并擬合響應(yīng)模型。數(shù)據(jù)文件為:“促銷效果評(píng)價(jià)數(shù)據(jù).sav”第18頁/共29頁協(xié)變量和三個(gè)截距項(xiàng)對(duì)方程的作用都有顯著意義顯著!由此可得對(duì)三種營(yíng)業(yè)場(chǎng)所的probit回歸方程:網(wǎng)上:probit(p)=-7.219+1.88*ln(促銷價(jià)格)貨架:probit(p)=-7.613+1.88*ln(促銷價(jià)格)店鋪:probit(p)=-7.982+1.88*ln(促銷價(jià)格)第19頁/共29頁自然響應(yīng)率估計(jì)值:在沒有促銷活動(dòng)的情況下,總顧客中仍會(huì)有4.1%的人購買產(chǎn)品。模型擬合非常好,因素變量各分組的回歸方程具有相同的斜率,滿足平行性假設(shè)條件第20頁/共29頁置信區(qū)間表:顯示的是制定銷售地點(diǎn)的相應(yīng)概率。響應(yīng)概率probit=0.5時(shí),促銷價(jià)格半數(shù)響應(yīng)估計(jì)值:網(wǎng)上為46.518,貨架為57.905,店鋪69.8,可見網(wǎng)上促銷最有效刺激強(qiáng)度反應(yīng)比例第21頁/共29頁相對(duì)中位數(shù)強(qiáng)度估計(jì)值,即相對(duì)半數(shù)效應(yīng)表。以第一行為例說明:第一行為網(wǎng)上促銷(地點(diǎn)取值為1)對(duì)貨架促銷(地點(diǎn)取值為2)的相對(duì)半數(shù)效應(yīng),網(wǎng)上與貨架半數(shù)效應(yīng)比值的估計(jì)值為0.803,且其95%的直線區(qū)間不包含1,說明兩者是有明顯區(qū)別的,也就是說網(wǎng)上促銷更有效,因?yàn)樗芤暂^小的促銷價(jià)格促使50%的顧客購買產(chǎn)品(即達(dá)到50%的響應(yīng)率。)第22頁/共29頁響應(yīng)概率與對(duì)數(shù)促銷價(jià)格呈明顯的現(xiàn)行趨勢(shì),說明對(duì)促銷價(jià)格選擇自然對(duì)數(shù)轉(zhuǎn)換是比較合適的。如果不呈現(xiàn)明顯線性趨勢(shì),可以嘗試其他轉(zhuǎn)換方法分析。網(wǎng)上促銷的probit普遍大于其他兩種方式第23頁/共29頁第24頁/共29頁序號(hào)性別年齡(歲)月收入(千元)序號(hào)性別年齡(歲)月收入(千元)10183.850151204.00020214.200161254.20030233.851171274.30040233.951181284.50050284.201191303.95160313.850201324.00070364.501211334.80080424.001221334.00090463.951231384.200100484.200241414.500110554.801251454.801120565
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度物流倉儲(chǔ)用地承包租賃合同(2024版)4篇
- 2025年度新型儲(chǔ)藏室與車位投資合作合同模板4篇
- 2025年度新能源汽車充電樁承債式公司股權(quán)轉(zhuǎn)讓合同4篇
- 2025年度文化演藝場(chǎng)館承包經(jīng)營(yíng)合同4篇
- 2025年度土地整治與生態(tài)修復(fù)項(xiàng)目承包合同4篇
- 2024通信線路施工及改造分包合同范本3篇
- 2025年度生態(tài)環(huán)保工程承包商工程款支付擔(dān)保協(xié)議4篇
- 2025年度歷史文化街區(qū)保護(hù)項(xiàng)目房屋拆遷補(bǔ)償合同2篇
- 2025年度住宅小區(qū)配套停車場(chǎng)車位代理銷售協(xié)議4篇
- 2025年度星級(jí)酒店廚師團(tuán)隊(duì)合作協(xié)議4篇
- 土壤農(nóng)化分析課件
- 小區(qū)大型團(tuán)購活動(dòng)策劃
- NEC(新生兒壞死性小腸結(jié)腸炎)92273
- 2023年租賃風(fēng)控主管年度總結(jié)及下一年展望
- 開關(guān)插座必看的七個(gè)安全隱患范文
- 高分子成型加工課件
- 消防救援-低溫雨雪冰凍惡劣天氣條件下災(zāi)害防范及救援行動(dòng)與安全
- 硅石項(xiàng)目建議書范本
- 概率論在金融風(fēng)險(xiǎn)評(píng)估中的應(yīng)用研究
- 住院醫(yī)療互助給付申請(qǐng)書
- 外墻外保溫工程檢驗(yàn)批質(zhì)量驗(yàn)收記錄表
評(píng)論
0/150
提交評(píng)論