SPSS—二元Logistic回歸結(jié)果分析_第1頁
SPSS—二元Logistic回歸結(jié)果分析_第2頁
SPSS—二元Logistic回歸結(jié)果分析_第3頁
SPSS—二元Logistic回歸結(jié)果分析_第4頁
SPSS—二元Logistic回歸結(jié)果分析_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、SPSS-二元Logistic 回歸結(jié)果分析2011-12-02 16:48身心疲憊,睡意連連,頭不斷往下掉,拿出耳機(jī),聽下歌曲,緩解我這 嚴(yán)重的睡意吧!今天來分析二元 Logistic 回歸的結(jié)果分析結(jié)果如下:案例艷理匯總N百分上匕選定案例包括在分析中48957.5缺失寨劍0.0總計(jì)48957.5耒選定的案例36142.5總計(jì)950100.0因歪量編礙初値商部値否0是分類畫量垢碣參敎鎬硏(1)皺盲水平來完惑高中2690&0.C00.000高中134.OCO1.00000Q.00053.D00.OUG1.C00.000大學(xué)25.DC0rOOO.C001.000硏究生3.OCO.000.

2、CD0.0001:在“案例處理匯總”中可以看出:選定的案例 489個(gè),未選定的案例361 個(gè),這個(gè)結(jié)果是根據(jù)設(shè)定的validate = 1 得到的,在“因變量編碼”中可以看 出“違約”的兩種結(jié)果“是”或者“否”分別用值“ 1 “和“0”代替,在“分類變量編碼”中教育水平分為5類,如果選中“為完成高中,高中,大專,大 學(xué)等,其中的任何一個(gè),那么就取值為1,未選中的為0,如果四個(gè)都未被選中, 那么就是”研究生“頻率分別代表了處在某個(gè)教育水平的個(gè)數(shù),總和應(yīng)該為 489個(gè)分類表d工己觀測未選匡的是否曾經(jīng)違約口分比檢IE是否曾經(jīng)劇OH7E彷驟0 是否噌究違約否3601D0.0157是仁90.C54總計(jì)口

3、分此73.6a已譴定的案validate EQ1A未迭定的案例validate J4E 1c.由于目孌量中有駛失值:或分類孌量中的値超岀選定臬例的范圉眇以床跖某翌未選建的案例進(jìn)彳 乩攜型中包括常量=e切割値對(duì)別“左握中的裘量BSE,WaisdfSig.EKP(fi)齒驟0 常量026.103100.02S1.000.3561:在“分類表”中可以看出:預(yù)測有360個(gè)是“否”(未違約)有129個(gè)是“是”(違約)2:在“方程中的變量”表中可以看出:最初是對(duì)“常數(shù)項(xiàng)”記性賦值,B為-1.026, 標(biāo)準(zhǔn)誤差為:0.103那么 wald =( B/S.E)2=(-1.026/0.103)2 = 99.22

4、48, 跟表中的“ 100.029 幾乎接近,是因?yàn)槲覍?duì)數(shù)據(jù)進(jìn)行的向下舍入的關(guān)系,所以數(shù)據(jù)會(huì)稍微偏小,B和Exp(B)是對(duì)數(shù)關(guān)系,將B進(jìn)行對(duì)數(shù)抓換后,可以得到:Exp(B) = eA-1.026 =0.358, 其中自由度為1,sig為0.000,非常顯著干在方程中的畫星導(dǎo)仔dfSig.歩疆0 克雖年腎7.4601.006教肓8,93+4.051如6.0091.OU1 U51.285教育2.22411362.51 S1m工歸3674S1.000把址9.4631002收入1.1D71.29276.4181.000信用卡£1債35.3291000其他員質(zhì)1 2 5311.000總紅計(jì)量1

5、47 55711.0001:從“不在方程中的變量”可以看出,最初模型,只有“常數(shù)項(xiàng)”被納入了模 型,其它變量都不在最初模型內(nèi)表中分別給出了,得分,df , Sig 三個(gè)值,而其中得分(Score)計(jì)算公式如下:Score.二 JJt只1刃壬厲-町(公式中(Xi- X")少了一個(gè)平方)F面來舉例說明這個(gè)計(jì)算過程:(“年齡”自變量的得分為例)從“分類表”中可以看出:有129人違約,違約記為“ T 則違約總和為 129,選定案例總和為489那么:y - = 129/489 = 0.2638036809816x- = 16951 / 489 = 34.664621676892所以:刀(Xi

6、-x - )2 = 30074.9979y " (1-y ")=0.2638036809816 *(1-0.2638036809816 )=0.19421129888216則:y(1-y )* 刀(Xi -x - )2 =0.19421129888216 * 30074.9979 = 5 840.9044060372則:刀Xi(yi- y ") A2 = 43570.8所以:O心j刃rScore i 二 JJty(l -刃£ E - x)=43570.8 / 5 840.9044060372 =7.4595982010876 = 7.46(四舍五入)計(jì)算

7、過程采用的是在EXCEL里面計(jì)算出來的,截圖如下所示:A1.B|CEEFG23136. 06339990-6. 06748275 乩 74:&4254=50-7.1227340. 4417219730-8. 969331350. 112479G2125, 7668724113.節(jié)3|15550-& 321294B177. 8323150-12, 66262675, 07566880-6. 85893021. 76869589L22* 08589361. 7832352660-9. 4969321186. 72188560-5, 53988340. 44=17219730-8.

8、96933350 11247862125.76687350.11278620-9. 23313340. 441721973125. 03067332. 7705653270-S, 705523021. 758695390-7. 9141124113, 73115550-6. 3312947152. 16155840-12. 398853336.1860983139. 0134221 &0. >9264320寶 803&8'361.793235266L26* 503072932. 087538740T. 6503133乙 7709553270-比 705524510

9、6. 82004510-11. 87121695130074. 997960. 26380443570. 8從“不在方程的變量中”可以看出,年齡的“得分”為7.46,剛好跟計(jì)算結(jié)果吻合!答案得到驗(yàn)證!nni »此匚卜H-I-詩丄卄壬斗塊仁方法=向前步逬(似然比)撲型系議的織合竝船卡方at8ig撈騾1齒騾740521.000烘74:0521.oon模型740521.00044.5431.00011S.5962.OQO模型118.5952.000曲菠3 歩專43.619' 1塊108 4143.000模型168.4143.000步轅4 歩騾10021760914.000模型V9.

10、C914.000-2對(duì)數(shù)似然僵Coo(& Snell RNagelherke F?140OJ5|-.141.7052445709b215.31532餌一胸3.291.4264266 213*.305.JI46撲型匯總a因期參數(shù)怙廿的更改范國小于刖1,所以估計(jì)在進(jìn) 代況數(shù)4處嶽止=b因?qū)澢贁?shù)估計(jì)的更改范圉小于.001,所以估計(jì)在迭1:從“塊T 中可以看出:采用的是:向前步進(jìn) 的方法,在“模型系數(shù)的綜 合檢驗(yàn)”表中可以看出: 所有的SIG幾乎都為“ 0” 而且隨著模型的逐漸步 進(jìn),卡方值越來越大,說明模型越來越顯著,在第 4步后,終止,根據(jù)設(shè)定的顯著性值 和 自由度,可以算出 卡方臨界值,

11、公式為:=CHIINV(顯著性值,自由度),放入excel就可以得到結(jié)果 2:在“模型匯總“中可以看出:Cox&SnellR方 和Nagelkerke R方擬合效果都不太理想,最終理想模型也才:0.305和0.446, 最大似然平方的對(duì)數(shù)值 都比較大,明顯是顯著的lnl = y In/? + (1”(】-£) 似然數(shù)對(duì)數(shù)計(jì)算公式為:計(jì)算過程太費(fèi)時(shí)間了,我就不舉例說明 計(jì)算過程了Cox&SnellR方的計(jì)算值 是根據(jù):1:先擬合不包含待檢驗(yàn)因素的Logistic模型,求對(duì)數(shù)似然函數(shù)值 INL0(指只包含“常數(shù)項(xiàng)”的檢驗(yàn))2:再擬合包含待檢驗(yàn)因素的Logistic模型,求

12、新的對(duì)數(shù)似然函數(shù)值 InLB(包含自變量的檢驗(yàn))盤去三1 -更A再根據(jù)公式:即可算出:Cox&SnellR方的值!=Hosmer 和 Lemeshow 楡驗(yàn)=卡方dfSig17 5&78.47725.3418.72133.3120.913411.91Se.155Hosmer和Lemeshor檢臉的隨和I.1涉表昱否國境違緇二否曇否曽經(jīng)通釣二昱總計(jì)己觀測期望値已觀測期望値14444;35354 0124Q2454134445 656493di41.467T6.51346+勢40.550117.450465454,0; 20.148 79S列&3937.607g10.393

13、48T3335.1421512.856+6&3332.5901516J1049g2427.2172521.7S3+9101917.5003334.49452翱214847.54111 469斗924646,04132.956+034544.25844 74249442T6 5064953340.2G511e.6-154-GE3537.8551411.14549T3331.3301114 170軸53530,562U18.43&4S92123.5642925 43E列101212.4653535.53548霽鸞11dQid dfk3結(jié)合一起來分析提示: 將Hosmer和Lemes

14、how檢驗(yàn) 和“隨機(jī)性表”1:從Hosmer和Lemeshow檢驗(yàn)表中,可以看出:經(jīng)過 4次迭代后,最終的卡方統(tǒng)計(jì)量為:11.919, 而臨界值為:CHINV(0.05,8) = 15.507卡方統(tǒng)計(jì)量 < 臨界值,從SIG角度來看:0.155 > 0.05 ,說明模型能夠很好的擬合整體,不存在顯著的差異。2:從Hosmer和Lemeshow檢驗(yàn)隨即表中可以看出:”觀測值“和”期望值“幾乎是接近的,不存在很大差異,說明模型擬合效果比較理想,印證了“ Hosmer 和Lemeshow檢驗(yàn)”中的結(jié)果而“ Hosmer和Lemeshow檢驗(yàn)”表中的“卡方”統(tǒng)計(jì)量,是通過“ Hosmer和

15、 Lemeshow檢驗(yàn)隨即表”中的數(shù)據(jù)得到的(即通過“觀測值和”預(yù)測值“)得到 的,計(jì)算公式如下所示:x2 (卡方統(tǒng)計(jì)量)=刀(觀測值頻率-預(yù)測值頻率)A2 /預(yù)測值的頻率 舉例說明一下計(jì)算過程:以計(jì)算"步驟1的卡方統(tǒng)計(jì)量為例"1:將“ Hosmer和Lemeshow檢驗(yàn)隨即表”中“步驟1 ” 的數(shù)據(jù),復(fù)制到 excel中,得到如下所示結(jié)果:_C21A SOCCl :C20)ABCDE |4444.3690. 0033854543.5440. 06324941414870. OOS7143740.5200. 3057294540.2010. 57287439J7.6070.

16、 0516083335.K20.1305173332.5900, 0051662427.2170.33017731917.5060.127566154,512Q 032576245.6560. 484724376.5130. Q360964117.4801.656082斗8.7992. 617364-J9g山”欽0S590.3567弓1616.4100. 010258d25.7630. 47500433334.4940. 0647391工566569從“ Hosmer和Lemeshow檢驗(yàn)”表中可以看出,步驟1的卡方統(tǒng)計(jì)量為:7.567,在上圖中,通過excel計(jì)算得

17、到,結(jié)果為7.566569 7.567 (四舍五入),結(jié)果是一致的,答案得到驗(yàn)證!己觀測I已碩測耒選疋的是否曾經(jīng)違約百分比校正是否曾坯降否jaa步麥1昱總計(jì)苜幷上匕34095203494 426 476 515042W2是否曾輕違妁否 是 總計(jì)肖井訊33574255593 142.67S eur39曇杏曾疑逋妁否是總計(jì)百分訊33364276592 550 491 4U233舞4是否曾輕違妁香 是 總計(jì)百分比33753237193 E55.003.4U134a-已遴定的案捌validate EQ 1d未選定的案倒validate NE 1c由于旨變量中有鍛失値,戴分類變量中的値超出選定舉例的范國

18、'所以未対某些未迭定的案例進(jìn)彳 d切剖値討.5001:從“分類表”一“步驟 T 中可以看出: 選定的案例中,“是否曾今違約” 總計(jì):489個(gè),其中 沒有違約的360個(gè),并且對(duì)360個(gè)“沒有違約”的客戶進(jìn) 行了預(yù)測,有340個(gè)預(yù)測成功,20個(gè)預(yù)測失敗,預(yù)測成功率為:340 / 360 =94.4%其中“違約”的有189個(gè),也對(duì)189個(gè)“違約”的客戶進(jìn)行了預(yù)測,有 95個(gè) 預(yù)測失敗,34個(gè)預(yù)測成功,預(yù)測成功率:34 / 129 = 26.4%總計(jì)預(yù)測成功率:(340 + 34)/ 489 = 76.5%步驟1的 總體預(yù)測成功率為:76.5%,在步驟4終止后,總體預(yù)測成功率為:83.4,預(yù)測

19、準(zhǔn)確率逐漸提升 76.5% 79.8% 81.4% 83.4。83.4的預(yù)測準(zhǔn)確率, 不能夠算太高,只能夠說還行。如果轄去頓則建撲樸型対敵似然 性在-2對(duì)散似誰 中的夏改(IT更改的顯薯性步膘1 甸債率-282 15274.0521.000場靈2工齡-245.12644 5431.000負(fù)債辜-260.995762821.000步腔3工齡-24 2.99690.1021.000員債率-205.88415 8戸1000信用卡負(fù)債-222.85549.9191.000谿1工齡-234 77663.331DOO地址-197.945967T1.002負(fù)債率-200.57215.1351.000信用卡負(fù)

20、債-221 .fB456.1741.000ES.E.WaisdfSig.Exp (B)129.016617771.0001 138常量-2.5002381199481.coo8501.000.877.140.01861.9741.0001.150常量-1 695269420511xoo.194-?52.033577441.000.777.0S3.021157281JQO1.086信用卡賁債,5440G931.09&1xoo1.723竄量118127518.5051.000.307步展梓工齡-249.03464.9771xoo.730-069.0239.027

21、1.933081.021U.8931.0001.035信用咔命債594.10233.0531TOO1.811-7633046.3761”012.465乩在歩聲1中樹入的變呈:員僵率.0在歩鑒衛(wèi)中騷入鼬變薑工齷.C.在垢驟3中輸卩.的具雖.涪用卡員債.在歩騁4中輸入的變量:地址.從“如果移去項(xiàng)則建?!北碇锌梢钥闯觯?“在-2對(duì)數(shù)似然中的更改” 中的數(shù)值 是不是很眼熟? ?,跟在“模型系數(shù)總和檢驗(yàn)”表中“卡方統(tǒng)計(jì)量 "量的值是 一樣的! !將“如果移去項(xiàng)則建?!焙?“方程中的變量”兩個(gè)表結(jié)合一起來看1:在“方程中的變量”表中可以看出: 在步驟1中輸入的變量為“負(fù)債率”,在”如果移去項(xiàng)則建

22、模“表中可以看出, 當(dāng)移去“負(fù)債率”這個(gè)變量時(shí),引起了 74.052的數(shù)值更改,此時(shí)模型中只剩下“常數(shù)項(xiàng)” -282.152為常數(shù)項(xiàng)的對(duì)數(shù)似 然值在步驟2中,當(dāng)移去“工齡”這個(gè)自變量時(shí),引起了 44.543的數(shù)值變化(簡 稱:似然比統(tǒng)計(jì)量),在步驟2中,移去“工齡”這個(gè)自變量后,還剩下“負(fù)債 率”和“常量”,此時(shí)對(duì)數(shù)似然值 變成了: -245.126,此時(shí)我們可以通過公式 算出“負(fù)債率”的似然比統(tǒng)計(jì)量:計(jì)算過程如下:答案得到驗(yàn)證! !似然比統(tǒng)計(jì)量=2 (-245.126+282.152)=74.0522:在“如果移去項(xiàng)則建?!北碇锌梢钥闯觯翰还芤迫ツ且粋€(gè)自變量,“更改的 顯著性”都非常小,幾乎

23、都小于 0.05,所以這些自變量系數(shù)跟模型顯著相關(guān), 不能夠剔去!回歸模型表達(dá)式:3:根據(jù)"方程中的變量“這個(gè)表,我們可以得出logistic1 / 1+ eA-(a+ 刀 B l*Xi)我們假設(shè)Z口+塔1陽血那么可以得到簡潔表達(dá)式:P(Y) = 1 / 1+eA (-z)將”方程中的變量“一步驟4中的參數(shù)代入 模型表達(dá)式中,可以得P(Y) = 1 / 1 + e a - 址-0.249*功齡)到logistic 回歸模型如下所示:(-0.766+0.594*信用卡負(fù)債率+0.081*負(fù)債率-0.069*地收入4301.512其他貢債0121.914總貓量12,7073.122步鑿4

24、 變晝年議20231.1551.2334.673教育.311.5560561.613抽首7721.380教言1361712收入.0051.S+5.1311.719總鎖計(jì)量3.6137.323從”不在方程中的變量“表中可以看出: 年齡,教育,收入,其它負(fù)債,都沒 有納入模型中,其中:sig值都大于0.05,所以說明這些自變量跟模型顯著不 相關(guān)。匚 rtumber: 4Observed Groups and Predictd Probabilities80 41+1F1111Reo +Ei1Qi1Ui1E40+0十N101Q101Y1000120 +000 0十10000011IOOOOOOLO

25、01011000 0 11 0 1IOOOOOQOOOOOOOOOOOOOOO 000010 00 1100 1100 0000mi111PredictedProb: 0.1.2.3.4.5.G.8.91Group: 000000000000000000000000000000000000000000000000001:Predittcf Probability is of M*mb rship forThe Cut Va!ue is .SOSymbols: Q否1 足Each Symbol5 Cases.在”觀察到的組和預(yù)測概率圖”中可以看出:1: the Cut Value is 0.5,此處以0.5為切割值,預(yù)測概率大于 0.5,表示客戶“違約”的概率比較大,小于 0.5表示客戶“違約”概率比較小。2:從上圖中可以看出:預(yù)測分布的數(shù)值基本分布在“左右兩端”在大于 0.5 的切割值中,大部分都是“ 1”表示大部分都是“違約”客戶,( 大約230個(gè) 違約客戶) 預(yù)測概率比較準(zhǔn),而在小于0.5的切割值中,大部分都是“ 0”大 部分都是“未違約”的客戶,(大約 500多個(gè)客戶,未違約

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論