信用評(píng)分管理模式_第1頁(yè)
信用評(píng)分管理模式_第2頁(yè)
信用評(píng)分管理模式_第3頁(yè)
信用評(píng)分管理模式_第4頁(yè)
信用評(píng)分管理模式_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、信用評(píng)分 信用評(píng)分通常正式的定義為一種統(tǒng)計(jì)或定量方法,用于預(yù)測(cè)貸款申請(qǐng)者或現(xiàn)存借款人將發(fā)生違約或拖欠的概率(Mester,1997)。信用評(píng)分的目的是關(guān)心信用提供者量化和治理包含在提供信用中的金融風(fēng)險(xiǎn),以便于他們能夠更好的而且更為客觀的作出借貸決策。關(guān)于信用評(píng)分的進(jìn)展能夠總結(jié)如下。在1936年,F(xiàn)isher引入了在一個(gè)總體中的不同群體中進(jìn)行區(qū)不的思想(例如通過(guò)使用物種的軀體大小來(lái)區(qū)分鳶尾的兩個(gè)種類(lèi))。在1941年,Durand(他在美國(guó)國(guó)民經(jīng)濟(jì)研究局工作)意識(shí)到Fisher 的判不分析能用來(lái)區(qū)分好的或者壞的貸款。 許多年來(lái),關(guān)于提供貸款的決策差不多上由信用分析師來(lái)判定的。在第二次世界大戰(zhàn)期間由

2、于缺乏信用分析師,許多機(jī)構(gòu)要求分析師們寫(xiě)下他們用于評(píng)價(jià)申請(qǐng)貸款者的信用狀況的評(píng)判規(guī)則(Johnson,1992)。 然后利用這些規(guī)則來(lái)關(guān)心進(jìn)行信用決策。世界大戰(zhàn)之后,人們把這兩項(xiàng)事件結(jié)合在一起同時(shí)開(kāi)始考慮在決定貸款申請(qǐng)者的過(guò)程中使用統(tǒng)計(jì)學(xué)生成模型的優(yōu)勢(shì)。在二十世紀(jì)六十年代,伴隨著信用卡的誕生,銀行與其他信用卡發(fā)行組織意識(shí)到了信用評(píng)分的優(yōu)勢(shì)。當(dāng)人們開(kāi)始應(yīng)用信用卡的數(shù)量逐漸增長(zhǎng)的時(shí)候,能夠自動(dòng)化信用準(zhǔn)許過(guò)程的問(wèn)題就變得特不急迫。使用信用評(píng)分的企業(yè)也意識(shí)到了這些預(yù)測(cè)違約的評(píng)分比起任何決策方法都要來(lái)的好(Myers,1963)。 這些評(píng)分同樣關(guān)心企業(yè)組織減少拖欠費(fèi)率。1975年在美國(guó)通過(guò)了同等信用機(jī)會(huì)

3、法案(The Equal Credit Opportunity Acts), 這在1976年被標(biāo)記為重要事件:法案意味著同意對(duì)信用評(píng)分來(lái)便利于借貸決策,同時(shí)愛(ài)護(hù)消費(fèi)者的利息收入以防止不公平的發(fā)生率。在二十世紀(jì)八十年代,對(duì)信用卡的信用評(píng)分的成功促使銀行開(kāi)始使用信用評(píng)分用于其它的目的(比如個(gè)人貸款申請(qǐng))。在二十世紀(jì)直接營(yíng)銷(xiāo)的進(jìn)展同樣也導(dǎo)致了信用評(píng)分方法的使用來(lái)增加廣告戰(zhàn)略的回應(yīng)率。在最近這些年里,信用評(píng)分差不多開(kāi)始用于家庭貸款、小型商業(yè)貸款、保險(xiǎn)申請(qǐng)和續(xù)訂。同時(shí)關(guān)于這方面的關(guān)注也開(kāi)始從減少貸款應(yīng)用的拖欠轉(zhuǎn)向了從客戶獲利方面的增長(zhǎng)(Thomas,2000)。信用評(píng)分的好處信用評(píng)分具有專(zhuān)門(mén)多好處,不僅

4、僅對(duì)借款者如此,對(duì)貸款者同樣如此。舉例講明之,由于信用評(píng)分模型提供了關(guān)于用戶信用價(jià)值的客觀分析從而能夠關(guān)心簡(jiǎn)化判不。這但是使得信用提供者僅僅關(guān)注于與信用風(fēng)險(xiǎn)相關(guān)的信息同時(shí)幸免信用分析師或保險(xiǎn)公司的個(gè)人主觀性。在美國(guó),在同等信用機(jī)會(huì)法案下, 顯著的判不變量諸如種族、 性不、宗教信仰和年齡等都不能包括在信用評(píng)分模型中。只有本質(zhì)上是非判不性的信息和那些被證實(shí)為對(duì)支付能力有預(yù)測(cè)性的信息才能包括在模型之中。信用評(píng)分同樣能夠關(guān)心我們?cè)黾淤J款申請(qǐng)過(guò)程的速度與一致性,同時(shí)同意借款過(guò)程的自動(dòng)化。同樣的,其大大簡(jiǎn)化了信用評(píng)價(jià)過(guò)程中人工干預(yù)的必要以及分發(fā)信用的成本(Barefoot,1995)。憑借信用評(píng)分的關(guān)心,

5、金融機(jī)構(gòu)在專(zhuān)門(mén)短時(shí)刻里能夠量化提供特不申請(qǐng)者與信用關(guān)聯(lián)的風(fēng)險(xiǎn)。Leonard(1995) 研究了加拿大的銀行,發(fā)覺(jué)在使用了信用評(píng)分之后,用于處理消費(fèi)貸款申請(qǐng)的時(shí)刻由原來(lái)的九天縮短為三天。那么處理貸款申請(qǐng)節(jié)約下來(lái)的時(shí)刻就能夠用于從事更為復(fù)雜的問(wèn)題。Banaslak and Kiely(2000)總結(jié)出在信用評(píng)分的關(guān)心下,金融機(jī)構(gòu)能夠制定更快、更好和更高質(zhì)量的決策。此外,信用評(píng)分能夠關(guān)心金融機(jī)構(gòu)確定利息率,這些他們將對(duì)他們的用戶收費(fèi)同時(shí)對(duì)資產(chǎn)組合定價(jià)(Avery et al.,2000)。高風(fēng)險(xiǎn)用戶將被提供更高的利息率,反之亦然。基于用戶的信用評(píng)分,金融機(jī)構(gòu)也能夠確定對(duì)用戶設(shè)定信用限度(Sandl

6、er et al.,2000)。 這些都能夠關(guān)心金融機(jī)構(gòu)更為有效的和有利的治理他們的賬戶。作為擴(kuò)展,利潤(rùn)評(píng)分則能用于在一系列產(chǎn)品中最大化利潤(rùn)(Thomas,2000)。與上面談到的相關(guān),信用評(píng)分模型實(shí)現(xiàn)了次一級(jí)借貸行業(yè)的進(jìn)展,在那個(gè)地點(diǎn),次一級(jí)的消費(fèi)者具有不足的信用記錄同時(shí)不符合信用承諾與風(fēng)險(xiǎn)。他們可能因?yàn)樾庞萌毕荨⑿庞脷v史記錄的缺失或者在確認(rèn)他們的收入等方面無(wú)法滿足傳統(tǒng)金融業(yè)務(wù)的要求(Quittner,2003)。在次一級(jí)借貸的進(jìn)展中,其中一個(gè)最要緊的因素差不多自動(dòng)化的認(rèn)購(gòu),其同意次一級(jí)抵押貸款能夠進(jìn)行打包然后作為投資性有價(jià)證券來(lái)銷(xiāo)售。在這一市場(chǎng)專(zhuān)門(mén)金融機(jī)構(gòu)的初始成功差不多驅(qū)動(dòng)更多的金融機(jī)構(gòu)

7、進(jìn)入次一級(jí)借貸市場(chǎng),期望伴隨著信用評(píng)分技術(shù)的前進(jìn)而增長(zhǎng)(Perin,1998)。最后,由于技術(shù)方面的進(jìn)展,更為智能的信用評(píng)分模型得到了進(jìn)展。相應(yīng)的,信用卡提供者能夠使用由模型得到的信息來(lái)明確表示更好的策略,然后更為有效的使用這些資源。Lucas(2000)報(bào)告稱,收獲率(recovery rate)從1997年的9.1%,1998年的12.1%上升到1999年平均15.9%。此外,保險(xiǎn)業(yè)應(yīng)用信用評(píng)分來(lái)使得保險(xiǎn)申請(qǐng)與續(xù)約過(guò)程更加簡(jiǎn)化有效率。尤其是,信用評(píng)分關(guān)心保險(xiǎn)公司作出關(guān)于索賠的更好的預(yù)測(cè)以及更為有效的操縱風(fēng)險(xiǎn)。他們同樣也能更準(zhǔn)確的對(duì)產(chǎn)品進(jìn)行定價(jià)。這使得保險(xiǎn)公司能夠以更為公平的成本提供更多的保

8、險(xiǎn)覆蓋面給更多的用戶,更快的對(duì)市場(chǎng)變化作出反應(yīng)以及贏得競(jìng)爭(zhēng)優(yōu)勢(shì)(Kellison and Brockett,2003)。信用評(píng)分應(yīng)用在最近幾年里,金融機(jī)構(gòu)使用信用評(píng)分要緊是針對(duì)貸款申請(qǐng)作出信用決策。然而,在過(guò)去的25年里,信用評(píng)分的應(yīng)用從制定信用決策開(kāi)始向?qū)εc住房、保險(xiǎn)、基礎(chǔ)公共事業(yè)服務(wù)甚至就業(yè)等方面制定決策轉(zhuǎn)移。然而,也并不是所有的應(yīng)用差不多上得到同等廣泛的應(yīng)用的。 信用評(píng)分最為普及的應(yīng)用是在貸款申請(qǐng)中進(jìn)行信用決策。除了在個(gè)人貸款應(yīng)用上的決策之外,金融機(jī)構(gòu)現(xiàn)在也開(kāi)始利用信用評(píng)分關(guān)心設(shè)定信用限度、治理現(xiàn)金賬戶同時(shí)預(yù)測(cè)用戶與客戶的利潤(rùn)度(Punch,2000)。例如,澳大利亞與新西蘭銀行集團(tuán) (

9、Australia and New Zealand Banking Group) 利用信用評(píng)分協(xié)助他們識(shí)不那些將同意信用的申請(qǐng)者, 決定申請(qǐng)者應(yīng)該同意的信用數(shù)量,以及當(dāng)在貸款支付過(guò)程中失敗時(shí)所應(yīng)該采取的步驟。同樣,信用卡發(fā)行者使用信用評(píng)分作為決策支持工具識(shí)不他們信用卡的目標(biāo)市場(chǎng)(這實(shí)際上確實(shí)是客戶贏得應(yīng)用)(Punch,2000)。 在最近這些年里,信用評(píng)分同樣也在給小商業(yè)企業(yè)信用決策過(guò)程的部分程序中使用(Rowland,2003)。例如,F(xiàn)leet金融集團(tuán)(Fleet Financial Group)在低于10萬(wàn)美元的貸款中使用信用評(píng)分。信用評(píng)分模型同樣也用于保險(xiǎn)行業(yè)中(例如抵押以及汽車(chē)保險(xiǎn)

10、),用于對(duì)新保險(xiǎn)政策的申請(qǐng)以及現(xiàn)存政策的更新做出決策。應(yīng)用的前提是:在金融穩(wěn)定性與風(fēng)險(xiǎn)之間存在著直接的聯(lián)系。據(jù)討論得知在汽車(chē)與抵押保險(xiǎn)方面的信用鑒定與損失比率之間都有專(zhuān)門(mén)強(qiáng)的相關(guān)關(guān)系。統(tǒng)計(jì)上的證據(jù)也證明了相對(duì)損失比率(關(guān)于索賠頻率與成本的函數(shù))減少而信用等級(jí)鑒定改善(Schiff,2003)。GE Capital Mortgage Corporation使用信用評(píng)分關(guān)心他們甄不抵押保險(xiǎn)申請(qǐng)表(Prakash,1995)。信用評(píng)分同樣用作調(diào)整年金的基準(zhǔn)。一般地,具有差的信用得分的用戶會(huì)比具有專(zhuān)門(mén)好的信用得分的用戶擁有專(zhuān)門(mén)高的機(jī)率申請(qǐng)保險(xiǎn)索賠。因此,前者都會(huì)被克以比較高的保險(xiǎn)費(fèi)。信用信息同樣也用于

11、在一項(xiàng)保險(xiǎn)政策的條件下評(píng)價(jià)一個(gè)消費(fèi)者的責(zé)任性以及行為。除了上面提及的之外,其他的信用評(píng)分的應(yīng)用能夠在2002年美國(guó)消費(fèi)者聯(lián)盟(The Consumer Federation of America) 的報(bào)告。比如,農(nóng)場(chǎng)主能夠利用信用得分來(lái)判定潛在的農(nóng)戶能否盡可能的及時(shí)支付他們的租金。美國(guó)的一些公共事業(yè)提供者同樣也應(yīng)用信用得分決定是否對(duì)他們的消費(fèi)者提供服務(wù)。最后,一些企業(yè)主利用信用歷史數(shù)據(jù)以及信用得分來(lái)決定是否雇用一個(gè)可能的雇員,尤其是對(duì)那些需要處理大量金鈔票的雇員的職位來(lái)講更是如此。其含意是雇員的誠(chéng)信價(jià)值進(jìn)而個(gè)人特性也能通過(guò)他們的信用得分進(jìn)行評(píng)價(jià)。信用評(píng)分模型的構(gòu)建構(gòu)建信用評(píng)分模型的方法論通常包

12、含了以下過(guò)程。首先,選擇一個(gè)往??蛻舻臉颖就瑫r(shí)將他們分類(lèi)成好與壞,要緊依靠在一段給定時(shí)刻里的支付能力來(lái)確定(為了簡(jiǎn)化起見(jiàn),那個(gè)地點(diǎn)僅僅使用兩分法)。 緊接著,從貸款用戶、個(gè)人和/或商業(yè)信用記錄以及能夠獲得其它不同的資源那兒收集數(shù)據(jù)(比如,信用局報(bào)告)。最后,統(tǒng)計(jì)或者其他定量的分析方法應(yīng)用到這些數(shù)據(jù)上,產(chǎn)生信用評(píng)分模型。這一模型將包含應(yīng)用到不同個(gè)體用戶變量(或?qū)傩裕┥系臋?quán)重以及分割點(diǎn)。應(yīng)用到單個(gè)用戶或客戶變量的權(quán)重的總和構(gòu)成了信用得分。分離點(diǎn)確定了是否那個(gè)用戶或客戶應(yīng)該被分類(lèi)為好的依舊壞的。更為準(zhǔn)確與具體的是伴隨分類(lèi)的概率同樣也能夠生成。需要注意的是,關(guān)于不同的數(shù)據(jù)的細(xì)分將構(gòu)建成不同的模型。 到

13、此為止, 幾種技術(shù)差不多用于信用評(píng)分模型的構(gòu)建了。 最為常用的技術(shù)是傳統(tǒng)統(tǒng)計(jì)學(xué)方法。例如, 一些最早建立的信用評(píng)分模型使用判不分析技術(shù)。 然而,判不分析需要相當(dāng)嚴(yán)格的統(tǒng)計(jì)假設(shè),這些假設(shè)在實(shí)際生活中是專(zhuān)門(mén)少能夠滿足的。相應(yīng)的,Logistic回歸(相對(duì)不是專(zhuān)門(mén)嚴(yán)格)被推舉成為判不分析的替代方法。一些技術(shù)是往常就使用過(guò)的,然而不是相當(dāng)頻繁,構(gòu)建信用評(píng)分模型包括基因算法、K最近鄰值方法、線性規(guī)劃以及專(zhuān)家系統(tǒng)方法。 在最近這些年里,數(shù)據(jù)挖掘技術(shù)不斷增長(zhǎng)的應(yīng)用于構(gòu)建信用評(píng)分模型。尤其是,決策樹(shù)方法差不多變成一種建立信用評(píng)分模型的流行的技術(shù),因?yàn)榈玫降臎Q策樹(shù)是專(zhuān)門(mén)易于解釋和形象化的。 進(jìn)一步,神經(jīng)網(wǎng)絡(luò)也是

14、普遍得到使用。這些技術(shù)在下面的文章中我們進(jìn)行詳細(xì)討論。關(guān)于信用評(píng)分模型的經(jīng)驗(yàn)研究包括(Lee and Jung,1999/2000)和(West,2000)。應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行信用評(píng)分 為了展示數(shù)據(jù)挖掘技術(shù)應(yīng)用于信用評(píng)分,考慮一信用卡提供者,他們致力于建立一個(gè)信用評(píng)分模型來(lái)預(yù)測(cè)信用卡申請(qǐng)者的信用風(fēng)險(xiǎn),并把他們分為有害損失、有害利潤(rùn)、良好風(fēng)險(xiǎn)三種。信用卡提供者傾向于在信用卡申請(qǐng)者進(jìn)行檢查時(shí)部署模型。假設(shè)所有的申請(qǐng)者都以申請(qǐng)表的形式提供以下的相關(guān)信息。 1.年齡; 2.年收入; 3.性不; 4.婚姻狀況; 5.家庭子女?dāng)?shù)目; 6.擁有其他信用卡情況; 7.申請(qǐng)者是否具有未完結(jié)的抵押貸款。 考慮到

15、上面涉及到的因素,目標(biāo)變量為信用風(fēng)險(xiǎn),輸入變量為上面列出的七個(gè)變量。在我們建立信用評(píng)分模型之前,信用卡提供者把代表性樣本中的4117一年期信用卡持有者用戶分成三類(lèi):有害損失、有害利潤(rùn)和良好風(fēng)險(xiǎn)。同樣,作為常規(guī)的做法,申請(qǐng)者所提供的所有信息差不多上電子化自動(dòng)收集的。 信用風(fēng)險(xiǎn)模型的構(gòu)建需要建立預(yù)測(cè)性的模型技術(shù)。為此,三種數(shù)據(jù)挖掘技術(shù)是比較合適的,也確實(shí)是,Logistic 回歸、神經(jīng)網(wǎng)絡(luò)和決策樹(shù)。我們?cè)诒疚牡睦C中使用SPSS公司的 Clementine7.2(數(shù)據(jù)挖掘軟件)。 與本文例證相關(guān)聯(lián)的數(shù)據(jù)挖掘的圖表參見(jiàn)圖1。需要注意的是,在圖中包含了描述與可視化以及預(yù)測(cè)性模型。進(jìn)一步,關(guān)聯(lián)與聚類(lèi)關(guān)于

16、信用風(fēng)險(xiǎn)評(píng)分的應(yīng)用并不相關(guān),因此那個(gè)地點(diǎn)并沒(méi)有涉及。關(guān)于數(shù)據(jù)的快照能夠參見(jiàn)圖2。圖1圖2 描述與可視化結(jié)果 正如先前提及的,描述與可視化關(guān)于理解數(shù)據(jù)以及在初始建模過(guò)程中發(fā)覺(jué)模式、趨勢(shì)以及關(guān)系是特不有用的。 在本例證中使用了幾種描述與可視化的工具。其中一些結(jié)果被匯總在圖.3中。 例如,在Clementine中由統(tǒng)計(jì)節(jié)點(diǎn)生成的描述統(tǒng)計(jì)量,展示了在樣本中,平均年齡為31.82, 平均年收入為25580美元,家庭平均擁有子女?dāng)?shù)目為1.45個(gè)。另外, 3200或者是77.73%的信用卡持有者持有未完結(jié)的抵押貸款。盡管有些結(jié)果沒(méi)有顯示,仍然要緊注意的是,每個(gè)客戶平均擁有其他類(lèi)型的信用卡為2.43張,207

17、7或者50.45%的客戶為女性,2089或50.74%為已婚。至于我們的目標(biāo)變量信用風(fēng)險(xiǎn),906(22.01%)的客戶為有害損失,2407(58.46%)的客戶為有害利潤(rùn),804(19.53%)的客戶為良好風(fēng)險(xiǎn)。這些描述性結(jié)果顯然有助于我們理解數(shù)據(jù)(也確實(shí)是信用卡申請(qǐng)者與持有者)。 圖3在Clementine中使用散點(diǎn)圖節(jié)點(diǎn)與直方圖節(jié)點(diǎn)來(lái)可視化數(shù)據(jù),關(guān)于年齡與年收入的散點(diǎn)圖以及直方圖展現(xiàn)了客戶年齡與收入之間的相關(guān)關(guān)系。需要注意的是,在圖表中我們使用了信用風(fēng)險(xiǎn)狀況那個(gè)變量來(lái)交疊,反映目標(biāo)變量的相關(guān)的可視化結(jié)果。關(guān)于結(jié)果的分析展示了年齡大與收入高的客戶以及持有相對(duì)較少其他信用卡的客戶表現(xiàn)出更為有利

18、的信用風(fēng)險(xiǎn)狀況。最后,利用Clementine中的網(wǎng)絡(luò)節(jié)點(diǎn)能夠繪制出反映性不、婚姻狀況、抵押貸款狀況與信用風(fēng)險(xiǎn)的聯(lián)系(見(jiàn)圖3下半部分)。其中聯(lián)系越為強(qiáng)烈的關(guān)系用更粗的線條來(lái)表示。假如聯(lián)系低于我們?cè)O(shè)置的某個(gè)門(mén)限,就可不能顯現(xiàn)在網(wǎng)絡(luò)圖中(比如良好風(fēng)險(xiǎn)與婚姻狀況)。網(wǎng)絡(luò)圖顯示出有害損失與是否擁有未完結(jié)抵押貸款有著中等程度的關(guān)聯(lián),與女性、已婚信用卡持有者有著弱相關(guān)聯(lián)。正如早前提及的,描述與可視化關(guān)于建模來(lái)講是有用的。 預(yù)測(cè)模型結(jié)果在本文是用數(shù)據(jù)挖掘技術(shù)進(jìn)行信用評(píng)分應(yīng)用的展示中,預(yù)測(cè)性建模是最為重要的分析。特不的,Logistic回歸、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)都能夠用于購(gòu)建信用評(píng)分模型。在實(shí)施預(yù)測(cè)性建模之前,樣

19、本數(shù)據(jù)首先要被分割為構(gòu)建/訓(xùn)練樣本集(大約占75%的數(shù)據(jù))和評(píng)價(jià)/檢驗(yàn)樣本集(大約占25%的數(shù)據(jù))。為了簡(jiǎn)化,我們假設(shè)模型的完全準(zhǔn)確率是衡量各個(gè)預(yù)測(cè)性模型的要緊的性能指標(biāo)。也確實(shí)是講,完全準(zhǔn)確率是評(píng)價(jià)每個(gè)模型以及在模型間進(jìn)行比較的標(biāo)準(zhǔn)。 圖4和圖5顯示了分不由Clementine中的Logistic回歸節(jié)點(diǎn)、神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)、決策樹(shù)節(jié)點(diǎn)C5.0生成的Logistic回歸模型、神經(jīng)網(wǎng)絡(luò)模型以及決策樹(shù)模型的部分結(jié)果。Logistic回歸結(jié)果講明了模型在統(tǒng)計(jì)上是顯著的(基于0.05的置信水平)。 另外,正如圖4左下部分所顯示的,以下所列的輸入變量在預(yù)測(cè)信用風(fēng)險(xiǎn)上在統(tǒng)計(jì)上是顯著的:年齡、年收入、子女?dāng)?shù)目、

20、其他信用卡持有情況、婚姻狀況、是否持有未完結(jié)的抵押貸款。性不在統(tǒng)計(jì)上是不顯著的。關(guān)于模型的詳細(xì)的結(jié)果匯總在圖4的右邊。最后,關(guān)于Logistic回歸模型,完全準(zhǔn)確率為72.7%。關(guān)于我們本文的例證來(lái)講能夠認(rèn)為是足夠的了。 圖4 圖5(左邊部分)顯示了一個(gè)相對(duì)簡(jiǎn)單的決策樹(shù)模型,擁有九個(gè)最終節(jié)點(diǎn) (預(yù)測(cè)有害損失、有害利潤(rùn)和良好風(fēng)險(xiǎn))和五個(gè)重要的輸入變量:年收入、年齡、子女?dāng)?shù)目、持有其他信用卡數(shù)目以及婚姻狀況。關(guān)于決策樹(shù)模型的一個(gè)圖形化的描述展示在圖6中。 正如我們所看到的,決策樹(shù)既能夠特不直觀的解釋?zhuān)材軌蛞勒找?guī)則進(jìn)行解釋。例如,良好風(fēng)險(xiǎn)信用卡持有者可能是那些年收入高于25049美元同時(shí)不超過(guò)一個(gè)

21、子女的信用卡客戶以及那些收入盡管低于25049美元然而39歲以上且單身的信用卡持有者。決策樹(shù)模型的完全準(zhǔn)確率為76.0%, 關(guān)于我們本文的例證來(lái)講也能夠認(rèn)為是足夠的了。 圖5最后,圖5顯示了神經(jīng)網(wǎng)絡(luò)模型,在模型中輸入層有九個(gè)神經(jīng)元 (也確實(shí)是四個(gè)連續(xù)變量和三個(gè)分類(lèi)變量),隱含層有三個(gè)神經(jīng)元,輸出層有三個(gè)神經(jīng)元(也確實(shí)是風(fēng)險(xiǎn)狀況有害損失、有害利潤(rùn)、良好風(fēng)險(xiǎn))。在神經(jīng)網(wǎng)絡(luò)中,在輸入層中輸入變量的重要性以降序的方式排列為:年收入、持有其他信用卡數(shù)目、婚姻狀況、年齡、子女?dāng)?shù)目、是否有未完結(jié)的抵押貸款以及性不。神經(jīng)網(wǎng)絡(luò)的完全準(zhǔn)確率為76.6%,同樣關(guān)于我們本文的例證來(lái)講也能夠認(rèn)為是足夠的了。 從上面展示

22、的模型的結(jié)果我們能夠注意到, 神經(jīng)網(wǎng)絡(luò)模型是最為準(zhǔn)確的。 然而,由于依據(jù)在構(gòu)建/訓(xùn)練數(shù)據(jù)集上的三個(gè)模型的性能是向上有偏的 (由于相同的觀看值被用于模型的構(gòu)建與模型的評(píng)估),因此需要依靠評(píng)價(jià)/檢驗(yàn)數(shù)據(jù)集來(lái)評(píng)價(jià)模型的性能是特不重要的。 相關(guān)結(jié)果匯總?cè)缦拢篖ogistic回歸模型為71.1%,決策樹(shù)模型為74.2%,神經(jīng)網(wǎng)絡(luò)模型為73.4%。 因此,決策樹(shù)模型的預(yù)測(cè)性能才是最為準(zhǔn)確的,緊跟著是神經(jīng)網(wǎng)絡(luò)模型和Logistic回歸模型。因此,依據(jù)我們的評(píng)價(jià)標(biāo)準(zhǔn),決策樹(shù)模型是最好的(冠軍)預(yù)測(cè)模型,同時(shí)能夠用于我們對(duì)信用卡申請(qǐng)者進(jìn)行信用風(fēng)險(xiǎn)的預(yù)測(cè)。然而同樣要注意的是,決策樹(shù)模型比較容易解釋?zhuān)?就如在圖6中

23、所反映的簡(jiǎn)單的規(guī)則證實(shí)的一樣。 圖6 信用評(píng)分的局限性 在那個(gè)地點(diǎn)的結(jié)論部分,我們討論一下信用評(píng)分的局限性同樣也是適合的。當(dāng)構(gòu)建信用評(píng)分模型是可能產(chǎn)生的一個(gè)要緊的問(wèn)題時(shí),模型可能建立在一個(gè)有偏的已獲信用準(zhǔn)許的用戶或客戶樣本數(shù)據(jù)基礎(chǔ)上(Hand,2001)。這可能發(fā)生要緊是因?yàn)?,那些被拒絕的申請(qǐng)者可能可不能包含在構(gòu)建模型的數(shù)據(jù)庫(kù)中,因此就沒(méi)有機(jī)會(huì)來(lái)確知他們的信用價(jià)值性。因而,樣本將會(huì)是有偏的(也確實(shí)是不同于一般總體),其中良好的客戶大大的得到了表現(xiàn)。使用這一樣本得到的信用評(píng)分模型通常將無(wú)法在完全的總體中表現(xiàn)良好,因?yàn)橛糜谫?gòu)建模型的數(shù)據(jù)與將模型應(yīng)用到的數(shù)據(jù)存在差異。 建立信用評(píng)分模型時(shí)可能產(chǎn)生的第

24、二個(gè)問(wèn)題是,隨著時(shí)刻的過(guò)去,模式在發(fā)生變化。關(guān)于任何預(yù)測(cè)性模型的關(guān)鍵假設(shè)是,過(guò)去或者歷史能夠預(yù)測(cè)以后(Berry and Linoff,2000)。關(guān)于信用評(píng)分,這就意味著過(guò)去的那些隨后被分成好與壞債權(quán)人的申請(qǐng)者的特征能夠用于預(yù)測(cè)新的申請(qǐng)者的信用狀況。有時(shí),隨著時(shí)刻流逝客戶特征分布的趨勢(shì)變化是如此快速,以至于需要不斷的更新信用評(píng)分模型來(lái)保持恰當(dāng)性。 另一個(gè)在預(yù)測(cè)性模型中比較流行的問(wèn)題是,模型中重要變量或?qū)傩缘娜笔Вˋvery et al.,2000)。信用評(píng)分模型要緊使用的是個(gè)人支付與信用歷史的信息數(shù)據(jù)。這可能并不足以評(píng)價(jià)一個(gè)人的信用價(jià)值性。在本文的展示性信用評(píng)分模型中,某申請(qǐng)者的信用等級(jí)被預(yù)測(cè)為壞的,假如他或她的屬性與壞的客戶的觀看得到的特征相似。然而,信用違約可能是由那些諸如雇用狀況和現(xiàn)在的經(jīng)濟(jì)狀況等未觀看到的(未測(cè)量的)特征所驅(qū)使的。進(jìn)一步,信用評(píng)分的準(zhǔn)確度比較關(guān)鍵的依靠于用于購(gòu)建

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論