版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、P2P 網(wǎng)絡(luò)借貸雙方的決策參考模型構(gòu)建 以拍拍貸為例北京郵電大學(xué) 張夢(mèng)洋 王藝婷 許悅 摘 要:低借款成功率、高借貸成本和高信用風(fēng)險(xiǎn)是我國(guó) P2P(Peer-to-Peer)網(wǎng)絡(luò)借貸平臺(tái)所面臨 的主要問題。為了改善上述問題,本文以拍拍貸網(wǎng)站為研究對(duì)象,從借貸雙方角度分別構(gòu)建決策參 考模型。從借入者的角度,基于二元 logistic 回歸方法,構(gòu)建滿標(biāo)預(yù)測(cè)模型,幫助借入者調(diào)整借款 標(biāo)的信息以便更好獲得借出者響應(yīng),提高滿標(biāo)概率。實(shí)證結(jié)果表明,該模型訓(xùn)練集綜合判斷正確率 達(dá)到 96%,驗(yàn)證集的綜合判斷正確率達(dá)到 95.5%。從借出者角度考慮,等級(jí)并不能反映同級(jí)用戶的 異質(zhì)性。因此通過逐步判別分析法,
2、對(duì)借入者信用進(jìn)行二次分類,幫助借出者分辨同級(jí)中的高質(zhì)量 用戶,降低投資風(fēng)險(xiǎn)。實(shí)例結(jié)果表明原分級(jí)制度下 26.3%的低等級(jí)用戶可視為高質(zhì)量的新生用戶, 且判別函數(shù)顯著成立。 關(guān)鍵詞:P2P 網(wǎng)絡(luò)借貸,二元 logistic 回歸,逐步判別分析,決策參考模型 目錄:1引言.22文獻(xiàn)綜述.23研究對(duì)象與樣本數(shù)據(jù).33.1拍拍貸網(wǎng)站介紹與運(yùn)營(yíng)機(jī)制 .33.2數(shù)據(jù)搜集與變量選取.33.3定性分析.4(1)描述性分析.4(2)多元對(duì)應(yīng)分析.54基于二元 logistic 回歸的滿標(biāo)預(yù)測(cè)模型借入者決策模型.74.1模型選取.74.2相關(guān)性檢驗(yàn).84.3模型構(gòu)建.84.4結(jié)果分析.104.5對(duì)借入者的決策建議
3、.105借入者信用的判別分類模型借出者決策模型.105.1研究目的與研究方法.105.2模型構(gòu)建.115.3結(jié)果分析.115.4對(duì)借出者的決策建議.146結(jié)語(yǔ).146.1總結(jié).146.2研究局限及后續(xù)改進(jìn).15 11 引言 P2P(peer to peer lending)網(wǎng)絡(luò)借貸平臺(tái),是指借助網(wǎng)絡(luò)技術(shù)和信用評(píng)估技術(shù),協(xié)助借出者和 借入者實(shí)現(xiàn)借貸行為的中介服務(wù)活動(dòng)平臺(tái)。個(gè)人可以通過該平臺(tái)將其閑置資金(出于投資目的)出 借給資金短缺者的新型借貸模式。P2P 貸款對(duì)象主要是短期、小額借貸者,本質(zhì)上屬于民間借貸, 其價(jià)值主要體現(xiàn)在滿足個(gè)人資金需求、發(fā)展個(gè)人信用體系和提高社會(huì)閑散資金利用率等方面(錢金
4、 葉,楊飛,2012)。 傳統(tǒng)金融體系的服務(wù)中心仍集中于大企業(yè)、大客戶,未覆蓋到具有巨大潛力的民間借貸市場(chǎng)。 而互聯(lián)網(wǎng)的介入無限放大了可貸款人群的范圍和數(shù)量,并使借貸雙方匹配的過程更加有效率且透明 化,小額借貸與網(wǎng)絡(luò)科技結(jié)合所產(chǎn)生的新型借款模式主張自主選擇、分散投資,所以吸引了借貸雙 方的關(guān)注,得以迅速發(fā)展起來(尤瑞章,張曉霞,2010)。 獲得 2006 年“諾貝爾和平獎(jiǎng)”的孟加拉國(guó)經(jīng)濟(jì)學(xué)家穆罕默德.尤努斯教授首創(chuàng)了在鄉(xiāng)村銀行 (GrameenBank)平臺(tái)上進(jìn)行運(yùn)作的小額借貸模式,由小額借貸衍生出了 P2P 網(wǎng)絡(luò)借貸平臺(tái)。全 球首家 P2P 網(wǎng)絡(luò)借貸平臺(tái) Zopa 于 2005 年在英國(guó)成
5、立,而美國(guó) 2006 年上線的 Prosper 則是目前全 球最大的 P2P 網(wǎng)絡(luò)借貸平臺(tái)。中國(guó)第一家 P2P 貸款網(wǎng)站拍拍貸于 2007 年成立(吳曉光、曹一, 2011),此后多家 P2P 網(wǎng)絡(luò)借貸平臺(tái)層出不窮,交易數(shù)額日益增長(zhǎng),影響范圍不斷擴(kuò)大。形成了以 拍拍貸、宜信、紅嶺創(chuàng)投為代表的三種不同模式的 P2P 網(wǎng)絡(luò)借貸平臺(tái)。 我國(guó) P2P 網(wǎng)貸公司的資質(zhì)和規(guī)模參差不齊,除了人人貸、拍拍貸等一些大型網(wǎng)貸平臺(tái)的風(fēng)險(xiǎn) 管理較正規(guī)外,其余的風(fēng)險(xiǎn)管理水平難以得到保證。由于信息不對(duì)稱、個(gè)人信用體系建設(shè)不完善等 因素的限制,網(wǎng)貸平臺(tái)存在很多問題未得到解決。從 P2P 網(wǎng)絡(luò)借貸參與者的角度來看,需要解決
6、的問題主要有兩方面,一是對(duì)借入者來說,如何提高較低的借款成功率;二是對(duì)借出者而言,如何 根據(jù)有限的可獲得信息做出投資決策。 2 文獻(xiàn)綜述 我國(guó)銀監(jiān)會(huì)自 2011 年發(fā)布了關(guān)于人人貸有關(guān)風(fēng)險(xiǎn)提示的通知,要求銀行業(yè)金融機(jī)構(gòu)嚴(yán)防民 間借貸風(fēng)險(xiǎn)向銀行體系蔓延,此后,國(guó)內(nèi)對(duì)于 P2P 網(wǎng)絡(luò)信貸風(fēng)險(xiǎn)的研究逐漸增多。 國(guó)外的 P2P 網(wǎng)貸平臺(tái)發(fā)展較早,因此對(duì)網(wǎng)貸的研究比較豐富。Mingfeng Lin,Prabhala NR和 Viswanathan S(2009),Seth Freedman 和 Jin GZ(2009)研究指出借入者的基本信息是借出者對(duì)其還 款可能性進(jìn)行評(píng)估的主要參照因素,影響著借出者最
7、終的投資決策。Puro et a1等(2010)研究 了借款額度會(huì)對(duì)借款成功率和借款利率產(chǎn)生顯著影響,為了降低借款利率并提高借款成功率,借入 者必須降低借款額度。Lin 等(2013)通過樣本的實(shí)證研究,認(rèn)為社交網(wǎng)絡(luò)能夠增加融資成功的概 率,并使融資成本即借款利率降低,同時(shí)也能降低事后違約率。 國(guó)內(nèi)方面,吳小英,鞠穎(2012)通過使用最小二乘法進(jìn)行參數(shù)估計(jì),研究 Prosper 平臺(tái)中借款 用途對(duì)借貸成功率的影響。陳建中,寧欣(2013)對(duì)人人貸的借貸數(shù)據(jù)進(jìn)行實(shí)證,發(fā)現(xiàn)借入者的基 本信息在貸款人評(píng)估借貸可行性時(shí)已成為重要的參照因素,促使借貸成功率提高。陳東宇,李偉軍, 丁婕(2012)建立了
8、包含借款人個(gè)人信息和社會(huì)資本因素的決策輔助模型。宋文(2013)以拍拍貸 為例,對(duì)出借人投標(biāo)意愿影響因素、出借人要求收益以及網(wǎng)貸中的逾期行為進(jìn)行了研究。經(jīng)過對(duì)國(guó) 內(nèi)外文獻(xiàn)的梳理和分析可知,貸款人對(duì)于借貸的決策與平臺(tái)公布的借入者基本信息有相關(guān)關(guān)系,借 入者公布在網(wǎng)上的信息對(duì)借貸的成功率有一定程度的影響。 目前,國(guó)內(nèi)相關(guān)研究一方面是以偏理論的描述性研究為主,對(duì)參與網(wǎng)貸投融資者的特點(diǎn)都做了 具體而細(xì)致的研究,另一方面是做實(shí)證研究篩選對(duì)交易狀態(tài)的影響因素。但少有文獻(xiàn)通過構(gòu)建模型 (尤其從借貸雙方兩個(gè)角度)輔助參與者進(jìn)行決策,并分別進(jìn)行研究。因此本文以拍拍貸為研究對(duì) 象,構(gòu)建對(duì)借貸雙方的決策參考模型,降
9、低信息不對(duì)稱導(dǎo)致的風(fēng)險(xiǎn),促進(jìn) P2P 網(wǎng)絡(luò)借貸良性發(fā)展, 具有很強(qiáng)的實(shí)際意義。 23 研究對(duì)象與樣本數(shù)據(jù) 3.1 拍拍貸網(wǎng)站介紹與運(yùn)營(yíng)機(jī)制 拍拍貸作為我國(guó)首家 P2P 小額無擔(dān)保網(wǎng)絡(luò)借貸平臺(tái),是單純的中介平臺(tái),主要以交易服務(wù)費(fèi) 為收入來源。拍拍貸根據(jù)“線下得分”和“線上得分”借入者的信用等級(jí)核定。其中,線下得分是 根據(jù)用戶提交的結(jié)婚證、工資證明等信息來確定的,包括年齡、學(xué)歷、工作、收入等因素;線上得 分項(xiàng)目包括身份認(rèn)證、手機(jī)實(shí)名認(rèn)證和在平臺(tái)上借還款記錄等。拍拍貸的信用等級(jí)分為 6 級(jí),由 高到低是 A、B、C、D、E、HR。信用評(píng)分的結(jié)果將直接影響借入者可借額度的大小和借款成功 率。拍拍貸的風(fēng)
10、險(xiǎn)控制手段與 Prosper 類似,主要是分散投資加強(qiáng)制每月還款,此外拍拍貸的借款 期限都在一年以內(nèi),也能夠在一定程度上降低風(fēng)險(xiǎn)。 圖 1. 拍拍貸流程圖 網(wǎng)貸之家公布的數(shù)據(jù)顯示自 2013 年 5 月 31 日到 2014 年 4 月 30 日,拍拍貸網(wǎng)站成交額為 1,579,770 元,純收益 14.12%,投資人數(shù)有 13798 人,借入者數(shù) 11337 人,在中國(guó)眾多網(wǎng)貸平臺(tái)中 較為活躍。本文以拍拍貸作為實(shí)證研究對(duì)象,主要理由如下: 1.該平臺(tái)起步早,網(wǎng)站建立成熟,交易量較大,公布的信息較多,有利于數(shù)據(jù)挖掘和模型建立。 同時(shí)為了保證樣本容量,數(shù)據(jù)釆集的來源應(yīng)比較豐富。 2.拍拍貸平臺(tái)的
11、運(yùn)營(yíng)模式最初主要是效仿 Prosper,即借貸雙方是完全自主交易的,有利于研 究網(wǎng)絡(luò)借貸存在的客觀規(guī)律,與國(guó)外學(xué)者的研究結(jié)論更有可比性。 3.拍拍貸的服務(wù)對(duì)象覆蓋了全國(guó)大部分省市的小微企業(yè)主和普通個(gè)人,不局限于特定的地區(qū), 這樣得到的樣本數(shù)據(jù)更全面更有代表性。 3.2 數(shù)據(jù)搜集與變量選取 為確保實(shí)證分析的有效性和時(shí)效性,我們用 C+編寫的代碼從拍拍貸平臺(tái) 2014 年 4 月中隨機(jī) 抓取了的 10520 筆交易的數(shù)據(jù),在剔除有誤數(shù)據(jù)和不完整數(shù)據(jù)后,共得到 10208 個(gè)研究樣本。 我們將在網(wǎng)站上所獲取的 14 個(gè)變量總結(jié)為五個(gè)維度進(jìn)行研究,如表 1 所示: 表 1 變量列表自變量因變量標(biāo)的特征
12、擔(dān)保特征個(gè)人特征信用特征歷史信息特征(Loan)(Warrant)(Person)(Credit)(History)是否滿標(biāo)借款原因*(L1)審錯(cuò)就賠標(biāo)性別*(P1)借入信用(C1)成功次數(shù)(H1)(W1)金額(L2)安全標(biāo)(W2)年齡*(P2)借出信用(C2)流標(biāo)次數(shù)(H2)是否借款成功利率(L3)非提現(xiàn)標(biāo)(W3)職業(yè)*(P3)期限(L4)注:1)*代表分類變量。2)部分文獻(xiàn)研究了社區(qū)和邀請(qǐng)?jiān)u價(jià),但本文研究期間,該功能已停 用,同時(shí)社區(qū)得分在本文所選擇數(shù)據(jù)中均為 0 分,因此不作研究。 31.標(biāo)的特征 借款原因:分類變量。在許多研究中并沒有研究借款原因的影響,原因在于很難對(duì)其進(jìn)行統(tǒng)計(jì) 和處理
13、。但通過所抓取的數(shù)據(jù)分析中可以得知,絕大多數(shù)借入者會(huì)在借款原因中表明標(biāo)簽,本文選 取含有標(biāo)簽的數(shù)據(jù)并把其作為分類變量進(jìn)行討論。 金額、利率、期限:均為數(shù)值型變量。表明借款的額度、還款利率和還款期限。 2.擔(dān)保特征 審錯(cuò)就賠標(biāo):虛擬變量。即在審核中如果出現(xiàn)過失或錯(cuò)誤,由拍拍貸或第三方提供相應(yīng)的賠付 服務(wù)。 安全標(biāo):虛擬變量。即借入者用自己的應(yīng)收賬款來給自己進(jìn)行擔(dān)保。 非提現(xiàn)標(biāo):虛擬變量。即借入者選擇不提現(xiàn)至銀行卡,在拍拍貸站內(nèi)進(jìn)行周轉(zhuǎn)。 以上三種都不同程度的通過抵押或擔(dān)保的形式降低了信用風(fēng)險(xiǎn)。 3.個(gè)人特征 性別、年齡、職業(yè):均為分類變量。其中年齡為有序變量,其余均為無序變量。在拍拍貸網(wǎng)站 的用
14、戶注冊(cè)信息中,后兩者均有其余均有固定選項(xiàng),具體分類說明如表 2 所示。 表 2 各分類變量水平變量名稱借款原因身份年齡分類實(shí)體經(jīng)營(yíng)工薪族20-25 歲網(wǎng)貸體驗(yàn)私營(yíng)業(yè)主26-31 歲個(gè)人消費(fèi)網(wǎng)店賣家32-38 歲網(wǎng)商經(jīng)營(yíng)學(xué)生大于 39 歲累積信用其他其他 4.信用特征。 借入信用:數(shù)值型變量。由認(rèn)證得分以及還款歷史得分構(gòu)成,可以衡量用戶的借款信用。 借出信用:數(shù)值型變量。由認(rèn)證得分以及投資歷史得分構(gòu)成,可以衡量用戶在拍拍貸平臺(tái)上的 1投資表現(xiàn)。 1拍貸信用等級(jí)劃分就是根據(jù)借入信用的分?jǐn)?shù)而確定的,A 為最高等級(jí),HR 為最低等級(jí)。詳細(xì) 見表 3。 表 3 拍拍貸用戶信用等級(jí)劃分分?jǐn)?shù)區(qū)間0-2526
15、-5051-75 76-100101-125126-150等級(jí)HREDCBA5.歷史信息特征 成功次數(shù)、流標(biāo)次數(shù):數(shù)值型變量。分別為該用戶在拍拍貸平臺(tái)歷史借款成功、失敗次數(shù)。 6. 因變量 是否滿標(biāo):二分型變量。滿標(biāo)意為借入者發(fā)布的借款在規(guī)定時(shí)間內(nèi)額度被滿足。在網(wǎng)頁(yè)中表現(xiàn) 為借款進(jìn)度達(dá)到 100%。 是否成功:二分型變量。該筆借款若成功會(huì)在借款 ID 的頁(yè)面上表示為“借款已成功”。但由 于成功的判定條件與網(wǎng)站線下審核制度相關(guān),故不作為研究重點(diǎn),只進(jìn)行定性分析。 3.3 定性分析 (1)描述性分析 表 4 變量列表 4變量滿標(biāo)未滿標(biāo)合計(jì)最小值最大值均值最大值最小值均值均方差金額(元)100035
16、00004910.371000143003007.047778.803標(biāo)的特征利率0.080.240.160.240.080.14.03690期限(月)2128.8831210.312.686審錯(cuò)就賠標(biāo)010.44010.00.351擔(dān)保特征安全標(biāo)010.09010.00.165非提現(xiàn)標(biāo)010.09010.00.165信用特征借入信用1014228.73109515.1413.305借出信用1066310798.4810770317.842676.824歷史信息成功次數(shù)05386.350220.0716.495特征流標(biāo)次數(shù)015990161.621.416有效項(xiàng)3286(32.19%)6922
17、(67.81%)10208在我們的統(tǒng)計(jì)數(shù)據(jù)中,3286 筆滿標(biāo)借款中只有 2231 筆借款成功,只有 67.89%的滿標(biāo)借款成 功借款。 1.性別:在選取的 10208 個(gè)樣本中,男性共 8874 名,占總借入者的 86.93。女性 1334 名, 占總借入者的 13.07??梢钥闯瞿行越枞胝哌h(yuǎn)多與女性借入者。在建立模型時(shí),對(duì)男性賦值為 1, 女性賦值為 0。 2.年齡段:借入者年齡段在拍拍貸上被分為 4 類:20-25 歲,26-31 歲,32-38 歲,大于 39 歲。 人數(shù)分別為 3845 人,3658 人,1868 人,837 人;分別占總?cè)藬?shù)的 37.67%,35.83%,18.30
18、%,8.20%。 樣本中 70%以上的用戶,年齡都在 31 歲以下,說明 P2P 借貸對(duì)象較年輕化。在金融投資理論中, 通過許多實(shí)證研究,認(rèn)為個(gè)人的風(fēng)險(xiǎn)傾向以及經(jīng)濟(jì)狀況隨著年齡的變化而不同,信任度也隨年齡的 增加而增加,屬于常見的借出者認(rèn)知。 3.職業(yè):在選取的 10208 個(gè)樣本中,工薪族 5819 人,占 57.00%;私營(yíng)業(yè)主 2052 人,占 20.10%; 學(xué)生 449 人,占 4.40%;網(wǎng)店賣家 443 占 4.34%;其他 1445 人,占 14.16%??梢钥闯龀^一半的 借入者身份都是工薪族,從某種程度上說明工薪族因個(gè)人原因的借款需求較大。 4.借款原因:個(gè)人消費(fèi) 2981
19、 人,占 29.20%;實(shí)體經(jīng)營(yíng) 2064 人,占 20.22%;累積信用 1133 人, 占 11.10%;網(wǎng)貸體驗(yàn) 887 人,占 8.69%;網(wǎng)商經(jīng)營(yíng) 549 人,占 5.38%;其他 2596 人,占 25.43%。 從數(shù)據(jù)中可以看出借入者的借款主要用于個(gè)人消費(fèi),其次是用于經(jīng)營(yíng)。 (2)多元對(duì)應(yīng)分析 對(duì)應(yīng)分析(Correspondence analysis),又稱關(guān)聯(lián)分析或 R-Q 型因子分析,是指通過分析由定性變 量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系的一種分析方法,用來揭示同一變量的各個(gè)類別之間的差 異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系。 對(duì)應(yīng)分析法的處理過程由相關(guān)系數(shù)表格和關(guān)聯(lián)圖
20、兩部分組成。其中,表格是一個(gè)二維的表格, 由行和列組成。行代表事物的屬性,依次排開。列代表不同的事物本身,由樣本集合構(gòu)成,排列順 序無特別要求。關(guān)聯(lián)圖中各個(gè)樣本都濃縮為一個(gè)點(diǎn)集合,而樣本的屬性變量同樣也是以點(diǎn)集合的形 式顯示在圖上。 5借款失敗 未滿標(biāo) 滿標(biāo) E 借款成功 圖 2. 多元對(duì)應(yīng)分析聯(lián)合圖 圖 3. 主要辨別度量 多元對(duì)應(yīng)分析的優(yōu)勢(shì)在于可以同時(shí)分析多個(gè)分類變量之間的關(guān)系,并對(duì)無序多分類變量、有序 多分類變量同時(shí)進(jìn)行分析,尤其是當(dāng)變量個(gè)數(shù)越多,各個(gè)變量取值越多時(shí),對(duì)應(yīng)分析的優(yōu)勢(shì)就越加 明顯。因此為了探究分類變量與是否滿標(biāo)以及是否借款成功之間的影響,我們采用多元對(duì)應(yīng)分析進(jìn) 行。 (1)
21、總體分析: 從圖可看出,“是否滿標(biāo)”的區(qū)分度量主要關(guān)注維度 1,而“是否成功”則主要關(guān)注維度 2。“等 級(jí)”、“年齡段”從維度 2 可初步判斷存在顯著性差異,“借款原因”、“身份”綜合關(guān)注維度 1、2 亦存在顯著性差異,而“性別”間無明顯差異。 6(2)坐標(biāo)軸定義和象限分析:可定義橫軸為“是否滿標(biāo)”,關(guān)注對(duì)象越靠近正方向即認(rèn)為與“已 滿標(biāo)”相關(guān)性更高,負(fù)方向反之;縱軸則為“是否成功”,與橫軸同理。由此,落在第一象限的即 表示已滿標(biāo)但借款失敗,而第四象限則為已滿標(biāo)且借款成功,第二三象限即表示未滿標(biāo)項(xiàng)。 (3)基本特征分析: 身份及借款原因:結(jié)合身份與借款原因,可看出用于個(gè)人消費(fèi)、網(wǎng)貸體驗(yàn)、累積信
22、用的工薪族 較易滿標(biāo),但用于實(shí)體經(jīng)營(yíng)、網(wǎng)商經(jīng)營(yíng)的網(wǎng)店賣家、私營(yíng)業(yè)主則較難滿標(biāo)。值得注意的是,盡管工 薪族滿標(biāo)率高,但其借款成功率并不高;而滿標(biāo)率較低的私營(yíng)業(yè)主卻擁有很高的借款成功率等。 年齡段:20-25 歲的用戶最不受借出者信任。 等級(jí):最靠近中心的 HR 等級(jí)用戶最不易識(shí)別,因此被投標(biāo)、借款的成功率最低,可大體看出 等級(jí)越高越易滿標(biāo)、完成借款。(A、B 等級(jí)樣本比重過小可忽略不計(jì)) (4)人群特征劃分: 為信用累積的 E 及以上等級(jí)用戶更容易通過網(wǎng)站核查成功借款,而為滿足網(wǎng)貸體驗(yàn)、個(gè)人消 費(fèi)的 20-25 歲 HR 等級(jí)用戶則很難完成借款;用于個(gè)人消費(fèi)、網(wǎng)貸體驗(yàn)的工薪族最受借出者信任, 達(dá)
23、到滿標(biāo)幾率最高,然而通過網(wǎng)站核查成功借款的幾率較低;相反的,為網(wǎng)店經(jīng)營(yíng)而借款的網(wǎng)店賣 主、為實(shí)體經(jīng)營(yíng)的私營(yíng)業(yè)主雖受信任度不高,但一旦滿標(biāo)后成功借款的概率卻較工薪族高出許多。 表 5 已轉(zhuǎn)換變量的相關(guān)系數(shù)維數(shù):1性別年齡段是否身份是否等級(jí)借款成功滿標(biāo)原因性別1.000.036.007.021.015.035.024年齡段.0361.000-.081.065.042-.025.080是否成功a.007-.0811.000-.011.019.441-.019身份.021.065-.0111.000.706.047.318是否滿標(biāo).015.042.019.7061.000.042.189等級(jí).035-
24、.025.441.047.0421.000.056借款原因.024.080-.019.318.189.0561.000維數(shù)1234567特征值b2.9692.3111.9991.691.976.693.360a. 使用已量化的變量模式對(duì)缺失值進(jìn)行歸因。 b. 使用變量權(quán)重對(duì)相關(guān)矩陣的特征值進(jìn)行加權(quán)。4 基于二元 logistic 回歸的滿標(biāo)預(yù)測(cè)模型借入者決策模型 從借入者的視角來說,如何使自己成功借款是其在網(wǎng)絡(luò)借貸中關(guān)注的重點(diǎn)。而借款成功的基礎(chǔ) 就是得到借出者的關(guān)注和響應(yīng)進(jìn)而達(dá)到滿標(biāo)。因此本文基于樣本數(shù)據(jù)進(jìn)行回歸分析,以期找到對(duì)影 響借出者投資意愿的因素,并建立回歸模型幫助借入者進(jìn)行滿標(biāo)預(yù)測(cè)。
25、 4.1 模型選取 研究所選取的因變量為是否滿標(biāo),為二分類變量。在建立回歸模型時(shí),由于目標(biāo)概率的取值 在0,1之間,而因變量取值落在實(shí)數(shù)集中,而導(dǎo)致一般的回歸方法無法接受。為了使回歸能夠順利 實(shí)現(xiàn),因此可以先將目標(biāo)概率做 logit 變換,使其取值區(qū)間變?yōu)檎麄€(gè)實(shí)數(shù)集,進(jìn)而進(jìn)行回歸,即二 元 logistic 回歸。其線性表示形式如下: 其中, 代表在第 個(gè)觀測(cè)中事件發(fā)生的概率,為在第 個(gè)觀測(cè)中不發(fā)生的概率,均為自變量 7 所構(gòu)成的非線性函數(shù),兩者之比成為事件的發(fā)生比。 4.2 相關(guān)性檢驗(yàn) 由于上文對(duì)于分類型變量已做出定性分析,所以回歸模型主要針對(duì)于除去分類變量的其余變量 進(jìn)行定量分析。為了篩選
26、自變量,我們需要進(jìn)行自變量之間進(jìn)行相關(guān)性檢驗(yàn)。在多元回歸中,若自 變量出現(xiàn)多重共線性,會(huì)導(dǎo)致增加或減少一個(gè)變量對(duì)回歸系數(shù)影響很大,回歸結(jié)果極不穩(wěn)定。若多 重共線性現(xiàn)象嚴(yán)重,很容易導(dǎo)致錯(cuò)誤的結(jié)論,因此應(yīng)進(jìn)行相關(guān)性檢驗(yàn),從有問題的變量中刪除不重 要的變量。 對(duì)于數(shù)值型變量,我們采用 Pearson 系數(shù)進(jìn)行檢驗(yàn),對(duì)于相關(guān)系數(shù)在 0.9 以上的變量應(yīng)予以處 理。相關(guān)系數(shù)表如下: 表 6 相關(guān)系數(shù)表Pearson 相關(guān)金額非提安全標(biāo)審錯(cuò)年利率期限成功數(shù)流標(biāo)數(shù)借入借出性現(xiàn)標(biāo)就賠標(biāo)信用信用金額1非提現(xiàn)標(biāo).0541安全標(biāo).060.9371審錯(cuò)就賠標(biāo)-.005-.056-.0701年利率-.003-.280-
27、.300-.1761期限-.095-.223-.221-.069-.0521成功數(shù).065.520.533-.003-.152-.1141流標(biāo)數(shù)-.042-.138-.146-.225.211.032-.0701借入信用.178.083.072.330.136-.244.145.2501借出信用.048.481.535-.032-.160-.082.834-.070.1191從相關(guān)系數(shù)表可以得知,非提現(xiàn)標(biāo)與安全標(biāo)的相關(guān)系數(shù)為 0.937,這可能由于拍拍貸網(wǎng)站 的應(yīng)收款安全標(biāo)和非提現(xiàn)標(biāo)均是將資金放在在站內(nèi)進(jìn)行周轉(zhuǎn)的,因此絕大多數(shù)狀況下是同時(shí) 認(rèn)證的,這也是在貸款原因中時(shí)常出現(xiàn)“安非標(biāo)”的原因。如
28、果這兩個(gè)擔(dān)保變量同時(shí)進(jìn)入回 歸方程易出現(xiàn)多重共線性問題,通過對(duì)網(wǎng)站擔(dān)保機(jī)制的分析,安全標(biāo)對(duì)于標(biāo)的的擔(dān)保性更強(qiáng), 故刪除非提現(xiàn)標(biāo)擔(dān)保變量。 4.3 模型構(gòu)建 由表 3 可以看出金額與借出信用的均方差非常大,為了消除回歸中可能出現(xiàn)的異方差,故對(duì)這 兩個(gè)變量做對(duì)數(shù)處理后再進(jìn)入回歸。另外,為了使 SPSS19.0 輸出的 Exp(B)有意義,我們將利率擴(kuò) 大 100 倍,也即是其變動(dòng)一個(gè)單位代表增長(zhǎng)或減少一個(gè)百分點(diǎn),符合實(shí)際意義。 回歸結(jié)果最終有 7 個(gè)自變量進(jìn)入回歸方程,Cox & Snell R 方和 Nagelkerke R 方取值分別為 0.643 和 0.902,也即是因變量是否滿標(biāo)
29、的 90.2%都可以由自變量解釋,從這一點(diǎn)看回歸方程的擬合 效果很好。 8表 7 R2 檢驗(yàn)值步驟-2 對(duì)數(shù)似然值Cox & Snell R 方Nagelkerke R 方16360.061.303.42524507.579.462.64832604.013.588.82442254.217.607.85152017.129.620.86961595.889.642.90071567.751.643.902在回歸過程中,建立了一個(gè)服從參數(shù)為 0.7 的伯努利分布的隨機(jī)變量 validate 作為選擇變量, 模型建立過程中只選用 validate=1 的變量,而其余用作預(yù)測(cè)和驗(yàn)證,結(jié)果顯
30、示在預(yù)測(cè)分類表格中。 預(yù)測(cè)概率以 0.5 為分界,若大于 0.5 則判斷為滿標(biāo),若小于 0.5 則判斷為不能滿標(biāo)。在最終模型中, 建模所用的 7164 個(gè)用戶綜合判斷正確率達(dá)到 96%。而對(duì)驗(yàn)證所用的 3044 個(gè)用戶的綜合判斷正確 率也達(dá)到 95.5%,說明模型的預(yù)測(cè)效果很好,尤其是對(duì)滿標(biāo)用戶的預(yù)測(cè)。 表 8 預(yù)測(cè)分類結(jié)果已預(yù)測(cè)選定案例 a未選定的案例 b,c是否滿標(biāo)是否滿標(biāo)已觀測(cè)百分比校正百分比校正0101是否滿標(biāo) 0467321995.519349695.3165 220797.14197396.0總計(jì)百分比96.095.5由系數(shù)表可以看出最終的回歸預(yù)測(cè)模型為 表 9 回歸系數(shù)表BS.E
31、,WalsdfSig.Exp (B)安全標(biāo)9.269.740157.0151.00010608.880ln 金額1.354.24530.6701.0003.875借入信用.074.00895.5371.0001.077成功數(shù).262.06615.6201.0001.299流標(biāo)數(shù)-.817.049282.5911.000.442審錯(cuò)就賠標(biāo)8.391.366526.4941.0004407.640年利率.730.026813.6771.0002.074常量-25.9082.120149.3211.000.000從回歸結(jié)果可知,期限與借出信用與是否滿標(biāo)相關(guān)性不大,故沒有進(jìn)入最后的回歸模型。其余 9變
32、量 wald 統(tǒng)計(jì)量伴隨的 p 值均小于 0.05,表明參數(shù)的估計(jì)值顯著的不為 0。Exp(B)列表明自變量 變動(dòng)一個(gè)單位而引起的事件發(fā)生比的變化率,通過該列數(shù)值可以看出擔(dān)保對(duì)于滿標(biāo)的影響程度非常 大。而在除擔(dān)保外的變量中,年利率變動(dòng)對(duì)滿標(biāo)概率的影響非常明顯。金額由于做了對(duì)數(shù)處理,故 相對(duì)來說金額的小幅變動(dòng)對(duì)滿標(biāo)概率影響不大。 4.4 結(jié)果分析 在標(biāo)的變量中,金額對(duì)是否滿標(biāo)有正向影響,但小幅變動(dòng)對(duì)其影響不大,原因在于借款金額大 說明了借入者的信用額度高,容易獲得投資人的信任;而對(duì)于 P2P 網(wǎng)貸平臺(tái)來說,為了分散風(fēng)險(xiǎn), 通常只進(jìn)行小額投資,因此金額的多少對(duì)與借出者并無太大影響。年利率影響較大,
33、投資行為最主 要的動(dòng)機(jī)就是獲得良好收益,因此這符合實(shí)際認(rèn)知。期限對(duì)是否滿標(biāo)影響不大,原因可能在于拍拍 貸網(wǎng)站限定還款期限均不超過一年,同時(shí)期限長(zhǎng)代表利息高,而期限短使得資金流動(dòng)快,各有優(yōu)勢(shì), 因此綜合起來影響不大 在擔(dān)保變量中,安全標(biāo)與審錯(cuò)就賠標(biāo)均對(duì)是否滿標(biāo)有較大影響,說明該種形式的擔(dān)??梢越档?信用風(fēng)險(xiǎn),對(duì)投資人有較大的吸引力。通過對(duì)樣本的統(tǒng)計(jì)顯示,安全標(biāo)中有 98.6%、審錯(cuò)就賠標(biāo)中 有 98.9%的借款均達(dá)到滿標(biāo)。 在歷史變量中,成功數(shù)正向影響是否滿標(biāo),而流標(biāo)數(shù)對(duì)借款是否能完成的影響為負(fù),這種現(xiàn)象 可以由馬太效應(yīng)解釋,即成功次數(shù)越多的人越容易成功,反之失敗次數(shù)越多則越容易失敗。另外, 一
34、次成功借款的影響要大于一次流標(biāo)的影響。因此,為了盡量避免流標(biāo)的出現(xiàn)同時(shí)盡可能促成成功 借款,本文所提出的滿標(biāo)預(yù)測(cè)模型可以為借入者提供較為可靠的參考。 在信用變量中,借入信用對(duì)是否滿標(biāo)正向影響。由于借入信用是借出者對(duì)借入者的最直接的判 別依據(jù),尤其是對(duì)沒有歷史信息的借款用戶,因此借款者應(yīng)盡量完成認(rèn)證以便獲得借出者信任。而 借出信用主要代表投資上的表現(xiàn),因此影響不大。 4.5 對(duì)借入者的決策建議 借入者可以使用本文提出的回歸模型進(jìn)行滿標(biāo)預(yù)測(cè),并針對(duì)自己可以變動(dòng)的信息進(jìn)行調(diào)整以最 小的成本達(dá)到滿標(biāo)的目的。舉例說明,一個(gè)新注冊(cè)的拍拍貸用戶,沒有借款歷史,不能得到擔(dān)保, 基礎(chǔ)信用分是 10 分,第一次發(fā)
35、布的借款金額規(guī)定為 3000 元,利率在 13%到 22%之間。為達(dá)到滿 標(biāo)目標(biāo),若該用戶不希望過多透露個(gè)人信息,那么最低可以將利率定為 20%;若該用戶不希望承 受過大的還款壓力,那么可以完成全部認(rèn)證使信用分達(dá)到 38 分,從而享受 17%的利率。若沒有明 顯偏好也可以綜合考慮。 5 借入者信用的判別分類模型借出者決策模型 5.1 研究目的與研究方法 信用等級(jí)把借入者劃分成六種類型,是基于認(rèn)證項(xiàng)目和歷史記錄的分類方法,但是這種劃分方 式未必能動(dòng)態(tài)的反應(yīng)出用戶的借款活動(dòng)情況。通過觀察平臺(tái)上的借入者可以發(fā)現(xiàn),有一些借入者雖 然是同樣信用等級(jí),但是活動(dòng)模式卻有較大差別。因?yàn)樾庞玫燃?jí)相同的人并一定是
36、同質(zhì)的,比如信 用等級(jí)低的并非全是低質(zhì)量的借入者,而有很大部分是“年輕”的、交易次數(shù)少導(dǎo)致等級(jí)低的新用 戶。因此,對(duì)借入者進(jìn)行判別分析的主要目的是:找出“信用等級(jí)”這一標(biāo)識(shí)所不能合理歸類的用 戶,并對(duì)其重新歸類,能幫助借出者更好地識(shí)別出同等級(jí)內(nèi)的“好用戶”。 考慮到拍拍貸現(xiàn)有用戶等級(jí)劃分依據(jù)較合理,因此在一定程度上遵循現(xiàn)有等級(jí)劃分制度框架, 但對(duì)占總數(shù) 70%的高風(fēng)險(xiǎn)(High Risk,即 HR 級(jí))用戶進(jìn)行重新定義,以選出 HR 級(jí)中表現(xiàn)活躍、 成長(zhǎng)潛力大、信用狀況較好的新用戶,增大 HR 級(jí)類別內(nèi)用戶信用情況的差異性,使其具有更強(qiáng)的 識(shí)別度。 研究方法選擇判別分析法,以較高等級(jí)用戶及典型
37、高風(fēng)險(xiǎn)用戶作為已知分類的數(shù)據(jù)集,將現(xiàn)有 分類規(guī)則下 HR 級(jí)用戶作為未知分類數(shù)據(jù),對(duì)高風(fēng)險(xiǎn)用戶進(jìn)行重新分類。 105.2 模型構(gòu)建 (1)預(yù)測(cè)變量選擇 為考量借入者的信用分類情況,選取與借入信用取值相關(guān)的以下變量集作為預(yù)測(cè)變量組合:總 標(biāo)數(shù)、成功數(shù)、流標(biāo)數(shù)、全額還清次數(shù);身份認(rèn)證、視頻認(rèn)證、學(xué)歷認(rèn)證、手機(jī)認(rèn)證、網(wǎng)銀認(rèn)證、 資料得分等 10 項(xiàng)。因分析對(duì)象為借款需求用戶,因此不予考慮其借出信用。 (2)驗(yàn)證樣本已知分類樣本集 表 10 已知樣本分類集分類優(yōu)質(zhì)良好尚可高風(fēng)險(xiǎn)享有極高的受信任含義程度,為同標(biāo)的下享有較高的受信任受信任程度一般受信任程度最低,為同標(biāo)的下借出者首要考慮的程度借出者基本不予
38、考慮的對(duì)象。對(duì)象拍拍貸 HR 級(jí)用戶篩選產(chǎn)生:拍拍貸 A/B/C 級(jí)用成功數(shù)=0樣本組成拍拍貸 D 級(jí)用戶拍拍貸 E 級(jí)用戶全額還款次數(shù)=0戶流標(biāo)數(shù)3資料與認(rèn)證得分總和15樣本容量852512149338(3)分析樣本待分類樣本集 人為剔除現(xiàn)有分類規(guī)則下 HR 級(jí)中可識(shí)別的高風(fēng)險(xiǎn)用戶(共 338 人次),其余 HR 級(jí)用戶信息 作為未知分類數(shù)據(jù),樣本容量為 7385。 5.3 結(jié)果分析 (1)基本統(tǒng)計(jì)信息 觀察組統(tǒng)計(jì)量數(shù)據(jù)可發(fā)現(xiàn),各類別中身份認(rèn)證標(biāo)準(zhǔn)差均為 0,即組內(nèi)身份認(rèn)證無差別;而在優(yōu) 質(zhì)、良好分類中網(wǎng)銀認(rèn)證標(biāo)準(zhǔn)差為 0,在尚可、高風(fēng)險(xiǎn)分類中卻存在明顯標(biāo)準(zhǔn)差值,即初步可判別 好用戶一特征即通過了網(wǎng)銀認(rèn)證。 (2)協(xié)方差矩陣的均等性的箱式檢驗(yàn)(Boxs M) 根據(jù) Boxs M 檢驗(yàn)結(jié)果,推斷不能拒絕接受各類協(xié)方差矩陣相等的零假設(shè),說明使用組內(nèi)協(xié)方 差陣進(jìn)行計(jì)算是合適的。 (3)變量篩選 觀察輸入變量的顯著性水平,除“身份認(rèn)證”外的其他變量的 WilksLambda 檢驗(yàn)都很顯著, 說明這些變量對(duì)正確判別分類具有顯著的作用。而“身份認(rèn)證”在“不在分析的變量”表中被篩選 出,考慮到現(xiàn)實(shí)中進(jìn)行交易的用戶必須完成身份認(rèn)證的交易規(guī)則,該變量不具組內(nèi)、組間差異性, 因此其剔除符合現(xiàn)實(shí)情況。 (4)判別函數(shù)檢驗(yàn) 表 11 已知樣本分類集正則相關(guān)函數(shù)特征值方差的 %累積 %性
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 出差安裝監(jiān)控合同范例
- 動(dòng)漫版權(quán)合作合同范本
- 農(nóng)民房買房合同范本
- 出租合同范例居間方
- 個(gè)人電纜銷售合同范本
- 關(guān)于稅費(fèi)附加協(xié)議合同范例
- 內(nèi)簽勞動(dòng)合同范例
- 三個(gè)合伙購(gòu)房合同范本
- 買賣民房合同范例
- 個(gè)人借款購(gòu)房合同范例
- 課題申報(bào)參考:生活服務(wù)數(shù)字化轉(zhuǎn)型下社區(qū)生活圈建設(shè)理念、模式與路徑研究
- DCMM練習(xí)題練習(xí)試題
- 《工業(yè)化建筑施工階段碳排放計(jì)算標(biāo)準(zhǔn)》
- 廢舊保溫棉處置合同范例
- 2024年數(shù)據(jù)編織價(jià)值評(píng)估指南白皮書-Aloudata
- 托育園老師培訓(xùn)
- 人教版八年級(jí)英語(yǔ)上冊(cè)Unit1-10完形填空閱讀理解專項(xiàng)訓(xùn)練
- 脊柱外科護(hù)理進(jìn)修心得
- FCI測(cè)試試題附答案
- 新編《公路隧道養(yǎng)護(hù)技術(shù)規(guī)范》解讀課件
- 違紀(jì)行為處罰確認(rèn)單
評(píng)論
0/150
提交評(píng)論