銀行客戶數(shù)據(jù)解析_第1頁
銀行客戶數(shù)據(jù)解析_第2頁
銀行客戶數(shù)據(jù)解析_第3頁
銀行客戶數(shù)據(jù)解析_第4頁
銀行客戶數(shù)據(jù)解析_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1銀行客戶數(shù)據(jù)分析2007-09-012背景數(shù)據(jù)客戶群服務(wù)盈利商業(yè)銀行擁有大量的個(gè)人客戶交易數(shù)據(jù)、個(gè)人客戶服務(wù)數(shù)據(jù)和個(gè)人客戶基本資料數(shù)據(jù)。在這些海量數(shù)據(jù)中,隱藏著大量的有價(jià)值的客戶信息。運(yùn)用數(shù)據(jù)挖掘中的聚類分析技術(shù)可以從這些數(shù)據(jù)集中提取客戶的分類知識(shí)。聚類分析技術(shù)可以將性質(zhì)、特征近似的數(shù)據(jù)對(duì)象歸屬在相同的群集中。商業(yè)銀行可以利用此技術(shù)分辨出能有效為之服務(wù)的最有價(jià)值的客戶,為他們提供更為個(gè)性化的服務(wù),從而影響相關(guān)的客戶行為并最終達(dá)到提高盈利的目的。3數(shù)據(jù)集客戶數(shù)據(jù)集包含10,000條客戶數(shù)據(jù)包含有31個(gè)特征(屬性),

分別為:BankNo(銀行代碼,其值有:004,024,077等)Accountnum(賬戶代碼)ShortName(客戶名字)FirstContactDate(第一次接觸日期)accountopendate(賬戶開戶日期)accountbalance(賬戶當(dāng)前余額)accountlowbalance(賬戶曾經(jīng)最低余額)accounthighbalance(賬戶曾經(jīng)最高余額)balancecategory(余額類型)StatementLowBalance(最低交易賬目,有正有負(fù))4數(shù)據(jù)集(屬性)StatementHighBalance(最高交易賬目)StatementAggregateDebitBalance(聚集透支賬目)StatementAggregateDebitDay(透支賬目的天數(shù))StatementAggregateCreditBalance(聚集存款賬目)StatementAggregateCreditDay(存款賬目的開數(shù))ReturnCheckCount(退回支票的次數(shù))Status(客戶狀態(tài))AuditGranding(授權(quán)級(jí)別,越高則風(fēng)險(xiǎn)越低)SalaryBeforeLastMonth(上一個(gè)月之前自動(dòng)付款的賬目)SalarylastMonth(上一個(gè)月自動(dòng)付款的賬目)SalarythisMonth(這一個(gè)月自動(dòng)付款的賬目)CountofCreditthisMonth(這個(gè)月存款的次數(shù))5數(shù)據(jù)集(屬性)CountofDebitthisMonth(這個(gè)月取款的次數(shù))CountofOD(透支的次數(shù))AmountofDepositthisMonth(本月存款的賬目)AmountofWithdrawthisMonth(本月取款的賬目)LastTransactionDate(上一次交易的日期)CountryCode(客戶所屬的國(guó)家)Birthday(生日)Sex(性別)

6數(shù)據(jù)預(yù)處理我們選用Weka數(shù)據(jù)挖掘工具來對(duì)客戶的賬戶數(shù)據(jù)進(jìn)行分析,因此所有的原始數(shù)據(jù)都必須轉(zhuǎn)換成能被Weka處理的數(shù)據(jù)集格式。

原始數(shù)據(jù)集的特征主要有四種類型的,分別是:數(shù)值型(numeric)、標(biāo)稱型(nominal)、日期型(date)和字符串型(string)。

對(duì)于缺失的屬性值,因?yàn)閃eka中的算法能自動(dòng)處理屬性值缺失的情況,所以按Weka數(shù)據(jù)集的格式要求用“?”表示。

7數(shù)據(jù)預(yù)處理(規(guī)格化)數(shù)值型特征:采用如下公式規(guī)格化到[0,1]區(qū)間

標(biāo)稱型特征、日期型特征和字符串型特征保持不變

8聚類分析目標(biāo)我們的目的是對(duì)客戶進(jìn)行分群,從而使銀行可以對(duì)不同群體的客戶提供不同的服務(wù)。因此聚類分析是對(duì)客戶進(jìn)行自動(dòng)分群的有效方法。方法k-means算法選取的特征從31個(gè)原始屬性值中選取23個(gè)屬性用作聚類(都是數(shù)值型或標(biāo)稱型的)聚類參數(shù)在經(jīng)過規(guī)格化處理后的數(shù)據(jù)集中,用k-means算法在選定的23個(gè)屬性上進(jìn)行聚類,設(shè)定聚類數(shù)為10.

9各聚類大小各聚類所包含的客戶數(shù)量如下表聚類客戶數(shù)量聚類1145聚類269聚類3133聚類46183聚類51985聚類6213聚類746聚類8446聚類9413聚類10368表110對(duì)聚類大小的分析 由表1可知,各聚類有大有小,且大小懸殊,但也合乎客戶關(guān)系處理的目的??蛻絷P(guān)系管理的往往是找出一小部分的特殊客戶(占20%左右)來進(jìn)行特別地對(duì)待。在上表所示的10個(gè)聚類中,除去最大的聚類4后其余9個(gè)聚類的客戶數(shù)達(dá)38一八人,占總客戶量的38.18%;除去最大的兩個(gè)聚類(聚類4和聚類5)后其余8個(gè)聚類的客戶數(shù)達(dá)1833人,占總客戶量的18.33%.

大聚類可以再繼續(xù)細(xì)分(作為一個(gè)數(shù)據(jù)集再繼續(xù)進(jìn)行聚類操作,或直接提高聚類個(gè)數(shù))11對(duì)各聚類類結(jié)果的的處理聚類后的的各聚類類結(jié)果的的數(shù)據(jù)是是規(guī)格化化處理后后的數(shù)據(jù)據(jù)的結(jié)果果,我們們要直觀觀地分析析各聚類類的特點(diǎn)點(diǎn),必須須把規(guī)格格化的數(shù)數(shù)據(jù)還原原為原始始數(shù)據(jù)。。例如,,最小值值為-10,000,最大值值為1,000,000的當(dāng)前賬賬戶余額額規(guī)格化化為[0,1]后就難以以理解各各賬戶間間存在的的巨大差差距,只只有把它它還原為為原始的的[-10000,1000000]才能使人人直觀地地理解其其存在的的差距。。把各聚類類的數(shù)據(jù)據(jù)集還原原為原始始數(shù)據(jù)后后,再計(jì)計(jì)算各特特征的均均值和標(biāo)標(biāo)準(zhǔn)差((數(shù)值型型的特征征);或或者各標(biāo)標(biāo)稱量的的數(shù)量((標(biāo)稱型型的特征征)。12聚類結(jié)果果分析(賬戶當(dāng)前前余額)下表所示示為10個(gè)聚類中中各聚類類的賬戶戶當(dāng)前余余額的正正負(fù)及賬賬戶當(dāng)前前余額的的均值和和標(biāo)準(zhǔn)差差聚類當(dāng)前余額正負(fù)當(dāng)前余額值+–均值標(biāo)準(zhǔn)差聚類1145024445.5073408.73聚類269029164.4178077.97聚類31330152882.48604633.58聚類4618215571.1723957.76聚類51985022102.6164825.42聚類6119948432.8218680.66聚類74602093.915798.48聚類8380667729.6733233.11聚類90413-24728.6861844.23聚類10368036264.2493389.1413聚類結(jié)果果分析(賬戶當(dāng)前前余額)最明顯的的特殊客客戶群有有兩個(gè):一個(gè)是聚類3的客戶群群,該聚聚類的當(dāng)當(dāng)前余額額均值達(dá)達(dá)十五萬左右,比比其他聚聚類的當(dāng)當(dāng)前余額額均值高高出一個(gè)個(gè)數(shù)量級(jí)級(jí)。所以以可以初初步判斷斷該聚類類的客戶戶是存款款額高或或者說是是高收入的的客戶群群。另外,,該聚類類當(dāng)前余余額的標(biāo)標(biāo)準(zhǔn)差也也很大,,這說明明在富有有的客戶戶群中各各客戶的的收入差差距也是是很大的的,有的的達(dá)百萬萬、千萬萬、甚至至上億.另一個(gè)明明顯的特特殊客戶戶群是聚類9所示的客客戶群。。該客戶戶群中的的4一三個(gè)客客戶當(dāng)前前賬戶余余額都為負(fù)值值,且其均均值達(dá)負(fù)負(fù)兩萬多多元。因因此可以以認(rèn)定該該客戶群群是高透支的的客戶群群。后面還還會(huì)分析析的透支支額、透透支次數(shù)數(shù)、透支支時(shí)間等等屬性的的分析同同樣可以以印證我我們這個(gè)個(gè)結(jié)論.14聚類結(jié)果果分析(賬戶當(dāng)前前余額)分析其他他的八個(gè)個(gè)聚類聚類4是占61.81%的最大的的普通客戶戶群,該客戶戶群中幾幾乎所有有的客戶戶的當(dāng)前前余額都都為正值值,其均均值為五五千多,,標(biāo)準(zhǔn)差差為兩萬萬多不會(huì)會(huì)太小,,說明該該龐大的的客戶群群還是可可以再繼繼續(xù)細(xì)分分的。聚類5是占19.85%的第二大大的客戶戶群,該該客戶群群比最大大的客戶戶群聚類類4來說它的的當(dāng)前余余額均值值高很多多,達(dá)兩兩萬多元元。因此此可以說說聚類5是大量普通通客戶中中的中等等存款額額度的賬賬戶(不包括括低存款款額度的的賬戶))。聚類7是賬戶當(dāng)當(dāng)前余額額為正值值但存款款額度較較低的客客戶群。。聚類1,2,6,8,10這五個(gè)聚聚類在當(dāng)當(dāng)前賬戶戶余額這這一屬性性上不能能發(fā)現(xiàn)其其明顯的的特征,,我們將將在后續(xù)續(xù)的其他他屬性上上的分析析發(fā)現(xiàn)其其聚類特特征。15聚類結(jié)果果分析(最低及最最高交易易賬目)下表所示示為各聚聚類的最最低交易易賬目和和最高交交易賬目目的均值值與標(biāo)準(zhǔn)準(zhǔn)差聚類最低交易賬目最高交易賬目均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類121710.5767398.2930649.7787211.66聚類225422.8071501.1843955.38100110.53聚類3137112.35560335.78180985.33617496.38聚類44664.6621531.078869.5331149.29聚類515040.5349724.5943980.40109262.32聚類6-9205.01915566.6615999.4228870.03聚類71703.675667.1385432.0912143.86聚類8-9331.1732766.5026126.10143537.61聚類9-27823.9464684.33-12265.0633615.10聚類1016948.3454751.5374335.21148054.7316聚類結(jié)果果分析(最低及最最高交易易賬目)明顯聚類類特征:聚類3的最低交易易賬目和最最高交易賬賬目的均值值都最高,,這說明該該類賬戶一一般是有大數(shù)額的資資金流入。聚類9的最低交易易賬目和最最高交易賬賬目的均值值都最小,,屬于透支最多的的一類,這說明該該類賬戶是是屬于透支型的賬賬戶,透支額維維持在一個(gè)個(gè)比較高的的水平,且且其最高交交易額平均均也達(dá)負(fù)一一萬兩千多多,說明這這類型賬戶戶平均很少正向資資金存入。17聚類結(jié)果分析(最低及最高高交易賬目目)聚類4這個(gè)最大的的客戶群的的最低和最最高交易賬賬目的平均均值保持在在一個(gè)中等的水平,最最低四千多多,最高八八千多;第二大客戶戶群聚類5的最低和最最高交易賬賬目的均值值都較聚類類4高很多,這這也同樣能能夠說明聚聚類5是大量的中等偏高的的存儲(chǔ)客戶戶。聚類7的最低和最最高交易賬賬目都較低低(正值)),屬于小額儲(chǔ)蓄客客戶。聚類6和聚類8的最低交易易賬目平均均為負(fù)值((屬于透支支),最高高交易賬目目平均為正正值(屬于于儲(chǔ)蓄),,因此該類類型客戶屬屬于有儲(chǔ)蓄有透透支的信用用消費(fèi)型客客戶。聚類1,2,10在這一屬性性上還不能能分析出很很明顯的聚聚類特征18聚類結(jié)果分析(透支賬目/存款賬目)下表所示為為聚集透支支賬目及透透支賬目天天數(shù)、聚集集存款賬目目及存款賬賬目天數(shù)的的均值和標(biāo)標(biāo)準(zhǔn)差。聚類聚集透支賬目透支賬目天數(shù)聚集存款賬目存款賬目天數(shù)均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類10000621553.941893055.17260聚類20000862332.672188134.51260聚類300003987771.6315631280.74260聚類4000.000.03145729.02582818.6026.000.03聚類50000599440.681531141.41260聚類699402.83202963.8015.644.3966568.08130475.9210.364.39聚類7000075543.65239671.98260聚類817345.0451581.643.632.61170027.62856644.6322.372.61聚類9596935.001384363.1225.391.312744.6715650.270.611.31聚類100000907077.212107278.8026019聚類結(jié)果分析(透支賬目/存款賬目)聚類3的聚集存款款賬目很高高,均值達(dá)三百百多萬,該該類型客戶戶幾乎不透透支,但該該類型客戶戶的聚集存存款賬目的的標(biāo)準(zhǔn)差也奇奇高,達(dá)一千五五百多萬,,這也印證證了前面所所說的高收入群體體中的各個(gè)個(gè)體收入差差距還是很很大的。聚類9是高額度透支支賬戶,聚集透支支賬目均值值接近六十十萬,但聚聚集存款賬賬目均值僅僅有兩千多多,并且其其透支時(shí)間間長(zhǎng),平均均達(dá)二十五五天多。所所以,該類類型賬戶應(yīng)應(yīng)該是長(zhǎng)期處于透透支狀態(tài)。20聚類結(jié)果分析(透支賬目/存款賬目)前面提到,,聚類6和聚類8是有透支有有儲(chǔ)蓄的信用型消費(fèi)費(fèi)客戶,在此也可可以說明問問題。這兩兩個(gè)聚類的的聚集透支支賬目和聚聚集存款賬賬目都有不不小的數(shù)額額,但其不同點(diǎn)點(diǎn)是:聚類6的聚集透支支賬目比聚聚集存款賬賬目要高,,且其透支支時(shí)間長(zhǎng),,說明該賬賬戶是以透支消費(fèi)費(fèi)為目的,,以存款維維持信用消消費(fèi)。聚類8的聚集存款款賬目要遠(yuǎn)遠(yuǎn)高于聚集集透支賬目目,說明該該客戶群以儲(chǔ)蓄為主主,透支消消費(fèi)為次。聚類7是聚集存賬賬目不高的的客戶群,,且其不進(jìn)進(jìn)行透支消消費(fèi)。聚類1,2,5,10在這一屬性性上不能分分析出明顯顯的聚類特特征。21聚類結(jié)果分析(本月存取款款賬目)下表所示為為本月存款次次數(shù)、本月月存款賬目目、本月取取款次數(shù)、、本月取款款賬目的均值與標(biāo)標(biāo)準(zhǔn)差聚類這個(gè)月存款次數(shù)本月存款賬目這個(gè)月取款次數(shù)本月取款賬目均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差均值標(biāo)準(zhǔn)差聚類10.160.443102.7922512.430.682.146525.8838214.38聚類21.521.9514204.9651897.495.646.6720524.6758284.22聚類30.941.1836389.15121866.583.795.0444100.75118407.29聚類40.430.656345.4451757.411.041.406871.6351832.93聚類52.371.4048165.60434339.248.564.6353513.42435119.06聚類62.823.1230468.1953245.3510.889.1331899.8950629.19聚類70.961.865205.3512258.952.615.766791.2613240.96聚類83.322.9847629.30186798.969.108.0349078.89201585.59聚類91.993.2015185.6541397.608.3310.0423149.9866096.16聚類107.184.0799006.39174714.0519.5810.0499224.65169294.6822聚類結(jié)果分析(本月存取款款賬目)聚類1,4,7都屬于存取取款賬目比比較小的賬賬戶類型。。聚類1的取款賬目目是存款賬賬目的2倍;聚類4的存取款賬賬目相當(dāng);;聚類7的取款賬目目略高于存存款賬目。。另外,從本本月的存取取次數(shù)看,,聚類1,4,7的存取次數(shù)數(shù)都很低,,因?yàn)樗麄儌兊拇嫒≠~賬目也低,,可以認(rèn)為為這些類型型的賬戶主主要是資金流動(dòng)很很小的賬戶戶類型(或者說包包含一部分分的睡眠賬戶)。23聚類結(jié)果分析(本月存取款款賬目)聚類2,3,5,6,8,9,10都屬于存取取款賬目較較高的客戶戶類型。其中聚類3,5,6,8的平均存取取款都為三三四萬;聚類2和9平均存款賬賬目一萬多多;平均取取款賬目?jī)蓛扇f多。前面面已已經(jīng)經(jīng)分分析析出出的的聚聚類類3所代代表表的的富富有有人人群群,,其其當(dāng)月月存存取取款款都都在在一一個(gè)個(gè)正正常常的的平平均均水水平平,,不不會(huì)會(huì)太太高高。聚類類10是本月月存存取取款款較較高高的的客客戶戶群群,其存取賬目目幾乎相等,,但其存款次次數(shù)多,取款款次數(shù)也多,,這說明該類類型的賬戶是是資金流入流出出頻繁的賬戶戶類型。24謝謝!9、靜夜夜四無無鄰,,荒居居舊業(yè)業(yè)貧。。。12月月-2212月月-22Saturday,December31,202210、雨中中黃葉葉樹,,燈下下白頭頭人。。。16:06:1416:06:1416:0612/31/20224:06:14PM11、以我獨(dú)獨(dú)沈久,,愧君相相見頻。。。12月-2216:06:1416:06Dec-2231-Dec-2212、故人江海別別,幾度隔山山川。。16:06:1416:06:1416:06Saturday,December31,202213、乍見見翻疑疑夢(mèng),,相悲悲各問問年。。。12月月-2212月月-2216:06:1416:06:14December31,202214、他鄉(xiāng)生生白發(fā),,舊國(guó)見見青山。。。31十十二月20224:06:14下午午16:06:1412月-2215、比不不了得得就不不比,,得不不到的的就不不要。。。。十二月月224:06下下午午12月月-2216:06December31,202216、行動(dòng)動(dòng)出成成果,,工作作出財(cái)財(cái)富。。。2022/12/3116:06:1416:06:1431December202217、做前,能能夠環(huán)視四四周;做時(shí)時(shí),你只能能或者最好好沿著以腳腳為起點(diǎn)的的射線向前前。。4:06:14下下午4:06下下午16:06:1412月-229、沒沒有有失失敗敗,,只只有有暫暫時(shí)時(shí)停停止止成成功功?。?。。12月月-2212月月-22Saturday,December31,202210、很多事情努努力了未必有有結(jié)果,但是是不努力卻什什么改變也沒沒有。。16:06:1416:06:1416:0612/31/20224:06:14PM11、成功功就是是日復(fù)復(fù)一日日那一一點(diǎn)點(diǎn)點(diǎn)小小小努力力的積積累。。。12月月-2216:06:1416:06Dec-2231-Dec-2212、世間間成事事,不不求其其絕對(duì)對(duì)圓滿滿,留留一份份不足足,可可得無無限完完美。。。16:06:1416:06:1416:06Saturday,December31,202213、不知香香積寺,,數(shù)里入入云峰。。。12月-2212月-2216:06:1416:06:14December31,202214、意志堅(jiān)強(qiáng)的的人能把世界界放在手中像像泥塊一樣任任意揉捏。31十二月月20224:06:14下午16:06:1412月-2215、楚塞三湘湘接,荊門門九派通。。。。十二月224:06下下午12月-2216:06December31,202216、少年十五五二十時(shí),,步行奪得得胡馬騎。。。2022

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論