數(shù)據(jù)挖掘商業(yè)案例——金融行業(yè)應(yīng)用_第1頁
數(shù)據(jù)挖掘商業(yè)案例——金融行業(yè)應(yīng)用_第2頁
數(shù)據(jù)挖掘商業(yè)案例——金融行業(yè)應(yīng)用_第3頁
數(shù)據(jù)挖掘商業(yè)案例——金融行業(yè)應(yīng)用_第4頁
數(shù)據(jù)挖掘商業(yè)案例——金融行業(yè)應(yīng)用_第5頁
免費預(yù)覽已結(jié)束,剩余43頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1.前言隨著中國加入WTQ國內(nèi)金融市場正在逐步對外開放,外資金融企業(yè)的進入在帶來先進經(jīng)營理念的同時,無疑也加劇了中國金融市場的競爭。金融業(yè)正在快速發(fā)生變化。合并、收購和相關(guān)法規(guī)的變化帶來了空前的機會,也為金融用戶提供了更多的選擇。節(jié)約資金、更完善的服務(wù)誘使客戶轉(zhuǎn)投到競爭對手那里。即便是網(wǎng)上銀行也面臨著吸引客戶的問題,最有價值的客戶可能正離您而去,而您甚至還沒有覺察。在這樣一種復(fù)雜、激烈的競爭環(huán)境下,如何才能吸引、增加并保持最好的客戶呢?數(shù)據(jù)挖掘(DataMining,DM是指從大量不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、有用的信息和知識的過程。其表現(xiàn)形式為概念(Concep

2、ts)、規(guī)則(Rules)、模式(Patterns)等形式。用統(tǒng)計分析和數(shù)據(jù)挖掘解決商務(wù)問題。金融業(yè)分析方案可以幫助銀行和保險業(yè)客戶進行交叉銷售來增加銷售收入、對客戶進行細分和細致的行為描述來有效挽留有價值客戶、提高市場活動的響應(yīng)效果、降低市場推廣成本、達到有效增加客戶數(shù)量的目的等??蛻艏毞忠皇箍蛻羰找孀畲蠡耐瑫r最大程度降低風險市場全球化和購并浪潮使市場競爭日趨激烈,新的管理需求迫切要求金融機構(gòu)實現(xiàn)業(yè)務(wù)革新。為在激烈的競爭中脫穎而出,業(yè)界領(lǐng)先的金融服務(wù)機構(gòu)正紛紛采用成熟的統(tǒng)計分析和數(shù)據(jù)挖掘技術(shù),來獲取有價值的客戶,提高利潤率。他們在分析客戶特征和產(chǎn)品特征的同時,實現(xiàn)客戶細分和市場細分。數(shù)據(jù)挖

3、掘?qū)崿F(xiàn)客戶價值的最大化和風險最小化。SPSS測分析技術(shù)能夠適應(yīng)用于各種金融服務(wù),采用實時的預(yù)測分析技術(shù),分析來自各種不同數(shù)據(jù)源一來自ATM交易網(wǎng)站、呼叫中心以及相關(guān)分支機構(gòu)的客戶數(shù)據(jù)。采用各種分析技術(shù),發(fā)現(xiàn)數(shù)據(jù)中的潛在價值,使營銷活動更具有針對性,提高營銷活動的市場回應(yīng)率,使營銷費用優(yōu)化配置??蛻袅魇б煌炝粲袃r值的客戶在銀行業(yè)和保險業(yè),客戶流失也是一個很大的問題。例如,抵押放款公司希望知道,自己的哪些客戶會因為競爭對手采用低息和較寬松條款的手段而流失;保險公司則希望知道如何才能減少取消保單的情況,降低承包成本。為了留住最有價值的客戶,您需要開展有效的保留活動。然而,首先您需要找出最有價值的客戶

4、,理解他們的行為??梢栽谡麄€客戶群的很小一部分中盡可能多地找出潛在的流失者,從而進行有效的保留活動并降低成本。接著按照客戶的價值和流失傾向給客戶排序,找出最有價值的客戶。交叉銷售在客戶關(guān)系管理中,交叉銷售是一種有助于形成客戶對企業(yè)忠誠關(guān)系的重要工具,有助于企業(yè)避開“擠奶式”的飽和競爭市場。由于客戶從企業(yè)那里獲得更多的產(chǎn)品和服務(wù),客戶與企業(yè)的接觸點也就越多,企業(yè)就越有機會更深入地了解客戶的偏好和購買行為,因此,企業(yè)提高滿足客戶需求的能力就比競爭對手更有效。研究表明,銀行客戶關(guān)系的年限與其使用的服務(wù)數(shù)目、銀行每個賬戶的利潤率之間,存在著較強的正相關(guān)性。企業(yè)通過對現(xiàn)有客戶進行交叉銷售,客戶使用企業(yè)的

5、服務(wù)數(shù)目就會增多,客戶使用銀行服務(wù)的年限就會增大,每個客戶的利潤率也隨著增大。從客戶的交易數(shù)據(jù)和客戶的自然屬性中尋找、選擇最有可能捆綁在一起銷售的產(chǎn)品和服務(wù),發(fā)現(xiàn)有價值的產(chǎn)品和服務(wù)組合,從而有效地向客戶提供額外的服務(wù),提高活期收入并提升客戶的收益率。欺詐監(jiān)測通過偵測欺詐、減少欺詐來降低成本。為了與欺詐活動作斗爭,首先您需要預(yù)測欺詐在何時、何地發(fā)生。數(shù)據(jù)挖掘技術(shù)偵測在欺詐中常見的模式,預(yù)測欺詐活動將在哪里發(fā)生。對于銀行業(yè)的公司來說,欺詐活動頻繁發(fā)生的一個領(lǐng)域是自動取款機(ATM。數(shù)據(jù)挖掘幫助公司預(yù)測欺詐性的AT幟易。銀行可以來預(yù)測欺詐最有可能在哪個地理位置上發(fā)生。接著該信息就被傳送給ATM網(wǎng)絡(luò)的

6、成員機構(gòu),由這些機構(gòu)通知客戶,讓客戶確定交易是否正當,從而避免發(fā)生更多的欺詐行為。有了這些信息,他們可以更快地凍結(jié)帳戶或采取其它必要的手段。開發(fā)新客戶金融機構(gòu)可以使用數(shù)據(jù)挖掘技術(shù)提高市場活動的有效性。銀行部門對給出反饋的活動對象進行分析,使之變成新的客戶。這些信息也可應(yīng)用到其它客戶,以提高新的市場活動的反饋率。降低索賠保險公司都希望減少索賠的數(shù)量??梢允褂镁垲惙治觯鶕?jù)現(xiàn)有客戶的特征檔案來找出哪些客戶更有可能提出索賠請求。這些檔案是通過對客戶提取200至300個不同的變量而產(chǎn)生出來的。接著,您就可以針對那些可能提出較少索賠請求的客戶開展獲取活動。信用風險分析傳統(tǒng)的風險管理已無法有效控制跨區(qū)域、

7、跨部門、跨行業(yè)的多種風險,利用科學的數(shù)據(jù)分析系統(tǒng)提高欺詐的防范,降低信用風險尤為重要。客戶科學評估造成風險的因素,有效規(guī)避風險,建立完善的風險防范機制。2.客戶流失隨著金融體制改革的不斷深化和金融領(lǐng)域的對外開放,我國金融行業(yè)的競爭日趨激烈。2006年金融服務(wù)指數(shù)研究報告顯示,在我國金融業(yè)逐步對外資行業(yè)開放的今天,中國金融業(yè)的服務(wù)質(zhì)量雖然有穩(wěn)步提升,但總體仍需提高,中資銀行面臨著極大的優(yōu)質(zhì)客戶流失的危險。這將對銀行經(jīng)營和效益產(chǎn)生極大的影響。除了提高服務(wù)質(zhì)量,銀行要加強營銷活動,保留優(yōu)質(zhì)客戶,首先面臨的第一個問題就是,誰可能流失?應(yīng)該針對哪些客戶進行客戶保留活動?針對所有的客戶開展保留活動,成本太

8、大。合理的做法是應(yīng)用數(shù)據(jù)挖掘技術(shù),研究流失客戶的特征,從而對流失進行預(yù)測、并對流失的后果進行評估,采取客戶保留措施,防止因客戶流失而引發(fā)的經(jīng)營危機,提升公司的競爭力。具體來說,客戶流失是指客戶終止與企業(yè)的服務(wù)合同或轉(zhuǎn)向其它公司提供的服務(wù)??蛻袅魇Х治鍪且钥蛻舻臍v史通話行為數(shù)據(jù)、客戶的基礎(chǔ)信息、客戶擁有的產(chǎn)品信息為基礎(chǔ),通過適當?shù)臄?shù)據(jù)挖掘手段,綜合考慮流失的特點和與之相關(guān)的多種因素,從中發(fā)現(xiàn)與流失密切相關(guān)的特征,在此基礎(chǔ)上建立可以在一定時間范圍內(nèi)預(yù)測用戶流失傾向的預(yù)測模型,為相關(guān)業(yè)務(wù)部門提供有流失傾向的用戶名單和這些用戶的行為特征,以便相關(guān)部門制定恰當?shù)臓I銷策略,采取針對性措施,開展客戶挽留工作

9、。客戶流失需要解決的問題1)哪些現(xiàn)有客戶可能流失?客戶流失的可能性預(yù)測。主要對每一個客戶流失傾向性的大小進行預(yù)測。2)現(xiàn)有客戶可能在何時流失?如果某一客戶可能流失,他會在多長時間內(nèi)流失。3)客戶為什么流失?哪些因素造成了客戶的流失,客戶流失的重要原因是什么。主要對引起客戶流失的諸因素進行預(yù)測和分析。4)客戶流失的影響?客戶流失對客戶自身會造成什么影響?客戶流失對公司的影響如何?對可能流失客戶進行價值評估,該客戶的價值影響了運營商將要付出多大的成本去保留該客戶。5)客戶保留措施?針對公司需要保留的客戶,制定客戶和執(zhí)行保留措施??蛻袅魇У念愋蜑榱吮苊庥煽蛻袅魇г斐傻膿p失,必須找出那些有流失危險和最

10、有價值的客戶,并開展客戶保留活動??蛻袅魇КF(xiàn)象可以分為以下三種情況:1)公司內(nèi)客戶轉(zhuǎn)移:客戶轉(zhuǎn)移至本公司的不同業(yè)務(wù)。主要是增加新業(yè)務(wù),或者費率調(diào)整引發(fā)的業(yè)務(wù)轉(zhuǎn)移,例如從活期存款轉(zhuǎn)移至零存整取,從外匯投資轉(zhuǎn)移至滬深股市投資。這種情況下,雖然就某個業(yè)務(wù)單獨統(tǒng)計來看存在客戶流失,并且會影響到公司的收入,但對公司整體而言客戶沒有流失。2)客戶被動流失:表現(xiàn)為金融服務(wù)商由于客戶欺詐等行為而主動終止客戶與客戶的關(guān)系。這是由于金融服務(wù)商在客戶開發(fā)的過程中忽視了客戶質(zhì)量造成的。3)客戶主動流失:客戶主動流失可分為兩種情況。一種是客戶不再使用任何一家金融服務(wù)商的業(yè)務(wù);另一種是客戶選擇了另一家服務(wù)商,如客戶將存款

11、從一家銀行轉(zhuǎn)移到另一家銀行??蛻糁鲃恿魇У脑蛑饕强蛻粽J為公司不能提供他所期待的價值,即公司為客戶提供的服務(wù)價值低于另一家服務(wù)商。這可能是客戶對公司的業(yè)務(wù)和服務(wù)不滿意,也可能是客戶僅僅想嘗試一下別家公司提供而本公司未提供的新業(yè)務(wù)。這種客戶流失形式是研究的主要內(nèi)容。如何進行客戶流失分析?對于客戶流失行為預(yù)測來說,需要針對客戶流失的不同種類分別定義預(yù)測目標,即明確定義何為流失,進而區(qū)別處理。預(yù)測目標的準確定義對于預(yù)測模型的建立是非常重要的,它是建立在對運營商的商業(yè)規(guī)則和業(yè)務(wù)流程的準確把握的基礎(chǔ)之上。在客戶流失分析中有兩個核心變量:財務(wù)原因/非財務(wù)原因,主動流失/被動流失。對不同的流失客戶按該原則

12、加以區(qū)分,進而制定不同的流失標準。例如,非財務(wù)原因主動流失的客戶往往是高價值的客戶,他們會正常支付服務(wù)費用并容易對市場活動有所響應(yīng),這種客戶是企業(yè)真正需要保留的客戶。而對于非財務(wù)原因被動流失的客戶,預(yù)測其行為的意義不大。研究哪些客戶即將流失,是一個分類問題。將現(xiàn)有客戶分為流失和不流失兩類,選擇適量的流失客戶和未流失客戶的屬性數(shù)據(jù)組成訓練數(shù)據(jù)集,包括:客戶的歷史通話行為數(shù)據(jù)、客戶的基礎(chǔ)信息、客戶擁有的產(chǎn)品信息等。Clementine提供人工神經(jīng)網(wǎng)絡(luò)、決策樹、Logistic回歸等模型用于建立客戶流失的分類模型。關(guān)于流失用戶特征的分析,是一個屬性約減和規(guī)則發(fā)現(xiàn)問題。Clementine提供關(guān)聯(lián)分析

13、方法,可以發(fā)現(xiàn)怎樣的規(guī)則導(dǎo)致客戶流失。也可以利用Clementine的決策樹方法,發(fā)現(xiàn)與目標變量(是否流失),關(guān)系最為緊密的用戶屬性。由于不同類型的客戶可能具有不同的流失特征。因此,在進行深入的客戶流失分析時,需要先進行客戶細分,再對細分之后的客戶群分別進行挖掘。在預(yù)測客戶流失時一個很重要的問題是流失的時間問題,即一個客戶即將要流失,那么它可能什么時候會流失。生存分析可以解決這類問題。生存分析不僅可以告訴分析人員在某種情況下,客戶可能流失,而且還可以告訴分析人員,在這種情況下,客戶在何時會流失。生存分析以客戶流失的時間為響應(yīng)變量進行建模,以客戶的人口統(tǒng)計學特征和行為特征為自變量,對每個客戶計算

14、出初始生存率,隨著時間和客戶行為的變化,客戶的生存率也發(fā)生變化,當生存率達到一定的閾值后,客戶就可能流失。分析客戶流失對客戶自身的影響時,主要可以考慮客戶的流失成本和客戶流失的受益分析??蛻袅魇С杀究梢钥紤]流失帶來的人際關(guān)系損失等因素,通過歸納客戶的通話特征來表征。減少客戶流失的一個手段就是增加客戶的流失成本??蛻袅魇У氖芤娣治鼍褪桥袛嗫蛻袅魇У膭訖C,是價格因素還是為了追求更好的服務(wù)等。這方面內(nèi)容豐富,需作具體分析。分析客戶流失對公司的影響時,不僅要著眼于對收入的影響,而且要考慮其它方面的影響。單個的客戶流失對公司的影響可能是微不足道的,此時需要研究流失客戶群對公司收入或業(yè)務(wù)的影響。這時候可能

15、需要對流失客戶進行聚類分析和關(guān)聯(lián)分析,歸納客戶流失的原因,有針對性的制定防止客戶流失的措施。10在預(yù)測出有較大流失可能性的客戶后,分析該客戶流失對公司的影響。評估保留客戶后的收益和保留客戶的成本。如果收益大于成本,客戶是高價值客戶,則采取措施對其進行保留。至于低價值客戶,不妨任其流失甚至勸其流失。總之在利用數(shù)據(jù)挖掘研究客戶流失問題時,需要明確并深入理解業(yè)務(wù)目標,在明確的業(yè)務(wù)目標的基礎(chǔ)上準備數(shù)據(jù)、建模、模型評估,最后將模型部署到企業(yè)中??蛻袅魇?yīng)用案例為了舉例說明,我們設(shè)想一個虛構(gòu)的銀行ZBAN假用保留客戶的應(yīng)用或客戶流失建模。ZBANKE受到來自其它金融機構(gòu)日益激烈的競爭。住房貸款是ZBANK

16、寶貴的客戶來源之一,在該業(yè)務(wù)中遇到一些客戶會轉(zhuǎn)投其它競爭對手。在營銷策略方面,ZBANK合它的房貸新客戶許多的優(yōu)惠措施(如免費的電器和家具優(yōu)惠券),因此它獲得客戶的初始成本相對要高于競爭對手。但是,由于此類貸款由市場主導(dǎo),因此房屋抵押貸款給ZBANK來較小的風險,同時也使其處于一個有利的戰(zhàn)略地位可以交叉銷售其它的服務(wù)如期房貸款和住房保險。11除了保持其戰(zhàn)略性市場主導(dǎo)地位,對于ZBANK說預(yù)測客戶流失的可能性也很重要,以便減少那些獲得不久就拖欠貸款的新客戶。ZBANK有一個客戶數(shù)據(jù)庫,包含了有關(guān)房貸客戶的交易和人口統(tǒng)計信息。(1)商業(yè)理解預(yù)測現(xiàn)有用戶中哪些客戶在未來六個月中可能流失以及對哪些流失

17、客戶采取保留措施。(2)數(shù)據(jù)理解a)數(shù)據(jù)說明選取一定數(shù)量的客戶(包括流失的和未流失的),選擇客戶屬性,包括客戶資料、客戶賬戶信息等。利用直方圖、分布圖來初步確定哪些因素可能影響客戶流失。所選取的數(shù)據(jù)屬性包括:(1)客戶號;(2)儲蓄賬戶余額;(3)活期賬戶余額;(4)投資賬戶余額;(5)日均交易次數(shù);(6)信用卡支付方式;(7)是否有抵押貸款;(8)是否有賒賬額度;12(9)客戶年齡;(10)客戶性別;(11)客戶婚姻狀況;(12)客戶孩子數(shù)目;(13)客戶年收入;(14)客戶是否有一輛以上汽車;(15)客戶流失狀態(tài)。其中客戶流失狀態(tài)有三種屬性:(1)被動流失;(2)主動流失,這是分析中特別關(guān)

18、注的一類客戶;(3)未流失。在分析中,我們主要關(guān)注的是主動流失的客戶。被動流失對銀行來說是意義最小的,因為該指標代表的大多數(shù)客戶是在貸款期內(nèi)賣掉了房子,因此不再需要房貸了。主動流失指的是轉(zhuǎn)投向ZBAN庭爭對手的客戶,是該行關(guān)注的焦點。在開發(fā)這個應(yīng)用之前,ZBANK各所有現(xiàn)有的客戶歸到上述的三個類別中。同時按照常規(guī),所有的人口統(tǒng)計信息(也就是從客戶年齡到客戶是否有一輛以上汽車)每六個月更新一次,而交易信息(從儲蓄賬戶余額到是否有賒賬額度)則是實時更新的。為了讓預(yù)測模型能預(yù)先進13行指示以便采取補救措施,在目標變量(因變量)和輸入變量(自變量)之間設(shè)定了6個月的延遲。也就是說,輸入變量的采集六個月

19、后再將客戶流失狀態(tài)分類;因此該模型提早6個月預(yù)測客戶流失。b)數(shù)據(jù)描述及圖表分析在數(shù)據(jù)理解中,可以利用描述及可視化來幫助探索模式、趨勢和關(guān)系圖2.1顯示了Clementine中數(shù)據(jù)理解的數(shù)據(jù)流圖,包括:使用數(shù)據(jù)審核,統(tǒng)計分析,網(wǎng)絡(luò)圖,直方圖,兩步聚類,關(guān)聯(lián)分析,查看數(shù)據(jù)屬性之間的關(guān)系??蛻舳蝗隡戶飛黑圖2.1:數(shù)據(jù)理解的數(shù)據(jù)流圖圖2.2顯示了數(shù)據(jù)審核結(jié)果??梢院芮宄亓私?4個數(shù)據(jù)字段的基本情況。如數(shù)據(jù)類型、最大最小值、平均值、標準差、偏度、是否唯一、有效記錄個數(shù)等。從圖2.2可見,房貸客戶的平均年齡是57.4歲,最小的18歲,最大的97歲。14圖2,2:數(shù)據(jù)審核圖這些描述能幫助理解數(shù)據(jù)。使

20、用繪圖和直方圖節(jié)點將數(shù)據(jù)可視化就產(chǎn)生了客戶收入和年齡圖及日均交易數(shù)的直方圖(見圖3)。將可視化的結(jié)果與目標變量聯(lián)系起來,可以看出客戶流失狀態(tài)包含在不同的圖表中。例如,客戶的離中趨勢,男性和女性客戶的被動流失和主動流失以及每個級別的日均交易次數(shù)都包含在了圖表中。這種對關(guān)系的初步評估對于建模是很有用的。更重要的是,結(jié)果表明主動流失在女性客戶和不太活躍的客戶(由日均交易次數(shù)確定)中較為多見。15圖2,3:各種數(shù)據(jù)分布圖最后,一幅網(wǎng)狀圖表明了客戶性別,客戶婚姻狀況,信用卡支付方式,客戶流失狀態(tài)之間的聯(lián)系(見圖3下左面板)。較強的關(guān)系由較粗的線表示。那些在一定標準(由用戶定義)之下的聯(lián)系則不包括在圖中(

21、例如在被動流失和選中的一些輸入變量之間)。網(wǎng)狀圖表明現(xiàn)有客戶(即非流動者)更多的是那些已婚男性,那些用其它賬戶進行信用卡支付的人。要注意的是,前面已經(jīng)提到過,客戶流失狀態(tài)滯后輸入變量六個月。c)關(guān)聯(lián)分析及聚類的結(jié)果為了進一步了解房貸客戶可以使用聚類。圖2.4總結(jié)了使用雙步聚類節(jié)點獲得的結(jié)果。如圖所示,客戶似乎分為七種自然的聚類。所產(chǎn)生的聚類特征可用來定義和理解每個聚類以及聚類間的區(qū)別。例如,我們比較聚類1和聚類4,聚類1中包含的是較年輕并絕大多數(shù)已婚(92.2%),并且年收入較高的女性。而聚類4中包含的是較年長(平均要比1中大5歲),59.8%已婚,年收16入較低(平均要比1中低4000美元)

22、的男性。聚類的結(jié)果對于市場定位和分割研究是非常有用的,但是對于預(yù)測建模的作用則沒這么明顯。上.聚福LCJtS圖2.4:兩步聚類的部分結(jié)果本例使用關(guān)聯(lián)分析來制訂規(guī)則,尋找輸入變量和目標變量間的關(guān)系。這些規(guī)則不僅對發(fā)現(xiàn)模式、關(guān)系和趨勢很重要,對于預(yù)測建模(例如決定采用/不采用哪些輸入變量)也很重要。我們使用Clementine的GRI(廣義規(guī)則歸納)節(jié)點來進行聯(lián)合分析,結(jié)果如圖2.5所示。其中,第一條聯(lián)合分析規(guī)則表明,有156名(或11.0%的)房貸客戶的投資賬戶余額低于4988美元,其中81.0%是被動流失的。同樣,第三條規(guī)則表明有198名(或13.9%的)房貸客戶的活期賬戶余額超過1017美元

23、,其中81.0%是主動流失的。其它的規(guī)則可以類似地進行理17解。這些規(guī)則表明交易和人口統(tǒng)計信息是如何與客戶流失狀態(tài)聯(lián)系起來的。要注意的是,客戶流失狀態(tài)滯后輸入變量六個月圖2,5:關(guān)聯(lián)分析的部分結(jié)果3)數(shù)據(jù)準備根據(jù)數(shù)據(jù)理解的結(jié)果準備建模用的數(shù)據(jù),包括數(shù)據(jù)選擇、新屬性的派生,數(shù)據(jù)合并等。在本例中,利用Clementine進行數(shù)據(jù)準備的數(shù)據(jù)流圖如圖2,6所示。通過分裂節(jié)點,給數(shù)據(jù)集添加一個新的標志屬性。該標志屬性是0-16之間的隨機數(shù)。然后再根據(jù)標志屬性值(4和)=4),利用過濾節(jié)點,將原來的數(shù)據(jù)樣本分成訓練集(約占75%和測試集(約占25%。18圖2,6:數(shù)據(jù)準備的數(shù)據(jù)流圖(4)建立模型及評估預(yù)測

24、建模是本例中最重要的分析,神經(jīng)網(wǎng)絡(luò)和決策樹尤其適用于對房貸客戶的流失建模。圖2.7和圖2.8展示的是使用Clementine訓練神經(jīng)網(wǎng)絡(luò)模型和建決策樹功能得到的神經(jīng)網(wǎng)絡(luò)和決策樹的結(jié)果圖2.7:C5.0決策樹結(jié)果19圖2.8:神經(jīng)網(wǎng)絡(luò)模型結(jié)果決策樹模型中有4個終端節(jié)點和僅僅3個重要的輸入變量(按照重要性降序排列):投資賬戶余額、客戶性別和客戶年齡。神經(jīng)網(wǎng)絡(luò)模型在輸入層、隱藏層和輸出層分別有15個、5個和3個神經(jīng)元。止匕外,最終要的5個輸入變量是(按照重要性降序排列):活期賬戶余額、客戶孩子數(shù)目、儲蓄賬戶余額、投資賬戶余額和客戶婚姻狀況。Logistic回歸模型統(tǒng)計有效,卡方檢驗的p值為1.000

25、,表明數(shù)據(jù)吻合得很好。止匕外,下列輸入變量在統(tǒng)計時,在0.05的有效水平上預(yù)測客戶流失狀態(tài)也統(tǒng)計有效:儲蓄賬戶余額c(p值=0.000)、活期賬戶余額(p值=0.000)、客戶年齡(p值=0.002)、客戶年收入(p值=0.033)及客戶性別(p值=0.000)。從用評估圖節(jié)點產(chǎn)生的提升表中可以看出每個預(yù)測模型都是有效的,如圖2.9所示(從左至右分別為Logistic回歸、決策樹和神經(jīng)網(wǎng)絡(luò))。20提升表中繪制的是累積提升值與樣本百分比的關(guān)系(在這里是構(gòu)造培訓樣本)?;鶞手担丛u估每個模型的底限)是1,它表示當從樣本中隨機抽取記錄的百分點時能成功地“擊中”現(xiàn)有客戶。提示值衡量的是當來自數(shù)據(jù)中的某

26、一記錄是一個現(xiàn)有客戶的降序預(yù)測概率能被百分點反映時,預(yù)測模型“擊中”現(xiàn)有客戶的成功可能性(準確度)有多高。如圖2.9(左)所示,每個模型的提升值均大于1,在100%時收斂于1。由于每個預(yù)測模型都能以有效精度預(yù)測目標變量(起碼對于現(xiàn)有客戶和非現(xiàn)有客戶之間的關(guān)系),因此我們可以說它們都是有效的。圖2.9:提升圖(左)和三個模型的分析結(jié)果(右)值得注意的是神經(jīng)網(wǎng)絡(luò)和決策樹得出的預(yù)測模型并不完全一致,這從圖2.9(右)兩個模型結(jié)果的比較可以看出來。所以,不僅要在訓練樣本中比較兩個模型的表現(xiàn),也要在訓練/測試樣本中進行比較,而后者更加重要。對于這些預(yù)測模型來說,評估它們相對表現(xiàn)的最佳辦法應(yīng)該是看它們預(yù)測

27、目標變量(客戶流失狀態(tài))的精確率。在本例中為了簡單起見,假設(shè)總體精確度包括了比較不同預(yù)測模型表現(xiàn)的評估標準。在圖2.10的右面板中,決策樹模型的預(yù)測相對精確,總體精21確度為81.6%,因此根據(jù)評估標準,決策樹模型是最好的預(yù)測模型,應(yīng)該在ZABN做測房貸客戶的流失中使用圖2.10:測試集的提升表(左)和三個模型的分析結(jié)果(右)(5)模型部署在本例中,決策樹模型不僅精度最高,而且從圖2.7中的簡明的規(guī)則可以看出,決策樹的模型也容易理解。結(jié)果表明,ZBANK勺房貸客戶中,那些39歲以上,在投資帳戶中余額超過4976美元的女性更可能主動流失。要注意的是,客戶流失狀態(tài)滯后輸入變量六個月。從到目前位置的

28、結(jié)果來看,決策樹客戶流失預(yù)測模型能夠更精確地根據(jù)交易和人口統(tǒng)計的信息判斷出流失客戶和非流失客戶,從而產(chǎn)生增值效益。因此,ZBANK以用決策樹模型判斷哪些客戶傾向于主動流失,然后向他們提供優(yōu)惠措施或采取其它預(yù)防措施。同樣,客戶流失模型可以判斷哪些是流失風險較低的房貸申請者。使用數(shù)據(jù)挖掘的決策樹模型可以用來對現(xiàn)有客戶和新的房貸申請者進行評級。在Clementine中部署模型的數(shù)據(jù)流圖如圖所示。運行數(shù)據(jù)流后,Clementine自動將結(jié)果存儲在逗號分隔的文件中。銀行中其他人員即使沒有安裝Clementine,也可以使用記事本等軟件打開查看。并且可以很好的集22成到銀行現(xiàn)有的其他業(yè)務(wù)系統(tǒng)中。圖2.12

29、給出了一個結(jié)果的例子其中按照客戶流失概率的大小,對客戶進行排序圖2.11:模型部署的數(shù)據(jù)流圖圖2.12:流失概率和客戶價值的散點圖最后需要指出的是在本例中,模型的總體分類精確率是簡化計算的。在實際使用中,一般還需要考慮誤分類及其相關(guān)成本,還有流失客戶和非流失客戶在樣本和總體中的相對比重。3.客戶細分信用風險分析23隨著金融市場逐步開放,商業(yè)銀行和保險公司面臨著巨大的壓力和挑戰(zhàn)。面對競爭和挑戰(zhàn)、重點是做好客戶市場細分,有效發(fā)掘客戶需求,提供客戶差異化服務(wù)。一個銀行的客戶是多種多樣的,各個客戶的需求也是千變?nèi)f化的,銀行不可能滿足所有客戶所有的需求,這不僅是由銀行自身條件所限制,而且從經(jīng)濟效益方面來

30、看也是不足取的,因而銀行應(yīng)該分辨出它能有效為之服務(wù)的最具吸引力的市場,揚長避短,而不是四面出擊。對一個銀行來說,在經(jīng)營管理中應(yīng)用市場細分理論是很有必要的。客戶細分的概念客戶細分的概念是美國市場學家溫德爾?史密斯(WendeiiR.Smith)于20世紀50年代中期提出來的??蛻艏毞?CustomerSegmentation)是指按照一定的標準將企業(yè)的現(xiàn)有客戶劃分為不同的客戶群??蛻艏毞质强蛻絷P(guān)系管理的核心概念之一,是實施客戶關(guān)系管理重要的工具和環(huán)節(jié)。SuzanneDonner認為:正確的客戶細分能夠有效地降低成本,同時獲得更強、更有利可圖的市場滲透。通過客戶細分,企業(yè)可以更好地識別不同客戶群體

31、對企業(yè)的價值及其需求,以此指導(dǎo)企業(yè)的客戶關(guān)系管理,達到吸引合適客戶,24保持客戶,建立客戶忠誠的目的。所謂客戶細分主要指企業(yè)在明確的戰(zhàn)略、業(yè)務(wù)模式下和專注的市場條件下,根據(jù)客戶的價值、需求和偏好等綜合因素對客戶進行分類,分屬于同一客戶群的消費者具備一定程度的相似性,而不同的細分客戶群間存在明顯的差異性。客戶細分的理論依據(jù)主要有:(1)客戶需求的異質(zhì)性。影響消費者購買決策因素的差異決定了消費者的需求、消費者的消費行為必然存在區(qū)別。因此可以根據(jù)這種差異來區(qū)分不同的客戶,客戶需求的異質(zhì)性是進行客戶細分的內(nèi)在依據(jù)。(2)消費檔次假說。隨著經(jīng)濟的發(fā)展和消費者收入水平的提高,消費量會隨之增加。但消費量的增

32、加并非線性增長,而是呈現(xiàn)出區(qū)間性臺階式的變化形式,一旦消費者達到某種消費層次之后,消費變化的趨勢將變得非常平緩。根據(jù)消費檔次假說,消費者的消費檔次或消費習慣在一段時期內(nèi)是相對穩(wěn)定的,這就為通過消費行為來劃分消費群體提供了理論前提和基礎(chǔ)。(3)企業(yè)資源的有限性和有效市場競爭的目的性。資源總是希缺的,由于缺乏足夠的資源去應(yīng)對整個客戶群體,因此必須有選擇地分配資源。為了充分發(fā)揮資源的最大效用,企業(yè)必須區(qū)分不同的客戶群,對不同的客戶制定不同的服務(wù)策略,集中資源服務(wù)好重點客戶。25(4)穩(wěn)定性。有效的客戶細分還必須具有相對的穩(wěn)定性,足以實現(xiàn)在此基礎(chǔ)上進行的實際應(yīng)用,如果變化太快,應(yīng)用方案還未來得及實施,

33、群體就已面目全非,這樣的細分方法就顯得毫無意義??蛻艏毞帜P涂蛻羧杭毞值哪康氖菫榱诉x擇適合企業(yè)發(fā)展目標和資源條件的目標市場??蛻艏毞帜P褪侵高x擇一定的細分變量,按照一定的劃分標準對客戶進行分類的方法。一個好的細分模型,首先是要滿足細分深度的要求,不同的使用者對客戶細分的深度也有不同的要求,這就要求模型劃分的結(jié)果能滿足不同使用者的需要。其次是對數(shù)據(jù)的處理能力和容錯能力,現(xiàn)代數(shù)據(jù)庫的存儲容量越來越大,數(shù)據(jù)結(jié)構(gòu)也趨于多樣性,誤差數(shù)據(jù)也會隨之增多,這就要求模型能適應(yīng)數(shù)據(jù)在量和樣上的膨脹,對誤差數(shù)據(jù)能做出判別和處理。最后是模型要有很強的適用能力,變化是絕對的,而穩(wěn)定只是相對的,無論是個人消費者還是消費群

34、體,他們的消費行為都是在變化的,這就要求模型對客戶的細分標準要隨新的情況而不斷更新。在對客戶進行細分的方法中,除了傳統(tǒng)的按照客戶基本屬性進行分類的方法以外,還有其他多種客戶細分模型,如基于客戶價值貢獻度的細分模型、基于不同需求偏好的細分模型和基于消費行為的細分模型?;谙M者消費行為的客戶細分模型26研究,主要是以消費者的購買頻率、消費金額等為細分變量,如RFM模型和客戶價值矩陣模型。(1)RFM莫型。RFMffi分模型是根據(jù)消費者消費的間隔、頻率和金額三個變量來識別重點客戶的細分模型。R-Recency指客戶上次消費行為發(fā)生至今的間隔,間隔越短則R越大;FFrequency指在一段時期內(nèi)消費

35、行為的頻率;M-Monetary指在某一時期內(nèi)消費的金額。研究發(fā)現(xiàn),R值越大、F值越大的客戶越有可能與企業(yè)達成新的交易,M越大的客戶越有可能再次響應(yīng)企業(yè)的產(chǎn)品和服務(wù)。(2)客戶價值矩陣模型??蛻魞r值矩陣模型是在對傳統(tǒng)的RFM模型修正的基礎(chǔ)上提出的改進模型。用購買次數(shù)F和平均購買額A構(gòu)成客戶價值矩陣,用平均購買額替代了RFM模型中存在多重共線性白兩個變量,消除了RF般型中購買次數(shù)和總購買額的多重共線性的影響。在客戶價值矩陣中,確定購買次數(shù)F和平均購買額A的基準是各自的平均值,一旦確定了坐標軸的劃分,客戶就被定位在客戶價值矩陣的某一象限區(qū)間內(nèi)。依據(jù)客戶購買次數(shù)的高低和平均購買額的多少,客戶價值矩陣

36、將客戶劃分成四種類型,即樂于消費型客戶、優(yōu)質(zhì)型客戶、經(jīng)??蛻艉筒淮_定客戶,如圖3,1所示。27消費型客戶優(yōu)值型客戶不桐定客戶經(jīng)常型客戶!葛圖3.1:客尸價值矩陣客戶細分并沒有統(tǒng)一的模式,企業(yè)往往根據(jù)自身的需要進行客戶細分,研究目的不同,用于客戶細分的方法也不同??偟膩碇v,客戶細分的方法主要有四類,一、基于客戶統(tǒng)計學特征的客戶細分;二、基于客戶行為的客戶細分;三、基于客戶生命周期的客戶細分;四、基于客戶價值相關(guān)指標的客戶細分??蛻艏毞帜P偷幕玖鞒炭蛻艏毞职鶄€基本流程:第一步:理解業(yè)務(wù)需求。在未來的業(yè)務(wù)中,知道誰是客戶是個非常好的起始點,以了解瞬息萬變的市場環(huán)境。清楚地了解客戶也是對每個客戶

37、組采取有針對性措施的基礎(chǔ)??蛻艏毞志褪歉鶕?jù)其特征將相似的客戶歸組到一起,這是了解客戶和針對特定客戶組進行市場定向所不可缺少的??蛻艏毞挚筛鶕?jù)許多不同條件而進行。這些條件可由簡單的年齡、性別、地理位置28或這些變量的組合來構(gòu)成。當這些條件變得越來越復(fù)雜時,數(shù)據(jù)挖掘技術(shù)就應(yīng)運而生了。決定使用哪些條件取決于客戶細分的目的和應(yīng)用方法。在使用數(shù)據(jù)挖掘開發(fā)客戶細分時,最重要的部分是其結(jié)果應(yīng)當在業(yè)務(wù)遠景中意義深遠,并且能夠在實際業(yè)務(wù)環(huán)境中進一步得到應(yīng)用。需要記住的一點是:由于市場環(huán)境是動態(tài)變化的,細分建模過程應(yīng)當是重復(fù)性的,且模型應(yīng)隨著市場的變化而不斷革新。第二步:選擇市場細分變量。由于變量選擇的優(yōu)劣對細分

38、結(jié)果質(zhì)量的影響非常顯著,所以變量選擇應(yīng)該建立在理解業(yè)務(wù)需求的基礎(chǔ)之上,以需求為前提,在消費者行為和心理的基礎(chǔ)上,根據(jù)需求選擇變量。止匕外,變量的選擇還應(yīng)該有一定的數(shù)量,多了不好,少了也不好。第三步:所需數(shù)據(jù)及其預(yù)處理。為創(chuàng)建數(shù)據(jù)模型,必須使用收集到的原始數(shù)據(jù),并將其轉(zhuǎn)換成數(shù)據(jù)模型所支持的格式。我們稱這個過程中的這個階段為初始化和預(yù)處理。在金融業(yè)中進行客戶行為細分通常需要行為數(shù)據(jù)和人口統(tǒng)計數(shù)據(jù)等類型的數(shù)據(jù)。行為數(shù)據(jù)是客戶行為,可通過客戶的賬戶信息、購買產(chǎn)品的信息等捕獲。人口統(tǒng)計數(shù)據(jù)(如年齡、性別、工作等)可根據(jù)客戶辦理業(yè)務(wù)時,提供給金融機構(gòu)的信息獲得。這在識別或描述客戶組的特征時很有用。29第四

39、步:選擇細分技術(shù)。目前,通常采用聚了技術(shù)來進行客戶細分。常用的聚類算法有K-means兩步聚類、Kohonen網(wǎng)絡(luò)等,可以根據(jù)不同的數(shù)據(jù)情況和需要選擇不同聚類算法來進行客戶細分。第五步:評估結(jié)果。在對用戶群進行細分之后,會得到多個細分的客戶群體,但是,并不是得到的每個細分都是有效的。細分的結(jié)果應(yīng)該通過下面幾條規(guī)則來測試:與業(yè)務(wù)目標相關(guān)的程度;可理解性和是否容易特征化;基數(shù)是否足夠大,以便保證一個特別的宣傳活動;是否容易開發(fā)獨特的宣傳活動等。第六步:應(yīng)用細分模型。根據(jù)客戶細分的結(jié)果,市場部門制定合適的營銷活動,進行有針對性的營銷??傊?,客戶細分是金融機構(gòu)與用戶二者實現(xiàn)雙贏的重要舉措。目前用戶需求

40、呈現(xiàn)多樣化、個性化的趨勢,只有通過深入分析用戶消費行為,精確識別、細分用戶市場,開發(fā)出針對不同層次用戶的服務(wù)品牌進行服務(wù)營銷,方能使得各方價值發(fā)揮到最大,實現(xiàn)共贏。不同級別的客戶對服務(wù)的需求以及“贏”的概念是不同的,正是因為為不同的客戶提供不同的產(chǎn)品和服務(wù)才能使客戶都達到滿意,從而在市場上占據(jù)有利地位。30細分方法介紹在數(shù)據(jù)挖掘中,往往通過聚類分析的方法來實現(xiàn)細分。聚類分析方法至少有以下幾類:(1)K-Means聚類法。使用者需要首先確定數(shù)據(jù)分為K群,該方法會自動確定K個群的中心位置,繼而計算每條記錄距離這K個中心位置的距離,按照距離最近的原則把各個記錄都加入到K個群,重新計算K個群的中心位置

41、,再次計算每條記錄距離這K個中心位置的距離,并把所有記錄重新歸類,再次調(diào)整中心位置,依次類推,當達到一定標準時,結(jié)束上述步驟。這種方法運算速度快,適合于大數(shù)據(jù)量。(2)兩步聚類法:這種方法首先需要確定一個最大群數(shù)(比如說n),并把數(shù)據(jù)按照一定的規(guī)則分為n個群,這是該方法的第一步。接著按照一定的規(guī)則把n個群中最接近的群進行歸并,當達到一定的標準時,這種歸并停止,這就是該種方法最終確定的聚類群數(shù)(比如說項,這是第二步。兩步聚類法的一個顯著優(yōu)點是可以不指定聚類群數(shù),它可以根據(jù)據(jù)結(jié)構(gòu)本身自動確定應(yīng)該把數(shù)據(jù)分為多少群。(3)Kohonen網(wǎng)絡(luò)聚類法:是運用神經(jīng)網(wǎng)絡(luò)的方法對數(shù)據(jù)進行細分的數(shù)據(jù)挖掘方法。為了

42、提升客戶的全面經(jīng)驗,許多金融機構(gòu)將數(shù)據(jù)挖掘應(yīng)用于客戶細分在客戶個人屬性以及產(chǎn)品之間提取直觀的聯(lián)系。從31這些現(xiàn)存的客戶以及潛在客戶中得到的客戶特征經(jīng)驗的知識進而可以用于配合市場營銷工作來增加交叉銷售的機會,提高投資回報率(ROD(Peacock,1998)。這使得金融機構(gòu)可以提供特定的產(chǎn)品與服務(wù)來滿足客戶的需要。數(shù)據(jù)挖掘中典型的細分應(yīng)用要么是使用有監(jiān)督學習方法,要么是使用非監(jiān)督學習方法來進行(Chung和Gray,1999)。對于前者,數(shù)據(jù)挖掘模型學習客戶的行為特征與已經(jīng)確定的我們感興趣的輸出變量之間的關(guān)系。例如,客戶評價模型,將客戶分為不同的等級,并得出每個等級的特征。另一方面,非監(jiān)督學習方

43、法基于客戶的輸入屬性產(chǎn)生不同的類別,而且不需要設(shè)定我們感興趣的輸出變量。每個類別的成員享有相似的特征,并且與其它的類別之間的特征是截然不同的??蛻艏毞謱嵗僭O(shè)Z銀行擁有以下數(shù)據(jù):1 .客戶號;2 .儲蓄賬戶余額;3 .活期賬戶余額;4 .投資賬戶余額;5 .日均交易次數(shù);6 .信用卡支付模式;327 .是否有抵押貸款;8 .是否有賒賬額度;9 .客戶年齡;10 .客戶性別;11 .客戶婚姻狀況;12 .客戶家庭情況(孩子數(shù));13 .客戶年收入;14 .客戶是否擁有一輛以上小汽車;15 .客戶流失狀態(tài)。假設(shè)Z銀行希望建立更為有效的市場營銷戰(zhàn)略來給持有高價值投資組合的客戶推銷其金融產(chǎn)品。為了做到

44、這些,Z銀行使用細分模型特征化了其客戶,并且依賴客戶屬性分割這些客戶為截然不同的類別。其后,自然可以利用這些從客戶中得到的特征剖面來定制其市場營銷戰(zhàn)略來給其潛在的客戶提供更多目標性的信息。此外,假設(shè)Z銀行使用監(jiān)督學習以及非監(jiān)督學習建模技術(shù)來生成客戶的特征。這里我們使用SPSS司的數(shù)據(jù)挖掘軟件Clementine。相關(guān)的數(shù)據(jù)挖掘應(yīng)用程序圖示參見圖3.2。33圖3.2:投資賬戶余額分段對于監(jiān)督學習模型,基于上面涉及到的十三個變量基礎(chǔ)進行細分。目標變量是由輸入變量-投資賬戶余額,直接生成的多分類變量。關(guān)于投資賬戶余額的分布可以由直方圖節(jié)點來決定如何適當?shù)膶⒚總€客戶分類到三個箱柜中:高、中和低投資組合

45、價值。關(guān)于投資賬戶余額的分布與歸箱也顯示在圖3.2中。關(guān)于投資賬戶余額的歸箱組成了我們感興趣的投資價值目標變量。進而可以構(gòu)建Logistic回歸模型來生成基于不同單個客戶投資價值的不同分類的特征屬性。圖3.3描述了Logistic回歸模型的結(jié)果。進一步的結(jié)果表明,在預(yù)測每個客戶的投資價值的預(yù)測模型中統(tǒng)計上顯著的變量有儲蓄賬戶余額和活期賬戶余額。進而,高價值投資組合客戶的特征就由這些變量來決定。34圖3.3:Logistic回歸模型非監(jiān)督學習細分模型是基于十四個變量來做出的。在這種情形下,不需要設(shè)定目標變量。對于非監(jiān)督學習細分,通??梢允褂萌N數(shù)據(jù)挖掘算法,也就是,兩步聚類、Kohonen網(wǎng)絡(luò)以

46、及K-means聚類。對于我們的演示,這里僅僅使用了兩步聚類35圖3,4:兩步聚類分析結(jié)果圖3.4顯示了使用兩步聚類法生成的五個類別的聚類模型。關(guān)于每一類的信息也列了出來。例如,第4類包含278個客戶,它描述了在這個類別中大部分的客戶是男性且大部分無抵押貸款的客戶。另一方面,第2類描述了大多數(shù)為已婚女性且擁有賒賬額度的客戶。更進一步的數(shù)據(jù)探索是建立在兩步聚類結(jié)果上,通過利用我們所關(guān)心的變量的直方圖或是分布圖等圖形化展示手段來比較五個類別的結(jié)果。圖3.5顯示了關(guān)于五個類別中流失狀態(tài)以及流失率的比較。我們可以看到,第2類中擁有大多數(shù)的主動以及被動流失的客戶。同樣,第3類則是相當?shù)幕旌狭爽F(xiàn)存客戶以及

47、主動流失的客戶。此外,第4類中具有最大的現(xiàn)存客戶。對于其他的分類輸入變量來講可以繪出相似的分布圖。圖3.5:五個類別中流失狀態(tài)以及流失率的比較最后,關(guān)于投資賬戶的直方圖也可以根據(jù)五個類別分別繪出,參見圖3.6。我們可以看到,第1類包含了相對其它幾類更多的低投資賬戶36的客戶。另一方面,第3類則是由持有高價值投資賬戶的客戶組成。如此,如果Z銀行能夠促銷新產(chǎn)品,第3類的客戶可能是更為有希望的目標群體,能夠生成更好的市場營銷結(jié)果。利用這些知識,Z銀行現(xiàn)在能夠設(shè)計適當?shù)你y行產(chǎn)品來滿足那些不同的客戶群體。圖3.6:五個類別的投資賬戶余額的直方圖4,營銷響應(yīng)為了發(fā)展新客戶和推廣新產(chǎn)品,企業(yè)通常會針對潛在客

48、戶推出各種直接營銷活動。然而,如果目標客戶的選擇不明確,營銷活動往往花費巨大而取得的實際效益不佳,甚至可能遭遇由于活動響應(yīng)率太低而無法收回成本的境況。在當今競爭激烈的金融市場上,一方面,客戶每天通過短信、電話、郵件、電子郵件、網(wǎng)站廣告等方式會接觸到大量的金融業(yè)務(wù)廣告,缺乏針對性和足夠吸引力的營銷活動往往會被客戶直接忽略。另一方面,用戶越來越看重個性化服務(wù),對新的金融產(chǎn)品37具有較大的需求。為了更好的滿足客戶需求,許多公司采用了促銷活動管理系統(tǒng)來幫助執(zhí)行促銷活動。這些管理系統(tǒng)增加了公司采取的促銷活動的數(shù)量,卻并不一定能改善促銷活動的效率。事實上,不合適的促銷活動和過多的促銷活動只會導(dǎo)致用戶對公司

49、的不滿意度增加。所以,有效促銷活動不在于數(shù)量的多少,而在于要在恰當?shù)臅r機,通過恰當?shù)姆绞?,向恰當?shù)挠脩敉其N恰當?shù)漠a(chǎn)品。也就是說,有效的促銷活動,不在于涉及客戶的數(shù)量多少,而在于針對的都是具有高響應(yīng)概率的目標人群。這不僅可以提升客戶的滿意度,增強客戶對公司的忠誠度,而且可以降低客戶獲取費用,增加營銷活動投資回報率,直接帶來公司效益的增加。數(shù)據(jù)挖掘中的營銷響應(yīng)分析可以幫助達到提高營銷活動回報率的目標。什么是營銷響應(yīng)?營銷響應(yīng)模型是一種預(yù)測模型。目標變量是預(yù)測誰會對某種產(chǎn)品或服務(wù)的宣傳進行響應(yīng),自變量是客戶及其行為的各種屬性,如:客戶年齡,客戶收入,客戶最近一次購買產(chǎn)品的時間,客戶最近一個月的購買頻

50、率等。利用響應(yīng)模型來預(yù)測哪些客戶最有可能對營銷活動進行響38應(yīng),這樣,當以后有類似的活動時,可以針對具有較高響應(yīng)可能性的客戶進行相應(yīng)的營銷活動。而對響應(yīng)度不高的客戶就不用對他們進行營銷活動,從而減少活動成本,提高投資回報率。如何提高營銷響應(yīng)率?金融機構(gòu)應(yīng)當在深入了解客戶需求和客戶特征的基礎(chǔ)上,制定營銷策略,從而達到增加營業(yè)收入和客戶滿意度的雙重目標。我們提倡的不是針對最佳的客戶群開展營銷活動,而是針對每一個客戶開展活動。所謂“知己知彼,百戰(zhàn)不殆”,建立在對客戶需求良好把握基礎(chǔ)之上極具針對性的營銷將極大地提高營銷活動的成功率。要開展這樣的營銷活動,首先需要回答以下幾個問題:? 對誰開展營銷活動?

51、 多長時間開展一次營銷活動?M可時開展營銷活動? 如何開展營銷活動?金融機構(gòu)在數(shù)據(jù)挖掘技術(shù)的幫助下,針對客戶數(shù)據(jù)建立營銷響應(yīng)模型,在合適的時間,通過合適的渠道,以一種合適的接觸頻率,對合適的客戶開展活動,從而提高營銷活動的響應(yīng)率和投資回報率。39圖4.1:營銷活動的四個要素1)選擇合適的客戶金融機構(gòu)對以往的營銷數(shù)據(jù)進行分析,采用決策樹等數(shù)據(jù)挖掘方法,識別出具有高響應(yīng)率的客戶的特征。通過選擇合適的客戶,可以排除對促銷活動響應(yīng)不積極的客戶,將目標客戶的數(shù)量大大減小,從而在實現(xiàn)更有針對性地營銷的同時減小營銷成本。據(jù)統(tǒng)計,通過減小目標客戶的數(shù)量,通常可以節(jié)省25%-40%勺營銷費用,同時增加營銷響應(yīng)率

52、。2)選擇合適的渠道第二步是要針對用戶選擇合適的營銷渠道,也就是和客戶接觸的方式。通過使用每個用戶偏愛的方式與之接觸,也有利于提升客戶響應(yīng)率。在確定促銷渠道時,要考慮客戶對渠道的偏愛,渠道成本,期望的響應(yīng)率,其他營銷限制條件等。3)選擇合適的時間在當今競爭激烈的社會里,客戶有很多滿足自己需求的機會和選擇。40因此,一旦發(fā)現(xiàn)了客戶尚未被滿足的需求或者出現(xiàn)遺失客戶風險時,一定要及時和客戶接觸。這種事件驅(qū)動的促銷方式,通常也可以取得較高的響應(yīng)率。4)選擇合適的活動頻率此外,并不是促銷活動越多,效果越好?;顒佑媱澱咝枰鶕?jù)實際情況,針對具體的客戶,選擇一個最優(yōu)的活動次數(shù),既使得客戶的各種需求得到較好的

53、滿足,又避免因為過于頻繁的接觸而導(dǎo)致客戶的反感。同時,過多的營銷活動,也會增加營銷成本。需要在增加的成本和提高的響應(yīng)率帶來的收益之間尋找一個最優(yōu)點??蛻糇陨淼钠脤τ跔I銷活動的頻率確定也至關(guān)重要,比如,對于不喜歡過于頻繁的接到促銷電話的客戶,就要適量降低電話促銷的頻率。通過選擇更有針對性地選擇客戶和根據(jù)客戶的需求和偏好來推廣促銷活動,可以將促銷活動的投資收益率提高25%-50%表4.1:營銷活動四階段總結(jié)1.合適的客戶2.合適的渠道3.合適的時間4.合適的營銷頻率目標為營銷活動選擇最佳客戶為目標客戶選擇最優(yōu)營銷方式在合適的時間對目標客戶開展營銷確定最適合客戶的營銷頻率,法預(yù)測分析渠道優(yōu)化事件營

54、銷促銷優(yōu)化,略預(yù)測誰是最有在客戶偏愛的變小的,經(jīng)常性4E客戶響應(yīng)率41可能響應(yīng)營銷并且能給營銷活動帶來收益的客戶方式和公司的成本與能力之間選取最優(yōu)結(jié)合點的營銷活動為事件觸發(fā)的營銷活動和公司收益之間選擇最佳結(jié)合點“處降低25%-40%降低接觸客戶的營銷成本的成本響應(yīng)率的提圖至少達到兩倍提高25%-50%的收益營銷響應(yīng)應(yīng)用案例一家虛擬銀行新推出了一種新的抵押貸款業(yè)務(wù),為了推廣新產(chǎn)品,該銀行決定執(zhí)行直接營銷活動。為此,分析人員收集了以往進行類似產(chǎn)品的營銷時公司執(zhí)行營銷活動的相關(guān)數(shù)據(jù),經(jīng)過數(shù)據(jù)挖掘應(yīng)用,計算客戶影響概率,得到客戶響應(yīng)率模型,進而對客戶對新產(chǎn)品的響應(yīng)概率進行預(yù)測。從中選取響應(yīng)率高的客戶開

55、展新產(chǎn)品營銷活動。(1)商業(yè)理解識別出可能響應(yīng)直接營銷活動的客戶,提高營銷活動的響應(yīng)率。(2)數(shù)據(jù)理解收集部分以往的營銷活動數(shù)據(jù)(包括對活動響應(yīng)的客戶數(shù)據(jù)和未對活動響應(yīng)的客戶數(shù)據(jù)),選擇客戶屬性,包括客戶人口統(tǒng)計學特征和賬戶信息等。利用直方圖、分布圖來初步確定哪些因素可能影響客戶響42應(yīng)。所選取的數(shù)據(jù)屬性包括:用戶編號、年齡、收入、孩子數(shù)目、是否有汽車、是否抵押、居住區(qū)域、性別、婚姻狀況、在該銀行是否有儲蓄賬戶、在該銀行是否有活期賬戶、是否對促銷活動響應(yīng)等12個字段。其中是否響應(yīng)是預(yù)測的目標變量,共有兩個屬性:否:客戶未響應(yīng)營銷活動;是:客戶響應(yīng)營銷活動圖4.2:數(shù)據(jù)首先采用直方圖,散點圖等工

56、具對數(shù)據(jù)之間的關(guān)系進行初步探索。下圖是按照響應(yīng)與否察看收入與孩子數(shù)目之間的散點圖??梢?,如果只考慮“孩子數(shù)目”屬性,發(fā)現(xiàn)隨著孩子數(shù)目增加,響應(yīng)的客戶比率降低。同時考慮“孩子數(shù)目”和“收入”屬性,發(fā)現(xiàn)響應(yīng)比率與“收入”和“孩子數(shù)目”的比值相關(guān),這個比值通常被成為“相對收入”。43圖4.3:收入與孩子數(shù)目的散點圖下圖是孩子數(shù)目的分布圖。有一個孩子的客戶占44.3%。而在這些客戶中,大部分是對直接營銷活動進行響應(yīng)的客戶??偟恼f來,隨著孩子數(shù)目增加,客戶響應(yīng)率降低。圖4.4:孩子數(shù)目的分布圖(3)數(shù)據(jù)準備根據(jù)數(shù)據(jù)理解的結(jié)果準備建模需要的數(shù)據(jù),包括數(shù)據(jù)選擇、新屬性的派生,數(shù)據(jù)合并等。在數(shù)據(jù)理解中發(fā)現(xiàn),是否響應(yīng)與“收入”和“孩子數(shù)目”的比率有關(guān),因此,派生出“相對收入”屬性,定義為:如果“孩子數(shù)目”為0,則“相對收入”=“收入”;否則,“相對收44入”收入”/“孩子數(shù)目(4)建立模型及評估對數(shù)據(jù)進行預(yù)處理之后,分別使用C5.0決策樹模型,神經(jīng)網(wǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論