




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、銀行客戶案例分析案例背景和問題:某商業(yè)銀行試圖通過對個(gè)人客戶購買本銀行金融產(chǎn)品的數(shù)據(jù)進(jìn)行分析,從而發(fā)現(xiàn)交叉銷售的機(jī)會。數(shù)據(jù)集說明:該銀行采集了7991個(gè)客戶的產(chǎn)品(或服務(wù))購買記錄,共32000行,數(shù)據(jù)集名稱為BANK。變量說明: ACCT:客戶標(biāo)識 SERVICE:購買的產(chǎn)品或服務(wù) VISIT:購買時(shí)間數(shù)據(jù)集每一行代表這個(gè)顧客擁有的一種產(chǎn)品,一個(gè)顧客可能有多個(gè)行。平均每個(gè)顧客擁有的產(chǎn)品數(shù)是3種。數(shù)據(jù)集中的13種產(chǎn)品和服務(wù)縮寫如下所示:ATM 自動取款機(jī)AUTO 自動貸款 CCRD 信用卡CKCRD 支票/貸記卡 CKING 支票賬戶 HMEQLC 家居股本信貸IRA 個(gè)人退休賬戶 MTG 抵
2、押CD 存款保證PLOAN 個(gè)人消費(fèi)信貸 SVG 儲蓄賬戶 TRUST 個(gè)人信托賬戶MMDA 貨幣市場存款帳戶實(shí)驗(yàn)要求和總體步驟: 對BANK數(shù)據(jù)集進(jìn)行關(guān)聯(lián)分析和頻繁序列分析。 確定數(shù)據(jù)源 設(shè)置變量角色 確定支持度、置信度閾值,進(jìn)行關(guān)聯(lián)分析 查看和篩選關(guān)聯(lián)分析結(jié)果 設(shè)置變量角色,進(jìn)行頻繁序列分析 分析評價(jià)頻繁購買序列操作步驟準(zhǔn)備工作:1.在D盤建立文件夾:BANK2.啟動SAS ,建立邏輯庫DATA 指向D:BANK3.打開企業(yè)挖掘機(jī)關(guān)聯(lián)分析:1. 建立一個(gè)新的挖掘項(xiàng)目BANK, 保存在D:BANK目錄下,第一個(gè)DIAGRAM命名為ASSOC。并在右邊的工作區(qū)中加入“input data so
3、urce”節(jié)點(diǎn)。,2. 打開Input Data Source node(數(shù)據(jù)輸入節(jié)點(diǎn))。3. .在數(shù)據(jù)庫中選擇BANK數(shù)據(jù)集。4. 選擇Variables(變量)欄。5. 將ACCT設(shè)為id(身份),SERVICE設(shè)為target(目標(biāo)),將VISIT設(shè)為sequence (序列)。6. 關(guān)閉Input Data Source node(數(shù)據(jù)輸入節(jié)點(diǎn)),保存對它的更改。7. 工作區(qū)中新增Association node節(jié)點(diǎn),并與Input Data Source 節(jié)點(diǎn)進(jìn)行連接。如下圖所示:然后 打開Association node(關(guān)聯(lián)節(jié)點(diǎn))。默認(rèn)的是Variables tab(變量欄),這
4、與Input Data Source node(數(shù)據(jù)輸入節(jié)點(diǎn))中的Variables tab(變量欄)是一樣的。8. 選擇General(綜合)欄,通過這個(gè)欄可以設(shè)置分析節(jié)點(diǎn)。觀察Analysis mode(分析方法)選項(xiàng),默認(rèn)的方法是By Context。要根據(jù)前面的Input Data Source node(數(shù)據(jù)輸入節(jié)點(diǎn))中定義的信息來選擇適當(dāng)?shù)姆椒?。如果輸入?shù)據(jù)集包括一個(gè)ID(身份)變量,一個(gè)target(目標(biāo))變量,這個(gè)節(jié)點(diǎn)就會自動地選擇association analysis(關(guān)聯(lián)分析)。如果有一個(gè)sequence(序列)變量且它的狀態(tài)是use,那么這個(gè)節(jié)點(diǎn)就會進(jìn)行一個(gè)sequen
5、ce Analysis(序列分析)。因?yàn)樵谳斎霐?shù)據(jù)集中有個(gè)序列變量,所以這里默認(rèn)的分析方法為sequence analysis(序列分析)。這里我們先進(jìn)行association analysis(關(guān)聯(lián)分析),稍后討論Sequence analysis(序列分析)。9. 將分析方法改為Association(關(guān)聯(lián))。設(shè)置支持度和置信度的閾值,以及頻繁項(xiàng)集的最大元素個(gè)數(shù),如上圖所示。10. 關(guān)閉Association node(關(guān)聯(lián)節(jié)點(diǎn)),彈出提示時(shí)選擇保存。11. 運(yùn)行這圖里的Association node(關(guān)聯(lián)節(jié)點(diǎn)),并且觀察結(jié)果。這個(gè)關(guān)系欄包含了所有的關(guān)聯(lián)關(guān)系,假設(shè)關(guān)系為A=>B,回
6、顧一下前面的:l A=>B 的Support(支持度)是指一個(gè)顧客同時(shí)擁有A和B的可能性。l A=>B 的confidence(_置信度)是給定顧客擁有A后,又擁有B的可能性。l A=>B的 lift是對這個(gè)關(guān)聯(lián)的強(qiáng)度的恒量。如果關(guān)系A(chǔ)=>B 的Lift=2,擁有A的顧客再擁有B的可能性是隨機(jī)抽樣的一個(gè)顧客擁有B的可能性的兩倍。12. 在Support(%)列中單擊右鍵,選擇Sort(排序)=> Descending(降序) Support(支持度)是指包含這個(gè)關(guān)系的所有顧客的百分比。比如說,大約在7991位顧客中有54.17%同時(shí)擁有支票與儲蓄帳戶,而大約有25
7、%的顧客同時(shí)擁有支票賬戶,儲蓄賬戶和ATM(自動取款卡)。13. 在Confidence(%)列中單擊右鍵,選擇Sort(排序)=> Descending(降序)。Confidence(置信度)表示擁有LHS (左邊)業(yè)務(wù)的顧客中擁有RHS(右邊)業(yè)務(wù)的百分比。比如:所有擁有支票賬戶的顧客都擁有一張支票卡,而在同時(shí)擁有儲蓄賬戶和信用卡的顧客中超過97%的顧客擁有一個(gè)支票賬戶。14. 在llift(增益)列中單擊右鍵,選擇Sort(排序)=> Descending(降序)。在關(guān)聯(lián)關(guān)系中的lift(增益),是RHS(右邊)和 LHS(左邊)形成關(guān)系的confidence(置信度)與假設(shè)
8、RHS(右邊)和 LHS(左邊)不相關(guān)的confidence(置信度)二者之比。因此,lift是用來衡量RHS(右邊)和 LHS(左邊)的關(guān)聯(lián)關(guān)系的。如果值大于1,則說明LHS 與RHS正相關(guān),如果等于1則代表無關(guān)。如果小于1則二者負(fù)相關(guān)。CKCRD => CCRD 的lift(增益)值為3.19,因此,如果選擇一個(gè)顧客擁有check/debit card(支票/借記卡),那他擁有credit card(信用卡)的可能性是隨機(jī)抽取的一個(gè)顧客的3倍。注:默認(rèn)情況下,在結(jié)果中,只顯示lift(增益)大于1的關(guān)聯(lián)??梢詫iew=> When Confidence(真實(shí)可信度) 改為Ex
9、pected Confidence(期望可信度)。15. 點(diǎn)擊Frequencies(頻率)欄。這個(gè)欄格列出了每個(gè)產(chǎn)品擁有的客戶量。這與簡單的次數(shù)統(tǒng)計(jì)是有所區(qū)別的。比如說,一個(gè)顧客可能擁有多個(gè)支票賬戶,但這里只會計(jì)算一次。這是一個(gè)相當(dāng)有用的信息,尤其在解釋為什么一個(gè)特定的對象沒有出現(xiàn)在這些關(guān)系里時(shí)。上面提到,在默認(rèn)的情況下,一個(gè)關(guān)聯(lián)出現(xiàn)的次數(shù)至少要是出現(xiàn)最多的對象的次數(shù)的5%。這里出現(xiàn)最多次數(shù)最多的是checking account(支票賬戶),出現(xiàn)了6855次。因此,一個(gè)產(chǎn)品的組合至少要有343位顧客(6855的5%),否則無法形成一個(gè)關(guān)聯(lián)準(zhǔn)則。如果想對association(關(guān)聯(lián))中的出現(xiàn)
10、較少的產(chǎn)品進(jìn)行研究的話,就要考慮在運(yùn)行association Node(關(guān)聯(lián)節(jié)點(diǎn))減低最少出現(xiàn)頻率的限制。如果得到的關(guān)聯(lián)關(guān)系太多,超過了可用范圍,則可以考慮提高最少出現(xiàn)頻率的限制。假設(shè)想對擁有market deposit account (MMDA) (貨幣市場存款帳戶)和certificate of deposit (CD) (存款保證)的用戶進(jìn)行了解,想了解他們擁有其它什么產(chǎn)品??梢园凑找韵碌姆椒ǎ?. 選擇Rules tab(關(guān)系欄)。2. 選擇View(視圖)=> Subset Table.(子欄)3. 在Predecessor (前續(xù))=> Successor(后續(xù))欄中
11、,選擇CD(存款保證)和MMDA(貨幣市場存款帳戶)兩項(xiàng)做為左邊的項(xiàng)。4. 在Left Hand Side (左邊)的Type(類型)的下拉選項(xiàng)中選擇Combinations &Single(結(jié)合與單一)。5. 在Right Hand Side(左邊)的Type(類型)的下拉選項(xiàng)中選擇Find Any(尋找全部)。6. 選擇Process(進(jìn)行),然后觀察結(jié)果。左邊是CD(存款保證)和MMDA(貨幣市場存款帳戶)中一個(gè)或者兩個(gè)的規(guī)則有8個(gè)。如果是想了解和automobile loans(自動貸款)有關(guān)的規(guī)則,而且想要得到一個(gè)含有AUTO(自動貸款)的規(guī)則的子集,最簡單的方法將這些規(guī)則保
12、存為一個(gè)子集,然后用SAS Code node(SAS代碼節(jié)點(diǎn))分出這個(gè)數(shù)據(jù)。7. 選擇 View(視圖)=> Reset Table(重排表格)8. 選擇 File(文件)=> Save As Data Set.(保存為數(shù)據(jù)集)9. 可以看到,這個(gè)數(shù)據(jù)集的保存名為Selected Output from Rulegen.點(diǎn)擊OK,保存這個(gè)數(shù)據(jù)集。10. 關(guān)閉這個(gè)Association node(關(guān)聯(lián)節(jié)點(diǎn)),然后在圖欄中添加一個(gè)SAS Code node(SAS代碼節(jié)點(diǎn))。11. 打開這個(gè)SAS Code node(SAS代碼節(jié)點(diǎn)),打開Macros tab(宏欄)。Enterpr
13、ise Miner(企業(yè)挖掘器)自動創(chuàng)建了很多宏變量。這里,我們可以看到&_MAC_4,這是從Association node(關(guān)聯(lián)節(jié)點(diǎn))中保存過來的結(jié)果。12. 選擇Program(程序)欄。13. 輸入如下的程序:14. 點(diǎn)擊按鈕 行SAS Code(SAS代碼)。15. 點(diǎn)擊Yes,選擇現(xiàn)在運(yùn)行SAS Code(SAS代碼)。16. 彈出提示時(shí)點(diǎn)擊Yes,觀察運(yùn)行結(jié)果。17. 選擇Output(輸出)欄。在輸出結(jié)果中得到了13個(gè)關(guān)于與automobile loans (自動貸款)有關(guān)的規(guī)則。18. 看完輸出結(jié)果以后,關(guān)閉SAS Code node(SAS代碼節(jié)點(diǎn))結(jié)果和SAS C
14、ode node(SAS代碼節(jié)點(diǎn))。序列分析Association analysis(關(guān)聯(lián)分析)的作用是用來研究出售的產(chǎn)品之間的關(guān)系。換句話說,哪些產(chǎn)品是顧客同時(shí)會購買的。Sequence analysis(序列分析)又進(jìn)一步分析了這些產(chǎn)品的購買的順序。這可以回答這樣的問題:如果一周顧客購買了A產(chǎn)品,下周他是否會購買B產(chǎn)品?一個(gè)Sequence analysis(序列分析)需要定義一個(gè)sequence(序列)變量。association analysis(關(guān)聯(lián)分析)則不要求sequence(序列)變量。銀行除了對客戶擁有的產(chǎn)品感興趣以外,還想了解顧客購買這些的順序。在數(shù)據(jù)集中有sequence
15、 (序列)變量,就可以進(jìn)行sequence analysis(序列分析)。1. 在圖表工作區(qū)添加一個(gè)Association node(關(guān)聯(lián)結(jié)點(diǎn)),把它與Input Data Source node(輸入數(shù)據(jù)源節(jié)點(diǎn))節(jié)點(diǎn)相連。2. 打開這個(gè)Association node(關(guān)聯(lián)節(jié)點(diǎn))。3. 選擇General(一般)欄。觀察到,由于數(shù)據(jù)集中的sequence(序列)變量的狀態(tài)是use(利用),所以在默認(rèn)的情況下,分析的方法就是sequence analysis(序列分析)。4. 選擇Sequences(序列)欄。在Sequences(序列)欄中,可以定義一個(gè)序列出現(xiàn)的最小出現(xiàn)頻率以及在一個(gè)最長的
16、序列鏈里出現(xiàn)的個(gè)數(shù)。定義的最多個(gè)數(shù)是10個(gè)。5. 選擇Time Constraints(時(shí)間限制)欄。這里的選項(xiàng)允許對一系列交易指定最大時(shí)間長度,這些交易被考慮成一個(gè)序列??赡苤豢紤]在三個(gè)月內(nèi)購買兩種產(chǎn)品的情況進(jìn)行序列分析,而超過三個(gè)月的則不以考慮。另外一個(gè)選項(xiàng)是固定時(shí)差。意思是如果在一天之內(nèi)購買兩種產(chǎn)品,則認(rèn)為是同時(shí)購買。6. 使用默認(rèn)值,關(guān)閉關(guān)聯(lián)節(jié)點(diǎn)。7. 運(yùn)行Association node(關(guān)聯(lián)節(jié)點(diǎn)),在彈出提示時(shí)選擇Yes來觀察得出的結(jié)果。8. 在Confidence(置信度)(%)列內(nèi)單擊右鍵選擇Sort(排序)=> Descending(降序)。這里的transaction
17、 count(交易總數(shù))是指按后面的序列順序購買了產(chǎn)品的總的顧客總數(shù)。這里的support(支持度)是指用transaction count(交易總數(shù))除以總的顧客數(shù),而總的顧客數(shù)也是可能的最大transaction count(交易總數(shù))。Confidence(置信度)百分比是用transaction count(交易總數(shù))除以擁有序列左邊業(yè)務(wù)的顧客的總數(shù)(這個(gè)可以在Frequencies(頻率)欄中查得)。比如說,使用了過automobile loan(自動貸款)的顧客中,有82.12%會使用第二次automobile loan(自動貸款)。9. 選擇View(視圖)=>Subset
18、 Table.(子表)10. 從Available Columns(變量列)清單中選擇Chain Item 1。11. 在Operators(方法)中選擇EQ。12. 在Available Columns(變量列)清單中選擇<LOOKUP distinct values>(查找特征值).13. 選擇AUTO(自動貸款)。14. 在Operators(方法)=> OR。15. 在Available Columns(變量列)清單中選擇Chain Item 2。16. 在Operators(方法)中選擇EQ。17. 在Available Columns(變量列)清單中選擇<LOOKUP distinct values>(查找
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 病房管理精細(xì)化
- 腹股溝滑動疝的臨床護(hù)理
- 員工法律測試題及答案
- 在師帶徒儀式上的發(fā)言稿模版
- 化療相關(guān)護(hù)理
- 中國旅游地理新教學(xué)設(shè)計(jì)
- 護(hù)理組長崗位認(rèn)知
- 小學(xué)二年級班主任年終總結(jié)模版
- 2025年人教PEP英語小學(xué)四年級下冊期末檢測題及答案(二)
- 2025年部編版道德與法治小學(xué)四年級下冊期末質(zhì)量檢測題附答案
- 2024年湖北省中考地理·生物試卷(含答案解析)
- GB/T 44241-2024虛擬電廠管理規(guī)范
- JGT 160-2017 混凝土用機(jī)械錨栓
- 南通輔警考試題庫
- 連續(xù)蒸煮螺旋喂料器
- DL-T904-2015火力發(fā)電廠技術(shù)經(jīng)濟(jì)指標(biāo)計(jì)算方法
- 北京市某低溫?zé)崴匕遢椛洳膳こ淘O(shè)計(jì) 畢業(yè)設(shè)計(jì)
- 懂設(shè)備原理會維護(hù)保養(yǎng)
- 英語中考專題復(fù)習(xí)-短文填空
- 25第11課第三框《違約侵權(quán)要承擔(dān)民事責(zé)任》
- 《化妝品穩(wěn)定性試驗(yàn)規(guī)范》
評論
0/150
提交評論