版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
CRM中的數據管理2CRM的客戶數據數據倉庫技術數據挖掘技術數據挖掘技術的應用 聽說,下雪天,啤酒和尿布更配哦4案例:尿布+啤酒=更大的利益
先請大家做個腦力游戲——說出任何尿布和啤酒的聯(lián)系,即在什么情況下它們可以相提并論。
請想象這樣的一副情景:在一個大的超級市場里面,人來人往。一角的貨架上,尿布和啤酒赫然地擺放在一起出售。而且,尿布和啤酒的銷售量雙雙增加。
這是上個世紀發(fā)生在美國沃爾瑪連鎖超市的真實事件,而且也許是將尿布和啤酒最好地聯(lián)系起來的方法,因為它甚至符合了今天正在流行的“雙贏”原理。5
原來,美國的太太經常囑咐他們的丈夫下班以后為小孩購買尿布,而丈夫們在買尿布以后又順手帶回了啤酒。啤酒和尿布在一起購買的機會是最多的。
誰在當時就能看出這種帶來“利益”的聯(lián)系?其實想到答案的不是人,是信息技術。具體地說,就是美國沃爾瑪超市的數據倉庫。是它,通過集中商店一年多的詳細原始交易數據,利用自動數據挖掘工具對這些數據進行分析,得到了這個意外的發(fā)現(xiàn)。6點評:從本例可以看出,CRM運用的成功必須依靠客戶數據,對客戶數據進行科學地分析,往往會帶來意想不到的商機:對客戶數據進行初級處理,可以完成基本業(yè)務過程;對數據進行高級處理(如數據挖掘),可以提供企業(yè)決策支持,促進銷售,保持消費群體的穩(wěn)定。所以說,客戶數據是整個CRM運用的靈魂,本章內容就是以客戶數據管理與分析為主。
2023/2/667第一節(jié)CRM的客戶數據一、客戶數據的類型81.直接渠道(1)在市場調查中獲取客戶數據(2)在營銷活動中獲取客戶數據(3)在服務過程中獲取客戶數據(4)通過博覽會、展銷會、洽談會等獲取客戶數據(5)網站和呼叫中心是收集客戶數據的新渠道(6)從客戶投訴中收集92.間接渠道(1)各種媒介(2)工商行政管理部門及駐外機構(3)國內外金融機構及其分支機構(4)國內外咨詢公司及市場研究公司(5)從已建立客戶數據庫的公司租用或購買(6)其他渠道10二、客戶的隱私及保護在企業(yè)層面保證客戶信息安全性2012年3月15日,據央視3.15晚會報道,招商銀行信用卡中心風險管理部貸款審核員胡XX就曾向作案人出售個人信息300多份;中國工商銀行客戶經理曹XX,通過中介向作案人提供了多達2318份個人信息。向朱凱華出售個人征信報告、銀行卡信息的,還有中國農業(yè)銀行無錫榮龍支行員工董某、中國工商銀行福州鼓樓支行員工陳某。112.使用匿名身份信息3.盡量使用匯總數據12三、構建客戶數據庫(1)適當超前。按照可預見未來所需的信息量,盡可能多地考慮預期客戶購買產品的情況和購買后的反應。(2)設計彈性。深入策劃客戶數據庫的組成部分,應保留一定的彈性,以滿足未來變化的需要。(3)靈活應用。建立數據庫,可先建成一個小而實用的數據庫,在管理客戶數據庫中獲得經驗,并對其評價,不斷改進。(4)必要參與。構建客戶數據庫時,讓盡可能多的部門和人員參與。一方面使信息采集科學完備;另一方面讓數據庫的使用者充分了解設計者的思想。13第二節(jié)數據倉庫技術一、數據倉庫概述從數據庫到數據倉庫傳統(tǒng)的數據庫技術由于其高效的數據存儲與查詢技術,支持了綜合型管理信息系統(tǒng)的廣泛應用。然而這些數據庫主要適應于業(yè)務處理的需要,不能提供從全局視圖對企業(yè)數據進行深入分析和挖掘。響應時間要求短某些業(yè)務功能數據對決策分析無關緊要客戶信息被割裂在各個不同系統(tǒng)中以二維表格存儲,無法進行多視角分析1415營銷子系統(tǒng):
客戶特征(類別號,收入水平,交易期限,客戶價值,…)客戶行為(客戶號,購買頻次,最近購買時間,。。。)營業(yè)推廣(編號,推廣方式,成本,日期,客戶。。。。)銷售子系統(tǒng):客戶(客戶號,姓名,地址,電話,…
)銷售(客戶號,商品號,數量,單價,日期,…)售后服務子系統(tǒng):咨詢單(編號,客戶號,日期,相關產品…)維修單(編號,客戶號,商品號,日期,負責人…)
維修次數、客戶特征與客戶忠誠度之間具有什么樣的關系?162.數據倉庫的含義
目前,對于數據倉庫的概念,權威的定義是“數據倉庫是在企業(yè)管理和決策中面向主題的、集成的、時變的、不可修改的數據集合”。3.建立數據倉庫的目的
建立數據倉庫并不是要取代原有的運作數據庫系統(tǒng),而是為了將企業(yè)多年來已經收集到的數據按統(tǒng)一、一致的企業(yè)級視圖組織、存儲,對這些數據進行分析,從中得出有關企業(yè)經營狀況、客戶需求、對手情況、發(fā)展趨勢等有用信息,幫助企業(yè)及時、準確地做出相應決策。16174.數據倉庫特征(1)面向主題(subject-oriented)。數據倉庫的數據組織是圍繞主題的。(2)集成(integrated)。數據倉庫通常是結合多個異種數據源構成的。(3)時變(time-variant)。數據倉庫中包含時間元素,它所提供的信息總是與時間相關聯(lián)的。(4)不可修改(nonvolatile)。其數據相對穩(wěn)定,極少或根本不更新。18
客戶基本信息:客戶號,姓名,地址,電話。。。??蛻粜袨樾畔ⅲ嚎蛻籼?,購買頻次,最近購買時間,。。??蛻艟S修信息:客戶號,商品號,日期,負責人…
客戶咨詢信息:編號,客戶號,日期,相關產品,
…
客戶主題域:營銷子系統(tǒng)銷售子系統(tǒng)售后子系統(tǒng)19整個數據倉庫系統(tǒng)是一個包含四個層次的體系結構,具體由下圖表示。20三、基于數據倉庫的OLAP
1.OLAP基本概念
1)維
維是人們觀察數據的特定角度。
2)維的層次
一個維往往具有多個層次,如描述時間維,可以從日期、月份、季度、年等不同層次來捕述,那么日期、月份、季度、年等就是時間維的層次;同樣,城市、地區(qū)、國家等構成了一個地理維的多個層次。
21
(1)維成員。維的一個取值稱為該維的一個維成員。如果一個維是多層次的,那么,該維的維成員是在不同維層次的取值的組合。
(2)多維數組。一個多維數組可以表示為:(維1,維2,…,維n,變量)。例如,日用品銷售數據是按時間、地區(qū)和銷售渠道組織起來的三維立方體,加上變量"銷售額”,就組成了一個多維數組(地區(qū),時間,銷售渠道,銷售額)。
(3)數據單元。多維數組的取值稱為數據單元。
22切片
選定多維數組的一個二維子集的方法叫做切片,即選定多維數組(維1,維2,……,維n,變量)中的兩個維:維I和維J,在這兩個維上取某一區(qū)間或任意維成員,而將其余的維都取定一個維成員,則得到的就是多維數組在維I和j上一個二維子集,稱這個二維子集為多維數在維I和維J上的一個切片,表示為;(維I,維j,變量)。OLAP的分析方法23
例如,選定多維數組(地區(qū),時間,產品,銷售額)中的地區(qū)維與產品維,在另外一維:時間維,選取一個維成員(如“2006年1月”),就得到了多維數組(地區(qū),時間,產品,銷售額)在產品和地區(qū)兩維上的一個切片(客戶,地區(qū),銷售額)。這個切片表示2006年1月各地區(qū)、各產品的銷售情況。24
產品銷售情況2006.1產品銷售情況選定兩個維:產品維和地區(qū)維時間維數據切片產品維地區(qū)維產品維地區(qū)維25切塊
選定多維數的一個三維子集的方法稱切塊。即選定多維數組(維1,維2,……,維n,變量)中的三個維:維I、維j和維r,在這三個維上取某一區(qū)間或任意的維成員,而將其余的維都取定一個維成員,則得到的就是多維數組在維I、維j和維r上一個三維子集,我們稱這個三維子集為多維數組在維I、維j和r上的一個切塊,表示為:(維I,維j,維r,變量)。切塊與切片的作用與目的是相似的。美國中國手機電腦圖8-3
三維立方體切塊(Slice)26旋轉
旋轉即是改變一個報告或面顯示的維方向。例如,旋轉可能包含了交換行和列;或是把某一個行維移到列維中去,或是把一個橫向為時間、縱向為產品的報表旋轉成為橫向為產品、縱向為時間的報表。272005年2006年部門1季度2季度3季度4季度1季度2季度3季度4季度部門一2012182722161929部門二2311241722311234部門三26213433212326321季度2季度3季度4季度部門2005年2006年2005年2006年2005年2006年2005年2006年部門一2022121618192729部門二2322113124121734部門三2621212334263332旋轉前的有關數據描述旋轉后的有關數據描述28鉆取按時間維向下鉆取按時間維向上鉆取6029第三節(jié)數據挖掘技術30什么是數據挖掘?數據挖掘(從數據中發(fā)現(xiàn)知識)從大量的數據中挖掘哪些令人感興趣的、有用的、隱含的、先前未知的和可能有用的模式或知識數據挖掘的替換詞數據庫中的知識挖掘(KDD)知識提煉數據/模式分析數據考古數據捕撈、信息收獲等等。31數據清理數據集成數據庫數據倉庫知識任務相關的數據選擇數據挖掘模式評估32數據挖掘數據庫越來越大有價值的知識可怕的數據數據挖掘背景33數據爆炸,知識貧乏苦惱:淹沒在數據中;不能制定合適的決策!數據知識決策模式趨勢事實關系模型關聯(lián)規(guī)則序列目標市場資金分配貿易選擇在哪兒做廣告銷售的地理位置金融經濟政府POS人口統(tǒng)計生命周期34客戶接觸
客戶信息客戶數據庫統(tǒng)計分析與數據挖掘客戶知識發(fā)現(xiàn)客戶管理知識發(fā)現(xiàn):從數據中深入抽取隱含的、未知的和有潛在用途的信息從商業(yè)數據到商業(yè)智能35各行業(yè)電子商務網站算法層商業(yè)邏輯層行業(yè)應用層商業(yè)應用商業(yè)模型挖掘算法CRM產品推薦客戶細分客戶流失客戶利潤客戶響應關聯(lián)規(guī)則、序列模式、分類、聚集、神經元網絡、偏差分析…WEB挖掘網站結構優(yōu)化網頁推薦商品推薦。。。基因挖掘基因表達路徑分析基因表達相似性分析基因表達共發(fā)生分析。。。銀行電信零售保險制藥生物信息科學研究。。。相關行業(yè)數據挖掘的應用36零售業(yè)用于識別顧客的購買模式,在顧客的統(tǒng)計特征中發(fā)現(xiàn)關聯(lián),預測促銷活動的反應,進行市場分析。啤酒和尿布的的關系,我們非常熟悉!如在購買面包和黃油的顧客中,有90%的人同時也買了牛奶”:(面包+黃油)→(牛奶)。數據挖掘其他應用37銀行洗錢:發(fā)現(xiàn)可疑的貨幣交易行為保險如;保險客戶流失性判斷數據挖掘其他應用收入>5萬元年齡>35歲不易流失易流失是否事業(yè)單位不易流失易流失YNYYNN38股票預設
預測一支股票的走勢幾乎是不可能,但是通過相關分析,可以找出一支股票的走勢與另一只股票走勢的潛在規(guī)律,比如數據挖掘曾經得到過這個結論:“如果微軟的股票下跌4%,那么IBM的股票將在兩周內下跌5%”。醫(yī)療探求各種疾病之間的相互關系、各種疾病的發(fā)展規(guī)律,總結各種治療方案的治療效果,以及對疾病的診斷、治療和醫(yī)學研究是非常有價值和發(fā)展前景的。同時,醫(yī)療數據是既有文本、數據挖掘其他應用39在今天,NBA的教練有了他們的新式武器:決策支持下的數據分析。大約20個NBA球隊使用了IBM公司開發(fā)的數據挖掘軟件來優(yōu)化他們的戰(zhàn)術組合?;鸺目偨浝砟自撥浖鸵驗檠芯苛四g隊隊員不同的布陣,在魔術隊與邁阿密熱隊的比賽中找到了獲勝的機會。(1)系統(tǒng)分析顯示魔術隊先發(fā)陣容中的兩個后衛(wèi)哈德衛(wèi)和伯蘭在前兩場中被評為-17分,這意味著他倆在場上,本隊輸掉的分數比得到的分數多17分。然而,當哈德衛(wèi)與替補后衛(wèi)阿姆斯創(chuàng)組合時,魔術隊得分為正14分。(2)在下一場中,魔術隊增加了阿姆斯創(chuàng)的上場時間。此招果然見效:阿姆斯創(chuàng)得了21分,哈德衛(wèi)得了42分,魔術隊以88比79獲勝。有趣的數據挖掘----美國NBA40數據挖掘的方法
根據數據挖掘的方法分,可粗分為:統(tǒng)計方法機器學習方法神經網絡方法數據庫方法41(1)統(tǒng)計方法回歸分析(多元回歸、自回歸、羅吉斯回歸等)判別分析(貝葉斯判別、費歇爾判別、非參數判別等)聚類分析(系統(tǒng)聚類、動態(tài)聚類等)探索性分析(主元分析法、相關分析法等)以及模糊集、粗糙集、支持向量機等。(2)機器學習歸納學習方法(決策樹(ID3算法)、規(guī)則歸納等)、基于范例的推理CBR遺傳算法貝葉斯信念網絡等。(3)神經網絡方法前向神經網絡(BP算法等)自組織神經網絡(自組織特征映射、競爭學習等)等。(4)數據庫方法基于可視化的多維數據分析或OLAP方法,另外還有面向屬性的歸納方法。數據挖掘是CRM成功的保障CRM中數據挖掘的應用:1.客戶的獲取。把客戶根據其性別、收入、交易行為特征等屬性細分為具有不同需求和交易習慣的群體,同一群體中的客戶對產品的需求以及交易心理等方面具有相似性,而不同群體間差異較大。這樣就有助于企業(yè)在營銷中更加貼近顧客需求。分類和聚類等挖掘方法可以把大量的客戶分成不同的類,適合于進行客戶細分。通過群體細分,CRM用戶可以更好地理解客戶,發(fā)現(xiàn)群體客戶的行為規(guī)律。在行為分組完成后,還要進行客戶理解、客戶行為規(guī)律發(fā)現(xiàn)和客戶組之間的交叉分析。數據挖掘是CRM成功的保障2.重點客戶發(fā)現(xiàn)。就是找出對企業(yè)具有重要意義的客戶,重點客戶發(fā)現(xiàn)主要包括:發(fā)現(xiàn)有價值的潛在客戶;發(fā)現(xiàn)有更多的消費需求的同一客戶;發(fā)現(xiàn)更多使用的同一種產品或服務;保持客戶的忠誠度。根據80/20以及開發(fā)新客戶的費用是保留老客戶費用的5倍等營銷原則,重點客戶發(fā)現(xiàn)在CRM中具有舉足輕重的作用。數據挖掘是CRM成功的保障3.交叉營銷。商家與其客戶之間的商業(yè)關系是一種持續(xù)的不斷發(fā)展的關系,通過不斷地相互接觸和交流,客戶得到了更好更貼切的服務質量,商家則因為增加了銷售量而獲利。交叉營銷指向已購買商品的客戶推薦其他產品和服務。這種策略成功的關鍵是要確保推銷的產品是用戶所感愛好的,有幾種挖掘方法都可以應用于此問題,關聯(lián)規(guī)則分析能夠發(fā)現(xiàn)顧客傾向于關聯(lián)購買哪些商品;聚類分析能夠發(fā)現(xiàn)對特定產品感愛好的用戶群;神經網絡、回歸等方法能夠猜測顧客購買該新產品的可能性。數據挖掘是CRM成功的保障4.客戶分析。主要包括:客戶價值金字塔分析、客戶分布分析、新增客戶分析、流失客戶分析和購買行為分析。其中分類等技術能夠判定具備哪些特性的客戶群體最輕易流失,建立客戶流失猜測模型,從而幫助企業(yè)對有流失風險的顧客提前采取相應營銷措施。利用數據挖掘技術,可以通過挖掘大量的客戶信息來構建猜測模型,較準確地找出易流失客戶群,并制訂相應的方案,最大程度地保持住老客戶。數據挖掘是CRM成功的保障5.性能評估。以客戶所提供的市場反饋為基礎,通過數據倉庫的數據清潔與集中過程,將客戶對市場的反饋自動地輸入到數據倉庫中,從而進行客戶行為跟蹤。性能分析與客戶行為分析和重點客戶發(fā)現(xiàn)是相互交疊的過程,這樣才能保證企業(yè)的客戶關系治理能夠達到既定的目標,建立良好的客戶關系。47關聯(lián)分析
關聯(lián)分析主要用于發(fā)現(xiàn)不同事件之間的關聯(lián)性,即一個事件發(fā)生的同時,另一個事件也經常發(fā)生。關聯(lián)分析的重點在于快速發(fā)現(xiàn)那些有實用價值的關聯(lián)發(fā)生的事件。三、數據挖掘方法的應用舉例48關聯(lián)規(guī)則挖掘記錄號購物清單12345啤酒、尿布、嬰兒爽身粉、面包、雨傘尿布、嬰兒爽身粉啤酒、尿布、牛奶尿布、啤酒、洗衣粉啤酒、牛奶、可樂客戶購物清單單項統(tǒng)計支持度{啤酒}{尿布}{嬰兒爽身粉}{牛奶}0.80.80.40.4單項統(tǒng)計結果49雙項統(tǒng)計支持度{啤酒,尿布}{啤酒,牛奶}{尿布,嬰兒爽身粉}0.60.40.4R1:啤酒~尿布,S=0.6,C=0.6/0.8==0.75R2:尿布~啤酒,S=0.6,C=0.6/0.8==0.75R3:牛奶~啤酒,S=0.4,C=0.4/0.4==1R4:啤酒~牛奶,S=0.4,C=0.4/0.8==0.5R5:尿布~爽身粉,S=0.4,C=0.4/0.8==0.5R6:嬰兒爽身粉~尿布,S=0.4,C=0.4/0.4==l50●現(xiàn)代方法——決策樹(DecisionTree)決策樹的組成決策節(jié)點、分支、葉子———根節(jié)點分支———葉子Debt<10%ofIncomeDebt=0%GoodCreditRisksBadCreditRisksGoodCreditRisksYesYesYesNONONOIncome>$40K節(jié)點
決策樹的分支過程就是對數據進行分類的過程,利用幾個變量(每個變量對應一個問題)來判斷數據所屬的類別。在分支后,要使不同分支之間數據的差異盡可能大、同一分支內的數據盡量相同。這一分割過程也就是數據的“純化”過程。2.決策樹方法決策樹算法決策樹的構造采用自上而下的遞歸構造。以多叉樹為例,其構造思路是:如果訓練樣本集中所有樣本是同類的,則將它作為葉子節(jié)點,節(jié)點內容即是該類別標記;否則,根據某種策略選擇一個屬性,按照屬性的不同取值,將樣本集劃分為若干子集,使得每個子集上的所有樣本在該屬性上具有同樣的屬性值。然后再依次處理各個子集。實際上就是“分而治之”(divide-and-conquer)的策略。二叉樹同理,差別僅在于要選擇一個好的邏輯判斷。
決策樹算法決策樹構造的條件構造好的決策樹的關鍵是:如何選擇好的邏輯判斷或屬性。對于同樣一組樣本,可以有很多決策樹能符合這組樣本。原則:選擇一個最能區(qū)別T中實例的屬性研究表明,一般情況下,樹越小則樹的預測能力越強。要構造盡可能小的決策樹,關鍵在于選擇恰當的邏輯判斷或屬性。一般采用啟發(fā)式策略選擇好的邏輯判斷或屬性。53患者代碼嗓子痛發(fā)燒淋巴腫充血頭痛診斷結果1YesyesYesYesYes咽炎2NoNoNoYesYes敏感癥3YesYesNoYesNo感冒4YesNoYesNoNo咽炎5NoYesNoYesNo感冒6NoNoNoYesNo敏感癥7NoNoYesNoNo咽炎8YesNoNoYesYes敏感癥9NoYesNoYesYes感冒10yesYesnoYesYes感冒淋巴腫數據挖掘實例患者代碼嗓子痛發(fā)燒淋巴腫充血頭痛診斷結果11NoNoYesYesYes?12YesYesNoNoYes?13NoNoNoNoYes?54患者代碼嗓子痛發(fā)燒淋巴腫充血頭痛診斷結果1YesyesYesYesYes咽炎2NoNoNoYesYes敏感癥3YesYesNoYesNo感冒4YesNoYesNoNo咽炎5NoYesNoYesNo感冒6NoNoNoYesNo敏感癥7NoNoYesNoNo咽炎8YesNoNoYesYes敏感癥9NoYesNoYesYes感冒10yesYesNoYesYes感冒淋巴腫發(fā)燒NoNoYesYes咽炎敏感癥感冒淋巴腫、發(fā)燒是有意義的屬性嗓子痛、充血、頭痛是無意義的屬性數據挖掘實例55淋巴腫發(fā)燒NoNoYesYes咽炎敏感癥感冒患者代碼嗓子痛發(fā)燒淋巴腫充血頭痛診斷結果11NoNoYesYesYes?12YesYesNoNoYes?13NoNoNoNoYes?未知分類的數據實例(檢驗集)未知分類的數據檢驗56患者代碼嗓子痛發(fā)燒淋巴腫充血頭痛診斷結果1YesyesYesYesYes咽炎2NoNoNoYesYes敏感癥3YesYesNoYesNo感冒4YesNoYesNoNo咽炎5NoYesNoYesNo感冒6NoNoNoYesNo敏感癥7NoNoYesNoNo咽炎8YesNoNoYesYes敏感癥9NoYesNoYesYes感冒10yesYesnoYesYes感冒淋巴腫發(fā)燒NoNoYesYes敏感癥敏感癥咽炎NoYes頭痛淋巴腫感冒發(fā)燒淋巴腫NoYes咽炎NoYes選取頭痛作為決策屬性決策樹的屬性選取屬性選取標準:最大化反映數據差異,使樹的層次和節(jié)點數最小信用卡促銷數據庫收入段壽險促銷信用卡保險性別年齡4-5萬NoNoM453-4萬YesNoF404-5萬NoNoM423-4萬YesYesM435-6萬YesNoF382-3萬NoNoF553-4萬YesYesM352-3萬NoNoM273-4萬NoNoF433-4萬YesNoF414-5萬YesNoM432-3萬YesNoF295-6萬YesNoF394-5萬NoNoM552-3萬YesYesF19數據挖掘實例—壽險促銷我們將試圖發(fā)現(xiàn)年齡、收入、性別、是否有信用卡保險等因素與是否購買壽險的關聯(lián),從而證實已購買壽險與某些相關因素間的規(guī)則。58收入段壽險促銷信用卡保險性別年齡4-5萬NoNoM453-4萬YesNoF404-5萬NoNoM423-4萬YesYesM435-6萬YesNoF382-3萬NoNoF553-4萬YesYesM352-3萬NoNoM273-4萬NoNoF433-4萬YesNoF414-5萬YesNoM432-3萬YesNoF295-6萬YesNoF394-5萬NoNoM552-3萬YesYesF19○選取收入段為根節(jié)點○選取壽險促銷為輸出屬性○沿著每個分支有兩個類,選取最頻繁出現(xiàn)的類收入段2Yes2No4Yes1No3No1Yes2Yes2—3萬3—4萬4—5萬5—6萬○訓練集分類的正確性為11/15=73%數據挖掘實例—壽險促銷59——決策樹(DecisionTree):例信用卡促銷數據庫○選取信用卡保險為根節(jié)點○選取壽險促銷為輸出屬性○沿著每個分支有兩個類,選取最頻繁出現(xiàn)的類信用卡保險6Yes6No3Yes0NoNoYes○訓練集分類的正確性為9/15=60%收入段壽險促銷信用卡保險性別年齡4-5萬NoNoM453-4萬YesNoF404-5萬NoNoM423-4萬YesYesM435-6萬YesNoF382-3萬NoNoF553-4萬YesYesM352-3萬NoNoM273-4萬NoNoF433-4萬YesNoF414-5萬YesNoM432-3萬YesNoF295-6萬YesNoF394-5萬NoNoM552-3萬YesYesF1960——決策樹(DecisionTree):例信用卡促銷數據庫○選取數值型屬性年齡為根節(jié)點○選取壽險促銷為輸出屬性○依照年齡排序,對照輸出屬性進行數據分割,選擇數據分割點年齡9Yes3No0Yes3No≤43>43○以年齡≤43結合壽險促銷=Yes,訓練集分類的正確性為12/15=80%172729353839404142434343455555YNYYYYYYNYYNNNN收入段壽險促銷信用卡保險性別年齡4-5萬NoNoM453-4萬YesNoF404-5萬NoNoM423-4萬YesYesM435-6萬YesNoF382-3萬NoNoF553-4萬YesYesM352-3萬NoNoM273-4萬NoNoF433-4萬YesNoF414-5萬YesNoM432-3萬YesNoF295-6萬YesNoF394-5萬NoNoM552-3萬YesYesF1961信用卡促銷數據庫年齡Yes(6/1)No(2/1)≤43>43性別FM信用卡保險Yes(2/0)No(3/0)NoYes信用卡數據庫的三節(jié)點決策樹○訓練集分類的正確性為13/15=87%收入段壽險促銷信用卡保險性別年齡4-5萬NoNoM453-4萬YesNoF404-5萬NoNoM423-4萬YesYesM435-6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年租賃合同租金支付與租賃物描述
- 2024隗蓉與科技公司關于物聯(lián)網設備研發(fā)的合同
- 2024版住宅小區(qū)物業(yè)經理聘任協(xié)議版
- 2025年度除塵設備節(jié)能效果評估合同3篇
- 2024某科技公司與某大學關于科研合作的合同
- 2024版婚內財產公證的協(xié)議書范本
- 二零二五年度金融信托補充協(xié)議3篇
- 西湖大學《人體形態(tài)與結構》2023-2024學年第一學期期末試卷
- 西安健康工程職業(yè)學院《小學語文課標解讀與教材分析》2023-2024學年第一學期期末試卷
- 二零二五年社會福利機構勞動合同員工保障與社保合同2篇
- 張家界喀斯特地貌
- 讓學生看見你的愛
- 銷售禮盒營銷方案
- 領導溝通的藝術
- 發(fā)生用藥錯誤應急預案
- 南潯至臨安公路(南潯至練市段)公路工程環(huán)境影響報告
- 綠色貸款培訓課件
- 大學生預征對象登記表(樣表)
- 主管部門審核意見三篇
- 初中數學校本教材(完整版)
- 父母教育方式對幼兒社會性發(fā)展影響的研究
評論
0/150
提交評論