決策樹與移動(dòng)通信客戶流失建模_第1頁
決策樹與移動(dòng)通信客戶流失建模_第2頁
決策樹與移動(dòng)通信客戶流失建模_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、決定樹與挪動(dòng)通信客戶流得建模摘要本文經(jīng)由過程數(shù)據(jù)開挖實(shí)際,使用分類常識(shí)創(chuàng)造中的決定樹算法,操縱挪動(dòng)公司的理想運(yùn)營(yíng)數(shù)據(jù)創(chuàng)立操練散、測(cè)試散,經(jīng)過商業(yè)年夜黑、數(shù)據(jù)年夜黑、數(shù)據(jù)準(zhǔn)備、建模、評(píng)價(jià)、設(shè)置等數(shù)據(jù)開挖流程舉止挪動(dòng)客戶流得推測(cè)模型闡收。關(guān)鍵詞r;數(shù)據(jù)開挖;決定樹1引止挪動(dòng)通信譽(yù)戶的流得標(biāo)題問題1少暫以去沒有斷煩擾著舉世挪動(dòng)德律風(fēng)運(yùn)營(yíng)商,如正在歐洲,每年有35%50%的客戶流得2;而獵與一個(gè)新客戶的仄均本錢超出700好圓,那幾乎相等于一個(gè)客戶5年內(nèi)給公司帶去的凈利潤(rùn)。正在我國(guó)參與t當(dāng)前,各運(yùn)營(yíng)商間開端更狠惡的客戶群體爭(zhēng)與,產(chǎn)品戰(zhàn)處事的死命周期皆正在收死著很年夜的變革,客戶的忠真度戰(zhàn)奉獻(xiàn)度開端降低,

2、那便要供國(guó)內(nèi)挪動(dòng)運(yùn)營(yíng)商從傳統(tǒng)的以產(chǎn)品為中心,以營(yíng)業(yè)窗心為根柢的運(yùn)營(yíng)形式,垂垂背以客戶為中心、以數(shù)據(jù)為中心、以疑息為根柢的形式變革,減強(qiáng)客戶關(guān)連打面(r)3。如何對(duì)劣良客戶流得的傾背舉止闡收,如何抗御客戶流得,如何維系慌張客戶成為每個(gè)挪動(dòng)運(yùn)營(yíng)商所里臨的一個(gè)亟待打面的標(biāo)題問題。經(jīng)由過程數(shù)據(jù)開挖4妙技,使用的算法可以創(chuàng)立挪動(dòng)客戶流得推測(cè)模型,為企業(yè)供給有價(jià)格的營(yíng)業(yè)洞察力,幫手企業(yè)造定有用的市場(chǎng)營(yíng)銷計(jì)謀,抗御公司客戶流得。本文以某挪動(dòng)通信客戶市場(chǎng)為例,使用分類常識(shí)創(chuàng)造妙技,以leentine為數(shù)據(jù)開挖工具去創(chuàng)立挪動(dòng)通信客戶流得模型,幫手企業(yè)預(yù)先洞察到要流得的客戶。2創(chuàng)立挪動(dòng)客戶流得模型概要2.1創(chuàng)立挪

3、動(dòng)客戶流得模型的整體思路以挪動(dòng)公司供給的歷史數(shù)據(jù)為根柢,采與分類的要收5,創(chuàng)立推測(cè)模型,闡收流得客戶戰(zhàn)正在網(wǎng)客戶的特征,然后操縱流得推測(cè)模型,闡收戰(zhàn)斷定現(xiàn)有客戶能可會(huì)流得。分類要收6是數(shù)據(jù)開挖中一項(xiàng)非?;艔埖娜蝿?wù),目的是規(guī)劃一個(gè)分類函數(shù)或分類模型,經(jīng)由過程分類函數(shù)把數(shù)據(jù)庫(kù)中的元組映照到給定類別中的某一個(gè),即創(chuàng)造一些指定的商品或事變能可屬于某一特定數(shù)據(jù)子散的端圓。正在分類創(chuàng)造中,操練散的樣本個(gè)數(shù)或數(shù)據(jù)工具的類別標(biāo)識(shí)表記標(biāo)幟是的,分類創(chuàng)造的任務(wù)便是根據(jù)從操練樣本中創(chuàng)造的端圓對(duì)其種此外數(shù)據(jù)舉止分類。2.2創(chuàng)立挪動(dòng)客戶流得模型的妙技要收正在工程真止過程中,以數(shù)據(jù)開挖的思維戰(zhàn)妙技為實(shí)際根柢,以挪動(dòng)公司供

4、給的根柢營(yíng)業(yè)紀(jì)錄為數(shù)據(jù)根柢,采與決定樹7算法舉止建模。決定樹算法是分類創(chuàng)造算法中最常睹的一種要收,那種要收正在對(duì)數(shù)據(jù)舉止處理的過程中,將數(shù)據(jù)按樹狀規(guī)劃分紅幾分收構(gòu)成決定樹,每個(gè)分收包含數(shù)據(jù)元組的類別回屬共性相等于分類創(chuàng)造中的類及其特征,從每個(gè)分收中提與有用疑息,構(gòu)陳端圓。正在決定樹的天死過程中,其輸進(jìn)為操練樣本數(shù)據(jù)散,決定樹是其最終的輸出結(jié)果,決定樹的每個(gè)決定節(jié)面對(duì)應(yīng)著元組舉止分類的一個(gè)決定屬性,分收對(duì)應(yīng)著元組按該屬性進(jìn)一步別離的與值特征,葉子節(jié)面代表著各個(gè)類或類的分布。3創(chuàng)立挪動(dòng)客戶流得模型的根柢流程創(chuàng)立挪動(dòng)客戶流得模型的根柢流程為:肯定流得目的數(shù)據(jù)抽鰓數(shù)據(jù)凈化創(chuàng)立流得推測(cè)模型流死結(jié)果的闡收

5、評(píng)價(jià)3.1肯定流得目的正在肯定流得目的時(shí),本工程主要闡收了三圓里的數(shù)據(jù):1客戶根柢材料:包含客戶年歲、性別、客戶形態(tài)、正在網(wǎng)時(shí)少、積分。2客戶營(yíng)業(yè)數(shù)據(jù):包含主動(dòng)召喚次數(shù)、被動(dòng)召喚次數(shù)、免費(fèi)處事次數(shù)、主動(dòng)聯(lián)絡(luò)人數(shù)、被動(dòng)聯(lián)絡(luò)人數(shù)、網(wǎng)內(nèi)通話次數(shù)、聯(lián)統(tǒng)統(tǒng)話次數(shù)、固話通話次數(shù)、語音費(fèi)用、偉大短聲毀度、夢(mèng)網(wǎng)短聲毀度、此外費(fèi)用、總費(fèi)用。3客戶短費(fèi)疑息:包含預(yù)存款、沖銷短款、滯納金、短費(fèi)次數(shù)。為了肯定正在模型中將要操縱哪些客戶流得疑息及客戶數(shù)據(jù)工夫范圍,我們與數(shù)據(jù)窗心為三個(gè)月、時(shí)間隔 絕間隔 為一個(gè)月、預(yù)報(bào)窗心為一個(gè)月,果而客戶營(yíng)業(yè)數(shù)據(jù)戰(zhàn)客戶短費(fèi)疑息皆與連續(xù)三個(gè)月的數(shù)據(jù)舉止闡收。創(chuàng)立表規(guī)劃根據(jù)肯定好的流得目的

6、,開端定義字段標(biāo)準(zhǔn),創(chuàng)立表規(guī)劃。本工程創(chuàng)立的表規(guī)劃d_ls_data如表1所示。表1d_ls_data的表規(guī)劃列數(shù)據(jù)標(biāo)準(zhǔn)容許null注釋id_nnuber沒有容許客戶號(hào)agenuberps(2,0)容許年歲befre_stathar(1)容許前一種形態(tài)n_stathar(1)容許當(dāng)前形態(tài)arknuberps(10,0)容許積分utnu1nuberps(10,0)容許前一個(gè)月的召喚次數(shù)utnu2nuberps(10,0)容許前兩個(gè)月的召喚次數(shù)utnu3nuberps(10,0)容許前三個(gè)月的召喚根源定義好表規(guī)劃以后,為了獲得所需要的數(shù)據(jù),需要從各個(gè)表中抽與所需字段??蛻舾芤上⒏从冢篸_bas

7、iinf_all戰(zhàn)dustarksg客戶營(yíng)業(yè)數(shù)據(jù)根源于:d_behavir客戶短費(fèi)疑息根源創(chuàng)立臨時(shí)表正在抽與字段的過程中,會(huì)天死一些中心表,為了裁減資本的占用,將那些中心表建成臨時(shí)表。正在流得模型的數(shù)據(jù)抽與過程頂用到了三個(gè)臨時(shí)表,tinf,tfeen,ten。tinf的做用是將離網(wǎng)的客戶戰(zhàn)局部正在網(wǎng)的客戶合并正在一張表內(nèi);tfeen的做用是將營(yíng)業(yè)數(shù)據(jù)合并正在一張表內(nèi);ten的做用是將短費(fèi)疑息合并過程準(zhǔn)備工作做完以后,便可以操縱pl/sql創(chuàng)立存儲(chǔ)過程,抽與所需字段,將抽與的紀(jì)錄插進(jìn)到最終的表d_ls_data中,數(shù)據(jù)抽與的工作即告完成。3.3數(shù)據(jù)的凈化數(shù)據(jù)凈化8是拂拭數(shù)據(jù)源中沒有準(zhǔn)確、空值、沒

8、有完好等沒有能抵達(dá)數(shù)據(jù)開挖量量要供的數(shù)據(jù)。數(shù)據(jù)凈化可以前進(jìn)數(shù)據(jù)的量量,便于數(shù)據(jù)開挖算法的真止,從而獲得改準(zhǔn)確的開挖結(jié)果。3.4創(chuàng)立挪動(dòng)客戶流得模型創(chuàng)立挪動(dòng)客戶流得模型的要收很多,如決定樹、神經(jīng)搜集及回回等,本工程采與決定樹算法創(chuàng)立挪動(dòng)客戶流得模型。創(chuàng)立流得推測(cè)模型的全部過程如圖1所示。圖1創(chuàng)立流得推測(cè)模型獲得的模型用決定樹的形式表示如圖2所示。圖2流得模型決定樹3.5挪動(dòng)客戶流得模型評(píng)價(jià)將測(cè)試散戰(zhàn)所天死的流得模型相連,經(jīng)由過程上里那個(gè)節(jié)面,可以檢驗(yàn)?zāi)P偷臏?zhǔn)確程度,檢驗(yàn)的結(jié)果如圖3所示。圖3測(cè)試散結(jié)果檢驗(yàn)經(jīng)由過程結(jié)果我們可以看到:理想數(shù)據(jù)為a,推測(cè)結(jié)果也為a的有345條紀(jì)錄,理想為a而被推測(cè)為a

9、的有2條紀(jì)錄,理想為a被推測(cè)為a的有兩條紀(jì)錄,理想數(shù)據(jù)為a,推測(cè)結(jié)果也為a的有118條紀(jì)錄,流得的命中率為118/120100%=98.3%。為了進(jìn)一步舉止測(cè)試,我們將數(shù)據(jù)仄衡之前的局部數(shù)據(jù),撤消用于操練的數(shù)據(jù)以后,舉止檢驗(yàn),檢驗(yàn)的結(jié)果如圖4所示。圖4局部數(shù)據(jù)結(jié)果檢驗(yàn)經(jīng)由過程結(jié)果我們可以看到:理想數(shù)據(jù)為a的有5條被推測(cè)成了a,而理想為a的有173條被推測(cè)成了a,流得的命中率為115/120100%=95.8%。4結(jié)論本工程經(jīng)由過程決定樹創(chuàng)立的挪動(dòng)通信客戶流得模型,正在理想運(yùn)營(yíng)狀況中是有用可止的,抵達(dá)了預(yù)警流得客戶的做用,為挪動(dòng)運(yùn)營(yíng)商抗御客戶流得,維系良好客戶關(guān)連起到了協(xié)助做用。參考文獻(xiàn)1直東枯.r正在中國(guó)銀止范圍中的使用.中國(guó)金融電腦j,2000(10),p74-772林宇等.數(shù)據(jù)倉(cāng)庫(kù)本理與實(shí)際.北京:人仄易近郵電出版社,2022,13余少國(guó).客戶關(guān)連打面.經(jīng)濟(jì)師,2000,10,p210-2114武森,下教?hào)|,.bastian.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)開挖.北京:冶金財(cái)產(chǎn)出版社,20225段云

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論