移動飛信業(yè)務(wù)數(shù)據(jù)挖掘_第1頁
移動飛信業(yè)務(wù)數(shù)據(jù)挖掘_第2頁
移動飛信業(yè)務(wù)數(shù)據(jù)挖掘_第3頁
移動飛信業(yè)務(wù)數(shù)據(jù)挖掘_第4頁
移動飛信業(yè)務(wù)數(shù)據(jù)挖掘_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、飛信業(yè)務(wù)數(shù)據(jù)挖掘 華院分析 2010年4月 2 內(nèi)容內(nèi)容 潛在飛信用戶預(yù)測潛在飛信用戶預(yù)測 飛信用戶飛信用戶關(guān)聯(lián)分析關(guān)聯(lián)分析 飛信用戶內(nèi)部分群飛信用戶內(nèi)部分群 3 三個業(yè)務(wù)問題 飛信的潛在用戶在哪里,能估算用戶加入的概率 嗎? 飛信與什么業(yè)務(wù)組合最容易引起客戶的興趣? 飛信客戶群是否還可細(xì)分,以便采取不同的營銷 策略? 數(shù)據(jù)挖掘嘗試來回答這些問題 4 什么是數(shù)據(jù)挖掘 按既定業(yè)務(wù)目標(biāo),對大量的企業(yè)數(shù)據(jù)進 行探索,揭示隱藏其中的規(guī)律性,并進一步 將其模型化的先進、有效的方法 5 內(nèi)容內(nèi)容 潛在飛信用戶預(yù)測潛在飛信用戶預(yù)測 飛信用戶飛信用戶關(guān)聯(lián)分析關(guān)聯(lián)分析 飛信用戶內(nèi)部分群飛信用戶內(nèi)部分群 6 方法

2、論 基于現(xiàn)有飛信用戶和普通用戶樣本,搜 集和判斷影響用戶成為飛信用戶的要素,采 用邏輯回歸的方法訓(xùn)練樣本得到回歸模型, 用以計算未來用戶成為飛信用戶的概率 7 預(yù)測步驟 實施實施 方法論方法論 選擇樣本用戶 分析影響因素 選擇重要變量 建立預(yù)測模型 驗證評估模型 8 一、選擇樣本用戶 飛信樣本飛信樣本 普通樣本普通樣本 訓(xùn)練樣本 在網(wǎng)三個月以上 1月注冊成飛信 1-2月連續(xù)活躍 共3萬用戶 隨機抽取普通 用戶 共30萬用戶 樣本一 樣本二 樣本用戶的選擇需要確保其能真實體 現(xiàn)飛信或普通用戶的一般特征,剔除由于 促銷活動等引發(fā)的“非正常”用戶 樣本需體現(xiàn)普遍性 9 二、分析影響因素 rfm(r代

3、表最近值、f代表頻度值、 m代表幣值) 是將客戶特征化的經(jīng) 典方法,最早應(yīng)用于目錄營銷服 務(wù)行業(yè) 我們認(rèn)為年齡、性別、品牌、交 往圈及終端等自然屬性是影響用 戶成為飛信用戶的關(guān)鍵因素 rfm變量自然屬性 用戶使用移動通信語音、短信、 彩信、gprs等服務(wù)產(chǎn)生的業(yè)務(wù) 量及收入也作為可能的影響因 子納入進來 消費特征 哪些方面的因素是飛信用戶區(qū) 別于普通用戶的特征呢? 10 1、rfm變量 我們認(rèn)為假如用戶最近定購過新業(yè)務(wù)類或夢網(wǎng)類產(chǎn)品,或者近 2年定購的次數(shù)比較多,則用戶繼續(xù)定購新業(yè)務(wù)產(chǎn)品(比如飛信) 的可能性會比較高,因此納入以下變量: 近2年新業(yè)務(wù)產(chǎn)品定購次數(shù)、最近新業(yè)務(wù)產(chǎn)品定購間隔、新業(yè)務(wù)

4、產(chǎn)品當(dāng)前有效個數(shù) 短信類、彩信類、 gprs類、wlan類、 手機郵箱類、語音 增值類、來電助手類 基礎(chǔ)通信類 商務(wù)類、博客類、手 機報類、音樂類、彩 信類 生活娛樂商務(wù)類 由于夢網(wǎng)產(chǎn)品無明確 細(xì)分方法,只能以總 的為依據(jù) 夢網(wǎng)類 新業(yè)務(wù)細(xì)分 注:彩鈴、來電助手等由于捆綁性質(zhì)居多,無法體現(xiàn)真實用戶使用趨向,這里統(tǒng)一未納入考慮 三大變量 11 2、自然屬性 我們認(rèn)為年齡、品牌、交往圈及終端等自然屬性是影響用戶成 為飛信用戶的關(guān)鍵因素 通過單變量回歸分析 ,發(fā)現(xiàn)32歲是一個比 較顯著的飛信用戶分 水嶺 年齡 飛信用戶以交流為主,因 此用戶交往圈的大小具有 重要意義,通過單變量回 歸分析發(fā)現(xiàn),在一定

5、時間 段內(nèi)有3次以上在不同天有 通話的對端用戶才是有效 交往用戶 交往圈 是否屬于動感地帶用 戶是一個重要布爾變 量 品牌 是否終端支持性別在網(wǎng)時長 12 3、消費特征 用戶使用移動通信語音、短信、彩信、gprs等服務(wù)產(chǎn)生的業(yè)務(wù)量及 收入也作為可能的影響因子納入進來。 為了降低短時間內(nèi)異常消費行為的影響,比如促銷,所有的消費行 為數(shù)據(jù)都以近2年的月均消費為基準(zhǔn)。 近2年收入 近2年優(yōu)惠收入 近2年sp費收入 收入類(10個) 近2年通話時長 近2年本地通話時長 近2年省內(nèi)漫游通話時長 近2年省際漫游通話時長 語音類(20個) 近2年短信發(fā)送條數(shù) 近2年彩信發(fā)送條數(shù) 近2年cmwap次數(shù) 近2年

6、彩鈴下載次數(shù) 新業(yè)務(wù)類(40個) 13 三、選擇重要變量 共規(guī)整收集150個變量,采用后向、逐步回歸方法,逐步淘汰不相 關(guān)變量,最終選擇穩(wěn)定的排名前20的變量作為飛信影響因素(模型輸入變量) 值得關(guān)注的現(xiàn)象: arpu、mou等常規(guī)用戶 價值度量與飛信用戶相關(guān) 性非常小,rfm變量則體 現(xiàn)出其價值 14 三、選擇重要變量 基于對業(yè)務(wù)和客戶的理解,選擇出合適的影 響要素(變量),是決定模型成敗的關(guān)鍵一步 要素的搜集和規(guī)整工作是模型建立中最艱苦 而耗時的部分 15 四、建立預(yù)測模型 實際模型: logit=log(p/(1-p)logit=log(p/(1-p) 2.1878 (p代表成為飛信用戶

7、的概率) +0.1427*trademark (品牌) +0.3098*is_trademark4 (是否動感地帶) -0.4207*is_age32 (年齡是否小于32) -1.2125*is_sphere3_1_11 (交往圈是否小于11) -1.3080*is_sphere3_12_15 (交往圈是否在12與15之間) -1.2624*is_sphere3_16_19 (交往圈是否在16與19之間) -1.0657*is_sphere3_20 (交往圈是否大于20) +0.4971*is_feixin_term (是否飛信終端) +0.000134*n_mu_l_date_logi (最

8、近定購的音樂產(chǎn)品間隔 log倒數(shù)) +0.0471*cmwap_counts_sqrt (cmwap上網(wǎng)次數(shù) sqrt平方根) -2.0817*n_apply_2_counts (近兩年月均產(chǎn)品定購次數(shù)) -1.6197*n_apply_2_counts_cos (近兩年月均產(chǎn)品定購次數(shù) cos) +0.7396*n_gprs_l_date7 (近7個月內(nèi)是否定購過gprs產(chǎn)品) +0.1916*n_gprs_l_date_sin (最近定購的gprs產(chǎn)品間隔 sin) -0.00005*n_mu_l_c_cui (近兩年月均音樂產(chǎn)品定購次數(shù) 立方的倒數(shù)) +0.5477*n_gprs_app

9、ly_counts114 (近兩年月均gprs產(chǎn)品定購次數(shù)) +0.000089*n_paper_l_date_logi (最近定購的手機報產(chǎn)品間隔 log倒數(shù)) +1.0152*n_paper_i_a_c_sqrt (近兩年月均手機報定購次數(shù) 平方根) +2.6438*n_mail_apply_counts_sqrt (近兩年月均手機郵箱定購次數(shù) 平方根) +0.3913*n_sms_a_l_d5 (最近是否定購過短信產(chǎn)品) -0.0558*n_b_a_l_d_curt (最近定購的商務(wù)類產(chǎn)品間隔 curt) -0.00002*n_a_l_d_logi (最近定購產(chǎn)品的間隔 log倒數(shù)) -

10、0.00003*vpmn_c_d_logi (最近定購vpmn產(chǎn)品的間隔 log倒數(shù)) -0.00003*nismg_a_l_d_sini (最近定購夢網(wǎng)產(chǎn)品的間隔 sin倒數(shù)) -0.00015*n_add_a_c_cui (近兩年月均語音增值產(chǎn)品次數(shù) 立方的倒數(shù)) +0.0292*sms_mo_counts_sqrt (近兩年月均短信發(fā)送次數(shù) 平方根) +0.00343*gprs_volume_curt (近兩年月均gprs流量 curt) -0.00004*n_c_i_a_c_cui (近兩年月均彩鈴產(chǎn)品定購次數(shù) 立方的倒數(shù)) 針對所選變量采用邏輯回歸方法,訓(xùn)練得到擬合方程式: logi

11、t=log(p/(1-p)=ax0+bx1+cx2+ 其中: p代表成為飛信的概率 x0、x1、x2等代表所選的變量(影響因素) a、b、c等代表計算得到的系數(shù) p即為計算得到的飛信活躍用戶的概率 模型確立后,只要 數(shù)據(jù)收集完整,非常容 易推廣和應(yīng)用到實際的 營銷中,由于是以概率 為度量,可以對營銷數(shù) 量進行靈活的控制 16 四、建立預(yù)測模型(預(yù)測舉例) 假如某用戶資料如下: 品牌:全球通 年齡:33 交往圈:68 終端:支持飛信 最近一次訂購音樂類產(chǎn)品的時間間隔:20個月 最近2年月均cwmap上網(wǎng)次數(shù):33次 最近2年月均產(chǎn)品定購次數(shù):0.3次 最近增值類產(chǎn)品參加時間間隔:3個月 最近2年

12、月均vpmn時長:950分鐘 最近一次訂購夢網(wǎng)類產(chǎn)品的時間間隔:3個月 最近2年月均短信發(fā)送次數(shù):13條 最近2年月均流量:2m 則計算其成為飛信活躍用戶的概率為: 29.6%29.6% 17 五、模型驗證 十分位分析 十分位樣本量預(yù)測概率實際比例 0209990.374430.36359 1210000.168380.19457 2210000.1230.12638 3210000.092030.09143 4210000.071420.06848 5210000.055650.05038 6210000.044680.03995 7210000.03570.03195 8210000.02

13、8160.02462 9210000.019760.02186 total 2099990.101320.10132 十分位分析是驗證模型健壯性的常用方法,其將樣本按照預(yù)測概率 高低排序等分為10等份,通過以下兩種方式來檢查模型的強壯性: (1)每個等分內(nèi)預(yù)測概率與實際情況的差異 (2)最高最低等分預(yù)測概率的差異 預(yù)測概率均值與實際 情況相差很小 最佳十分位是最差十 分位預(yù)測概率的18倍 非常好的區(qū)分性能 注:為了防止模型的過渡適應(yīng),即它吸收了數(shù)據(jù)中的非規(guī)則元素,往往還需采用重采 樣方式來驗證模型健壯性 18 內(nèi)容內(nèi)容 潛在飛信用戶預(yù)測潛在飛信用戶預(yù)測 飛信用戶飛信用戶關(guān)聯(lián)分析關(guān)聯(lián)分析 飛信用

14、戶內(nèi)部分群飛信用戶內(nèi)部分群 19 方法論 基于現(xiàn)有飛信用戶注冊的各類新業(yè)務(wù)套 餐產(chǎn)品信息,從中找出與飛信產(chǎn)品最相關(guān)的 產(chǎn)品組合,從而指導(dǎo)交叉銷售產(chǎn)品設(shè)計,也 可作為一種發(fā)現(xiàn)潛在飛信用戶的手段 20 關(guān)聯(lián)度排名(二產(chǎn)品組合)關(guān)聯(lián)度排名(二產(chǎn)品組合) 左圖列舉了飛信用戶同時選用 其它套餐產(chǎn)品的支持度排名情況 可見其與gprs、無線音樂、彩 信等產(chǎn)品具有較強的關(guān)聯(lián)性,對于 日常營銷中的交叉銷售設(shè)計具有一 定的參考意義 注:剔除了彩鈴、來電助手等現(xiàn)捆綁性質(zhì)居多的 產(chǎn)品 關(guān)聯(lián)度排名(二產(chǎn)品組合) 排名支持度與“飛信”相關(guān)的營銷產(chǎn)品 115.595元套餐 210.8無線音樂俱樂部高級會員 38.98彩信指

15、上炫 48.34新聞早晚報 58.21數(shù)據(jù)撥號國內(nèi) 67.27動感ip長途4折 77.0520元套餐 85.87手機炒股專業(yè)版 95.2手機郵箱 104.86無線音樂俱樂部普通會員 114.62音樂特權(quán)免費鈴音 124.36免費帳單郵箱 134.32校園動感新天地套餐 144.28神州行家園卡18套餐 154.01動感地帶10元包套餐 163.84gprs2元套餐 173.61動感單向音樂套餐 21 關(guān)聯(lián)度排名(多產(chǎn)品組合)關(guān)聯(lián)度排名(多產(chǎn)品組合) 關(guān)聯(lián)度排名(四產(chǎn)品組合) 排名支持度與“飛信”相關(guān)的營銷產(chǎn)品 12.2 校園動感新天地套餐、動感地帶優(yōu)惠期長話包(新 )、 彩信指上炫 21.68

16、 校園動感新天地套餐、彩信指上炫 、 5元套餐 31.67 無線音樂俱樂部高級會員、動感單向音樂套餐 、 動感ip長途4折 41.53 音樂特權(quán)免費鈴音 、 無線音樂俱樂部高級會員 、 動感ip長途4折 51.3手機郵箱 、手機炒股專業(yè)版、全球通 61.26 動感地帶10元包套餐、彩信指上炫 、 20元套餐 71.22 音樂特權(quán)免費鈴音 、 無線音樂俱樂部高級會員 、 動感單向音樂套餐 81.12 神州行升級包 、 神州行家園卡18套餐、2元包40 條 91.09 動感單向音樂套餐 、 無線音樂俱樂部高級會員 、 5元套餐 101.04手機郵箱 、全球通、本地一機雙號主號 關(guān)聯(lián)度排名(三產(chǎn)品組

17、合) 排名支持度與“飛信”相關(guān)的營銷產(chǎn)品 14.01校園動感新天地套餐、彩信指上炫 23.61音樂特權(quán)免費鈴音 、 無線音樂俱樂部高級會員 33.39動感地帶10元包套餐、20元套餐 43.38無線音樂俱樂部高級會員、動感單向音樂套餐 53.32無線音樂俱樂部高級會員、動感ip長途4折 62.85彩信指上炫、5元套餐 72.68無線音樂俱樂部高級會員、5元套餐 82.31手機郵箱 、 手機炒股專業(yè)版 92.2校園動感新天地套餐、動感地帶優(yōu)惠期長話包(新) 102.2動感地帶優(yōu)惠期長話包(新)、彩信指上炫 112.1彩信指上炫、20元套餐 122.05手機郵箱 、 全球通 131.88新聞早晚報、5元套餐 141.85神州行升級包 、 神州行家園卡4 151.85新聞早晚報 、 無線音樂俱樂部高級會員 以上可作為多產(chǎn)品交叉銷售的參考 22 內(nèi)容內(nèi)容 潛在飛信用戶預(yù)測潛在飛信用戶預(yù)測 飛信用戶飛信用戶關(guān)聯(lián)分析關(guān)聯(lián)分析 飛信用戶內(nèi)部分群飛信用戶內(nèi)部分群 23 方法論 基于現(xiàn)有飛信用戶,將其劃分為多個分 組并總結(jié)特征,使得組內(nèi)客戶高度相似,組 間客戶差異明顯,發(fā)現(xiàn)各個分群的客戶

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論