數(shù)據(jù)挖掘?qū)嵺`應(yīng)用_第1頁(yè)
數(shù)據(jù)挖掘?qū)嵺`應(yīng)用_第2頁(yè)
數(shù)據(jù)挖掘?qū)嵺`應(yīng)用_第3頁(yè)
數(shù)據(jù)挖掘?qū)嵺`應(yīng)用_第4頁(yè)
數(shù)據(jù)挖掘?qū)嵺`應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

據(jù)挖掘?qū)嵺`應(yīng)用(93,

標(biāo)用戶特征分析的不同思路分享”

及“2011個(gè)人年度總結(jié)"

本日志的緣起:本文是我年后在數(shù)據(jù)分析團(tuán)隊(duì)內(nèi)部分享的一個(gè)專題項(xiàng)目的思路匯總,條條大路通羅馬,任何一個(gè)數(shù)據(jù)分析課題也一定是可以有不同的思路不同的算法不同的技術(shù)殊途同歸的,我的分享的目的在于通過(guò)真實(shí)的業(yè)務(wù)需求和業(yè)務(wù)數(shù)據(jù),引導(dǎo)分析團(tuán)隊(duì)內(nèi)部集體討論,發(fā)動(dòng)大家參與,相互切磋,從而提升數(shù)據(jù)分析團(tuán)隊(duì)整體的分析能力和水平。

項(xiàng)目背景:P4P(在線廣告競(jìng)價(jià)排名,paymentforperformance)產(chǎn)品是互聯(lián)網(wǎng)行業(yè)平臺(tái)型企業(yè)的一個(gè)重要收入來(lái)源,由于組織架構(gòu)的因素,以前我們的P4P產(chǎn)品的相關(guān)數(shù)據(jù)挖掘模型(比如付費(fèi)用戶預(yù)測(cè)打分模型)是由數(shù)據(jù)倉(cāng)庫(kù)團(tuán)隊(duì)、算法團(tuán)隊(duì)開(kāi)發(fā)、嵌入、固化業(yè)務(wù)流程,人工的銷售服務(wù)還沒(méi)有類似的分析模型可以支持。最近,隨著新的組織架構(gòu)調(diào)整,電話銷售團(tuán)隊(duì)承擔(dān)了P4P產(chǎn)品售賣的部分KPI,業(yè)務(wù)方因此提出了新的需求,“找出P4P消費(fèi)用戶的典型特征,由此可以讓電話銷售團(tuán)隊(duì)因地制宜圈定不同的目標(biāo)群體,并同時(shí)制定相應(yīng)的不同運(yùn)營(yíng)賣點(diǎn),即運(yùn)營(yíng)抓手,。(提請(qǐng)注意的是,這里的典型特征不是指單一維度的分布特征,而是要找出多維度并存組合時(shí)的特征)

很明顯,這里的業(yè)務(wù)需求就不是前期的“P4P目標(biāo)付費(fèi)用戶預(yù)測(cè)打分模型”可以滿足的;兩者有什么區(qū)別呢?從數(shù)據(jù)挖掘理論上看似乎可以沒(méi)有區(qū)別,但是在業(yè)務(wù)實(shí)踐場(chǎng)景下,差別太大了?!按蚍帜P汀钡漠a(chǎn)出物是一批潛在用戶的member_id以及相應(yīng)的付費(fèi)概率數(shù)值,業(yè)務(wù)方不需要在乎模型里面的具體的預(yù)測(cè)變量有哪些,變量之間的線性或非線性關(guān)系,也不需要知道各個(gè)預(yù)測(cè)變量的閥值;打分模型的優(yōu)點(diǎn)是精確,效率高,缺點(diǎn)是每個(gè)周期都要打分,而且比較死板,缺乏靈活性;而“付費(fèi)用戶典型特征模型,的產(chǎn)出物是不僅要找出付費(fèi)用戶典型特征的字段(這里的特征是不僅在統(tǒng)計(jì)上有意義,更要求在業(yè)務(wù)應(yīng)用中有意義,有實(shí)用性。很多時(shí)候,統(tǒng)計(jì)上的顯著性到了業(yè)務(wù)實(shí)踐中其實(shí)并沒(méi)有應(yīng)用價(jià)值的,最典型的一個(gè)例子就是,付費(fèi)用戶中男女比例52:48,相對(duì)潛在目標(biāo)群體來(lái)說(shuō),這個(gè)比例從統(tǒng)計(jì)學(xué)上看是顯著的,但是在實(shí)踐應(yīng)用中,單純看這個(gè)性別的顯著性特征其實(shí)是沒(méi)有什么運(yùn)營(yíng)價(jià)值的,沒(méi)有誰(shuí)會(huì)因此聚焦在男性群體里進(jìn)行營(yíng)銷)更要找出這些典型特征字段組合在一起的數(shù)值區(qū)間閥僮比如近30天的登錄天次大于25天,并且近30天交易訂單數(shù)量大于15,等等);“付費(fèi)用戶典型特征模型”優(yōu)點(diǎn)是靈活,可以由業(yè)務(wù)人員(電話銷售)靈活組合不同的目標(biāo)群體,但是其應(yīng)用的(預(yù)測(cè))準(zhǔn)確度通常來(lái)說(shuō)是沒(méi)有'打分模型”高的;

“付費(fèi)用戶典型特征模型'以及類似的此類'典型特征”模型,有個(gè)核心的終極評(píng)價(jià)標(biāo)準(zhǔn):優(yōu)良的模型(準(zhǔn)確的字段以及合理的相應(yīng)閥值)能最大限度包含付費(fèi)用戶的數(shù)量,同時(shí)按照這些閥值圈定的運(yùn)營(yíng)受眾的數(shù)量范圍能滿足運(yùn)營(yíng)資源的負(fù)荷(比方說(shuō),如果分析用的原始數(shù)據(jù)里有1000個(gè)付費(fèi)用戶,而這些付費(fèi)用戶是從10萬(wàn)個(gè)俱樂(lè)部會(huì)員中產(chǎn)生的話,那么一個(gè)比較滿意的“付費(fèi)用戶典型特征模型’(即典型字段以及相應(yīng)的閥值)能覆蓋80%(左右)以上的付費(fèi)用戶(也即800個(gè)左右的上述分析數(shù)據(jù)中的付費(fèi)用戶包含在這些典型閥值的區(qū)間里)并且在10萬(wàn)個(gè)全體的俱樂(lè)部會(huì)員中,滿足這些條件的用戶在2-3萬(wàn)左右(這里的數(shù)據(jù)、比例只是為了舉例方便,實(shí)際應(yīng)用中的原則是閥值覆蓋的付費(fèi)用戶數(shù)量盡可能多,滿足這些閥值條件的潛在目標(biāo)受眾盡可能精簡(jiǎn),如果上述例子中,分析的結(jié)果閥值是有8-9萬(wàn)人滿足這些條件,那從全體10萬(wàn)人的基數(shù)看,這個(gè)8-9萬(wàn)的篩選其實(shí)并沒(méi)有多大的效率的提升);

這樣看來(lái),“付費(fèi)用戶典型特征模型'從思路和分析技術(shù)上看可以分成兩步:

第一步,確定有明顯特征差異的字段,

第二步,確定這些顯著差異性字段的各自的閥值。

如何有效鎖定“有明顯差異的字段'?有三種不同的思路以及更多的具體的算法:

我們可以按照預(yù)測(cè)模型的思路,通過(guò)邏輯回歸、決策樹(shù)、(RSquare\Chi_Square等不同的算法);

我們還可以另起爐灶,按照假設(shè)檢驗(yàn)的思路,從付費(fèi)用戶和非付費(fèi)用戶中抽取等量的樣本進(jìn)行T檢驗(yàn)和(或)者非參數(shù)檢驗(yàn),嘗試這個(gè)假設(shè)檢驗(yàn)的思路時(shí),要注意,樣本的抽取數(shù)量不能太少,也不能太多(樣本太少,比如20-30個(gè),很多顯著性的差異也變得似乎不顯著;樣本太多,比如幾萬(wàn),很細(xì)微可以忽略不計(jì)的差異也變得顯著,這樣在實(shí)踐應(yīng)用中沒(méi)有意義,這是大數(shù)定理)

第三種方法就是利用聚類技術(shù),嘗試不同字段組合進(jìn)行聚類劃分,這種方法的優(yōu)點(diǎn)是快速,缺點(diǎn)是聚類技術(shù)很多時(shí)候的結(jié)果不可控不可預(yù)見(jiàn),常常不能令業(yè)務(wù)方滿意,而且參與聚類的字段如何挑選,還是有賴于前面兩種思路的探索和實(shí)現(xiàn)的(關(guān)于聚類技術(shù)的判斷,詳見(jiàn)我之前的博客(數(shù)據(jù)挖掘交流討論之23,與“汪生”分享我對(duì)于聚類實(shí)踐應(yīng)用的個(gè)人體會(huì))

/blog/static/8167057720102118262485

4/

如何確定顯著差異性字段的各自的閥值?至少有三種方法:

第一是聚類技術(shù),不過(guò)這里稍微要延展一下,我自己的體會(huì),在互聯(lián)網(wǎng)的實(shí)踐中,有不少項(xiàng)目的直接的聚類結(jié)果并不能令人滿意,主要原因在于單純聚類評(píng)價(jià)的指標(biāo)(RSquare,RMSSTDroot_mean_square_standard_deviation等等)關(guān)注的是總體上的宏觀上的結(jié)果評(píng)價(jià),而如果這些字段的各自的標(biāo)準(zhǔn)差比均值大很多的時(shí)候,這些總體的宏觀的判斷指標(biāo)會(huì)明顯無(wú)法勝任合格的效果評(píng)判,結(jié)果是這些總體指標(biāo)看上去可能比較滿意,但是具體到各個(gè)細(xì)分出來(lái)的群體里,這些關(guān)鍵字段的分布過(guò)于分散,由此可以想見(jiàn)其均值是沒(méi)有實(shí)際參考價(jià)值的;但是,就算如此,聚類技術(shù)至少可以給我們一些思路和啟示,告訴我們哪些字段可以組合進(jìn)行閥值權(quán)衡,這后一種方法我最近多次采用,效果比單純聚類結(jié)果要好些,已經(jīng)在業(yè)務(wù)項(xiàng)目中得到了驗(yàn)證。

第二種方法,就是分析師人工嘗試,比如利用excel的透視表,按照前面的“典型特征模型的核心終極評(píng)價(jià)標(biāo)準(zhǔn),來(lái)做判斷和決定。

第三種方法,決策樹(shù)的結(jié)果,如果決策樹(shù)模型效果不錯(cuò)的話,從樹(shù)根到樹(shù)葉的幾條顯著的組合就是很好的答案了,不過(guò)在實(shí)踐中,決策樹(shù)模型是否能如我們所愿有好結(jié)果,要看具體項(xiàng)目數(shù)據(jù)是否有這種邏輯關(guān)系存在的!?。?/p>

“說(shuō)的再多,也是說(shuō)食不飽,哪有這多啰嗦,各位還是參,參,參”我喜歡虛云老和尚的單刀直入,各位,業(yè)務(wù)分析需求在這里,數(shù)據(jù)在這里,對(duì)數(shù)據(jù)挖掘應(yīng)用感興趣的同事,按照上面的框架嘗試把!!

7. 獨(dú)立承擔(dān)(或牽頭、負(fù)責(zé)、指導(dǎo))PM,XPWP,FTP,

SDRZ,HKT等七大產(chǎn)品線的全部的運(yùn)營(yíng)數(shù)據(jù)分析挖掘支持,包括新簽、續(xù)簽預(yù)測(cè)模型、客戶分層模型、優(yōu)質(zhì)定義分析建議書、活躍度定義劃分建議書、用戶行為軌跡分析報(bào)告以及在各業(yè)務(wù)領(lǐng)域(PD,UED,運(yùn)營(yíng)、客服)的應(yīng)用建議書,交叉銷售模型、運(yùn)營(yíng)效果評(píng)估模板、運(yùn)營(yíng)效果提升的應(yīng)用模型、客戶流失預(yù)警模型、服務(wù)細(xì)分模型;所有分析模型、分析報(bào)告、建議全部在實(shí)踐落地應(yīng)用中得到檢驗(yàn),模型應(yīng)用準(zhǔn)確率基本上都保持了相當(dāng)?shù)姆€(wěn)定度和準(zhǔn)確度除了SDRZ這個(gè)新產(chǎn)品剛剛上線正在進(jìn)行中外);一分耕耘一分收獲,當(dāng)你對(duì)一份工作,一分職業(yè)、一分愛(ài)好,充滿了愛(ài),充滿了興趣,在這個(gè)領(lǐng)域你想不做好都很難?。?!

據(jù)挖掘交流討論(33,再完美的數(shù)據(jù)挖掘模型也只是業(yè)務(wù)應(yīng)用萬(wàn)

里長(zhǎng)征第一步)

背景:2011年11月30日,汪生在本博客留言(“今年做了差不多一年的互聯(lián)網(wǎng)方面的挖掘課題,現(xiàn)在我面臨著你前面提及的瓶頸和困局。本來(lái)期望年底的注冊(cè)響應(yīng)模型能有起色,但不幸的是,互聯(lián)網(wǎng)的確有特殊之處。能注冊(cè)的自然注冊(cè)了,不愿注冊(cè)的即使給了OFFER還是不夠大。不僅如此,營(yíng)銷配合的業(yè)務(wù)部門也不給力。對(duì)我而言,這是一個(gè)艱難時(shí)期。不知老兄可有良策?!?/p>

回復(fù):汪生你好,我們不約而同想到了同樣的話題。我在最近2個(gè)月做了一個(gè)挖掘應(yīng)用課題(某核心產(chǎn)品高活躍免費(fèi)用戶防止流失的預(yù)警模型應(yīng)用),建模階段在業(yè)務(wù)部門的支持配合下進(jìn)展順利,實(shí)際數(shù)據(jù)驗(yàn)證模型也非常穩(wěn)定可靠滿意。一個(gè)優(yōu)秀的完美的挖掘模型并不是必然帶來(lái)運(yùn)營(yíng)落地應(yīng)用效果的完美,落地應(yīng)用相比建立模型來(lái)說(shuō)更加復(fù)雜,更加挑戰(zhàn),涉及到更多的不可確定的因素。也正因?yàn)槁涞貞?yīng)用更復(fù)雜更挑戰(zhàn),所以數(shù)據(jù)分析師應(yīng)該有勇氣有熱情突破自己的數(shù)據(jù)分析挖掘的領(lǐng)域,向業(yè)務(wù)應(yīng)用延伸,這個(gè)要求短期看是對(duì)企業(yè)有功,長(zhǎng)期看是對(duì)分析師個(gè)人的跨越式成長(zhǎng)所必須的,只有不斷突破自己,才可能真正成為實(shí)戰(zhàn)型的數(shù)據(jù)分析專家。作為數(shù)據(jù)分析師來(lái)說(shuō),個(gè)人的含金量或者說(shuō)個(gè)人的專業(yè)價(jià)值一定是要在實(shí)戰(zhàn)中體現(xiàn)或者發(fā)揮的,僅僅能熟練搭建一些準(zhǔn)確的完美的模型離市場(chǎng)所需的實(shí)戰(zhàn)型優(yōu)秀分析師的能力之間的距離有天壤之別。

項(xiàng)目建模階段概述:免費(fèi)客戶運(yùn)營(yíng)部提出一個(gè)分析需求,鑒于免費(fèi)客戶中的高活躍用戶群體(該群體是最有可能轉(zhuǎn)化成付費(fèi)用戶的)流失率比較高(涉及東家商業(yè)隱私,本博客所有商業(yè)數(shù)據(jù)做了屏蔽或修改),業(yè)務(wù)方希望通過(guò)數(shù)據(jù)分析挖掘提前預(yù)警發(fā)現(xiàn)最有可能在近期流失的用戶,并提交運(yùn)營(yíng)部門做精細(xì)化分層運(yùn)營(yíng),力圖有效挽回高流失風(fēng)險(xiǎn)的用戶,降低該用戶群體的流失率。通過(guò)與運(yùn)營(yíng)方前期溝通,首先明確定義了本分析課題中'什么是流失用戶的定義',根據(jù)運(yùn)營(yíng)方的運(yùn)營(yíng)節(jié)奏和經(jīng)驗(yàn),“H層流失用戶是指在A時(shí)間點(diǎn)屬于H層用戶,在A加7天的時(shí)間點(diǎn)已經(jīng)跌落離開(kāi)H層,并且在A加14天的時(shí)間點(diǎn)仍然沒(méi)有回到H層的用戶”。接下來(lái),與運(yùn)營(yíng)方一起討論潛在的分析變量字段,結(jié)果運(yùn)營(yíng)方為了省事,把寬表里所有70個(gè)字段全部作為潛在分析字段讓我選,呵呵(“悟空,你又在調(diào)皮!”)。第一次提數(shù)據(jù),

30萬(wàn)行70個(gè)字段,通過(guò)基礎(chǔ)原始數(shù)據(jù)摸底和數(shù)據(jù)清洗,排除了空缺嚴(yán)重的或者分布過(guò)度集中的或者高度相關(guān)的字段共36個(gè),同時(shí),發(fā)現(xiàn)了兩個(gè)字段數(shù)據(jù)矛盾(過(guò)去30天某某操作天數(shù)為零,但是過(guò)去30天某某操作次數(shù)不為零),這個(gè)相互矛盾的兩個(gè)字段我們覺(jué)得不能忽視或者簡(jiǎn)單刪除,要找原因,經(jīng)過(guò)與數(shù)據(jù)倉(cāng)庫(kù)方面溝通,發(fā)現(xiàn)是數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)回滾錯(cuò)誤造成的,這樣必須重新提取數(shù)據(jù)。第二次重新提取數(shù)據(jù)后,按部就班邊分析邊分享,進(jìn)展順利,當(dāng)模型搭建完成,驗(yàn)證比較滿意,準(zhǔn)備提交業(yè)務(wù)應(yīng)用時(shí),我突然想到一個(gè)關(guān)鍵問(wèn)題,“這樣大動(dòng)十戈挖掘建模出來(lái)的結(jié)果,有沒(méi)有更加簡(jiǎn)單直觀的分析方法代替呢?”,換言之,如果我們直觀猜想,在起初的A時(shí)間點(diǎn),在H層定義的值域附近的人群是否可以直觀判斷在7天14天時(shí)間點(diǎn)最有可能跌落離開(kāi)H層?”,無(wú)論這個(gè)直觀猜想是否正確,我們最起碼要驗(yàn)證一下吧。結(jié)果,我回頭驗(yàn)證的時(shí)候,猛然發(fā)現(xiàn),我們當(dāng)初全部囊括的寬表里的70個(gè)字段,盡然沒(méi)有包括H層定義的那幾個(gè)字段(行業(yè)的登錄標(biāo)準(zhǔn)天次,行業(yè)的關(guān)鍵A頁(yè)面的pv,等),如果沒(méi)有這些字段數(shù)據(jù),那么上述的直觀假設(shè)就無(wú)法驗(yàn)證,我們也就不能理直氣壯證明挖掘模型的價(jià)值了。所以,盡管模型單方面看可以滿足業(yè)務(wù)需要在這種情況下,我主持召開(kāi)了課題階段分享會(huì),向業(yè)務(wù)方通報(bào)進(jìn)展和無(wú)法對(duì)比直觀假設(shè)的尷尬,面對(duì)當(dāng)前的模型結(jié)論和發(fā)現(xiàn)的一些明顯證明是與流失有密切關(guān)系的一些字段,業(yè)務(wù)方非常感興趣,也支持我重新提取新數(shù)據(jù),包括上面假設(shè)里的一些關(guān)鍵字段(在該分享會(huì)上,我首先承認(rèn)遺漏上述關(guān)鍵字段是我的責(zé)任,但同時(shí)我也指出在前期的字段討論中,業(yè)務(wù)方將近20人參加討論也沒(méi)有人想到跟H層定義有關(guān)的那幾個(gè)關(guān)鍵字段),同時(shí),在這次會(huì)上,業(yè)務(wù)方根據(jù)自己的經(jīng)驗(yàn)提出的另外一個(gè)關(guān)鍵字段在后來(lái)的模型中證明是最重要的一個(gè)預(yù)測(cè)字段第三次重新提取經(jīng)過(guò)增添的新的原始字段,按部就班,最后跟上面的直觀猜想進(jìn)行驗(yàn)證,發(fā)現(xiàn)這個(gè)直觀猜想不成立(放心了)并且(由于增添了幾個(gè)關(guān)鍵字段)新的預(yù)測(cè)模型比第二次數(shù)據(jù)建模的效果要提高6個(gè)百分點(diǎn),最后,經(jīng)過(guò)最刺激的開(kāi)門見(jiàn)山的跟當(dāng)時(shí)最新的實(shí)際數(shù)據(jù)驗(yàn)證,模型實(shí)際精度與建模時(shí)的測(cè)試精度完全吻合(說(shuō)明很穩(wěn)定可以投入業(yè)務(wù)試用);前期建模完成,數(shù)據(jù)分析挖掘告一段落,接下來(lái)是提交運(yùn)營(yíng)方開(kāi)始試運(yùn)營(yíng),每周一按照該預(yù)警模型,跑數(shù)據(jù),預(yù)測(cè)4天后最有肯能流失的所有用戶的流失概率分?jǐn)?shù),由運(yùn)營(yíng)部門按照流失概率分?jǐn)?shù)從高到低,排名最前的30%的目標(biāo)群體進(jìn)行進(jìn)一步的分層的精細(xì)化運(yùn)營(yíng)。我在模型投放業(yè)務(wù)應(yīng)用的分享會(huì)上,重點(diǎn)提醒大家再好的模型也只是業(yè)務(wù)應(yīng)用萬(wàn)里長(zhǎng)征第一步,接下來(lái)的落地應(yīng)用任務(wù)更加挑戰(zhàn),更加復(fù)雜,也更加有意義。下面節(jié)選的三個(gè)PPT是我當(dāng)時(shí)在模型交付應(yīng)用之前業(yè)務(wù)分享的幾個(gè)主要分享點(diǎn):

-對(duì)干褂期的“晅失群悻尾丈〃璉片界胡?岫文廛苦ft:

含毒是否荷合業(yè)著巨昔的打析樣拿】

*時(shí)對(duì)疆夫隊(duì)險(xiǎn)?大的^易鼻晃景「透T曾帝乂曜1運(yùn)用的主要抻點(diǎn).特此過(guò)面分,累芟,分布罪)I

■U里碧城應(yīng)舞瓦鈉致芽任tf

§?'"!??,riH^irjjii測(cè)效火?

—4

,蔑圣的ft此募我皆斑增用的應(yīng)岸?……

?耗經(jīng)條洋最“鎮(zhèn)裂*員Bf慘”的定義的度化r

?y「<sw足皓臺(tái)用牲也帳聃*?素的代:

?福丹建候晶提外疝海澎效果的。效手皮,

c?mi mm*v4M*-AftfiivI

也■/膏

?安為0J&L的!|議和直■有時(shí)搟可以一字千金卜搟值涯」

?醐博慢里與牌站分忻-Mb

止地; I

最Jkiji勺檢驗(yàn)

落地應(yīng)用環(huán)節(jié)的重點(diǎn)分享:

感謝上述流失預(yù)警模型的落地應(yīng)用的運(yùn)營(yíng)部的同學(xué)們,尤其感謝牽頭的資深運(yùn)營(yíng)專家MS。跟蹤、關(guān)注、參與你們的運(yùn)營(yíng)過(guò)程實(shí)在是在下的好享受。從11月13日開(kāi)始,第一次打分后,提取最可能流失的

30%的H層用戶中,隨機(jī)抽出其中10%的用戶作為觀察組(不做運(yùn)營(yíng)碰觸),其余90%的目標(biāo)用戶由運(yùn)營(yíng)方根據(jù)他們經(jīng)驗(yàn)中提取的幾個(gè)核心指標(biāo)進(jìn)行人群細(xì)分和相應(yīng)的運(yùn)營(yíng)方案細(xì)分(這個(gè)動(dòng)作是我之前的很多模型落地應(yīng)用中不同的地方,因?yàn)楸灸P偷年P(guān)鍵預(yù)測(cè)變量在業(yè)務(wù)方看來(lái)都沒(méi)有運(yùn)營(yíng)應(yīng)用“噱頭,話題'的價(jià)值,所以他們提出了另外的幾個(gè)字段來(lái)提煉細(xì)分方案,目前看來(lái)他們的方案起碼還沒(méi)有明顯錯(cuò)誤的)。首先應(yīng)用的運(yùn)營(yíng)通道是電子郵件運(yùn)營(yíng):EDM),包括觀察組在內(nèi)一共7個(gè)細(xì)分群體(其中6個(gè)群體進(jìn)行不同內(nèi)容和宣傳的細(xì)分運(yùn)營(yíng))持續(xù)兩周時(shí)間,現(xiàn)在到了揭開(kāi)神秘面紗的時(shí)候了,呵呵!!

第一次模型投放試運(yùn)營(yíng)為期兩周,隨后運(yùn)營(yíng)方做了詳細(xì)的階段性

(2周)運(yùn)營(yíng)總結(jié)分析報(bào)告,先摘錄如下:

模型預(yù)挪膻確率。

根據(jù)模型評(píng)分選擇流失預(yù)測(cè)評(píng)分最高的馳%作為運(yùn)營(yíng)目標(biāo),

最終流失的標(biāo)準(zhǔn)是11月20日流失至W房,并旦在”日之前沒(méi)有同到H層的客戶.

最終預(yù)測(cè)目標(biāo)客戶流失數(shù)量竟人.

同期,H屋忌痛流失客戶為人,預(yù)測(cè)人群在總體實(shí)際流失客戶中占比763%,與模型測(cè)試時(shí)的莪果相符,

從上面的運(yùn)營(yíng)效果報(bào)告里,可以看出,首先,預(yù)測(cè)模型到目前為止預(yù)測(cè)的準(zhǔn)確率和穩(wěn)定性還是很好的;其次,在第一輪電子郵件運(yùn)營(yíng)的六個(gè)不同細(xì)分群體的效果看,有的效果好,有的效果不好,具體原因有詳細(xì)歸納;第三,綜合對(duì)比運(yùn)營(yíng)群體和(沒(méi)有運(yùn)營(yíng)的)對(duì)照組群體的14天后的流失率,兩周沒(méi)有明顯差異。

對(duì)于上面的第三點(diǎn),運(yùn)營(yíng)方主要?dú)w咎目前郵件運(yùn)營(yíng)通道阻礙、效果不好;其實(shí),在我看來(lái),既然第二點(diǎn)明確總結(jié)了有的運(yùn)營(yíng)細(xì)分群體效果比較好,有的不好,那么總的運(yùn)營(yíng)群體從邏輯推理上講其運(yùn)營(yíng)效果一定會(huì)或多或少比(沒(méi)有運(yùn)營(yíng)的)對(duì)照組的對(duì)應(yīng)效果要好的吧。如何解釋第三與第二點(diǎn)之間的貌似的'矛盾”呢?原來(lái),這里出問(wèn)題的就是來(lái)自運(yùn)營(yíng)方的KPI考量。從科學(xué)的合理指標(biāo)看,上面總結(jié)的第二點(diǎn),已經(jīng)給出了合理評(píng)價(jià)現(xiàn)階段運(yùn)營(yíng)效果的方法。但是,作為一個(gè)專門的運(yùn)營(yíng)部門,它希望本次活動(dòng)的評(píng)估的指標(biāo)能跟自己的部門KPI掛鉤,而這里的KPI就是H層流失率的降低,從上面第二點(diǎn)里的合理評(píng)價(jià)效果的指標(biāo)到這里的KPI,中間有個(gè)過(guò)程的,實(shí)際上是個(gè)從量變到質(zhì)變的過(guò)程,如果強(qiáng)行忽視這個(gè)從量變到質(zhì)變的過(guò)程,強(qiáng)行按部門KPI考核這個(gè)為期2周的階段性運(yùn)營(yíng)活動(dòng),當(dāng)然很難滿足這個(gè)KPI的要求了。

上述情況,應(yīng)該跟你在留言里提到的情況非常類似了吧,這里的關(guān)鍵是業(yè)務(wù)部門的認(rèn)識(shí)問(wèn)題,有急功近利,有大躍進(jìn)思潮,這其實(shí)就是對(duì)“數(shù)據(jù)化運(yùn)營(yíng)”的一種誤解,是蠻十,是霸王硬上弓。打個(gè)比方,婚戀網(wǎng)站百合網(wǎng)如果做一個(gè)營(yíng)銷活動(dòng),那么這個(gè)小活動(dòng)的評(píng)估指標(biāo)應(yīng)該是本次活動(dòng)帶來(lái)的牽手?jǐn)?shù)量或者報(bào)名數(shù)量的,但是如果你一定要把本次活動(dòng)帶來(lái)的“領(lǐng)證結(jié)婚的數(shù)量”作為活動(dòng)評(píng)估指標(biāo),你說(shuō)是不是要求有點(diǎn)急功近利???

當(dāng)然,運(yùn)營(yíng)方式的變通也是一個(gè)探索的方向,比如本項(xiàng)目的落地應(yīng)用,在上面的郵件運(yùn)營(yíng)之后,目前正在運(yùn)營(yíng)的方式是在線即時(shí)通訊IM的運(yùn)營(yíng),根據(jù)我以往的項(xiàng)目經(jīng)驗(yàn),在線運(yùn)營(yíng)的通道和方式中,IM的效果總體來(lái)說(shuō)是高于EDM的,目前運(yùn)營(yíng)正在進(jìn)行中,運(yùn)營(yíng)方隨后會(huì)有階段性的效果報(bào)告和總結(jié)歸納。

綜合我曾經(jīng)碰到的類似你在留言里提到的落地應(yīng)用不好的原因,除了上面提到的這個(gè)普遍性的原因外,還有:

落地應(yīng)用的資源是否有保障,比如營(yíng)銷資源,促銷預(yù)算,這些都是打仗的槍炮子彈,有還是沒(méi)有,多還是少,對(duì)于運(yùn)營(yíng)效果有顯著影響;

運(yùn)營(yíng)團(tuán)隊(duì)的數(shù)據(jù)化運(yùn)營(yíng)的能力,能有效細(xì)分受眾,高效設(shè)計(jì)運(yùn)營(yíng)方案,有效執(zhí)行在線運(yùn)營(yíng)方案,全程跟蹤記錄過(guò)程數(shù)據(jù),能及時(shí)總結(jié)歸納提煉運(yùn)營(yíng)效果報(bào)告。我很慶幸在本項(xiàng)目中合作的資深運(yùn)營(yíng)專家MS在這方面非常專業(yè),我從中也學(xué)到了不少新的經(jīng)驗(yàn)和體會(huì);

數(shù)據(jù)化運(yùn)營(yíng)是企業(yè)全方位競(jìng)爭(zhēng)的綜合較量,不是單單一個(gè)好的或者精準(zhǔn)的挖掘模型就可以一了百了的,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論