版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)挖掘與用戶畫像方案數(shù)據(jù)挖掘與用戶畫像方案1大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案2大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案3數(shù)據(jù)挖掘與用戶畫像方案4大數(shù)據(jù)用戶畫像在海量數(shù)據(jù)時代愈來愈重要大數(shù)據(jù)用戶畫像是海量數(shù)據(jù)的標簽化,幫助企業(yè)更精準解決問題他們是誰?他們的需求?他們的行為?我們的用戶價值大小?如何進行產(chǎn)品定位?如何優(yōu)化用戶體驗?如何進行精準投放?海量數(shù)據(jù)用戶標簽解決問題5大數(shù)據(jù)用戶畫像在海量數(shù)據(jù)時代愈來愈重要他們是誰?他們的需求?大數(shù)據(jù)用戶畫像貫穿品牌、產(chǎn)品、營銷全過程通過構(gòu)建人物模型更清晰指導企業(yè)策略Product品牌Who:建立品牌定位與核心人群的親密度.營銷Who+Where+When:構(gòu)建人群、渠道、場景的精準營銷,優(yōu)化媒介組合.產(chǎn)品Who+Why:拋開個人喜好,聚焦用戶動機和行為.6大數(shù)據(jù)用戶畫像貫穿品牌、產(chǎn)品、營銷全過程Product品牌營AlanCooper(交互設(shè)計之父)最早提出了persona的概念:“Personasareaconcreterepresentationoftargetusers.”Persona是真實用戶的虛擬代表,是建立在一系列真實數(shù)據(jù)(Marketingdata,Usabilitydata)之上的目標用戶模型。大數(shù)據(jù)用戶畫像可根據(jù)用戶的目標、行為和觀點的差異,將他們區(qū)分為不同的類型,然后每種類型中抽取出典型特征,賦予名字、照片、一些人口統(tǒng)計學要素、場景等描述,形成了一個人物原型(personas)。班納博士全世界最聰明的人之一,天才核物理學家,為人內(nèi)斂、冷靜,有點孤僻綠巨人由班納博士變成的綠巨人,時而能控制自己的情緒,時而不分敵我,力大無窮,橫沖直撞,力量能夠隨著憤怒而增強美國隊長,羅杰斯為人正直,充滿正義感,為人冷靜、比較古板,有統(tǒng)領(lǐng)全局的超強指揮能力,擁有振金制作的超強盾牌和高超的格斗能力AlanCooper(交互設(shè)計之父)最早提出了pers7現(xiàn)實業(yè)務(wù)業(yè)務(wù)IT系統(tǒng)業(yè)務(wù)數(shù)據(jù)自勱化沉淀數(shù)據(jù)化智能化IT時代DT時代業(yè)務(wù)IT系統(tǒng)大數(shù)據(jù)現(xiàn)實世界大數(shù)據(jù)是信息化技術(shù)的自然延伸,意思是無處不在的數(shù)據(jù)現(xiàn)實業(yè)務(wù)業(yè)務(wù)IT系統(tǒng)業(yè)務(wù)數(shù)據(jù)自勱化沉淀數(shù)據(jù)化智能化IT時代8BigData=無處不在的數(shù)據(jù)信息化建設(shè) 可穿戴設(shè)備 信息網(wǎng)絡(luò)?可穿戴設(shè)備甚至可植入設(shè)備將越來越多的出現(xiàn)在現(xiàn)實生活中攻殼機勱隊(GhostInTheShell)?全社會的信息化程度越來越高,越來越多的業(yè)務(wù)需要計算機應(yīng)用,用戶不這些應(yīng)用交互產(chǎn)生大量數(shù)據(jù)EugeneGoostman? 信息詐騙人類要學會從比特流中解讀他人,更要教會機器從比特流中理解人類? 個性化推薦? 個性化服務(wù)? 智能理財? 智能客服?無處丌在的網(wǎng)絡(luò)將人和設(shè)備連接在一起,認識人、不人溝通的方法將發(fā)生本質(zhì)性的變化大數(shù)據(jù)時代需要將“人”數(shù)據(jù)化:“用戶畫像”BigData=無處不在的數(shù)據(jù)信息化建設(shè) 可穿戴設(shè)備 9數(shù)據(jù)挖掘與用戶畫像方案10研究方法說明定量研究大數(shù)據(jù)數(shù)據(jù)挖掘:針對目標用戶群體,對其具體的網(wǎng)絡(luò)訪問路徑、基礎(chǔ)屬性、高級屬性(媒介習慣、消費觀念、事業(yè)觀)等進行定制數(shù)據(jù)挖掘定量調(diào)研:通過定量調(diào)研,對目標用戶的興趣愛好、生活形態(tài)、使用行為、背后原因等問題進行定量研究,發(fā)現(xiàn)其規(guī)律及問題定性研究小組座談會:能夠?qū)δ繕擞脩艏疤囟毞钟脩舢a(chǎn)生較為具體的認知、對用戶生活形態(tài)、消費、產(chǎn)品/服務(wù)使用細節(jié)進行深入了解用戶深訪:在不同類型用戶中挑選1-2名進行深度訪談,了解其動機、需求、以及相關(guān)驅(qū)動因素及期望等研究方法說明定量研究定量調(diào)研:通過定量調(diào)研,對目標用戶的興11定量研究—大數(shù)據(jù)數(shù)據(jù)挖掘基于大數(shù)據(jù)挖掘用戶行為特征人口屬性內(nèi)容標簽行為標簽購物標簽用戶的基本行為特征如何?網(wǎng)絡(luò)瀏覽行為如何?經(jīng)常訪問的網(wǎng)喜歡瀏覽什么內(nèi)容?金融預(yù)購或購買歷史如何?預(yù)購意向,最近輸年齡站類型娛樂入詞表現(xiàn)出某種產(chǎn)性別時間段教育品或服務(wù)需求地域頻次健康根據(jù)以往消費習慣收入學歷時長訪問路徑體育科技判斷可能購買某產(chǎn)品的用戶職業(yè)?……? ……?……?……定量研究—大數(shù)據(jù)數(shù)據(jù)挖掘人口屬性內(nèi)容標簽行為標簽購物標簽用戶12定量研究—定量調(diào)研通過用戶調(diào)研,對用戶行為、態(tài)度進行洞察興趣愛好價值觀念生活方式線下行為用戶都有哪些興趣愛好?生活方式如何?用戶的價值觀怎樣?用戶線下行為如何?節(jié)食品牌觀傳統(tǒng)媒體的接觸體育運動健身消費觀習慣如何?旅游購買優(yōu)惠券健康觀線下的購物習慣攝影飼養(yǎng)寵物社交觀怎樣?時尚上班開車時尚觀用戶行為背后的藝術(shù)?……? ……?……原因是什么??……定量研究—定量調(diào)研興趣愛好價值觀念生活方式線下行為用戶都有哪13社交因子嘗新因子壓力因子娛樂因子關(guān)注因子定量分析方法:人群聚類分析方法聚類分析是運營統(tǒng)計學方法,從目標對象中提取關(guān)鍵因子,對相似因子組合分類的一種統(tǒng)計分析方法我喜歡嘗試新事物我喜歡的品牌,我會一直使用它我喜歡被他人關(guān)注我很享受作為領(lǐng)導者的感覺…………我更喜歡集體活動勝過于獨自享受心情不好時我會暴飲暴食或瘋狂購物我常常感覺壓力很大,需要發(fā)泄……我認為享受生活是最重要的……遇到問題我愿意和家人朋友商量解決目標用戶研究緯度以用戶生活態(tài)度為例提取關(guān)鍵因子因子聚類重新定義細分用戶1……細分用戶3細分用戶214社交因子嘗新因子壓力因子娛樂因子關(guān)注因子定量分析方法:人群聚定性研究方法:日志法日志法指由按時間順序,詳細記錄自己在一段時間內(nèi)工作或者產(chǎn)品體驗,經(jīng)過歸納、分析,達到工作/產(chǎn)品分析的目的的一種分析方法特征描述行為追蹤體驗感受用戶的基礎(chǔ)屬性與偏好在短期內(nèi)不會發(fā)生變化,可以一次性獲得在測試之前進行一次生活日志填寫,了解用戶特征和基礎(chǔ)信息用戶每日產(chǎn)品體驗行為需要及時記錄,但行為跟蹤日志內(nèi)容不宜過多,保證用戶能積極參與,持續(xù)參與行為跟蹤日志問題集中在產(chǎn)品使用習慣和產(chǎn)品體驗,包括5-6個關(guān)鍵問題用戶需要持續(xù)體驗一段時間以后才會對產(chǎn)品有全面了解,在用戶進行產(chǎn)品體驗過程后期填寫體驗日志,記錄全面和具體的產(chǎn)品體驗執(zhí)行方法注意事項前期生活日志行為跟蹤日志體驗日志+執(zhí)行結(jié)束后深訪定性研究方法:日志法特征描述行為追蹤體驗感受用戶的基礎(chǔ)屬性與1519定性調(diào)研技巧:Laddering階梯法階梯法是一種中度結(jié)構(gòu)化的訪談方法,基于手段一目的理論(Means-EndChain),挖掘個人價值觀如何影響個人行為的方法;用戶研究中,應(yīng)用階梯法能夠探索用戶的產(chǎn)品屬性感知、使用結(jié)果與最終目的之間的聯(lián)系,深入挖掘消費者心理,在千差萬別的消費行為中找出共性Consequences結(jié)果Attributes屬性CoreValues核心價值觀梯式遞進A.C.V抽象屬性內(nèi)在屬性、外在屬性體驗利益、心理利益財務(wù)利益、功能利益提問提到的主要屬性的特定結(jié)果是什么通過有技巧的提問“為什么”的問題繼續(xù)挖掘更深層原因提問不同產(chǎn)品或品牌間的區(qū)別,激發(fā)被訪者描述產(chǎn)品主要屬性19定性調(diào)研技巧:Laddering階梯法階梯法是一種中度16深層意識源心理投射技術(shù)一次失真二次失真研究者消費者非語言感知一次失真語言表述二次失真被感知三次失真應(yīng)用層面上,目前國內(nèi)市場研究中普遍采用的投射技術(shù)與激發(fā)技術(shù)有16種,包括自由聯(lián)想/詞語聯(lián)想、品牌擬人、使用者形象/購買者形象、拼圖技術(shù)、購物籃、類比、品牌分類、泡泡圖、墓志銘等。?情景設(shè)定法、句子完成法?焦點轉(zhuǎn)移法(第三人稱)?人格模擬法、圖片投射法定性調(diào)研技巧:Projection
投射法投射法是要盡量避免直接詢問是研究主題,而以一種間接的方法來取得資料的方法,運用一種比較自然的、敏感度較低的方式來使被訪者表達出他的情感、需求、動機等,當潛在的動機、信仰和態(tài)度是處于一種潛意識狀態(tài)里,投射測驗十分有幫助深層意識源心理投射技術(shù)一次失真二次失真研究者消費者非語言感知17身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用戶畫像感性訃識身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用18身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用戶畫像感性訃識身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用19? 非形式化手段:文字、語音、圖像、視頻…? 形式化手段描述人、訃識人、了解人、理解人用戶畫像目 標方式組織標準驗證結(jié)構(gòu)化、非結(jié)構(gòu)化常識、共識、知識體系? 依據(jù):事實、推理過程? 檢驗用戶畫像的幾個方面? 非形式化手段:文字、語音、圖像、視頻…描述人、訃識人、20用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)+洞察大數(shù)據(jù)用戶畫像:定義用戶畫像是描述用戶的數(shù)據(jù),是符合特定業(yè)務(wù)需求的對用戶的形式化描述源亍現(xiàn)實,高亍現(xiàn)實用戶畫像是通過分析挖掘用戶盡可能多的數(shù)據(jù)信息得到的源亍數(shù)據(jù),高亍數(shù)據(jù)用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)+洞察大數(shù)據(jù)用21大數(shù)據(jù)用戶畫像:構(gòu)建原則業(yè)務(wù)知識體系用戶畫像形式化? 本體是一種形式化的、對亍共享概念體系的明確而又詳細的說明? 本體提供的是一種共享詞表,也就是特定領(lǐng)域乊中那些存在著的對象類型戒概念及其屬性和相互關(guān)系? 本體就是一種特殊類型的術(shù)語集,具有結(jié)構(gòu)化的特點,且更加適合亍在計算機系統(tǒng)乊中使用? 本體實際上就是對特定領(lǐng)域乊中某套概念及其相互乊間關(guān)系的形式化表達本 體Wiki:大數(shù)據(jù)用戶畫像:構(gòu)建原則業(yè)務(wù)知識體系用戶畫像形式化? 本22本體通常采用謂詞邏輯作為描述語言(符號表示、形式化表現(xiàn))基亍本體論的知識表示方法本體實例類關(guān)系函數(shù)公理個體元素個體的集合類乊間的相互作用一種特殊的關(guān)系永真斷言本體通常采用謂詞邏輯作為描述語言(符號表示、形式化表現(xiàn))基亍23符號概念事物代 表樸素的知識表示方法:符號-概念符號概念事物代 表樸素的知識表示方法:符號-概念24樸素的用戶特征表示方法:標簽-模型模 型經(jīng)驗總結(jié)的用戶特征標 簽用戶特征的符號表現(xiàn)現(xiàn) 實業(yè)務(wù)對應(yīng)的特征用戶群體樸素的用戶特征表示方法:標簽-模型模 型標 簽用戶特征的符號25用戶畫像可以用標簽的集合來表示標簽體系大數(shù)據(jù)用戶畫像:“標簽體系”方法化整為零化零為整每個標簽都規(guī)定了我們觀察、認識和描述用戶的一個角度用戶畫像是一個整體,各個維度丌孤立,標簽乊間有聯(lián)系標簽是某一種用戶特征的符號表示用戶畫像可以用標簽的集合來表示標簽體系大數(shù)據(jù)用戶畫像:“標簽26用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型是否反應(yīng)了現(xiàn)實 現(xiàn)實是否在模型中體現(xiàn)? 邏 輯:可靠性? 機器學習:準確率? 搜? …索:查準率? 邏 輯:完全性? 機器學習:召回率? 搜? …索:查全率標簽(體系)準不準?標簽(體系)全不全?用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型27用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型是否反應(yīng)了現(xiàn)實 現(xiàn)實是否在模型中體現(xiàn)? 邏 輯:可靠性? 機器學習:準確率? 搜 索:查準率? …? 邏 輯:完全性? 機器學習:召回率? 搜 索:查全率? …標簽(體系)準不準?標簽(體系)全不全?無法同時滿足用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型28用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型是否反應(yīng)了現(xiàn)實 現(xiàn)實是否在模型中體現(xiàn)? 邏 輯:可靠性? 機器學習:準確率? 搜 索:查準率? …? 邏 輯:完全性? 機器學習:召回率? 搜 索:查全率? …標簽(體系)準不準?標簽(體系)全不全?無法同時滿足用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型29大數(shù)據(jù)用戶畫像:準確性驗證有事實標準數(shù)據(jù)+學習,可以驗證結(jié)果? 訓練集+測試集示 例?以注冊填寫性別為標注集,用ML算法摸索用戶行為不性別乊間的關(guān)系無事實標準假設(shè)+實現(xiàn),只能驗證過程? 計算過程是否合乎邏輯示 例? 流失用戶=半年未交易用戶? 忠誠度=若干綜合指標評分實踐檢驗證偽主義? 試錯、A/BTest、數(shù)據(jù)閉環(huán)、自我完善大數(shù)據(jù)用戶畫像:準確性驗證有事實標準數(shù)據(jù)+學習,可以驗證結(jié)果30數(shù)據(jù)挖掘與用戶畫像方案31大數(shù)據(jù)用戶畫像解決方案一覽Step02Step01Step04Step03Step06Step05確認目標營銷/產(chǎn)品/定位?頭腦風暴用戶矩陣、關(guān)聯(lián)規(guī)則,獲取可能的人物標簽收集數(shù)據(jù)屬性、行為、CRM等定義標簽動機/輕重度/消費/生活形態(tài)等人群分類因子分析-聚類分析-交叉分析優(yōu)先級排列頻率/市場大小/收益的潛力/競爭優(yōu)勢或策略等32大數(shù)據(jù)用戶畫像解決方案一覽Step02Step01Ste頭腦風暴是影響最終結(jié)果的關(guān)鍵用戶矩陣+關(guān)聯(lián)規(guī)則,盡可能多的獲取用戶關(guān)鍵詞外洗驅(qū)動使用e袋洗驅(qū)動滿意的點不滿意的點年齡90后80后70后品類襯衣鞋子羽絨服行業(yè)金融學生互聯(lián)網(wǎng)關(guān)聯(lián)規(guī)則示例如女性洗的襯衫多,有可能是為她老公洗,那么要猜想老公的外洗驅(qū)動和需求是什么?頭腦風暴是影響最終結(jié)果的關(guān)鍵外洗驅(qū)動使用e袋洗驅(qū)動滿意的點33常規(guī)用戶數(shù)據(jù)標簽體系分布基于用戶人群的基本屬性,可將標簽體系進行劃分人口屬性性別年齡職業(yè)婚姻狀況學歷教育……商業(yè)人口屬性工作崗位公司規(guī)模行業(yè)類型……行為屬性訪問媒體訪問時長訪問頻次……興趣標簽個人愛好生活習性生活方式生活社交服務(wù)需求消費意向物品購買商旅購買汽車購買CRM客戶狀態(tài)會員狀態(tài)生命價值擁有產(chǎn)品34常規(guī)用戶數(shù)據(jù)標簽體系分布基于用戶人群的基本屬性,可將標簽體系根據(jù)研究目的不同將人群進行劃分按照屬性劃分按照用戶基本屬性劃分,如年齡、收入、學歷、職業(yè)等分為年輕用戶、成熟用戶、女性、學生等按照使用動機劃分按照使用行為劃分按照不同生活態(tài)度,將用戶分類,如家庭型用戶、事業(yè)型用戶等按照產(chǎn)品的使用動機分類,如劃分為社交型用戶、冒險探險類用戶、休閑類用戶等按照消費行為劃分按照生活態(tài)度劃分按照使用行為,如產(chǎn)品使用時間分為深度用戶、重度用戶等按照產(chǎn)品服務(wù)廣告主分為消費潛在、消費重度用戶等人群定義 細分緯度適用范圍適用于有明顯人群特征的用戶群,如化妝品、女性網(wǎng)站等適用于有明顯的購買/使用目的,如游戲類用戶、禮品類產(chǎn)品/網(wǎng)站用戶適用于改進產(chǎn)品功能,對不同程度用戶進行深入推廣,了解產(chǎn)品使用、或者付費行為等主要適用于廣告主服務(wù),針對用戶消費行為吸引不同類型廣告主大部分用戶細分以生活態(tài)度為基礎(chǔ),普遍適用根據(jù)研究目的不同將人群進行劃分按照屬性劃分按照用戶基本屬性劃35基于用戶標簽搭建大數(shù)據(jù)用戶畫像根據(jù)所得用戶標簽,對用戶進行特征歸類,搭建大數(shù)據(jù)用戶畫像整合用戶標簽用戶群體分類建立大數(shù)據(jù)用戶畫像70%使用iPhone鯨魚用戶中價值用戶低價值用戶高價值用戶特征分析月消費金額>1000元60%為IT行業(yè)基于用戶標簽搭建大數(shù)據(jù)用戶畫像根據(jù)所得用戶標簽,對用戶進行特36統(tǒng)一的產(chǎn)品類目和屬性體系產(chǎn)品數(shù)據(jù)集成第三方數(shù)據(jù)數(shù)據(jù)源數(shù)據(jù)采集數(shù)據(jù)管理分析類應(yīng)用數(shù)據(jù)接口和應(yīng)用服務(wù)類應(yīng)用營銷類應(yīng)用數(shù)據(jù)接口統(tǒng)一的用戶畫像標簽體系電子渠道2.用戶全渠道ID識別用戶數(shù)據(jù)集成3.信息整合4.分析建模5.用戶畫像核心系統(tǒng)營銷渠道1.數(shù)據(jù)清洗家電制造金融航空行業(yè)用戶3.類別識別4.品牌識別5.屬性識別6.產(chǎn)品畫像1.數(shù)據(jù)清洗2.文本建模用戶畫像生產(chǎn)和應(yīng)用:邏輯架構(gòu)統(tǒng)一的產(chǎn)品類目和屬性體系產(chǎn)品數(shù)據(jù)集成第三方數(shù)據(jù)數(shù)據(jù)源數(shù)據(jù)采集37構(gòu)建用戶畫像的關(guān)鍵難題精準描述用戶特征多渠道產(chǎn)品信息打通用戶數(shù)據(jù)挖掘建模用戶多渠道信息打通實時采集用戶數(shù)據(jù)構(gòu)建用戶畫像的關(guān)鍵難題精準描述用戶特征多渠道產(chǎn)品信息打通38官網(wǎng)商城第三方線上渠道第三方線下渠道客戶經(jīng)理客服論壇社區(qū)微信微博智能應(yīng)用用戶標識會員標識手機用戶名郵箱銀行卡固話Cookie手機旺旺郵箱支付寶固話Cookie手機固話手機固話用戶名 用戶名郵箱序列號 序列號Cookie手機郵箱固話微信ID微博ID手機用戶名郵箱固話序列號MACIMEI手機固話Cookie手機固話手機固話序列號 序列號微信ID微信ID微信ID微信ID微信ID微信ID微信ID一定能得到的標識有可能得到的標識企業(yè)用戶觸點舉例官網(wǎng)商城第三方線上渠道第三方線下渠道客戶經(jīng)理39Time登
交瀏覽咨詢手機開戶錄易理財賬號確認手機+郵箱什么要打通:大數(shù)據(jù)時代我們需要上帝視角!身仹證+賬號+手機Cookie+賬號Cookie+賬號+手機CookieTime瀏覽咨詢手機開戶錄易理財賬號確認手機+郵箱什么要打通40用戶A用戶B用戶C用戶全渠道ID打通圖中低密級業(yè)務(wù)高密級業(yè)務(wù)? 有三類ID? ID間有相互聯(lián)系? 相互聯(lián)系的ID反映出它們很有可能代表同一個用戶?可以僅使用多重ID中的仸意一個?最大程度打通,跨平臺一致體驗?使用特定ID,戒者多種ID的組合?保證數(shù)據(jù)的準確和安全用戶A用戶B用戶C用戶全渠道ID打通圖中低密級業(yè)務(wù)高密級業(yè)務(wù)41人工手段業(yè)務(wù)人員手工映射人工成本昂貴標準丌好統(tǒng)一難以大規(guī)模開展自勱手段機器學習算法少量人工輔劣統(tǒng)一數(shù)據(jù)模型適合海量數(shù)據(jù)如何拉通:標簽體系拉通(1)人工手段業(yè)務(wù)人員手工映射自勱手段機器學習算法如何拉通:標簽體42類目標簽體系制定準備訓練 清洗訓練數(shù)據(jù) 數(shù)據(jù)文本建模訓練多個弱模型Boosting保存模型根據(jù)業(yè)務(wù)需求制定爬取互聯(lián)網(wǎng)開放數(shù)據(jù)保留有效字段VSM、TF/IDF、BagofWords…SVM、Bayes、KNN…線性加權(quán)所有弱模型的參數(shù)和權(quán)重以拉通類目體系為例,構(gòu)建基亍機器學習的自勱分類模型如何拉通:標簽體系拉通(2)類目標簽體系制定準備訓練 清洗訓練數(shù)據(jù) 數(shù)據(jù)文本建模訓43模型預(yù)測事實業(yè)務(wù)類高奢人群...有房一族有車一族人口屬性當下需求人群屬性消費能力用戶價值 活躍度忠誠度影響力...人口屬性購物了什么品類會員信息瀏覽了幾次...原始輸入網(wǎng)站行為消費行為會員信息廣告上行為...業(yè)務(wù)規(guī)則建模潛在需求營銷模型預(yù)測用戶畫像標簽層級標簽+營銷模型建模機器學習建模清洗、結(jié)構(gòu)化、統(tǒng)計建模...模型預(yù)測事實業(yè)務(wù)類高奢人群...有房一族有車一族人口屬性當下44數(shù)據(jù)挖掘與用戶畫像方案45用戶畫像乊應(yīng)用業(yè)務(wù)應(yīng)用標簽維度根據(jù)應(yīng)用擴展維度業(yè)務(wù)應(yīng)用標簽維度根據(jù)維度擴展維度售前:精準營銷售中:個性化推薦售后:增值服務(wù)……人口屬性上網(wǎng)特征購物偏好……用戶畫像乊應(yīng)用業(yè)務(wù)應(yīng)用標簽維度根據(jù)應(yīng)用擴展維度業(yè)務(wù)應(yīng)用標簽維46營銷效果分析系統(tǒng)基礎(chǔ)設(shè)施群發(fā)式短信&郵件觸發(fā)式短信&郵件短信&郵件營銷在線營銷訪客找回再營銷實時競價廣告廣告著陸頁社會化活動社會化分享網(wǎng)絡(luò)輿情監(jiān)控社會化營銷潛在客戶獲取潛在客戶評級潛在客戶分組潛在客戶培育銷售預(yù)警銷售智能化數(shù)據(jù)應(yīng)用能力——典型應(yīng)用:“售前”精準營銷CRM系統(tǒng)整合接口營銷效果分系統(tǒng)基礎(chǔ)設(shè)施群發(fā)式短信&郵件觸發(fā)式短信&47目標?建立互聯(lián)網(wǎng)全觸點用戶經(jīng)營模式?拉通和建立消費者統(tǒng)一的用戶數(shù)據(jù)平臺?利用用戶數(shù)據(jù)驅(qū)勱業(yè)務(wù)改進解決方案?建設(shè)用戶中心大數(shù)據(jù)平臺?收集、拉通企業(yè)內(nèi)、外部消費者用戶數(shù)據(jù)?建立消費者用戶畫像,對用戶進行紳分,識別用戶的興趣愛好等特征?基于用戶畫像完成營銷增強和精準營銷價值展示全觸點打通用戶微觀畫像用戶行為偏好精準廣告營銷某知名制造企業(yè)支持營銷應(yīng)用目標解決方案價值展示全觸點打通用戶微觀畫像用戶行為偏好精準廣48用戶關(guān)系信息用戶乊間的關(guān)系(如:同事、校友、社交好友等)……用戶風險信息用戶溝通信息用戶財務(wù)信息用戶資產(chǎn)信息用戶聯(lián)系信息用戶事件信息用戶戶基本信息用戶產(chǎn)品信息客戶維度重大事件,公司開業(yè)、生日等違約事件,提前換款、逾期等可疑事件,可能發(fā)生的一些事……用戶名稱證件類信息客戶性質(zhì)信息……產(chǎn)品類型購買時間……信用評級黑名單……用戶利潤貢獻度……用戶資產(chǎn)相關(guān)信息……用戶聯(lián)系信息,包括主要營業(yè)地址電話、聯(lián)系地址、公司網(wǎng)址、電郵地址等用戶建議信息、申請信息、溝通信息、回訪信息、投訴信息、調(diào)查信息等業(yè)務(wù)據(jù)系統(tǒng)數(shù)客訂產(chǎn)用服單品戶信信信基息息息本……企數(shù)業(yè)內(nèi)據(jù)外大社音交微頻日網(wǎng)博視志站信頻流息量……傳統(tǒng)用戶畫像數(shù)據(jù)僅僅來自業(yè)務(wù)系統(tǒng),事件信息、關(guān)系信息、等多類信息缺失戒不足,很難形成準確、全方位的畫像。引入大數(shù)據(jù),實現(xiàn)了客戶360o立體畫像構(gòu)建360°用戶畫像體系用戶關(guān)系信息……用戶風險信息用戶溝通信息用戶財務(wù)信息49產(chǎn)用 業(yè)品戶 數(shù)務(wù)信畫 據(jù)系息像 統(tǒng)……大企數(shù)業(yè)據(jù)外部社微勱交博聯(lián)站信移息互網(wǎng)……傳統(tǒng)營銷采用一對多方式,確定目標群體,針對群體執(zhí)行營銷,成本高、準確性差。引入大數(shù)據(jù)可以根據(jù)客戶當前需要(NextBestAction)戒用戶生命周期的重要事件(KeyLifeEvent),實現(xiàn)個性化的智慧營銷執(zhí)行個性化精準營銷產(chǎn)用 業(yè)……大企數(shù)業(yè)據(jù)外部社微勱交博聯(lián)站信50……大企數(shù)業(yè)據(jù)外部社微勱交博聯(lián)站信移息互網(wǎng)……體,針對群體執(zhí)行營銷,成本高、準確產(chǎn)用 業(yè)品戶 數(shù)務(wù)信畫 據(jù)系息像 統(tǒng)傳統(tǒng)營銷采用一對多方式,確通定目過標用群戶拉通與用戶畫像,對59萬潛在消性差。引入大數(shù)據(jù)可以根據(jù)客費戶當者前形需成4個精準人群進行投放,是盲投點要(NextBestAction)戒用戶生命周期的重大事件(KeyLifeEv擊en率t)的,10倍實現(xiàn)個性化的智慧營銷執(zhí)行個性化精準營銷……大企數(shù)業(yè)據(jù)外部社微勱交博聯(lián)站信移息互51某家電制造企業(yè),新品發(fā)布時招募粉絲分析和解決方案問題和需求?期望通過短信和郵件方式,從老用戶中找出最有可能參加活勱的粉絲? 愿意參加活勱的一定是對品牌認同和忠誠度最高的用戶? 利用企業(yè)的CRM、客服、銷售等數(shù)據(jù),對用戶忠誠度進行綜合評定幵挑選忠誠度最高的用戶作為招募目標
接觸渠道的多少
購買品類的多少
投訴次數(shù)的多少
…效 果? 帶來了超過一半的粉絲,但成本只有以往的40%應(yīng)用亍社會化營銷某家電制造企業(yè),新品發(fā)布時招募粉絲問題和需求?期望通52數(shù)據(jù)應(yīng)用能力——典型應(yīng)用:“售中”個性化推薦數(shù)據(jù)應(yīng)用能力——典型應(yīng)用:“售中”個性化推薦53百分點個性化推薦引擎(BRE)數(shù)據(jù)采集第一方數(shù)據(jù)第二方數(shù)據(jù)第三方數(shù)據(jù)分布式存儲離線計算平臺活勱數(shù)據(jù)實時計算平臺實時數(shù)據(jù)歸檔數(shù)據(jù)場景引擎用戶畫像規(guī)則引擎商品畫像展示引擎算法引擎BRE百分點個性化推薦引擎(BRE)數(shù)據(jù)采集第一方數(shù)據(jù)第二方數(shù)據(jù)第54問題和需求? 下單率低某團購網(wǎng)站,應(yīng)用百分點推薦引擎優(yōu)化案例分析和結(jié)論? 步長偏短。PV為1的用戶占65+%,PV為2~5用戶比例逐步下滑,7~10開始穩(wěn)定,11步以上又開始略有上升? 主勱訪問用戶比較少,僅占8%左史,大多數(shù)用戶通過導航和搜索過來? 用戶首次進入和離開的品類變化率比較低? 用戶首次進入商圈和下單商圈較接近? 用戶的忠誠度比較低? 大多數(shù)用戶都是有強烈需求過來? 用戶具有區(qū)域性購買特征應(yīng)用亍個性化推薦問題和需求? 下單率低某團購網(wǎng)站,應(yīng)用百分點推薦引擎優(yōu)化案例55某團購網(wǎng)站,應(yīng)用百分點推薦引擎優(yōu)化案例解決方案? 改進召回:使用用戶畫像中的品類偏好、商圈偏好、消費能力等標簽優(yōu)化召回? 去除用戶反感:利用用戶標簽衰減、權(quán)重清零等機制,進行品類過濾,避免給用戶進行過力營銷? 利用百分點覆蓋多行業(yè)多客戶的全網(wǎng)數(shù)據(jù)特點,構(gòu)建用戶全網(wǎng)的潛在需求標簽:解決冷啟勱問題效 果? 點擊率平均提升18.23%? 平均步長提升45.8%? 影響下單提升30%? 直接下單提升86.95%應(yīng)用亍個性化推薦某團購網(wǎng)站,應(yīng)用百分點推薦引擎優(yōu)化案例? 改進召回:使用用戶56補錄滿意度用戶線下維修獲取用戶手機號/IMEI錄入系統(tǒng)(TCS)溝通維修解決方案現(xiàn)場維修服務(wù)結(jié)束事后錄入問題&解決方案&滿意度抽查電話回訪坐席分配CallCenter溝通提出
解決方案
事后錄入問題&投訴&解決方案&滿意度熱線服務(wù)結(jié)束界面展現(xiàn)用戶信息界面展現(xiàn)用戶信息用戶畫像平臺1、實時傳入IMEI4、補充/更新用戶畫像信息2、實時傳入電話號碼3、實時向界面展示系統(tǒng)反饋用戶基本信息、歷叱維修、歷叱咨詢、購買信息、觸點、服務(wù)知識推薦等數(shù)據(jù)應(yīng)用能力——典型應(yīng)用:“售后”增值服務(wù)用戶呼入服務(wù)熱線補錄滿意度用戶線下維修獲取用戶手機號/IMEI錄入系統(tǒng)57小 結(jié)用戶畫像不是數(shù)學游戲,而是嚴肅的業(yè)務(wù)問題,是業(yè)務(wù)與技術(shù)的最佳結(jié)合點,是現(xiàn)實與數(shù)據(jù)化的最佳實踐小 結(jié)58BigDataPractitioner謝謝BigDataPractitioner謝謝59ThankYou世界觸手可及攜手共進,齊創(chuàng)精品工程ThankYou世界觸手可及攜手共進,齊創(chuàng)精品工程60數(shù)據(jù)挖掘與用戶畫像方案數(shù)據(jù)挖掘與用戶畫像方案61大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案62大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案大數(shù)據(jù)挖掘的用戶畫像應(yīng)用方案63數(shù)據(jù)挖掘與用戶畫像方案64大數(shù)據(jù)用戶畫像在海量數(shù)據(jù)時代愈來愈重要大數(shù)據(jù)用戶畫像是海量數(shù)據(jù)的標簽化,幫助企業(yè)更精準解決問題他們是誰?他們的需求?他們的行為?我們的用戶價值大???如何進行產(chǎn)品定位?如何優(yōu)化用戶體驗?如何進行精準投放?海量數(shù)據(jù)用戶標簽解決問題65大數(shù)據(jù)用戶畫像在海量數(shù)據(jù)時代愈來愈重要他們是誰?他們的需求?大數(shù)據(jù)用戶畫像貫穿品牌、產(chǎn)品、營銷全過程通過構(gòu)建人物模型更清晰指導企業(yè)策略Product品牌Who:建立品牌定位與核心人群的親密度.營銷Who+Where+When:構(gòu)建人群、渠道、場景的精準營銷,優(yōu)化媒介組合.產(chǎn)品Who+Why:拋開個人喜好,聚焦用戶動機和行為.66大數(shù)據(jù)用戶畫像貫穿品牌、產(chǎn)品、營銷全過程Product品牌營AlanCooper(交互設(shè)計之父)最早提出了persona的概念:“Personasareaconcreterepresentationoftargetusers.”Persona是真實用戶的虛擬代表,是建立在一系列真實數(shù)據(jù)(Marketingdata,Usabilitydata)之上的目標用戶模型。大數(shù)據(jù)用戶畫像可根據(jù)用戶的目標、行為和觀點的差異,將他們區(qū)分為不同的類型,然后每種類型中抽取出典型特征,賦予名字、照片、一些人口統(tǒng)計學要素、場景等描述,形成了一個人物原型(personas)。班納博士全世界最聰明的人之一,天才核物理學家,為人內(nèi)斂、冷靜,有點孤僻綠巨人由班納博士變成的綠巨人,時而能控制自己的情緒,時而不分敵我,力大無窮,橫沖直撞,力量能夠隨著憤怒而增強美國隊長,羅杰斯為人正直,充滿正義感,為人冷靜、比較古板,有統(tǒng)領(lǐng)全局的超強指揮能力,擁有振金制作的超強盾牌和高超的格斗能力AlanCooper(交互設(shè)計之父)最早提出了pers67現(xiàn)實業(yè)務(wù)業(yè)務(wù)IT系統(tǒng)業(yè)務(wù)數(shù)據(jù)自勱化沉淀數(shù)據(jù)化智能化IT時代DT時代業(yè)務(wù)IT系統(tǒng)大數(shù)據(jù)現(xiàn)實世界大數(shù)據(jù)是信息化技術(shù)的自然延伸,意思是無處不在的數(shù)據(jù)現(xiàn)實業(yè)務(wù)業(yè)務(wù)IT系統(tǒng)業(yè)務(wù)數(shù)據(jù)自勱化沉淀數(shù)據(jù)化智能化IT時代68BigData=無處不在的數(shù)據(jù)信息化建設(shè) 可穿戴設(shè)備 信息網(wǎng)絡(luò)?可穿戴設(shè)備甚至可植入設(shè)備將越來越多的出現(xiàn)在現(xiàn)實生活中攻殼機勱隊(GhostInTheShell)?全社會的信息化程度越來越高,越來越多的業(yè)務(wù)需要計算機應(yīng)用,用戶不這些應(yīng)用交互產(chǎn)生大量數(shù)據(jù)EugeneGoostman? 信息詐騙人類要學會從比特流中解讀他人,更要教會機器從比特流中理解人類? 個性化推薦? 個性化服務(wù)? 智能理財? 智能客服?無處丌在的網(wǎng)絡(luò)將人和設(shè)備連接在一起,認識人、不人溝通的方法將發(fā)生本質(zhì)性的變化大數(shù)據(jù)時代需要將“人”數(shù)據(jù)化:“用戶畫像”BigData=無處不在的數(shù)據(jù)信息化建設(shè) 可穿戴設(shè)備 69數(shù)據(jù)挖掘與用戶畫像方案70研究方法說明定量研究大數(shù)據(jù)數(shù)據(jù)挖掘:針對目標用戶群體,對其具體的網(wǎng)絡(luò)訪問路徑、基礎(chǔ)屬性、高級屬性(媒介習慣、消費觀念、事業(yè)觀)等進行定制數(shù)據(jù)挖掘定量調(diào)研:通過定量調(diào)研,對目標用戶的興趣愛好、生活形態(tài)、使用行為、背后原因等問題進行定量研究,發(fā)現(xiàn)其規(guī)律及問題定性研究小組座談會:能夠?qū)δ繕擞脩艏疤囟毞钟脩舢a(chǎn)生較為具體的認知、對用戶生活形態(tài)、消費、產(chǎn)品/服務(wù)使用細節(jié)進行深入了解用戶深訪:在不同類型用戶中挑選1-2名進行深度訪談,了解其動機、需求、以及相關(guān)驅(qū)動因素及期望等研究方法說明定量研究定量調(diào)研:通過定量調(diào)研,對目標用戶的興71定量研究—大數(shù)據(jù)數(shù)據(jù)挖掘基于大數(shù)據(jù)挖掘用戶行為特征人口屬性內(nèi)容標簽行為標簽購物標簽用戶的基本行為特征如何?網(wǎng)絡(luò)瀏覽行為如何?經(jīng)常訪問的網(wǎng)喜歡瀏覽什么內(nèi)容?金融預(yù)購或購買歷史如何?預(yù)購意向,最近輸年齡站類型娛樂入詞表現(xiàn)出某種產(chǎn)性別時間段教育品或服務(wù)需求地域頻次健康根據(jù)以往消費習慣收入學歷時長訪問路徑體育科技判斷可能購買某產(chǎn)品的用戶職業(yè)?……? ……?……?……定量研究—大數(shù)據(jù)數(shù)據(jù)挖掘人口屬性內(nèi)容標簽行為標簽購物標簽用戶72定量研究—定量調(diào)研通過用戶調(diào)研,對用戶行為、態(tài)度進行洞察興趣愛好價值觀念生活方式線下行為用戶都有哪些興趣愛好?生活方式如何?用戶的價值觀怎樣?用戶線下行為如何?節(jié)食品牌觀傳統(tǒng)媒體的接觸體育運動健身消費觀習慣如何?旅游購買優(yōu)惠券健康觀線下的購物習慣攝影飼養(yǎng)寵物社交觀怎樣?時尚上班開車時尚觀用戶行為背后的藝術(shù)?……? ……?……原因是什么??……定量研究—定量調(diào)研興趣愛好價值觀念生活方式線下行為用戶都有哪73社交因子嘗新因子壓力因子娛樂因子關(guān)注因子定量分析方法:人群聚類分析方法聚類分析是運營統(tǒng)計學方法,從目標對象中提取關(guān)鍵因子,對相似因子組合分類的一種統(tǒng)計分析方法我喜歡嘗試新事物我喜歡的品牌,我會一直使用它我喜歡被他人關(guān)注我很享受作為領(lǐng)導者的感覺…………我更喜歡集體活動勝過于獨自享受心情不好時我會暴飲暴食或瘋狂購物我常常感覺壓力很大,需要發(fā)泄……我認為享受生活是最重要的……遇到問題我愿意和家人朋友商量解決目標用戶研究緯度以用戶生活態(tài)度為例提取關(guān)鍵因子因子聚類重新定義細分用戶1……細分用戶3細分用戶274社交因子嘗新因子壓力因子娛樂因子關(guān)注因子定量分析方法:人群聚定性研究方法:日志法日志法指由按時間順序,詳細記錄自己在一段時間內(nèi)工作或者產(chǎn)品體驗,經(jīng)過歸納、分析,達到工作/產(chǎn)品分析的目的的一種分析方法特征描述行為追蹤體驗感受用戶的基礎(chǔ)屬性與偏好在短期內(nèi)不會發(fā)生變化,可以一次性獲得在測試之前進行一次生活日志填寫,了解用戶特征和基礎(chǔ)信息用戶每日產(chǎn)品體驗行為需要及時記錄,但行為跟蹤日志內(nèi)容不宜過多,保證用戶能積極參與,持續(xù)參與行為跟蹤日志問題集中在產(chǎn)品使用習慣和產(chǎn)品體驗,包括5-6個關(guān)鍵問題用戶需要持續(xù)體驗一段時間以后才會對產(chǎn)品有全面了解,在用戶進行產(chǎn)品體驗過程后期填寫體驗日志,記錄全面和具體的產(chǎn)品體驗執(zhí)行方法注意事項前期生活日志行為跟蹤日志體驗日志+執(zhí)行結(jié)束后深訪定性研究方法:日志法特征描述行為追蹤體驗感受用戶的基礎(chǔ)屬性與7519定性調(diào)研技巧:Laddering階梯法階梯法是一種中度結(jié)構(gòu)化的訪談方法,基于手段一目的理論(Means-EndChain),挖掘個人價值觀如何影響個人行為的方法;用戶研究中,應(yīng)用階梯法能夠探索用戶的產(chǎn)品屬性感知、使用結(jié)果與最終目的之間的聯(lián)系,深入挖掘消費者心理,在千差萬別的消費行為中找出共性Consequences結(jié)果Attributes屬性CoreValues核心價值觀梯式遞進A.C.V抽象屬性內(nèi)在屬性、外在屬性體驗利益、心理利益財務(wù)利益、功能利益提問提到的主要屬性的特定結(jié)果是什么通過有技巧的提問“為什么”的問題繼續(xù)挖掘更深層原因提問不同產(chǎn)品或品牌間的區(qū)別,激發(fā)被訪者描述產(chǎn)品主要屬性19定性調(diào)研技巧:Laddering階梯法階梯法是一種中度76深層意識源心理投射技術(shù)一次失真二次失真研究者消費者非語言感知一次失真語言表述二次失真被感知三次失真應(yīng)用層面上,目前國內(nèi)市場研究中普遍采用的投射技術(shù)與激發(fā)技術(shù)有16種,包括自由聯(lián)想/詞語聯(lián)想、品牌擬人、使用者形象/購買者形象、拼圖技術(shù)、購物籃、類比、品牌分類、泡泡圖、墓志銘等。?情景設(shè)定法、句子完成法?焦點轉(zhuǎn)移法(第三人稱)?人格模擬法、圖片投射法定性調(diào)研技巧:Projection
投射法投射法是要盡量避免直接詢問是研究主題,而以一種間接的方法來取得資料的方法,運用一種比較自然的、敏感度較低的方式來使被訪者表達出他的情感、需求、動機等,當潛在的動機、信仰和態(tài)度是處于一種潛意識狀態(tài)里,投射測驗十分有幫助深層意識源心理投射技術(shù)一次失真二次失真研究者消費者非語言感知77身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用戶畫像感性訃識身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用78身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用戶畫像感性訃識身長八尺,面如冠玉,頭戴綸巾,身披鶴氅,飄飄然有神仙乊概用79? 非形式化手段:文字、語音、圖像、視頻…? 形式化手段描述人、訃識人、了解人、理解人用戶畫像目 標方式組織標準驗證結(jié)構(gòu)化、非結(jié)構(gòu)化常識、共識、知識體系? 依據(jù):事實、推理過程? 檢驗用戶畫像的幾個方面? 非形式化手段:文字、語音、圖像、視頻…描述人、訃識人、80用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)+洞察大數(shù)據(jù)用戶畫像:定義用戶畫像是描述用戶的數(shù)據(jù),是符合特定業(yè)務(wù)需求的對用戶的形式化描述源亍現(xiàn)實,高亍現(xiàn)實用戶畫像是通過分析挖掘用戶盡可能多的數(shù)據(jù)信息得到的源亍數(shù)據(jù),高亍數(shù)據(jù)用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)+洞察大數(shù)據(jù)用81大數(shù)據(jù)用戶畫像:構(gòu)建原則業(yè)務(wù)知識體系用戶畫像形式化? 本體是一種形式化的、對亍共享概念體系的明確而又詳細的說明? 本體提供的是一種共享詞表,也就是特定領(lǐng)域乊中那些存在著的對象類型戒概念及其屬性和相互關(guān)系? 本體就是一種特殊類型的術(shù)語集,具有結(jié)構(gòu)化的特點,且更加適合亍在計算機系統(tǒng)乊中使用? 本體實際上就是對特定領(lǐng)域乊中某套概念及其相互乊間關(guān)系的形式化表達本 體Wiki:大數(shù)據(jù)用戶畫像:構(gòu)建原則業(yè)務(wù)知識體系用戶畫像形式化? 本82本體通常采用謂詞邏輯作為描述語言(符號表示、形式化表現(xiàn))基亍本體論的知識表示方法本體實例類關(guān)系函數(shù)公理個體元素個體的集合類乊間的相互作用一種特殊的關(guān)系永真斷言本體通常采用謂詞邏輯作為描述語言(符號表示、形式化表現(xiàn))基亍83符號概念事物代 表樸素的知識表示方法:符號-概念符號概念事物代 表樸素的知識表示方法:符號-概念84樸素的用戶特征表示方法:標簽-模型模 型經(jīng)驗總結(jié)的用戶特征標 簽用戶特征的符號表現(xiàn)現(xiàn) 實業(yè)務(wù)對應(yīng)的特征用戶群體樸素的用戶特征表示方法:標簽-模型模 型標 簽用戶特征的符號85用戶畫像可以用標簽的集合來表示標簽體系大數(shù)據(jù)用戶畫像:“標簽體系”方法化整為零化零為整每個標簽都規(guī)定了我們觀察、認識和描述用戶的一個角度用戶畫像是一個整體,各個維度丌孤立,標簽乊間有聯(lián)系標簽是某一種用戶特征的符號表示用戶畫像可以用標簽的集合來表示標簽體系大數(shù)據(jù)用戶畫像:“標簽86用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型是否反應(yīng)了現(xiàn)實 現(xiàn)實是否在模型中體現(xiàn)? 邏 輯:可靠性? 機器學習:準確率? 搜? …索:查準率? 邏 輯:完全性? 機器學習:召回率? 搜? …索:查全率標簽(體系)準不準?標簽(體系)全不全?用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型87用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型是否反應(yīng)了現(xiàn)實 現(xiàn)實是否在模型中體現(xiàn)? 邏 輯:可靠性? 機器學習:準確率? 搜 索:查準率? …? 邏 輯:完全性? 機器學習:召回率? 搜 索:查全率? …標簽(體系)準不準?標簽(體系)全不全?無法同時滿足用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型88用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型是否反應(yīng)了現(xiàn)實 現(xiàn)實是否在模型中體現(xiàn)? 邏 輯:可靠性? 機器學習:準確率? 搜 索:查準率? …? 邏 輯:完全性? 機器學習:召回率? 搜 索:查全率? …標簽(體系)準不準?標簽(體系)全不全?無法同時滿足用戶畫像是對現(xiàn)實世界中用戶的數(shù)學建模大數(shù)據(jù)用戶畫像:驗證模型89大數(shù)據(jù)用戶畫像:準確性驗證有事實標準數(shù)據(jù)+學習,可以驗證結(jié)果? 訓練集+測試集示 例?以注冊填寫性別為標注集,用ML算法摸索用戶行為不性別乊間的關(guān)系無事實標準假設(shè)+實現(xiàn),只能驗證過程? 計算過程是否合乎邏輯示 例? 流失用戶=半年未交易用戶? 忠誠度=若干綜合指標評分實踐檢驗證偽主義? 試錯、A/BTest、數(shù)據(jù)閉環(huán)、自我完善大數(shù)據(jù)用戶畫像:準確性驗證有事實標準數(shù)據(jù)+學習,可以驗證結(jié)果90數(shù)據(jù)挖掘與用戶畫像方案91大數(shù)據(jù)用戶畫像解決方案一覽Step02Step01Step04Step03Step06Step05確認目標營銷/產(chǎn)品/定位?頭腦風暴用戶矩陣、關(guān)聯(lián)規(guī)則,獲取可能的人物標簽收集數(shù)據(jù)屬性、行為、CRM等定義標簽動機/輕重度/消費/生活形態(tài)等人群分類因子分析-聚類分析-交叉分析優(yōu)先級排列頻率/市場大小/收益的潛力/競爭優(yōu)勢或策略等92大數(shù)據(jù)用戶畫像解決方案一覽Step02Step01Ste頭腦風暴是影響最終結(jié)果的關(guān)鍵用戶矩陣+關(guān)聯(lián)規(guī)則,盡可能多的獲取用戶關(guān)鍵詞外洗驅(qū)動使用e袋洗驅(qū)動滿意的點不滿意的點年齡90后80后70后品類襯衣鞋子羽絨服行業(yè)金融學生互聯(lián)網(wǎng)關(guān)聯(lián)規(guī)則示例如女性洗的襯衫多,有可能是為她老公洗,那么要猜想老公的外洗驅(qū)動和需求是什么?頭腦風暴是影響最終結(jié)果的關(guān)鍵外洗驅(qū)動使用e袋洗驅(qū)動滿意的點93常規(guī)用戶數(shù)據(jù)標簽體系分布基于用戶人群的基本屬性,可將標簽體系進行劃分人口屬性性別年齡職業(yè)婚姻狀況學歷教育……商業(yè)人口屬性工作崗位公司規(guī)模行業(yè)類型……行為屬性訪問媒體訪問時長訪問頻次……興趣標簽個人愛好生活習性生活方式生活社交服務(wù)需求消費意向物品購買商旅購買汽車購買CRM客戶狀態(tài)會員狀態(tài)生命價值擁有產(chǎn)品94常規(guī)用戶數(shù)據(jù)標簽體系分布基于用戶人群的基本屬性,可將標簽體系根據(jù)研究目的不同將人群進行劃分按照屬性劃分按照用戶基本屬性劃分,如年齡、收入、學歷、職業(yè)等分為年輕用戶、成熟用戶、女性、學生等按照使用動機劃分按照使用行為劃分按照不同生活態(tài)度,將用戶分類,如家庭型用戶、事業(yè)型用戶等按照產(chǎn)品的使用動機分類,如劃分為社交型用戶、冒險探險類用戶、休閑類用戶等按照消費行為劃分按照生活態(tài)度劃分按照使用行為,如產(chǎn)品使用時間分為深度用戶、重度用戶等按照產(chǎn)品服務(wù)廣告主分為消費潛在、消費重度用戶等人群定義 細分緯度適用范圍適用于有明顯人群特征的用戶群,如化妝品、女性網(wǎng)站等適用于有明顯的購買/使用目的,如游戲類用戶、禮品類產(chǎn)品/網(wǎng)站用戶適用于改進產(chǎn)品功能,對不同程度用戶進行深入推廣,了解產(chǎn)品使用、或者付費行為等主要適用于廣告主服務(wù),針對用戶消費行為吸引不同類型廣告主大部分用戶細分以生活態(tài)度為基礎(chǔ),普遍適用根據(jù)研究目的不同將人群進行劃分按照屬性劃分按照用戶基本屬性劃95基于用戶標簽搭建大數(shù)據(jù)用戶畫像根據(jù)所得用戶標簽,對用戶進行特征歸類,搭建大數(shù)據(jù)用戶畫像整合用戶標簽用戶群體分類建立大數(shù)據(jù)用戶畫像70%使用iPhone鯨魚用戶中價值用戶低價值用戶高價值用戶特征分析月消費金額>1000元60%為IT行業(yè)基于用戶標簽搭建大數(shù)據(jù)用戶畫像根據(jù)所得用戶標簽,對用戶進行特96統(tǒng)一的產(chǎn)品類目和屬性體系產(chǎn)品數(shù)據(jù)集成第三方數(shù)據(jù)數(shù)據(jù)源數(shù)據(jù)采集數(shù)據(jù)管理分析類應(yīng)用數(shù)據(jù)接口和應(yīng)用服務(wù)類應(yīng)用營銷類應(yīng)用數(shù)據(jù)接口統(tǒng)一的用戶畫像標簽體系電子渠道2.用戶全渠道ID識別用戶數(shù)據(jù)集成3.信息整合4.分析建模5.用戶畫像核心系統(tǒng)營銷渠道1.數(shù)據(jù)清洗家電制造金融航空行業(yè)用戶3.類別識別4.品牌識別5.屬性識別6.產(chǎn)品畫像1.數(shù)據(jù)清洗2.文本建模用戶畫像生產(chǎn)和應(yīng)用:邏輯架構(gòu)統(tǒng)一的產(chǎn)品類目和屬性體系產(chǎn)品數(shù)據(jù)集成第三方數(shù)據(jù)數(shù)據(jù)源數(shù)據(jù)采集97構(gòu)建用戶畫像的關(guān)鍵難題精準描述用戶特征多渠道產(chǎn)品信息打通用戶數(shù)據(jù)挖掘建模用戶多渠道信息打通實時采集用戶數(shù)據(jù)構(gòu)建用戶畫像的關(guān)鍵難題精準描述用戶特征多渠道產(chǎn)品信息打通98官網(wǎng)商城第三方線上渠道第三方線下渠道客戶經(jīng)理客服論壇社區(qū)微信微博智能應(yīng)用用戶標識會員標識手機用戶名郵箱銀行卡固話Cookie手機旺旺郵箱支付寶固話Cookie手機固話手機固話用戶名 用戶名郵箱序列號 序列號Cookie手機郵箱固話微信ID微博ID手機用戶名郵箱固話序列號MACIMEI手機固話Cookie手機固話手機固話序列號 序列號微信ID微信ID微信ID微信ID微信ID微信ID微信ID一定能得到的標識有可能得到的標識企業(yè)用戶觸點舉例官網(wǎng)商城第三方線上渠道第三方線下渠道客戶經(jīng)理99Time登
交瀏覽咨詢手機開戶錄易理財賬號確認手機+郵箱什么要打通:大數(shù)據(jù)時代我們需要上帝視角!身仹證+賬號+手機Cookie+賬號Cookie+賬號+手機CookieTime瀏覽咨詢手機開戶錄易理財賬號確認手機+郵箱什么要打通100用戶A用戶B用戶C用戶全渠道ID打通圖中低密級業(yè)務(wù)高密級業(yè)務(wù)? 有三類ID? ID間有相互聯(lián)系? 相互聯(lián)系的ID反映出它們很有可能代表同一個用戶?可以僅使用多重ID中的仸意一個?最大程度打通,跨平臺一致體驗?使用特定ID,戒者多種ID的組合?保證數(shù)據(jù)的準確和安全用戶A用戶B用戶C用戶全渠道ID打通圖中低密級業(yè)務(wù)高密級業(yè)務(wù)101人工手段業(yè)務(wù)人員手工映射人工成本昂貴標準丌好統(tǒng)一難以大規(guī)模開展自勱手段機器學習算法少量人工輔劣統(tǒng)一數(shù)據(jù)模型適合海量數(shù)據(jù)如何拉通:標簽體系拉通(1)人工手段業(yè)務(wù)人員手工映射自勱手段機器學習算法如何拉通:標簽體102類目標簽體系制定準備訓練 清洗訓練數(shù)據(jù) 數(shù)據(jù)文本建模訓練多個弱模型Boosting保存模型根據(jù)業(yè)務(wù)需求制定爬取互聯(lián)網(wǎng)開放數(shù)據(jù)保留有效字段VSM、TF/IDF、BagofWords…SVM、Bayes、KNN…線性加權(quán)所有弱模型的參數(shù)和權(quán)重以拉通類目體系為例,構(gòu)建基亍機器學習的自勱分類模型如何拉通:標簽體系拉通(2)類目標簽體系制定準備訓練 清洗訓練數(shù)據(jù) 數(shù)據(jù)文本建模訓103模型預(yù)測事實業(yè)務(wù)類高奢人群...有房一族有車一族人口屬性當下需求人群屬性消費能力用戶價值 活躍度忠誠度影響力...人口屬性購物了什么品類會員信息瀏覽了幾次...原始輸入網(wǎng)站行為消費行為會員信息廣告上行為...業(yè)務(wù)規(guī)則建模潛在需求營銷模型預(yù)測用戶畫像標簽層級標簽+營銷模型建模機器學習建模清洗、結(jié)構(gòu)化、統(tǒng)計建模...模型預(yù)測事實業(yè)務(wù)類高奢人群...有房一族有車一族人口屬性當下104數(shù)據(jù)挖掘與用戶畫像方案105用戶畫像乊應(yīng)用業(yè)務(wù)應(yīng)用標簽維度根據(jù)應(yīng)用擴展維度業(yè)務(wù)應(yīng)用標簽維度根據(jù)維度擴展維度售前:精準營銷售中:個性化推薦售后:增值服務(wù)……人口屬性上網(wǎng)特征購物偏好……用戶畫像乊應(yīng)用業(yè)務(wù)應(yīng)用標簽維度根據(jù)應(yīng)用擴展維度業(yè)務(wù)應(yīng)用標簽維106營銷效果分析系統(tǒng)基礎(chǔ)設(shè)施群發(fā)式短信&郵件觸發(fā)式短信&郵件短信&郵件營銷在線營銷訪客找回再營銷實時競價廣告廣告著陸頁社會化活動社會化分享網(wǎng)絡(luò)輿情監(jiān)控社會化營銷潛在客戶獲取潛在客戶評級潛在客戶分組潛在客戶培育銷售預(yù)警銷售智能化數(shù)據(jù)應(yīng)用能力——典型應(yīng)用:“售前”精準營銷CRM系統(tǒng)整合接口營銷效果分系統(tǒng)基礎(chǔ)設(shè)施群發(fā)式短信&郵件觸發(fā)式短信&107目標?建立互聯(lián)網(wǎng)全觸點用戶經(jīng)營模式?拉通和建立消費者統(tǒng)一的用戶數(shù)據(jù)平臺?利用用戶數(shù)據(jù)驅(qū)勱業(yè)務(wù)改進解決方案?建設(shè)用戶中心大數(shù)據(jù)平臺?收集、拉通企業(yè)內(nèi)、外部消費者用戶數(shù)據(jù)?建立消費者用戶畫像,對用戶進行紳分,識別用戶的興趣愛好等特征?基于用戶畫像完成營銷增強和精準營銷價值展示全觸點打通用戶微觀畫像用戶行為偏好精準廣告營銷某知名制造企業(yè)支持營銷應(yīng)用目標解決方案價值展示全觸點打通用戶微觀畫像用戶行為偏好精準廣108用戶關(guān)系信息用戶乊間的關(guān)系(如:同事、校友、社交好友等)……用戶風險信息用戶溝通信息用戶財務(wù)信息用戶資產(chǎn)信息用戶聯(lián)系信息用戶事件信息用戶戶基本信息用戶產(chǎn)品信息客戶維度重大事件,公司開業(yè)、生日等違約事件,提前換款、逾期等可疑事件,可能發(fā)生的一些事……用戶名稱證件類信息客戶性質(zhì)信息……產(chǎn)品類型購買時間……信用評級黑名單……用戶利潤貢獻度……用戶資產(chǎn)相關(guān)信息……用戶聯(lián)系信息,包括主要營業(yè)地址電話、聯(lián)系地址、公司網(wǎng)址、電郵地址
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程單位租車合同范例
- 重塑孤殘兒童庇護之路
- 液壓新篇:挑戰(zhàn)與超越
- 姑蘇區(qū)物業(yè)管理合同范例
- 中醫(yī)培訓合作合同范例
- 平臺服務(wù)抽合同范例
- 工程居間付款合同模板
- 工業(yè)廠房干貨合同范例
- 婚慶店轉(zhuǎn)讓合同范例
- 加盟餐飲商務(wù)合同范例
- 醫(yī)療健康管理合作框架協(xié)議
- 教師資格考試《高中心理健康專業(yè)面試》真題卷
- 2024跨國公司在中國新市場環(huán)境下的致勝之道-羅蘭貝格
- 2024年拖車服務(wù)合同范本
- 培訓需求調(diào)研問卷
- (管理制度)某酒業(yè)公司經(jīng)銷商管理制度
- 2023-2024年高二年級上學期期中試題:文言文閱讀(解析版)
- 江蘇省揚州市2022-2023學年高一上學期數(shù)學期中考試試卷(含答案)
- 手術(shù)分級目錄(2023年修訂)
- 【六年級】上冊道德與法治-(核心素養(yǎng)目標)9.1 知法守法 依法維權(quán) 第一課時 教案設(shè)計
- 學習解讀2024年《關(guān)于深化產(chǎn)業(yè)工人隊伍建設(shè)改革的意見》課件
評論
0/150
提交評論