版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
市場營銷中的數(shù)據分析方法Agenda2024/6/20可編輯Usefultipsandtricks TitleimagesAgendaslidesTextandimagepagesProcessandconceptslidesChartsTablesOrganizationalchartsMapsandflagsTimelinesFinalslides報告內容原理篇客戶關系管理中的數(shù)量方法方法篇數(shù)據分析方法概論統(tǒng)計分析方法數(shù)據挖掘分析方法工具篇常用數(shù)據分析工具簡介總結基本結論市場營銷中的數(shù)量決策問題傳統(tǒng)的純粹定性描述方法已遠遠不能滿足現(xiàn)代市場營銷實踐的需要,為了體現(xiàn)市場營銷學本身的科學性和對企業(yè)實踐的指導性,數(shù)據分析理論與方法在市場營銷學中占有越來越重要的地位。理論上->計量市場營銷學的出現(xiàn)理念上->數(shù)據庫營銷、關系營銷的興起實務上->數(shù)據挖掘技術在客戶關系管理中的應用探察數(shù)量決策問題的兩個視角理論上的框架要素實務上的業(yè)務流程20June2024MarketingCommunications–2015StrategyandExecution4視角一:市場營銷學的理論框架
核心概念營銷觀念營銷計劃營銷組織營銷控制營銷審計產品策略定價策略分銷策略促銷策略需求分析市場細分目標市場市場定位基礎理論戰(zhàn)略理論策略理論管理理論20June2024MarketingCommunications–2015StrategyandExecution5視角一示例:市場營銷中的產品決策產品定位定位圖分析(感知定位圖、偏好定位圖等)新產品擴散與產品生命周期管理巴斯模型(BASSModel)生長曲線模型(GrowthCurveModel)品牌決策消費者品牌選擇模型20June2024MarketingCommunications–2015StrategyandExecution6視角二示例:電信業(yè)業(yè)務流程視圖(eTOM)運營實施保障計費運營支撐與就緒客戶關系管理服務管理與運營資源管理與運營供應商/合作伙伴關系管理(應用,計算與網絡)企業(yè)管理戰(zhàn)略與企業(yè)規(guī)劃財務與資產管理企業(yè)質量管理管理,過程與IT規(guī)劃&架構股東與外部關系管理品牌管理,市場研究&廣告人力資源管理災難恢復,安全&欺詐管理研究與開發(fā),技術獲取戰(zhàn)略,基礎設施&產品產品周期管理基礎設施生命周期管理戰(zhàn)略與承諾營銷&產品提供管理服務開發(fā)與管理資源開發(fā)與管理供應鏈開發(fā)與管理(應用,計算與網絡)客戶20.06.2024TitlederPr?sentationundAutor視角二示例:理解客戶與市場市場購買行為消費者購買行為模型消費者品牌選擇模型市場需求測量市場需求預測模型市場細分20June2024MarketingCommunications–2015StrategyandExecution8客戶生命周期與市場營銷策略客戶生命周期在不同生命周期階段需考慮不同問題如何發(fā)現(xiàn)并獲取潛在客戶?階段A(Acquisition)客戶獲取如何把客戶培養(yǎng)成高價值客戶?階段B:(Build-up)客戶提升如何使客戶使用新電信產品?如何培養(yǎng)顧客忠誠度?階段C:(Climax)客戶成熟如何延長客戶“生命周期”?階段D:(Decline)客戶衰退如何贏回客戶?階段E:(Exit)客戶離網客戶價值多種分析主題在不同時期應用客戶獲取市場細分與產品定位目標客戶特征識別刺激需求提升銷售交叉銷售目標營銷客戶保持生存分析客戶風險客戶挽留20June2024MarketingCommunications–2015StrategyandExecution9客戶細分細分是指將一個大的消費群體劃分成一個個細分群的動作,同屬于一個細分群的消費者彼此相似,而隸屬于不同細分群的消費者被視為不同。細分的目的可以讓管理者從一個比較高的層次上“鳥瞰”整個數(shù)據庫中的數(shù)據,從而可以用不同的方法對待處于不同細分群眾的客戶,提供相對個性化的服務??蛻艏毞值哪康母玫牧私饪蛻艚Y構改善客戶管理與溝通增加客戶貢獻度客戶細分中的數(shù)量方法聚類分析卡方自動交互檢測(CHAID)20June2024MarketingCommunications–2015StrategyandExecution10營銷策略客戶保持基于獎賞及高成本事件驅動的保持策略專注的,區(qū)分優(yōu)先級的Callcenter支持客戶獲取刻畫子分群的特征建立跟蹤系統(tǒng)(trackingsystems)以從價值的角度監(jiān)控新來的客戶交叉銷售對高價值客戶進行交叉銷售會產生更大的收益經常地,頭20%的客戶貢獻了將近100%的整體利潤.這些客戶對CRM策略開發(fā)是至關重要的。示例:基于價值的客戶細分(高價值客戶)20.06.2024TitlederPr?sentationundAutor中間層代表了客戶的大多數(shù).他們利潤較?。╰hinmargins)但容量巨大(highvolume).營銷策略定價與行為改變識別服務機會–增強可能的定價結構性定價以鼓勵改善收益性的行為交叉銷售利用預測模型識別具有潛在價值的客戶利用事件營銷與關系營銷策略去增加產品的持有量渠道與服務的效率識別高成本/低回報的渠道并重新部署或調整結構定位高成本業(yè)務流程以流線化或渠道遷移示例:基于價值的客戶細分(中價值客戶)20.06.2024TitlederPr?sentationundAutor盡管數(shù)量很少
(10%to20%)但他們消除了很大一部分的利潤.營銷策略改變定價識別與負利潤相關的定價策略與行為,鼓勵服務使用與目標定價以增加或引入由服務改變而帶來的可能收入客戶風險避免向具有信用風險的客戶進行交叉銷售客戶獲取識別低價值客戶并積極地在獲取過程中避免與這類客戶發(fā)生接觸示例:基于價值的客戶細分(低價值客戶)20.06.2024TitlederPr?sentationundAutor
RetirementAgeChildrenIndependentWealthAccumulationFirstChildFirstHomePre-RetirementCareerLaunchIndependenceFinancialDebutEmploymentChangeMarriageHighValue??HighValue??LowValue??LowValue??示例:基于生命階段的客戶細分20June2024MarketingCommunications–2015StrategyandExecution14客戶獲取在大多數(shù)商業(yè)領域中,業(yè)務發(fā)展的主要指標里包括新客戶的獲取能力。新客戶的獲取包括發(fā)現(xiàn)那些對你的產品不了解的客戶,也包括以前接受你的競爭對手服務的顧客??蛻臬@取中的數(shù)量方法特征識別(ProfilingandPenetrationAnalysis)響應模型(ResponseModel)20June2024MarketingCommunications–2015StrategyandExecution15客戶保持隨著行業(yè)的競爭越來越激烈和獲得一個新客戶的開支愈來愈大,保持原有客戶的工作愈來愈有價值??蛻舯3种械臄?shù)量方法流失預測模型客戶忠誠度模型20June2024MarketingCommunications–2015StrategyandExecution16交叉銷售與提升銷售交叉營銷是指你向現(xiàn)有的客戶提供新的產品和服務的營銷過程。公司與其客戶之間的商業(yè)關系是一種持續(xù)的不斷發(fā)展的關系,在這種關系建立起來以后,可以有很多種方法來不斷改善這種關系。雙方的目標是達到雙贏的結果,客戶獲益是由于他們得到了更好更貼切的服務質量,商家則因為增加銷售量獲利。交叉銷售中的數(shù)量方法購買傾向預測產品關聯(lián)分析20June2024MarketingCommunications–2015StrategyandExecution17客戶流失客戶流失預警分品牌、高/中/低價值、主動/被動構建模型分類預測數(shù)據挖掘模型客戶挽留流程設計彩鈴客戶流失預警分主動/捆綁構建模型分類預測數(shù)據挖掘模型客戶挽留流程設計競爭對手流失預警聯(lián)通用戶流失預測客戶挽留流程設計20.06.2024TitlederPr?sentationundAutor交叉銷售與提升銷售購買傾向預測彩鈴預測模型彩信預測模型WAP預測模型購物藍分析產品關聯(lián)分析營銷方案關聯(lián)分析提升銷售價值提升預測模型營銷案預演營銷預演是為了支持業(yè)務人員制訂新的資費營銷方案,然后對該方案在歷史數(shù)據上做相應的測算,從而根據測算結果來指導下一步工作。營銷活動管理-CMP需求名稱:營銷活動管理(CMP)提出時間:2006-01-01需求提出部門:市場部需求內容描述:營銷活動管理。通過系統(tǒng)分析定位目標營銷的客戶群,并自動生成客戶群信息進行管理,通過實時跟蹤客戶的營銷情況進行營銷策略的調整,并監(jiān)控渠道銷售信息。同時營銷活動完成以后進行營銷活動的評估。需求時間計劃:計劃06年7月前完成東莞、佛山地市的推廣。需求數(shù)據要求:目前系統(tǒng)數(shù)據支撐需求優(yōu)先級別:高需求實施難度:較高要求配合部門:業(yè)務支撐中心、客戶服務部其他說明:全省推廣需求,劉鵬負責
需求分析和定位:屬于05年的需求,已經納入日常維護,今年需要推廣。根據省公司的統(tǒng)一規(guī)劃安排。省公司時間規(guī)劃:2006年上半年完成省、市二級規(guī)劃,東莞和佛山推廣2006年上半年完成三個事件營銷KPI預測模型需求名稱:KPI預測模型提出時間:2006-02-23需求提出部門:東莞公司需求內容描述:KPI指標中的收入指標作為核心指標,規(guī)劃和預測十分重要。而收入受營銷政策與執(zhí)行的影響較大,傳統(tǒng)的歷史曲線預測方法與手段不能準確預測當期及下期的收入。實現(xiàn)邏輯:將當期營收款細拆為“當期收入”(如購卡收入、補換卡收入、后付費收入等)與“分期劃扣收入”(充值卡收入、營銷活動預存款收入等)兩個部分?!爱斊谑杖搿狈浅7€(wěn)定,只受季節(jié)因素影響,“分期劃扣收入”結合號碼級數(shù)據的消費ARPU可以較為方便地預演推算。推廣過去,針對KPI指標的重要指標(如收入、業(yè)務量等)都可以進行規(guī)劃和預測,有效的幫助各部門制定相關的政策策略。需求時間計劃:無需求數(shù)據要求:目前系統(tǒng)數(shù)據支撐。需求優(yōu)先級別:需求級別待定。需求實施難度:高要求配合部門:業(yè)務支撐中心、市場部其他說明:區(qū)域接口人負責(劉鵬)需求分析和定位:需求可行,可以通過邏輯回歸構建模型實現(xiàn),具體的建設方案需要與相關人員進行細化和確認。個人客戶分群需求名稱:個人客戶分群提出時間:2006-02-23需求提出部門:佛山公司需求內容描述:每個人作為消費者其對同一種產品的具體功能需求和關注點是不同的,因此作為為用戶服務的企業(yè),必須盡可能的考慮這些差異,發(fā)現(xiàn)這些存在于客戶整體內部的具有不同特征或消費習慣的客戶群體,然后再根據每個群體的特征執(zhí)行針對性的管理或營銷策略。將這個把客戶分成不同群體的過程稱之為“客戶分群”。通過對客戶合理的類別劃分,并對當前客戶以及預期的客戶群作區(qū)段分析,判斷不同區(qū)段的突出特點,對客戶總體構成有準確的認識,對客戶的服務和營銷更具針對性。對客戶分群可以達到如下目標:了解客戶的總體構成了解各種客戶價值的客戶群體特征了解流失客戶的客戶群體特征了解使用各種套餐的客戶群體特征了解各消費等級的客戶群體特征需求時間計劃:無需求數(shù)據要求:目前系統(tǒng)數(shù)據支撐。需求優(yōu)先級別:中等需求實施難度:中等要求配合部門:業(yè)務支撐中心、市場部、數(shù)據業(yè)務中心其他說明:區(qū)域接口人負責(劉敏)需求分析和定位:需求可行??蛻舴诸?聚類是根據一個或多個客戶屬性組合把所有客戶劃分成不同的類,同類內的客戶具有最大的相似性,異類間的客戶具有最大的差異性。通過對客戶合理的類別劃分,并對當前客戶以及預期的客戶群作區(qū)段分析,判斷不同區(qū)段的突出特點,對客戶總體構成有準確的認識,對客戶的服務和營銷更具針對性。對于各種業(yè)務(新業(yè)務)可以單獨進行客戶的細分,也可按照各種業(yè)務的綜合指標進行客戶細分,使市場營銷更具針對性。個人客戶價值評估需求名稱:個人客戶價值評估提出時間:2006-02-23需求提出部門:市場部需求內容描述:有區(qū)別的看待個人客戶的差異性,觀察其價值特征變化,綜合考慮成本,用戶成長度,客戶消費等因素,通過建模量化個人客戶對公司的貢獻和價值??蛻魞r值包括客戶貢獻與客戶成本兩個側面,對于前者,客戶的帳單金額已是很好的衡量指標,但是也需要綜合考慮其他指標(如新業(yè)務使用情況、長途或者漫游比例等);而對于后者,由于利用財務數(shù)據進行分攤或者活動單位成本進行直接計算還需時日(等待財務部的成本分攤工作完成),故當前階段是處理貢獻類相關指標以供用戶直觀考察。需求時間計劃:06年3月廣州數(shù)據集市試點需求數(shù)據要求:目前系統(tǒng)數(shù)據支撐需求優(yōu)先級別:高需求實施難度:高要求配合部門:業(yè)務支撐中心、財務部其他說明:負責人待定需求分析和定位:個人客戶價值如果考慮成本分攤,需要等財務部開展的成本分攤完成后才能考慮到地市的實施。新產品生命周期分析需求名稱:新產品生命周期分析提出時間:2006-02-23需求提出部門:數(shù)據業(yè)務中心需求內容描述:目前地市沒有明確和急需的需求,只是有個這樣的概念和初步的想法。省公司想法是作為一個科研項目來研究和分析,希望能研究一些成果幫助市公司的市場分析和營銷策略。需求時間計劃:根據省公司的統(tǒng)一規(guī)劃安排。需求數(shù)據要求:目前系統(tǒng)數(shù)據支撐需求優(yōu)先級別:高需求實施難度:高要求配合部門:業(yè)務支撐中心、市場部其他說明:試點科研項目,鄧逸斌、劉鵬負責需求分析和定位:題目比較難,優(yōu)先級別比較高,先按照省公司的思路和計劃安排走。初步思路進行兩個方面的研究:現(xiàn)有新業(yè)務產品的生命周期曲線研究本研究的內容主要包括構建產品生命周期曲線預測模型并基于相關產品展開數(shù)據實證研究,同時對實證結果進行有效的業(yè)務解釋并形成合理的政策建議。2.新業(yè)務產品生命周期變遷之關鍵績效指標的研究本研究的內容主要包括分析并總結產品生命周期變遷過程中對階段性轉折點具有前瞻警示作用的業(yè)務指標,并在此基礎之上構建切實可行的關鍵指標體系報告內容原理篇客戶關系管理中的數(shù)量方法方法篇數(shù)據分析方法概論統(tǒng)計分析方法數(shù)據挖掘分析方法工具篇常用數(shù)據分析工具簡介總結基本結論數(shù)量分析方法(QuantitativeAnalysis)數(shù)量分析是對事物的數(shù)量特征、數(shù)量關系與數(shù)量變化的分析。數(shù)量分析的類型按照分析的目的探索性數(shù)據分析描述性數(shù)據分析解釋性數(shù)據分析按照問題的本質確定性分析不確定性分析20June2024MarketingCommunications–2015StrategyandExecution27數(shù)量分析中的模型化方法數(shù)量模型是對現(xiàn)實問題的描述和模仿模型是為認識目的或實踐目的而建立的典型的模型化過程20.06.2024TitlederPr?sentationundAutor數(shù)據分析模型E.F.Codd的數(shù)據分析模型絕對模型(CategoricalModel):依據預定義路徑尋找原因,如查詢解釋模型(ExegeticalModel):依據多層次路徑尋找原因,如多維分析思考模型(ContemplativeModel):參數(shù)化路徑,如場景分析公式模型(FormulaicModel):模型化路徑,如數(shù)據挖掘ReportingAdHocQueriesPredictiveModelingWhathappened?Whydidithappen?Whatwillhappen?ROI應用復雜性Stage3Stage2Stage1HumanDiscoveryMachine-assistedDiscovery常用的數(shù)據分析方法/模型數(shù)量分析是對事物的數(shù)量特征、數(shù)量關系與數(shù)量變化的分析。數(shù)量分析的類型按照分析的目的探索性數(shù)據分析描述性數(shù)據分析解釋性數(shù)據分析按照問題的本質確定性分析不確定性分析20June2024MarketingCommunications–2015StrategyandExecution30認識分析數(shù)據:數(shù)據測量尺度名義尺度有序尺度間隔尺度比例尺度20June2024MarketingCommunications–2015StrategyandExecution31認識分析數(shù)據:數(shù)據結構類型截面數(shù)據(Cross-sectionData)時間序列數(shù)據(Time-seriesData)面板數(shù)據(PanelData)20June2024MarketingCommunications–2015StrategyandExecution32數(shù)據分析的出發(fā)點:數(shù)據矩陣截面數(shù)據(Cross-sectionData)時間序列數(shù)據(Time-seriesData)面板數(shù)據(PanelData)20June2024MarketingCommunications–2015StrategyandExecution33常用的統(tǒng)計分析方法數(shù)據分類分析聚類分析判別分析數(shù)據化簡分析主成分分析因子分析數(shù)據相關分析回歸分析典型相關分析數(shù)據預測分析時間序列預測20June2024MarketingCommunications–2015StrategyandExecution34什么是數(shù)據挖掘?DataInformationKnowledgeWisdom存在太多數(shù)據挖掘的定義,但基本上有這樣一種描述結構Tofind/discover/extract/dredge/harvest、、、Interesting/novel/useful/implicit/actable/meaningful、、、Information/knowledge/patterns/trends/rules/anomalies、、、Inmassivedata/largedataset/largedatabase/datawarehouse、、、Data+contextInformation+rulesKnowledge+experience為什么會出現(xiàn)數(shù)據挖掘?數(shù)據爆炸性增長是數(shù)據挖掘技術應運而生的根本原因。只見樹木,不見森林(Drowningindatabutstarvingforinformation)計算復雜度數(shù)據管理問題數(shù)據類型的多樣性處理大容量數(shù)據是數(shù)據挖掘技術區(qū)別于其他數(shù)據分析方法的唯一標志嗎?2024/6/2037其他數(shù)據分析方法:統(tǒng)計學從處理數(shù)據的角度看、、、數(shù)據規(guī)模不同數(shù)據來源不同:觀測數(shù)據(SecondaryAnalysis)VS試驗數(shù)據(PrimaryAnalysis)數(shù)據類型不同(結構化數(shù)據、半結構化數(shù)據、非結構化數(shù)據)從分析思想的角度看更關注實證性分析(EmpiricalAnalysis)而非探索性分析(ExploratoryAnalysis)更關注模型(Model)而非算法(Algorithm)但二者具有相當密切的聯(lián)系從數(shù)據分析的角度,統(tǒng)計學現(xiàn)在是且仍將是數(shù)據挖掘最重要的技術支撐和思想源泉更加深入的滲透和交叉(如探索性數(shù)據分析,EDA)數(shù)據挖掘是數(shù)據驅動的探索性分析!數(shù)據挖掘:多學科的匯合數(shù)據挖掘數(shù)據庫技術統(tǒng)計學其它學科信息科學機器學習可視化人工智能科學計算數(shù)據挖掘是一個過程“fromdataminingtoknowledgediscoveryindatabase”.U.fayyad,G.P.ShapiroandP.Smyth(1996)數(shù)據挖掘過程中的數(shù)據預處理數(shù)據清洗填充缺失值,修均噪聲數(shù)據,識別或刪除孤立點,并解決數(shù)據不一致問題主要分析方法:分箱(Binning)、聚類、回歸數(shù)據集成多個數(shù)據庫、數(shù)據方或文件的集成數(shù)據變換規(guī)范化與匯總數(shù)據簡化減少數(shù)據量的同時,還可以得到相同或相近的分析結果主要分析方法:抽樣、主成分分析數(shù)據離散化數(shù)據簡化的一部分,但非常重要(尤其對于數(shù)值型數(shù)據來說)數(shù)據挖掘過程中的數(shù)據探索探索性數(shù)據分析(ExploratoryDataAnalysis,EDA)探索性地查看數(shù)據,概括數(shù)據集的結構和關系對數(shù)據集沒有各種嚴格假定“玩”數(shù)據主要任務數(shù)據可視化(apictureisworthathousandwords)殘差分析(數(shù)據=擬合+殘差)數(shù)據的重新表達(什么樣的尺度-對數(shù)抑或平方跟-會簡化分析?)方法的耐抗性(對數(shù)據局部不良的不敏感性,如中位數(shù)耐抗甚于均值)常見方法統(tǒng)計量,如均值、方差、根方差、協(xié)方差、峰度、偏度、相關系數(shù)等統(tǒng)計圖,如餅圖、直方圖、散點圖、箱尾圖等模型,如聚類數(shù)據挖掘結果的評價興趣度度量:一個模式是有意義的,如果它易于被人理解,在某種程度上,對于新數(shù)據或者測試數(shù)據是有效的、潛在有用或者驗證了用戶渴望確認的某些假設。目前仍無很好的解決辦法,很大程度上仍依靠人工不存在解決這個問題的簡單技術,最終答案是不要把數(shù)據挖掘當作脫離數(shù)據內涵的簡單技術來運用客觀興趣度:基于統(tǒng)計或模式的結構,如統(tǒng)計量、支持度、lift等主觀興趣度:基于用戶對數(shù)據的確信程度,如意外程度、新奇程度或者可行動性等過度擬合(Over-fitting)問題什么不是數(shù)據挖掘?定量分析(QuantitativeAnalysis)的需要存在企業(yè)管理運行的各個側面或環(huán)節(jié),但并非所有的定量分析問題都可以歸結到數(shù)據挖掘范疇的問題。簡單的報表、圖表及多維分析仍是日常分析工作的主要內容小樣本數(shù)據的分析傳統(tǒng)統(tǒng)計分析方法更成熟有效,如趨勢預測某些特定業(yè)務問題無法用數(shù)據挖掘算法加以解決,例如資源最優(yōu)配置問題是個運籌學問題某些物流管理問題或者供應鏈管理問題是個隨機規(guī)劃問題營銷預演本質是個系統(tǒng)仿真問題幾個基本概念模型(Model)vs模式(Pattern)數(shù)據挖掘的根本目的就是把樣本數(shù)據中隱含的結構泛化(Generalize)到總體(Population)上去模型:對數(shù)據集的一種全局性的整體特征的描述或概括,適用于數(shù)據空間中的所有點,例如聚類分析模式:對數(shù)據集的一種局部性的有限特征的描述或概括,適用于數(shù)據空間的一個子集,例如關聯(lián)分析算法(Algorithm):一個定義完備(well-defined)的過程,它以數(shù)據作為輸入并產生模型或模式形式的輸出描述型挖掘(Descriptive)vs預測型挖掘(Predictive)描述型挖掘:對數(shù)據進行概括,以方便的形式呈現(xiàn)數(shù)據的重要特征預測型挖掘:根據觀察到的對象特征值來預測它的其他特征值描述型挖掘可以是目的,也可以是手段幾類基本的挖掘算法關聯(lián)規(guī)則(模式、描述型)發(fā)現(xiàn)數(shù)據集中的頻繁模式例如:buy(x,”diapers”)
buy(x,”beers”)[0.5%,60%]分類與預測(模型、預測型)發(fā)現(xiàn)能夠區(qū)分或預測目標變量(唯一的)的規(guī)則或者函數(shù)分類的目標變量一般是范疇型的,而預測則是數(shù)量型的,并不必然帶有任何時間延續(xù)型的暗示例如:股票市值的預測,病人病情的判斷聚類(模型、描述型)對數(shù)據分組以形成新類,類標記是未知的例如:市場細分孤立點探測(OutlierDetection)(模式、預測型)分析異?;蛟肼晹?shù)據的行為模式例如:欺詐檢測關聯(lián)規(guī)則的基本概念基本定義給定(1)事務數(shù)據集(2)每個事務是數(shù)據項的集合,試圖發(fā)現(xiàn)項集中的頻繁模式或關聯(lián)關系所謂頻繁模式或者關聯(lián)規(guī)則就是一個具有“A
B”形式的邏輯蘊涵式頻繁模式并不必然蘊涵著因果關系或相關關系!算法實現(xiàn)基本上基于APRIORI法則:頻繁項集的所有非空子集一定也是頻繁(Frequent)的基本分類布爾關聯(lián)規(guī)則vs定量關聯(lián)規(guī)則buy(x,”diapers”)
buy(x,”beers”)Age(x,”30..39”)^income(x,”42k..48k”)
buy(x,”PC”)單維關聯(lián)規(guī)則vs多維關聯(lián)規(guī)則單層關聯(lián)規(guī)則vs多層關聯(lián)規(guī)則Age(x,”30..39”)^income(x,”42k..48k”)
buy(x,”IBMPC”)序列模式(SequencePattern)數(shù)據項是一個包含時間標簽的序偶[item(i),t]關聯(lián)規(guī)則的度量發(fā)現(xiàn)具有最小置信度和支持度的全部規(guī)則X^YZ支持度(support),s,事務中包含{X&Y&Z}的概率置信度(confidence),c,
事務中包含{X&Y}的條件下,包含Z的條件概率令最小支持度為50%,最小置信度為50%,則有AC(50%,66.6%)CA(50%,100%)顧客購買尿布顧客購買兩者顧客購買啤酒對支持度與置信度的批判示例總共5000名學生,其中3000人玩籃球3750人吃谷類食品2000人既玩籃球又吃谷類食品playbasketball
eatcereal[40%,66.7%]是一個誤導規(guī)則,因為吃谷類食品的學生占學生總數(shù)的75%,比66.7%更高playbasketball
noteatcereal[20%,33.3%]其實是一個更精確的規(guī)則,盡管它的支持度和置信度都比較低關聯(lián)規(guī)則的應用市場購物籃分析(MarketBasketAnalysis)例如一個事務是客戶的一個購物清單,同一客戶的兩份清單被認為是兩個不同的事務數(shù)據項是所有可能陳列貨物的全集目標是發(fā)現(xiàn)同時出現(xiàn)的貨品組合間的關聯(lián)模式應用:商品貨價設計、倉儲規(guī)劃、網頁布局、產品目錄設計等等交叉銷售(CrossSelling)客戶依次購買不同產品的序列目標是發(fā)現(xiàn)在購買某一產品組合之后客戶可能購買的另一產品或服務應用:網絡故障分析、網站門戶設計等分類問題的基本定義給定一數(shù)據集合(訓練集)數(shù)據記錄由一系列變量組成其中有一個變量是目標分類標簽尋找一模型,使目標分類變量值是其他變量值的一個函數(shù)利用上述函數(shù),一未知分類變量值的數(shù)據記錄能夠盡可能準確地被判定到某一類別中去一般會有另一獨立地數(shù)據集(測試集)用以驗證所構建分類函數(shù)的準確性,避免過度擬合分類過程示意訓練集分類學習訓練集分類器IFrank=‘professor’ORyears>6THENtenured=‘yes’JefisYES!分類中的決策樹(DecisionTree)歸納決策樹類似于流程圖的樹型結構內部節(jié)點代表對某個屬性的一次測試分支代表測試的輸出結果葉節(jié)點代表分類標簽或分布決策樹的生成包括兩個階段樹的創(chuàng)建首先,所有訓練樣本都位于根節(jié)點遞歸地基于選擇屬性來劃分樣本集樹的修剪識別并刪除那些反映噪聲或孤立點的分支應用決策樹:對未知樣本進行分類在決策樹上測試樣本的各個屬性值決策樹示意示例:是否購買計算機?age?overcaststudent?creditrating?noyesfairexcellent<=30>40nonoyesyesyes30..40聚類的基本概念基本定義將數(shù)據對象集劃分成事先未知的分組或類別聚類的原則:類內相似度高,類間相似度低相似度一般為某種距離函數(shù)D(i,j)聚類既可以作為獨立分析工具考察數(shù)據分布結構,也可以作為其他分析方法的預處理步驟很不幸,對聚類結果的評價一般都是主觀的基本分類將數(shù)據對象集劃分成事先未知的分組或類別聚類示意基于歐氏距離的三維空間中的聚類A1A2B1xyz從算法到應用報告內容原理篇客戶關系管理中的數(shù)量方法方法篇數(shù)據分析方法概論統(tǒng)計分析方法數(shù)據挖掘分析方法其他分析方法工具篇常用數(shù)據分析工具簡介總結基本結論數(shù)據分析軟件數(shù)據分析軟件的種類按照分析模式統(tǒng)計分析軟件數(shù)據挖掘軟件OLAP軟件科學計算軟件按照分析范圍通用分析軟件專用分析軟件按照分析規(guī)模企業(yè)級分析軟件桌面級分析軟件20June2024MarketingCommunications–2015StrategyandExecution59數(shù)據分析軟件的基本特點功能全面,系統(tǒng)地集成了多種成熟的數(shù)據分析方法有完善的數(shù)據定義、操作和管理功能方便地生成各種統(tǒng)計圖形和統(tǒng)計表格使用方式簡單、靈活,有完備的聯(lián)機幫助功能軟件開放性好,能方便地和其他軟件進行數(shù)據交換20June2024MarketingCommunications–2015StrategyandExecution60學習使用統(tǒng)計分析軟件的基本方法弄清分析的目的正確收集待處理和分析的數(shù)據(目的、影響因素的剔除)弄清分析方法的概念、含義和適用范圍。無需記憶公式選擇一種或幾種分析方法來探索性地分析數(shù)據讀懂計算機分析的數(shù)據結果,發(fā)現(xiàn)規(guī)律,得出結論20June2024MarketingCommunications–2015StrategyandExecution61SAS:ThePowertoKnowSAS(StatisticalAnalysisSystem)是一個模塊化、集成化的大型應用軟件系統(tǒng);目前國際上最流行的一種大型統(tǒng)計分析系統(tǒng);統(tǒng)計分析的標準軟件SAS系統(tǒng)主要完成以數(shù)據為中心的四大任務:數(shù)據訪問;數(shù)據管理;數(shù)據呈現(xiàn);數(shù)據分析。它由數(shù)十個專用模塊構成,SAS/STAT(統(tǒng)計分析);SAS/ETS(經濟計量與時間序列分析);SAS/QC(質量控制管理);SAS/OR(運籌學);SAS/IML(矩陣運算);SAS/GRAPH(繪圖)等20June2024MarketingCommunications–2015StrategyandExecution62SPSS:RealStat,RealEasySPSS(StatisticalPackagefortheSocialScience)--社會科學統(tǒng)計軟件包是世界是著名的統(tǒng)計分析軟件之一。SPSSforWindows是一個組合式軟件包,它集數(shù)據整理、分析功能于一身。用戶可以根據實際需要和計算機的功能選擇模塊,以降低對系統(tǒng)硬盤容量的要求,有利于該軟件的推廣應用。SPSS的基本功能包括數(shù)據管理、統(tǒng)計分析、圖表分析、輸出管理等等。SPSS統(tǒng)計分析過程包括描述性統(tǒng)計、均值比較、一般線性模型、相關分析、回歸分析、對數(shù)線性模型、聚類分析、數(shù)據簡化、生存分析、時間序列分析、多重響應等幾大類,每類中又分好幾個統(tǒng)計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權估計、兩階段最小二乘法、非線性回歸等多個統(tǒng)計過程,而且每個過程中又允許用戶選擇不同的方法及參數(shù)。SPSS也有專門的繪圖系統(tǒng),可以根據數(shù)據繪制各種圖形。20June2024MarketingCommunications–2015StrategyandExecution63報告內容原理篇客戶關系管理中的數(shù)量方法方法篇數(shù)據分析方法概論統(tǒng)計分析方法數(shù)據挖掘分析方法工具篇常用數(shù)據分析工具簡介總結基本結論總結關鍵是業(yè)務問題的發(fā)現(xiàn)及其構建以及切實迎合業(yè)務需要從分析方法的角度切入討論只是手段而非目的方法還是很重要的方法應該是最不會成為問題的方法是個工具箱關于Teradata2005Revenue
byBusinessUnitTeradataDataWarehouseRetailSolutionsFinancialSolutionsWorldwideCustomerServicesSystemediaNCR公司概貌Fortune500companyGlobaloperationsinover100countries&territoriesMorethan28,000employees$6BrevenueNon-pensionoperatingincome3pointimprovementto9%50%ofTop
GlobalRetailers60%ofTopMostAdmired
GlobalCompanies90%ofTopGlobal
TelcoFirms60%ofTop
GlobalAirlines50%oftheTop
Transportation
LogisticFirmsTeradata在Fortune500中的優(yōu)異表現(xiàn)LeadingindustriesBankingGovernmentInsurance&HealthcareManufacturingRetailTelecommunicationsTransportationLogisticsTravelWorldclasscustomerlistMorethan800customersGlobalpresenceOver100countriesandterritoriesFORTUNEGlobalRankings,July2005TopTenRankinginFortune500分析型CRM是擅長之一RetailFinancialTravelCommunicationsInsuranceManufacturing/SourcingUnionBankofNorway20.06.2024TitlederPr?sentationundAutorTechnologyROIAwardsHarrah’s-GrandPrizeWinnerStateofIowa-Winner,PublicSectorTDWIBestPracticesAwardEnterpriseDataWarehouse:UnionPacificGovernment&Non-profit:StateofMichiganWorldClassSolutionAwardsJeffersonCountyPublicSchools,winner-DataManagementcategory;GCNAgencyAwardsUSAirForceKnowledgeSystems,MaterialSystemsGroup/EnterpriseSystemsDivisionNCDMDatabaseExcellenceAwardFubonFinancialHoldingCompany(Taiwan)-SilverAwardCIOMagazineEnterpriseValueAwardsContinentalAirlines,Winner-TransportationAceHardware,Winner-Retail/WholesaleIntelligentEnterpriseEditors’ChoiceAwardsTeradatanamedoneofIntelligentEnterpriseDozenMostInfluentialCompaniesDMReview100Teradata-industryleaderinbusinessintelligence,datawarehousingandanalyticsmarket
CRMMarketLeaderTeradata-MarketLeaderinCRMAnalyticscategoryBestPracticesinBusinessIntelligenceLexisNexis,ManagingandEnhancingBIAp
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房地產業(yè)安全生產管理辦法
- 動物救助捐贈管理計劃
- 體育賽事巴士租賃合同
- 神經外科人才聘用合同模板
- 2022年大學森林資源專業(yè)大學物理下冊月考試卷C卷-附解析
- 2022年大學生物科學專業(yè)大學物理二月考試題C卷-附解析
- 25樓地面采暖工程施工合同
- 2022年大學數(shù)學專業(yè)大學物理二期末考試試卷D卷-附解析
- 2022年大學口腔醫(yī)學專業(yè)大學物理二期末考試試卷-附解析
- 新生兒濕疹護理健康宣教
- 【課件】第4課 畫外之意-中國傳統(tǒng)花鳥畫、人物畫 課件-2022-2023學年高中美術人教版(2019)美術鑒賞
- 堤壩拋石固腳施工方案(標準版)
- 醫(yī)療器械不良事件報告表
- 災難救援現(xiàn)場的檢傷分類方法
- 探秘瀾滄江-湄公河流域的河流地貌(公共課件)
- 盤扣支架施工合同
- 建筑工程各種材料臺賬樣表格模板
- 配餐學校供餐企業(yè)交接餐檢查記錄表
- 通風隊崗位說明書XXXX117
- 初中體育與健康人教九年級(2023年修訂) 田徑初三跨欄教案
- DB13T 5216-2020 建設用地土壤污染風險篩選值
評論
0/150
提交評論