




已閱讀5頁(yè),還剩58頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)挖掘在商務(wù)智能決策與 CRM中的應(yīng)用 北京科技大學(xué) 楊炳儒 教授 數(shù)據(jù)挖掘(知識(shí)發(fā)現(xiàn))新進(jìn)展 數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用 數(shù)據(jù)挖掘在 CRM中的應(yīng)用 第一部分?jǐn)?shù)據(jù)挖掘(知識(shí)發(fā)現(xiàn))新進(jìn)展 五、研究動(dòng)態(tài)與趨向 一、數(shù)據(jù)挖掘 (知識(shí)發(fā)現(xiàn) )概念內(nèi)涵與外延的發(fā)展 二、挖掘知識(shí)類型的擴(kuò)展 三、挖掘技術(shù)方法的擴(kuò)展 四、應(yīng)用的擴(kuò)展 一、數(shù)據(jù)挖掘 (知識(shí)發(fā)現(xiàn) )概念內(nèi)涵與外延的發(fā)展 結(jié)構(gòu)化數(shù)據(jù)挖掘 DM(KDD) 多媒體數(shù)據(jù)構(gòu)成的大型異質(zhì)異構(gòu)數(shù)據(jù)庫(kù),稱為復(fù)雜數(shù)據(jù)類型挖掘 CDM 動(dòng)態(tài) (在線 )-分布式 -并行系統(tǒng) Web: 1、以文本為主的頁(yè)面內(nèi)容挖掘 2、以客戶訪問(wèn)信息為主 3、以 Web結(jié)構(gòu)為主 多媒體:音頻、視頻、圖像、圖形、時(shí)序、空間等 基于知識(shí)庫(kù)的知識(shí)發(fā)現(xiàn)KDK 知識(shí)發(fā)現(xiàn)的新定義: 在現(xiàn)實(shí)世界中,針對(duì)客觀存在的具有海量性、不確定性、不完全性的量的、質(zhì)的、復(fù)雜形態(tài)的知識(shí)源,挖掘其中潛在的、先前未知的、用戶感興趣的、最終可被用戶理解的模式的非平凡提取過(guò)程。 二、挖掘知識(shí)類型的擴(kuò)展 擴(kuò)展 擴(kuò)展 關(guān)聯(lián)規(guī)則、分類、聚類、相似模式、 混沌模式、時(shí)序模式、預(yù)測(cè)等 文本、客戶訪問(wèn)路徑、音頻、視頻 生物信息挖掘、游戲信息挖掘、 XML文檔、多語(yǔ)言文本挖掘、 圖表數(shù)據(jù)庫(kù)、分子結(jié)構(gòu)數(shù)據(jù)庫(kù)等 三、挖掘技術(shù)方法的擴(kuò)展 擴(kuò)展 統(tǒng)計(jì)學(xué)(數(shù)理統(tǒng)計(jì))、證據(jù)理論、 機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、粗糙集、 近似推理、小波、分形、概念格、 概念樹(shù)提升、決策樹(shù)等 Hilbert空間、信息融合與 神經(jīng)網(wǎng)絡(luò)結(jié)合、距離測(cè)度函數(shù)、 數(shù)據(jù)立方體、隱馬爾可夫模型、信息熵、 主觀 Bayes方法、信息擴(kuò)散等 四、應(yīng)用的擴(kuò)展 金融、醫(yī)療保健、市場(chǎng)業(yè)、零售業(yè)、 制造業(yè)、工程與科學(xué)、經(jīng)紀(jì)業(yè)和安全交易、 證券交易、瑕疵分析、政府和防衛(wèi)、電信、 司法、企業(yè)經(jīng)營(yíng)管理等等 應(yīng)用領(lǐng)域擴(kuò)展 Internet、農(nóng)業(yè)、氣象、遠(yuǎn)程教育、 天文學(xué)、生物信息、地理信息等等 Marksman、 Think Machine、 DataMind、 Intelligent Miner、 KnowledgeSEEKER、等等 實(shí)例和軟件的擴(kuò)展 MSMiner、 KDD*、 KDK*、 KD(D&K)等等 五、研究動(dòng)態(tài)與趨向 目前國(guó)際上 KDD的研究主要是以知識(shí)發(fā)現(xiàn)的任務(wù)描述 、 知識(shí)評(píng)價(jià)與知識(shí)表示為主線 , 有效的知識(shí)發(fā)現(xiàn)算法為中心 。 這是在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)保持的主流 與基調(diào)。 國(guó)外研究動(dòng)態(tài) 2003年 8月 27日在華盛頓召開(kāi)了第九屆知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘國(guó)際會(huì)議,參與討論的專家一致認(rèn)為: 數(shù)據(jù)挖掘正面臨著巨大的機(jī)遇和挑戰(zhàn)。 其中 U. Fayyad認(rèn)為 從科學(xué)發(fā)展的長(zhǎng)遠(yuǎn)來(lái)看 ,最大的絆腳石是基礎(chǔ)理論的缺乏以及所面臨的問(wèn)題和挑戰(zhàn)的清晰明白的闡述。 他認(rèn)為對(duì)于我們要做什么,幾乎沒(méi)有理論甚至工程實(shí)踐來(lái)指導(dǎo):在今天它仍然是” 不為人知的藝術(shù)”。 我們需要理論來(lái)指導(dǎo)我們要做什么以及要如何作。這些理論能夠促使工程解決方法的出現(xiàn),這樣我們也可以將我們的 “手藝”更有效的教給其他人。而這種形勢(shì)與從業(yè)者以及對(duì)應(yīng)用感興趣的人們的巨大的熱情同時(shí)存在,這些人來(lái)自不同的領(lǐng)域,但是沒(méi)有科學(xué)根基以及持續(xù)的學(xué)術(shù)發(fā)展,本領(lǐng)域不可能得到發(fā)展與鞏固。 R.Uthurusamy認(rèn)為 WEB的使用和生產(chǎn)廠家的大肆宣傳等都會(huì)在短期內(nèi)影響本領(lǐng)域的發(fā)展,它們會(huì)使得我們將更多的精力投向數(shù)據(jù)庫(kù)營(yíng)銷、 CRM和OLAP等方面,而不是致力于使 KDD從根本上或科學(xué)上有大的進(jìn)步。 KDD的基礎(chǔ)研究界必須消除這些干擾而去努力解決 KDD的真正的根本的問(wèn)題。 國(guó)內(nèi)研究動(dòng)態(tài) 我們編制了了軟件對(duì)中國(guó)期刊網(wǎng)上 1994年至今的論文進(jìn)行了分類與統(tǒng)計(jì)。 1、歷年發(fā)表文章數(shù)分類匯總圖示如下 (含所有的類別共 11707篇 ) 0500100015002000250030001994年 1995年 1996年 1997年 1998年 1999年 2000年 2001年 2002年 2003年 2004年 2、按照數(shù)據(jù)挖掘、決策支持系統(tǒng)、專家系統(tǒng)方面的文章統(tǒng)計(jì)圖示如下: (評(píng)價(jià) ) 02004006008001994年 1995年 1996年 1997年 1998年 1999年 2000年 2001年 2002年 2003年 2004年發(fā)展的基本特征 ( 1)原有理論方法的深化與拓展 如: 1)網(wǎng)絡(luò)數(shù)據(jù)挖掘;流數(shù)據(jù) ;混合數(shù)據(jù)。 2)基于神經(jīng)網(wǎng)絡(luò)的的時(shí)序數(shù)據(jù)、相似序列、快速挖掘算法的研究等 。 3)粗糙集與支持向量機(jī)模型與方法的擴(kuò)展。 4)凸分析與數(shù)據(jù)包絡(luò)分析方法的運(yùn)用。 5)增強(qiáng)(強(qiáng)化)學(xué)習(xí)模型與方法的運(yùn)用。 ( 2)復(fù)雜類型(系統(tǒng))數(shù)據(jù)挖掘成為熱點(diǎn) 如: 1) 生物信息挖掘。 Knowledge Discovery for Promoter Structure Analysis Study of Motif Correlation in Proteins by Data Mining (用數(shù)據(jù)挖掘技術(shù)進(jìn)行蛋白質(zhì)中啟動(dòng)子的結(jié)構(gòu)分析) 2)半結(jié)構(gòu)化、非結(jié)構(gòu)化等復(fù)雜類型數(shù)據(jù)挖掘。 A Method for Mining Data of Sequential Images- Rebuilding of Gray (Position) time Function on Arbitrary Direction Lines (基于圖表數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)系統(tǒng)的概念等級(jí)聚類 ) 3)分布式數(shù)據(jù)挖掘系統(tǒng)。 4)動(dòng)態(tài)、在線數(shù)據(jù)挖掘系統(tǒng)。 5)流數(shù)據(jù)、混合數(shù)據(jù)與不完備數(shù)據(jù)挖掘系統(tǒng)。 ( 3)新技術(shù)與方法的引入(其它學(xué)科領(lǐng)域的滲透) 如:人工免疫系統(tǒng)方法;協(xié)同驗(yàn)算方法 ;模擬退火算法;保角變換方法;黎曼幾何方法等。 ( 4)理論融合交叉性研究 如:基于 RoughSet的證據(jù)推理算法;模糊關(guān)系數(shù)據(jù)模型與粗集結(jié)合算法等。認(rèn)知心理學(xué)、認(rèn)知物理學(xué)、認(rèn)知生物學(xué)等。 ( 5)基礎(chǔ)理論研究 內(nèi)在機(jī)理研究;自主知識(shí)發(fā)現(xiàn)框架; DM=數(shù)據(jù)集 +似然關(guān)系 +挖掘算法等。 第二部分 數(shù)據(jù)挖掘在商務(wù)智能決策中的應(yīng)用 一、基于信息挖掘的新型智能決策支持系統(tǒng) 二、商務(wù)部國(guó)際商務(wù)中心項(xiàng)目簡(jiǎn)介 三、軟件系統(tǒng)實(shí)現(xiàn)整體說(shuō)明 一、基于信息挖掘的新型智能決策支持系統(tǒng) 自從美國(guó)麻省理工學(xué)院的 Michael S.S.Morton和 Peter G.W.Keen于 20世紀(jì) 70年代首次提出決策支持系統(tǒng)( DSS)以來(lái),其發(fā)展迅速,不斷取得顯著的成果,并成為許多行業(yè)經(jīng)營(yíng)管理中一個(gè)不可缺少的現(xiàn)代化決策支持工具?,F(xiàn)在正逐步形成新一代的 DSS:群決策支持系統(tǒng)( GDSS),分布式?jīng)Q策支持系統(tǒng)( DDSS),戰(zhàn)略決策支持系統(tǒng)等,尤其是智能決策支持系統(tǒng)( IDSS)的出現(xiàn),將人工智能的知識(shí)推理等技術(shù)引入 DSS,使 DSS的發(fā)展進(jìn)入了一個(gè)新的階段。近年來(lái),又相繼出現(xiàn)了基于數(shù)據(jù)倉(cāng)庫(kù)與基于 WEB的智能決策支持系統(tǒng),大大推進(jìn)了 IDSS的發(fā)展。 但是,傳統(tǒng)的決策支持系統(tǒng)尚存在著推理技術(shù)單調(diào),自學(xué)習(xí)能力較差,形成知識(shí)庫(kù)中的知識(shí)不足夠豐富這一新的 “ 瓶頸 ”現(xiàn)象。近年來(lái) Internet迅速發(fā)展,網(wǎng)上信息極大豐富而知識(shí)卻相對(duì)缺乏,并且這些信息和以往決策支持系統(tǒng)所處理的信息不同,是非結(jié)構(gòu)化的,這就使其處理方式也必然有所不同。所以新一代決策支持系統(tǒng)的發(fā)展方向是高度智能化,以多種知識(shí)表示、自組織協(xié)同工作、自動(dòng)知識(shí)獲取和自適應(yīng)能力較強(qiáng)等為特征。 為此,我們提出了基于信息挖掘的智能決策支持系統(tǒng) IDSSIM,這里的信息挖掘區(qū)別于通常的數(shù)據(jù)挖掘,是從結(jié)構(gòu)化數(shù)據(jù)或復(fù)雜類型數(shù)據(jù)(文本、日志、音頻、視頻、圖像等)中提取新穎、潛在有用知識(shí)的非平凡抽取過(guò)程。所形成的 IDSSIM結(jié)構(gòu)模型可廣泛應(yīng)用于各行各業(yè)在管理信息系統(tǒng)的基礎(chǔ)上所提升的輔助決策支持系統(tǒng)中。 IDSSIM的總體結(jié)構(gòu)模型如下圖所示: 在線幫助子系統(tǒng) 決策者 用戶接口 問(wèn)題解釋子系統(tǒng) 自檢子系統(tǒng) (指令與測(cè)試指標(biāo)傳輸) 模型定位子系統(tǒng) 分級(jí)診斷子系統(tǒng) 綜合知識(shí)庫(kù) (問(wèn)答集, K D D * 知識(shí),推理知識(shí)) W E B 知識(shí)庫(kù) 基于推理機(jī)制的 知識(shí)發(fā)現(xiàn)子系統(tǒng) 基于雙庫(kù)協(xié)同機(jī)制 的知識(shí)發(fā)現(xiàn)子系統(tǒng) 基于 W E B 挖掘 的知識(shí)發(fā)現(xiàn)子系統(tǒng) 知識(shí)庫(kù) 數(shù)據(jù)庫(kù) 方法庫(kù) 模型庫(kù) 文本庫(kù) 日志庫(kù) 多庫(kù)管理子系統(tǒng) 知識(shí)獲取子系統(tǒng) 專家知識(shí) 書(shū)本知識(shí) I n t e r n e t I D S S I M 總體結(jié)構(gòu)模型 其理論基礎(chǔ)是我們提出的基于雙庫(kù)協(xié)同機(jī)制的知識(shí)發(fā)現(xiàn)系統(tǒng)KDD*和 WEB數(shù)據(jù)挖掘過(guò)程,它以多個(gè)知識(shí)源的知識(shí)融合、多抽象級(jí)與不同知識(shí)層次的結(jié)構(gòu),以及使數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、方法庫(kù)、模型庫(kù)、文本庫(kù)、日志庫(kù)六庫(kù)協(xié)同運(yùn)作為特征,形成了極其豐富的動(dòng)態(tài)知識(shí)庫(kù)系統(tǒng)與相應(yīng)的集成推理機(jī)制,為解決決策系統(tǒng)構(gòu)造中的核心技術(shù)提供了一條有效的途徑,也從根本上提高了決策支持系統(tǒng)的實(shí)用化程度。 系統(tǒng)的核心是 “ 源于信息的知識(shí)發(fā)現(xiàn) KDBI”( Knowledge Discovery Based on Information),它在模塊實(shí)現(xiàn)上主要包含三個(gè)部分:基于雙庫(kù)協(xié)同機(jī)制的知識(shí)發(fā)現(xiàn)子系統(tǒng)( KDD*)、基于推理機(jī)制的知識(shí)發(fā)現(xiàn)子系統(tǒng)( KDRM)和基于WEB挖掘的知識(shí)發(fā)現(xiàn)子系統(tǒng)( KDWM)??纱致缘乇硎緸椋篕DBI KDD*+KDRM+KDWM。 首先,六庫(kù)(數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、方法庫(kù)、模型庫(kù)、文本庫(kù)、日志庫(kù))在多庫(kù)管理子系統(tǒng)的管理下協(xié)同運(yùn)作。知識(shí)獲取子系統(tǒng)可以從領(lǐng)域?qū)<夷抢铽@取知識(shí),也可以獲取書(shū)本中的知識(shí),并將這些知識(shí)存儲(chǔ)在知識(shí)庫(kù)中?;谛畔⑼诰虻男滦椭悄軟Q策支持系統(tǒng)。 其次,知識(shí)庫(kù)中的知識(shí)可以直接納入綜合知識(shí)庫(kù),也可以被基于雙庫(kù)協(xié)同機(jī)制的知識(shí)發(fā)現(xiàn)( KDD*)子系統(tǒng)利用,在以屬性為基礎(chǔ)的知識(shí)庫(kù)建庫(kù)原則下,通過(guò)搜索知識(shí)庫(kù)中知識(shí)結(jié)點(diǎn)的不關(guān)聯(lián)態(tài),產(chǎn)生 “ 創(chuàng)見(jiàn)意向 ” ,發(fā)現(xiàn)短缺知識(shí)。 再次,基于推理機(jī)制的知識(shí)發(fā)現(xiàn)子系統(tǒng)( KDRM) ,包括用一種或多種知識(shí)表示方法描述的已知問(wèn)題及其解法的描述集合的知識(shí)庫(kù)和需要求解的問(wèn)題集;通過(guò) Fuzzy推理、演繹推理、廣義綜合歸納推理和基于案例的推理等,構(gòu)造規(guī)則集和發(fā)現(xiàn)新知識(shí)。來(lái)自 WEB的信息首先被存儲(chǔ)在文本庫(kù)和日志庫(kù)中,并由基于 WEB的知識(shí)發(fā)現(xiàn)子系統(tǒng)挖掘關(guān)于訪問(wèn)信息、文本和結(jié)構(gòu)方面的知識(shí),并將挖掘結(jié)果存入 WEB知識(shí)庫(kù)。 二、 商務(wù)部國(guó)際商務(wù)中心項(xiàng)目簡(jiǎn)介 在與國(guó)家商務(wù)部國(guó)際商務(wù)中心的合作中,構(gòu)造了基于我們專利技術(shù)的“面向加工貿(mào)易基于競(jìng)爭(zhēng)情報(bào)的智能決策支持系統(tǒng)” 。針對(duì)外貿(mào)加工中國(guó)內(nèi)采購(gòu)與供應(yīng)鏈系統(tǒng)進(jìn)行深入分析,通過(guò)數(shù)據(jù)挖掘、 WEB挖掘、案例推理與 OLAP等技術(shù),挖掘出一些平時(shí)很難靠直觀或憑借經(jīng)驗(yàn)發(fā)現(xiàn)的規(guī)則,發(fā)現(xiàn)了若干新的知識(shí)。對(duì)領(lǐng)導(dǎo)戰(zhàn)略決策與企業(yè)經(jīng)營(yíng)決策管理有一定的參考價(jià)值。 利用商務(wù)部國(guó)際商務(wù)中心長(zhǎng)期積累的對(duì)外加工貿(mào)易的數(shù)據(jù),充分運(yùn)用我們的創(chuàng)新性信息處理技術(shù)和數(shù)據(jù)挖掘技術(shù),開(kāi)展研發(fā)工作。目前已通過(guò)驗(yàn)收,并將對(duì)國(guó)家的對(duì)外貿(mào)易和商務(wù)活動(dòng)產(chǎn)生較大影響。概括起來(lái)有如下幾點(diǎn): 1)為對(duì)外貿(mào)易企業(yè)“請(qǐng)進(jìn)來(lái),走出去”提供決策支持 ; 2)為領(lǐng)導(dǎo)關(guān)注的熱點(diǎn)問(wèn)題,提供決策支持; 3)為外商投資提供咨詢指導(dǎo); 4)為國(guó)家和地方招商引資提供科學(xué)的建議。 項(xiàng)目主頁(yè)應(yīng)用窗口 三、軟件系統(tǒng)實(shí)現(xiàn)整體說(shuō)明 1、 OLAP 問(wèn)題域 運(yùn)行環(huán)境與開(kāi)發(fā)工具 OLAP問(wèn)題域 1、經(jīng)營(yíng)企業(yè)信息分析 2、國(guó)產(chǎn)料件分析 3、進(jìn)口料件分析 4、加工行業(yè)分析 5、外商分析 6、進(jìn)出口幣種分析 7、工繳費(fèi)分析 8、口岸與海關(guān)分析 9、出口成品分析 OLAP運(yùn)行環(huán)境與工具 服務(wù)器端: 硬件:性能較好的服務(wù)器、網(wǎng)絡(luò)鏈接 軟件: ORACLE數(shù)據(jù)庫(kù)服務(wù)器及數(shù)據(jù)、 BRIO INTELLIGENCE SERVER、 BRIO CLIENT DESIGNER 客戶端: 硬件:普通 PC、網(wǎng)卡、 INTERNET 網(wǎng)絡(luò)鏈接 軟件: BRIO CLIENT EXPLORER、通用瀏覽器 2. KDD* 問(wèn)題域 計(jì)算模式與開(kāi)發(fā)工具 總體設(shè)計(jì)流程圖 KDD*問(wèn)題域說(shuō)明 預(yù) 想: 就采購(gòu)價(jià)值鏈方面內(nèi)容,展開(kāi)數(shù)據(jù)挖掘,重點(diǎn) 對(duì)國(guó)內(nèi)采購(gòu)現(xiàn)狀,抽取相關(guān)關(guān)聯(lián)規(guī)則,提供領(lǐng) 導(dǎo)決策信息。 方法特征: 智能系統(tǒng)內(nèi)在的使用了人工智能方法與軟 計(jì)算方法,知識(shí)發(fā)現(xiàn)方法 尋求新穎的知識(shí) 類型,因而所發(fā)現(xiàn)的知識(shí)與數(shù)據(jù)狀況密切 相關(guān)。在未作實(shí)際挖掘前難以確定其明確 主題。 將提交結(jié)果: 就目前挖掘情況看,領(lǐng)導(dǎo)決策方面與企業(yè)經(jīng) 營(yíng)決策方面的內(nèi)容都可能發(fā)現(xiàn)較有價(jià)值得知 識(shí)。因而,須在實(shí)際研發(fā)過(guò)程中,逐步篩選、 調(diào)試、聚焦。 KDD*計(jì)算模式與開(kāi)發(fā)工具 計(jì)算模式:客戶機(jī) /服務(wù)器模式 運(yùn)行環(huán)境與開(kāi)發(fā)工具 客戶端: windows平臺(tái), DELPH, ODBC 服務(wù)器端:商務(wù)部現(xiàn)有環(huán)境和 ORACLE數(shù)據(jù)庫(kù) 系統(tǒng) KDD*總體設(shè)計(jì)流程圖 數(shù)據(jù)清洗主題管理知識(shí)庫(kù)管理構(gòu)建知識(shí)庫(kù)屬性離散化用戶自定義挖掘 啟發(fā)式數(shù)據(jù)挖掘中斷評(píng)價(jià)對(duì)數(shù)據(jù)進(jìn)行離散化形成挖掘數(shù)據(jù)庫(kù),為挖掘做準(zhǔn)備形成基礎(chǔ)知識(shí)庫(kù)為下面的 啟發(fā)式數(shù)據(jù)挖掘做準(zhǔn)備知識(shí)庫(kù)管理知識(shí)的展示總體設(shè)計(jì)流程圖 數(shù)據(jù)清理:主要完成數(shù)據(jù)源的選取 、 數(shù)據(jù)清洗 、去噪聲以及填補(bǔ)空缺數(shù)據(jù)等等 , 也就是要為挖掘準(zhǔn)為數(shù)據(jù) , 確切的說(shuō)就是為數(shù)據(jù)離散做準(zhǔn)備 。 主題管理:主要是針對(duì)挖掘的目標(biāo)不同而設(shè)立不同的主題 , 這部分主要實(shí)現(xiàn)主題的定義 、 修改 、 刪除以及主題的選擇等功能 , 在主題的定義中要完成與該主題相關(guān)的數(shù)據(jù) , 也就是要在這里確定挖掘的方向 。 屬性值離散化:建立主題以后根據(jù)所選擇的數(shù)據(jù)確定語(yǔ)言變量以及所對(duì)應(yīng)的語(yǔ)言變量值 , 同時(shí)對(duì)所選定的數(shù)據(jù)根據(jù)語(yǔ)言變量和語(yǔ)言變量值進(jìn)行離散形成挖掘數(shù)據(jù)庫(kù) , 為下面的挖掘工作做準(zhǔn)備 。 知識(shí)庫(kù)管理:分為基礎(chǔ)知識(shí)庫(kù)管理和衍生知識(shí)庫(kù)管理兩個(gè)部分 , 其中基礎(chǔ)知識(shí)庫(kù)包括基礎(chǔ)知識(shí)的錄入 、 修改 、 刪除等基本的維護(hù)工作;衍生知識(shí)庫(kù)包括挖掘出的知識(shí)的輸入 , 只是的展示等工作 , 這部分涉及到挖掘及知識(shí)的展示 。 數(shù)據(jù)挖掘:根據(jù)數(shù)據(jù)產(chǎn)生規(guī)則 , 分為兩個(gè)部分用戶子定義挖掘和系統(tǒng)自動(dòng)挖掘 ( 啟發(fā)式協(xié)調(diào)器 ) 。 用戶子定義挖掘是根據(jù)用戶感興趣的內(nèi)容進(jìn)行聚焦挖掘 , 啟發(fā)式挖掘是根據(jù)基礎(chǔ)知識(shí)庫(kù) , 針對(duì)短缺知識(shí)進(jìn)行挖掘 。 知識(shí)評(píng)價(jià):對(duì)挖掘出的規(guī)則進(jìn)行評(píng)價(jià)決定是否存入到衍生知識(shí)庫(kù)中 , 首先是通過(guò)中斷協(xié)調(diào)器進(jìn)行評(píng)價(jià)然后再經(jīng)過(guò)領(lǐng)域?qū)<疫M(jìn)行評(píng)價(jià)來(lái)決定是否存入衍生知識(shí)庫(kù) 。 附:與此相應(yīng)的,我們還研發(fā)了用于智能決策的“分布式數(shù)據(jù)資源集成系統(tǒng)”,給出了統(tǒng)一數(shù)據(jù)訪問(wèn)接口、快速全文檢索、文本分類、文本數(shù)字化、個(gè)性化信息推送和信息發(fā)布等一攬子整體解決方案。 第三部分 數(shù)據(jù)挖掘在 CRM中的應(yīng)用 一、數(shù)據(jù)挖掘?qū)?CRM的影響 二、在 CRM中數(shù)據(jù)挖掘常用技術(shù) 三、解決實(shí)際商業(yè)問(wèn)題 四、建立解決方案的關(guān)鍵 一、數(shù)據(jù)挖掘?qū)?CRM的影響 21世紀(jì)的商業(yè)競(jìng)爭(zhēng)不僅取決于對(duì)市場(chǎng)的反應(yīng)速度,還取決于對(duì)本行業(yè)新知識(shí)的獲取、積累和有效利用的能力。實(shí)際上效率不再是商場(chǎng)上取勝的唯一關(guān)鍵。在這個(gè)新的啟用 web的電子商務(wù)經(jīng)濟(jì)時(shí)代,靈活性和敏感性也是在競(jìng)爭(zhēng)中取勝的重要因素。能夠提供客戶資源及相關(guān)數(shù)據(jù)分析的客戶關(guān)系管理系統(tǒng)( Customer Relationship Management, CRM)就成為焦點(diǎn)。作為專門(mén)管理企業(yè)前臺(tái)的客戶關(guān)系管理為企業(yè)提供了一個(gè)收集、分析和利用各種客戶信息的系統(tǒng),幫助企業(yè)充分利用其客戶管理資源,也為企業(yè)在電子商務(wù)時(shí)代從容自如地面對(duì)客戶提供了科學(xué)手段和方法。 客戶關(guān)系管理 (CRM)指的是企業(yè)與其客戶的交流方式,它實(shí)施于企業(yè)的市場(chǎng)營(yíng)銷、銷售、服務(wù)與技術(shù)支持等與客戶有關(guān)的領(lǐng)域。 它 是一種管理理念,又是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理機(jī)制 , 也是一種管理軟件和技術(shù),它將最佳的商業(yè)實(shí)踐與數(shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)庫(kù)、一對(duì)一營(yíng)銷、銷售自動(dòng)化以及其它信息技術(shù)緊密結(jié)合在一起,為企業(yè)的銷售、客戶服務(wù)和決策支持等領(lǐng)域提供了一個(gè)業(yè)務(wù)自動(dòng)化的解決方案,使企業(yè)有了一個(gè)基于電子商務(wù)的面對(duì)客戶的前沿,從而順利實(shí)現(xiàn)由傳統(tǒng)企業(yè)模式到以電子商務(wù)為基礎(chǔ)的現(xiàn)代企業(yè)模式的轉(zhuǎn)化。 CRM的特征 一對(duì)一營(yíng)銷 高度集成的交流渠道 統(tǒng)一共享的信息資源 商業(yè)智能化的數(shù)據(jù)分析和處理 對(duì)基于 Web的功能的支持 CRM體系結(jié)構(gòu)圖如下所示: 業(yè)務(wù)規(guī)則和元數(shù)據(jù)管理 工作流管理 聯(lián)系歷史 交易歷史 客戶和帳務(wù)數(shù)據(jù)倉(cāng)庫(kù) 外部數(shù)據(jù) ETL工具 ( 抽取轉(zhuǎn)換裝載工具 ) 行銷數(shù)據(jù)集市 活動(dòng)管理 分析數(shù)據(jù)集市 報(bào)表數(shù)據(jù)集市 活動(dòng)管理 數(shù)據(jù)挖掘分析 數(shù)據(jù)源 行銷數(shù)據(jù)存儲(chǔ) 決策支持應(yīng)用 特別查詢和報(bào)表 直接郵寄(廣告) 聯(lián)系管理 呼叫中心 銷售力量 客服中心 Internet 電子郵件 其他 信息渠道 CRM體系結(jié)構(gòu)圖 在這個(gè)體系結(jié)構(gòu)圖中,有很多用于產(chǎn)生和使用信息的客戶接觸點(diǎn)和發(fā)送渠道。經(jīng)過(guò)集成和分析信息,可以完整、正確地得出客戶的大概情況 -他們的喜好、需求、抱怨、和使他們成為公司產(chǎn)品和服務(wù)網(wǎng)的終身會(huì)員的特性。最后數(shù)據(jù)倉(cāng)庫(kù)環(huán)境下所有的部件都將被部署到適當(dāng)?shù)奈恢?,并提供多種用于集成和分析的重要功能。 從較高的層次看, CRM系統(tǒng)的體系結(jié)構(gòu)很像一 棟房子: 客戶接觸點(diǎn)是根基 數(shù)據(jù)倉(cāng)庫(kù)是地基 客戶利益性是隅石 數(shù)據(jù)挖掘是藍(lán)圖 Web應(yīng)用是頂石 這些技術(shù)結(jié)合在一起便構(gòu)成了完整的 CRM系統(tǒng)。 二、在 CRM中數(shù)據(jù)挖掘常用技術(shù) 比較典型的數(shù)據(jù)挖掘方法 關(guān)聯(lián)分析 序列模式分析 分類分析 聚類分析 決策樹(shù) 神經(jīng)元網(wǎng)絡(luò) 規(guī)則歸納 三、解決實(shí)際商業(yè)問(wèn)題 客戶盈利分析 新客戶的獲取 交叉營(yíng)銷 客戶的保持 客戶的細(xì)分 客戶盈利分析 客戶盈利能力分析是數(shù)據(jù)挖掘的基礎(chǔ),也是數(shù)據(jù)挖掘是否用于正確方向的一個(gè)指標(biāo)。 一般情況下,在顧客身上的花費(fèi)越多,他們保持更高的忠誠(chéng)度和購(gòu)買(mǎi)更多產(chǎn)品的可能性越大。保持客戶的忠誠(chéng)度將對(duì)客戶盈利能力產(chǎn)生極深的影響。 數(shù)據(jù)挖掘技術(shù)可以用來(lái)預(yù)測(cè)在不同市場(chǎng)活動(dòng)情況下的客戶盈利能力;可以預(yù)測(cè)未來(lái)的盈利能力;預(yù)測(cè)客戶盈利能力的變化。 新客戶的獲取 在大多數(shù)商業(yè)領(lǐng)域中,業(yè)務(wù)發(fā)展的主要指標(biāo)里包括新客戶的獲取能力。新客戶的獲取包括發(fā)現(xiàn)那些對(duì)你的產(chǎn)品不了解的客戶,也包括以前接受你的競(jìng)爭(zhēng)對(duì)手服務(wù)的顧客。數(shù)據(jù)挖掘技術(shù)可以幫助我們對(duì)潛在客戶群進(jìn)行分析,并增加市場(chǎng)推廣活動(dòng)產(chǎn)生的反饋率。 交叉營(yíng)銷 交叉營(yíng)銷是指你向現(xiàn)有的客戶提供新的產(chǎn)品和服務(wù)的營(yíng)銷過(guò)程。公司與其客戶之間的商業(yè)關(guān)系是一種持續(xù)的不斷發(fā)展的關(guān)系,在這種關(guān)系建立起來(lái)以后,可以有很多種方法來(lái)不斷改善這種關(guān)系。雙方的目標(biāo)是達(dá)到雙贏的結(jié)果,客戶獲益是由于他們得到了更好更貼切的服務(wù)質(zhì)量,商家則因?yàn)樵黾愉N售量獲利。 客戶的保持 隨著行業(yè)的競(jìng)爭(zhēng)越來(lái)越激烈和獲得一個(gè)新客戶的開(kāi)支愈來(lái)愈大,保持原有客戶的工作愈來(lái)愈有價(jià)值。使用數(shù)據(jù)挖掘技術(shù)可以用來(lái)預(yù)測(cè)哪些客戶具有高風(fēng)險(xiǎn)轉(zhuǎn)移的可能性。例如使用分類回歸樹(shù) (CART)來(lái)生成各種預(yù)測(cè)模型,可以對(duì)客戶流失原因有深入的了解。 客戶的細(xì)分 細(xì)分是指將一個(gè)大的消費(fèi)群體劃分成一個(gè)個(gè)細(xì)分群的動(dòng)作,同屬于一個(gè)細(xì)分群的消費(fèi)者彼此相似,而隸屬于不同細(xì)分群的消費(fèi)者被視為不同。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)設(shè)計(jì):110KV變電站一次、二次系統(tǒng)設(shè)計(jì)
- 汽車門(mén)店銷售管理辦法
- 軍用保密文件管理辦法
- 生物校本課程開(kāi)發(fā)與實(shí)施策略
- 企業(yè)安全管理體系改進(jìn)路徑研究
- 逆向思維:重塑認(rèn)知與人生的轉(zhuǎn)變之道
- 林業(yè)宿舍門(mén)禁管理辦法
- 國(guó)企資產(chǎn)臺(tái)賬管理辦法
- 民政行業(yè)扶貧管理辦法
- 自然觀察法在小學(xué)科學(xué)教育中的應(yīng)用研究
- 2025江蘇省招聘村級(jí)后備干部考試題(含答案)
- 相控陣超聲檢測(cè)技術(shù)及應(yīng)用
- 2025年北京市中考數(shù)學(xué)試卷真題(含答案解析)
- 2026年高考政治一輪復(fù)習(xí):高考政治命題備考策略
- 2024年湖南省辰溪縣檔案局公開(kāi)招聘試題帶答案
- 鋰離子電池安全性能優(yōu)化:針刺實(shí)驗(yàn)與失效機(jī)制分析
- 2025至2030年中國(guó)森林消防車行業(yè)市場(chǎng)全景評(píng)估及未來(lái)趨勢(shì)研判報(bào)告
- 2025生產(chǎn)與運(yùn)作管理試題及答案
- 入職預(yù)支薪資協(xié)議書(shū)
- 《中國(guó)特色社會(huì)主義理論體系的形成和發(fā)展》(課件)
- 職業(yè)技術(shù)學(xué)院嬰幼兒托育服務(wù)與管理專業(yè)人才培養(yǎng)方案
評(píng)論
0/150
提交評(píng)論