




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 授課人:安茂香授課人:安茂香 林宇等林宇等 數(shù)據(jù)倉庫原理與實踐數(shù)據(jù)倉庫原理與實踐 人民郵電出版社人民郵電出版社 20032003年年1 1月月 彭木根彭木根 數(shù)據(jù)倉庫技術(shù)與實現(xiàn)數(shù)據(jù)倉庫技術(shù)與實現(xiàn) 電子工業(yè)出版社電子工業(yè)出版社 20022002年年6 6月月飛思科技產(chǎn)品研發(fā)中心飛思科技產(chǎn)品研發(fā)中心 Oracle9iOracle9i數(shù)據(jù)倉庫構(gòu)建技術(shù)數(shù)據(jù)倉庫構(gòu)建技術(shù) 電子工業(yè)出版社電子工業(yè)出版社 20032003年年1 1月月 企業(yè)在生產(chǎn)經(jīng)營中會產(chǎn)生無數(shù)的信息,企業(yè)在生產(chǎn)經(jīng)營中會產(chǎn)生無數(shù)的信息,如訂單、庫存、交易帳目、通話記錄及客如訂單、庫存、交易帳目、通話記錄及客戶資料等。這些信息蘊藏了豐富的經(jīng)
2、營理戶資料等。這些信息蘊藏了豐富的經(jīng)營理念和市場規(guī)律。念和市場規(guī)律。 怎樣有效地利用這些寶貴的信息增進怎樣有效地利用這些寶貴的信息增進對業(yè)務(wù)情況的了解,幫助管理人員在業(yè)務(wù)對業(yè)務(wù)情況的了解,幫助管理人員在業(yè)務(wù)管理及發(fā)展上作出及時、正確的判斷,也管理及發(fā)展上作出及時、正確的判斷,也就是說,怎樣從業(yè)務(wù)數(shù)據(jù)中提取有用的信就是說,怎樣從業(yè)務(wù)數(shù)據(jù)中提取有用的信息,然后根據(jù)這些信息來采取明智的行動,息,然后根據(jù)這些信息來采取明智的行動,成了企業(yè)的一個迫切愿望和現(xiàn)實難點。這成了企業(yè)的一個迫切愿望和現(xiàn)實難點。這就是商業(yè)智能的課題。就是商業(yè)智能的課題。 商業(yè)智能的特點商業(yè)智能的特點具有知識性:具有知識性: 決策者
3、根據(jù)自己的經(jīng)驗和專業(yè)技能把一般信息轉(zhuǎn)決策者根據(jù)自己的經(jīng)驗和專業(yè)技能把一般信息轉(zhuǎn)化為知識,用于輔助決策?;癁橹R,用于輔助決策。基于智能:基于智能: 商業(yè)智能系統(tǒng)具有從現(xiàn)有數(shù)據(jù)和歷史數(shù)據(jù)中發(fā)現(xiàn)商業(yè)智能系統(tǒng)具有從現(xiàn)有數(shù)據(jù)和歷史數(shù)據(jù)中發(fā)現(xiàn)潛在關(guān)系的能力。潛在關(guān)系的能力?;诟偁巸?yōu)勢:基于競爭優(yōu)勢: 使用商業(yè)智能系統(tǒng)進行決策分析,可以降低成本,使用商業(yè)智能系統(tǒng)進行決策分析,可以降低成本,更有效的實現(xiàn)財務(wù)分析、風(fēng)險管理、詐騙管理等,更有效的實現(xiàn)財務(wù)分析、風(fēng)險管理、詐騙管理等,從而使企業(yè)在競爭中取得優(yōu)勢。從而使企業(yè)在競爭中取得優(yōu)勢。 各大廠商都提供了商業(yè)智能軟件,主要各大廠商都提供了商業(yè)智能軟件,主要功能
4、類似,我們以功能類似,我們以O(shè)racle公司提供的公司提供的商業(yè)商業(yè)智能軟件為例介紹智能管理的內(nèi)容。智能軟件為例介紹智能管理的內(nèi)容。 Oracle公司提供的公司提供的商業(yè)智能軟件的智商業(yè)智能軟件的智能管理能管理包括:包括: 客戶智能、營銷智能、銷售智能、服務(wù)智客戶智能、營銷智能、銷售智能、服務(wù)智能、采購智能、流程管理智能、財務(wù)智能、能、采購智能、流程管理智能、財務(wù)智能、交互中心智能交互中心智能等。等。 客戶智能:客戶智能:是基于是基于Web方式,提供全方式,提供全方位的客戶信息查詢、分析和監(jiān)控的系統(tǒng)。方位的客戶信息查詢、分析和監(jiān)控的系統(tǒng)。 利用利用客戶智能客戶智能可幫助企業(yè)制定獲取客可幫助企業(yè)
5、制定獲取客戶、保留客戶和提升客戶利潤貢獻度的客戶、保留客戶和提升客戶利潤貢獻度的客戶管理策略。戶管理策略。 客戶智能還可以對客戶智能還可以對產(chǎn)品的毛利、客戶產(chǎn)品的毛利、客戶滿意度、忠誠度、以及客戶生命周期進行滿意度、忠誠度、以及客戶生命周期進行分析,并能通過先進的績效管理對客戶利分析,并能通過先進的績效管理對客戶利潤貢獻度進行評估進而制定客戶細分策略。潤貢獻度進行評估進而制定客戶細分策略。 營銷智能:通過分析、報告、管理和營銷智能:通過分析、報告、管理和監(jiān)控營銷信息來監(jiān)控營銷信息來幫助企業(yè)的高級執(zhí)行官、幫助企業(yè)的高級執(zhí)行官、營銷專家和分析人員制定戰(zhàn)略性的營銷策營銷專家和分析人員制定戰(zhàn)略性的營銷
6、策略。略。 營銷智能提供著強大的營銷智能提供著強大的營銷活動分析、營銷活動分析、銷售渠道分析、銷售線索分析、產(chǎn)品分析、銷售渠道分析、銷售線索分析、產(chǎn)品分析、客戶分析和個性化服務(wù)功能,以幫助企業(yè)客戶分析和個性化服務(wù)功能,以幫助企業(yè)提高營銷能力。提高營銷能力。 銷售智能:銷售智能:提供全面的銷售團隊分析、提供全面的銷售團隊分析、銷售業(yè)績分析、根源分析和業(yè)績管理來幫銷售業(yè)績分析、根源分析和業(yè)績管理來幫助企業(yè)領(lǐng)導(dǎo)者制定銷售策略及對銷售業(yè)務(wù)助企業(yè)領(lǐng)導(dǎo)者制定銷售策略及對銷售業(yè)務(wù)做出快速反應(yīng)。做出快速反應(yīng)。 銷售智能銷售智能還提供很多隨時可以運行的還提供很多隨時可以運行的智能報告和分析手冊,并且具有搜索引擎
7、,智能報告和分析手冊,并且具有搜索引擎,用以引導(dǎo)用戶根據(jù)其商務(wù)方面的問題查找用以引導(dǎo)用戶根據(jù)其商務(wù)方面的問題查找適當(dāng)?shù)膱蟾婧褪謨?。適當(dāng)?shù)膱蟾婧褪謨浴?服務(wù)智能服務(wù)智能: 提供強大的服務(wù)智能分析提供強大的服務(wù)智能分析(服務(wù)請求狀態(tài)分析、服務(wù)請求解決方案服務(wù)請求狀態(tài)分析、服務(wù)請求解決方案分析、代理商分析、代理商/分析人員效率分析等)和個分析人員效率分析等)和個性化服務(wù)來分析與服務(wù)相關(guān)活動的全面信性化服務(wù)來分析與服務(wù)相關(guān)活動的全面信息,監(jiān)控服務(wù)質(zhì)量。最終幫助企業(yè)制定更息,監(jiān)控服務(wù)質(zhì)量。最終幫助企業(yè)制定更合理高效的服務(wù)策略。合理高效的服務(wù)策略。 采購智能采購智能:是是Oracle完整的互聯(lián)網(wǎng)采完整的互
8、聯(lián)網(wǎng)采購(購(Internet Procurement)解決方案套)解決方案套件的一部分,它提供一些工具,可用于確件的一部分,它提供一些工具,可用于確定哪些供應(yīng)商一直在及時提供質(zhì)優(yōu)價廉的定哪些供應(yīng)商一直在及時提供質(zhì)優(yōu)價廉的產(chǎn)品和服務(wù)。采購專業(yè)人員可以在產(chǎn)品和服務(wù)。采購專業(yè)人員可以在Oracle Purchasing中獲取這些信息并用來建立供中獲取這些信息并用來建立供應(yīng)商戰(zhàn)略聯(lián)盟,改善供應(yīng)商關(guān)系,更直接應(yīng)商戰(zhàn)略聯(lián)盟,改善供應(yīng)商關(guān)系,更直接地將重點放到改進供應(yīng)商的服務(wù)上。地將重點放到改進供應(yīng)商的服務(wù)上。 另外,一旦建立了與供應(yīng)商的關(guān)系,另外,一旦建立了與供應(yīng)商的關(guān)系,他們的電子目錄即可供公司員工用
9、來選擇他們的電子目錄即可供公司員工用來選擇和采購其產(chǎn)品和服務(wù)。和采購其產(chǎn)品和服務(wù)。 流程管理智能流程管理智能: 為流程制造商提供產(chǎn)為流程制造商提供產(chǎn)品、生產(chǎn)、存貨和成本信息,以解決流程品、生產(chǎn)、存貨和成本信息,以解決流程制造業(yè)中的特定問題,為流程制造商提供制造業(yè)中的特定問題,為流程制造商提供更好的決策信息和持續(xù)流程改善的建議。更好的決策信息和持續(xù)流程改善的建議。 財務(wù)智能財務(wù)智能: 提供提供一種易于使用的一種易于使用的Web格式的財務(wù)盈利狀況分析報表、現(xiàn)金流分格式的財務(wù)盈利狀況分析報表、現(xiàn)金流分析報表、現(xiàn)金狀況分析報表、資產(chǎn)管理分析報表、現(xiàn)金狀況分析報表、資產(chǎn)管理分析報表、項目報表分析報表等,
10、方便企業(yè)析報表、項目報表分析報表等,方便企業(yè)迅速地分發(fā)財務(wù)信息從而使財務(wù)主管能更迅速地分發(fā)財務(wù)信息從而使財務(wù)主管能更及時地作出更好的決策。及時地作出更好的決策。 交互中心智能:交互中心智能:Oracle交互中心智能交互中心智能將呼叫數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)進行合并,通過分將呼叫數(shù)據(jù)與業(yè)務(wù)數(shù)據(jù)進行合并,通過分析呼叫中心活動的概況,利用績效管理框析呼叫中心活動的概況,利用績效管理框架評估呼叫中心的效率及客戶表現(xiàn)。架評估呼叫中心的效率及客戶表現(xiàn)。 由于商業(yè)智能系統(tǒng)強大的功能在實際由于商業(yè)智能系統(tǒng)強大的功能在實際應(yīng)用中能帶來高利潤的回報,所以近年來應(yīng)用中能帶來高利潤的回報,所以近年來商業(yè)智能在證券業(yè)、銀行領(lǐng)域、
11、稅務(wù)領(lǐng)域、商業(yè)智能在證券業(yè)、銀行領(lǐng)域、稅務(wù)領(lǐng)域、控制金融風(fēng)險、保險、客戶管理等眾多領(lǐng)控制金融風(fēng)險、保險、客戶管理等眾多領(lǐng)域得到了越來越廣泛的應(yīng)用。域得到了越來越廣泛的應(yīng)用。1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 現(xiàn)代商業(yè)競爭越來越激烈,客戶群體越來越現(xiàn)代商業(yè)競爭越來越激烈,客戶群體越來越龐大,客戶對服務(wù)的要求也越來越高,因此客戶龐大,客戶對服務(wù)的要求也越來越高,因此客戶關(guān)系管理(關(guān)系管理(Customer Relation Management,CRM)僅靠手工是難以完成的。由于不同企業(yè))僅靠手工是難以完成的。由于不同企業(yè)的客戶群各不相同,客戶管理的內(nèi)容也千差萬別,的客戶群各
12、不相同,客戶管理的內(nèi)容也千差萬別,所以開發(fā)出所以開發(fā)出“放之四海而皆準放之四海而皆準”的萬能的萬能CRM產(chǎn)產(chǎn)品也是不現(xiàn)實的,而是需要針對不同行業(yè)提供不品也是不現(xiàn)實的,而是需要針對不同行業(yè)提供不同的同的CRM產(chǎn)品。目前,產(chǎn)品。目前,Sybase公司可以提供面向公司可以提供面向電信、金融、保險、醫(yī)療保健等電信、金融、保險、醫(yī)療保健等4個行業(yè)領(lǐng)域的個行業(yè)領(lǐng)域的CRM產(chǎn)品。在這產(chǎn)品。在這4個產(chǎn)品中,有個產(chǎn)品中,有80的功能是共的功能是共性的,有性的,有20的功能需要的功能需要Sybase和合作伙伴共同和合作伙伴共同針對不同客戶的不同需求進行開發(fā)。其中針對不同客戶的不同需求進行開發(fā)。其中80共共性功能包
13、括性功能包括7個模塊(即個模塊(即CRM中的中的“7P”)。)。 客戶概況分析(客戶概況分析(Profiling)包括客戶的層次、風(fēng))包括客戶的層次、風(fēng)險、愛好、習(xí)慣等;險、愛好、習(xí)慣等;客戶忠誠度分析(客戶忠誠度分析(Persistency)指客戶對某個產(chǎn))指客戶對某個產(chǎn)品或商業(yè)機構(gòu)的忠誠程度、持久性、變動情況等;品或商業(yè)機構(gòu)的忠誠程度、持久性、變動情況等;客戶利潤分析(客戶利潤分析(Profitability)指不同客戶所消費)指不同客戶所消費的產(chǎn)品的邊緣利潤、總利潤額、凈利潤等;的產(chǎn)品的邊緣利潤、總利潤額、凈利潤等;客戶性能分析(客戶性能分析(Performance)指不同客戶所消)指不
14、同客戶所消費的產(chǎn)品按種類、渠道、銷售地點等指標劃分的費的產(chǎn)品按種類、渠道、銷售地點等指標劃分的銷售額;銷售額;客戶未來分析(客戶未來分析(Prospecting)包括客戶數(shù)量、類)包括客戶數(shù)量、類別等情況的未來發(fā)展趨勢、爭取客戶的手段等;別等情況的未來發(fā)展趨勢、爭取客戶的手段等;客戶產(chǎn)品分析(客戶產(chǎn)品分析(Product)包括產(chǎn)品設(shè)計、關(guān)聯(lián))包括產(chǎn)品設(shè)計、關(guān)聯(lián)性、供應(yīng)鏈等;性、供應(yīng)鏈等; 客戶促銷分析(客戶促銷分析(Promotion)包括廣告、宣傳等)包括廣告、宣傳等促銷活動的管理。促銷活動的管理。 1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 通過收集、加工和處理涉及消費者消通
15、過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或費行為的大量信息,確定特定消費群體或個體的興趣、消費習(xí)慣、消費傾向和消費個體的興趣、消費習(xí)慣、消費傾向和消費需求,進而推斷出相應(yīng)消費群體或個體下需求,進而推斷出相應(yīng)消費群體或個體下一步的消費行為,然后以此為基礎(chǔ),對所一步的消費行為,然后以此為基礎(chǔ),對所識別出來的消費群體進行特定內(nèi)容的定向識別出來的消費群體進行特定內(nèi)容的定向營銷,這與傳統(tǒng)的不區(qū)分消費者對象特征營銷,這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而為企業(yè)帶來成本,提高了營銷效果,從而為企
16、業(yè)帶來更多的利潤。更多的利潤。1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 商業(yè)消費信息來自市場中的各種渠道。商業(yè)消費信息來自市場中的各種渠道。例如,每當(dāng)我們用信用卡消費時,商業(yè)企例如,每當(dāng)我們用信用卡消費時,商業(yè)企業(yè)就可以在信用卡結(jié)算過程收集商業(yè)消費業(yè)就可以在信用卡結(jié)算過程收集商業(yè)消費信息,記錄下我們進行消費的時間、地點、信息,記錄下我們進行消費的時間、地點、感興趣的商品或服務(wù)、愿意接收的價格水感興趣的商品或服務(wù)、愿意接收的價格水平和支付能力等數(shù)據(jù);平和支付能力等數(shù)據(jù); 當(dāng)我們在申辦信用卡、辦理汽車駕駛當(dāng)我們在申辦信用卡、辦理汽車駕駛執(zhí)照、填寫商品保修單等其他需要填寫表執(zhí)照、填寫
17、商品保修單等其他需要填寫表格的場合時,我們的個人信息就存入了相格的場合時,我們的個人信息就存入了相應(yīng)的業(yè)務(wù)數(shù)據(jù)庫;企業(yè)除了自行收集相關(guān)應(yīng)的業(yè)務(wù)數(shù)據(jù)庫;企業(yè)除了自行收集相關(guān)業(yè)務(wù)信息之外,甚至可以從其他公司或機業(yè)務(wù)信息之外,甚至可以從其他公司或機構(gòu)購買此類信息為自己所用。構(gòu)購買此類信息為自己所用。 1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級計算機、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算超級計算機、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進行處理,從中得到法和其他信息處理技術(shù)手段進行處理,從中得到商
18、家用于向特定消費群體或個體進行定向營銷的商家用于向特定消費群體或個體進行定向營銷的決策信息。這種數(shù)據(jù)信息是如何應(yīng)用的呢?決策信息。這種數(shù)據(jù)信息是如何應(yīng)用的呢? 舉一個簡單的例子,當(dāng)銀行通過對業(yè)務(wù)數(shù)據(jù)舉一個簡單的例子,當(dāng)銀行通過對業(yè)務(wù)數(shù)據(jù)進行挖掘后,發(fā)現(xiàn)一個銀行帳戶持有者突然要求進行挖掘后,發(fā)現(xiàn)一個銀行帳戶持有者突然要求申請雙人聯(lián)合帳戶時,并且確認該消費者是第一申請雙人聯(lián)合帳戶時,并且確認該消費者是第一次申請聯(lián)合帳戶,銀行會推斷該用戶可能要結(jié)婚次申請聯(lián)合帳戶,銀行會推斷該用戶可能要結(jié)婚了,它就會向該用戶定向推銷用于購買房屋、支了,它就會向該用戶定向推銷用于購買房屋、支付子女學(xué)費等長期投資業(yè)務(wù),銀
19、行甚至可能將該付子女學(xué)費等長期投資業(yè)務(wù),銀行甚至可能將該信息賣給專營婚慶商品和服務(wù)的公司。信息賣給專營婚慶商品和服務(wù)的公司。1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 在市場經(jīng)濟比較發(fā)達的國家和地區(qū),許多公在市場經(jīng)濟比較發(fā)達的國家和地區(qū),許多公司都開始在原有信息系統(tǒng)的基礎(chǔ)上通過數(shù)據(jù)挖掘司都開始在原有信息系統(tǒng)的基礎(chǔ)上通過數(shù)據(jù)挖掘?qū)I(yè)務(wù)信息進行深加工,以構(gòu)筑自己的競爭優(yōu)勢對業(yè)務(wù)信息進行深加工,以構(gòu)筑自己的競爭優(yōu)勢,擴大自己的營業(yè)額。,擴大自己的營業(yè)額。 美國運通公司美國運通公司(American Express)有一個用有一個用于記錄信用卡業(yè)務(wù)的數(shù)據(jù)庫,數(shù)據(jù)量達到于記錄信用卡業(yè)務(wù)的數(shù)
20、據(jù)庫,數(shù)據(jù)量達到54億字億字符,并仍在隨著業(yè)務(wù)進展不斷更新。運通公司通符,并仍在隨著業(yè)務(wù)進展不斷更新。運通公司通過對這些數(shù)據(jù)進行挖掘,制定了過對這些數(shù)據(jù)進行挖掘,制定了“關(guān)聯(lián)結(jié)算關(guān)聯(lián)結(jié)算(Relation ship Billing)優(yōu)惠優(yōu)惠”的促銷策略,即如的促銷策略,即如果一個顧客在一個商店用運通卡購買一套時裝,果一個顧客在一個商店用運通卡購買一套時裝,那么在同一個商店再買一雙鞋,就可以得到比較那么在同一個商店再買一雙鞋,就可以得到比較大的折扣,這樣既可以增加商店的銷售量,也可大的折扣,這樣既可以增加商店的銷售量,也可以增加運通卡在該商店的使用率。以增加運通卡在該商店的使用率。1.在客戶服務(wù)
21、及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 基于數(shù)據(jù)挖掘的營銷,常常可以向消基于數(shù)據(jù)挖掘的營銷,常??梢韵蛳M者發(fā)出與其以前的消費行為相關(guān)的推銷費者發(fā)出與其以前的消費行為相關(guān)的推銷材料。材料。 卡夫卡夫(Kraft)食品公司建立了一個擁有食品公司建立了一個擁有3000萬客戶資料的數(shù)據(jù)庫,數(shù)據(jù)庫是通過萬客戶資料的數(shù)據(jù)庫,數(shù)據(jù)庫是通過收集對公司發(fā)出的優(yōu)惠券等其他促銷手段收集對公司發(fā)出的優(yōu)惠券等其他促銷手段作出積極反應(yīng)的客戶和銷售記錄而建立起作出積極反應(yīng)的客戶和銷售記錄而建立起來的,卡夫公司通過數(shù)據(jù)挖掘了解特定客來的,卡夫公司通過數(shù)據(jù)挖掘了解特定客戶的興趣和口味,并以此為基礎(chǔ)向他們發(fā)戶的興趣和口味,
22、并以此為基礎(chǔ)向他們發(fā)送特定產(chǎn)品的優(yōu)惠券,并為他們推薦符合送特定產(chǎn)品的優(yōu)惠券,并為他們推薦符合客戶口味和健康狀況的卡夫產(chǎn)品食譜??蛻艨谖逗徒】禒顩r的卡夫產(chǎn)品食譜。1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 美國的讀者文摘美國的讀者文摘(Readers Digest)出版出版公司運行著一個積累了公司運行著一個積累了40年的業(yè)務(wù)數(shù)據(jù)庫,年的業(yè)務(wù)數(shù)據(jù)庫,其中容納有遍布全球的一億多個訂戶的資其中容納有遍布全球的一億多個訂戶的資料,數(shù)據(jù)庫每天料,數(shù)據(jù)庫每天24小時連續(xù)運行,保證數(shù)小時連續(xù)運行,保證數(shù)據(jù)不斷得到實時的更新。據(jù)不斷得到實時的更新。 正是基于對客戶資料數(shù)據(jù)庫進行數(shù)據(jù)正是基于對客戶資
23、料數(shù)據(jù)庫進行數(shù)據(jù)挖掘的優(yōu)勢,使讀者文摘出版公司能夠從挖掘的優(yōu)勢,使讀者文摘出版公司能夠從通俗雜志擴展到專業(yè)雜志、書刊和聲像制通俗雜志擴展到專業(yè)雜志、書刊和聲像制品的出版和發(fā)行業(yè)務(wù),極大地擴展了自己品的出版和發(fā)行業(yè)務(wù),極大地擴展了自己的業(yè)務(wù)。的業(yè)務(wù)。 1.在客戶服務(wù)及營銷方面的應(yīng)用在客戶服務(wù)及營銷方面的應(yīng)用 基于數(shù)據(jù)挖掘的營銷對我國當(dāng)前的市基于數(shù)據(jù)挖掘的營銷對我國當(dāng)前的市場競爭中也很具有啟發(fā)意義,我們經(jīng)常可場競爭中也很具有啟發(fā)意義,我們經(jīng)??梢钥吹椒比A商業(yè)街上一些廠商對來往行人以看到繁華商業(yè)街上一些廠商對來往行人不分對象地散發(fā)大量商品宣傳廣告,其結(jié)不分對象地散發(fā)大量商品宣傳廣告,其結(jié)果是不需要的
24、人隨手丟棄資料,而需要的果是不需要的人隨手丟棄資料,而需要的人并不一定能夠得到。人并不一定能夠得到。 如果搞家電維修服務(wù)的公司向在商店如果搞家電維修服務(wù)的公司向在商店中剛剛購買家電的消費者郵寄維修服務(wù)廣中剛剛購買家電的消費者郵寄維修服務(wù)廣告,賣特效藥品的廠商向醫(yī)院特定門診就告,賣特效藥品的廠商向醫(yī)院特定門診就醫(yī)的病人郵寄廣告,肯定會比漫無目的的醫(yī)的病人郵寄廣告,肯定會比漫無目的的營銷效果要好得多。營銷效果要好得多。 2.競技運動中的數(shù)據(jù)挖掘競技運動中的數(shù)據(jù)挖掘 Advanced Scout是一個數(shù)據(jù)分析工具,是一個數(shù)據(jù)分析工具,教練可以用便攜式電腦在家里或在路上挖教練可以用便攜式電腦在家里或在
25、路上挖掘存儲在掘存儲在NBA中心的服務(wù)器上的數(shù)據(jù)。每中心的服務(wù)器上的數(shù)據(jù)。每一場比賽的事件都被統(tǒng)計分類,按得分、一場比賽的事件都被統(tǒng)計分類,按得分、助攻、失誤等等。時間標記讓教練非常容助攻、失誤等等。時間標記讓教練非常容易地通過搜索易地通過搜索NBA比賽的錄像來理解統(tǒng)計比賽的錄像來理解統(tǒng)計發(fā)現(xiàn)的含義。發(fā)現(xiàn)的含義。 2.競技運動中的數(shù)據(jù)挖掘競技運動中的數(shù)據(jù)挖掘 Advanced Scout的開發(fā)人,因德帕爾的開發(fā)人,因德帕爾.布罕德瑞,開發(fā)該應(yīng)用時他正在布罕德瑞,開發(fā)該應(yīng)用時他正在IBM的的ThomasJ.Watson研究中心當(dāng)研究員,他演研究中心當(dāng)研究員,他演示了一個技術(shù)新手應(yīng)該如何使用數(shù)據(jù)挖
26、掘。示了一個技術(shù)新手應(yīng)該如何使用數(shù)據(jù)挖掘。布罕德瑞說:布罕德瑞說:“教練們可以完全沒有統(tǒng)計教練們可以完全沒有統(tǒng)計學(xué)的培訓(xùn),但他們可以利用數(shù)據(jù)挖掘制定學(xué)的培訓(xùn),但他們可以利用數(shù)據(jù)挖掘制定策略策略”。 2.競技運動中的數(shù)據(jù)挖掘競技運動中的數(shù)據(jù)挖掘 另一個體育聯(lián)盟,曲棍球聯(lián)盟,與另一個體育聯(lián)盟,曲棍球聯(lián)盟,與IBM建立了一個技術(shù)型的合資公司,推出建立了一個技術(shù)型的合資公司,推出了自己的數(shù)據(jù)挖掘應(yīng)用了自己的數(shù)據(jù)挖掘應(yīng)用NHLICE,一個,一個電子實時比賽計分和統(tǒng)計系統(tǒng)。電子實時比賽計分和統(tǒng)計系統(tǒng)。 在原理上是一個與在原理上是一個與Advanced Scout相相似的數(shù)據(jù)挖掘應(yīng)用,可以讓教練、廣播員、似
27、的數(shù)據(jù)挖掘應(yīng)用,可以讓教練、廣播員、新聞記者及球迷挖掘新聞記者及球迷挖掘NHL的統(tǒng)計。的統(tǒng)計。當(dāng)然,所有系統(tǒng)都有其局限性。所以當(dāng)然,所有系統(tǒng)都有其局限性。所以不要期望這樣的數(shù)據(jù)挖掘可以幫助一支球不要期望這樣的數(shù)據(jù)挖掘可以幫助一支球隊找到贏得世界杯的策略。隊找到贏得世界杯的策略。3. 在銀行領(lǐng)域的應(yīng)用在銀行領(lǐng)域的應(yīng)用 由于體制、市場、企業(yè)、個體等經(jīng)濟由于體制、市場、企業(yè)、個體等經(jīng)濟要素變化、發(fā)展的不平衡性,帶來了銀行要素變化、發(fā)展的不平衡性,帶來了銀行對各種金融變量控制的隨機性和模糊性。對各種金融變量控制的隨機性和模糊性。如何防范銀行的經(jīng)營風(fēng)險、實現(xiàn)科學(xué)管理如何防范銀行的經(jīng)營風(fēng)險、實現(xiàn)科學(xué)管理以
28、及進行決策是金融研究的一個重要課題。以及進行決策是金融研究的一個重要課題。 如中國銀行省、市兩級金融管理信息如中國銀行省、市兩級金融管理信息系統(tǒng),是中國銀行廣東省分行承擔(dān)開發(fā)的系統(tǒng),是中國銀行廣東省分行承擔(dān)開發(fā)的國家國家“八五八五”科技攻關(guān)項目??萍脊リP(guān)項目。 該系統(tǒng)在工程組織和總體方案設(shè)計上該系統(tǒng)在工程組織和總體方案設(shè)計上采用數(shù)據(jù)倉庫(采用數(shù)據(jù)倉庫(Data Warehouse)及聯(lián)機)及聯(lián)機分析處理(分析處理(OLAP)理論。系統(tǒng)重點圍繞)理論。系統(tǒng)重點圍繞中國銀行資產(chǎn)負債管理的要求,建立覆蓋中國銀行資產(chǎn)負債管理的要求,建立覆蓋全省全省所有所有分行的數(shù)據(jù)采集網(wǎng)絡(luò),初步實現(xiàn)分行的數(shù)據(jù)采集網(wǎng)絡(luò)
29、,初步實現(xiàn)了計算機業(yè)務(wù)系統(tǒng)數(shù)據(jù)和手工報表數(shù)據(jù)采了計算機業(yè)務(wù)系統(tǒng)數(shù)據(jù)和手工報表數(shù)據(jù)采集、存儲的自動化。同時面向各級經(jīng)營管集、存儲的自動化。同時面向各級經(jīng)營管理人員,開發(fā)出財務(wù)分析、業(yè)務(wù)管理、動理人員,開發(fā)出財務(wù)分析、業(yè)務(wù)管理、動態(tài)報表和金融資訊計態(tài)報表和金融資訊計50余項管理分析應(yīng)用。余項管理分析應(yīng)用。成為中國銀行省、市分行實行科學(xué)管理的成為中國銀行省、市分行實行科學(xué)管理的有力工具。有力工具。 商業(yè)智能在商業(yè)銀行信用風(fēng)險管理中的應(yīng)用商業(yè)智能在商業(yè)銀行信用風(fēng)險管理中的應(yīng)用 4. 在保險業(yè)的應(yīng)用在保險業(yè)的應(yīng)用 隨著商業(yè)保險公司業(yè)務(wù)系統(tǒng)日趨完善,隨著商業(yè)保險公司業(yè)務(wù)系統(tǒng)日趨完善,數(shù)據(jù)交換和處理中心的建
30、立,如何滿足保數(shù)據(jù)交換和處理中心的建立,如何滿足保險行業(yè)日益增長的各種查詢、統(tǒng)計、報表險行業(yè)日益增長的各種查詢、統(tǒng)計、報表以及分析的需求,如何提高防范和化解經(jīng)以及分析的需求,如何提高防范和化解經(jīng)營風(fēng)險的能力,如何有效利用這些數(shù)據(jù)來營風(fēng)險的能力,如何有效利用這些數(shù)據(jù)來實現(xiàn)經(jīng)營目標,預(yù)測保險業(yè)的發(fā)展趨勢,實現(xiàn)經(jīng)營目標,預(yù)測保險業(yè)的發(fā)展趨勢,甚至如何利用這些數(shù)據(jù)來設(shè)計保險業(yè)的發(fā)甚至如何利用這些數(shù)據(jù)來設(shè)計保險業(yè)的發(fā)展宏圖,在激烈的競爭中贏得先機是保險展宏圖,在激烈的競爭中贏得先機是保險決策支持系統(tǒng)需要解決的問題,也是目前決策支持系統(tǒng)需要解決的問題,也是目前保險企業(yè)在信息技術(shù)應(yīng)用上的首要難題。保險企業(yè)在
31、信息技術(shù)應(yīng)用上的首要難題。 如菲奈特公司與深圳華安保險公司的如菲奈特公司與深圳華安保險公司的合作項目。合作項目。 2000年年6月菲奈特公司與深圳華安保險公司月菲奈特公司與深圳華安保險公司合作聯(lián)合開發(fā)財產(chǎn)險主業(yè)務(wù)系統(tǒng)(合作聯(lián)合開發(fā)財產(chǎn)險主業(yè)務(wù)系統(tǒng)(SPS)和保險)和保險決策支持系統(tǒng)(決策支持系統(tǒng)(IDSS)。這是金融業(yè)決策支持系)。這是金融業(yè)決策支持系統(tǒng)在華南地區(qū)的首例商業(yè)應(yīng)用,也是數(shù)據(jù)倉庫在統(tǒng)在華南地區(qū)的首例商業(yè)應(yīng)用,也是數(shù)據(jù)倉庫在保險業(yè)的成功應(yīng)用。保險業(yè)的成功應(yīng)用。 該系統(tǒng)是以數(shù)據(jù)倉庫(該系統(tǒng)是以數(shù)據(jù)倉庫(Data Warehouse)技)技術(shù)為基礎(chǔ),聯(lián)機分析處理(術(shù)為基礎(chǔ),聯(lián)機分析處理(
32、OLAP)和數(shù)據(jù)挖掘)和數(shù)據(jù)挖掘(Data Mining)工具為手段的一整套可操作、)工具為手段的一整套可操作、可實施的整體解決方案,適用于可實施的整體解決方案,適用于UNIX和和Windows NT平臺,可連接多個業(yè)務(wù)系統(tǒng)的異構(gòu)平臺,可連接多個業(yè)務(wù)系統(tǒng)的異構(gòu)數(shù)據(jù)源(如數(shù)據(jù)源(如Informix、Oracle、DB2、Sybase、SQL Server),并同時提供),并同時提供Client/Server與與Web兩個操作版本。兩個操作版本。 該系統(tǒng)充分利用了數(shù)據(jù)倉庫的先進技該系統(tǒng)充分利用了數(shù)據(jù)倉庫的先進技術(shù)以及聯(lián)機分析處理機制對數(shù)據(jù)的多維動術(shù)以及聯(lián)機分析處理機制對數(shù)據(jù)的多維動態(tài)查詢、分析和鉆
33、取功能,建成了保險決態(tài)查詢、分析和鉆取功能,建成了保險決策支持系統(tǒng)。策支持系統(tǒng)。 該系統(tǒng)具有進一步挖掘保險公司現(xiàn)有該系統(tǒng)具有進一步挖掘保險公司現(xiàn)有的各種數(shù)據(jù)的潛力,提供了關(guān)鍵業(yè)務(wù)指標的各種數(shù)據(jù)的潛力,提供了關(guān)鍵業(yè)務(wù)指標分析、業(yè)績分析、財務(wù)分析、市場分析、分析、業(yè)績分析、財務(wù)分析、市場分析、重要險種分析、重大事件分析、即席分析、重要險種分析、重大事件分析、即席分析、風(fēng)險評估、業(yè)務(wù)預(yù)測、風(fēng)險告警和風(fēng)險預(yù)風(fēng)險評估、業(yè)務(wù)預(yù)測、風(fēng)險告警和風(fēng)險預(yù)測等功能,為保險公司領(lǐng)導(dǎo)層及時掌握經(jīng)測等功能,為保險公司領(lǐng)導(dǎo)層及時掌握經(jīng)營管理的真實動態(tài),作出科學(xué)決策提供了營管理的真實動態(tài),作出科學(xué)決策提供了多方位、多層次、多
34、視覺的信息服務(wù)和重多方位、多層次、多視覺的信息服務(wù)和重要的數(shù)據(jù)依據(jù)。要的數(shù)據(jù)依據(jù)。5. 在證券業(yè)的應(yīng)用在證券業(yè)的應(yīng)用 客戶分析、帳戶分析、證券交易數(shù)據(jù)分析、客戶分析、帳戶分析、證券交易數(shù)據(jù)分析、非資金交易等多個業(yè)界關(guān)心的主題,也是證券業(yè)非資金交易等多個業(yè)界關(guān)心的主題,也是證券業(yè)擴大經(jīng)營、防范風(fēng)險的預(yù)警行動。擴大經(jīng)營、防范風(fēng)險的預(yù)警行動。 證券公司利用客戶行為分析系統(tǒng)及時將所有證券公司利用客戶行為分析系統(tǒng)及時將所有客戶的操作記錄進行歸類和整理,并結(jié)合行情走客戶的操作記錄進行歸類和整理,并結(jié)合行情走勢、上市公司資料、宏觀和微觀經(jīng)濟數(shù)據(jù)等,在勢、上市公司資料、宏觀和微觀經(jīng)濟數(shù)據(jù)等,在掌握大量數(shù)據(jù)的情
35、況下,對客戶的行為和市場各掌握大量數(shù)據(jù)的情況下,對客戶的行為和市場各因素的關(guān)聯(lián)、客戶的操作習(xí)慣、客戶的持倉情況、因素的關(guān)聯(lián)、客戶的操作習(xí)慣、客戶的持倉情況、客戶的盈虧情況、公司的利潤分布等進行統(tǒng)計和客戶的盈虧情況、公司的利潤分布等進行統(tǒng)計和分析。從而獲得以往一直想獲得但卻無法獲取的分析。從而獲得以往一直想獲得但卻無法獲取的關(guān)于客戶在本公司的行為、盈虧、習(xí)慣等關(guān)鍵信關(guān)于客戶在本公司的行為、盈虧、習(xí)慣等關(guān)鍵信息。證券商在獲得這些信息后,就有能力為客戶息。證券商在獲得這些信息后,就有能力為客戶提供針對其個人習(xí)慣、投資組合的投資建議,從提供針對其個人習(xí)慣、投資組合的投資建議,從而真正做到對客戶的貼心服
36、務(wù)。而真正做到對客戶的貼心服務(wù)。 如如 深圳國信證券的數(shù)據(jù)倉庫項目。深圳國信證券的數(shù)據(jù)倉庫項目。 1994年年4月,深圳國信證券的數(shù)據(jù)倉庫月,深圳國信證券的數(shù)據(jù)倉庫系統(tǒng)一期工程完成,該項目首期投資近系統(tǒng)一期工程完成,該項目首期投資近200萬元。數(shù)據(jù)倉庫系統(tǒng)建設(shè)的目的是為當(dāng)前萬元。數(shù)據(jù)倉庫系統(tǒng)建設(shè)的目的是為當(dāng)前公司的決策者提供快速有效的各種報表和公司的決策者提供快速有效的各種報表和分析方式,提高公司的市場反應(yīng)速度和競分析方式,提高公司的市場反應(yīng)速度和競爭力水平。爭力水平。 同時,考慮到公司業(yè)務(wù)系統(tǒng)的不斷完同時,考慮到公司業(yè)務(wù)系統(tǒng)的不斷完善和決策支持的更高要求,對不斷增長的善和決策支持的更高要求,
37、對不斷增長的企業(yè)數(shù)據(jù)具有無限的可擴展性并提供可控企業(yè)數(shù)據(jù)具有無限的可擴展性并提供可控的快速查詢響應(yīng)時間。的快速查詢響應(yīng)時間。 該系統(tǒng)包括了客戶分析、賬戶分析、該系統(tǒng)包括了客戶分析、賬戶分析、證券匯總分析、資金交易分析、非資金交證券匯總分析、資金交易分析、非資金交易分析等多個業(yè)界關(guān)心的主題。易分析等多個業(yè)界關(guān)心的主題。 該公司的用戶可以通過固定靈活報表、該公司的用戶可以通過固定靈活報表、多維分析等多種形式實現(xiàn)多個層面的數(shù)據(jù)多維分析等多種形式實現(xiàn)多個層面的數(shù)據(jù)訪問。訪問。 數(shù)據(jù)訪問的手段包括訪問授權(quán)的內(nèi)部數(shù)據(jù)訪問的手段包括訪問授權(quán)的內(nèi)部Web站點、通過自動站點、通過自動E-mail郵件轉(zhuǎn)發(fā)數(shù)據(jù)、郵
38、件轉(zhuǎn)發(fā)數(shù)據(jù)、直接直接Client/Server連接等多種方式。連接等多種方式。 該系統(tǒng)的完成是國內(nèi)開放平臺數(shù)據(jù)倉該系統(tǒng)的完成是國內(nèi)開放平臺數(shù)據(jù)倉庫系統(tǒng)建設(shè)的一個成功案例。庫系統(tǒng)建設(shè)的一個成功案例。1.2.1 商業(yè)智能系統(tǒng)的數(shù)據(jù)處理循環(huán)商業(yè)智能系統(tǒng)的數(shù)據(jù)處理循環(huán)l在以數(shù)據(jù)庫為中心的業(yè)務(wù)處理系統(tǒng)和以數(shù)據(jù)在以數(shù)據(jù)庫為中心的業(yè)務(wù)處理系統(tǒng)和以數(shù)據(jù)倉庫為基礎(chǔ)的分析系統(tǒng)的基礎(chǔ)上,倉庫為基礎(chǔ)的分析系統(tǒng)的基礎(chǔ)上,IBM公司公司首先提出了商業(yè)智能(首先提出了商業(yè)智能(Business Intelligence,簡稱簡稱BI)系統(tǒng)的概念。)系統(tǒng)的概念。l商業(yè)智能系統(tǒng)由業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)、決策支持商業(yè)智能系統(tǒng)由業(yè)務(wù)數(shù)據(jù)庫
39、系統(tǒng)、決策支持系統(tǒng)等部分構(gòu)成,如圖系統(tǒng)等部分構(gòu)成,如圖1-1所示。決策支持所示。決策支持系統(tǒng)即系統(tǒng)即DSS(Decision Support System)由)由3個層次的內(nèi)容組成:數(shù)據(jù)倉庫、聯(lián)機分析處個層次的內(nèi)容組成:數(shù)據(jù)倉庫、聯(lián)機分析處理(理(On-line Analytical Processing,OLAP)和數(shù)據(jù)挖掘(和數(shù)據(jù)挖掘(Data Mining,DM)。)。 數(shù)據(jù)倉庫決策支持業(yè)務(wù)數(shù)據(jù)庫數(shù)據(jù)存儲企業(yè)決策層OLAP數(shù)據(jù)挖掘提取、清洗、轉(zhuǎn)換圖1-1 商業(yè)智能系統(tǒng)的數(shù)據(jù)處理循環(huán)l 各個業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)通過提取、清洗、和各個業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)通過提取、清洗、和轉(zhuǎn)換整理后按照不同的主題存放
40、在數(shù)據(jù)倉庫中,轉(zhuǎn)換整理后按照不同的主題存放在數(shù)據(jù)倉庫中,原先存放在多個業(yè)務(wù)系統(tǒng)中的反應(yīng)業(yè)務(wù)局部情況原先存放在多個業(yè)務(wù)系統(tǒng)中的反應(yīng)業(yè)務(wù)局部情況的數(shù)據(jù)經(jīng)過整理后轉(zhuǎn)換成了反映企業(yè)整體情況的的數(shù)據(jù)經(jīng)過整理后轉(zhuǎn)換成了反映企業(yè)整體情況的信息,這樣就完成了從信息,這樣就完成了從“數(shù)據(jù)數(shù)據(jù)信息信息”的轉(zhuǎn)變。的轉(zhuǎn)變。l 存放在數(shù)據(jù)倉庫中的信息通過存放在數(shù)據(jù)倉庫中的信息通過OLAP和和DM處理后,形成帶有規(guī)律性的能夠?qū)ζ髽I(yè)運營提供處理后,形成帶有規(guī)律性的能夠?qū)ζ髽I(yè)運營提供指導(dǎo)意義的知識,從而完成從指導(dǎo)意義的知識,從而完成從“信息信息知識知識”的的轉(zhuǎn)變。企業(yè)的決策層可以利用轉(zhuǎn)變。企業(yè)的決策層可以利用OLAP和和DM
41、處理處理得到的知識制定相應(yīng)的策略,并反饋到業(yè)務(wù)系統(tǒng)得到的知識制定相應(yīng)的策略,并反饋到業(yè)務(wù)系統(tǒng)中,最終改善企業(yè)的運營。比如,超市通過分析中,最終改善企業(yè)的運營。比如,超市通過分析近期暢銷的商品制定近期的采購計劃,確保超市近期暢銷的商品制定近期的采購計劃,確保超市采購的商品能夠適銷對路。采購的商品能夠適銷對路。 作為商業(yè)智能系統(tǒng)中的核心部分,決作為商業(yè)智能系統(tǒng)中的核心部分,決策支持系統(tǒng)必須具備企業(yè)級的多維信息查策支持系統(tǒng)必須具備企業(yè)級的多維信息查詢、詢、OLAP在線分析處理、數(shù)據(jù)挖掘、預(yù)在線分析處理、數(shù)據(jù)挖掘、預(yù)測等功能,如圖測等功能,如圖1-2所示。所示。 查詢OLAP分析數(shù)據(jù)挖掘預(yù)測輔助決策數(shù)
42、據(jù)倉庫圖1-2 商業(yè)智能系統(tǒng)的總體功能1. 企業(yè)級的多維信息查詢企業(yè)級的多維信息查詢 “ “企業(yè)級企業(yè)級”是指通過對業(yè)務(wù)數(shù)據(jù)庫的是指通過對業(yè)務(wù)數(shù)據(jù)庫的提取、清洗和整理后,數(shù)據(jù)倉庫中的信息提取、清洗和整理后,數(shù)據(jù)倉庫中的信息應(yīng)當(dāng)是企業(yè)的整體信息,而不再是某個業(yè)應(yīng)當(dāng)是企業(yè)的整體信息,而不再是某個業(yè)務(wù)系統(tǒng)中零散的局部信息。務(wù)系統(tǒng)中零散的局部信息。 “ “多維多維”是指查詢可以從多種維度進是指查詢可以從多種維度進行。比如,查找行。比如,查找“19992000年年”之間之間“華華東區(qū)東區(qū)”的的“機械類機械類”產(chǎn)品,這里實際上包產(chǎn)品,這里實際上包含了時間維度(含了時間維度(“19992000年年”)、地理
43、)、地理緯度(緯度(“華東區(qū)華東區(qū)”)和產(chǎn)品類型維度)和產(chǎn)品類型維度(“機械類機械類”),可以通過這些維度的限),可以通過這些維度的限定去查找目標。定去查找目標。 2. OLAP在線分析處理在線分析處理 在線分析處理是指使用直觀的方式(表在線分析處理是指使用直觀的方式(表格、圖形等)從多種維度去觀察系統(tǒng)的情格、圖形等)從多種維度去觀察系統(tǒng)的情況。況。 比如,顯示某公司在比如,顯示某公司在“19952000年年”間中國各省的銷量值,這里實際上包含了間中國各省的銷量值,這里實際上包含了時間維度(時間維度(“19952000年年”)和地理緯度)和地理緯度(中國各?。ㄟ^這些維度的限定去顯(中國各省
44、),通過這些維度的限定去顯示系統(tǒng)的一個度量值示系統(tǒng)的一個度量值產(chǎn)值。如圖產(chǎn)值。如圖1-3所所示,該圖使用二維矩陣可以形象地呈現(xiàn)數(shù)示,該圖使用二維矩陣可以形象地呈現(xiàn)數(shù)據(jù)。據(jù)。 關(guān)于緯度和度量值的概念將在后續(xù)的關(guān)于緯度和度量值的概念將在后續(xù)的章節(jié)詳細講解。章節(jié)詳細講解。 3. 數(shù)據(jù)挖據(jù)數(shù)據(jù)挖據(jù) 數(shù)據(jù)挖掘,就是去發(fā)現(xiàn)系統(tǒng)中諸多因素間有數(shù)據(jù)挖掘,就是去發(fā)現(xiàn)系統(tǒng)中諸多因素間有指導(dǎo)意義的關(guān)系。指導(dǎo)意義的關(guān)系。 在數(shù)據(jù)挖掘領(lǐng)域一個著名的案例是英國的在數(shù)據(jù)挖掘領(lǐng)域一個著名的案例是英國的“啤酒和尿布啤酒和尿布”的故事。的故事。 英國一家超市使用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)奇怪英國一家超市使用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)奇怪的現(xiàn)象:在周
45、末,許多購買了啤酒的男性公民常的現(xiàn)象:在周末,許多購買了啤酒的男性公民常常也購買小孩的尿布。常也購買小孩的尿布。 后來的研究表明:原來年輕男子在周末必看后來的研究表明:原來年輕男子在周末必看英國的超級聯(lián)賽,他們都喜歡一邊喝啤酒,一邊英國的超級聯(lián)賽,他們都喜歡一邊喝啤酒,一邊看比賽。同時,照顧小孩主要是婦女的工作,男看比賽。同時,照顧小孩主要是婦女的工作,男性公民在購買啤酒的時候,常常會買一些小孩使性公民在購買啤酒的時候,常常會買一些小孩使用的尿布,為太太和孩子進一點義務(wù)。用的尿布,為太太和孩子進一點義務(wù)。 對于這個重要發(fā)現(xiàn),這家超市決定將啤酒和對于這個重要發(fā)現(xiàn),這家超市決定將啤酒和尿布放在比較
46、近的貨架上,這樣既方便了顧客,尿布放在比較近的貨架上,這樣既方便了顧客,又促進了產(chǎn)品的銷售。又促進了產(chǎn)品的銷售。 4.預(yù)測預(yù)測 預(yù)測就是通過歷史積累的信息以及發(fā)預(yù)測就是通過歷史積累的信息以及發(fā)現(xiàn)的規(guī)律來預(yù)測事物發(fā)展的趨勢。現(xiàn)的規(guī)律來預(yù)測事物發(fā)展的趨勢。 比如,通過比如,通過19992000年中國移動用戶年中國移動用戶的數(shù)量信息來預(yù)測的數(shù)量信息來預(yù)測2001年移動用戶的增長年移動用戶的增長情況,從而為移動的設(shè)備制造商和運營商情況,從而為移動的設(shè)備制造商和運營商提供有利的決策依據(jù)。提供有利的決策依據(jù)。 1.3.1 蜘蛛網(wǎng)問題蜘蛛網(wǎng)問題 隨著數(shù)據(jù)庫技術(shù)的廣泛運用,企業(yè)的隨著數(shù)據(jù)庫技術(shù)的廣泛運用,企業(yè)
47、的運營環(huán)境逐漸轉(zhuǎn)化成以數(shù)據(jù)庫為中心的運運營環(huán)境逐漸轉(zhuǎn)化成以數(shù)據(jù)庫為中心的運營環(huán)境。營環(huán)境。 企業(yè)對數(shù)據(jù)的需求是多方面的,除了企業(yè)對數(shù)據(jù)的需求是多方面的,除了在企業(yè)中建立企業(yè)級的數(shù)據(jù)庫外,常常還在企業(yè)中建立企業(yè)級的數(shù)據(jù)庫外,常常還要建立部門級數(shù)據(jù)庫。要建立部門級數(shù)據(jù)庫。 比如,市場部人員通常只關(guān)心企業(yè)的比如,市場部人員通常只關(guān)心企業(yè)的銷售、市場策劃方面的信息,而不注重企銷售、市場策劃方面的信息,而不注重企業(yè)的研發(fā)、生產(chǎn)等其它環(huán)節(jié)。業(yè)的研發(fā)、生產(chǎn)等其它環(huán)節(jié)。 1.3.1 蜘蛛網(wǎng)問題蜘蛛網(wǎng)問題 因此,將銷售、市場、策劃方面的信因此,將銷售、市場、策劃方面的信息抽取出來單獨建立部門級的數(shù)據(jù)庫很有息抽取
48、出來單獨建立部門級的數(shù)據(jù)庫很有必要,這樣可以提高數(shù)據(jù)的訪問效率。必要,這樣可以提高數(shù)據(jù)的訪問效率。 在部門級數(shù)據(jù)的基礎(chǔ)上還要建立個人在部門級數(shù)據(jù)的基礎(chǔ)上還要建立個人級的數(shù)據(jù)庫。比如,專門負責(zé)制作公司財級的數(shù)據(jù)庫。比如,專門負責(zé)制作公司財務(wù)報表的數(shù)據(jù)人員,常常需要從財務(wù)部門務(wù)報表的數(shù)據(jù)人員,常常需要從財務(wù)部門的數(shù)據(jù)庫系統(tǒng)中抽取數(shù)據(jù)。又如,部門經(jīng)的數(shù)據(jù)庫系統(tǒng)中抽取數(shù)據(jù)。又如,部門經(jīng)理可能經(jīng)常抽取常用的數(shù)據(jù)到本地,有針理可能經(jīng)常抽取常用的數(shù)據(jù)到本地,有針對性地建立個人級數(shù)據(jù)庫就顯得尤為重要。對性地建立個人級數(shù)據(jù)庫就顯得尤為重要。 隨著數(shù)據(jù)的逐層抽取,很可能會形成隨著數(shù)據(jù)的逐層抽取,很可能會形成如圖如
49、圖1-4所示的所示的“蜘蛛網(wǎng)蜘蛛網(wǎng)”現(xiàn)象,使數(shù)據(jù)的現(xiàn)象,使數(shù)據(jù)的抽取和訪問顯得錯綜復(fù)雜。抽取和訪問顯得錯綜復(fù)雜。 一個大型的公司每天進行上萬次的數(shù)一個大型的公司每天進行上萬次的數(shù)據(jù)抽取很普通。這種演變不是人為制造的,據(jù)抽取很普通。這種演變不是人為制造的,而是自然演變的結(jié)果,如果不在體系結(jié)構(gòu)而是自然演變的結(jié)果,如果不在體系結(jié)構(gòu)上進行調(diào)整,上進行調(diào)整,“蜘蛛網(wǎng)蜘蛛網(wǎng)”問題將越來越嚴問題將越來越嚴重。重。 錯綜復(fù)雜的抽取與訪問將產(chǎn)生很多的問錯綜復(fù)雜的抽取與訪問將產(chǎn)生很多的問題,諸如數(shù)據(jù)分析的結(jié)果缺乏可靠性、數(shù)題,諸如數(shù)據(jù)分析的結(jié)果缺乏可靠性、數(shù)據(jù)處理的效率很低、難于將數(shù)據(jù)轉(zhuǎn)化成信據(jù)處理的效率很低、難
50、于將數(shù)據(jù)轉(zhuǎn)化成信息等。息等。 1數(shù)據(jù)分析的結(jié)果缺乏可靠性數(shù)據(jù)分析的結(jié)果缺乏可靠性 圖圖1-5中展示了某電信公司的市場部和計劃部對業(yè)務(wù)中展示了某電信公司的市場部和計劃部對業(yè)務(wù)A是否具有市是否具有市場前景的分析過程和結(jié)果。場前景的分析過程和結(jié)果。 抽取數(shù)據(jù)的時間不同2001/3/5外部市場信息A外部信息外部市場信息B外部市場信息C分析程序和分析內(nèi)容不同分析程序1分析結(jié)果1: 業(yè) 務(wù) A市 場 前 景很好市場部計劃部企業(yè)級數(shù)據(jù)庫抽取數(shù)據(jù)的內(nèi)容不同分析程序2分析結(jié)果2: 業(yè) 務(wù) A沒 有 市 場前景圖1-5兩個分析過程的差異 市場部認為市場部認為“業(yè)務(wù)業(yè)務(wù)A的市場前景很好的市場前景很好”,而計劃部卻得
51、到截然相反的結(jié)果而計劃部卻得到截然相反的結(jié)果“業(yè)務(wù)業(yè)務(wù)A沒有市場前景沒有市場前景”。作為企業(yè)的最終決策。作為企業(yè)的最終決策者,將如何根據(jù)這樣的結(jié)論進行決策呢?者,將如何根據(jù)這樣的結(jié)論進行決策呢? 兩個分析的數(shù)據(jù)都來自于企業(yè)數(shù)據(jù)庫,兩個分析的數(shù)據(jù)都來自于企業(yè)數(shù)據(jù)庫,但是結(jié)論卻不同,下面通過分析兩個過程但是結(jié)論卻不同,下面通過分析兩個過程的差異來尋求原因。的差異來尋求原因。 首先,市場部門和計劃部門從企業(yè)數(shù)據(jù)首先,市場部門和計劃部門從企業(yè)數(shù)據(jù)庫中抽取的數(shù)據(jù)可能不同,比如,市場部庫中抽取的數(shù)據(jù)可能不同,比如,市場部抽取的是在大客戶中對業(yè)務(wù)抽取的是在大客戶中對業(yè)務(wù)A的使用情況,的使用情況,而計劃部抽取
52、的是在普通客戶中對業(yè)務(wù)而計劃部抽取的是在普通客戶中對業(yè)務(wù)A的使用情況。兩者分析數(shù)據(jù)的內(nèi)容存在差的使用情況。兩者分析數(shù)據(jù)的內(nèi)容存在差異。異。 其次,市場部分析的時間是其次,市場部分析的時間是2001年年3月月5日,日,而計劃部分析的時間是而計劃部分析的時間是2001年年3月月25日,兩個分日,兩個分析過程從數(shù)據(jù)庫中抽取數(shù)據(jù)的時間不同,企業(yè)數(shù)析過程從數(shù)據(jù)庫中抽取數(shù)據(jù)的時間不同,企業(yè)數(shù)據(jù)庫中的內(nèi)容已經(jīng)發(fā)生了變化,這很可能導(dǎo)致分據(jù)庫中的內(nèi)容已經(jīng)發(fā)生了變化,這很可能導(dǎo)致分析的結(jié)果不同。析的結(jié)果不同。 再次,分析業(yè)務(wù)的發(fā)展趨勢常常需要引入企再次,分析業(yè)務(wù)的發(fā)展趨勢常常需要引入企業(yè)外部的信息,比如客戶的滿意
53、程度、國家的政業(yè)外部的信息,比如客戶的滿意程度、國家的政策等。市場部門引用的外部信息來源可能與計劃策等。市場部門引用的外部信息來源可能與計劃部不同,而外部信息自然是仁者見仁,智者見智,部不同,而外部信息自然是仁者見仁,智者見智,這也可能是導(dǎo)致最終分析結(jié)果不同的原因。這也可能是導(dǎo)致最終分析結(jié)果不同的原因。 最后,市場部門使用的分析程序可能與計劃最后,市場部門使用的分析程序可能與計劃部門不同,分析的內(nèi)容和指標也可能不同。通過部門不同,分析的內(nèi)容和指標也可能不同。通過上面的分析,我們可以看出導(dǎo)致兩個分析過程出上面的分析,我們可以看出導(dǎo)致兩個分析過程出現(xiàn)截然相反的結(jié)論的根本原因是數(shù)據(jù)的來源不一現(xiàn)截然相
54、反的結(jié)論的根本原因是數(shù)據(jù)的來源不一致,對于不同來源的數(shù)據(jù),分析結(jié)果顯然是不一致,對于不同來源的數(shù)據(jù),分析結(jié)果顯然是不一致的。致的。 2. 數(shù)據(jù)處理的效率很低數(shù)據(jù)處理的效率很低 在錯綜復(fù)雜的體系結(jié)構(gòu)中,不同級別在錯綜復(fù)雜的體系結(jié)構(gòu)中,不同級別的數(shù)據(jù)庫可能使用不同類型的數(shù)據(jù)庫系統(tǒng)。的數(shù)據(jù)庫可能使用不同類型的數(shù)據(jù)庫系統(tǒng)。 對于擁有巨型數(shù)據(jù)量的企業(yè)級數(shù)據(jù)庫對于擁有巨型數(shù)據(jù)量的企業(yè)級數(shù)據(jù)庫可能使用可能使用IBM DB2,對于中小型數(shù)據(jù)庫可,對于中小型數(shù)據(jù)庫可能使用能使用SQLServer。 各種數(shù)據(jù)庫的開發(fā)工具和開發(fā)環(huán)境不各種數(shù)據(jù)庫的開發(fā)工具和開發(fā)環(huán)境不同,抽取程序應(yīng)用的技術(shù)不同,因而難以同,抽取程序應(yīng)
55、用的技術(shù)不同,因而難以集成。集成。 2. 數(shù)據(jù)處理的效率很低數(shù)據(jù)處理的效率很低 如果一個大型企業(yè)的決策領(lǐng)導(dǎo)需要一如果一個大型企業(yè)的決策領(lǐng)導(dǎo)需要一份關(guān)于公司整體運營情況的報表,通常需份關(guān)于公司整體運營情況的報表,通常需要動用大量的人力和物力才能達到。要動用大量的人力和物力才能達到。 首先,需要確定報表涉及的內(nèi)容分布首先,需要確定報表涉及的內(nèi)容分布在哪個數(shù)據(jù)庫的哪個位置,然后調(diào)動各個在哪個數(shù)據(jù)庫的哪個位置,然后調(diào)動各個部門的程序員部門的程序員/分析員對應(yīng)用進行分析、設(shè)分析員對應(yīng)用進行分析、設(shè)計和編碼。計和編碼。 由于數(shù)據(jù)分散在各個數(shù)據(jù)庫中,因此由于數(shù)據(jù)分散在各個數(shù)據(jù)庫中,因此需要編寫的程序很多。需
56、要編寫的程序很多。 由于在企業(yè)中使用的數(shù)據(jù)庫類型很多,由于在企業(yè)中使用的數(shù)據(jù)庫類型很多,因此可能需要使用多種技術(shù)來實現(xiàn)。因此可能需要使用多種技術(shù)來實現(xiàn)。 程序的重用性很差,因為決策者明天程序的重用性很差,因為決策者明天想看的內(nèi)容可能與今天不同。想看的內(nèi)容可能與今天不同。 可見,動用大量的人力、物力和時間可見,動用大量的人力、物力和時間才完成的報表不僅時效性很差,數(shù)據(jù)處理才完成的報表不僅時效性很差,數(shù)據(jù)處理的效率也很低。報表形成的過程如圖的效率也很低。報表形成的過程如圖1-6所所示。示。 報表3報表2報表1計費數(shù)據(jù)庫財務(wù)數(shù)據(jù)庫銷售數(shù)據(jù)庫圖1-6 報表形成過程示意圖3. 難以將數(shù)據(jù)轉(zhuǎn)化成信息難以將
57、數(shù)據(jù)轉(zhuǎn)化成信息 除了數(shù)據(jù)處理效率和數(shù)據(jù)可信度的問除了數(shù)據(jù)處理效率和數(shù)據(jù)可信度的問題之外,題之外,“蜘蛛網(wǎng)蜘蛛網(wǎng)”式的結(jié)構(gòu)還難以將數(shù)式的結(jié)構(gòu)還難以將數(shù)據(jù)轉(zhuǎn)化為信息。據(jù)轉(zhuǎn)化為信息。 比如,某電信公司想分析某個大客戶比如,某電信公司想分析某個大客戶今年的情況和過去今年的情況和過去3年有什么不同?大客戶年有什么不同?大客戶的情況可能包括客戶的呼叫行為、話費情的情況可能包括客戶的呼叫行為、話費情況、咨詢問題等。因此要想比較完整地回況、咨詢問題等。因此要想比較完整地回答這個問題,實際上需要將客戶多方面的答這個問題,實際上需要將客戶多方面的數(shù)據(jù)綜合成信息。數(shù)據(jù)綜合成信息。 3. 難以將數(shù)據(jù)轉(zhuǎn)化成信息難以將數(shù)據(jù)轉(zhuǎn)化成信息 在實際的數(shù)據(jù)庫系統(tǒng)中,記錄客戶呼在實際的數(shù)據(jù)庫系統(tǒng)中,記錄客戶呼叫行為的數(shù)據(jù)庫通常只保留客戶最近叫行為的數(shù)據(jù)庫通常只保留客戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度食堂工作人員健康體檢及福利聘用合同
- 二零二五年度汽修廠與汽車維修配件研發(fā)中心合作協(xié)議
- 二零二五年度養(yǎng)老公寓入住與子女共同維護社區(qū)和諧協(xié)議
- 二零二五年度游艇俱樂部個人保潔合同
- 二零二五年度房地產(chǎn)項目銷售代理及客戶關(guān)系維護合同
- 綠茶茶園承包經(jīng)營合同(2025年度)含茶文化體驗項目
- 二零二五年度個人車輛抵押保險理賠合同
- 二零二五實習(xí)律師實習(xí)合同(反壟斷與反不正當(dāng)競爭)
- 2025年度藝人經(jīng)紀違約金及違約行為處理合同
- 二零二五年度房產(chǎn)交易傭金糾紛解決合同
- 智慧農(nóng)業(yè)的智能農(nóng)機與裝備
- 并聯(lián)有源電力濾波器工程應(yīng)用關(guān)鍵技術(shù)的研究的開題報告
- 跨文化語境下的國家形象塑造與傳播以中國《國家形象》宣傳片為例
- 志愿服務(wù)與志愿者精神知識考試題庫大全(含答案)
- 工業(yè)機器人應(yīng)用基礎(chǔ) 教案(教學(xué)設(shè)計) 模塊二-任務(wù)二-ABB工業(yè)機器人編程基礎(chǔ)
- 文創(chuàng)產(chǎn)品設(shè)計:文創(chuàng)產(chǎn)品設(shè)計與創(chuàng)新
- 麻醉復(fù)蘇護理進修匯報
- 企業(yè)安全與風(fēng)險管控課件
- 小學(xué)語文《文學(xué)閱讀與創(chuàng)意表達》
- 醫(yī)保定點納入預(yù)測性研究的報告
- 手術(shù)講解模板單側(cè)腎切除術(shù)
評論
0/150
提交評論