客戶關(guān)系管理第6章課件_第1頁
客戶關(guān)系管理第6章課件_第2頁
客戶關(guān)系管理第6章課件_第3頁
客戶關(guān)系管理第6章課件_第4頁
客戶關(guān)系管理第6章課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第6章

CRM中的數(shù)據(jù)管理數(shù)據(jù)倉庫(datawarehouse)與數(shù)據(jù)挖掘(datamining)第6章

16.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起1.“數(shù)據(jù)太多,信息不足”的現(xiàn)狀2.異構(gòu)環(huán)境的數(shù)據(jù)源據(jù)美國《幸福》雜志所列的全球2000家大公司中已有90%將Internet網(wǎng)絡(luò)和數(shù)據(jù)倉庫這兩項(xiàng)技術(shù)列入企業(yè)計(jì)劃。數(shù)據(jù)倉庫是1995年開始盛行起來的。6.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起26.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在《建立數(shù)據(jù)倉庫》一書中,對數(shù)據(jù)倉庫的定義為:數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的,不同時(shí)間的數(shù)據(jù)集合,用于支持經(jīng)營管理中決策制定過程。6.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在3(2)SAS軟件研究所定義:數(shù)據(jù)倉庫是一種管理技術(shù),旨在通過通暢、合理、全面的信息管理,達(dá)到有效的決策支持。(2)SAS軟件研究所定義:4

傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型處理,是指對數(shù)據(jù)庫聯(lián)機(jī)進(jìn)行日常操作,即對一個(gè)或一組記錄的查詢和修改,主要為企業(yè)特定的應(yīng)用服務(wù)的。用戶關(guān)心的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性。數(shù)據(jù)倉庫用于決策支持,也稱分析型處理,用于決策分析,它是建立決策支持系統(tǒng)(DSS)的基礎(chǔ)。傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型處理,是指對數(shù)據(jù)庫5操作型數(shù)據(jù)(DB數(shù)據(jù))與分析型數(shù)據(jù)(DW數(shù)據(jù))之間的差別為:操作型數(shù)據(jù)(DB數(shù)據(jù))與6數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的主題是數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個(gè)主題基本對應(yīng)一個(gè)宏觀的分析領(lǐng)域。例如,銀行的數(shù)據(jù)倉庫的主題:客戶DW的客戶數(shù)據(jù)來源:從銀行儲蓄DB、信用卡DB、貸款DB等三個(gè)DB中抽取同一客戶的數(shù)據(jù)整理而成。在DW中分析客戶數(shù)據(jù),可決定是否繼續(xù)給予貸款。數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的7傳統(tǒng)的數(shù)據(jù)庫是面向應(yīng)用而進(jìn)行數(shù)據(jù)組織的,其抽象程度不夠高,沒有完全實(shí)現(xiàn)數(shù)據(jù)與應(yīng)用的分離。但這種方式能較好地將企業(yè)業(yè)務(wù)活動與數(shù)據(jù)庫模式相對應(yīng),利于從手工處理向計(jì)算機(jī)處理過渡,因而具有較好的可操作性;數(shù)據(jù)倉庫是面向主題而進(jìn)行數(shù)據(jù)組織的。主題是一個(gè)在較高層次上對數(shù)據(jù)的抽象,在邏輯意義上,它是對企業(yè)中某一宏觀領(lǐng)域所涉及的分析對象,即將數(shù)據(jù)組織成主題域。傳統(tǒng)的數(shù)據(jù)庫是面向應(yīng)用而進(jìn)行數(shù)據(jù)組織的,其抽象程度不夠高,沒8面向主題汽車人壽健康意外傷亡操作性環(huán)境應(yīng)用顧客保險(xiǎn)單保險(xiǎn)費(fèi)索賠數(shù)據(jù)倉庫主題面向主題汽車操作性環(huán)境應(yīng)用顧客數(shù)據(jù)倉庫主題9(2)數(shù)據(jù)倉庫是集成的數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,必須經(jīng)過加工與集成。對不同的數(shù)據(jù)來源進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異義,異名同義,單位不統(tǒng)一,字長不一致等。將原始數(shù)據(jù)結(jié)構(gòu)做一個(gè)從面向應(yīng)用到面向主題的大轉(zhuǎn)變。(2)數(shù)據(jù)倉庫是集成的10

數(shù)據(jù)庫

應(yīng)用Am,f應(yīng)用B1,0應(yīng)用Cx,y應(yīng)用D男,女

數(shù)據(jù)倉庫

m,f編碼應(yīng)用A管道cm應(yīng)用B管道inches應(yīng)用C管道m(xù)cf應(yīng)用D管道yds管道cm屬性度量數(shù)據(jù)庫數(shù)據(jù)倉庫編碼應(yīng)用A管道cm管道cm屬性11應(yīng)用A描述應(yīng)用B描述應(yīng)用C描述應(yīng)用D描述應(yīng)用Achar(10)應(yīng)用Bdecfixed(9,2)應(yīng)用Cpic‘9999999’應(yīng)用Dchar(12)多重信息源?描述char(12)沖突的鍵碼集成應(yīng)用A描述多重信息源?描述沖突的鍵碼集成12(3)數(shù)據(jù)倉庫是穩(wěn)定/非易失的操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)發(fā)生變化。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。(3)數(shù)據(jù)倉庫是穩(wěn)定/非易失的13非易失性插入刪除插入修改刪除訪問修改訪問數(shù)據(jù)的逐個(gè)記錄方式處理數(shù)據(jù)的批量載入/訪問數(shù)據(jù)庫數(shù)據(jù)倉庫非易失性插入刪除插入修改刪除訪問修改訪問數(shù)據(jù)的逐個(gè)記錄方式處14(4)數(shù)據(jù)倉庫是反映時(shí)間變化的

操作型數(shù)據(jù)庫主要關(guān)心當(dāng)前某一個(gè)時(shí)間段內(nèi)的數(shù)據(jù),而數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時(shí)點(diǎn)(如開始應(yīng)用數(shù)據(jù)倉庫的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。數(shù)據(jù)倉庫中的數(shù)據(jù)時(shí)間期限要遠(yuǎn)遠(yuǎn)長于操作型系統(tǒng)中的數(shù)據(jù)時(shí)間期限。操作型系統(tǒng)的時(shí)間期限一般是60~90天,而數(shù)據(jù)倉庫中數(shù)據(jù)的時(shí)間期限通常是5~10年??蛻絷P(guān)系管理第6章課件15操作型數(shù)據(jù)庫含有“當(dāng)前值”的數(shù)據(jù),這些數(shù)據(jù)的準(zhǔn)確性在訪問時(shí)是有效的,同樣當(dāng)前值的數(shù)據(jù)能被更新。而數(shù)據(jù)倉庫中的數(shù)據(jù)僅僅是一系列某一時(shí)刻生成的復(fù)雜的快照。操作型數(shù)據(jù)的鍵碼結(jié)構(gòu)可能包含也可能不包含時(shí)間元素,如年、月、日等。而數(shù)據(jù)倉庫的鍵碼結(jié)構(gòu)總是包含某時(shí)間元素。數(shù)據(jù)倉庫的數(shù)據(jù)碼鍵都包含時(shí)間項(xiàng),用作標(biāo)明數(shù)據(jù)的歷史時(shí)期。數(shù)據(jù)倉庫中的數(shù)據(jù)包含有大量綜合數(shù)據(jù),很多與時(shí)間有關(guān),如按時(shí)間段進(jìn)行綜合或隔時(shí)間片進(jìn)行抽樣。隨著時(shí)間變化,數(shù)據(jù)倉庫需要不斷增加新數(shù)據(jù)、刪去舊數(shù)據(jù)。操作型數(shù)據(jù)庫含有“當(dāng)前值”的數(shù)據(jù),這些數(shù)據(jù)的準(zhǔn)確性在訪問時(shí)是16數(shù)據(jù)庫數(shù)據(jù)倉庫時(shí)間期限:當(dāng)前到60—90天記錄更新鍵碼結(jié)構(gòu)可能包括也可能不包括時(shí)間元素時(shí)間期限:5—10年數(shù)據(jù)的復(fù)雜快照鍵碼結(jié)構(gòu)包括時(shí)間元素?cái)?shù)據(jù)庫數(shù)據(jù)倉庫時(shí)間期限:當(dāng)前到60—90天時(shí)間期限:5—117

(5)DW中數(shù)據(jù)量大。大型DW是一個(gè)TB(1000GB)級數(shù)據(jù)庫問題(一般為10GB級相當(dāng)于一般數(shù)據(jù)庫100MB的100倍)需要一個(gè)巨大的硬件平臺需要一個(gè)并行的數(shù)據(jù)庫系統(tǒng)最好的數(shù)據(jù)倉庫是大的和昂貴的。(5)DW中數(shù)據(jù)量大。18

(6)是信息的概括和聚集。

(6)是信息的概括和聚集。19操作性數(shù)據(jù)倉庫JJones女1945年7月20日。。。。。JJones去年有兩張罰單一次大事故。。。。。JJonesMain大街123號已婚。。。。。JJones兩個(gè)孩子高血壓。。。。。人壽保險(xiǎn)汽車保險(xiǎn)房產(chǎn)保險(xiǎn)健康保險(xiǎn)JJones女1945年7月20日出生去年兩張罰單一次大事故已婚兩個(gè)孩子高血壓。。。。。。顧客操作性數(shù)據(jù)倉庫JJonesJJonesJJones206.1.2數(shù)據(jù)倉庫中的數(shù)據(jù)組織1數(shù)據(jù)的粒度2數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)3數(shù)據(jù)的分割4數(shù)據(jù)倉庫的數(shù)據(jù)組織形式5數(shù)據(jù)倉庫的數(shù)據(jù)組織模式6數(shù)據(jù)的追加6.1.2數(shù)據(jù)倉庫中的數(shù)據(jù)組織1數(shù)據(jù)的粒度211粒度粒度——是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或總合程度的級別。細(xì)化程度越高,粒度級就越?。?/p>

細(xì)化程度越低,粒度級就越大。粒度——細(xì)節(jié)的級別粒度的劃分決定了數(shù)據(jù)倉庫中數(shù)據(jù)量的大小和查詢的詳細(xì)程度。多重粒度1粒度粒度——是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或總合22粒度的一個(gè)例子高細(xì)化低細(xì)化每月200個(gè)記錄每月40,000個(gè)字節(jié)每月一個(gè)記錄每月200個(gè)字節(jié)通過檢索可以回答無細(xì)節(jié)無法回答詢問某一電話的細(xì)節(jié)粒度的一個(gè)例子高細(xì)化低細(xì)化每月200個(gè)記錄每月一個(gè)記錄通過檢23

近期基本數(shù)據(jù):是最近時(shí)期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉庫用戶最感興趣的部分,數(shù)據(jù)量大。

歷史基本數(shù)據(jù):近期基本數(shù)據(jù)隨時(shí)間的推移,由數(shù)據(jù)倉庫的時(shí)間控制機(jī)制轉(zhuǎn)為歷史基本數(shù)據(jù)。

輕度綜合數(shù)據(jù):是從近期基本數(shù)據(jù)中提取出的,這層數(shù)據(jù)是按時(shí)間段選取,或者按數(shù)據(jù)屬性(attributes)和內(nèi)容(contents)進(jìn)行綜合。

高度綜合數(shù)據(jù)層:這一層的數(shù)據(jù)是在輕度綜合數(shù)據(jù)基礎(chǔ)上的再一次綜合,是一種準(zhǔn)決策數(shù)據(jù)。2數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)近期基本數(shù)據(jù):是最近時(shí)期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉242數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)元數(shù)據(jù)高度綜合級輕度綜合級(數(shù)據(jù)集市)銷售細(xì)節(jié)級2000-2001操作型轉(zhuǎn)換早期細(xì)節(jié)級每月銷售1994-2001每周銷售1994-2001當(dāng)前細(xì)節(jié)級銷售細(xì)節(jié)級1994-19992數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)元數(shù)據(jù)高度綜合級輕度綜合級銷售細(xì)節(jié)253分割分割——將當(dāng)前細(xì)節(jié)數(shù)據(jù)分散到各自的物理單元中去以便能分別獨(dú)立處理,以提高數(shù)據(jù)處理效率。分片——數(shù)據(jù)分割后的獨(dú)立單元。數(shù)據(jù)的分割提高了數(shù)據(jù)管理的靈活性

重構(gòu)、索引、重組、恢復(fù)、監(jiān)控分割的標(biāo)準(zhǔn):日期、地域、業(yè)務(wù)領(lǐng)域。3分割分割——將當(dāng)前細(xì)節(jié)數(shù)據(jù)分散到各自的物理單元中去以便能26分割的一個(gè)例子分片9分片8分片72001分片6分片5分片42000分片3分片2分片11999事故保險(xiǎn)生命保險(xiǎn)健康保險(xiǎn)分割的一個(gè)例子分片9分片8分片72001分片6分片5分片42274數(shù)據(jù)倉庫的數(shù)據(jù)組織形式簡單堆積數(shù)據(jù)輪轉(zhuǎn)綜合數(shù)據(jù)簡化直接數(shù)據(jù)連續(xù)數(shù)據(jù)4數(shù)據(jù)倉庫的數(shù)據(jù)組織形式簡單堆積數(shù)據(jù)28簡單堆積文件1月1日1月2日1月3日……2月1日2月2日2月3日……3月1日3月2日3月3日……………………簡單堆積文件1月1日29輪轉(zhuǎn)綜合文件星期一星期二……星期天第一周第二周……第五周一月二月……十二月

………………輪轉(zhuǎn)綜合文件星期一30簡化直接文件數(shù)據(jù)庫快照姓名顧客號地址張平C960100北京王珂C960101上海劉輝C960102天津李強(qiáng)C960103成都

...

一月份顧客表操作性數(shù)據(jù)生成簡化直接文件簡化直接文件數(shù)據(jù)庫快照姓名顧客號地址一月31連續(xù)文件姓名顧客號地址張平C020100北京王珂C020101上海張順C020102天津李強(qiáng)C020103成都姓名顧客號地址張平C020100北京王珂C020101上海張順C020101廣州李強(qiáng)C020103成都劉誠C020105杭州姓名顧客號日期地址張平C0201001-2月北京王珂C0201011-2月上海張順C0201031月天津張順C0201032月廣州李強(qiáng)C0201031-2月成都劉誠C0201052月杭州1月份顧客表2月份顧客表1-2月份顧客表連續(xù)文件姓名顧客號地址姓名顧客32第6章

CRM中的數(shù)據(jù)管理數(shù)據(jù)倉庫(datawarehouse)與數(shù)據(jù)挖掘(datamining)第6章

336.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起1.“數(shù)據(jù)太多,信息不足”的現(xiàn)狀2.異構(gòu)環(huán)境的數(shù)據(jù)源據(jù)美國《幸?!冯s志所列的全球2000家大公司中已有90%將Internet網(wǎng)絡(luò)和數(shù)據(jù)倉庫這兩項(xiàng)技術(shù)列入企業(yè)計(jì)劃。數(shù)據(jù)倉庫是1995年開始盛行起來的。6.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起346.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在《建立數(shù)據(jù)倉庫》一書中,對數(shù)據(jù)倉庫的定義為:數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的,不同時(shí)間的數(shù)據(jù)集合,用于支持經(jīng)營管理中決策制定過程。6.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在35(2)SAS軟件研究所定義:數(shù)據(jù)倉庫是一種管理技術(shù),旨在通過通暢、合理、全面的信息管理,達(dá)到有效的決策支持。(2)SAS軟件研究所定義:36

傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型處理,是指對數(shù)據(jù)庫聯(lián)機(jī)進(jìn)行日常操作,即對一個(gè)或一組記錄的查詢和修改,主要為企業(yè)特定的應(yīng)用服務(wù)的。用戶關(guān)心的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性。數(shù)據(jù)倉庫用于決策支持,也稱分析型處理,用于決策分析,它是建立決策支持系統(tǒng)(DSS)的基礎(chǔ)。傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型處理,是指對數(shù)據(jù)庫37操作型數(shù)據(jù)(DB數(shù)據(jù))與分析型數(shù)據(jù)(DW數(shù)據(jù))之間的差別為:操作型數(shù)據(jù)(DB數(shù)據(jù))與38數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的主題是數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個(gè)主題基本對應(yīng)一個(gè)宏觀的分析領(lǐng)域。例如,銀行的數(shù)據(jù)倉庫的主題:客戶DW的客戶數(shù)據(jù)來源:從銀行儲蓄DB、信用卡DB、貸款DB等三個(gè)DB中抽取同一客戶的數(shù)據(jù)整理而成。在DW中分析客戶數(shù)據(jù),可決定是否繼續(xù)給予貸款。數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的39傳統(tǒng)的數(shù)據(jù)庫是面向應(yīng)用而進(jìn)行數(shù)據(jù)組織的,其抽象程度不夠高,沒有完全實(shí)現(xiàn)數(shù)據(jù)與應(yīng)用的分離。但這種方式能較好地將企業(yè)業(yè)務(wù)活動與數(shù)據(jù)庫模式相對應(yīng),利于從手工處理向計(jì)算機(jī)處理過渡,因而具有較好的可操作性;數(shù)據(jù)倉庫是面向主題而進(jìn)行數(shù)據(jù)組織的。主題是一個(gè)在較高層次上對數(shù)據(jù)的抽象,在邏輯意義上,它是對企業(yè)中某一宏觀領(lǐng)域所涉及的分析對象,即將數(shù)據(jù)組織成主題域。傳統(tǒng)的數(shù)據(jù)庫是面向應(yīng)用而進(jìn)行數(shù)據(jù)組織的,其抽象程度不夠高,沒40面向主題汽車人壽健康意外傷亡操作性環(huán)境應(yīng)用顧客保險(xiǎn)單保險(xiǎn)費(fèi)索賠數(shù)據(jù)倉庫主題面向主題汽車操作性環(huán)境應(yīng)用顧客數(shù)據(jù)倉庫主題41(2)數(shù)據(jù)倉庫是集成的數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,必須經(jīng)過加工與集成。對不同的數(shù)據(jù)來源進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異義,異名同義,單位不統(tǒng)一,字長不一致等。將原始數(shù)據(jù)結(jié)構(gòu)做一個(gè)從面向應(yīng)用到面向主題的大轉(zhuǎn)變。(2)數(shù)據(jù)倉庫是集成的42

數(shù)據(jù)庫

應(yīng)用Am,f應(yīng)用B1,0應(yīng)用Cx,y應(yīng)用D男,女

數(shù)據(jù)倉庫

m,f編碼應(yīng)用A管道cm應(yīng)用B管道inches應(yīng)用C管道m(xù)cf應(yīng)用D管道yds管道cm屬性度量數(shù)據(jù)庫數(shù)據(jù)倉庫編碼應(yīng)用A管道cm管道cm屬性43應(yīng)用A描述應(yīng)用B描述應(yīng)用C描述應(yīng)用D描述應(yīng)用Achar(10)應(yīng)用Bdecfixed(9,2)應(yīng)用Cpic‘9999999’應(yīng)用Dchar(12)多重信息源?描述char(12)沖突的鍵碼集成應(yīng)用A描述多重信息源?描述沖突的鍵碼集成44(3)數(shù)據(jù)倉庫是穩(wěn)定/非易失的操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實(shí)時(shí)更新,數(shù)據(jù)根據(jù)需要及時(shí)發(fā)生變化。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。(3)數(shù)據(jù)倉庫是穩(wěn)定/非易失的45非易失性插入刪除插入修改刪除訪問修改訪問數(shù)據(jù)的逐個(gè)記錄方式處理數(shù)據(jù)的批量載入/訪問數(shù)據(jù)庫數(shù)據(jù)倉庫非易失性插入刪除插入修改刪除訪問修改訪問數(shù)據(jù)的逐個(gè)記錄方式處46(4)數(shù)據(jù)倉庫是反映時(shí)間變化的

操作型數(shù)據(jù)庫主要關(guān)心當(dāng)前某一個(gè)時(shí)間段內(nèi)的數(shù)據(jù),而數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時(shí)點(diǎn)(如開始應(yīng)用數(shù)據(jù)倉庫的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。數(shù)據(jù)倉庫中的數(shù)據(jù)時(shí)間期限要遠(yuǎn)遠(yuǎn)長于操作型系統(tǒng)中的數(shù)據(jù)時(shí)間期限。操作型系統(tǒng)的時(shí)間期限一般是60~90天,而數(shù)據(jù)倉庫中數(shù)據(jù)的時(shí)間期限通常是5~10年??蛻絷P(guān)系管理第6章課件47操作型數(shù)據(jù)庫含有“當(dāng)前值”的數(shù)據(jù),這些數(shù)據(jù)的準(zhǔn)確性在訪問時(shí)是有效的,同樣當(dāng)前值的數(shù)據(jù)能被更新。而數(shù)據(jù)倉庫中的數(shù)據(jù)僅僅是一系列某一時(shí)刻生成的復(fù)雜的快照。操作型數(shù)據(jù)的鍵碼結(jié)構(gòu)可能包含也可能不包含時(shí)間元素,如年、月、日等。而數(shù)據(jù)倉庫的鍵碼結(jié)構(gòu)總是包含某時(shí)間元素。數(shù)據(jù)倉庫的數(shù)據(jù)碼鍵都包含時(shí)間項(xiàng),用作標(biāo)明數(shù)據(jù)的歷史時(shí)期。數(shù)據(jù)倉庫中的數(shù)據(jù)包含有大量綜合數(shù)據(jù),很多與時(shí)間有關(guān),如按時(shí)間段進(jìn)行綜合或隔時(shí)間片進(jìn)行抽樣。隨著時(shí)間變化,數(shù)據(jù)倉庫需要不斷增加新數(shù)據(jù)、刪去舊數(shù)據(jù)。操作型數(shù)據(jù)庫含有“當(dāng)前值”的數(shù)據(jù),這些數(shù)據(jù)的準(zhǔn)確性在訪問時(shí)是48數(shù)據(jù)庫數(shù)據(jù)倉庫時(shí)間期限:當(dāng)前到60—90天記錄更新鍵碼結(jié)構(gòu)可能包括也可能不包括時(shí)間元素時(shí)間期限:5—10年數(shù)據(jù)的復(fù)雜快照鍵碼結(jié)構(gòu)包括時(shí)間元素?cái)?shù)據(jù)庫數(shù)據(jù)倉庫時(shí)間期限:當(dāng)前到60—90天時(shí)間期限:5—149

(5)DW中數(shù)據(jù)量大。大型DW是一個(gè)TB(1000GB)級數(shù)據(jù)庫問題(一般為10GB級相當(dāng)于一般數(shù)據(jù)庫100MB的100倍)需要一個(gè)巨大的硬件平臺需要一個(gè)并行的數(shù)據(jù)庫系統(tǒng)最好的數(shù)據(jù)倉庫是大的和昂貴的。(5)DW中數(shù)據(jù)量大。50

(6)是信息的概括和聚集。

(6)是信息的概括和聚集。51操作性數(shù)據(jù)倉庫JJones女1945年7月20日。。。。。JJones去年有兩張罰單一次大事故。。。。。JJonesMain大街123號已婚。。。。。JJones兩個(gè)孩子高血壓。。。。。人壽保險(xiǎn)汽車保險(xiǎn)房產(chǎn)保險(xiǎn)健康保險(xiǎn)JJones女1945年7月20日出生去年兩張罰單一次大事故已婚兩個(gè)孩子高血壓。。。。。。顧客操作性數(shù)據(jù)倉庫JJonesJJonesJJones526.1.2數(shù)據(jù)倉庫中的數(shù)據(jù)組織1數(shù)據(jù)的粒度2數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)3數(shù)據(jù)的分割4數(shù)據(jù)倉庫的數(shù)據(jù)組織形式5數(shù)據(jù)倉庫的數(shù)據(jù)組織模式6數(shù)據(jù)的追加6.1.2數(shù)據(jù)倉庫中的數(shù)據(jù)組織1數(shù)據(jù)的粒度531粒度粒度——是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或總合程度的級別。細(xì)化程度越高,粒度級就越??;

細(xì)化程度越低,粒度級就越大。粒度——細(xì)節(jié)的級別粒度的劃分決定了數(shù)據(jù)倉庫中數(shù)據(jù)量的大小和查詢的詳細(xì)程度。多重粒度1粒度粒度——是指數(shù)據(jù)倉庫的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或總合54粒度的一個(gè)例子高細(xì)化低細(xì)化每月200個(gè)記錄每月40,000個(gè)字節(jié)每月一個(gè)記錄每月200個(gè)字節(jié)通過檢索可以回答無細(xì)節(jié)無法回答詢問某一電話的細(xì)節(jié)粒度的一個(gè)例子高細(xì)化低細(xì)化每月200個(gè)記錄每月一個(gè)記錄通過檢55

近期基本數(shù)據(jù):是最近時(shí)期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉庫用戶最感興趣的部分,數(shù)據(jù)量大。

歷史基本數(shù)據(jù):近期基本數(shù)據(jù)隨時(shí)間的推移,由數(shù)據(jù)倉庫的時(shí)間控制機(jī)制轉(zhuǎn)為歷史基本數(shù)據(jù)。

輕度綜合數(shù)據(jù):是從近期基本數(shù)據(jù)中提取出的,這層數(shù)據(jù)是按時(shí)間段選取,或者按數(shù)據(jù)屬性(attributes)和內(nèi)容(contents)進(jìn)行綜合。

高度綜合數(shù)據(jù)層:這一層的數(shù)據(jù)是在輕度綜合數(shù)據(jù)基礎(chǔ)上的再一次綜合,是一種準(zhǔn)決策數(shù)據(jù)。2數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)近期基本數(shù)據(jù):是最近時(shí)期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉562數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)元數(shù)據(jù)高度綜合級輕度綜合級(數(shù)據(jù)集市)銷售細(xì)節(jié)級2000-2001操作型轉(zhuǎn)換早期細(xì)節(jié)級每月銷售1994-2001每周銷售1994-2001當(dāng)前細(xì)節(jié)級銷售細(xì)節(jié)級1994-19992數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)元數(shù)據(jù)高度綜合級輕度綜合級銷售細(xì)節(jié)573分割分割——將當(dāng)前細(xì)節(jié)數(shù)據(jù)分散到各自的物理單元中去以便能分別獨(dú)立處理,以提高數(shù)據(jù)處理效率。分片——數(shù)據(jù)分割后的獨(dú)立單元。數(shù)據(jù)的分割提高了數(shù)據(jù)管理的靈活性

重構(gòu)、索引、重組、恢復(fù)、監(jiān)控分割的標(biāo)準(zhǔn):日期、地域、業(yè)務(wù)領(lǐng)域。3分割分割——將當(dāng)前細(xì)節(jié)數(shù)據(jù)分散到各自的物理單元中去以便能58分割的一個(gè)例子分片9分片8分片72001分片6分片5分片42000分片3分片2分片11999事故保險(xiǎn)生命保險(xiǎn)健康保險(xiǎn)分割的一個(gè)例子分片9分片8分片72001分片6分片5分片42594數(shù)據(jù)倉庫的數(shù)據(jù)組織形式簡單堆積數(shù)據(jù)輪轉(zhuǎn)綜合數(shù)據(jù)簡化直接數(shù)據(jù)連續(xù)數(shù)據(jù)4數(shù)據(jù)倉庫的數(shù)據(jù)組織形式簡單堆積數(shù)據(jù)60簡單堆積文件1月1日1月2日

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論