數(shù)據(jù)倉庫的概念模型設(shè)計(jì)模型定義_第1頁
數(shù)據(jù)倉庫的概念模型設(shè)計(jì)模型定義_第2頁
數(shù)據(jù)倉庫的概念模型設(shè)計(jì)模型定義_第3頁
數(shù)據(jù)倉庫的概念模型設(shè)計(jì)模型定義_第4頁
數(shù)據(jù)倉庫的概念模型設(shè)計(jì)模型定義_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、完成概念模型的需求調(diào)查后,可以開始進(jìn)行概念模型的定義。在概念模型的定義過程中需要確定系統(tǒng)的范圍以及所涉及的對象。模型的設(shè)計(jì)先要明確所要構(gòu)建的內(nèi)容,設(shè)計(jì)模型的起點(diǎn)是所選擇的主題域。數(shù)據(jù)倉庫是面向決策進(jìn)行分析的數(shù)據(jù)庫,無法在數(shù)據(jù)倉庫設(shè)計(jì)時(shí)就確定用戶明確而詳細(xì)的需求,只有一些基本的需求方向、基本的數(shù)據(jù)需求擺在設(shè)計(jì)著面前:要做的決策有哪些?決策者感興趣的是什么問題?解決這些問題需要什么樣的信息?作為傳統(tǒng)的業(yè)務(wù)處理系統(tǒng)的開發(fā),在其開發(fā)分析中需要明確業(yè)務(wù)處理的具體功能,即系統(tǒng)的開發(fā)是基于功能驅(qū)動(dòng)的,數(shù)據(jù)倉庫開發(fā)人員在數(shù)據(jù)倉庫形成與應(yīng)用之前是不可能了解數(shù)據(jù)倉庫的功能的。因此,無法采用功能驅(qū)動(dòng)開發(fā)方法進(jìn)行數(shù)據(jù)

2、倉庫的開發(fā),但是,數(shù)據(jù)倉庫的開發(fā)人員可以在數(shù)據(jù)倉庫開發(fā)之前通過數(shù)據(jù)倉庫的需求分析,了解數(shù)據(jù)倉庫用戶的大致需求,即在決策過程中需要什么信息。這樣,就可以界定一個(gè)數(shù)據(jù)倉庫的大致系統(tǒng)邊界,集中精力進(jìn)行主要部分的開發(fā)。因而,界定邊界的工作也可看作是數(shù)據(jù)倉庫系統(tǒng)設(shè)計(jì)的需求分析,因?yàn)樗鼘Q策者的數(shù)據(jù)分析的需求用系統(tǒng)邊界的定義形式反映出來。例如,以某個(gè)超市的數(shù)據(jù)倉庫設(shè)計(jì)為例。由于超市的業(yè)務(wù)需求,已經(jīng)建立了一些分散的數(shù)據(jù)庫,分別處理各自的業(yè)務(wù),各個(gè)數(shù)據(jù)庫是按照各個(gè)部門的具體需求建立起來的,這樣的組織是的數(shù)據(jù)各自為政、缺乏全局性,管理層想要在這些數(shù)據(jù)庫的基礎(chǔ)上得到一些全局報(bào)表,進(jìn)行一些分析工作是比較困難的。因此

3、,超市的管理層決定要在原有的數(shù)據(jù)庫系統(tǒng)基礎(chǔ)上建立一個(gè)數(shù)據(jù)倉庫。為實(shí)現(xiàn)該數(shù)據(jù)倉庫的概念模型的定義,首先需要分析用戶的決策需求,其次,分析為實(shí)現(xiàn)這些決策分析,數(shù)據(jù)倉庫應(yīng)該提供哪些信息。1、數(shù)據(jù)倉庫用戶的決策分析從決定數(shù)據(jù)倉庫的開發(fā)初衷來說,超市管理者最迫切的需求是能更準(zhǔn)確地把握超市商品的銷售情況和庫存情況。為制定一個(gè)較長期的營銷策略,超市經(jīng)營者目前所要進(jìn)行的分析有:客戶的購買趨勢、商品供應(yīng)市場的變化趨勢,供應(yīng)商和客戶的信息用等級等情況。2、支持決策的數(shù)據(jù)需求分析管理決策者完成以上的決策分析,需要商品銷售量、商品采購量、客戶情況和供應(yīng)商情況這樣一些數(shù)據(jù)。3、數(shù)據(jù)需求分析工具為了對數(shù)據(jù)進(jìn)行完整的、規(guī)范

4、的分析,可以采用用戶信息需求表來描述用戶的信息需求狀況。在用戶信息需求表中列出概念模型定義中所確定的數(shù)據(jù)倉庫用戶決策分析問題以及所要的信息。在列出所有需要信息的同時(shí),還要明確這些信息的詳略程度。例如,對客戶購買商品趨勢分析時(shí),可能根據(jù)客戶購買商品時(shí)所在的國家、省、市、街道、商店進(jìn)行分析。此時(shí),應(yīng)將這些不同層次的信息按照層次的高低一次填寫在用戶信息需求表中,并且在所需要的信息名稱后面表明這些信息可能分成多少個(gè)組別,才能滿足決策分析的需要。利用這張表可以為客戶購買商品趨勢分析的主題確定不同的維:時(shí)間、地點(diǎn)和商品等,并且可以進(jìn)一步確定維的層次。表1 用戶信息需求表決策分析問題客戶購買商品趨勢分析需求

5、信息類日期地點(diǎn)商品年齡組經(jīng)濟(jì)狀況信用需求信息1層需求信息2層需求信息3層需求信息4層需求信息5層年(4)季度(16)月(48)國家(15)省(60)城市(200)街道(4800)商店(20000)商品種類(15)商品小類(78)商品(4500)年齡組(8)經(jīng)濟(jì)類(12)信用(10)信息需求單位: 信息需求采集人: 信息需求表填寫時(shí)間:4、CRUD矩陣CRUD矩陣是指利用矩陣的形式來表示各個(gè)不同用戶對不同操作的動(dòng)作行為。其中,C是Creat產(chǎn)生,R是Read引用,U是Update更新,D是Delete刪除。概念模型的定義,不僅需要構(gòu)建一個(gè)ERD模型,還要了解ERD模型中每一個(gè)實(shí)體的誕生與消亡事件

6、。因?yàn)橹挥性趯?shí)體誕生以后,數(shù)據(jù)倉庫才能從數(shù)據(jù)源中獲取關(guān)于這一實(shí)體的數(shù)據(jù)。當(dāng)這個(gè)實(shí)體消亡后,還需要將該實(shí)體的消亡狀況在數(shù)據(jù)倉庫的元數(shù)據(jù)中記錄下來。為了提高系統(tǒng)的處理效率,在業(yè)務(wù)處理系統(tǒng)中常將一些歷史數(shù)據(jù)刪除,但是在數(shù)據(jù)倉庫中這些歷史數(shù)據(jù)卻要保留下來。例如,在銷售業(yè)務(wù)處理系統(tǒng)中,某個(gè)客戶第一次購買商品,系統(tǒng)會(huì)將一些相關(guān)信息記錄在案,但是,某個(gè)已經(jīng)記錄在案的客戶,如果在兩年中沒有訂購商品,就要在業(yè)務(wù)系統(tǒng)中將其置于停頓狀態(tài),如果在三年內(nèi)沒有購買商品,系統(tǒng)將會(huì)刪除該客戶的記錄。而在數(shù)據(jù)倉庫中,該客戶的信息將長期存在,因?yàn)楣芾砣藛T可能需要了解五年中的客戶信息,數(shù)據(jù)倉庫就需要提供銷售情況的五年快照。這些快照

7、的信息包含客戶的第一次訂購時(shí)間、最后一次訂購時(shí)間、目前的狀況等信息。為了獲取這些信息,在數(shù)據(jù)倉庫的高層模型中就需要使用CRUD矩陣反映實(shí)體的生成、引用、更新和刪除狀況。利用CRUD矩陣還可以使數(shù)據(jù)源與數(shù)據(jù)倉庫的聯(lián)系得到確認(rèn)。在CRUD矩陣中使用只描述那些重要的數(shù)據(jù)實(shí)體事件,對并不重要的實(shí)體可以不考慮。在實(shí)體的CRUD時(shí)間中,最重要的是CD事件,因?yàn)镃D事件提供了數(shù)據(jù)倉庫的數(shù)據(jù)源的數(shù)據(jù)質(zhì)量和數(shù)據(jù)完整性信息。同時(shí),CD事件對數(shù)據(jù)倉庫的時(shí)間標(biāo)識機(jī)制會(huì)產(chǎn)生較大的影響;而U事件對數(shù)據(jù)倉庫的維護(hù)具有重要意義,只有了解了數(shù)據(jù)源的更新狀況,才能確定數(shù)據(jù)倉庫中數(shù)據(jù)的刷新處理。在使用CRUD矩陣進(jìn)行概念模型的分析

8、是,可以了解到數(shù)千種潛在的數(shù)據(jù)倉庫應(yīng)用關(guān)系,這些應(yīng)用將會(huì)產(chǎn)生大量的實(shí)體與功能關(guān)系CRUD矩陣,如表2所示。因此,在使用該矩陣時(shí),一定要和用戶以及業(yè)務(wù)系統(tǒng)的使用人員保持緊密的聯(lián)系,對實(shí)體和功能關(guān)系的CRUD矩陣進(jìn)行仔細(xì)的分析,存照對數(shù)據(jù)倉庫真正有用的數(shù)據(jù)源。表2 實(shí)體與功能關(guān)系CRUD矩陣用戶訂單產(chǎn)品銷售代表供貨商訂單輸入CRUDCRUDRRURU訂單處理CRUDCRUD產(chǎn)品管理RRRU預(yù)算系統(tǒng)RRRRUR財(cái)務(wù)計(jì)算RURRURR制造控制RRUCRUD后勤管理RRURRU生產(chǎn)控制RU5、企業(yè)業(yè)務(wù)處理系統(tǒng)數(shù)據(jù)存儲(chǔ)表數(shù)據(jù)倉庫分析人員在數(shù)據(jù)倉庫的概念模型定義中還要了解組織現(xiàn)行業(yè)務(wù)處理系統(tǒng)的數(shù)據(jù)存儲(chǔ)方式,從中找到數(shù)據(jù)倉庫的數(shù)據(jù)映射源的物理狀況,這對數(shù)據(jù)倉庫的創(chuàng)建與刷新十分重要。因此,需要使用數(shù)據(jù)存儲(chǔ)模式表,如表3所示,將所有的數(shù)據(jù)源存儲(chǔ)模式列出。數(shù)據(jù)存儲(chǔ)表的第一列給出組織現(xiàn)有的各種業(yè)務(wù)處理系統(tǒng),其他列為這些業(yè)務(wù)處理系統(tǒng)中數(shù)據(jù)的存儲(chǔ)模式。根據(jù)這張表,數(shù)據(jù)倉庫設(shè)計(jì)人員還需要對每個(gè)數(shù)據(jù)源進(jìn)行分析:這些數(shù)據(jù)源存儲(chǔ)模式的管理者是否能為數(shù)據(jù)倉庫的建設(shè)提供某種程度的支持?客戶/服務(wù)器之間的聯(lián)接通過那種通信協(xié)議予以支持?數(shù)據(jù)源的存儲(chǔ)模式使用哪些數(shù)據(jù)操作語言?在了解這些情況后,數(shù)據(jù)倉庫設(shè)計(jì)人員可將數(shù)據(jù)倉庫與特定的業(yè)務(wù)處理系統(tǒng)中的數(shù)據(jù)源成功地聯(lián)結(jié)在一起。在了解組織現(xiàn)有的數(shù)據(jù)源的存儲(chǔ)模式時(shí),還要了解現(xiàn)有業(yè)務(wù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論