數據倉庫設計_第1頁
數據倉庫設計_第2頁
數據倉庫設計_第3頁
數據倉庫設計_第4頁
數據倉庫設計_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據倉庫設計內容提要數據倉庫的開發(fā)過程數據倉庫設計步驟數據倉庫的概念設計概念設計步驟星型模型數據倉庫的開發(fā)與數據庫應用系統的開發(fā)過程相比,有如下幾方面不同:面向的處理類型不同;面向的需求不同;系統設計的目標不同;兩者的數據來源或系統的輸入不同;系統設計的方法和步驟不同;數據庫應用開發(fā)過程——SDLC數據倉庫的開發(fā)過程——CLDS數據倉庫開發(fā)的特點:數據驅動數據驅動:從已有數據出發(fā)的數據倉庫設計方法稱為“數據驅動”的系統設計方法。

利用以前所取得的工作成果不再是面向應用利用數據模型數據模型是聯系操作型數據環(huán)境的設計、數據倉庫數據環(huán)境的設計、操作型數據處理應用的開發(fā)和設計以及DSS應用的開發(fā)與設計的紐帶

規(guī)劃分析階段

數據倉庫開發(fā)過程設計實施使用維護階段階段

數據倉庫的螺旋式開發(fā)方法數據倉庫實現策略開發(fā)策略主要有:自頂向下:實際應用比較困難。自底向上:用于一個數據集市或一個部門的數據倉庫開發(fā),容易獲得成功。兩種策略的聯合使用:能夠快速地完成數據倉庫的開發(fā)與應用,而且還可以建立具有長遠價值的數據倉庫方案。在實際使用中難以操作。數據倉庫的結構數據倉庫的應用結構基于業(yè)務處理系統的數據倉庫單純數據倉庫單純數據集市數據倉庫和數據集市數據倉庫的技術平臺結構單層結構客戶/服務器兩層結構三層客戶/服務器多層式結構數據倉庫使用方案和項目規(guī)劃預算數據倉庫使用方案最終用戶的決策支持要求數據倉庫的技術要求開發(fā)方案的預算進行估計編制數據倉庫開發(fā)說明書說明系統與企業(yè)戰(zhàn)略目標的關系,系統與企業(yè)急需處理的、范圍相對有限的開發(fā)機會。業(yè)務機會的說明以及任務概況說明、重點支持的職能部門和今后工作的建議。計劃中需要闡明期望取得的有形和無形利益規(guī)劃書中要確定數據倉庫的開發(fā)目標實現范圍、體系結構和使用方案及開發(fā)預算。數據倉庫的設計步驟數據倉庫的設計步驟1.概念模型設計:界定系統邊界、確定主要的主題域

2.技術準備工作:技術評估和環(huán)境的準備

3.邏輯模型設計:確定要裝載的主題、粒度層次劃分、數據分割策略、關系模式定義和記錄系統定義

數據倉庫的設計步驟4.物理模型設計:確定數據的存儲結構、索引策略、數據存放位置和存儲分配5.數據倉庫生成:設計接口和將數據裝入

6.數據倉庫運行與維護:開發(fā)決策支持系統DSS的應用;進一步理解需求,調整和完善數據倉庫系統,維護數據倉庫;概念模型設計概念模型的設計階段:用戶需求調查模型定義模型分析模型設計概念模型的需求調查數據倉庫開發(fā)的任務書首先要明確用戶的信息需求了解管理人員在信息需求方面的內容了解關于信息的來源組織所使用的系統環(huán)境概念模型的定義數據倉庫用戶的決策分析支持決策的數據需求分析數據需求分析工具:CRUD矩陣C:Create產生;R:Read引用;U:Update更新;D:Delete刪除。例:了解用戶的決策分析問題決策分析問題客戶購買商品趨勢分析需求信息類日期地點商品客戶年齡組客戶經濟狀況客戶信用需求信息1層需求信息2層需求信息3層需求信息4層需求信息5層……年(4)季(16)月(48)……國家(15)省(60)市(200)街道(2100)商店(20000)……商品種類(7)商品小類(40)商品(220)……年齡組(8)……經濟類(10)……信用(10)……實體功能客戶銷售單商品銷售代表供貨商銷售單輸入CRUDCRUDRRURU銷售單處理CRUDCRUD商品管理RRRUR預算系統RRRRUR財務計算RURRURR庫存控制RRUCRUDR后勤RRURRUCRUD矩陣企業(yè)業(yè)務處理系統數據存儲表OracleSysbaseSQLServerVFP其它模式銷售單輸入√√銷售單處理√√商品管理√預算系統√(Excel)財務計算√庫存控制√后勤√外部數據源商品供應商√市場調查公司√概念模型的分析簡單的概念模型的缺陷僅從數據模型的角度,會產生“平面”的效應;實體之間不會是簡單的對等的關系;實體的三維透視某些實體的數據載入量要遠遠大于其他實體;星型模型利用星型模型對要載入大量數據的實體進行管理;產生大量數據的實體處于中央,稱之為事實表;其他實體處于周圍,稱之為維度表;事實表包含了獨有的標識數據,也包含了實體本身的獨有數據;事實表還包含了指向其周圍的表—維表的外鍵;如果非外鍵的信息經常被事實表使用,那么星型連接內的非外鍵信息將會伴隨外鍵的關系共同存在。例:星型模型例子星型模型

星型模型是最常用的數據倉庫設計結構的實現模式。使數據倉庫形成了一個集成系統,為用戶提供分析服務對象。

事實表維度表維度表維度表維度表維度表核心是事實表,圍繞事實表的是維度表。通過事實表將各種不同的維度表連接起來,各個維度表都連接到中央事實表。指標實體(事實實體)指標實體名維度實體名詳細類別實體名維度實體詳細類別實體(引用實體)星型模型中使用的表示方法星型模型文本數據常出現在維表中,數值數據常出現在事實表中;星型連接的好處是為決策支持系統的處理優(yōu)化了數據;數據預連接;建立有選擇的數據冗余;傳統數據模型和星型連接的配合傳統數據模型應用于維表即數據不多的實體;星形連接應用于事實表(即數據量大的實體);文本數據與數值數據數據模型依然是數據倉庫的設計基礎經濟(年收入)100萬以上10萬以上1萬以上1萬以下地點國家省市銷售銷售數量銷售價格銷售金額時間ID地點ID商品ID年齡60歲以上40歲以上30歲以上20歲以上20歲以下日期年月日商品種類ID小類ID商品ID信用10萬元以上1萬元以上1千元以上1千元以下0元概念模型的設計雪花模型雪花模型是對星型模型的擴展,每一個維度都可以向外連接到多個詳細類別表。

雪花模型對星型模型的維度表進一步標準化,對星型模型中的維度表進行了規(guī)范化處理。事實表維度表維度表維度表維度表維度表詳細類別表詳細類別表經濟(年收入)100萬以上10萬以上1萬以上地點國家省市銷售銷售ID銷售數量銷售價格銷售金額時間ID地點ID商品ID年齡60歲以上40歲以上30歲以上20歲以上20歲以下日期年月日商品ID種類小類商品信用10萬元以上1萬元以上1千元以上1千元以下0元商品ID生產

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論