1了解數(shù)據(jù)庫及其管理系統(tǒng)的相關(guān)概念_第1頁
1了解數(shù)據(jù)庫及其管理系統(tǒng)的相關(guān)概念_第2頁
1了解數(shù)據(jù)庫及其管理系統(tǒng)的相關(guān)概念_第3頁
1了解數(shù)據(jù)庫及其管理系統(tǒng)的相關(guān)概念_第4頁
1了解數(shù)據(jù)庫及其管理系統(tǒng)的相關(guān)概念_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

學(xué)習(xí)目標(biāo)

?

了解數(shù)據(jù)庫及其管理系統(tǒng)的相關(guān)概念

?

熟悉數(shù)據(jù)倉庫的定義和特征

?

熟悉數(shù)據(jù)倉庫和數(shù)據(jù)庫、OLTP的主要區(qū)別

?

熟悉數(shù)據(jù)倉庫的開發(fā)流程及開發(fā)過程中應(yīng)該注意

?

學(xué)會分析思考如何構(gòu)建基于數(shù)據(jù)倉庫的DSS

淘寶網(wǎng)數(shù)據(jù)倉庫項目投資的

決策

?

假如說你現(xiàn)在就是淘寶網(wǎng)的財務(wù)總監(jiān),當(dāng)時該項目方案的

申請

和投資工作由你來負(fù)責(zé)。結(jié)合淘寶網(wǎng)的案例資料

和你對數(shù)據(jù)庫、數(shù)據(jù)倉庫的理解,

該項目前的決策思考重點。

你在

決定投資

解讀亞馬遜成功三法則改

戶數(shù)據(jù)

?

結(jié)合亞馬遜公司業(yè)務(wù)特點和給定的案例資料,

馬遜公司對數(shù)據(jù)庫、數(shù)據(jù)倉庫的要求,以及在構(gòu)建數(shù)據(jù)庫

和數(shù)據(jù)倉庫時的決策思考重點。

Sybase數(shù)據(jù)倉庫解決方案招商

應(yīng)用案例

為什么要應(yīng)用Sybase數(shù)據(jù)倉庫?

?

招商

Sybase數(shù)據(jù)倉庫主要應(yīng)用于招商

?

業(yè)務(wù)的哪些方面?

?

?

招商

對數(shù)據(jù)倉庫應(yīng)用系統(tǒng)的需求主要集中哪些方面?

Sybase數(shù)據(jù)倉庫應(yīng)用設(shè)計方案

簡單介紹招商

?

招商

數(shù)據(jù)倉庫系統(tǒng)實現(xiàn)了哪些功能?

數(shù)據(jù)庫術(shù)語

1.

2.表

?

?

?

?

?

?

數(shù)據(jù)庫

列和數(shù)據(jù)類型

主鍵

查詢和索引

查詢是人們用各種SQL指令構(gòu)造出來的,SQL指令負(fù)責(zé)具體完成篩選和提取結(jié)果數(shù)據(jù)的工作。

索引(index)是一種輔助性的數(shù)據(jù)表,它們只包含一種信

息:原始數(shù)據(jù)

的排序情況。

數(shù)據(jù)庫系統(tǒng)

?

數(shù)據(jù)庫系統(tǒng)是一個實際可運行的

和應(yīng)用系

統(tǒng)提供數(shù)據(jù)的

理系統(tǒng)的集合體。

系統(tǒng),是

介質(zhì)、處理對象和管

?

它通常由

、數(shù)據(jù)庫和數(shù)據(jù)管理員組成。

主要包括操作系統(tǒng)、各種宿主語言、實用程序以及數(shù)據(jù)

庫管理系統(tǒng)。

數(shù)據(jù)庫由數(shù)據(jù)庫管理系統(tǒng)

管理,數(shù)據(jù)的

、修改和檢

索均要通過數(shù)據(jù)庫管理系統(tǒng)進(jìn)行。

數(shù)據(jù)管理員負(fù)責(zé)創(chuàng)建、

整個數(shù)據(jù)庫,使數(shù)據(jù)能被

任何

使用的人有效使用。

數(shù)據(jù)庫管理系統(tǒng)

數(shù)據(jù)庫管理系統(tǒng)(DatabaseManagementSystem)是一

?

和管理數(shù)據(jù)庫的大型

數(shù)據(jù)庫,簡稱DBMS。

,是用于建立、使用和

?

對數(shù)據(jù)庫進(jìn)行

的管理和控制,以保證數(shù)據(jù)庫的安全

性和完整性。用戶通過DBMS

數(shù)據(jù)庫中的數(shù)據(jù),數(shù)

據(jù)庫管理員也通過DBMS進(jìn)行數(shù)據(jù)庫的

工作。

?

提供多種功能,可使多個應(yīng)用程序和用戶用不同的方法

在同時或不同時刻去建立,修改和詢問數(shù)據(jù)庫。

數(shù)據(jù)倉庫的產(chǎn)生

?

隨著數(shù)據(jù)庫和信息系統(tǒng)的應(yīng)用,企業(yè)的日常經(jīng)營運轉(zhuǎn)越來

越依賴于信息系統(tǒng)中收集的數(shù)據(jù)和信息,大多數(shù)公司目前

的系統(tǒng)都收集了海量的業(yè)務(wù)數(shù)據(jù),在一定時間后,這些歷

史數(shù)據(jù)也被從業(yè)務(wù)數(shù)據(jù)庫中轉(zhuǎn)移到了備份系統(tǒng)中,但是,

這些數(shù)據(jù)并不便于用戶進(jìn)行深入的數(shù)據(jù)分析,難以支持用

戶做出有效的決策。

一些新的需求也隨之產(chǎn)生。從大量數(shù)據(jù)中提取(檢索、查詢

?

等)制定市場策略的信息就顯得越來越重要了。

數(shù)據(jù)倉庫的產(chǎn)生

這種需求既要求聯(lián)機服務(wù),又涉及大量用于決策的數(shù)據(jù),

?

傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)已

這種需求。

1歷史數(shù)據(jù)量很大。

2輔助決策信息涉及許多部門的數(shù)據(jù),而不同系統(tǒng)的數(shù)據(jù)難以集成。

3由于

降。

數(shù)據(jù)的能力

,它對大量數(shù)據(jù)的

性能明顯下

?

為了更好的管理數(shù)據(jù),保持?jǐn)?shù)據(jù)的一致性,從企業(yè)整體的

角度分析使用數(shù)據(jù),數(shù)據(jù)倉庫的概念被提了出來。

為什么要構(gòu)建數(shù)據(jù)倉庫

數(shù)據(jù)倉庫的目的是為了收集盡可能多的信息,用作公司的決策支持。

數(shù)據(jù)倉庫是一種把收集的數(shù)據(jù)轉(zhuǎn)變成有意義信息的技術(shù),

?

?

采用特定工具進(jìn)行

放在數(shù)據(jù)倉庫中。

后的數(shù)據(jù)往往以一種特定的格式存

?

數(shù)據(jù)倉庫通過使用多部進(jìn)程來執(zhí)行,這些進(jìn)程包括收集數(shù)

據(jù)、過濾數(shù)據(jù)和

告應(yīng)用程序中。

數(shù)據(jù),以便把這些數(shù)據(jù)用在分析和報

?

數(shù)據(jù)倉庫中的數(shù)據(jù)可以來源于不同的數(shù)據(jù)源,如不同的數(shù)

據(jù)庫、不同的操作系統(tǒng)。

數(shù)據(jù)倉庫的概念

W.H.

on的定義為:數(shù)據(jù)倉

?

數(shù)據(jù)倉庫領(lǐng)域的

庫是支持管理決策過程的、面向

的、集成的、時

變的、非易失的數(shù)據(jù)集合。

(1)面向

(2)集成(

(SubjectOriented)的數(shù)據(jù)集合

egrated)的數(shù)據(jù)集合

時變(TimeVariant)的數(shù)據(jù)集合

非易失(Nonvolatile)的數(shù)據(jù)集合

數(shù)據(jù)倉庫的特性

?

1.面向

:以用戶需要的方式組織

不同于面向功能的各種應(yīng)用程序,數(shù)據(jù)倉庫面向與決策支持

只需要考慮數(shù)據(jù)建模以及數(shù)據(jù)庫的設(shè)計,無需顧及過程的設(shè)計

數(shù)據(jù)之間相互聯(lián)系

數(shù)據(jù)倉庫的特性

?

2.數(shù)據(jù)集成:所有的名稱和

都進(jìn)行了

數(shù)據(jù)倉庫中所有的數(shù)據(jù)都是整合的,是通過管理命名、度量屬性、

精確度和一般集合體的一致性

來的

涉及應(yīng)用程序的時候,對變量

名是

的,但是,一旦那些

與應(yīng)用程序相聯(lián)系的數(shù)據(jù)庫裝載入數(shù)據(jù)倉庫時,采用什么命名方

式就必須進(jìn)行確定了,需要使用

名方式進(jìn)行轉(zhuǎn)換

數(shù)據(jù)整合的另一個結(jié)果是對于不同數(shù)據(jù)庫中相似的數(shù)據(jù)建立

,不僅僅要對裝入的數(shù)據(jù)進(jìn)行

,而且還要對最終

數(shù)據(jù)

數(shù)據(jù)倉庫的特性

?

3.時變——時間變量:不是當(dāng)前的數(shù)據(jù),而是時間序列

數(shù)據(jù)

數(shù)據(jù)的時間變量有不同的表示方法

數(shù)據(jù)的時間跨度比較長(5-10年),應(yīng)用系統(tǒng)中的時間跨度是當(dāng)前的或80-90天內(nèi)

另一個顯示時間變量的地方是

顯式或隱式的包含時間變量

的主鍵,每個主鍵或

數(shù)據(jù)一旦被

,將不可更改和變化

數(shù)據(jù)倉庫的特性

?

4.非易失——即穩(wěn)定、不可變性:只以只讀的方式存

儲,不隨時間變化

在數(shù)據(jù)倉庫中只有兩種數(shù)據(jù)操作方法:數(shù)據(jù)裝載和數(shù)據(jù)

,以保證數(shù)據(jù)不可更改和更新

應(yīng)用設(shè)計,第三范式要求,無需

所有可能的數(shù)據(jù)

數(shù)據(jù)倉庫,

著很多操作數(shù)據(jù)中沒有的計算結(jié)果和概括

信息,非常有用

數(shù)據(jù)倉庫的特性

?

5.綜合的:操作型數(shù)據(jù)

為制定決策可以使用的格式

?

6.海量的:時間序列數(shù)據(jù)集一般數(shù)據(jù)量很大

?

7.元數(shù)據(jù):關(guān)于數(shù)據(jù)

的數(shù)據(jù)

?

8.數(shù)據(jù)源:數(shù)據(jù)來自

和外部的

過整合的操作

型系統(tǒng)

數(shù)據(jù)倉庫的類型

?

企業(yè)數(shù)據(jù)倉庫為通用數(shù)據(jù)倉庫,它既

詳細(xì)的數(shù)

據(jù),也

累贅的或

的數(shù)據(jù),這些數(shù)據(jù)具有不

易改變性和面向歷史性。

?

操作型數(shù)據(jù)庫

與企業(yè)數(shù)據(jù)倉庫EDW相比較,ODS有下列特點:ODS是

和面向綜合的;ODS是易變的;ODS僅僅含有目前的、

詳細(xì)的數(shù)據(jù),不含有累計的、歷史性的數(shù)據(jù)。

?

數(shù)據(jù)集市是數(shù)據(jù)倉庫的一種具體化,它可以包含輕度累

計、歷史的部門數(shù)據(jù),適合特定企業(yè)中某個部門的需要。

幾組數(shù)據(jù)集市可以組成一個企業(yè)數(shù)據(jù)倉庫。

數(shù)據(jù)倉庫環(huán)境

組織的遺留系統(tǒng)和系統(tǒng)外部相關(guān)數(shù)據(jù)的主要數(shù)據(jù)來源。

?

是數(shù)據(jù)倉庫和數(shù)據(jù)集市

?

數(shù)據(jù)在不同數(shù)據(jù)

中傳輸?shù)臅r候,進(jìn)行一個

和轉(zhuǎn)化的過

程,從而

整合到數(shù)據(jù)倉庫中。

?

系統(tǒng)還收集元數(shù)據(jù),并與數(shù)據(jù)倉庫的數(shù)據(jù)相關(guān)聯(lián),使?jié)撛诘挠脩?/p>

能夠知道數(shù)據(jù)倉庫中數(shù)據(jù)的來源和特性。

?

從數(shù)據(jù)倉庫或數(shù)據(jù)集市中產(chǎn)生一個或多個個人數(shù)據(jù)倉庫,應(yīng)用于

獨立分析。

?

元數(shù)據(jù):數(shù)據(jù)的數(shù)據(jù),描述數(shù)據(jù)倉庫中

了什么樣的數(shù)據(jù)、存

儲的位置,如何獲得數(shù)據(jù)等燈方面的內(nèi)容。

?

元數(shù)據(jù)是數(shù)據(jù)倉庫的

,它用于

數(shù)據(jù)模型和定義數(shù)據(jù)結(jié)構(gòu)、

轉(zhuǎn)換規(guī)劃、倉庫結(jié)構(gòu)、控制信息等。

數(shù)據(jù)倉庫環(huán)境

操作型數(shù)據(jù)

?

(ODS)

數(shù)據(jù)倉庫環(huán)境中最基本的組成部分

每天

各種應(yīng)用程序的數(shù)據(jù)

為數(shù)據(jù)倉庫提供必需的原始數(shù)據(jù)

數(shù)據(jù)組織形式是面

象的(顧客、產(chǎn)品、訂單、政策

等)、易變的、近期的

ODS通常來源于一個或多個遺留系統(tǒng)

遺留系統(tǒng)在企業(yè)中廣泛存在,主要是指那些過時或存在問題的計算機系統(tǒng)

為了能夠用于分析,都必須進(jìn)一步整合到數(shù)據(jù)倉庫中

數(shù)據(jù)集市

?

以數(shù)據(jù)倉庫為基礎(chǔ)的決策支持環(huán)境,要求數(shù)據(jù)倉庫能夠滿足所有最終用戶的

需求。然而,

不同最終用戶的需求側(cè)重點是不同的,這就要求數(shù)據(jù)倉庫

的數(shù)據(jù)要具有充

分的靈活性,以能夠適應(yīng)各類用戶的查詢和分析;

最終用戶對信息檢索要求是高性能—越快越好。但是,對數(shù)據(jù)倉庫而言,靈活

體—要保障靈活性以滿足盡可能多用戶的查詢需

性和性能(速度)是一對

求會影響整個數(shù)據(jù)倉庫的性能

?

為了解決靈活性和性能之間的

,數(shù)據(jù)倉庫體系結(jié)構(gòu)中增加了數(shù)據(jù)集市一

種小型的部門或工作組級別的數(shù)據(jù)倉庫。

?

數(shù)據(jù)集市

為特定用戶預(yù)先計算好的數(shù)據(jù),從而滿足用戶對性能的需求。

數(shù)據(jù)集市

適用于各個公司的、小型的、低成本的數(shù)據(jù)倉庫

?

?

常被視為開發(fā)數(shù)據(jù)倉庫的

法,直接向一個獨立

的數(shù)據(jù)使用者提供數(shù)據(jù)更為容易

?

不能夠從企業(yè)的范

個信息孤島

內(nèi)進(jìn)行規(guī)劃,數(shù)據(jù)集市成為一個

?

如果在整個企業(yè)的層次上構(gòu)筑,可以提供低成本的數(shù)

據(jù)

并不斷擴大發(fā)展成為整個的數(shù)據(jù)倉庫環(huán)境

元數(shù)據(jù)——數(shù)據(jù)的數(shù)據(jù)

元數(shù)據(jù)是關(guān)于數(shù)據(jù)的簡單數(shù)據(jù),也就是說,是關(guān)于數(shù)據(jù)

?

倉庫的信息,而不是數(shù)據(jù)倉庫內(nèi)

的信息

?

元數(shù)據(jù)是

明的抽象

次的數(shù)據(jù),為

提供對低層次數(shù)據(jù)的簡

?

數(shù)據(jù)倉庫中的數(shù)據(jù)不論是不是元數(shù)據(jù)都是不可更新的。

數(shù)據(jù)倉庫中數(shù)據(jù)的每一次增加,元數(shù)據(jù)都會進(jìn)行擴展

為了描述數(shù)據(jù)倉庫中大量的元素,元數(shù)據(jù)必須組織為精確的、前后對照的方式

?

元數(shù)據(jù)——數(shù)據(jù)的數(shù)據(jù)

數(shù)據(jù)倉庫中存了什么表、屬性和鍵

?

?

?

?

?

?

?

?

每一個數(shù)據(jù)集合的來源是什么

在數(shù)據(jù)裝載入庫時使用的什么轉(zhuǎn)換邏輯

元數(shù)據(jù)如何隨時間變化

數(shù)據(jù)的別名是什么以及數(shù)據(jù)之間的關(guān)系如何

技術(shù)和業(yè)務(wù)過程的關(guān)聯(lián)是什么

數(shù)據(jù)重載的頻率是多少

數(shù)據(jù)倉庫

有多少數(shù)據(jù)元素

數(shù)據(jù)倉庫的其他重要概念

?

數(shù)據(jù)倉庫的邏輯結(jié)構(gòu)和物理結(jié)構(gòu)

邏輯結(jié)構(gòu)數(shù)據(jù)由3層到4層數(shù)據(jù)組成,它們均由元數(shù)據(jù)

(MetaData)組織而成。

數(shù)據(jù)庫組織形式(空間超立方體形式)

物理

形式有

和基于關(guān)系數(shù)據(jù)庫組織形式(由關(guān)系型事實表和維表組成)。

數(shù)據(jù)倉庫的其他重要概念

數(shù)據(jù)倉庫系統(tǒng)(DWS)由數(shù)據(jù)倉庫、倉庫管理和分析工具三部分組成。

(1)數(shù)據(jù)倉庫:數(shù)據(jù)倉庫的數(shù)據(jù)來源于多個數(shù)據(jù)源,包括企業(yè)

?

?

數(shù)據(jù)、市場

及各種文檔之類的外部數(shù)據(jù)。

(2)倉庫管理:在確定數(shù)據(jù)倉庫信息需求后,首先進(jìn)行數(shù)據(jù)建模,

?

然后確定從數(shù)據(jù)源到數(shù)據(jù)倉庫的數(shù)據(jù)抽取、

和轉(zhuǎn)換過程,最后

劃分維數(shù)及確定數(shù)據(jù)倉庫的物理

結(jié)構(gòu)。倉庫管理包括對數(shù)據(jù)的

、恢復(fù)等工作,這些工作需要利

安全、歸檔、備份、

用數(shù)據(jù)庫管理系統(tǒng)(DBMS)的功能。

(3)分析工具:用于完成實際決策問題所需的各種查詢檢索工具、數(shù)據(jù)的OLAP分析工具、數(shù)據(jù)開采DM工具等,以實現(xiàn)決策支持

系統(tǒng)的各種要求。

?

數(shù)據(jù)倉庫的其他重要概念

數(shù)據(jù)倉庫應(yīng)用的C/S結(jié)構(gòu)形式

?

兩層結(jié)構(gòu):客戶端的工作包括客戶交互、格式化查詢及

結(jié)果和報表生成等,服務(wù)器端完成各種輔助決策的SQL查

詢、復(fù)雜的計算和各類綜合功能等。

三層結(jié)構(gòu):在客戶與服務(wù)器之間增加一個

數(shù)據(jù)分析服

務(wù)器。該服務(wù)器能加強和規(guī)范決策支持的服務(wù)工作,集中

和簡化原客戶端和DW服務(wù)器的部分工作,降低系統(tǒng)數(shù)據(jù)傳輸量,因此工作效率更高。

數(shù)據(jù)倉庫體系的組成

數(shù)據(jù)倉庫體系的組成

?

操作和外部數(shù)據(jù)庫層:數(shù)據(jù)倉庫的數(shù)據(jù)源,用戶不必考慮

數(shù)

據(jù)庫的操作

應(yīng)用的執(zhí)行過程

?

信息

層:直接與最終用戶打交道的一層,最終用戶用來提取

和分析數(shù)據(jù)倉庫中數(shù)據(jù)的工具

?

數(shù)據(jù)

層:連接操作型信息

層與數(shù)據(jù)倉庫本身的一個接

,包括數(shù)據(jù)倉庫所涉及的不同的數(shù)據(jù)庫,為數(shù)據(jù)倉庫用戶

數(shù)據(jù)提供方便

?

元數(shù)據(jù)層:為實現(xiàn)通用的數(shù)據(jù)

服務(wù)

數(shù)據(jù)倉庫體系的組成

過程管理層:主要著重于調(diào)度數(shù)據(jù)倉庫的建立以及元數(shù)據(jù)的所必需的各種任務(wù)

?

?

應(yīng)用消息發(fā)送層:

用于在計算機網(wǎng)絡(luò)中傳遞信息

不僅包括網(wǎng)絡(luò)協(xié)議和請求路由的功能,還可以使得操作和信息的

應(yīng)用于數(shù)據(jù)的格式相

可視作數(shù)據(jù)倉庫底層的傳輸系統(tǒng)

?

物理數(shù)據(jù)倉庫層:數(shù)據(jù)實際

據(jù)

的地方,包括虛擬的和本地的數(shù)

?

數(shù)據(jù)分段

層:包括選擇、編輯、小結(jié)、合并以及從操作性和

/或外部數(shù)據(jù)庫中裝載數(shù)據(jù)倉庫和信息

數(shù)據(jù)的所有過程

數(shù)據(jù)庫、OLTP和數(shù)據(jù)倉庫

?

數(shù)據(jù)庫與數(shù)據(jù)倉庫的內(nèi)在

業(yè)務(wù)為例。數(shù)據(jù)庫是事務(wù)系統(tǒng)的數(shù)據(jù)

,客戶在

做的每筆交易都會寫入數(shù)據(jù)庫,被

下來,這里,可以簡單

地理解為用數(shù)據(jù)庫記賬。數(shù)據(jù)倉庫是分析系統(tǒng)的數(shù)據(jù)

,它

從事務(wù)系統(tǒng)獲取數(shù)據(jù),并做匯總、加工,為決策者提供決策的

依據(jù)。比如,分析某

當(dāng)前存款余額是多少。

OLTP與數(shù)據(jù)倉庫

某分行一個月發(fā)生多少交易,該分行

?

程序大部分都屬于不是很復(fù)雜的數(shù)據(jù)庫,但是完全可以

將其看作一個在單用戶環(huán)境下的OLTP(

事務(wù)處理系統(tǒng))

數(shù)據(jù)的操作CRUD(創(chuàng)建、

簡單示例。它使用了所有的所謂

、更新、刪除)。當(dāng)數(shù)據(jù)會幾乎保持不變,因為可以從

達(dá)到一定量的時候,規(guī)模就

中刪除過期數(shù)據(jù)。

區(qū)

數(shù)據(jù)倉庫的開發(fā)

數(shù)據(jù)倉庫的開發(fā)流程

?

啟動工程

建立技術(shù)環(huán)境

確定

進(jìn)行數(shù)據(jù)建模

設(shè)計數(shù)據(jù)倉庫中的數(shù)據(jù)庫

數(shù)據(jù)轉(zhuǎn)換程序管理元數(shù)據(jù)

開發(fā)用戶決策的數(shù)據(jù)分析工具

管理數(shù)據(jù)倉庫環(huán)境

數(shù)據(jù)倉庫的開發(fā)

數(shù)據(jù)倉庫開發(fā)工具

?

1.?dāng)?shù)據(jù)

一般的數(shù)據(jù)庫系統(tǒng)中有可能存在著大量的噪聲數(shù)據(jù),引起的主要原

因有

縮寫詞、慣用語、數(shù)據(jù)輸入錯誤、重復(fù)

、丟失值、拼

寫變化等等。

為了清除噪聲數(shù)據(jù),必須對數(shù)據(jù)庫系統(tǒng)中的相關(guān)數(shù)據(jù)進(jìn)行

。

2.ETL工具

ETL是指數(shù)據(jù)抽取(Extract)、轉(zhuǎn)換(Transform)、裝載

(Load)的過程,它是構(gòu)建數(shù)據(jù)倉庫的重要環(huán)節(jié)。

整個ETL過程基本是通過控制用SQL語句編寫的

過程和函數(shù)的

方式來實現(xiàn)對數(shù)據(jù)的直接操作,SQL語句的效率將直接影響到數(shù)據(jù)

倉庫

的性能。

數(shù)據(jù)倉庫的開發(fā)

在實施數(shù)據(jù)倉庫過程中應(yīng)避免的11個錯誤

?

1.錯誤的項目發(fā)起

2、制訂了不可能完成的目標(biāo)

3、犯政治幼稚病

4、把所有能找到的數(shù)據(jù)全都放到數(shù)據(jù)倉庫中

5、認(rèn)為設(shè)計數(shù)據(jù)倉庫就是設(shè)計事務(wù)數(shù)據(jù)庫

6、選擇一個面向技術(shù)的而不是面向用戶的人做數(shù)據(jù)倉庫項目經(jīng)理

7、只專注傳統(tǒng)的

關(guān)系型數(shù)據(jù),而忽略外部數(shù)據(jù)、文本、圖像、甚

至聲音、

數(shù)據(jù)

8、用交疊的或

的數(shù)據(jù)定義交付數(shù)據(jù)

9、相信軟硬件供應(yīng)商對性能、能力和可擴展性的承諾

10、相信一旦數(shù)據(jù)倉庫建立起來并開始運行,你的任務(wù)就完成了

11、專注于動態(tài)生成查詢、數(shù)據(jù)挖掘和定期生成報表

構(gòu)建基于數(shù)據(jù)倉庫的決策支持系統(tǒng)

DSS的

?

(1)DDS使用的數(shù)據(jù)庫(DB)只能對原始數(shù)據(jù)進(jìn)行一般的

,難以滿足DDS的需要。

加工和匯總,致使決策所需信息

(2)由于決策本身的動態(tài)性和復(fù)雜性,針對不同的情況應(yīng)有不同的處理方法,而模型庫提供的分析能力有限,它所提供的模型獨立于環(huán)境之外,決策者和模型交互很少,模型參數(shù)固定不變,不符合決策要求,DDS作出的決策常被有經(jīng)驗

的決策者一口否定,使決策者對DDS產(chǎn)生不信任感。

(3)在實際開發(fā)DDS過程中,人機接口

占整個DDS開

發(fā)工作量的一半,人的任何意圖及系統(tǒng)對人的任何支持都要

通過人機接口才能最終實現(xiàn)?,F(xiàn)在人機接口開發(fā)得不理想,可以說是DDS實施中的一個瓶頸。

構(gòu)建基于數(shù)據(jù)倉庫的決策支持系統(tǒng)

DSS因數(shù)據(jù)倉庫而實現(xiàn)了突破

?

一般決策所需的數(shù)據(jù)總是與一些維數(shù)(每一維代表對數(shù)據(jù)的

一個特定的觀察視角,如地區(qū)、時間等)和不同級別(如部

門、

、地區(qū)和國家)的統(tǒng)計和計算有關(guān),以

數(shù)據(jù)分析是決策的主要內(nèi)容。

數(shù)據(jù)為

特征滿足DDS對數(shù)據(jù)的分析要求,并且克服

數(shù)據(jù)倉庫的

數(shù)據(jù)庫的數(shù)據(jù)組織性差、利用率低的缺點。

構(gòu)建基于數(shù)據(jù)倉庫的決策支持系統(tǒng)

如何建立數(shù)據(jù)倉庫

?

建立一個數(shù)據(jù)倉庫需要經(jīng)過以下幾個處理過程:數(shù)據(jù)倉庫設(shè)計、

數(shù)據(jù)抽取、數(shù)據(jù)管理。

1.?dāng)?shù)據(jù)倉庫設(shè)計

(1)根據(jù)決策

設(shè)計數(shù)據(jù)倉庫結(jié)構(gòu),一般采用星型模型和雪花

模型設(shè)計其數(shù)據(jù)模型,在設(shè)計過程中應(yīng)保證數(shù)據(jù)倉庫的規(guī)范化和體系各元素的必要聯(lián)系。主要有以下3個步驟:

(1)定義該

所需各數(shù)據(jù)源的詳細(xì)情況,包括所在計算機

、

擁有者、數(shù)據(jù)結(jié)構(gòu)、使用該數(shù)據(jù)源的處理過程、倉庫更新計劃等。

(2)定義數(shù)據(jù)抽取原則,以便從每個數(shù)據(jù)源中抽取所需數(shù)據(jù);定

義數(shù)據(jù)如何轉(zhuǎn)換、裝載到

的哪個數(shù)據(jù)表中。

(3)將一個

細(xì)化為多個業(yè)務(wù)

,形成

表,據(jù)此從數(shù)據(jù)

倉庫中選出多個數(shù)據(jù)子集,即數(shù)據(jù)集市。數(shù)據(jù)集市通常針對部門級的決策或某個特定業(yè)務(wù)需求,它開發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論