倉(cāng)庫(kù)管理_數(shù)據(jù)倉(cāng)庫(kù)比較oraclevsdb2_第1頁(yè)
倉(cāng)庫(kù)管理_數(shù)據(jù)倉(cāng)庫(kù)比較oraclevsdb2_第2頁(yè)
倉(cāng)庫(kù)管理_數(shù)據(jù)倉(cāng)庫(kù)比較oraclevsdb2_第3頁(yè)
倉(cāng)庫(kù)管理_數(shù)據(jù)倉(cāng)庫(kù)比較oraclevsdb2_第4頁(yè)
倉(cāng)庫(kù)管理_數(shù)據(jù)倉(cāng)庫(kù)比較oraclevsdb2_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)數(shù)數(shù)數(shù)據(jù)據(jù)據(jù)據(jù)倉(cāng)倉(cāng)倉(cāng)倉(cāng)庫(kù)庫(kù)庫(kù)庫(kù)比比比比較較較較 O OOr r ra a ac c cl l le e e v v vs s s D D DB B B2 2 2 1文檔簡(jiǎn)介文檔簡(jiǎn)介 .3 1.1文檔目的 .3 1.2文檔范圍 .3 1.3縮寫約定 .3 1.4參考文檔和文獻(xiàn) .3 1.5文檔概述 .4 2相關(guān)的產(chǎn)品比較相關(guān)的產(chǎn)品比較 .5 2.1數(shù)據(jù)倉(cāng)庫(kù) .5 2.2ETL 工具.5 2.3OLAP.6 2.4展示工具 .6 3開(kāi)發(fā)過(guò)程開(kāi)發(fā)過(guò)程 .7 3.1ORACLE的開(kāi)發(fā)過(guò)程.7 3.2DB2 的開(kāi)發(fā)過(guò)程.7 4應(yīng)用性應(yīng)用性 .7 1文檔文檔簡(jiǎn)簡(jiǎn)介介 1.1文檔目的文檔目的 此文檔,用來(lái)介紹 Oracle 的數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品與 IBM 公司數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品的比較文檔。通 過(guò)本文,使開(kāi)發(fā)團(tuán)隊(duì)及最終使用者對(duì)兩個(gè)數(shù)據(jù)倉(cāng)庫(kù)有初步的認(rèn)識(shí),為數(shù)據(jù)倉(cāng)庫(kù)及相關(guān)產(chǎn)品 的選擇提供依據(jù)。 1.2文檔范文檔范圍圍 所以文中沒(méi)有具體實(shí)施的細(xì)節(jié),適用讀者: 開(kāi)發(fā)人員 項(xiàng)目經(jīng)理 開(kāi)發(fā)經(jīng)理 最終用戶 1.3縮縮寫寫約約定定 縮寫縮寫描述描述 IDSInternet Developer Suite OWBOracle Warehouse Builder 1.4參考文檔和文獻(xiàn)參考文檔和文獻(xiàn) 編編號(hào)號(hào)文檔名稱文檔名稱版本版本日期日期 1 DB2 vs Oracle(BI) 2 Data Warehouse Center Application Integration Guide 8.2 3 1.5文檔概述文檔概述 本文檔主要是從各各角度本文檔主要是從各各角度對(duì)對(duì) ORACLE 的數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)倉(cāng)庫(kù)和和 IBM 的數(shù)據(jù)的數(shù)據(jù)倉(cāng)庫(kù)倉(cāng)庫(kù)的分析的分析,下面就兩方面下面就兩方面 的的產(chǎn)產(chǎn)品做一下品做一下簡(jiǎn)單簡(jiǎn)單的概述的概述: IBM IBM 公司提供了一套基于可視數(shù)據(jù)倉(cāng)庫(kù)的商業(yè)智能(BI)解決方案,包括: Warehouse manager、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB,以及來(lái)自第三方的前端數(shù)據(jù)展現(xiàn)工 具(如 BO)和數(shù)據(jù)挖掘工具(如 SAS)。其中, Warehouse manager 是一個(gè)功能很強(qiáng)的集成環(huán)境, 既可用于數(shù)據(jù)倉(cāng)庫(kù)建模和元數(shù)據(jù)管理,又可用于數(shù)據(jù)抽取、轉(zhuǎn)換、裝載和調(diào)度。Essbase/DB2 OLAP Server 支持“維”的定義和數(shù)據(jù)裝載。Essbase/DB2 OLAP Server 不是 ROLAP(Relational OLAP)服務(wù)器,而是一個(gè)(ROLAP 和 MOLAP)混合的 HOLAP 服務(wù)器,在 Essbase 完成數(shù)據(jù) 裝載后,數(shù)據(jù)存放在系統(tǒng)指定的 DB2 UDB 數(shù)據(jù)庫(kù)中。 嚴(yán)格說(shuō)來(lái),IBM 自己并沒(méi)有提供完整的數(shù)據(jù)倉(cāng)庫(kù)解決方案,該公司采取的是合作伙伴戰(zhàn)略。 也就是說(shuō) IBM 公司在展現(xiàn)和多維分析上留有接口,所有第 3 方的公司可以利用這個(gè)接口來(lái)連 接到 IBM 的系統(tǒng)中提取想要的數(shù)據(jù).例如,它的前端數(shù)據(jù)展現(xiàn)工具可以是 Business Objects 的 BO、Lotus 的 Approach、Cognos 的 Impromptu 或 IBM 的 Query Management Facility;多維分 析工具支持 Arbor Software 的 Essbase 和 IBM(與 Arbor 聯(lián)合開(kāi)發(fā))的 DB2 OLAP 服務(wù)器;統(tǒng) 計(jì)分析工具采用 SAS 系統(tǒng)。 Oracle Oracle 數(shù)據(jù)倉(cāng)庫(kù)解決方案主要包括 OWB 和 Oracle Discoverer 兩個(gè)部分。然而 Express 是和 Oracle 8i 配合使用的 OLAP Server。從 Oracle 9i 開(kāi)始(包括 10g), Oracle 把 OLAP Server 整合進(jìn)了數(shù)據(jù)庫(kù),作為了數(shù)據(jù)庫(kù)的一個(gè)選件,Oracle Express Server 是一個(gè) MOLAP (多維 OLAP)服務(wù)器,它利用多維模型,存儲(chǔ)和管理多維數(shù)據(jù)庫(kù)或多維 高速緩存,同時(shí)也能夠訪問(wèn)多種關(guān)系數(shù)據(jù)庫(kù);OWB(Warehouse builder) 可以完成數(shù)據(jù)倉(cāng)庫(kù) 建模和元數(shù)據(jù)管理,又可用于數(shù)據(jù)抽取、轉(zhuǎn)換、裝載和調(diào)度以及多維模型的建立; Oracle Discoverer 屬于查詢工具是專門為最終用戶設(shè)計(jì)的,分為最終用戶版和管理員版。 Discoverer 是 Oracle 的 OLAP 展示工具,無(wú)需編程。 1.6數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)倉(cāng)庫(kù) ORACLE 采用 Cluster 體系結(jié)構(gòu),多個(gè)節(jié)點(diǎn)共享硬盤,存在磁盤 I/O 瓶頸,可伸縮性較差, 少見(jiàn)超過(guò) 4 個(gè)節(jié)點(diǎn)的實(shí)例。ORACLE 基本上沒(méi)有真正 TB 級(jí)的數(shù)據(jù)倉(cāng)庫(kù),客戶往往被要求將 其海量數(shù)據(jù)分解到多個(gè)數(shù)據(jù)庫(kù)中。 IBM 采用 MPP 體系結(jié)構(gòu),每個(gè)節(jié)點(diǎn)獨(dú)享各自的硬盤空間,各個(gè)節(jié)點(diǎn)間通過(guò)高速網(wǎng)絡(luò)交 換數(shù)據(jù)。可伸縮性強(qiáng),最多可以擴(kuò)充到 1000 個(gè)節(jié)點(diǎn)。國(guó)內(nèi)有 32 節(jié)點(diǎn)的實(shí)例,國(guó)外有 512 節(jié)點(diǎn) 的實(shí)例。每個(gè)數(shù)據(jù)庫(kù)中單個(gè)表的大小可以達(dá)到 512GB*1000=500TB。在全球范圍有許多 TB 級(jí)的數(shù)據(jù)倉(cāng)庫(kù)。 1.7ETL 工具工具 ORACLE 的 ETL 工具使用的是 Oracle Warehouse Builder(OWB),此工具中做維過(guò)程就 是構(gòu)建星形結(jié)構(gòu)的過(guò)程,在作 mapping,執(zhí)行的過(guò)程則是數(shù)據(jù)抽取的過(guò)程,全都用 Oracle warehouse Builder 來(lái)實(shí)現(xiàn)。OWB 全部開(kāi)發(fā)過(guò)程通過(guò)圖形界面完成,對(duì)于簡(jiǎn)單的數(shù)據(jù)轉(zhuǎn)換實(shí)現(xiàn) 簡(jiǎn)單,開(kāi)發(fā)速度快。但是對(duì)于復(fù)雜的轉(zhuǎn)換過(guò)程,由于整個(gè)轉(zhuǎn)換過(guò)程全部都是由工具完成,用戶 不能干涉,導(dǎo)致在轉(zhuǎn)換中一些復(fù)雜查詢速度緩慢,而且沒(méi)有可能優(yōu)化。 IBM Warehouse Manager 是 IBM 數(shù)據(jù)倉(cāng)庫(kù)解決方案的重要組成部分,它主要由以下幾 部分功能組成:數(shù)據(jù)訪問(wèn),數(shù)據(jù)轉(zhuǎn)換,數(shù)據(jù)分布,數(shù)據(jù)存儲(chǔ),靠描述性數(shù)據(jù)查找和理解數(shù)據(jù),顯 示、分析和發(fā)掘數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)換過(guò)程的自動(dòng)化及其管理。它縮短了復(fù)雜的海量數(shù)據(jù)與有洞察力 的商務(wù)決策之間的差距。IBM 的 Warehouse Manager 可獲取的數(shù)據(jù)源可以是 DB2 家族中 的任一數(shù)據(jù)庫(kù),也可以是 Oracle、Sybase、Informix、SQL Server 數(shù)據(jù)庫(kù)和 IMS、VSAM 文件 系統(tǒng);存放數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)可以是 DB2 UDB for Windows NT、OS/2、AIX/600、HP- UX、Sun Solaris、SCO、SINIX 和 DB2/400、DB2 for OS/390;Warehouse Manager 的管理平臺(tái) 為 Windows NT 和 OS/2;而且以上適用的平臺(tái)仍在不斷地?cái)U(kuò)展。 1.8OLAP DB2 OLAP Server 在線分析處理(OLAP)在 IBM 的商務(wù)智能中扮演著重要角色,IBM 為此提供一個(gè)分析工具- -DB2 OLAP Server,深入最終用戶的業(yè)務(wù),對(duì)桌面上的數(shù)據(jù)進(jìn)行實(shí)時(shí)操作。DB2 OLAP Server 是一套獨(dú)特的商務(wù)工具,能夠快速地分布傳統(tǒng)監(jiān)視和報(bào)告范圍之外的應(yīng)用程序數(shù)據(jù)。 IBM DB2 OLAP Server 是一種功能強(qiáng)大的工具,結(jié)合了業(yè)界領(lǐng)先的 Arbor Essbase OLAP 功 能以及 DB2 的可靠性、可管理性和訪問(wèn)能力。Arbor Essbase 是 OLAP 市場(chǎng)領(lǐng)先的廠商。同其 它 OLAP 相比,有更多的前端工具和應(yīng)用程序利用了 Essbase API,使其成為事實(shí)上的業(yè)界 標(biāo)準(zhǔn)。同大多數(shù)基于 SQL 的應(yīng)用程序結(jié)合時(shí),DB2 OLAP Server 和 Warehouse Manager 將 為端用戶提供更多的前端工具和業(yè)務(wù)智能應(yīng)用程序選擇余地。如今,用戶可以享受到多種 OLAP 應(yīng)用程序的優(yōu)勢(shì),如通過(guò) Arbor 的 OLAP 引擎集成預(yù)算功能,充分利用機(jī)構(gòu)在相關(guān) 技術(shù)上的投資,管理基本設(shè)施和 DB2 數(shù)據(jù)。 通過(guò)集成 IBM 的 Warehouse Manager 和 DB2 OLAP Server,這套解決方案將具有三方面的 重要價(jià)值: 完全、自動(dòng)地把 OLAP 集成到數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)抽取和生成自動(dòng)地由規(guī)則和數(shù)據(jù)源 支持,直接進(jìn)入 DB2 OLAP Server 的立方體。 利用 Warehouse Manager OLAP 版本還有一項(xiàng)附加收益,就是在可視化數(shù)據(jù)倉(cāng)庫(kù)上創(chuàng)建了一 個(gè)中間信息倉(cāng)庫(kù)。這個(gè)中間數(shù)據(jù)倉(cāng)庫(kù)包含干凈、抽取的數(shù)據(jù),用來(lái)在 OLAP 系統(tǒng)上裝載多維 數(shù)據(jù)。一旦 OLAP 系統(tǒng)裝載并上線,或者作為干凈數(shù)據(jù)源來(lái)進(jìn)行 OLAP 以外的分析比如查 詢客戶地址等,這些中間數(shù)據(jù)就可以廢棄。 DB2 OLAP Analyzer 使用 DB2 OLAP Analyzer,可以達(dá)到企業(yè)的“商業(yè)智能化“,并提高信息技 術(shù)組織的效率。信息技術(shù)人員可以讓用戶利用分析和報(bào)表的功能獲得他們所需的信息,而不 會(huì)失去對(duì)信息、數(shù)據(jù)完整性、系統(tǒng)性能和系統(tǒng)安全的控制。 1.9展示工具展示工具 Oracle 的展示工具是使用 Oracle 公司的 discover 工具,使用此工具,有某些局限性,實(shí) 現(xiàn)方式不靈活,且需使用專用前端工具,開(kāi)發(fā)復(fù)雜。 IBM 采用業(yè)界領(lǐng)先的多維分析服務(wù)器 OLAP Server 和智能挖掘工具 Intelligent Miner。 開(kāi)放的前端界面和開(kāi)發(fā)接口。 IBM 的展示沒(méi)有特定的工具,而是提供標(biāo)準(zhǔn)的數(shù)據(jù)借口,它可以采取第三方的展現(xiàn)工具, 或者獨(dú)立開(kāi)發(fā)展現(xiàn)工具,比較靈活的實(shí)現(xiàn)前端的展現(xiàn)過(guò)程。 2開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程程 2.1Oracle 的開(kāi)的開(kāi)發(fā)過(guò)發(fā)過(guò)程程 ORACLE 的開(kāi)的開(kāi)發(fā)過(guò)發(fā)過(guò)程主要分程主要分為為兩大部分兩大部分: 1.OWB 開(kāi)開(kāi)發(fā)發(fā) 2.IDS 開(kāi)開(kāi)發(fā)發(fā) ORACLE 9I SOURCEOracle warehouse builder ORACLE 9I TARGETInternet Developer Suite ETL OLAP 展現(xiàn) 一一.OWB 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程程: 1 在開(kāi)發(fā)之前必須先建立 Owb 中的兩個(gè)資料檔案庫(kù),一個(gè)叫 repository,另一個(gè)叫 runtime repository(運(yùn)行時(shí)資料檔案庫(kù)) 。其中 repository 用來(lái)存放 owb 設(shè)計(jì)過(guò)程中的對(duì)象。Runtime repository 用來(lái)存放運(yùn)行所需的數(shù)據(jù),包括元數(shù)據(jù)、映射定義、轉(zhuǎn)換規(guī)則等等。 2 每個(gè)資料檔案庫(kù)都有相應(yīng)的用戶。一般來(lái)說(shuō)至少需要?jiǎng)?chuàng)建四個(gè)用戶:repository 所有者、 runtime repository 所有者、runtime repository 訪問(wèn)者、目標(biāo)數(shù)據(jù)庫(kù)所有者。 3 用所有者用戶登陸到 OWB 以后就可以創(chuàng)建一個(gè)新的 project, 在新的 project 里需要?jiǎng)?chuàng)建 數(shù)據(jù)源(soruce),目標(biāo)庫(kù)(target),位置(location) 4 系統(tǒng)配置完成后,進(jìn)入到開(kāi)發(fā)階段,首先需要制作維表(dimension),此操作的作用是定義出維 表的表結(jié)構(gòu)以及維表的層次.部署的時(shí)候系統(tǒng)會(huì)在目標(biāo)數(shù)據(jù)庫(kù)內(nèi)創(chuàng)建一個(gè)維表(table)用來(lái)存放緯度 數(shù)據(jù). 5 維表定義完成后,需要定義維表對(duì)應(yīng)的映射(mapping),此操作的作用是制定從數(shù)據(jù)源(soruce) 抽取符合那些條件的數(shù)據(jù)放到維表中.在部署的時(shí)候系統(tǒng)會(huì)在目標(biāo)數(shù)據(jù)庫(kù)內(nèi)創(chuàng)建一個(gè)包(package), (維表和維表的 mapping 是一一對(duì)應(yīng)的) 6 所有維表都定義完成后,需要定義事實(shí)表(cube), 此操作的作用是定義出事實(shí)表的表結(jié)構(gòu)以 及事實(shí)表和維表的關(guān)系(也就是星型結(jié)構(gòu)).部署的時(shí)候系統(tǒng)會(huì)在目標(biāo)數(shù)據(jù)庫(kù)內(nèi)創(chuàng)建一個(gè)事實(shí)表 (table)用來(lái)存放度量值. 7.事實(shí)表定義完成后,需要定義事實(shí)表對(duì)應(yīng)的映射(mapping),此操作的作用是制定從數(shù)據(jù)源 (soruce)抽取符合那些條件的數(shù)據(jù)放到事實(shí)表中.在部署的時(shí)候系統(tǒng)會(huì)在目標(biāo)數(shù)據(jù)庫(kù)內(nèi)創(chuàng)建一個(gè)包 (package), (事實(shí)表和事實(shí)表的 mapping 是一一對(duì)應(yīng)的) 8 執(zhí)行所有部署成功的維表的 mapping,向維表內(nèi)插入數(shù)據(jù),成功后在執(zhí)行所有部署成功的事實(shí) 表的 mapping,向事實(shí)表內(nèi)插入數(shù)據(jù). ORACLE 的 owb 的整個(gè)開(kāi)發(fā)過(guò)程完成了數(shù)據(jù)的抽取.轉(zhuǎn)換.裝載(ETL)和星型結(jié)構(gòu)的構(gòu)建,在 owb 的所有操作沒(méi)有脫離開(kāi) ORACLE 的數(shù)據(jù)庫(kù). 二二.IDS 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程程: 1 在 owb 的開(kāi)發(fā)告一段落后,我們就可以進(jìn)入到展現(xiàn)工具的開(kāi)發(fā)過(guò)程中來(lái),首先我們需要進(jìn)入 IDS 的 Discoverer administrator 里,在這里制定一個(gè) EUL 用戶,這個(gè) EUL 用戶是用來(lái)是用來(lái)管理 desktop 的,還做一些層次管理,例如可以制定一些計(jì)算方式和管理那些數(shù)據(jù)可以顯示給用戶那 些數(shù)據(jù)不可以顯示給用戶看. 2 在 Discoverer administrator 里完成了制定工作后,我們就可以進(jìn)入 IDS 的另一個(gè)工具進(jìn) 行展現(xiàn)方面的開(kāi)發(fā)了(desktop),進(jìn)入這個(gè)工具后,我們開(kāi)始制作展現(xiàn)需要的表單. 3.在 desktop 里你所能看到的所有數(shù)據(jù)項(xiàng)都是 EUL 用戶給你的權(quán)限,你可以根據(jù)客戶的要求 去制作表單,增加一些特殊的計(jì)算項(xiàng),在這里你可以使用 ORACLE 公司提供給你的所有聚集函數(shù). ORACLE 的 ids 工具主要是用來(lái)滿足展現(xiàn)方面的需要,而 desktop 是開(kāi)發(fā)表單的主要工具. 2.2DB2 的開(kāi)的開(kāi)發(fā)過(guò)發(fā)過(guò)程程 IBM 的開(kāi)的開(kāi)發(fā)過(guò)發(fā)過(guò)程主要分程主要分為為三大部分三大部分: 1 warehouse manager 開(kāi)開(kāi)發(fā)發(fā) 2 olap server 開(kāi)開(kāi)發(fā)發(fā) 3 BI 開(kāi)開(kāi) 發(fā)發(fā) ORACLE 9I SOURCE warehouse manager DB2 TARGET ETL Essbase administration server Olap server BI OLAP 展現(xiàn) 一一.Warehouse manager 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程程: 1.在 DB2 數(shù)據(jù)庫(kù)內(nèi)通過(guò) II 工具和 ORACLE 數(shù)據(jù)庫(kù)做好映射,將 ORACLE 數(shù)據(jù)庫(kù)內(nèi)的所有表 映射到 DB2 數(shù)據(jù)庫(kù)內(nèi). 2.進(jìn)入到數(shù)據(jù)倉(cāng)庫(kù)中心,首先我們現(xiàn)配置,在倉(cāng)庫(kù)源內(nèi)加入你需要的數(shù)據(jù)源表(也就是 映射過(guò)來(lái)的 ORACLE 表). 3.接下來(lái)我們需要在內(nèi)加入你需要的目標(biāo)表(也就是在 DB2 數(shù)據(jù)庫(kù)內(nèi)創(chuàng)建的事實(shí) 表). 4.我們現(xiàn)在就可以進(jìn)入,在這里我們來(lái)建立一個(gè)主題,這個(gè)主題是的作用是制定一系 列的數(shù)據(jù)抽取和轉(zhuǎn)換的規(guī)則,將 ORACLE 數(shù)據(jù)庫(kù)內(nèi)的原始記錄,經(jīng)過(guò) ETL 的過(guò)程存放到 DB2 數(shù)據(jù) 庫(kù)的事實(shí)表內(nèi). 5.我現(xiàn)在測(cè)試主題無(wú)誤后,可以進(jìn)入到運(yùn)行界面,點(diǎn)擊運(yùn)行該主題,這樣數(shù)據(jù)倉(cāng)庫(kù)就開(kāi)始抽取數(shù)據(jù) 到目標(biāo)表內(nèi)了,至此在 warehouse manager 里的工作我們就結(jié)束了,現(xiàn)在我們得到的只是一些過(guò)濾好 的原始數(shù)據(jù),至于這些數(shù)據(jù)之間到底有什么關(guān)系和結(jié)構(gòu),還有根據(jù)什么來(lái)匯總,我們需要到 IBM 的 Essbase administration server 這個(gè)工具里來(lái)實(shí)現(xiàn)它. 二二.OLAP SERVER 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程程: 1.在打開(kāi) Essbase administration server 之前我們需要現(xiàn)啟動(dòng) OLAP SEREVER 這個(gè)服務(wù),啟動(dòng)它 后,我們需要再啟動(dòng) administration server 的服務(wù),這樣我們就可以進(jìn)入到 dministration console 里 開(kāi)發(fā)了. 2.進(jìn)入后,我們選擇 Essbase analytic servers ,需要新建立一個(gè) application,在這個(gè) application 里還 需要建立一個(gè) datebase ,建立完這個(gè) datebase 后我們就可以正是進(jìn)入 OLAP 的開(kāi)發(fā)中. 3.我們現(xiàn)在 datebase 里進(jìn)入到它的 outline,在這里我們可以定義一個(gè)主題到底有那些維 (dimension),和事實(shí)數(shù)據(jù)(date load),當(dāng)定義完成后我們就可以制作規(guī)則文件了. 4.我們?cè)?datebase 里選著 rules files 在制定維和事實(shí)數(shù)據(jù)的規(guī)則文件,制定完成后就驗(yàn)證和保 存. 5.在這里我們可以選著 load date 項(xiàng),來(lái)想你的規(guī)則文件中填入數(shù)據(jù),系統(tǒng)會(huì)根據(jù)你定義的規(guī)則 文件和維與事實(shí)數(shù)據(jù)之間的關(guān)系從 DB2 數(shù)據(jù)庫(kù)內(nèi)抽取需要的數(shù)據(jù),load 到文件中,到此,OLAP 的工 作我們也開(kāi)發(fā)完成了. 三三.BI 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程程: (注:這里使用的是第三方 BI 產(chǎn)品北京博易智軟產(chǎn)品 BI-PILOT) 1. 開(kāi)發(fā)前需要先安裝 BI 的產(chǎn)品,BI-PILOT BUILDER AND BI-PILOT SERVER, BUILDER 的作 用主要用來(lái)開(kāi)發(fā)報(bào)表,SERVER 主要用來(lái)發(fā)布部署報(bào)表和在服務(wù)器上建立服務(wù). 2. 進(jìn)入到 BUILDER PROFESSIONAL 里我們需要先配置它與 OLAP SERVER 的連接,新建立 一個(gè)項(xiàng)目在項(xiàng)目上選擇新建 ODS 文件,在這里需要填寫 OLAP 的驅(qū)動(dòng)和地址,用戶名和密碼,驗(yàn)證 成功后,這樣連接就建立起來(lái)了. 3. 連接建立起來(lái)后我們可以選擇需要的 OLAP 里的 datebase,這樣我們還需要在項(xiàng)目上新建立 一個(gè) OLAP 文件,在這里我們可以選擇需要的 datebase. 4. 現(xiàn)在就可以制作交叉報(bào)表了新建立一個(gè)報(bào)表,選擇插入交叉表,在這里我們可以看到 datebase 里的所有的維表和事實(shí)表里的數(shù)據(jù)點(diǎn),可以選擇橫表頭顯示什么,每列顯示什么,制作完成后可以預(yù) 覽報(bào)表, 5.開(kāi)發(fā)完成后,就可以發(fā)布和部署了,現(xiàn)在就需要啟動(dòng) BI-PILOT SERVER 了.部署以后就可以通 過(guò) B/S 結(jié)構(gòu)來(lái)觀看報(bào)表. 3應(yīng)應(yīng)用性用性 3.1 Oracle 的的 OWB 和和 IBM 的的 warehouse manager . OLAP server 的比的比較較 1 總總體理解上體理解上: Oracle 的產(chǎn)品使用圖形化界面,可以快速設(shè)計(jì)、部署數(shù)據(jù)倉(cāng)庫(kù),上手比較容易,理解 上比較快一些,比較適合出學(xué)者. 而 IBM 的產(chǎn)品比較多,安裝和配置還有使用上比較復(fù)雜,所有比較適合有一定的數(shù)據(jù) 庫(kù)基礎(chǔ)和一定的數(shù)據(jù)倉(cāng)據(jù)知識(shí)的人來(lái)操作. 2 操作使用上操作使用上: Oracle 產(chǎn)品控制上太嚴(yán)禁,沒(méi)有多少發(fā)揮的余地,不可以修改已生成的 SQL. 而 IBM 產(chǎn)品就可以修改你生成的任何 SQL,比較開(kāi)放.編程人員可以自己發(fā)揮. 3.從從結(jié)結(jié)構(gòu)上構(gòu)上: Oracle 的 WAREHOUSE BUILDER 工具可以完成數(shù)據(jù)的抽取轉(zhuǎn)換(ETL)和多維結(jié) 構(gòu)的建立. 而 IBM 的 ETL 部分是由 WAREHOUSE MANAGER 完成的,多維結(jié)構(gòu)的建立是由 OLAP SERVER 來(lái)實(shí)現(xiàn)的,這樣會(huì)需要多花時(shí)間來(lái)掌握更多的工具. 4 數(shù)據(jù)數(shù)據(jù)結(jié)結(jié)構(gòu)上構(gòu)上: Oracle 的整個(gè)流程都是在操作 ORACLE 的數(shù)據(jù)庫(kù),已 ORACLE 數(shù)據(jù)庫(kù)為基礎(chǔ),即使 到了展現(xiàn)的時(shí)候數(shù)據(jù)的保存還是在數(shù)據(jù)庫(kù)里,對(duì)數(shù)據(jù)庫(kù)操作比較頻繁. 而 IBM 在 WAREHOUSE MANAGER 的操作還是已數(shù)據(jù)庫(kù)為基礎(chǔ),但是到了 OLAP SERVER 的時(shí)候就可以脫離對(duì)數(shù)據(jù)庫(kù)的操作了,已文件的形式保存下來(lái). 5 流程流程順順序上序上: Oracle 的整個(gè)流程是先建立維表和事實(shí)表,然后建立他們之間的層次和關(guān)系,最后根 據(jù)抽取條件從數(shù)據(jù)源抽取數(shù)據(jù)放到目標(biāo)表內(nèi),它的 ETL 和 OLAP 的多維結(jié)構(gòu)是一步完成的. 而 IBM 是先根據(jù)抽取條件從源數(shù)據(jù)庫(kù)內(nèi)整理好數(shù)據(jù)放到 DB2 數(shù)據(jù)庫(kù)內(nèi),在建立多維 的規(guī)則文件,根據(jù)多維的規(guī)則文件再?gòu)?DB2 數(shù)據(jù)庫(kù)內(nèi)抽取數(shù)據(jù)存放到最終的一個(gè)文件中. ORACLE 建立維表的 層次以及和 事實(shí)表的關(guān) 系 數(shù)據(jù)的整理 和抽取 數(shù)據(jù)按多維 模型和抽取 規(guī)則保存到 最終的目標(biāo) 庫(kù)中 展現(xiàn)和多維 分析 創(chuàng)建所需維 表和事實(shí)表 數(shù)據(jù)的整理 和抽取 數(shù)據(jù)按抽取 規(guī)則保存到 目標(biāo)庫(kù)中 建立規(guī)則文 件,創(chuàng)建多維 模型 數(shù)據(jù)按多維 模型保存到 最終的目標(biāo) 文件中 展現(xiàn)和多維 分析 3.2 由于數(shù)據(jù)由于數(shù)據(jù)倉(cāng)庫(kù)倉(cāng)庫(kù)開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程相程相對(duì)對(duì)復(fù)復(fù)雜雜,在兩個(gè),在兩個(gè)產(chǎn)產(chǎn)品的使用品的使用過(guò)過(guò)程中都出程中都出現(xiàn)現(xiàn)了一些了一些問(wèn)題問(wèn)題。 3.2.1 用用 ORACLE 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程中遇到的程中遇到的問(wèn)題問(wèn)題: 1 在展現(xiàn)方面 oracle 的 IDS 工具,在報(bào)表的表頭中無(wú)法實(shí)現(xiàn)多層嵌套和自定義表頭。 2 增量抽取數(shù)據(jù)有問(wèn)題,oracle 的 OWB 工具不能實(shí)現(xiàn)自動(dòng)定時(shí)間增量抽取數(shù)據(jù),只能人 工抽取數(shù)據(jù),這樣會(huì)給以后的維護(hù)產(chǎn)生問(wèn)題。 3 如果設(shè)計(jì)的維比較多,對(duì)于報(bào)表查詢的性能會(huì)有一定影響,兩者是成正比的,緯度越多,性 能越底。 4 所有數(shù)據(jù)全部動(dòng)態(tài)計(jì)算,沒(méi)有預(yù)算機(jī)制,延長(zhǎng)了統(tǒng)計(jì)時(shí)間。 5 在 OWB 工具里作數(shù)據(jù)抽取時(shí),如果主輔表關(guān)聯(lián),會(huì)產(chǎn)生統(tǒng)計(jì)金額的加倍的問(wèn)題。 6 有關(guān)上月數(shù)與同期數(shù)的問(wèn)題在 IDS 里無(wú)法解決。Oracle 提供的聚集函數(shù)并不能滿足 這樣的要求。 7 Owb 工具,如果今后需求有變動(dòng),需要修改開(kāi)發(fā)成果從新抽取數(shù)據(jù),但是 owb 工 具 不支持修改,只能刪除原來(lái)的關(guān)系線從新作,比較耗費(fèi)時(shí)間。 8 最大弱點(diǎn),在 OWB 的開(kāi)發(fā)中,如果數(shù)據(jù)庫(kù)或網(wǎng)絡(luò)斷線,那就意味這你沒(méi)有保存的信息 都將丟失. 3.2.2 用用 IBM 開(kāi)開(kāi)發(fā)過(guò)發(fā)過(guò)程中遇到的程中遇到的問(wèn)題問(wèn)題: : 1 開(kāi)發(fā)過(guò)程分為多部(oracle 到 db2 映射,etl,olap,展現(xiàn)),需要安裝使用的軟件較多(現(xiàn)階 段需要掌握 7 個(gè)軟件安裝 4 個(gè)軟件的使用),掌握這些軟件需要更多的時(shí)間,還需要 對(duì)數(shù)據(jù)倉(cāng)庫(kù)的理念有一定的了解。 2 業(yè)務(wù)數(shù)據(jù)庫(kù)為 oracle,需要映射到 db2 的數(shù)據(jù)庫(kù)中才能進(jìn)行開(kāi)發(fā),這樣會(huì)對(duì)數(shù)據(jù)的 ETL 部分有影響,具體影響有多大,還需要具體分析。 3 開(kāi)發(fā)過(guò)程中完全使用 db2 的數(shù)據(jù)庫(kù)及管理軟件

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論