ORACLE數(shù)據(jù)倉庫建設_第1頁
ORACLE數(shù)據(jù)倉庫建設_第2頁
ORACLE數(shù)據(jù)倉庫建設_第3頁
ORACLE數(shù)據(jù)倉庫建設_第4頁
ORACLE數(shù)據(jù)倉庫建設_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、摘 要自20世紀90 年代以來,計算機技術(shù)發(fā)展迅猛,各通信商逐步開發(fā)出新的BI系統(tǒng)。實現(xiàn)給通信領域提出了充分利用數(shù)據(jù)倉庫技術(shù),將現(xiàn)有的海量數(shù)據(jù)構(gòu)造成為可用、可控、可擴展的數(shù)據(jù)組織,以適應通信領域各級主管和業(yè)務人員的分析需要。在本論文中從數(shù)據(jù)倉庫需求分析包括參與成員、各個成員所起到的作用;邏輯模型建設通過軟件設計,確定表之間的關系;物理模型建設中對表和過程進行詳細的審核,用來支持所提出的需求;數(shù)據(jù)倉庫設計以ODS、DWD、DWA為層次,采用橫向分層縱向分域的理念,進行具體的實施建立,并在后期提供了錯誤的應急措施、數(shù)據(jù)倉庫的維護和優(yōu)化。關鍵詞: 數(shù)據(jù)據(jù)倉庫,物理理模型,維護護和優(yōu)化Englishh

2、 absttractSince tthe niineteeen ninnties, compputer technnologyy is ddevelooping rapiddly, tthe coommuniicatioon bussinesss gradduallyy deveelopedd a neew BI systeem. Reealityy to ccommunnicatiion fiield iis preesenteed forr fullly usiing daata waarehouuse teechnollogy tto exiistingg dataa struuctur

3、ees beccome aavailaable, contrrollabble, sscalabble daata orrganizzationn, to adaptt to tthe fiield oof commmuniccationn at aall leevels of maanagerrs andd busiiness analyysis.In thiss papeer froom thee dataa wareehousee requuiremeent annalysiis inccludess the partiicipattion oof memmbers, eachh mem

4、bber off the role playeed by; logiic moddel coonstruuctionn throough ssoftwaare deesign, to ddetermmine tthe reelatioonshipp betwween ttabless; phyysicall modeel connstrucction proceess taable aand deetaileed auddit, uused tto suppport the ppropossed reequireement; dataa wareehousee desiign wiith OD

5、DS, DWWD, DWWA levvels, the hhorizoontallly strratifiied loongituudinall domaain coonceptt, speecificc impllementtationn of tthe esstabliishmennt, annd in late stagee provvides errorr emerrgencyy meassures, dataa wareehousee mainntenannce annd opttimizaation.Keywordds: dataa wareehousee, phyysicall

6、modeel, maaintennance and ooptimiizatioon目錄TOC o 1-3 h z u HYPERLINK l _Toc14329 第一章 數(shù)據(jù)倉倉庫概述 PAGEREF _Toc14329 1 HYPERLINK l _Toc2941 1.1 本論文文采用數(shù)據(jù)倉倉庫的目的 PAGEREF _Toc2941 1 HYPERLINK l _Toc25886 1.2 數(shù)據(jù)倉倉庫的定義和和特點 PAGEREF _Toc25886 1 HYPERLINK l _Toc15072 1.3 數(shù)據(jù)倉倉庫與數(shù)據(jù)庫庫 PAGEREF _Toc15072 2 HYPERLINK l

7、_Toc13337 1.5 元數(shù)據(jù)據(jù) PAGEREF _Toc13337 3 HYPERLINK l _Toc12707 1.5.1 技技術(shù)元數(shù)據(jù) PAGEREF _Toc12707 3 HYPERLINK l _Toc13143 1.5.2 業(yè)業(yè)務元數(shù)據(jù) PAGEREF _Toc13143 3 HYPERLINK l _Toc23925 1.5.3 元元數(shù)據(jù)的作用用 PAGEREF _Toc23925 4 HYPERLINK l _Toc14041 1.6 數(shù)據(jù)倉倉庫發(fā)展方向向 PAGEREF _Toc14041 5 HYPERLINK l _Toc13085 1.6.1 數(shù)數(shù)據(jù)倉庫的產(chǎn)產(chǎn)生

8、和發(fā)展 PAGEREF _Toc13085 5 HYPERLINK l _Toc13812 1.6.2 數(shù)數(shù)據(jù)倉庫發(fā)展展趨勢 PAGEREF _Toc13812 7 HYPERLINK l _Toc21434 1.6.3 數(shù)數(shù)據(jù)集市、集集市群行業(yè)的發(fā)展展方向 PAGEREF _Toc21434 8 HYPERLINK l _Toc8181 1.6.4 基基于Inteernet22、光處理器器計算機和GGGG技術(shù)的的DW PAGEREF _Toc8181 11 HYPERLINK l _Toc16715 1.7建設數(shù)據(jù)據(jù)倉庫的必要要性 PAGEREF _Toc16715 14 HYPERLINK

9、 l _Toc10024 第二章 數(shù)據(jù)倉倉庫需求分析析 PAGEREF _Toc10024 15 HYPERLINK l _Toc17448 2.1 需求分分析原因 PAGEREF _Toc17448 15 HYPERLINK l _Toc15566 2.2 需求分分析階段 PAGEREF _Toc15566 15 HYPERLINK l _Toc29077 2.2.1 需需求分析成員員確立 PAGEREF _Toc29077 16 HYPERLINK l _Toc3590 2.2.2 需需求會議 PAGEREF _Toc3590 18 HYPERLINK l _Toc918 第三章 數(shù)據(jù)倉倉

10、庫總體設計計 PAGEREF _Toc918 19 HYPERLINK l _Toc4274 3.1 數(shù)據(jù)倉倉庫實施環(huán)境境 PAGEREF _Toc4274 19 HYPERLINK l _Toc29861 3.2 確定數(shù)數(shù)據(jù)倉庫開發(fā)發(fā)的生命周期期 PAGEREF _Toc29861 19 HYPERLINK l _Toc26854 3.3 通訊數(shù)數(shù)據(jù)倉庫設計計原則 PAGEREF _Toc26854 25 HYPERLINK l _Toc9737 3.4 確定數(shù)數(shù)據(jù)倉庫系統(tǒng)統(tǒng)的結(jié)構(gòu)及各各部分的主要要功能 PAGEREF _Toc9737 26 HYPERLINK l _Toc29277 第四

11、章 數(shù)據(jù)倉倉庫詳細設計計 PAGEREF _Toc29277 31 HYPERLINK l _Toc19923 4.1 邏輯模模型設計 PAGEREF _Toc19923 31 HYPERLINK l _Toc22282 4.2 物理模模型設計 PAGEREF _Toc22282 32 HYPERLINK l _Toc4557 第五章 數(shù)據(jù)倉倉庫實現(xiàn) PAGEREF _Toc4557 34 HYPERLINK l _Toc8896 5.1 ODSS層建設 PAGEREF _Toc8896 34 HYPERLINK l _Toc7905 5.1.1 接接口數(shù)據(jù)抽取取 PAGEREF _Toc79

12、05 34 HYPERLINK l _Toc1409 5.1.2 數(shù)數(shù)據(jù)抽取策略略 PAGEREF _Toc1409 35 HYPERLINK l _Toc18629 5.1.3 OODS層的作作用 PAGEREF _Toc18629 36 HYPERLINK l _Toc16641 5.2 DWWD層建設 PAGEREF _Toc16641 36 HYPERLINK l _Toc23529 5.2.1 DDWD定義 PAGEREF _Toc23529 36 HYPERLINK l _Toc25420 5.2.2 實實體選取的原原則 PAGEREF _Toc25420 36 HYPERLINK

13、 l _Toc23551 5.2.3 字字段選取的原原則 PAGEREF _Toc23551 37 HYPERLINK l _Toc16322 5.2.4 數(shù)數(shù)據(jù)轉(zhuǎn)換 PAGEREF _Toc16322 37 HYPERLINK l _Toc31635 5.2.5 數(shù)數(shù)據(jù)加載技術(shù)術(shù)及策略 PAGEREF _Toc31635 38 HYPERLINK l _Toc24768 5.3 DWAA匯總層建設設 PAGEREF _Toc24768 39 HYPERLINK l _Toc15755 5.4 DWAA衍生層建設設 PAGEREF _Toc15755 40 HYPERLINK l _Toc16

14、294 第六章 數(shù)據(jù)倉倉庫后期運維維 PAGEREF _Toc16294 42 HYPERLINK l _Toc30603 6.1 數(shù)據(jù)倉倉庫測試 PAGEREF _Toc30603 42 HYPERLINK l _Toc15915 6.1.11 分析源文文件 PAGEREF _Toc15915 42 HYPERLINK l _Toc25742 6.1.2 開開發(fā)策略和測測試計劃 PAGEREF _Toc25742 42 HYPERLINK l _Toc29457 6.1.3 測測試的開發(fā)與與執(zhí)行 PAGEREF _Toc29457 43 HYPERLINK l _Toc12595 6.2 數(shù)

15、據(jù)倉倉庫后期維護護 PAGEREF _Toc12595 43 HYPERLINK l _Toc11706 6.2.1 數(shù)數(shù)據(jù)倉庫數(shù)據(jù)據(jù)清理 PAGEREF _Toc11706 43 HYPERLINK l _Toc30610 6.2.2 數(shù)數(shù)據(jù)倉庫模型型更改 PAGEREF _Toc30610 44 HYPERLINK l _Toc28464 6.3 數(shù)據(jù)倉倉庫性能優(yōu)化化 PAGEREF _Toc28464 44 HYPERLINK l _Toc3733 6.3.1 調(diào)調(diào)整數(shù)據(jù)庫服服務器的性能能 PAGEREF _Toc3733 44 HYPERLINK l _Toc19610 6.3.2 調(diào)

16、調(diào)整內(nèi)存分配配 PAGEREF _Toc19610 44 HYPERLINK l _Toc28960 6.3.3 使使用ORACCLE的數(shù)據(jù)據(jù)完整性約束束 PAGEREF _Toc28960 45 HYPERLINK l _Toc3642 6.3.4 使使用數(shù)據(jù)庫觸觸發(fā)器 PAGEREF _Toc3642 45 HYPERLINK l _Toc25499 6.3.5 使使用存儲過程程 PAGEREF _Toc25499 46 HYPERLINK l _Toc14174 6.3.6 應應用程序調(diào)整整 PAGEREF _Toc14174 46 HYPERLINK l _Toc29329 總結(jié) PA

17、GEREF _Toc29329 47 HYPERLINK l _Toc18165 致謝 PAGEREF _Toc18165 48 HYPERLINK l _Toc31618 參考文獻 PAGEREF _Toc31618 499第一章 數(shù)據(jù)倉倉庫概述1.1 本論文文采用數(shù)據(jù)倉倉庫的目的當前,通信行業(yè)業(yè)(以聯(lián)通為為例)內(nèi)部已已經(jīng)積累了大大量的業(yè)務處處理數(shù)據(jù),但是這些數(shù)數(shù)據(jù)分布在各各級機構(gòu)、各各個部門中,而且數(shù)據(jù)的的操作平臺各各異,有DOS 的、有有Windoows 的、有有Unix 的、有Sollaris 的;數(shù)據(jù)的來源源復雜,有存儲在硬硬盤上的,也有存儲在在磁帶、光盤盤上的;數(shù)據(jù)的文件件格式多樣

18、,有各種不同同數(shù)據(jù)庫的,也有文本文文件型的,還有多媒體體文件型的。這這些數(shù)據(jù)是通通信行業(yè)決策策的寶貴信息息資源,在構(gòu)造新的的系統(tǒng)時必須須要善加利用用。數(shù)據(jù)倉庫庫技術(shù)為解決決充分有效的的利用超大容容量、多平臺臺數(shù)據(jù)資源這這個問題提供供了方法和手手段,能夠充分利利用現(xiàn)有的海海量數(shù)據(jù)資源源,并從中找出出對通信的運運作和決策有有價值的信息息。1.2 數(shù)據(jù)倉倉庫的定義和和特點數(shù)據(jù)倉庫是 HYPERLINK /view/8048.htm 決策策支持系統(tǒng)(ddss)和聯(lián)聯(lián)機分析應用用數(shù)據(jù)源的結(jié)結(jié)構(gòu)化 HYPERLINK /view/277719.htm 數(shù)據(jù)環(huán)環(huán)境。數(shù)據(jù)倉倉庫研究和解解決從數(shù)據(jù)庫庫中獲取信息

19、息的問題。數(shù)數(shù)據(jù)倉庫的特特征在于面向向主題、集成成性、穩(wěn)定性性和時變性。數(shù)據(jù)倉庫是面向向主題的操作型數(shù)據(jù)庫的的數(shù)據(jù)組織面面向事務處理理任務,而數(shù)數(shù)據(jù)倉庫中的的數(shù)據(jù)是按照照一定的主題題域進行組織織。主題是指指用戶使用數(shù)數(shù)據(jù)倉庫進行行決策時所關關心的重點方方面,一個主主題通常與多多個操作型信信息系統(tǒng)相關關。數(shù)據(jù)倉庫是集成成的數(shù)據(jù)倉庫的數(shù)據(jù)據(jù)有來自于分分散的操作型型數(shù)據(jù),將所所需數(shù)據(jù)從原原來的數(shù)據(jù)中中抽取出來,進進行加工與集集成,統(tǒng)一與與綜合之后才才能進入數(shù)據(jù)據(jù)倉庫。數(shù)據(jù)倉庫是不可可更新的數(shù)據(jù)倉庫主要是是為決策分析析提供數(shù)據(jù),所所涉及的操作作主要是數(shù)據(jù)據(jù)的查詢。數(shù)據(jù)倉庫是隨時時間而變化的的傳統(tǒng)的關系

20、數(shù)據(jù)據(jù)庫系統(tǒng)比較較適合處理格格式化的數(shù)據(jù)據(jù),能夠較好好的滿足商業(yè)業(yè)商務處理的的需求。穩(wěn)定定的數(shù)據(jù)以只只讀格式保存存,且不隨時時間改變。匯總的操作性數(shù)據(jù)映射射成決策可用用的格式。大容量 HYPERLINK /view/2822835.htm 時間序列數(shù)據(jù)集集合通常都非非常大。非規(guī)范化的DW數(shù)據(jù)可以是是而且經(jīng)常是是冗余的。元數(shù)據(jù)將描述數(shù)據(jù)的數(shù)數(shù)據(jù)保存起來來。數(shù)據(jù)源數(shù)據(jù)來自內(nèi)部的的和外部的非非集成操作系系統(tǒng)。 1.3 數(shù)據(jù)倉倉庫與數(shù)據(jù)庫庫數(shù)據(jù)庫已經(jīng)在信信息技術(shù)領域域有了廣泛的的應用,我們們社會生活的的各個部門,幾幾乎都有各種種各樣的數(shù)據(jù)據(jù)庫保存著與與我們的生活活息息相關的的各種數(shù)據(jù)。作作為數(shù)據(jù)庫的的

21、一個分支,數(shù)數(shù)據(jù)倉庫概念念的提出,相相對于數(shù)據(jù)庫庫從時間上就就近得多。美美國著名信息息工程專家WWilliaam博士在990年代初提提出了數(shù)據(jù)倉倉庫概念的一一個表述,認認為:“一個數(shù)據(jù)倉倉庫通常是一一個面向主題題的、集成的的、隨時間變變化的、但信信息本身相對對穩(wěn)定的數(shù)據(jù)據(jù)集合,它用用于對管理決決策過程的支支持?!边@里的主題題,是指用戶戶使用數(shù)據(jù)倉倉庫進行決策策時所關心的的重點方面,如如:收入、客客戶、銷售渠渠道等;所謂謂面向主題,是是指數(shù)據(jù)倉庫庫內(nèi)的信息是是按主題進行行組織的,而而不是像業(yè)務務支撐系統(tǒng)那那樣是按照業(yè)業(yè)務功能進行行組織的。集成,是指數(shù)據(jù)據(jù)倉庫中的信信息不是從各各個業(yè)務系統(tǒng)統(tǒng)中簡單

22、抽取取出來的,而而是經(jīng)過一系系列加工、整整理和匯總的的過程,因此此數(shù)據(jù)倉庫中中的信息是關關于整個企業(yè)業(yè)的一致的全全局信息。 隨時間變化,是是指數(shù)據(jù)倉庫庫內(nèi)的信息并并不只是反映映企業(yè)當前的的狀態(tài),而是是記錄了從過過去某一時點點到當前各個個階段的信息息。通過這些些信息,可以以對企業(yè)的發(fā)發(fā)展歷程和未未來趨勢做出出定量分析和和預測。二者的聯(lián)系:數(shù)據(jù)倉庫的出現(xiàn)現(xiàn),并不是要要取代數(shù)據(jù)庫庫。目前,大大部分數(shù)據(jù)倉倉庫還是用關關系數(shù)據(jù)庫管管理系統(tǒng)來管管理的??梢砸哉f,數(shù)據(jù)庫庫、數(shù)據(jù)倉庫庫相輔相成、各各有千秋。 二者的區(qū)別: 出發(fā)點不同數(shù)據(jù)庫是面向事事務的設計,數(shù)據(jù)倉庫是是面向主題設設計的。 存儲的數(shù)據(jù)不同同數(shù)據(jù)

23、庫一般存儲儲在線交易數(shù)數(shù)據(jù),數(shù)據(jù)倉庫存存儲的一般是是歷史數(shù)據(jù)。 設計規(guī)則不同數(shù)據(jù)庫設計是盡盡量避免冗余余,一般采用用符合范式的的規(guī)則來設計計,數(shù)據(jù)倉庫在在設計是有意意引入冗余,采采用反范式的的方式來設計計。提供的功能不同同數(shù)據(jù)庫是為捕獲獲數(shù)據(jù)而設計計,數(shù)據(jù)倉庫庫是為分析數(shù)數(shù)據(jù)而設計?;驹夭煌瑪?shù)據(jù)庫的基本元元素是事實表表,數(shù)據(jù)倉庫庫的基本元素素是維度表。容量不同數(shù)據(jù)庫在基本容容量上要比數(shù)數(shù)據(jù)倉庫小的的多。服務對象不同數(shù)據(jù)庫是為了高高效的事務處處理而設計的的,服務對象象為企業(yè)業(yè)務務處理方面的的工作人員,數(shù)據(jù)倉庫是是為了分析數(shù)數(shù)據(jù)進行決策策而設計的,服服務對象為企企業(yè)高層決策策人員。1.5 元數(shù)

24、據(jù)據(jù)元數(shù)據(jù)(Mettadataa)是關于數(shù)數(shù)據(jù)的數(shù)據(jù)。在在數(shù)據(jù)倉庫系系統(tǒng)中,元數(shù)數(shù)據(jù)可以幫助助數(shù)據(jù)倉庫管管理員和數(shù)據(jù)據(jù)倉庫的開發(fā)發(fā)人員非常方方便地找到他他們所關心的的數(shù)據(jù);元數(shù)數(shù)據(jù)是描述數(shù)數(shù)據(jù)倉庫內(nèi)數(shù)數(shù)據(jù)的結(jié)構(gòu)和和建立方法的的數(shù)據(jù),可將將其按用途的的不同分為兩兩類:技術(shù)元元數(shù)據(jù)(TeechniccalMettadataa)和業(yè)務元元數(shù)據(jù)(BuusinesssMetaadata)。1.5.1 技技術(shù)元數(shù)據(jù)技術(shù)元數(shù)據(jù)是存存儲關于數(shù)據(jù)據(jù)倉庫系統(tǒng)技技術(shù)細節(jié)的數(shù)數(shù)據(jù),是用于于開發(fā)和管理理數(shù)據(jù)倉庫使使用的數(shù)據(jù),它它主要包括數(shù)數(shù)據(jù)倉庫結(jié)構(gòu)構(gòu)的描述,包包括倉庫模式式、視圖、維維、層次結(jié)構(gòu)構(gòu)和導出數(shù)據(jù)據(jù)的定義,

25、以以及數(shù)據(jù)集市市的位置和內(nèi)內(nèi)容;業(yè)務系系統(tǒng)、數(shù)據(jù)倉倉庫和數(shù)據(jù)集集市的體系結(jié)結(jié)構(gòu)和模式。 匯總用的的算法,包括括度量和維定定義算法,數(shù)數(shù)據(jù)粒度、主主題領域、聚聚集、匯總、預預定義的查詢詢與報告。 由操作環(huán)環(huán)境到數(shù)據(jù)倉倉庫環(huán)境的映映射,包括源源數(shù)據(jù)和它們們的內(nèi)容、數(shù)數(shù)據(jù)分割、數(shù)數(shù)據(jù)提取、清清理、轉(zhuǎn)換規(guī)規(guī)則和數(shù)據(jù)刷刷新規(guī)則、安安全(用戶授授權(quán)和存取控控制)。1.5.2 業(yè)業(yè)務元數(shù)據(jù)業(yè)務元數(shù)據(jù)從業(yè)業(yè)務角度描述述了數(shù)據(jù)倉庫庫中的數(shù)據(jù),它它提供了介于于使用者和實實際系統(tǒng)之間間的語義層。業(yè)業(yè)務元數(shù)據(jù)主主要包括以下下:使用者的的業(yè)務術(shù)語所所表達的數(shù)據(jù)據(jù)模型、對象象名和屬性名名;訪問數(shù)據(jù)據(jù)的原則和數(shù)數(shù)據(jù)的來源;

26、系統(tǒng)所提供供的分析方法法以及公式和和報表的;具具體包括以下下: (11)企業(yè)概念念模型這是業(yè)務元數(shù)據(jù)據(jù)所應提供的的重要的,它它表示企業(yè)數(shù)數(shù)據(jù)模型的高高層、整個企企業(yè)的業(yè)務概概念和相互關關系。多維數(shù)據(jù)模型這是企業(yè)概念模模型的重要組組成部分,確確定業(yè)務分析析人員在數(shù)據(jù)據(jù)集市當中有有哪些維、維維的類別、數(shù)數(shù)據(jù)立方體以以及數(shù)據(jù)集市市中的聚合規(guī)規(guī)則。這里的的數(shù)據(jù)立方體體表示某主題題領域業(yè)務事事實表和維表表的多維組織織形式。 (3)業(yè)務務概念模型和和物理數(shù)據(jù)之之間的依賴業(yè)務元數(shù)據(jù)只是是表示出了數(shù)數(shù)據(jù)的業(yè)務視視圖,這些業(yè)業(yè)務視圖與實實際的數(shù)據(jù)倉倉庫或 HYPERLINK / 數(shù)據(jù)庫庫、中的表、字字段、維、層

27、層次等之間的的對應關系也也應該在元數(shù)數(shù)據(jù)知識庫中中有所體現(xiàn)。1.5.3 元元數(shù)據(jù)的作用用描述哪些數(shù)據(jù)在在數(shù)據(jù)倉庫中中。定義要進入數(shù)據(jù)據(jù)倉庫中的數(shù)數(shù)據(jù)和從數(shù)據(jù)據(jù)倉庫中產(chǎn)生生的數(shù)據(jù)。記錄根據(jù)業(yè)務事事件發(fā)生而隨隨之進行的數(shù)數(shù)據(jù)抽取工作作時間安排。記錄并檢測系統(tǒng)統(tǒng)數(shù)據(jù)一致性性的要求和執(zhí)執(zhí)行情況。衡量數(shù)據(jù)質(zhì)量。 元數(shù)據(jù)據(jù)管理的主要要任務有兩個個方面:一是負責存儲和和維護元 HYPERLINK / 數(shù)據(jù)據(jù)庫中的元數(shù)數(shù)據(jù);二是負負責數(shù)據(jù)倉庫庫建模工具、數(shù)數(shù)據(jù)獲取工具具、前端工具具等之間的消消息傳遞,協(xié)協(xié)調(diào)各模塊和和工具之間的的工作。 我們了了解到元數(shù)據(jù)據(jù)幾乎可以被被稱為是數(shù)據(jù)據(jù)倉庫乃至商商業(yè)智能(BBI)系

28、統(tǒng)的的“靈魂”,正正是由于元數(shù)數(shù)據(jù)在整個數(shù)數(shù)據(jù)倉庫生命命周期中有著著重要的地位位,各個廠商商的都提到了了關于對元數(shù)數(shù)據(jù)的管理。但但遺憾的是對對于元數(shù)據(jù)的的管理,各個個解決方案都都沒有明確提提出一個完整整的管理模式式;它們提供供的僅僅是對對特定的局部部元數(shù)據(jù)的管管理。與元數(shù)數(shù)據(jù)相關的數(shù)數(shù)據(jù)倉庫工具具大致可分為為四類: (1)數(shù)據(jù)抽取工工具把業(yè)務系統(tǒng)中的的數(shù)據(jù)抽取、轉(zhuǎn)轉(zhuǎn)換、集成到到數(shù)據(jù)倉庫中中,如Arddent的DDataSttage、CCA(原Pllatinuum)的DeecisioonBasee和ETI的的Extraact等。這這些工具僅提提供了技術(shù)元元數(shù)據(jù),幾乎乎沒有提供對對業(yè)務元數(shù)據(jù)據(jù)的支

29、持。前端展現(xiàn)工具包括OLAP分分析、報表和和商業(yè)智能工工具等,如MMicroSStrateegy的DSSSAgennt、Coggnos的PPowerPPlay、BBusineessObjjects的的BO,以及及Brio等等。它們通過過把關系表映映射成與業(yè)務務相關的事實實表和維表來來支持多維業(yè)業(yè)務視圖,進進而對數(shù)據(jù)倉倉庫中的數(shù)據(jù)據(jù)進行多維分分析。這些工工具都提供了了業(yè)務元數(shù)據(jù)據(jù)與技術(shù)元數(shù)數(shù)據(jù)相對應的的語義層。 (33)建模工具具為非技術(shù)人員準準備的業(yè)務建建模工具,這這些工具可以以提供更高層層的與特定業(yè)業(yè)務相關的語語義。如CAA的ERwiin、Syssbase的的PowerrDesiggner以

30、及及Ratioonal的RRose等。 (4)元工具元數(shù)據(jù)通常存儲儲在專用的 HYPERLINK / 數(shù)數(shù)據(jù)庫中,該該 HYPERLINK / 數(shù)據(jù)庫就如同同一個“黑盒盒子”,外部部無法知道這這些工具所用用到和產(chǎn)生的的元數(shù)據(jù)是如如何存儲的。還還有一類被稱稱為元數(shù)據(jù)知知識庫(MeetadattaRepoositorry)的工具具,它們獨立立于其它工具具,為元數(shù)據(jù)據(jù)提供一個集集中的存儲空空間。包括微微軟的Reppositoory,CAA的Repoositorry,Arddent的MMetaSttage和的的WCC等。1.6 數(shù)據(jù)倉倉庫發(fā)展方向向1.6.1 數(shù)數(shù)據(jù)倉庫的產(chǎn)產(chǎn)生和發(fā)展現(xiàn)在基于業(yè)務數(shù)數(shù)據(jù)

31、的決策分分析聯(lián)機分析析處理(OLLAP),比比以往任何時時候都顯得更更為重要。如如果說傳統(tǒng)聯(lián)聯(lián)機事務處理理(OLTPP)強調(diào)的是是更新數(shù)據(jù)庫庫向數(shù)據(jù)庫庫中添加信息息,那么OLLAP就是從從數(shù)據(jù)庫中獲獲取信息、利利用信息。事事實上,將大大量的業(yè)務數(shù)數(shù)據(jù)應用于分分析和統(tǒng)計原原本是一個非非常簡單和自自然的想法。但但在實際的操操作中,人們們卻發(fā)現(xiàn)要獲獲得有用的信信息并非如想想象的那么容容易:第一,所有OLLTP強調(diào)的的是密集的數(shù)數(shù)據(jù)更新處理理性能和系統(tǒng)統(tǒng)的可靠性,并并不關心數(shù)據(jù)據(jù)查詢的方便便與快捷。聯(lián)聯(lián)機分析和事事務處理對系系統(tǒng)的要求不不同,同一個個數(shù)據(jù)庫在理理論上都難以以做到兩全。第二,業(yè)務數(shù)據(jù)據(jù)往

32、往被存放放于分散的異異構(gòu)環(huán)境中,不不易統(tǒng)一查詢詢訪問,而且且還有大量的的歷史數(shù)據(jù)處處于脫機狀態(tài)態(tài),形同虛設設。第三,業(yè)務數(shù)據(jù)據(jù)的模式針對對事務處理系系統(tǒng)而設計,數(shù)數(shù)據(jù)的格式和和描述方式并并不適合非計計算機專業(yè)人人員進行業(yè)務務上的分析和和統(tǒng)計??梢赃@么說,以以前查詢不到到信息是因為為數(shù)據(jù)太少了了,而今天查查詢不到則是是因為數(shù)據(jù)太太多了。針對對這一問題,人人們設想專門門為業(yè)務的統(tǒng)統(tǒng)計分析建立立一個數(shù)據(jù)中中心,它的數(shù)數(shù)據(jù)從OLTTP系統(tǒng)中來來、從外部數(shù)數(shù)據(jù)源來、從從歷史業(yè)務數(shù)數(shù)據(jù)中來這個數(shù)據(jù)中中心是一個聯(lián)聯(lián)機的系統(tǒng),它它是專門為分分析統(tǒng)計和決決策支持應用用服務的,通通過它可滿足足決策支持和和聯(lián)機分析

33、應應用所要求的的一切。這個個數(shù)據(jù)中心就就叫做數(shù)據(jù)倉倉庫。數(shù)據(jù)倉倉庫就是一個個作為決策支支持系統(tǒng)和聯(lián)聯(lián)機分析應用用數(shù)據(jù)源的結(jié)結(jié)構(gòu)化數(shù)據(jù)環(huán)環(huán)境。數(shù)據(jù)倉倉庫所要研究究和解決的問問題就是從數(shù)數(shù)據(jù)庫中獲取取信息的問題題。與關系數(shù)據(jù)庫不不同,數(shù)據(jù)倉倉庫并沒有嚴嚴格的數(shù)學理理論基礎,它它更偏向于工工程。由于數(shù)數(shù)據(jù)倉庫的這這種工程性,因因而在技術(shù)上上可以根據(jù)它它的工作過程程分為:數(shù)據(jù)據(jù)的抽取、存存儲和管理、數(shù)數(shù)據(jù)的表現(xiàn)以以及數(shù)據(jù)倉庫庫設計的技術(shù)術(shù)咨詢四個方方面。(1)數(shù)據(jù)的抽抽取數(shù)據(jù)倉庫是一個個獨立的數(shù)據(jù)據(jù)環(huán)境,它需需要通過抽取取過程將數(shù)據(jù)據(jù)從聯(lián)機事務務處理系統(tǒng)、外外部數(shù)據(jù)源、脫脫機的數(shù)據(jù)存存儲介質(zhì)中導導入數(shù)

34、據(jù)倉庫庫。數(shù)據(jù)抽取取可以定時進進行,但多個個抽取操作執(zhí)執(zhí)行的時間、相相互的順序、成成敗對數(shù)據(jù)倉倉庫中信息的的有效性則至至關重要。(2)存儲和管管理數(shù)據(jù)倉庫的真正正關鍵是數(shù)據(jù)據(jù)的存儲和管管理。數(shù)據(jù)倉倉庫的組織管管理方式?jīng)Q定定了它有別于于傳統(tǒng)數(shù)據(jù)庫庫的特性,同同時也決定了了其對外部數(shù)數(shù)據(jù)表現(xiàn)形式式。要決定采采用什么產(chǎn)品品和技術(shù)來建建立數(shù)據(jù)倉庫庫核心,則需需要從數(shù)據(jù)倉倉庫的技術(shù)特特點著手分析析。如何完成對大量量數(shù)據(jù)的存儲儲和管理并行處理能力針對決策支持查查詢的優(yōu)化支持多維分析的的查詢模式,這這也是關系數(shù)數(shù)據(jù)庫在數(shù)據(jù)據(jù)倉庫領域遇遇到的最嚴峻峻的挑戰(zhàn)之一一。(3)數(shù)據(jù)的表表現(xiàn)數(shù)據(jù)表現(xiàn)是數(shù)據(jù)據(jù)倉庫的門面面

35、。這里說的的主要是多維維分析、數(shù)理理統(tǒng)計和數(shù)據(jù)據(jù)挖掘方面。(4)數(shù)據(jù)倉庫庫設計的技術(shù)術(shù)咨詢數(shù)據(jù)倉庫絕不是是簡單的產(chǎn)品品堆砌,它是是一個綜合性性的解決方案案和系統(tǒng)工程程。在數(shù)據(jù)倉倉庫的實施過過程中,技術(shù)術(shù)咨詢服務至至關重要,是是一個不可缺缺少的部分,它它甚至于比購購買產(chǎn)品更為為重要。就目前的發(fā)展來來看,建立數(shù)數(shù)據(jù)倉庫有兩兩個基本條件件:建立數(shù)據(jù)倉庫的的行業(yè)有較為為成熟的OLLTP系統(tǒng),它它為數(shù)據(jù)倉庫庫提供客觀條條件;行業(yè)面臨市場競競爭的壓力,它它為數(shù)據(jù)倉庫庫的建立提供供外在的動力力。另外建立立大型數(shù)據(jù)倉倉庫,成本也也是較高的,所所以對企業(yè)的的經(jīng)濟實力也也是個考驗。所所以數(shù)據(jù)倉庫庫的概念一經(jīng)經(jīng)出現(xiàn)

36、,就首首先被應用于于金融、電信信、保險等行行業(yè)。1.6.2 數(shù)數(shù)據(jù)倉庫發(fā)展展趨勢(1)數(shù)據(jù)倉庫庫規(guī)模不斷增增長所有企業(yè)的數(shù)據(jù)據(jù)倉庫規(guī)模都都將呈指數(shù)增增長,數(shù)據(jù)源源的增長以及及企業(yè)對數(shù)據(jù)據(jù)更好的獲取取能力推動了了這種增長。另另外存儲成本本也越來越便便宜,因此企企業(yè)能夠保存存更長期的數(shù)數(shù)據(jù)。但數(shù)據(jù)據(jù)增長也將使使企業(yè)面臨一一些新問題,包包括數(shù)據(jù)倉庫庫的可升級性性以及可能出出現(xiàn)的性能問問題。(2)數(shù)據(jù)集市市的整合(3)客戶數(shù)據(jù)據(jù)集成許多企業(yè)如今很很想跨越產(chǎn)品品線、業(yè)務單單位、渠道和和地理各方面面來綜合地得得到一個關于于客戶的單一一視圖,一種種稱之為客戶戶數(shù)據(jù)集成(CCDI)的解解決方案應聲聲而出,其核

37、核心部分由數(shù)數(shù)據(jù)倉庫和相相關技術(shù)構(gòu)成成??蛻魯?shù)據(jù)據(jù)集成提供了了對客戶數(shù)據(jù)據(jù)360的全方位視視圖,并使企企業(yè)可以從任任何一個接觸觸點上對客戶戶進行認識和和做出反應。(4)開發(fā)商的的整合由于企業(yè)都想得得到完備的產(chǎn)產(chǎn)品套件,數(shù)數(shù)據(jù)倉庫和商商務智能開發(fā)發(fā)商因此將越越來越多的功功能融合到他他們的產(chǎn)品中中去。(5)EAI和和ETL工具具的集成(6)快速反應應的決策支持持電子商務的不斷斷增長驅(qū)使著著企業(yè)去尋找找共享數(shù)據(jù)和和對機會快速速反應的方法法,雖然真正正的實時決策策支持基本是是不可能的,但但數(shù)據(jù)倉庫技技術(shù)的進步卻卻使快速反應應的決策支持持得以實現(xiàn)。在在數(shù)分鐘或數(shù)數(shù)秒鐘內(nèi)對數(shù)數(shù)據(jù)進行分析析和對事件做做出反

38、應的能能力有助于企企業(yè)在各方面面的行動,比比如供應鏈管管理、客戶服服務和商務性性能管理等。(7)非結(jié)構(gòu)化化信息的增長長企業(yè)正面臨著非非結(jié)構(gòu)化和半半結(jié)構(gòu)化數(shù)據(jù)據(jù)的增長,包包括圖像、聲聲音、視頻、XXML以及其其它的數(shù)據(jù)類類型。同時,相相關的技術(shù)也也在不斷出現(xiàn)現(xiàn),使企業(yè)可可以采用跟以以前處理傳統(tǒng)統(tǒng)的結(jié)構(gòu)化數(shù)數(shù)據(jù)資源的方方式,來存儲儲和挖掘這些些數(shù)據(jù)。(8)越來越了了解如何對“成功或失敗敗”問題做出正正確分析知識管理在企業(yè)倉促著手手建立數(shù)據(jù)倉倉庫或其它分分析型知識庫庫時,數(shù)據(jù)質(zhì)質(zhì)量或元數(shù)據(jù)據(jù)這些重要問問題經(jīng)常被忽忽視,其后果果就是,很多多企業(yè)現(xiàn)今發(fā)發(fā)現(xiàn)他們的行行動成功性打打了不少折扣扣,因為他們們不

39、能確定“成功或失敗敗”問題。數(shù)據(jù)據(jù)質(zhì)量問題和和元數(shù)據(jù)的缺缺乏會嚴重影影響用戶對數(shù)數(shù)據(jù)倉庫的接接受程度,也也只能得到可可憐的分析結(jié)結(jié)果和不正確確的決策。這這是一個相當當復雜的問題題,需要花費費時間和精力力去確定他們們。(9)強調(diào)應用用程序VS數(shù)數(shù)據(jù)倉庫對大多企業(yè)來說說,數(shù)據(jù)倉庫庫不再是單獨獨的一件事。需需要確定投資資回報率。數(shù)數(shù)據(jù)倉庫項目目跟以前一樣樣是必需的,但但可能會盡量量跟應用程序序聯(lián)系起來以以便于計算投投資回報率和和調(diào)整項目成成本。(10)越來越越注重盈虧問問題艱難的經(jīng)濟環(huán)境境迫使企業(yè)除除了收入增長長外,還得認認真考慮收益益率問題。這這種不斷增加加的對盈虧問問題的注意力力影響到了IIT項

40、目,其其中包括數(shù)據(jù)據(jù)倉庫,最終終導致各級水水平上的成本本削減。新的的數(shù)據(jù)倉庫項項目仍將不斷斷進行,但是是企業(yè)不會再再妄想一步登登天去做那些些對盈利沒有有直接影響的的事;它們還還想有一個明明確的商業(yè)案案例,明確的的投資回報率率和更短的回回報周期。1.6.3 數(shù)數(shù)據(jù)集市、集集市群行業(yè)的發(fā)展展方向在數(shù)據(jù)倉庫產(chǎn)品品方面,微軟軟是以其關系系數(shù)據(jù)庫SQQL Serrver作為為它數(shù)據(jù)倉庫庫核心的。微微軟的OLAAP走的是RROLAP的的路子,與其其數(shù)據(jù)轉(zhuǎn)換一一樣,屬于常常規(guī)的解決方方案;而并行行處理和決策策支持擴展則則不是SQLL Servver的強項項。因此,整整個解決方案案仍面向中低低端,價格取取勝是

41、關鍵。為為此,微軟在在數(shù)據(jù)倉庫市市場中倡導了了另一個概念念數(shù)據(jù)集市市(Dataa Martt)。所謂數(shù)數(shù)據(jù)集市就是是一個面向部部門應用的、小小型的數(shù)據(jù)倉倉庫;所采用用的技術(shù)與數(shù)數(shù)據(jù)倉庫相似似,但存儲的的內(nèi)容更加專專題化。對于于數(shù)據(jù)集市這這樣的規(guī)模,微微軟的解決方方案便可成為為理想的選擇擇。雖然微軟是無數(shù)數(shù)IT人士“憎恨”的對象,但但我們不得不不承認,它在在市場定位方方面的工作一一直很成功。其其所堅持的走走大眾化、平平民化道路的的理念,從操操作系統(tǒng)中的的windoows,辦公公軟件里得OOfficee到數(shù)據(jù)庫領領域的SQLL Seveer等等,無無一不是成功功的案例。在在這次數(shù)據(jù)倉倉庫的較量中中

42、,微軟又打打起了數(shù)據(jù)集集市的大旗。就就目前情況而而言,能夠建建立大型數(shù)據(jù)據(jù)倉庫的企業(yè)業(yè)畢竟還局限限于有雄厚實實力的大型公公司。而占市市場相當比重重的中小企業(yè)業(yè),一方面難難以接受建立立數(shù)據(jù)倉庫高高昂的成本,另另一方面使用用大型數(shù)據(jù)倉倉庫來解決他他們少量的工工作也顯得有有些浪費。而而此時數(shù)據(jù)集集市則成了他他們不錯的選選擇。表1-1 數(shù)數(shù)據(jù)集市與數(shù)數(shù)據(jù)倉庫的區(qū)區(qū)別數(shù)據(jù)倉庫數(shù)據(jù)集市數(shù)據(jù)來源OLTP、遺留留系統(tǒng)、外部部數(shù)據(jù)數(shù)據(jù)倉庫范圍企業(yè)級部門級、工作組組級主題企業(yè)主題部門或?qū)m椫黝}題數(shù)據(jù)粒度最細粒度較粗粒度數(shù)據(jù)結(jié)構(gòu)3NTF星型、雪片型歷史數(shù)據(jù)大量歷史數(shù)據(jù)適度歷史數(shù)據(jù)優(yōu)化處理海量數(shù)據(jù)、數(shù)數(shù)據(jù)探索便于訪問

43、分析、快快速查詢索引高度索引高度索引數(shù)據(jù)集市可以分分為兩種類型型:獨立型數(shù)據(jù)據(jù)集市和從屬屬型數(shù)據(jù)集市市。獨立型數(shù)數(shù)據(jù)集市直接接從操作型環(huán)環(huán)境獲取數(shù)據(jù)據(jù),從屬型數(shù)數(shù)據(jù)集市從企企業(yè)級數(shù)據(jù)倉倉庫獲取數(shù)據(jù)據(jù)。作為快速解決企企業(yè)當前存在在的實際問題題的一種有效效方法,獨立立型數(shù)據(jù)集市市成為一種既既成事實。獨獨立型數(shù)據(jù)集集市是為滿足足特定用戶的的需求而建立立的一種分析析型環(huán)境,它它能夠快速地地解決某些具具體的問題,而而且投資規(guī)模模也比數(shù)據(jù)倉倉庫小很多。但獨立數(shù)據(jù)集市市也存在一些問題:冗余數(shù)據(jù)。隨著著獨立數(shù)據(jù)集集市數(shù)量的增增長,數(shù)據(jù)冗冗余量也不斷斷增長,這種種冗余是由于于每個獨立數(shù)數(shù)據(jù)集市都有有一個整體數(shù)數(shù)

44、據(jù)的備份而而引起的,但但這些數(shù)據(jù)中中有不少通常常并不是必需需的。冗余流程。數(shù)據(jù)據(jù)倉庫的體系系結(jié)構(gòu)可以對對所有數(shù)據(jù)集集市的共同活活動進行集中中化,沒有數(shù)數(shù)據(jù)倉庫,這這些流程就必必須為每個數(shù)數(shù)據(jù)集市進行行復制,這將將大大增加維維護DSS所所需的員工數(shù)數(shù)量。較低的可伸縮性性。獨立數(shù)據(jù)集集市直接讀取取運作系統(tǒng)的的文件或表,這這極大限制了了DSS的伸伸縮能力。非集成。獨立數(shù)數(shù)據(jù)集市是由由自成體系的的團隊建立的的,而且一般般是為不同的的部門建立的的,導致這些些數(shù)據(jù)集市沒沒有進行集成成,而且沒有有一個會包含含了整個企業(yè)業(yè)的視圖。因因此,如果CCEO讓信息息部門提供一一個獲利能力力最強的客戶戶列表,那么么從每

45、個數(shù)據(jù)集集市分析到的答案案都將是不同的。獨立型數(shù)據(jù)集市市的存在會給給人造成一種種錯覺,似乎乎可以先獨立立地構(gòu)建數(shù)據(jù)據(jù)集市,當數(shù)數(shù)據(jù)集市達到到一定的規(guī)模模再直接轉(zhuǎn)換換為數(shù)據(jù)倉庫庫。實際上多個獨獨立的數(shù)據(jù)集集市的累積,是是不能形成一一個企業(yè)級的的數(shù)據(jù)倉庫的的。如果企業(yè)最最終想建設一一個全企業(yè)統(tǒng)統(tǒng)一的數(shù)據(jù)倉倉庫,想要以以整個企業(yè)的的視圖分析數(shù)數(shù)據(jù),獨立型型數(shù)據(jù)集市恐恐怕不是合適適的選擇?,F(xiàn)現(xiàn)在的業(yè)內(nèi)人人士普遍認為為,從屬型數(shù)數(shù)據(jù)集市在體體系結(jié)構(gòu)上比比獨立型數(shù)據(jù)據(jù)集市更穩(wěn)定定,可以作為為數(shù)據(jù)集市未未來建設的主主要方向。從屬型數(shù)據(jù)集市市不過是在數(shù)數(shù)據(jù)倉庫與最最終用戶之間間又增加了一一套匯集、優(yōu)優(yōu)化系統(tǒng)。

46、這這樣的設計也也許對提高整整個系統(tǒng)的反反應速度方面面有一定幫助助,但卻削弱弱了數(shù)據(jù)集市市相當重要的的一項優(yōu)勢廉價。其其成本甚至超超過了單一數(shù)數(shù)據(jù)倉庫系統(tǒng)統(tǒng),不利于此此類技術(shù)的大大眾化、平民民化發(fā)展。另另一種比較理理想的方式是是,企業(yè)先就就其最急需的的領域建立獨獨立型數(shù)據(jù)集集市,而后隨隨著需求的變變化、實力的的增強逐步建建立更多的數(shù)數(shù)據(jù)集市。這這些數(shù)據(jù)集市市之間保持一一種高度的統(tǒng)統(tǒng)一與協(xié)調(diào)機機制,構(gòu)成一一個完整的群群體,我把它它稱作數(shù)據(jù)集市市群。數(shù)據(jù)集市群的優(yōu)優(yōu)勢主要表現(xiàn)現(xiàn)在以下幾方方面:成本低廉初始成本為初始始數(shù)據(jù)集市的的成本加上集集市群控制器器的成本。雖雖然比只有幾幾個數(shù)據(jù)集市市的成本高,但

47、但與數(shù)據(jù)倉庫庫相比還是便便宜很多。而而且其投入產(chǎn)產(chǎn)出比也更容容易預測。冗余度低由于加入了集市市群控制器,各各數(shù)據(jù)集市中中的數(shù)據(jù)被統(tǒng)統(tǒng)一調(diào)度,統(tǒng)統(tǒng)一規(guī)劃。從從而消除了數(shù)數(shù)據(jù)集市件容容易發(fā)生的數(shù)數(shù)據(jù)冗余、不不一致等問題題。后期維護容易當集市群因某種種需求而要加加入新的數(shù)據(jù)據(jù)集市時,所所要考慮的問問題僅是新的的模塊需要那那些數(shù)據(jù),原原有集市群能能提供那些數(shù)數(shù)據(jù)。根據(jù)這這兩點去設計計新的數(shù)據(jù)集集市,而不必必對原有集市市群做什么調(diào)調(diào)整。(4)數(shù)據(jù)集市市群策劃和設設計數(shù)據(jù)集市群的建建立需要前期期的精心策劃劃、設計和標標準化的接口口設計。只有有解決好這些些問題,才能能保證以后新新建的集市能能夠與原來的的群順

48、利實現(xiàn)現(xiàn)對接及整體體效果最佳。目目前看來這還還是一項相當當復雜的工程程,但其一旦旦實現(xiàn),給數(shù)數(shù)據(jù)倉庫行業(yè)業(yè)帶來的震動動將是難以想想象的。信息源信息源數(shù)據(jù)集市信息源數(shù)據(jù)倉庫數(shù)據(jù)集市數(shù)據(jù)集市信息源數(shù)據(jù)集市數(shù)據(jù)集市控制器圖1-1 獨立型數(shù)據(jù)集市圖1-2 從屬型數(shù)據(jù)集市圖1-3 數(shù)據(jù)集市群1.6.4 基基于Inteernet22、光處理器器計算機和GGGG技術(shù)的的DW(1)Inteernet221996年由一一些大學和高高科技公司組組成的聯(lián)盟開開發(fā)的,旨在在提供超高速速的連接速度度,該項目的的目標是領先先于商用互聯(lián)聯(lián)網(wǎng)3-4年年的時間。目目前的Intternett2已經(jīng)是第第三代了,今今年早些時候候,

49、其骨干網(wǎng)網(wǎng)的數(shù)據(jù)傳輸輸速率已經(jīng)升升級為10GGbps。目目前大部分的的公共互聯(lián)網(wǎng)網(wǎng)使用2.55Gbps,一一些運營商正正在將它們的的連接升級至至10Gbpps。P2P應用、高高清晰視頻會會議、實驗室室設備的遠程程操作、分布布式計算等應應用都可以在在Interrnet2上上運行。目前前,由于受帶帶寬的限制,這這些應用的大大規(guī)模部署還還很緩慢,而而Interrnet2則則能夠滿足這這些應用對帶帶寬的需求。通通過Inteernet22進行的音樂樂會轉(zhuǎn)播每秒秒鐘能夠發(fā)送送250GBB的數(shù)據(jù),這這比標準的撥撥號連接要快快4000倍倍,比有線電電視連接要快快800倍。研究人員仍然在在研究如何進進一步提高I

50、Internnet2的效效率和速度的的問題。研究究人員還在開開發(fā)新的中間間件技術(shù),使使通過網(wǎng)絡的的協(xié)作更無縫縫更安全。在在目前的互聯(lián)聯(lián)網(wǎng)上,應用用程序本身必必須提供中間間件所提供的的識別、授權(quán)權(quán)、安全等服服務。通過語語言標準化和和兼容性,中中間件將大大大提高先進網(wǎng)網(wǎng)絡應用的易易用性。在過去的15年年中,互聯(lián)網(wǎng)網(wǎng)的速度每年年都會翻一番番。研究人員員相信,這種種每年增長1100%的趨趨勢在未來還還會持續(xù)下去去。Inteernet22的研究人員員已經(jīng)在研究究新一代的超超高速網(wǎng)絡。速速度為10GGbps的AAbilenne網(wǎng)絡的平平均運行速度度為1Gbpps-2Gbbps。另外外在高等教育育領域,用戶

51、戶對帶寬的需需求的增長將將呈幾何級數(shù)數(shù)增長,因此此新應用的需需求將超過目目前的公共IIP網(wǎng)絡的帶帶寬也是很自自然的。(2)未來高性性能計算機按照摩爾定律,每每過18個月月,微處理器器硅芯片上晶晶體管的數(shù)量量就會翻一番番。隨著大規(guī)規(guī)模集成電路路工藝的發(fā)展展,芯片的集集成度越來越越高,也越來來越接近工藝藝甚至物理的的上限,最終終,晶體管會會變得只有幾幾個分子那樣樣小。以摩爾爾速度發(fā)展的的微處理器使使全世界的微微電子技術(shù)專專家面臨著新新的挑戰(zhàn)。盡盡管傳統(tǒng)的、基基于集成電路路的計算機短短期內(nèi)還不會會退出歷史舞舞臺,但旨在在超越它的超超導計算機、納納米計算機、光光計算機、DDNA計算機機和量子計算算機正

52、在躍躍躍欲試。與傳傳統(tǒng)硅芯片計計算機不同,光光計算機用光光束代替電子子進行運算和和存儲:它以以不同波長的的光代表不同同的數(shù)據(jù),以以大量的透鏡鏡、棱鏡和反反射鏡將數(shù)據(jù)據(jù)從一個芯片片傳送到另一一個芯片。 從上個世紀800年代起,光光子計算機就就成為新一代代計算機的發(fā)發(fā)展方向。22003年10月底,全全球首枚嵌入入光核心的商商用向量光學學數(shù)字處理器器由以色色列一公司研發(fā)的的Enligght在美國國波士頓軍事事通信展覽會會上露面,引引起了業(yè)界莫莫大的關注。因因為,它的出出現(xiàn)預示著計計算機將進入入光學時代。以以光速進行計計算,運行速速度達到每秒秒8萬億次這相當于一一臺超級計算算機的運算能能力。但超級級計

53、算機動輒輒采用上千個個處理器同時時工作,才能能實現(xiàn)這樣的的運算速度。以以去年問世的的“地球模擬擬器”為例,這這臺號稱全球球運算速度最最快的超級計計算機峰值運運算速度為335.86萬萬億次,而這這個速度是由由它的51220個處理器器共同創(chuàng)造出出來的。由于Enligght強大的的性能,能夠夠被廣泛運用用在大型多媒媒體廣播系統(tǒng)統(tǒng)、機場安全全檢查系統(tǒng)和和醫(yī)學數(shù)據(jù)庫庫系統(tǒng)等方面面。比如在移移動通信領域域,采用Ennlightt進行多用戶戶檢測,即通通過重復計算算一系列方程程式,能解除除同一基站內(nèi)內(nèi)用戶間的相相互干擾。一一枚單獨的EEnlighht就可以同同時支持20000個用戶戶,并避免相相互干擾。而而

54、在生物科技技方面,Ennlightt強大的運算算能力,可以以大大縮短生生物技術(shù)運算算必需的基因因數(shù)據(jù)配對和和基因與多基基體配對過程程?!肮庾舆\算具有有巨大的潛力力,能夠做常常規(guī)計算無法法辦到的事。”德德國達姆施塔塔特大學的科科爾內(nèi)利婭登茨博士長長期致力于光光計算研究。她她表示,采用用光學技術(shù)不不但可以極大大地提升計算算機的運算速速度,而且可可以讓計算機機系統(tǒng)模擬人人腦的思維活活動,并且比比人腦的處理理速度快上數(shù)數(shù)千倍,從而而實現(xiàn)真正的的人工智能??瓶茖W家的預測測不是沒有依依據(jù)的。到22015年,硅硅芯片的運算算速度和微型型化發(fā)展都將將止步不前。而而與此同時,網(wǎng)網(wǎng)絡和其他行行業(yè)發(fā)展帶來來的海量數(shù)

55、據(jù)據(jù)運算需要和和更快的傳輸輸需求,將迫迫使人們不得得不尋求革命命性的變革。(3)網(wǎng)格技術(shù)術(shù)網(wǎng)格計算因為在在結(jié)構(gòu)上酷似似電力網(wǎng)絡而而得名。在九九十年代中期期,網(wǎng)格作為為一種共享計計算的方法被被正式提出,并并首先在科研研領域應用。后后來,為了降降低成本,很很多企業(yè)也打打算利用閑置置的資源,網(wǎng)網(wǎng)格開始逐步步進入商業(yè)市市場,并由此此為許多產(chǎn)業(yè)業(yè)帶來了新的的機遇。網(wǎng)格技術(shù)是一種種趨勢,這是是毋庸置疑的的。就像計算算機最初是大大型主機,發(fā)發(fā)展到更加通通用的小型機機,現(xiàn)在則又又有了更多的的選擇。這其其中有成本的的原因,有硬硬件技術(shù)的發(fā)發(fā)展,也說明明大家都在期期待一個更加加開放的平臺臺。網(wǎng)格技術(shù)術(shù)正是這種趨趨

56、勢發(fā)展的一一個必然。盡管網(wǎng)格的發(fā)展展還面臨很大大的困難,有有業(yè)內(nèi)人士說說,“網(wǎng)格的處境境就好像100年前的Innterneet和3年前前的Linuux一樣,正正在從技術(shù)計計算進入商業(yè)業(yè)計算。”但是,曾經(jīng)經(jīng)價格高昂的的網(wǎng)格計算已已經(jīng)進入各個個組織機構(gòu)及及跨國公司,廣廣泛應用到金金融和工程仿仿真,醫(yī)學研研究和石油勘勘探領域,發(fā)發(fā)揮著巨大的的作用:汽車車制造商們正正實施更多的的模擬程序以以使汽車更安安全;娛樂公公司更細致地地描繪數(shù)字人人像以求逼真真的效果對企業(yè)來說說,網(wǎng)格無疑疑是極具價值值的工具,未未來幾年,將將會有更多的的網(wǎng)格進入市市場。為了在未來的發(fā)發(fā)展潮流中占占據(jù)有利的戰(zhàn)戰(zhàn)略地位,世世界各國都

57、紛紛紛加緊了網(wǎng)網(wǎng)格研究的步步伐。 一些些發(fā)達國家和和跨國公司已已為此投下了了巨資。在具具體實施中,IIBM全球服服務部和其業(yè)業(yè)務合作伙伴伴一起,共同同提供各種與與網(wǎng)格有關的的服務,包括括一個網(wǎng)格創(chuàng)創(chuàng)新工作室(用于幫助企企業(yè)在其業(yè)務務中實施網(wǎng)格格)以及專業(yè)業(yè)化的行業(yè)專專用課程。在在產(chǎn)品方面,IIBM eSServerr產(chǎn)品線也形形成了一個可可以用來設計計和開發(fā)網(wǎng)格格解決方案、甚甚至管理整個個網(wǎng)格的堅實實平臺;其 DB2產(chǎn)品品和工具也支支持網(wǎng)格計算算解決方案,使使得能快速、方方便地建設復復雜的數(shù)據(jù)基基礎設施。(4)數(shù)據(jù)倉庫庫、聯(lián)機系統(tǒng)統(tǒng)的發(fā)展根據(jù)長久以來的的經(jīng)驗,計算算機的軟硬件件發(fā)展一直是是互相

58、促進、互互為動力的。以以上所述的未未來高性能計計算機、Innterneet2、網(wǎng)格格技術(shù)等等已已經(jīng)為我們勾勾勒出了一幅幅美好的畫面面。更強大的的計算工作站站、驚人的信信息傳輸速度度、更優(yōu)化的的網(wǎng)絡協(xié)調(diào)機機制,這些無無疑都給未來來軟件業(yè)的發(fā)發(fā)展帶來了更更廣闊的施展展空間。就如如同現(xiàn)在的PPC機使用的的內(nèi)存,比110年前硬盤盤的存儲容量量還大一樣。許許許多多現(xiàn)在在認為不可能能實現(xiàn)或相當當復雜的工作作,對那時的的計算機系統(tǒng)統(tǒng)來說不過是是小兒科而以以。到那時對對一個包含55千萬條記錄錄的DW作一一次完整分析析,也僅僅需需要幾秒鐘的的時間。所以我們有理由由相信在新一一代的應用系系統(tǒng)中,數(shù)據(jù)據(jù)倉庫將在一一

59、開始便被納納入系統(tǒng)設計計的考慮,聯(lián)聯(lián)機分析會應應用于普遍的的事務處理系系統(tǒng)之中。在在數(shù)據(jù)管理上上,聯(lián)機事務務處理和數(shù)據(jù)據(jù)倉庫在應用用中相對獨立立,使聯(lián)機事事務處理系統(tǒng)統(tǒng)本身更加簡簡潔高效,同同時分析統(tǒng)計計也更為便利利。面向行業(yè)業(yè)的數(shù)理統(tǒng)計計學向更為普普遍的應用發(fā)發(fā)展,并集成成到應用系統(tǒng)統(tǒng)的數(shù)據(jù)倉庫庫解決方案中中。它們將立立足于數(shù)據(jù)倉倉庫提供的豐豐富信息,更更好地為業(yè)務務決策服務。1.7建設數(shù)據(jù)據(jù)倉庫的必要要性企業(yè)建立數(shù)據(jù)倉倉庫是為了填填補現(xiàn)有數(shù)據(jù)據(jù)存儲形式已已經(jīng)不能滿足足信息分析的的需要。數(shù)據(jù)據(jù)倉庫理論中中的一個核心心理念就是:事務型數(shù)據(jù)據(jù)和決策支持持型數(shù)據(jù)的處處理性能不同同。企業(yè)在它它們的事

60、務操操作收集數(shù)據(jù)據(jù)。在企業(yè)運運作過程中:隨著定單、銷售記錄錄的進行,這這些事務型數(shù)數(shù)據(jù)也連續(xù)的的產(chǎn)生。為了了引入數(shù)據(jù),我我們必須優(yōu)化化事務型數(shù)據(jù)據(jù)庫。處理決決策支持型數(shù)數(shù)據(jù)時,一些些問題經(jīng)常會會被提出:哪哪類客戶會購購買哪類產(chǎn)品品?促銷后銷銷售額會變化化多少?等,事務型數(shù)數(shù)據(jù)庫可以為為這些問題作作出解答,但但是它所給出出的答案往往往并不能讓人人十分滿意。在在運用有限的的計算機資源源時常常存在在著競爭。在在增加新信息息的時候我們們需要事務型型數(shù)據(jù)庫是空空閑的。而在在解答一系列列具體的有關關信息分析的的問題的時候候,系統(tǒng)處理理新數(shù)據(jù)的有有效性又會被被大大降低。另另一個問題就就在于事務型型數(shù)據(jù)總是在

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論