




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第5章
數(shù)據(jù)倉庫系統(tǒng)的實施SQLServer2000數(shù)據(jù)倉庫設計與使用其他一些公司的數(shù)據(jù)倉庫實施戰(zhàn)略數(shù)據(jù)倉庫的投資回報分析1第5章
數(shù)據(jù)倉庫系統(tǒng)的實施1SQLServer2000的基本服務SQLServer2000關系數(shù)據(jù)庫引擎:是一個流行的、具有高度可伸縮性和高度可靠性的數(shù)據(jù)存儲引擎。該數(shù)據(jù)庫引擎將數(shù)據(jù)存儲在表中。每個表上都列出感興趣的一些對象,每個表上的列表示由表建模的對象的屬性,而表上的行則代表由表建模的這種對象的事例。應用程序可以將結構化查詢語言(SQL)的語句提交給數(shù)據(jù)庫引擎,后者將表格格式的結果集返回給應用程序。SQLServer支持的特定SQL語言稱為Transact-SQL。應用程序還可以提交SQL語句或XPath查詢,并請求數(shù)據(jù)庫引擎以XML文檔形式返回結果。關系數(shù)據(jù)庫引擎具有高度的可伸縮性。SQLServer2000企業(yè)版可以支持多組數(shù)據(jù)庫服務器相互協(xié)作,構成可供上千用戶同時訪問的TB大小的數(shù)據(jù)庫。該引擎能夠處理世界上任何Web站點的流量。該數(shù)據(jù)庫引擎還能自我調節(jié),自動在連接到數(shù)據(jù)庫的用戶增多時獲取資源,并在用戶注銷后釋放資源。2SQLServer2000的基本服務SQLServeSQLServer2000的基本服務關系數(shù)據(jù)庫引擎具有高可靠性。在數(shù)據(jù)庫引擎的早期版本中要求停止和啟動的管理操作現(xiàn)在可以在引擎運行當中執(zhí)行,從而增加了可用性。數(shù)據(jù)庫引擎與Windows2000和WindowsNT?故障轉移群集的集成可定義虛擬服務器,即使節(jié)點中的一臺物理服務器出現(xiàn)故障,這些虛擬服務器仍然保持運行。在適當?shù)牡胤剑罩緜魉涂梢杂糜诰S護熱備用服務器。在故障發(fā)生的數(shù)分鐘內,熱備用服務器可以代替生產服務器運行。關系數(shù)據(jù)庫引擎具有高度的安全性。登錄身份驗證可以與Windows身份驗證集成在一起,這樣,密碼將不會存儲在SQLServer中,也不會通過網絡發(fā)送而被網絡嗅探器讀取。網站可以設置C2級審核,對所有訪問數(shù)據(jù)庫的用戶進行審核,還可以使用安全套接字層(SSL)加密的辦法,對所有在應用程序和數(shù)據(jù)庫間傳送的數(shù)據(jù)進行加密。3SQLServer2000的基本服務關系數(shù)據(jù)庫引擎具有SQLServer2000的基本服務數(shù)據(jù)庫引擎的分布式查詢功能??梢栽L問所有可通過OLEDB訪問的數(shù)據(jù)源中的數(shù)據(jù)。在Transact-SQL語句中,可以像引用實際駐留在SQLServer數(shù)據(jù)庫中的表一樣引用遠程OLEDB數(shù)據(jù)源表。此外,全文檢索功能可以對SQLServer數(shù)據(jù)庫或Windows文件中存儲的文本數(shù)據(jù)進行復雜的模式匹配。關系數(shù)據(jù)庫引擎能夠存儲由頂層聯(lián)機事務處理(OLTP)系統(tǒng)生成的所有事務的詳細記錄。該數(shù)據(jù)庫引擎還可以支持最大的聯(lián)機分析(OLAP)數(shù)據(jù)倉庫中的事實數(shù)據(jù)表和維度表的嚴格處理要求。MicrosoftSQLServer2000AnalysisServices提供分析數(shù)據(jù)倉庫和數(shù)據(jù)集市中存儲的數(shù)據(jù)的工具。AnalysisServices以多維數(shù)據(jù)集的形式顯示事實數(shù)據(jù)表和維度表中的數(shù)據(jù),從多維數(shù)據(jù)集中可以分析趨勢和其它對于規(guī)劃今后工作非常重要的信息。在AnalysisServices多維數(shù)據(jù)集上處理OLAP查詢比試圖在OLTP數(shù)據(jù)庫中記錄的詳細數(shù)據(jù)上進行同樣的查詢要快得多。4SQLServer2000的基本服務數(shù)據(jù)庫引擎的分布式SQLServer2000的特性Internet集成:SQLServer2000數(shù)據(jù)庫引擎提供完整的XML支持。它還具有構成最大的Web站點的數(shù)據(jù)存儲組件所需的可伸縮性、可用性和安全功能。其程序設計模型與WindowsDNA構架集成,用以開發(fā)Web應用程序,并且還支持EnglishQuery和Microsoft搜索服務等功能,在Web應用程序中包含了用戶友好的查詢和強大的搜索功能??缮炜s性和可用性:同一個數(shù)據(jù)庫引擎可以在不同的平臺上使用。SQLServer2000企業(yè)版支持聯(lián)合服務器、索引視圖和大型內存支持等功能,使其得以升級到最大Web站點所需的性能級別。企業(yè)級數(shù)據(jù)庫功能:SQLServer2000關系數(shù)據(jù)庫引擎能充分保護數(shù)據(jù)完整性,同時將管理上千個并發(fā)修改數(shù)據(jù)庫的用戶的開銷減到最小。其分布式查詢得以引用來自不同數(shù)據(jù)源的數(shù)據(jù),就好象這些數(shù)據(jù)是SQLServer2000數(shù)據(jù)庫的一部分,同時分布式事務支持充分保護任何分布式數(shù)據(jù)更新的完整性。復制功能可維護多個數(shù)據(jù)復本,同時確保單獨的數(shù)據(jù)復本保持同步。5SQLServer2000的特性Internet集成:SQLServer2000的特性易于安裝、部署和使用:SQLServer2000中包括一系列管理和開發(fā)工具,這些工具可改進在多個站點上安裝、部署、管理和使用SQLServer的過程。SQLServer2000還支持基于標準的、與WindowsDNA集成的程序設計模型,使SQLServer數(shù)據(jù)庫和數(shù)據(jù)倉庫的使用成為生成強大的可伸縮系統(tǒng)的無縫部分。這些功能可以快速交付SQLServer應用程序,使客戶只需最少的安裝和管理開銷即可實現(xiàn)這些應用程序。數(shù)據(jù)倉庫:SQLServer2000中包括析取和分析匯總數(shù)據(jù)以進行聯(lián)機分析處理(OLAP)的工具。SQLServer中還包括一些工具,可用來直觀地設計數(shù)據(jù)庫并通過EnglishQuery來分析數(shù)據(jù)。6SQLServer2000的特性易于安裝、部署和使用:SSQLServer2000組件關系圖
7SQLServer2000組件關系圖7SQLServer2000數(shù)據(jù)倉庫工具
工具描述關系數(shù)據(jù)庫數(shù)據(jù)倉庫設計、構造、維護的基礎數(shù)據(jù)轉換服務(DTS)用于向數(shù)據(jù)倉庫加載數(shù)據(jù)數(shù)據(jù)復制用于分布式數(shù)據(jù)倉庫數(shù)據(jù)分布和加載數(shù)據(jù)OLEDB提供應用程序與數(shù)據(jù)源的接口APIAnalysisServices用于采集和分析數(shù)據(jù)倉庫中的數(shù)據(jù)EnglishQuery提供使用英語查詢數(shù)據(jù)倉庫MetaDataServices瀏覽數(shù)據(jù)倉庫中的元數(shù)據(jù)PivotTable服務用于制定操作多維數(shù)據(jù)的客戶端接口8SQLServer2000數(shù)據(jù)倉庫工具工具描述關系數(shù)據(jù)關系型數(shù)據(jù)庫關系型數(shù)據(jù)庫是設計、構造、維護數(shù)據(jù)倉庫的基礎技術。MicrosoftSQLServer2000是一個關系型數(shù)據(jù)庫管理系統(tǒng),它提供了強大的數(shù)據(jù)庫引擎和許多工具,這些工具不僅可以用于數(shù)據(jù)庫的管理,而且可以用于數(shù)據(jù)倉庫的管理,是數(shù)據(jù)倉庫的技術基礎。9關系型數(shù)據(jù)庫關系型數(shù)據(jù)庫是設計、構造、維護數(shù)據(jù)倉庫的基礎技術數(shù)據(jù)轉換服務(DTS)提供數(shù)據(jù)轉換功能,例如數(shù)據(jù)引入、引出以及在SQLServer和任何OLEDB、ODBC或者文本文件之間轉換數(shù)據(jù)。利用DTS,通過交互式地或按照規(guī)劃自動地從多處異構數(shù)據(jù)源輸入數(shù)據(jù),這樣便有可能在SQLServer上建立數(shù)據(jù)倉庫和數(shù)據(jù)市場。數(shù)據(jù)的來源特性允許用戶輸入查詢數(shù)據(jù)的輸入時間、地點及其計算方法。數(shù)據(jù)的引入引出是通過以相同的格式讀寫數(shù)據(jù),在應用程序之間交換數(shù)據(jù)的過程。一次轉換是指在源數(shù)據(jù)被存儲到目的地之前,對其進行的一系列操作。轉換特性使得載引入引出中完成復雜數(shù)據(jù)的驗證、清除等功能變得非常簡單。定制轉換對象可以被創(chuàng)建并集成進第三方產品中。DTS支持多步封裝,其中大量文件能被單獨處理,最終被集成為一個單一的文件。在目的地,該文件的記錄能被系統(tǒng)分為多個記錄,或相反,多個記錄被集成為一個單一的記錄。DTS也與微軟的中心庫集成在一起,微軟數(shù)據(jù)中心庫存儲元數(shù)據(jù)、數(shù)據(jù)傳送包和數(shù)據(jù)源特性,許多獨立的軟件經銷商支持和共享這個元數(shù)據(jù)模型。數(shù)據(jù)轉換服務可以在SQLServer間移動數(shù)據(jù)結構、數(shù)據(jù)、觸發(fā)器、規(guī)則、默認、約束和用戶定義的數(shù)據(jù)類型,只有數(shù)據(jù)結構和數(shù)據(jù)可以在不同的異構數(shù)據(jù)源中間傳遞。10數(shù)據(jù)轉換服務(DTS)提供數(shù)據(jù)轉換功能,例如數(shù)據(jù)引入、引出以數(shù)據(jù)復制數(shù)據(jù)復制:是一種實現(xiàn)數(shù)據(jù)分布的方法,就是指把一個系統(tǒng)中的數(shù)據(jù)通過網絡分布到另外一個或者多個地理位置不同的系統(tǒng)中,以適應可伸縮組織的需要,減輕主服務器的工作負荷和提高數(shù)據(jù)的使用效率。數(shù)據(jù)復制的過程類似于報紙雜志的出版過程,即把信息從信息源迅速傳送到信息接受處。出版服務器包含了將要復制的數(shù)據(jù)所在的數(shù)據(jù)庫,該服務器負責制作將要出版的數(shù)據(jù),然后將這些出版的數(shù)據(jù)的所有變化發(fā)送到分布服務器中。訂閱服務器是數(shù)據(jù)復制的目標地,負責接收復制過來的數(shù)據(jù),并且負責接收從出版服務器上傳送過來的全部變化。分布服務器在出版服務器和訂閱服務器之間起中介作用。分布服務器負責從出版服務器中接受復制過來的數(shù)據(jù),然后在該服務器上的分布數(shù)據(jù)庫中存儲這些變化,最后按照指定的時間間隔推向響應的訂閱服務器。在復制過程中,把將要復制的數(shù)據(jù)稱為出版物和文章。文章是復制的基本單元,是組成出版物的最小單位。文章與數(shù)據(jù)庫中的表對應。文章既可以對應一個表中的全部數(shù)據(jù),也可以指包括表中的一部分數(shù)據(jù)。出版物是一個完整的將要復制的內容,它包括一篇或多篇文章,是訂閱服務器訂閱的對象。11數(shù)據(jù)復制數(shù)據(jù)復制:是一種實現(xiàn)數(shù)據(jù)分布的方法,就是指把一個系統(tǒng)OLEDBOLEDB式微軟開發(fā)的數(shù)據(jù)訪問編程界面。微軟已經定位OLEDB是ODBC繼承者,ODBC主要用于處理關系型數(shù)據(jù)。ODBC是基于SQL的,它可以很好的用于關系型數(shù)據(jù)庫訪問,但是它不能用于非關系型數(shù)據(jù)源。象ODBC一樣,OLEDB也提供對關系型數(shù)據(jù)的訪問,但是OLEDB擴展了由ODBC提供的功能。OLEDB的設計目的是用于所有數(shù)據(jù)類型的標準界面。除了關系型數(shù)據(jù)庫的訪問,OLEDB提供對各種各樣數(shù)據(jù)源的訪問,包括Excel電子表格的數(shù)據(jù),dBase的ISAM文件、電子郵件、新的NT的ActiveDirectory和IBM的DB2數(shù)據(jù)。使用OLEDB,用一個界面就可以訪問許多不同的數(shù)據(jù)源。OLEDB是微軟的數(shù)據(jù)訪問策略,稱為萬能數(shù)據(jù)訪問的基礎。萬能數(shù)據(jù)訪問指的是一組通用界面,它用來表示來自任何數(shù)據(jù)源的數(shù)據(jù)。OLEDB是使萬能訪問成為現(xiàn)實的技術。萬能數(shù)據(jù)訪問和OLEDB的另一方面是所有的對象都應該在數(shù)據(jù)庫中維護,不是企圖把商業(yè)要求的不同的數(shù)據(jù)移動到一個面向對象的數(shù)據(jù)庫中。OLEDB創(chuàng)建和理解企業(yè)數(shù)據(jù)并且在各種數(shù)據(jù)源中維護。12OLEDBOLEDB式微軟開發(fā)的數(shù)據(jù)訪問編程界面。微軟已AnalysisServices在數(shù)據(jù)倉庫或者數(shù)據(jù)市場中的信息可OLAP處理,OLAP可以有效的以維度和度量組成的立方體方式察看數(shù)據(jù)。維度是一種描述性分類,例如,維度可能是地理位置,也可能是產品類型。度量是一種定量數(shù)值,例如銷售額、庫存量或者總費用。來自于原始數(shù)據(jù)源的合計存儲在每一個立方體單元中,這種組織數(shù)據(jù)的方法可以輕易得過濾數(shù)據(jù)、有效的加快數(shù)據(jù)的查詢。然而,存在著這種問題:雖然OLAP合計是在數(shù)據(jù)倉庫中可以達到的查詢性能的關鍵因素,但是存儲這些合計數(shù)據(jù)的成本是磁盤存儲量。事實上,合計數(shù)據(jù)量可以輕易的超過原有的數(shù)據(jù)量。另外,當維度和合計量提高時,所要求的OLAP數(shù)據(jù)存儲量也大大的提高。這種對存儲量的極大要求一般稱為數(shù)據(jù)爆炸。OLAP描述的是一種多維數(shù)據(jù)服務,這種服務的設計目的是保證分析員、經理和決策者針對特定的問題,通過快速、一致、交互式的實時數(shù)據(jù)訪問和分析。13AnalysisServices在數(shù)據(jù)倉庫或者數(shù)據(jù)市場中的AnalysisServicesMOLAP:多維型OLAP在一個用于壓縮索引的永久數(shù)據(jù)存儲中存儲維度數(shù)據(jù)和實時數(shù)據(jù)。合計存儲用來加快數(shù)據(jù)訪問。MOLAP查詢引擎是專有的,而且優(yōu)化成由MOLAP數(shù)據(jù)存儲使用的存儲格式。MOLAP提供了比ROLAP更快的查詢處理速度,并且要求更少的存儲空間。然而,它不能較好的伸縮,并且要求使用單獨的數(shù)據(jù)庫來存儲。ROLAP:關系型OLAP在關系型數(shù)據(jù)表中存儲合計。ROLAP針對關系型數(shù)據(jù)庫的應用允許其利用已有的數(shù)據(jù)庫資源,并且允許ROLAP應用程序很好的伸縮。然而,ROLAP使用表存儲合計則要求比MOLAP更多的磁盤空間,速度相對比較慢。HOLAP:正如其名稱所示,混合型OLAP介于MOLAP和ROLAP之間。象ROLAP一樣,HOLAP將主數(shù)據(jù)存儲在源數(shù)據(jù)庫中。象MOLAP一樣,HOLAP把合計存儲在一個永久性數(shù)據(jù)存儲的地方,它與主關系數(shù)據(jù)庫分開。這種混合形式使HOLAP可以具備MOLAP和ROLAP兩者的優(yōu)點。14AnalysisServicesMOLAP:多維型OLAPEnglishQuery微軟的英語查詢環(huán)境允許設計者將他們的關系數(shù)據(jù)庫轉移到英語查詢上來,這給最終用戶提供了使用英語提出問題而不是用SQL語言進行查詢的能力。EnglishQuery服務是利用英語查詢域編輯器創(chuàng)建的,提供了數(shù)據(jù)庫的有關信息,從而使EnglishQuery可用于處理關于特殊表、域和數(shù)據(jù)的英語問題。15EnglishQuery微軟的英語查詢環(huán)境允許設計者將他們MetaDataServices在MicrosoftSQLServer2000中,許多工具把元數(shù)據(jù)存儲在位于msdb系統(tǒng)數(shù)據(jù)庫中的集中式中心倉庫中。這里提到的元數(shù)據(jù)是指數(shù)據(jù)的數(shù)據(jù),MetaDataServices提供瀏覽這些元數(shù)據(jù)的功能。數(shù)據(jù)中心庫提供了一個通用的位置:可以用來存放對象和對象之間的關系。通過使用一些軟件工具,可以描述面向對象的信息:軟件工具使用各類對象組成的信息。對象接口界面,界面由屬性、方法和集合組成,集合包含了對其他界面的關系,以及關聯(lián)對象。16MetaDataServices在MicrosoftSPivotTable服務PivotTable服務和AnalysisServices一起為用戶提供客戶端對OLAP數(shù)據(jù)的存取。PivotTable服務運行于客戶端工作站上,它使得可以利用VisualBasic或其他語言來開發(fā)用戶程序,這些程序可以利用OLEDB技術,并使用AnalysisServices中的OLAP數(shù)據(jù)或直接取自關系數(shù)據(jù)庫的數(shù)據(jù)。當它和OLAP服務一起使用時,PivotTable服務可以自動將進程或緩沖內存分配到最合適的位置,并且允許多個客戶動態(tài)存取同一個立方體。PivotTable服務業(yè)能在本地客戶機上存儲數(shù)據(jù),從而使用戶可以在不連接AnalysisServices的情況下對數(shù)據(jù)進行分析。這種移動式的解決方案允許分析者將數(shù)據(jù)帶回家或在途中進行分析。為最終用戶提供的OLAP數(shù)據(jù)分析和描述工具可以利用PivotTable服務進行開發(fā)。PivotTable服務也提供了開放的界面,獨立的軟件銷售商可以利用它來開發(fā)第三方應用的產品。17PivotTable服務PivotTable服務和Analy數(shù)據(jù)倉庫的實現(xiàn)步驟明確用戶需求設計和建立數(shù)據(jù)倉庫使用數(shù)據(jù)倉庫維護和優(yōu)化數(shù)據(jù)倉庫18數(shù)據(jù)倉庫的實現(xiàn)步驟明確用戶需求18數(shù)據(jù)倉庫生命周期管理數(shù)據(jù)倉庫系統(tǒng)框架影響數(shù)據(jù)倉庫項目成功的因素數(shù)據(jù)倉庫的技術數(shù)據(jù)倉庫項目所需的角色19數(shù)據(jù)倉庫生命周期管理數(shù)據(jù)倉庫系統(tǒng)框架19數(shù)據(jù)倉庫系統(tǒng)框架基本特點擁有為項目作出技術決策的觀察點擁有確定項目是否能夠完成的計量參照點擁有以靈活方式運用現(xiàn)有知識的能力分部分、分階段依靠多個工作小組協(xié)調完成四個階段設想階段規(guī)劃階段開發(fā)階段穩(wěn)定階段20數(shù)據(jù)倉庫系統(tǒng)框架基本特點20影響數(shù)據(jù)倉庫項目成功的因素數(shù)據(jù)倉庫創(chuàng)建前的影響因素管理層的信任從管理項目開始:面向主題交流實現(xiàn)目標任命一個面向用戶的項目經理數(shù)據(jù)倉庫創(chuàng)建時的影響因素采用成熟的技術注重查詢而不是注重事務只加載所需數(shù)據(jù)定義合適的數(shù)據(jù)源:元數(shù)據(jù)映射明確定義主題數(shù)據(jù)倉庫創(chuàng)建后的影響因素面向決策的使用者的信任21影響數(shù)據(jù)倉庫項目成功的因素數(shù)據(jù)倉庫創(chuàng)建前的影響因素21數(shù)據(jù)倉庫的技術管理大量的數(shù)據(jù)管理多介質索引和監(jiān)視數(shù)據(jù)多種技術的接口對數(shù)據(jù)存放位置的控制數(shù)據(jù)的并行存儲和管理元數(shù)據(jù)管理技術語言接口數(shù)據(jù)的高效裝入高效索引的利用技術數(shù)據(jù)壓縮技術復合鍵碼技術變長數(shù)據(jù)鎖管理切換技術快速恢復技術其他技術:事務集成性、高速緩存、行/頁級鎖定、引用完整性、 數(shù)據(jù)視圖等22數(shù)據(jù)倉庫的技術管理大量的數(shù)據(jù)22數(shù)據(jù)倉庫項目所需的角色管理角色項目主管項目經理技術角色數(shù)據(jù)提供專家體系結構設計者數(shù)據(jù)庫管理員數(shù)據(jù)遷移專家數(shù)據(jù)轉換專家數(shù)據(jù)集市開發(fā)的領導人質量保證/測試專家維護角色內行的用戶培訓教師技術文檔編寫人員工具專家銷售商聯(lián)系人23數(shù)據(jù)倉庫項目所需的角色管理角色23創(chuàng)建數(shù)據(jù)倉庫向導24創(chuàng)建數(shù)據(jù)倉庫向導24創(chuàng)建數(shù)據(jù)倉庫向導25創(chuàng)建數(shù)據(jù)倉庫向導25創(chuàng)建數(shù)據(jù)倉庫向導26創(chuàng)建數(shù)據(jù)倉庫向導26創(chuàng)建數(shù)據(jù)倉庫向導27創(chuàng)建數(shù)據(jù)倉庫向導27完成創(chuàng)建數(shù)據(jù)倉庫28完成創(chuàng)建數(shù)據(jù)倉庫28創(chuàng)建事實維度表
29創(chuàng)建事實維度表29創(chuàng)建事實維度表30創(chuàng)建事實維度表30屬性選項卡31屬性選項卡31屬性選項卡32屬性選項卡32創(chuàng)建數(shù)據(jù)庫關系圖向導33創(chuàng)建數(shù)據(jù)庫關系圖向導33關系圖34關系圖34多維數(shù)據(jù)集向導35多維數(shù)據(jù)集向導35多維數(shù)據(jù)集36多維數(shù)據(jù)集36多維數(shù)據(jù)集37多維數(shù)據(jù)集37數(shù)據(jù)倉庫軟件市場1993~1998平均年增23.9%,達22億美元。數(shù)據(jù)值入工具:從數(shù)據(jù)庫中提取數(shù)據(jù),轉換為數(shù)據(jù)倉庫格式并送入數(shù)據(jù)倉庫中。數(shù)據(jù)過濾工具:對數(shù)據(jù)倉庫中的數(shù)據(jù)進行存放和管理。數(shù)據(jù)存取工具:讓用戶存取數(shù)據(jù)倉庫中的數(shù)據(jù)。數(shù)據(jù)倉庫市場劃分軟件總市場69493-124166@12。3%數(shù)據(jù)存取663-1258@13.7%第三代語言/公用程序3061-6019@14.5%CASE1751-3085@12.5%DBMS5801-11680%15.0%其它市場58163-102124@11.9%數(shù)據(jù)存取663-1258@13.7%數(shù)據(jù)提取/轉換31-232@49.3%數(shù)據(jù)管理59-708@64.3%數(shù)據(jù)倉庫753-2198@23.9%數(shù)據(jù)復制14-319@87.1%注:***-***@***%指1993年-1998年銷售額(M$)@年遞增率38數(shù)據(jù)倉庫軟件市場1993~1998平均年增23.9%,達2(1)動態(tài)可伸縮的數(shù)據(jù)庫系統(tǒng)(DSA)存放大量數(shù)據(jù):幾個GB到幾個TBPDQ(并行數(shù)據(jù)查詢)技術:實現(xiàn)數(shù)據(jù)查詢、索引掃描。索引建立、數(shù)據(jù)修改、備份恢復等數(shù)據(jù)庫操作的并發(fā)處理支持所有開放系統(tǒng)硬件環(huán)境:單CPUSMP(對稱多處理器)Cluster(松耦合群體系統(tǒng))MPP(大規(guī)模并行系統(tǒng))批處理操作數(shù)據(jù)事務處理操作數(shù)據(jù)外部數(shù)據(jù)數(shù)據(jù)倉庫管理軟件開放系統(tǒng)平臺元數(shù)據(jù)目標數(shù)據(jù)庫數(shù)據(jù)存取工具INFORMIX-ONLINE動態(tài)服務器INFORMIX的數(shù)據(jù)倉庫戰(zhàn)略39(1)動態(tài)可伸縮的數(shù)據(jù)庫系統(tǒng)(DSA)批處理事務處理外部數(shù)SybaseWarehouseWorks體系結構(1)C/S環(huán)境下的數(shù)據(jù)倉庫框架聯(lián)機事務處理子系統(tǒng)部門數(shù)據(jù)部門數(shù)據(jù)局部倉庫局部倉庫中央倉庫個人使用個人使用決策支持數(shù)據(jù)分布的靈活性要求(2)Sybase支持數(shù)據(jù)分布的方法EnterpriseCONNECT互操作體系結構:并發(fā)方法、異構數(shù)據(jù)分布、信息打包ReplicationServer的基于事件的事件捕捉功能基于時間調度方式的批時間拷貝方案(3)高速的時間訪問NavigationServer(導航服務器)SQLServer中增加interactionQuery(IQ)Accelerator進行隨機高速查詢SybaseOmniSQLServer提供時間訪問透明性推薦125種無縫存取數(shù)據(jù)的工具40SybaseWarehouseWorks體系結構聯(lián)機事ORACLE
的數(shù)據(jù)倉庫實施戰(zhàn)略
決策支持應用系統(tǒng)OracleApplicationsDataWarehouse外部數(shù)據(jù)源析取、轉換、裝載工具數(shù)據(jù)倉庫管理工具數(shù)據(jù)分析工具數(shù)據(jù)集成工具數(shù)據(jù)挖掘并將數(shù)據(jù)切換到用戶自定義的視圖中數(shù)據(jù)挖掘數(shù)據(jù)切換多維視圖41ORACLE
的數(shù)據(jù)倉庫實施戰(zhàn)略決策支持應用系統(tǒng)OraclORACLE
的數(shù)據(jù)倉庫實施戰(zhàn)略針對多維數(shù)據(jù)的擴展Oracle7擴展Oracle7SpatialDataOption管理多維數(shù)據(jù)或時空數(shù)據(jù)多維數(shù)據(jù)的編碼:HHCODE標準多達32維的數(shù)據(jù)綜合無索引通過數(shù)據(jù)分割優(yōu)化VLDB多種查詢方式:行方式、近似方式、自定義多角度方式數(shù)據(jù)過濾器數(shù)據(jù)轉換工具集數(shù)據(jù)管理工具集42ORACLE
的數(shù)據(jù)倉庫實施戰(zhàn)略針對多維數(shù)據(jù)的擴展42數(shù)據(jù)倉庫投資回報分析
DW技術投資的收益加拿大IDC公司對62家公司調查收益巨大DW的特點(BillInmon):數(shù)據(jù)按主題組織,有利于宏觀分析、決策分析數(shù)據(jù)是集成的,無需再轉換數(shù)據(jù)是穩(wěn)定的,便于查詢信息是面向時間的,是一定期限時間的快照43數(shù)據(jù)倉庫投資回報分析DW技術投資的收益43DW投資回報巨大的原因DW中的協(xié)同數(shù)據(jù)能夠使管理者了解完整的商業(yè)過程、制定決策維護費用比DSS低軟件、硬件、存儲費用低減少白領工人為決策者提供嶄新視角,發(fā)現(xiàn)規(guī)律,從正確的決策中獲取效益同時進行宏觀、微觀管理,減少手工勞動、避免錯誤44DW投資回報巨大的原因DW中的協(xié)同數(shù)據(jù)能夠使管理者了解完整的DW投資回報的定量分析投資回報的度量標準投資回報率(ROI)回報周期(PP)凈現(xiàn)值(NPV)內部回報率(IRR)DW的投資回報率(ROI)與回報周期(PP)收益現(xiàn)值ROI=
成本現(xiàn)值結果:62個企業(yè)中45個企業(yè)ROI為3%~1838%,三年平均ROI為401%DW平均投資2200萬美元,平均回報周期為2.3年8個為負值9個為1857%~16000%45DW投資回報的定量分析投資回報的度量標準45DW投資回報的規(guī)律DW維護人員提高效益、規(guī)范小型化、即席查(占20%)信息收集、傳輸自動化(占30%)最終用戶制定基于分析的決策以DW為唯一信息源 (占50%)高技術制造業(yè)、制造業(yè)高于其他行業(yè)200GB以上的數(shù)據(jù)倉庫具有較低的ROI以業(yè)務/工程為主要用戶的企業(yè)具有較高的ROI歐洲企業(yè)平均ROI為340%,北美為440%46DW投資回報的規(guī)律DW維護人員提高效益、規(guī)范小型化、即席查4數(shù)據(jù)倉庫投資回報的定性分析從總體上管理企業(yè)與客戶之間的關系讓客戶獲得更多的好處建立企業(yè)內部的合作關系對機遇作出快速反應可管理宏觀和微觀數(shù)據(jù)改善管理能力47數(shù)據(jù)倉庫投資回報的定性分析從總體上管理企業(yè)與客戶之間的關系4第5章
數(shù)據(jù)倉庫系統(tǒng)的實施SQLServer2000數(shù)據(jù)倉庫設計與使用其他一些公司的數(shù)據(jù)倉庫實施戰(zhàn)略數(shù)據(jù)倉庫的投資回報分析48第5章
數(shù)據(jù)倉庫系統(tǒng)的實施1SQLServer2000的基本服務SQLServer2000關系數(shù)據(jù)庫引擎:是一個流行的、具有高度可伸縮性和高度可靠性的數(shù)據(jù)存儲引擎。該數(shù)據(jù)庫引擎將數(shù)據(jù)存儲在表中。每個表上都列出感興趣的一些對象,每個表上的列表示由表建模的對象的屬性,而表上的行則代表由表建模的這種對象的事例。應用程序可以將結構化查詢語言(SQL)的語句提交給數(shù)據(jù)庫引擎,后者將表格格式的結果集返回給應用程序。SQLServer支持的特定SQL語言稱為Transact-SQL。應用程序還可以提交SQL語句或XPath查詢,并請求數(shù)據(jù)庫引擎以XML文檔形式返回結果。關系數(shù)據(jù)庫引擎具有高度的可伸縮性。SQLServer2000企業(yè)版可以支持多組數(shù)據(jù)庫服務器相互協(xié)作,構成可供上千用戶同時訪問的TB大小的數(shù)據(jù)庫。該引擎能夠處理世界上任何Web站點的流量。該數(shù)據(jù)庫引擎還能自我調節(jié),自動在連接到數(shù)據(jù)庫的用戶增多時獲取資源,并在用戶注銷后釋放資源。49SQLServer2000的基本服務SQLServeSQLServer2000的基本服務關系數(shù)據(jù)庫引擎具有高可靠性。在數(shù)據(jù)庫引擎的早期版本中要求停止和啟動的管理操作現(xiàn)在可以在引擎運行當中執(zhí)行,從而增加了可用性。數(shù)據(jù)庫引擎與Windows2000和WindowsNT?故障轉移群集的集成可定義虛擬服務器,即使節(jié)點中的一臺物理服務器出現(xiàn)故障,這些虛擬服務器仍然保持運行。在適當?shù)牡胤?,日志傳送可以用于維護熱備用服務器。在故障發(fā)生的數(shù)分鐘內,熱備用服務器可以代替生產服務器運行。關系數(shù)據(jù)庫引擎具有高度的安全性。登錄身份驗證可以與Windows身份驗證集成在一起,這樣,密碼將不會存儲在SQLServer中,也不會通過網絡發(fā)送而被網絡嗅探器讀取。網站可以設置C2級審核,對所有訪問數(shù)據(jù)庫的用戶進行審核,還可以使用安全套接字層(SSL)加密的辦法,對所有在應用程序和數(shù)據(jù)庫間傳送的數(shù)據(jù)進行加密。50SQLServer2000的基本服務關系數(shù)據(jù)庫引擎具有SQLServer2000的基本服務數(shù)據(jù)庫引擎的分布式查詢功能??梢栽L問所有可通過OLEDB訪問的數(shù)據(jù)源中的數(shù)據(jù)。在Transact-SQL語句中,可以像引用實際駐留在SQLServer數(shù)據(jù)庫中的表一樣引用遠程OLEDB數(shù)據(jù)源表。此外,全文檢索功能可以對SQLServer數(shù)據(jù)庫或Windows文件中存儲的文本數(shù)據(jù)進行復雜的模式匹配。關系數(shù)據(jù)庫引擎能夠存儲由頂層聯(lián)機事務處理(OLTP)系統(tǒng)生成的所有事務的詳細記錄。該數(shù)據(jù)庫引擎還可以支持最大的聯(lián)機分析(OLAP)數(shù)據(jù)倉庫中的事實數(shù)據(jù)表和維度表的嚴格處理要求。MicrosoftSQLServer2000AnalysisServices提供分析數(shù)據(jù)倉庫和數(shù)據(jù)集市中存儲的數(shù)據(jù)的工具。AnalysisServices以多維數(shù)據(jù)集的形式顯示事實數(shù)據(jù)表和維度表中的數(shù)據(jù),從多維數(shù)據(jù)集中可以分析趨勢和其它對于規(guī)劃今后工作非常重要的信息。在AnalysisServices多維數(shù)據(jù)集上處理OLAP查詢比試圖在OLTP數(shù)據(jù)庫中記錄的詳細數(shù)據(jù)上進行同樣的查詢要快得多。51SQLServer2000的基本服務數(shù)據(jù)庫引擎的分布式SQLServer2000的特性Internet集成:SQLServer2000數(shù)據(jù)庫引擎提供完整的XML支持。它還具有構成最大的Web站點的數(shù)據(jù)存儲組件所需的可伸縮性、可用性和安全功能。其程序設計模型與WindowsDNA構架集成,用以開發(fā)Web應用程序,并且還支持EnglishQuery和Microsoft搜索服務等功能,在Web應用程序中包含了用戶友好的查詢和強大的搜索功能??缮炜s性和可用性:同一個數(shù)據(jù)庫引擎可以在不同的平臺上使用。SQLServer2000企業(yè)版支持聯(lián)合服務器、索引視圖和大型內存支持等功能,使其得以升級到最大Web站點所需的性能級別。企業(yè)級數(shù)據(jù)庫功能:SQLServer2000關系數(shù)據(jù)庫引擎能充分保護數(shù)據(jù)完整性,同時將管理上千個并發(fā)修改數(shù)據(jù)庫的用戶的開銷減到最小。其分布式查詢得以引用來自不同數(shù)據(jù)源的數(shù)據(jù),就好象這些數(shù)據(jù)是SQLServer2000數(shù)據(jù)庫的一部分,同時分布式事務支持充分保護任何分布式數(shù)據(jù)更新的完整性。復制功能可維護多個數(shù)據(jù)復本,同時確保單獨的數(shù)據(jù)復本保持同步。52SQLServer2000的特性Internet集成:SQLServer2000的特性易于安裝、部署和使用:SQLServer2000中包括一系列管理和開發(fā)工具,這些工具可改進在多個站點上安裝、部署、管理和使用SQLServer的過程。SQLServer2000還支持基于標準的、與WindowsDNA集成的程序設計模型,使SQLServer數(shù)據(jù)庫和數(shù)據(jù)倉庫的使用成為生成強大的可伸縮系統(tǒng)的無縫部分。這些功能可以快速交付SQLServer應用程序,使客戶只需最少的安裝和管理開銷即可實現(xiàn)這些應用程序。數(shù)據(jù)倉庫:SQLServer2000中包括析取和分析匯總數(shù)據(jù)以進行聯(lián)機分析處理(OLAP)的工具。SQLServer中還包括一些工具,可用來直觀地設計數(shù)據(jù)庫并通過EnglishQuery來分析數(shù)據(jù)。53SQLServer2000的特性易于安裝、部署和使用:SSQLServer2000組件關系圖
54SQLServer2000組件關系圖7SQLServer2000數(shù)據(jù)倉庫工具
工具描述關系數(shù)據(jù)庫數(shù)據(jù)倉庫設計、構造、維護的基礎數(shù)據(jù)轉換服務(DTS)用于向數(shù)據(jù)倉庫加載數(shù)據(jù)數(shù)據(jù)復制用于分布式數(shù)據(jù)倉庫數(shù)據(jù)分布和加載數(shù)據(jù)OLEDB提供應用程序與數(shù)據(jù)源的接口APIAnalysisServices用于采集和分析數(shù)據(jù)倉庫中的數(shù)據(jù)EnglishQuery提供使用英語查詢數(shù)據(jù)倉庫MetaDataServices瀏覽數(shù)據(jù)倉庫中的元數(shù)據(jù)PivotTable服務用于制定操作多維數(shù)據(jù)的客戶端接口55SQLServer2000數(shù)據(jù)倉庫工具工具描述關系數(shù)據(jù)關系型數(shù)據(jù)庫關系型數(shù)據(jù)庫是設計、構造、維護數(shù)據(jù)倉庫的基礎技術。MicrosoftSQLServer2000是一個關系型數(shù)據(jù)庫管理系統(tǒng),它提供了強大的數(shù)據(jù)庫引擎和許多工具,這些工具不僅可以用于數(shù)據(jù)庫的管理,而且可以用于數(shù)據(jù)倉庫的管理,是數(shù)據(jù)倉庫的技術基礎。56關系型數(shù)據(jù)庫關系型數(shù)據(jù)庫是設計、構造、維護數(shù)據(jù)倉庫的基礎技術數(shù)據(jù)轉換服務(DTS)提供數(shù)據(jù)轉換功能,例如數(shù)據(jù)引入、引出以及在SQLServer和任何OLEDB、ODBC或者文本文件之間轉換數(shù)據(jù)。利用DTS,通過交互式地或按照規(guī)劃自動地從多處異構數(shù)據(jù)源輸入數(shù)據(jù),這樣便有可能在SQLServer上建立數(shù)據(jù)倉庫和數(shù)據(jù)市場。數(shù)據(jù)的來源特性允許用戶輸入查詢數(shù)據(jù)的輸入時間、地點及其計算方法。數(shù)據(jù)的引入引出是通過以相同的格式讀寫數(shù)據(jù),在應用程序之間交換數(shù)據(jù)的過程。一次轉換是指在源數(shù)據(jù)被存儲到目的地之前,對其進行的一系列操作。轉換特性使得載引入引出中完成復雜數(shù)據(jù)的驗證、清除等功能變得非常簡單。定制轉換對象可以被創(chuàng)建并集成進第三方產品中。DTS支持多步封裝,其中大量文件能被單獨處理,最終被集成為一個單一的文件。在目的地,該文件的記錄能被系統(tǒng)分為多個記錄,或相反,多個記錄被集成為一個單一的記錄。DTS也與微軟的中心庫集成在一起,微軟數(shù)據(jù)中心庫存儲元數(shù)據(jù)、數(shù)據(jù)傳送包和數(shù)據(jù)源特性,許多獨立的軟件經銷商支持和共享這個元數(shù)據(jù)模型。數(shù)據(jù)轉換服務可以在SQLServer間移動數(shù)據(jù)結構、數(shù)據(jù)、觸發(fā)器、規(guī)則、默認、約束和用戶定義的數(shù)據(jù)類型,只有數(shù)據(jù)結構和數(shù)據(jù)可以在不同的異構數(shù)據(jù)源中間傳遞。57數(shù)據(jù)轉換服務(DTS)提供數(shù)據(jù)轉換功能,例如數(shù)據(jù)引入、引出以數(shù)據(jù)復制數(shù)據(jù)復制:是一種實現(xiàn)數(shù)據(jù)分布的方法,就是指把一個系統(tǒng)中的數(shù)據(jù)通過網絡分布到另外一個或者多個地理位置不同的系統(tǒng)中,以適應可伸縮組織的需要,減輕主服務器的工作負荷和提高數(shù)據(jù)的使用效率。數(shù)據(jù)復制的過程類似于報紙雜志的出版過程,即把信息從信息源迅速傳送到信息接受處。出版服務器包含了將要復制的數(shù)據(jù)所在的數(shù)據(jù)庫,該服務器負責制作將要出版的數(shù)據(jù),然后將這些出版的數(shù)據(jù)的所有變化發(fā)送到分布服務器中。訂閱服務器是數(shù)據(jù)復制的目標地,負責接收復制過來的數(shù)據(jù),并且負責接收從出版服務器上傳送過來的全部變化。分布服務器在出版服務器和訂閱服務器之間起中介作用。分布服務器負責從出版服務器中接受復制過來的數(shù)據(jù),然后在該服務器上的分布數(shù)據(jù)庫中存儲這些變化,最后按照指定的時間間隔推向響應的訂閱服務器。在復制過程中,把將要復制的數(shù)據(jù)稱為出版物和文章。文章是復制的基本單元,是組成出版物的最小單位。文章與數(shù)據(jù)庫中的表對應。文章既可以對應一個表中的全部數(shù)據(jù),也可以指包括表中的一部分數(shù)據(jù)。出版物是一個完整的將要復制的內容,它包括一篇或多篇文章,是訂閱服務器訂閱的對象。58數(shù)據(jù)復制數(shù)據(jù)復制:是一種實現(xiàn)數(shù)據(jù)分布的方法,就是指把一個系統(tǒng)OLEDBOLEDB式微軟開發(fā)的數(shù)據(jù)訪問編程界面。微軟已經定位OLEDB是ODBC繼承者,ODBC主要用于處理關系型數(shù)據(jù)。ODBC是基于SQL的,它可以很好的用于關系型數(shù)據(jù)庫訪問,但是它不能用于非關系型數(shù)據(jù)源。象ODBC一樣,OLEDB也提供對關系型數(shù)據(jù)的訪問,但是OLEDB擴展了由ODBC提供的功能。OLEDB的設計目的是用于所有數(shù)據(jù)類型的標準界面。除了關系型數(shù)據(jù)庫的訪問,OLEDB提供對各種各樣數(shù)據(jù)源的訪問,包括Excel電子表格的數(shù)據(jù),dBase的ISAM文件、電子郵件、新的NT的ActiveDirectory和IBM的DB2數(shù)據(jù)。使用OLEDB,用一個界面就可以訪問許多不同的數(shù)據(jù)源。OLEDB是微軟的數(shù)據(jù)訪問策略,稱為萬能數(shù)據(jù)訪問的基礎。萬能數(shù)據(jù)訪問指的是一組通用界面,它用來表示來自任何數(shù)據(jù)源的數(shù)據(jù)。OLEDB是使萬能訪問成為現(xiàn)實的技術。萬能數(shù)據(jù)訪問和OLEDB的另一方面是所有的對象都應該在數(shù)據(jù)庫中維護,不是企圖把商業(yè)要求的不同的數(shù)據(jù)移動到一個面向對象的數(shù)據(jù)庫中。OLEDB創(chuàng)建和理解企業(yè)數(shù)據(jù)并且在各種數(shù)據(jù)源中維護。59OLEDBOLEDB式微軟開發(fā)的數(shù)據(jù)訪問編程界面。微軟已AnalysisServices在數(shù)據(jù)倉庫或者數(shù)據(jù)市場中的信息可OLAP處理,OLAP可以有效的以維度和度量組成的立方體方式察看數(shù)據(jù)。維度是一種描述性分類,例如,維度可能是地理位置,也可能是產品類型。度量是一種定量數(shù)值,例如銷售額、庫存量或者總費用。來自于原始數(shù)據(jù)源的合計存儲在每一個立方體單元中,這種組織數(shù)據(jù)的方法可以輕易得過濾數(shù)據(jù)、有效的加快數(shù)據(jù)的查詢。然而,存在著這種問題:雖然OLAP合計是在數(shù)據(jù)倉庫中可以達到的查詢性能的關鍵因素,但是存儲這些合計數(shù)據(jù)的成本是磁盤存儲量。事實上,合計數(shù)據(jù)量可以輕易的超過原有的數(shù)據(jù)量。另外,當維度和合計量提高時,所要求的OLAP數(shù)據(jù)存儲量也大大的提高。這種對存儲量的極大要求一般稱為數(shù)據(jù)爆炸。OLAP描述的是一種多維數(shù)據(jù)服務,這種服務的設計目的是保證分析員、經理和決策者針對特定的問題,通過快速、一致、交互式的實時數(shù)據(jù)訪問和分析。60AnalysisServices在數(shù)據(jù)倉庫或者數(shù)據(jù)市場中的AnalysisServicesMOLAP:多維型OLAP在一個用于壓縮索引的永久數(shù)據(jù)存儲中存儲維度數(shù)據(jù)和實時數(shù)據(jù)。合計存儲用來加快數(shù)據(jù)訪問。MOLAP查詢引擎是專有的,而且優(yōu)化成由MOLAP數(shù)據(jù)存儲使用的存儲格式。MOLAP提供了比ROLAP更快的查詢處理速度,并且要求更少的存儲空間。然而,它不能較好的伸縮,并且要求使用單獨的數(shù)據(jù)庫來存儲。ROLAP:關系型OLAP在關系型數(shù)據(jù)表中存儲合計。ROLAP針對關系型數(shù)據(jù)庫的應用允許其利用已有的數(shù)據(jù)庫資源,并且允許ROLAP應用程序很好的伸縮。然而,ROLAP使用表存儲合計則要求比MOLAP更多的磁盤空間,速度相對比較慢。HOLAP:正如其名稱所示,混合型OLAP介于MOLAP和ROLAP之間。象ROLAP一樣,HOLAP將主數(shù)據(jù)存儲在源數(shù)據(jù)庫中。象MOLAP一樣,HOLAP把合計存儲在一個永久性數(shù)據(jù)存儲的地方,它與主關系數(shù)據(jù)庫分開。這種混合形式使HOLAP可以具備MOLAP和ROLAP兩者的優(yōu)點。61AnalysisServicesMOLAP:多維型OLAPEnglishQuery微軟的英語查詢環(huán)境允許設計者將他們的關系數(shù)據(jù)庫轉移到英語查詢上來,這給最終用戶提供了使用英語提出問題而不是用SQL語言進行查詢的能力。EnglishQuery服務是利用英語查詢域編輯器創(chuàng)建的,提供了數(shù)據(jù)庫的有關信息,從而使EnglishQuery可用于處理關于特殊表、域和數(shù)據(jù)的英語問題。62EnglishQuery微軟的英語查詢環(huán)境允許設計者將他們MetaDataServices在MicrosoftSQLServer2000中,許多工具把元數(shù)據(jù)存儲在位于msdb系統(tǒng)數(shù)據(jù)庫中的集中式中心倉庫中。這里提到的元數(shù)據(jù)是指數(shù)據(jù)的數(shù)據(jù),MetaDataServices提供瀏覽這些元數(shù)據(jù)的功能。數(shù)據(jù)中心庫提供了一個通用的位置:可以用來存放對象和對象之間的關系。通過使用一些軟件工具,可以描述面向對象的信息:軟件工具使用各類對象組成的信息。對象接口界面,界面由屬性、方法和集合組成,集合包含了對其他界面的關系,以及關聯(lián)對象。63MetaDataServices在MicrosoftSPivotTable服務PivotTable服務和AnalysisServices一起為用戶提供客戶端對OLAP數(shù)據(jù)的存取。PivotTable服務運行于客戶端工作站上,它使得可以利用VisualBasic或其他語言來開發(fā)用戶程序,這些程序可以利用OLEDB技術,并使用AnalysisServices中的OLAP數(shù)據(jù)或直接取自關系數(shù)據(jù)庫的數(shù)據(jù)。當它和OLAP服務一起使用時,PivotTable服務可以自動將進程或緩沖內存分配到最合適的位置,并且允許多個客戶動態(tài)存取同一個立方體。PivotTable服務業(yè)能在本地客戶機上存儲數(shù)據(jù),從而使用戶可以在不連接AnalysisServices的情況下對數(shù)據(jù)進行分析。這種移動式的解決方案允許分析者將數(shù)據(jù)帶回家或在途中進行分析。為最終用戶提供的OLAP數(shù)據(jù)分析和描述工具可以利用PivotTable服務進行開發(fā)。PivotTable服務也提供了開放的界面,獨立的軟件銷售商可以利用它來開發(fā)第三方應用的產品。64PivotTable服務PivotTable服務和Analy數(shù)據(jù)倉庫的實現(xiàn)步驟明確用戶需求設計和建立數(shù)據(jù)倉庫使用數(shù)據(jù)倉庫維護和優(yōu)化數(shù)據(jù)倉庫65數(shù)據(jù)倉庫的實現(xiàn)步驟明確用戶需求18數(shù)據(jù)倉庫生命周期管理數(shù)據(jù)倉庫系統(tǒng)框架影響數(shù)據(jù)倉庫項目成功的因素數(shù)據(jù)倉庫的技術數(shù)據(jù)倉庫項目所需的角色66數(shù)據(jù)倉庫生命周期管理數(shù)據(jù)倉庫系統(tǒng)框架19數(shù)據(jù)倉庫系統(tǒng)框架基本特點擁有為項目作出技術決策的觀察點擁有確定項目是否能夠完成的計量參照點擁有以靈活方式運用現(xiàn)有知識的能力分部分、分階段依靠多個工作小組協(xié)調完成四個階段設想階段規(guī)劃階段開發(fā)階段穩(wěn)定階段67數(shù)據(jù)倉庫系統(tǒng)框架基本特點20影響數(shù)據(jù)倉庫項目成功的因素數(shù)據(jù)倉庫創(chuàng)建前的影響因素管理層的信任從管理項目開始:面向主題交流實現(xiàn)目標任命一個面向用戶的項目經理數(shù)據(jù)倉庫創(chuàng)建時的影響因素采用成熟的技術注重查詢而不是注重事務只加載所需數(shù)據(jù)定義合適的數(shù)據(jù)源:元數(shù)據(jù)映射明確定義主題數(shù)據(jù)倉庫創(chuàng)建后的影響因素面向決策的使用者的信任68影響數(shù)據(jù)倉庫項目成功的因素數(shù)據(jù)倉庫創(chuàng)建前的影響因素21數(shù)據(jù)倉庫的技術管理大量的數(shù)據(jù)管理多介質索引和監(jiān)視數(shù)據(jù)多種技術的接口對數(shù)據(jù)存放位置的控制數(shù)據(jù)的并行存儲和管理元數(shù)據(jù)管理技術語言接口數(shù)據(jù)的高效裝入高效索引的利用技術數(shù)據(jù)壓縮技術復合鍵碼技術變長數(shù)據(jù)鎖管理切換技術快速恢復技術其他技術:事務集成性、高速緩存、行/頁級鎖定、引用完整性、 數(shù)據(jù)視圖等69數(shù)據(jù)倉庫的技術管理大量的數(shù)據(jù)22數(shù)據(jù)倉庫項目所需的角色管理角色項目主管項目經理技術角色數(shù)據(jù)提供專家體系結構設計者數(shù)據(jù)庫管理員數(shù)據(jù)遷移專家數(shù)據(jù)轉換專家數(shù)據(jù)集市開發(fā)的領導人質量保證/測試專家維護角色內行的用戶培訓教師技術文檔編寫人員工具專家銷售商聯(lián)系人70數(shù)據(jù)倉庫項目所需的角色管理角色23創(chuàng)建數(shù)據(jù)倉庫向導71創(chuàng)建數(shù)據(jù)倉庫向導24創(chuàng)建數(shù)據(jù)倉庫向導72創(chuàng)建數(shù)據(jù)倉庫向導25創(chuàng)建數(shù)據(jù)倉庫向導73創(chuàng)建數(shù)據(jù)倉庫向導26創(chuàng)建數(shù)據(jù)倉庫向導74創(chuàng)建數(shù)據(jù)倉庫向導27完成創(chuàng)建數(shù)據(jù)倉庫75完成創(chuàng)建數(shù)據(jù)倉庫28創(chuàng)建事實維度表
76創(chuàng)建事實維度表29創(chuàng)建事實維度表77創(chuàng)建事實維度表30屬性選項卡78屬性選項卡31屬性選項卡79屬性選項卡32創(chuàng)建數(shù)據(jù)庫關系圖向導80創(chuàng)建數(shù)據(jù)庫關系圖向導33關系圖81關系圖34多維數(shù)據(jù)集向導82多維數(shù)據(jù)集向導35多維數(shù)據(jù)集83多維數(shù)據(jù)集36多維數(shù)據(jù)集84多維數(shù)據(jù)集37數(shù)據(jù)倉庫軟件市場1993~1998平均年增23.9%,達22億美元。數(shù)據(jù)值入工具:從數(shù)據(jù)庫中提取數(shù)據(jù),轉換為數(shù)據(jù)倉庫格式并送入數(shù)據(jù)倉庫中。數(shù)據(jù)過濾工具:對數(shù)據(jù)倉庫中的數(shù)據(jù)進行存放和管理。數(shù)據(jù)存取工具:讓用戶存取數(shù)據(jù)倉庫中的數(shù)據(jù)。數(shù)據(jù)倉庫市場劃分軟件總市場69493-124166@12。3%數(shù)據(jù)存取663-1258@13.7%第三代語言/公用程序3061-6019@14.5%CASE1751-3085@12.5%DBMS5801-11680%15.0%其它市場58163-102124@11.9%數(shù)據(jù)存取663-1258@13.7%數(shù)據(jù)提取/轉換31-232@49.3%數(shù)據(jù)管理59-708@64.3%數(shù)據(jù)倉庫753-2198@23.9%數(shù)據(jù)復制14-319@87.1%注:***-***@***%指1993年-1998年銷售額(M$)@年遞增率85數(shù)據(jù)倉庫軟件市場1993~1998平均年增23.9%,達2(1)動態(tài)可伸縮的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 虛擬現(xiàn)實技術改進的用戶體驗
- 2025年關于大班科學標準教案
- 臭氧鎮(zhèn)痛治療
- 2025年會計職稱考試《初級會計實務》易錯難題突破實戰(zhàn)高分突破試卷
- 2025年美容師高級護理技能測試卷:美容師美容院員工激勵機制試題
- 膽石癥的中醫(yī)護理查房
- 2025年電工中級職業(yè)技能考試電氣自動化控制試題卷
- 干部下沉數(shù)字賦能工作思路
- 2025年ACCA國際注冊會計師考試真題卷:稅務實務與規(guī)劃試題
- 日用品塑料瓶滾塑成型模具設計
- 我的家鄉(xiāng)新疆-我愛你課件
- 液化天然氣(LNG)相關的知識培訓
- 施工升降機安全管理培訓課件
- 2017華東六省一市優(yōu)質課課件連乘問題11月29日
- 部編版(統(tǒng)編)一年級語文下冊每課練習題(全冊全套)
- DB62∕T 4134-2020 高速公路服務區(qū)設計規(guī)范
- 《影視鑒賞(第二版)》課件2-0故事片引子
- 青島版科學一年級下冊《塑料》教學設計
- 專利文件撰寫殷紅梅課件
- 中鐵集團工程有限公司人力資源績效考核暫行辦法
- 部編版七年級語文下學期木蘭詩對比閱讀練習題(含解析答案)
評論
0/150
提交評論