SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)_第1頁
SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)_第2頁
SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)_第3頁
SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)_第4頁
SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)美國(guó)SAS研究所數(shù)據(jù)倉庫的加載和更新 從數(shù)據(jù)源抓取數(shù)據(jù)不僅有質(zhì)量問題,還存在有計(jì)劃地按一定時(shí)間節(jié)奏從數(shù)據(jù)源取出和裝入、更新數(shù)據(jù)倉庫的問題。因?yàn)镾AS系統(tǒng)有主動(dòng)去取外部數(shù)據(jù)的能力,所以按時(shí)間節(jié)奏從數(shù)據(jù)源取出數(shù)據(jù)的操作在和其它系統(tǒng)管理人員協(xié)調(diào)好的基礎(chǔ)上,就可完全在SAS系統(tǒng)內(nèi)制定從各系統(tǒng)取用數(shù)據(jù)的計(jì)劃了。在此基礎(chǔ)上,數(shù)據(jù)倉庫按照數(shù)據(jù)和信息使用的時(shí)間要求,準(zhǔn)時(shí)地加載、更新,就是完全有保障的了。從數(shù)據(jù)源到數(shù)據(jù)倉庫一氣呵成的集成式的操作,這是SAS數(shù)據(jù)倉庫技術(shù)的重要特點(diǎn)。 按決策需要重組數(shù)據(jù)和信息清理好的數(shù)據(jù)還要進(jìn)行重組。按照決策的需要組織成不同主題的數(shù)據(jù)倉庫表。這是十分關(guān)鍵性的操作。在再小的企業(yè)或組織中,也總是有許多業(yè)務(wù)和技術(shù)環(huán)節(jié)的。一般來說,原來運(yùn)行系統(tǒng)數(shù)據(jù)庫的設(shè)計(jì)也總是針對(duì)這些業(yè)務(wù)和技術(shù)環(huán)節(jié)設(shè)置"實(shí)體",即數(shù)據(jù)庫的表。這樣的設(shè)計(jì)使OLTP系統(tǒng)在線運(yùn)行時(shí),發(fā)揮了最大限度的工作效率。但在開拓決策支持的OLAP時(shí),特別是對(duì)于全企業(yè)范圍的數(shù)據(jù)進(jìn)行操作時(shí),這種數(shù)據(jù)結(jié)構(gòu)效率極低。這是因?yàn)榭赡芤獜脑S多表中取出所需數(shù)據(jù),而且還要進(jìn)行數(shù)據(jù)的篩選,對(duì)不同表中的數(shù)據(jù)進(jìn)行擬合等操作,這是極費(fèi)時(shí)間和資源的。企業(yè)范圍的決策是對(duì)各個(gè)環(huán)節(jié)分別進(jìn)行業(yè)務(wù)處理的業(yè)務(wù)重組,這就需要有相應(yīng)數(shù)據(jù)結(jié)構(gòu)的重組,即按決策的需要組織成不同主題的數(shù)據(jù)倉庫表,以及相應(yīng)的數(shù)據(jù)視圖,匯總表等。SAS為此設(shè)置了交互式操作的界面,以最大的主動(dòng)性幫您完成決策支持所需的數(shù)據(jù)重組。 豐富的決策數(shù)據(jù)處理能力為更有效地支持決策,必須進(jìn)行廣泛、深入的數(shù)據(jù)挖掘(DataMining),而不是僅僅提供簡(jiǎn)單的函數(shù)功能供編程使用。SAS在這方面有世界領(lǐng)先的豐富的決策支持?jǐn)?shù)據(jù)分析、處理軟件。首先SAS/MDDB可幫您構(gòu)造最適宜OLAP操作的多維數(shù)據(jù)結(jié)構(gòu)?!猄AS/STAT覆蓋了所有的實(shí)用數(shù)理統(tǒng)計(jì)分析方法,是國(guó)際上統(tǒng)計(jì)分析領(lǐng)域的標(biāo)準(zhǔn)軟件。它提供了十多個(gè)過程可進(jìn)行各種不同模型或不同特點(diǎn)的回歸分析;為多種試驗(yàn)設(shè)計(jì)模型提供了方差分析工具;在多變量統(tǒng)計(jì)分析方面,為主成分分析,相關(guān)分析,判別分析和因子分析提供了許多專用過程;還包括多種聚類準(zhǔn)則的聚類分析方法 等。 SAS/ETS提供了豐富的計(jì)量經(jīng)濟(jì)學(xué)和時(shí)間序列分析方法,是研究復(fù)雜系統(tǒng)和進(jìn)行預(yù)測(cè)的有力工具。SAS/OR提供了全面的運(yùn)籌學(xué)方法?!猄AS/IML提供了功能強(qiáng)大的面向矩陣運(yùn)算的編程語言,幫助您研究新算法或解決SAS系統(tǒng)中沒有現(xiàn)成算法的專門問題。__SAS/INSIGHT是一個(gè)可視化的數(shù)據(jù)探索工具。它將統(tǒng)計(jì)方法與交互式圖形顯示融合在起,為您展現(xiàn)了一種全新的使用統(tǒng)計(jì)分析方法的環(huán)境。 還有SAS的人工神經(jīng)元網(wǎng)絡(luò)和SAS/ASSIST……等,具有很大伸縮性的,適合各個(gè)層次,各種類型人員使用的工具。靈活多樣的結(jié)果展現(xiàn)方式分析結(jié)果的展現(xiàn)方式對(duì)決策時(shí)人的判別有重大的影響。SAS也有眾多的方式,方法供您選擇:—在BaseSAS中就有從簡(jiǎn)單列表到比較復(fù)雜的統(tǒng)計(jì)報(bào)表和用戶自定義的式樣復(fù)雜的報(bào)表的能力。SAS/ER(EnterpriseReport)更是為企業(yè)級(jí)的決策過程提供了報(bào)告的制作能力。 SAS/GRAPH是一個(gè)強(qiáng)有力的圖形軟件包,可將數(shù)據(jù)及其包含著的深層信息以多種圖形生動(dòng)的呈現(xiàn)出來……。 從各種數(shù)據(jù)源主動(dòng)地取出數(shù)據(jù);經(jīng)過清理、整合;再按決策支持的需要分主題、重組數(shù)據(jù);按照時(shí)序節(jié)奏不斷地自動(dòng)裝載、更新數(shù)據(jù)倉庫;用世界權(quán)威的,豐富的數(shù)據(jù)處理工具進(jìn)行決策分析;最后以多種形式將決策支持的意見呈現(xiàn)給您。這就是完整的決策支持?jǐn)?shù)據(jù)倉庫解決方 提醒您:在購(gòu)買數(shù)據(jù)倉庫產(chǎn)品時(shí)必須注意,您所得到的產(chǎn)品是否能夠?qū)崿F(xiàn)決策支持所需的全部技術(shù)環(huán)節(jié)!SAS數(shù)據(jù)倉庫的體系結(jié)構(gòu)—數(shù)據(jù)庫技術(shù)大大推動(dòng)了計(jì)算機(jī)應(yīng)用的迅速發(fā)展特別是建立在E.F.Codd提出的E-R理論基礎(chǔ)上的關(guān)系型數(shù)據(jù)庫更是為OLTP(聯(lián)機(jī)事務(wù)處理)應(yīng)用開拓了廣闊天地。1994年E.F.Codd曾回答一個(gè)提問:為什么在對(duì)一個(gè)運(yùn)行良好的,基于E-R理論的關(guān)系數(shù)據(jù)庫進(jìn)行查詢以制作一個(gè)較大的報(bào)告時(shí),系統(tǒng)的響應(yīng)速度特別的慢。他說:運(yùn)行數(shù)據(jù)庫是為OLTP需求環(huán)境設(shè)計(jì)的,這已有太多的成功事例。但現(xiàn)在我們所面對(duì)的是 OLAP(聯(lián)機(jī)分析處理,這個(gè)概念述語E.F.Codd在此第一次提出)類型的需求。要實(shí)現(xiàn)OLAP就要有適應(yīng)它的、整合的、快速的、多維的信息架構(gòu)和查詢機(jī)制。 SAS數(shù)據(jù)倉庫就是一個(gè)適應(yīng)于對(duì)企業(yè)級(jí)的數(shù)據(jù)、信息進(jìn)行重新整合,適應(yīng)多維、快速查詢;進(jìn)行OLAP操作和決策支持的數(shù)據(jù)、信息的采集、管理、處理和展現(xiàn)的架構(gòu)體系??捎糜覉D表示: 環(huán)境(Enviroment)環(huán)境是SAS數(shù)據(jù)倉庫體系結(jié)構(gòu)的總根,它由兩大部分組成。一部分是分別含有不同主題內(nèi)容的若干個(gè)數(shù)據(jù)倉庫;另一部分是對(duì)數(shù)據(jù)源的定義。這構(gòu)成了從數(shù)據(jù)采集到直接應(yīng)用完整的支持體系。 數(shù)據(jù)倉庫(DataWarehouse)為了使用上的方便,可以存在多個(gè)數(shù)據(jù)倉庫。在一個(gè)大的企業(yè)或組織中,不同部門在進(jìn)行決策分析時(shí)可能使用徊然不同的數(shù)據(jù),重新整合后就沒有必要將它們放在一起了。在體系結(jié)構(gòu)層次中的數(shù)據(jù)倉庫主要是管理性的作用,其中有對(duì)數(shù)據(jù)倉庫所有組成單元的解釋性數(shù)據(jù)-Metadata。在每個(gè)數(shù)據(jù)倉庫中還可以設(shè)置若干個(gè)主題,這一般是同一部門中支持不同決策內(nèi)容的數(shù)據(jù)。主題是較大的數(shù)據(jù)載體,相對(duì)精簡(jiǎn)或匯總一些的是所謂數(shù)據(jù)市場(chǎng),在一個(gè)數(shù)據(jù)倉庫中亦可存在若干個(gè)數(shù)據(jù)市場(chǎng)?!黝}(Subject)在每個(gè)主題中有一個(gè)主題表系統(tǒng),放置與此主題相關(guān)的各種數(shù)據(jù)。為了支持決策,還設(shè)置了若干個(gè)數(shù)據(jù)的匯總表組。進(jìn)一步還有若干個(gè)信息市場(chǎng)組,其中放置的是對(duì)數(shù)據(jù)處理后產(chǎn)生的決策支持信息。—主題表系統(tǒng)(Detail)這里放置的就是從各個(gè)數(shù)據(jù)源中取出,經(jīng)過清理、整合的原始數(shù)據(jù)。為了使用和管理的方便,這些數(shù)據(jù)可放在多個(gè)表中?!黝}表(DetailTable)從運(yùn)行系統(tǒng)數(shù)據(jù)源取出的數(shù)據(jù),分別組成這里的若干表。它們可能是實(shí)際的表,也可以是一些邏輯視圖(View)。從本質(zhì)上講,它們和原來各個(gè)運(yùn)行系統(tǒng)數(shù)據(jù)源的數(shù)據(jù)內(nèi)容是一致的。但是為了方便地支持決策數(shù)據(jù)處理,而對(duì)數(shù)據(jù)的結(jié)構(gòu)進(jìn)行了重組。為了決策支持?jǐn)?shù)據(jù)處理工作的方便和提高工作的效率,在數(shù)據(jù)重組過程中,可能還要增加一些數(shù)據(jù)冗余。 匯總表組(SummaryGroups)在匯總表組中定義進(jìn)行數(shù)據(jù)匯總處理時(shí)的層次維數(shù)和所分析的變量。當(dāng)匯總表組是按SAS數(shù)據(jù)集和DBMS格式存放時(shí)可有六個(gè)層次,若是采用SAS的多維數(shù)據(jù)庫產(chǎn)品MDDB時(shí)則可有任意多個(gè)層次。實(shí)際上數(shù)據(jù)匯總就是最常用的決策支持?jǐn)?shù)據(jù)處理手段,有時(shí)還可以在匯總數(shù)據(jù)的基礎(chǔ)上進(jìn)行進(jìn)一步的決策支持?jǐn)?shù)據(jù)處理。匯總表組可以有若干個(gè),也就是說可以對(duì)多種變量分別進(jìn)行不同方式的匯總處理。 匯總層次(SummaryLevels)匯總一般是按時(shí)間進(jìn)程而執(zhí)行的。匯總層次表示您所選擇的數(shù)據(jù)匯總處理的時(shí)間維,如:日、周、月等。 信息市場(chǎng)(InformationMarts)這是信息市場(chǎng)的分組,在一項(xiàng)主題中可以有若干組信息市場(chǎng)。一般來說是按不同的決策支持內(nèi)容需要進(jìn)行分組的。之所以要稱之為"信息市場(chǎng)",這正是體現(xiàn)了設(shè)置這樣一個(gè)機(jī)制的目的:要讓決策者象到了一個(gè)信息市場(chǎng)一樣,能最方便,最快捷的取得決策支持所需要的信息。 信息市場(chǎng)項(xiàng)目(InformationMartItems)這是信息市場(chǎng)中一項(xiàng)一項(xiàng)具體的信息,它是對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行處理后產(chǎn)生的結(jié)果。在一個(gè)企業(yè)或組織中決策目標(biāo)并不總是隨機(jī)的,相反總是有一些要經(jīng)常反復(fù)進(jìn)行的決策工作,但是隨著時(shí)間的進(jìn)程,支持決策的依據(jù)在不斷發(fā)展、變化。利用數(shù)據(jù)倉庫架構(gòu)就可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論