sas數(shù)據(jù)倉庫與數(shù)據(jù)挖掘_第1頁
sas數(shù)據(jù)倉庫與數(shù)據(jù)挖掘_第2頁
sas數(shù)據(jù)倉庫與數(shù)據(jù)挖掘_第3頁
sas數(shù)據(jù)倉庫與數(shù)據(jù)挖掘_第4頁
sas數(shù)據(jù)倉庫與數(shù)據(jù)挖掘_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、SAS數(shù)據(jù)倉庫與數(shù)據(jù)挖掘-從業(yè)務數(shù)數(shù)據(jù)中提煉決決策支持信息息的解決方案案目 錄SAS研究所和和SAS系統(tǒng)1利用SAS技術術建立你的數(shù)數(shù)據(jù)倉庫2SAS數(shù)據(jù)倉庫庫的組成4SAS數(shù)據(jù)倉庫庫的體系結構構6SAS數(shù)據(jù)倉庫庫的開發(fā)9SAS的數(shù)據(jù)倉倉庫產(chǎn)品-SSAS/WAA12SAS幫助你進進行數(shù)據(jù)挖掘掘15SAS的數(shù)據(jù)挖挖掘的方法論論-SEMMMA17SAS數(shù)據(jù)挖掘掘的集成軟件件工具-SAAS/EM(Enterrprisee Mineer)21決策支持智能化化24企業(yè)級的報表制制作工具-SSAS/ERR+SAS/MDDB+SAS/IIntrNeet27在網(wǎng)上展開SAAS功能31SAS研究所和和SAS系統(tǒng)S

2、AS系統(tǒng)是用用于嚴肅數(shù)據(jù)據(jù)分析和決策策支持的大型型集成式模塊塊化軟件包。六六十年代末到到八十年代初初以統(tǒng)計分析析及線性數(shù)學學模型為主,并并以此聞名于于世。故其早早期名為“Statiisticaal Anaalysiss Systtem”?!癝AS”即成為SASS軟件研究所所(SAS Instiitute Inc.)產(chǎn)產(chǎn)品的總商標標。SAS軟件研究究所跨國公司司成立于19976年,總總部設在美國國北卡州凱瑞瑞市(Carry Norrth Caarolinna)。SAS保持了了20年連續(xù)不不斷的兩位數(shù)數(shù)的業(yè)務收入入增長率,現(xiàn)現(xiàn)已是全球最最大的私人軟軟件公司和全全球排名第九九位的獨立軟軟件商。緣其其

3、是私人獨立立軟件商,免免受股市和公公眾股東資本本的操縱和影影響,按自主主意志把收益益的很大部分分再投入于研研究和發(fā)展,使使其研發(fā)投資資比重一直保保持了全球軟軟件業(yè)的領先先地位。憑借借這一技術優(yōu)優(yōu)勢,遍布世世界的45000多名SAS員工為為120多個國國家的三百五五十多萬SAAS用戶提供供了行業(yè)公譽譽的高質量技技術服務和支支持。面對當今競爭日日趨激烈、瞬瞬息萬變的世世界市場經(jīng)濟濟,從國家機機關到企業(yè)界界的各類人員員都要面對各各種機遇迅速速作出抉擇。計計算機系統(tǒng)支支持人們能做做出迅即反應應業(yè)務處理的的能力已滿足足不了當今的的需求,要信信息技術對各各個層次和各各種類型決策策進行支持已已是IT行業(yè)發(fā)展

4、展必然趨勢。SAS以其具有前瞻性的技術開拓,在決策支持工具數(shù)據(jù)倉庫和數(shù)據(jù)挖掘(Data Warehouse與Data Mining)方面已連年被評為“年度最佳產(chǎn)品”、“最佳決策支持工具”。公司卓著的業(yè)績使之被評為“全美國人們最樂意為之工作的100家公司”之一及“最佳決策支持工具的供應商”。Interneet已成為世世界信息的通通衢大道,IIntrannet也已成成為先進企業(yè)業(yè)的信息經(jīng)脈脈。SAS技術也也與之有著同同步的發(fā)展。SAS的IntrNet產(chǎn)品使全部的SAS技術最大限度的實現(xiàn)了Web-Enable。這使得SAS原來跨多平臺應用的開放機制擴展到了網(wǎng)絡計算環(huán)境和網(wǎng)際應用。這不僅使SAS使用更

5、加方便,而且使那些以Thin-client運行的系統(tǒng)在使用SAS時節(jié)省了投資,并減少了系統(tǒng)維護的工作量。在這里將按下面面五個脈絡向向你系統(tǒng)的介介紹SAS技術:SAS世界領先先的數(shù)據(jù)倉庫庫技術SAS獲最佳決決策支持工具具褒獎的數(shù)據(jù)據(jù)挖掘技術SAS的業(yè)務智智能化技術SAS的企業(yè)級級報表制作工具具SAS的Webb-Enabblemennt你可以通過htttp:/www.ssas.coom/查到SAS研究所所最新的技術術信息。你還還可以通過美美國SAS研究所所設立在北京京(Tel:010-662351228(0-3),上上海(Tell:021-635822288)和和廣州(Teel:0200-8755

6、54490)的的辦事處得到到直接的咨詢詢和技術支持持。利用SAS技術術建立你的數(shù)數(shù)據(jù)倉庫由于使用SASS系統(tǒng)成功地地建立了許多多卓有成效的的數(shù)據(jù)倉庫,SAS系統(tǒng)的數(shù)據(jù)倉庫產(chǎn)品已連續(xù)兩年(1996-1997)被美國著名的“Datamation”評為“當年度最佳產(chǎn)品”。銷售額也占據(jù)了SAS產(chǎn)品的首位。98年又在DCI全球數(shù)據(jù)倉庫大會榮獲“Excellence in Business Information”大獎。正象數(shù)據(jù)倉庫雖然是個較新的詞語,但它是計算機技術發(fā)展的必然結果一樣;SAS獲此殊榮也非一日之功,正是它順合計算機技術發(fā)展規(guī)律的淵源所致。為什么在有了這這么多數(shù)據(jù)庫庫產(chǎn)品之后,人人們又要用數(shù)

7、數(shù)據(jù)倉庫技術術。業(yè)界的各各路諸侯又如如此趨之若騖騖。這正是計計算機技術應應用需求的推推動。當年數(shù)數(shù)據(jù)庫技術大大發(fā)展的過程程是伴隨著OOLTP(On Linne Traansacttion PProcesss聯(lián)機業(yè)務務處理)應用用需求的推動動。聯(lián)機業(yè)務務處理最迫切切的技術要求求就是快速響響應。數(shù)據(jù)庫庫技術,特別別是基于E. F. CCodd提出出的關系理論論的數(shù)據(jù)庫的的技術,將數(shù)數(shù)據(jù)集分成了了甚少冗余的的實體(Enntity),然然后又將它們們按一定的關關系(Rellationnship)編編織成一個有有機的整體,比比較完美地滿滿足了OLTTP的應用需需求。對于每每個業(yè)務處理理最好只須涉涉及一個

8、實體體,業(yè)務處理理對于實體的的Add或Updatte也只涉及及數(shù)據(jù)媒體的的可能最小的的空間(如記記錄級封鎖技技術),對于于其它實體的的相關更新通通過關系保持持了一致性和和完整性。這這個切合當時時OLTP應用用實際需求的的理論和技術術的成功,推推動了關系數(shù)數(shù)據(jù)庫產(chǎn)品風風靡世界。象計算機技術的的迅速發(fā)展一一樣,激烈競競爭的市場也也激發(fā)了各行行各業(yè)對計算算機應用的更更多樣的需求求。計算機用用戶早已不滿滿足于計算機機能幫助他迅迅速地處理具具體業(yè)務,他他們要從這大大量業(yè)務數(shù)據(jù)據(jù)中探索業(yè)務務活動的規(guī)律律性,市場的的運作趨勢,并并從中為他們們參與市場競競爭作出重要要的決策。由此而來產(chǎn)生了了對DSS(Deci

9、ssion SSupporrt Sysstem)決策支持持系統(tǒng)的需求求。支持決策策就要進行數(shù)數(shù)據(jù),信息的的分析,這就就產(chǎn)生了OLLAP(On Liine Annalysiis Proocess)聯(lián)聯(lián)機數(shù)據(jù)分析析處理的需要要。決策支持持所依據(jù)的數(shù)數(shù)據(jù)從哪里來來,當然是成成功運行著的的業(yè)務處理數(shù)數(shù)據(jù)庫中的數(shù)數(shù)據(jù)。所以最最早的決策支支持所進行的的數(shù)據(jù)處理就就是直接使用用數(shù)據(jù)庫中的的數(shù)據(jù)??煞Q稱之為ROLLAP,即利利用關系數(shù)據(jù)據(jù)庫的數(shù)據(jù)進進行聯(lián)機分析析處理。SAAS系統(tǒng)早就就具有最強有有力的數(shù)據(jù)分分析處理能力力,再加上SSAS的SAS/AACCESSS對幾乎所有有數(shù)據(jù)庫和數(shù)數(shù)據(jù)文件的強強大的讀取能能

10、力,以及SSAS跨多平平臺的運作能能力,SASS系統(tǒng)就成了了最完善的RROLAP工工具。當ROLAP只只使用很少的的關系數(shù)據(jù)庫庫表時,這一一操作是可行行的。這種操操作往往是針針對局部性問問題進行的決決策支持數(shù)據(jù)據(jù)分析。但面面對市場的決決策往往是涉涉及整個企業(yè)業(yè)范疇的數(shù)據(jù)據(jù)和信息。這這就要同時啟啟動大量的數(shù)數(shù)據(jù)庫表,并并且要將眾多多表中的數(shù)據(jù)據(jù)按一定的規(guī)規(guī)律擬合起來來,形成恰好好針對所支持持決策問題的的數(shù)據(jù)內(nèi)容。這這樣一個過程程或許是十分分復雜,且耗耗費大量資源源。或許企業(yè)業(yè)的數(shù)據(jù)是分分布在若干個個系統(tǒng)中的,這這樣的數(shù)據(jù)整整合過程幾乎乎是難以完成成的。除此之外,在一一個數(shù)據(jù)庫表表中的每一條條記錄

11、也并不不是某項決策策都需要的,這這要按決策支支持的需要編編制專用的數(shù)數(shù)據(jù)篩選程序序。再者,聯(lián)聯(lián)機業(yè)務處理理系統(tǒng)中的數(shù)數(shù)據(jù)有一個特特性:即每一一條記錄都有有產(chǎn)生,反復復的變更、修修改,直至數(shù)數(shù)據(jù)記錄不再再變化的過程程,稱之為“數(shù)據(jù)到位”。例如:一一個物料在一一個工廠中產(chǎn)產(chǎn)生了,聯(lián)機機業(yè)務處理系系統(tǒng)中就要添添加一條相應應的記錄;這這個物料不斷斷地進行加工工,就要在它它的記錄中記記入加工的參參數(shù);當這個個物料加工成成產(chǎn)品,被發(fā)發(fā)貨出廠,就就要再登錄這這些出廠信息息,此后,記記錄其生產(chǎn)過過程的數(shù)據(jù)就就再也不能修修改了。如果果要進行產(chǎn)品品生產(chǎn)周期的的分析,就只只使用發(fā)貨出出廠后的那些些物料的數(shù)據(jù)據(jù),而不

12、能使使用同一表中中的正在加工工的物料的數(shù)數(shù)據(jù)。由此可見,直接接使用聯(lián)機業(yè)業(yè)務處理系統(tǒng)統(tǒng)中的數(shù)據(jù)進進行決策支持持數(shù)據(jù)的分析析處理是會產(chǎn)產(chǎn)生許多麻煩煩的,甚至是是實現(xiàn)不了的的。這時候,人人們就會問為為什么系統(tǒng)中中有我需要的的數(shù)據(jù),而我我卻無法運用用呢!這不是是說關系數(shù)據(jù)據(jù)庫不好,而而是老產(chǎn)品遇遇到了新任務務。E-R型的數(shù)數(shù)據(jù)結構能完完美地執(zhí)行聯(lián)聯(lián)機業(yè)務處理理,但不適應應較大規(guī)模的的決策支持數(shù)數(shù)據(jù)分析,尤尤其不適應企企業(yè)級的決策策支持數(shù)據(jù)分分析處理的需需要。適應這這一需求,應應運而生的就就是數(shù)據(jù)倉庫庫技術。在W.H.Innmon所著著“Buildding tthe Daata Waarehouuse

13、”一書中給出出了數(shù)據(jù)倉庫庫的定義:“數(shù)據(jù)倉庫是是面向主題的的、整合的、穩(wěn)穩(wěn)定的,并且且時變的收集集數(shù)據(jù)以支持持管理決策的的一種數(shù)據(jù)結結構形式。”這一定義指指出了數(shù)據(jù)倉倉庫和事務處處理系統(tǒng)之間間的主要差異異。數(shù)據(jù)倉庫庫的目標是為為了制定管理理的決策提供供支持信息,這這顯著的與OOLTP系統(tǒng)統(tǒng)的快速響應應需要不同。正正象企業(yè)為了了發(fā)展要進行行業(yè)務重組一一樣,為了支支持管理決策策需要也要按按決策業(yè)務科科目的要求重重組OLTPP系統(tǒng)中的數(shù)數(shù)據(jù),并要按按不同決策,分分析內(nèi)容分別別組織使之方方便使用。這這種基于主題題的模式從用用戶角度來看看就是多重的的數(shù)據(jù)重組結結構。在把數(shù)據(jù)裝載到到數(shù)據(jù)結構重重組后的數(shù)據(jù)

14、據(jù)倉庫之前,先先要進行數(shù)據(jù)據(jù)轉換,或稱稱“整合”處理。這一一處理包括幾幾個必不可少少的操作步驟驟,做到使數(shù)數(shù)據(jù)完整、統(tǒng)統(tǒng)一,這就確確保了在使用用數(shù)據(jù)倉庫時時其中的數(shù)據(jù)據(jù)是有質量保保證的,對此此后文有詳述述。簡而言之之,整合就是是保證數(shù)據(jù)準準確,到位,沒沒有超出應有有的數(shù)值范圍圍,沒有重復復等。數(shù)據(jù)倉倉庫中的數(shù)據(jù)據(jù)不象事務處處理系統(tǒng)中的的數(shù)據(jù)那樣頻頻繁的修改,所所以它是比較較穩(wěn)定的(不不必實時修改改)。在一次次數(shù)據(jù)分析的的執(zhí)行過程中中使用的數(shù)據(jù)據(jù)不得變更,這這才能保證兩兩次在使用同同一組信息進進行分析時不不會得出不同同的答案。數(shù)數(shù)據(jù)倉庫一般般是按周、月月或隔月從OOLTP系統(tǒng)統(tǒng)周期性的批批次更新

15、數(shù)據(jù)據(jù)。由于具有有數(shù)據(jù)的時段段穩(wěn)定性,對對數(shù)據(jù)倉庫來來說就可以減減少許多傳統(tǒng)統(tǒng)RDBMSS必須的資源源消耗,如:記錄的鎖機機制、參照完完整性的檢查查、數(shù)據(jù)操作作的日志、以以及檢查點/回退(Rolll bacck)等。和OLTP的“實際事件”相比,SASS數(shù)據(jù)倉庫的的數(shù)據(jù)組織可可呈多維時間間段結構(時時變的例如:19997年各個月月份的銷售數(shù)數(shù)據(jù)),這一一數(shù)據(jù)結構供供進行某一時時間段眾多事事件的定量分分析用,并產(chǎn)產(chǎn)生相應的結結論。從本質質上說,數(shù)據(jù)據(jù)倉庫的目標標是從聯(lián)機業(yè)業(yè)務處理系統(tǒng)統(tǒng)中篩選出某某項決策所需需的支持數(shù)據(jù)據(jù),再在分析析處理過程中中得出進行決決策時有用的的信息。供分分析使用的這這種時

16、變數(shù)據(jù)據(jù)亦可預先歸歸納出若干層層次的匯總數(shù)數(shù)據(jù)以利決策策支持使用,這這樣,在常規(guī)規(guī)決策操作時時就不必臨時時進行基礎數(shù)數(shù)據(jù)的匯總處處理了。SAS系統(tǒng)提供供的數(shù)據(jù)倉庫庫模型是包括括了數(shù)據(jù)倉庫庫管理、組織織和信息展現(xiàn)現(xiàn)的整體解決決方案。這是是由一族有機機組合產(chǎn)品構構成的陣容強強大的模型。在在下圖中表示示了SAS數(shù)據(jù)倉倉庫的模型??傊?,數(shù)據(jù)倉庫庫是當今社會會的人們參與與市場競爭等等各項活動,要要進行決策時時的最適合的的數(shù)據(jù)結構形形式。是適應應企業(yè)重組(Re-Engineering)時,進行企業(yè)數(shù)據(jù)、信息重組的工具。SAS在數(shù)據(jù)倉庫技術上的成功例證和經(jīng)驗也必然能幫助中國的企業(yè)更卓有成效的走向市場經(jīng)濟的大

17、潮。SAS數(shù)據(jù)倉庫庫的組成提醒您:在購買買數(shù)據(jù)倉庫產(chǎn)產(chǎn)品時注意其其必不可少的的技術環(huán)節(jié)數(shù)據(jù)倉庫是適應應決策支持系系統(tǒng)的需要而而產(chǎn)生的,所所以人們希望望所采用的軟軟件產(chǎn)品能支支持決策過程程的全部工作作內(nèi)容。SAAS的數(shù)據(jù)倉倉庫技術就是是可以支持決決策全過程的的整體解決方方案。包括:從任何業(yè)務處理理系統(tǒng)或數(shù)據(jù)據(jù)源中取出決決策所需數(shù)據(jù)據(jù)對源數(shù)據(jù)進行清清理和整合按計劃或規(guī)則進進行數(shù)據(jù)倉庫庫的裝載和更更新按支持決策的需需要,以多種種形式進行數(shù)數(shù)據(jù)和信息的的組織最豐富的決策數(shù)數(shù)據(jù)分析處理理能力靈活多樣的結果果展現(xiàn)方式如果您想建立決決策支持系統(tǒng)統(tǒng)的話,您就就應當檢查您您所采用的軟軟件工具是否否具備上述全全面

18、的能力。SAS系統(tǒng)的數(shù)數(shù)據(jù)存取能力力從早期的SASS技術來看,它它就是一個十十分通用,且且又十分開放放的軟件產(chǎn)品品。唯有這樣樣SAS才會在在如此廣泛的的各種不同類類型計算機系系統(tǒng)平臺和各各種各樣的環(huán)環(huán)境中得到充充分的運用。SAS有一個SAS/ACCESS產(chǎn)品,利用它可對眾多不同格式的數(shù)據(jù)進行查詢、訪問和分析。SAS/ACCESS提供了與目前許多流行數(shù)據(jù)庫軟件和老的數(shù)據(jù)文件的接口,用SAS/ACCESS可建立對應外部異構數(shù)據(jù)的一個統(tǒng)一的共用數(shù)據(jù)界面。所提供的與外部數(shù)據(jù)的接口是透明和動態(tài)的。用戶可不必將數(shù)據(jù)真的讀到SAS系統(tǒng)中來,而只需在SAS系統(tǒng)中建立對外部數(shù)據(jù)的描述(亦即所謂View),便可把

19、這些外部數(shù)據(jù)當作真正存儲在SAS系統(tǒng)中的數(shù)據(jù)集一樣使用。這時,用戶即可使用這些數(shù)據(jù)進行所謂ROLAP式的數(shù)據(jù)分析和決策工作。對一些經(jīng)常反復使用的外部數(shù)據(jù),亦可利用SAS/ACCESS將其真正提取放入SAS系統(tǒng)中,并進一步經(jīng)過整理放進數(shù)據(jù)倉庫。SAS/ACCESS提供的接口是雙向的,既可將數(shù)據(jù)讀入SAS系統(tǒng),亦可在SAS系統(tǒng)中更新外部數(shù)據(jù),或將數(shù)據(jù)加載到外部數(shù)據(jù)載體中去。這使數(shù)據(jù)倉庫系統(tǒng)和原有的運行數(shù)據(jù)體系更加溝通。目前SAS/ACCESS支持的數(shù)據(jù)庫主要有:DB2,Oracle,Sybase,Rdb,CA-Ingres,CA-Datacom,Informix,ADABAS,NCR-Terada

20、ta,AS/400.等數(shù)據(jù)庫。SAS/ACCESS還能支持一些老的數(shù)據(jù)文件系統(tǒng),如有名的IBM/VSAM等。通過ODBC使SAS系統(tǒng)和更廣泛的開放型數(shù)據(jù)庫建立了溝通。另外,通過SAS編程中的DATA STEP可與任何知道其結構的數(shù)據(jù)進行聯(lián)結。在數(shù)據(jù)倉庫的宣宣傳中曾報道道用一個數(shù)據(jù)據(jù)庫產(chǎn)品作數(shù)數(shù)據(jù)倉庫使用用。但這個數(shù)數(shù)據(jù)庫對原有有數(shù)據(jù)載體沒沒有存取能力力,就又買了了第三方的軟軟件作為它們們?nèi)〕鰯?shù)據(jù)的的工具。這種種選擇顯然是是不妥當?shù)摹AS與眾多軟軟/硬件廠商長長期友好合作作所形成的跨跨平臺的數(shù)據(jù)據(jù)存取能力決決非一日之功功。數(shù)據(jù)的清理和整整合在SAS的數(shù)據(jù)據(jù)倉庫系統(tǒng)中中有專門的機機制進行引入入數(shù)

21、據(jù)的檢查查、核對和將將不同來源數(shù)數(shù)據(jù)進行整合合的技術環(huán)節(jié)節(jié)。在一個企企業(yè)或其它大大型的組織中中,各種數(shù)據(jù)據(jù)可能有不同同的類型,格格式可能也不不盡統(tǒng)一,在在原來不同的的應用場合亦亦可能采用了了不同的單位位、制式,要要想將它們放放在一起進行行有效的處理理,首先的要要求就是統(tǒng)一一。從業(yè)務操作系統(tǒng)統(tǒng)中引入的數(shù)數(shù)據(jù)必須進行行其完整性的的檢查。在一一條記錄中的的各個數(shù)據(jù)項項應保持完整整的存在關系系。若有缺項項,且又沒有有檢查,這必必然導致統(tǒng)計計的錯誤,決決策也會產(chǎn)生生偏差。數(shù)值的有效性也也是必須進行行核對的。防防止將數(shù)據(jù)源源中的錯誤帶帶入決策過程程之中。這些必要的清理理工作保障了了決策支持所所使用數(shù)據(jù)的的

22、質量。此外,還可以加加入用戶自己己認為需要加加強的環(huán)節(jié)。系系統(tǒng)允許在數(shù)數(shù)據(jù)整理的各各個層次加上上用戶自行強強化的環(huán)節(jié)。數(shù)據(jù)倉庫的加載載和更新從數(shù)據(jù)源抓取數(shù)數(shù)據(jù)不僅有質質量問題,還還有有計劃的的按一定時間間節(jié)奏從數(shù)據(jù)據(jù)源取出和裝裝入、更新數(shù)數(shù)據(jù)倉庫的問問題。因為SSAS系統(tǒng)有有主動去取外外部數(shù)據(jù)的能能力,所以按按時間節(jié)奏從從數(shù)據(jù)源取出出數(shù)據(jù)的操作作在和其它系系統(tǒng)管理人員員協(xié)調(diào)好的基基礎上,就可可完全在SAAS系統(tǒng)內(nèi)制制定從各系統(tǒng)統(tǒng)取用數(shù)據(jù)的的計劃了。在在此基礎上,數(shù)數(shù)據(jù)倉庫按照照數(shù)據(jù)和信息息使用的時間間要求,準時時的加載、更更新,就是完完全有保障的的了。從數(shù)據(jù)源到數(shù)據(jù)據(jù)倉庫一氣呵呵成的集成式式的

23、操作,這這是SAS數(shù)據(jù)倉倉庫技術的重重要特點。按決策需要重組組數(shù)據(jù)和信息息清理好的數(shù)據(jù)還還要進行重組組。按照決策策的需要組織織成不同的主主題的數(shù)據(jù)倉倉庫表。這是是十分關鍵性性的操作。在在再小的企業(yè)業(yè)或組織中,也也總是有許多多業(yè)務和技術術環(huán)節(jié)的。一一般來說,原原來運行系統(tǒng)統(tǒng)數(shù)據(jù)庫的設設計也總是針針對這些業(yè)務務和技術環(huán)節(jié)節(jié)設置“實體”,即數(shù)據(jù)庫庫的表。這樣樣的設計使OOLTP系統(tǒng)統(tǒng)在線運行時時,發(fā)揮了最最大限度的工工作效率。但但在開拓決策策支持的OLLAP時,特特別是對于全全企業(yè)范圍的的數(shù)據(jù)進行操操作時,這種種數(shù)據(jù)結構效效率極低。這這是因為可能能要從許多表表中取出所需需數(shù)據(jù),而且且還要進行數(shù)數(shù)據(jù)的

24、篩選,對對不同表中的的數(shù)據(jù)進行擬擬合等操作,這這是極費時間間和資源的。企企業(yè)范圍的決決策是對各個個環(huán)節(jié)分別進進行業(yè)務處理理的業(yè)務重組組,這就需要要有相應數(shù)據(jù)據(jù)結構的重組組,即按決策策的需要組織織成不同主題題的數(shù)據(jù)倉庫庫表,以及相相應的數(shù)據(jù)視視圖,匯總表表等。SASS為此設置了了交互式操作作的界面,以以最大的主動動性幫你完成成決策支持所所需的數(shù)據(jù)重重組。豐富的決策數(shù)據(jù)據(jù)處理能力在有的所謂數(shù)據(jù)據(jù)倉庫產(chǎn)品的的宣傳中說:為了處理數(shù)數(shù)據(jù)他們有各各種函數(shù)功能能供編程使用用。這顯然是是極其不夠的的。為了更有有效地支持決決策,可能需需要進行廣泛泛、深入的數(shù)數(shù)據(jù)挖掘(DData MMiningg)工作。SAS在

25、這方面面有世界領先先的豐富的決決策支持數(shù)據(jù)據(jù)分析、處理理軟件。首先SAS/MMDDB可幫幫你構造最適適宜OLAPP操作的多維維數(shù)據(jù)結構。SAS/STAAT覆蓋了所所有的實用數(shù)數(shù)理統(tǒng)計分析析方法,是國國際上統(tǒng)計分分析領域的標標準軟件。它它提供了十多多個過程可進進行各種不同同模型或不同同特點的回歸歸分析;為多多種試驗設計計模型提供了了方差分析工工具;在多變變量統(tǒng)計分析析方面,為主主成分分析,相相關分析,判判別分析和因因子分析提供供了許多專用用過程;還包包括多種聚類類準則的聚類類分析方法.等。SAS/ETSS提供了豐富富的計量經(jīng)濟濟學和時間序序列分析方法法,是研究復復雜系統(tǒng)和進進行預測的有有力工具。

26、SAS/OR提提供了全面的的運籌學方法法。SAS/IMLL提供了功能能強大的面向向矩陣運算的的編程語言,幫幫助你研究新新算法或解決決SAS系統(tǒng)中中沒有現(xiàn)成算算法的專門問問題。SAS/INSSIGHT是是一個可視化化的數(shù)據(jù)探索索工具。它將將統(tǒng)計方法與與交互式圖形形顯示融合在在一起,為你你展現(xiàn)了一種種全新的使用用統(tǒng)計分析方方法的環(huán)境。還有SAS的人人工神經(jīng)元網(wǎng)網(wǎng)絡和SASS/ASSIIST.等,具具有很大伸縮縮性的,適合合各個層次,各各種類型人員員使用的工具具。靈活多樣的結果果展現(xiàn)方式分析結果的展現(xiàn)現(xiàn)方式對決策策時人的判別別有重大的影影響。SASS也有眾多的的方式,方法法供你選擇:在Basee S

27、AS中中就有從簡單單列表到比較較復雜的統(tǒng)計計報表和用戶戶自定義的式式樣復雜的報報表的能力;SAS/EER(Enterrprisee Repoort)更是是為企業(yè)級的的決策過程提提供了報告的的制作能力;SAS/GGRAPH是是一個強有力力的圖形軟件件包,可將數(shù)數(shù)據(jù)及其包含含著的深層信信息以多種圖圖形生動的呈呈現(xiàn)出來.。從各種數(shù)據(jù)源主主動的取出數(shù)數(shù)據(jù);經(jīng)過清清理、整合;再按決策支支持的需要分分別主題,重重組數(shù)據(jù);按按照時序節(jié)奏奏不斷地自動動裝載、更新新數(shù)據(jù)倉庫;用世界權威威的,豐富的的數(shù)據(jù)處理工工具進行決策策分析;最后后以多種形式式將決策支持持的意見呈現(xiàn)現(xiàn)給你。這就就是完整的決決策支持數(shù)據(jù)據(jù)倉庫解

28、決方方案。再次提醒您:在在購買數(shù)據(jù)倉倉庫產(chǎn)品時注注意其必不可可少的技術環(huán)環(huán)節(jié)!SAS數(shù)據(jù)倉庫庫的體系結構構數(shù)據(jù)庫技術對計計算機應用的的推動發(fā)揮了了巨大的作用用,特別是建建立在E.FF.Coddd提出的E-RR理論基礎上上的關系型數(shù)數(shù)據(jù)庫更是對對OLTP(聯(lián)聯(lián)機業(yè)務處理理)應用開拓拓了廣闊天地地。19944年E.F.CCodd曾回回答一個提問問:為什么對對一個運行十十分良好的基基于E-R理論的的關系數(shù)據(jù)庫庫進行查詢,以以制作一個較較大型的報告告時,其響應應速度特別慢慢。他說:運運行數(shù)據(jù)庫是是基于OLTTP需求環(huán)境境設計的,這這已有太多的的成功事例。但但現(xiàn)在是OLLAP(聯(lián)機機分析處理,這這個概念

29、述語語E.F.CCodd在此此第一次提出出)類型的需需求。要實現(xiàn)現(xiàn)OLAP就要要有適應它的的,整合的,快快速的,多維維的信息架構構和查詢機制制。SAS數(shù)據(jù)倉庫庫就是一個適適應于對企業(yè)業(yè)級的數(shù)據(jù)、信信息進行重新新整合,適合合多維、快速速查詢;進行行OLAP操作作和決策支持持的數(shù)據(jù)、信信息的采集、管管理、處理和和展現(xiàn)的架構構體系。可用用下圖表示:環(huán)境SSAS數(shù)據(jù)倉倉庫的體系結結構數(shù)據(jù)倉庫庫1主題1主題表系統(tǒng)統(tǒng)主題表1 .主題表n匯總表組11SAS或DBMS匯總總層次1 .SAS或DBMS匯總總層次6MDDB11 .MDDBnn .匯總表組nn .信息市場11信息市場項項目1.信息市場項項目n.信息

30、市場nn .主題n數(shù)據(jù)市場場組1數(shù)據(jù)市場11 .數(shù)據(jù)市場nn信息市場11 .信息市場nn .數(shù)據(jù)市場場組n .數(shù)據(jù)倉庫庫n .運行數(shù)據(jù)據(jù)定義組1運行數(shù)據(jù)據(jù)定義1數(shù)據(jù)文件11 .數(shù)據(jù)文件nn外部文件11 .外部文件nn .運行數(shù)據(jù)據(jù)定義n .運行數(shù)據(jù)據(jù)定義組n環(huán)境(Enviiromennt)環(huán)境是SAS數(shù)數(shù)據(jù)倉庫的體體系結構的總總根,它由兩兩大部分組成成。一部分是是分別含有不不同主題內(nèi)容容的若干個數(shù)數(shù)據(jù)倉庫;另另一部分是對對數(shù)據(jù)源的定定義。這構成成了從數(shù)據(jù)采采集到直接應應用的完整的的支持體系。數(shù)據(jù)倉庫(Daata Waarehouuse)可以存在多個數(shù)數(shù)據(jù)倉庫,這這是為了使用用的方便。在在一個大

31、的企企業(yè)或組織中中不同部門在在進行決策分分析時可能使使用的是徊然然不同的數(shù)據(jù)據(jù),重新整合合后就沒有必必要將它們放放在一起了。在在體系結構層層次中的數(shù)據(jù)據(jù)倉庫主要是是管理性的作作用,其中有有對數(shù)據(jù)倉庫庫所有組成單單元的解釋性性數(shù)據(jù)-Meetadatta。在每個個數(shù)據(jù)倉庫中中還可以設置置若干個主題題,這一般是是同一部門中中支持不同決決策內(nèi)容對應應的數(shù)據(jù)。主主題是較大的的數(shù)據(jù)載體,相相對精簡或匯匯總一些的是是所謂數(shù)據(jù)市市場,在一個個數(shù)據(jù)倉庫中中亦可存在若若干個數(shù)據(jù)市市場。主題(Subjject)在每個主題中有有一個主題表表系統(tǒng),其中中放置與此主主題相關的各各種數(shù)據(jù)。為為了支持決策策方便還設置置了若干

32、個數(shù)數(shù)據(jù)的匯總表表組。進一步步為了支持決決策的方便還還有若干個信信息市場組,其其中放置的是是對數(shù)據(jù)處理理后產(chǎn)生的決決策支持信息息。主題表系統(tǒng)(DDetaill)這里放置的就是是從各個數(shù)據(jù)據(jù)源取出,經(jīng)經(jīng)過清理、整整合的原始數(shù)數(shù)據(jù)。為了使使用和管理的的方便,這些些數(shù)據(jù)可放在在多個表中。主題表(Dettail TTable)從運行系統(tǒng)數(shù)據(jù)據(jù)源取出的數(shù)數(shù)據(jù),分別組組成這里的若若干表。它們們可能是實際際的表,也可可以是一些邏邏輯視圖(VView)。從從本質上講,它它們和原來各各個運行系統(tǒng)統(tǒng)數(shù)據(jù)源的數(shù)數(shù)據(jù)內(nèi)容是一一致的。但是是為了支持決決策數(shù)據(jù)處理理的使用方便便,而對數(shù)據(jù)據(jù)的結構進行行了重組。為為了決策支

33、持持數(shù)據(jù)處理工工作的方便,和和提高了工作作的效率,在在數(shù)據(jù)重組過過程中,可能能還要增加一一些數(shù)據(jù)冗余余。匯總表組(Suummaryy Grouups)在匯總表組中定定義進行數(shù)據(jù)據(jù)匯總處理時時的層次維數(shù)數(shù)和所分析的的變量。當匯匯總表組是按按SAS數(shù)據(jù)集集和DBMSS格式存放時時可有六個層層次,若是采采用SAS的多維維數(shù)據(jù)庫產(chǎn)品品MDDB時則則可有任意多多個層次。實實際上數(shù)據(jù)匯匯總就是最常常用的決策支支持數(shù)據(jù)處理理手段,或有有時是在匯總總數(shù)據(jù)的基礎礎上再進行進進一步的決策策支持數(shù)據(jù)處處理。匯總表表組可以有若若干個,也就就是說可以對對多種變量分分別進行不同同方式的匯總總處理。匯總層次(Suummar

34、yy Leveels)匯總一般是按時時間進程而執(zhí)執(zhí)行的。匯總總層次就是表表示你所選擇擇的數(shù)據(jù)匯總總處理的時間間維,如:日日、周、月等等。信息市場(Innformaation Martss)這是信息市場的的分組,在一一項主題中可可以有若干組組信息市場。一一般來說是按按不同的決策策支持內(nèi)容需需要進行分組組的。之所以以要稱之為“信息市場”,這正是體體現(xiàn)了設置這這樣一個機制制的目的:要要讓決策者象象到了一個信信息市場一樣樣,能最方便便,最快捷的的取得決策支支持所需要的的信息。信息市場項目(Information Mart Items)這是信息市場中中一項項具體體的信息,它它是對數(shù)據(jù)倉倉庫中的數(shù)據(jù)據(jù)處理

35、后產(chǎn)生生的結果。在在一個企業(yè)或或組織中決策策目標并不總總是隨機的,相相反總是有一一些要經(jīng)常反反復進行的決決策工作,但但是隨著時間間的進程,支支持決策的依依據(jù)在不斷發(fā)發(fā)展、變化。利利用數(shù)據(jù)倉庫庫架構就可以以對這樣的決決策支持數(shù)據(jù)據(jù)處理工作自自動的及時執(zhí)執(zhí)行。當人們們需要決策支支持時,馬上上就可以得到到這些信息的的支持。信息市場項目可可以是一些報報表、圖形或或分析的結果果。它也可以以是一項應用用功能的輸出出。你在調(diào)用用這樣的項目目時,可以是是即時啟動此此項應用功能能,也可以將將它們設定成成在數(shù)據(jù)倉庫庫更新時作為為系統(tǒng)運行的的一部分。這這樣,就在可可能的最早時時間形成了決決策支持的信信息,為支持持決

36、策創(chuàng)造最最大限度的快快捷和方便。數(shù)據(jù)市場組(DData MMart GGroupss)這是對數(shù)據(jù)市場場項目的分組組,在一個數(shù)數(shù)據(jù)倉庫中可可以有多組數(shù)數(shù)據(jù)市場。這這也是按內(nèi)容容的不同進行行分組的。和和“信息市場”一樣“數(shù)據(jù)市場”也是一個形形象化的表達達詞匯:要讓讓決策者能最最方便的取得得決策支持所所需要的數(shù)據(jù)據(jù)。數(shù)據(jù)市場(Daata Maarts)有時決策就是依依據(jù)某些數(shù)據(jù)據(jù),但讓決策策者在浩如煙煙海的企業(yè)信信息系統(tǒng)中找找出這些數(shù)據(jù)據(jù)可能并非易易事。正是為為了這樣地目目的設置了數(shù)數(shù)據(jù)市場。它它實際上就是是為了各種特特殊需要專門門設計的數(shù)據(jù)據(jù)表。特別是是對一些要緊緊急查詢的內(nèi)內(nèi)容設置這樣樣的數(shù)據(jù)表

37、,就就更有必要。你你可以注意到到數(shù)據(jù)市場不不是設置在每每個主題內(nèi),而而是設置在數(shù)數(shù)據(jù)倉庫的范范疇內(nèi),這也也就是說,你你可在以分主主題的方式對對原來運行數(shù)數(shù)據(jù)重組的基基礎上,為了了某種支持決決策的需要,再再跨主題進行行數(shù)據(jù)的重組組。可以想象象,這給你隨隨著企業(yè)管理理的發(fā)展,在在要求你為了了業(yè)務重組而而進行數(shù)據(jù)重重組時,SAAS數(shù)據(jù)倉庫庫技術為你創(chuàng)創(chuàng)造了可持續(xù)續(xù)增長的、無無限的數(shù)據(jù)重重組的廣闊天天地。運行數(shù)據(jù)定義組組(Operrationnal Daata Deefinittion GGroup)這是對要從數(shù)據(jù)據(jù)源取出的數(shù)數(shù)據(jù)進行定義義的分組。企企業(yè)可能有許許多數(shù)據(jù)源,比比如說,它們們是放在不同同

38、的計算機系系統(tǒng)中的,你你就可以分系系統(tǒng)設置數(shù)據(jù)據(jù)定義組。這這從運行、管管理上看,或或者說從開發(fā)發(fā)文檔上看都都是比較清楚楚的。運行數(shù)據(jù)定義(Operational Data Definition)在這里定義你要要取出的數(shù)據(jù)據(jù)。前面已述述SAS不僅有有多種方式可可從各種環(huán)境境中取出數(shù)據(jù)據(jù),而且可以以通過SASS/ACCEESS在SAS系統(tǒng)中中啟動這些操操作。所以這這里就是你在在SAS/AACCESSS中設定的邏邏輯視圖(VView)的的描述。由于于取用對象的的不同,它亦亦可能是SAAS語句PROCC SQL的邏邏輯視圖(VView)的的描述,或是是DATE STEP邏邏輯視圖(VView)的的描述

39、。由上述內(nèi)容可以以看出SASS數(shù)據(jù)倉庫有有一個十分完完善的體系結結構。不僅為為你建立決策策支持系統(tǒng)提提供了完整的的解決方案,而而且為今后的的持續(xù)發(fā)展留留下了廣闊的的天地。這也也正是SASS獲得數(shù)據(jù)倉倉庫最佳產(chǎn)品品獎的原因所所在。SAS數(shù)據(jù)倉庫庫的開發(fā)利用SAS技術術建立數(shù)據(jù)倉倉庫,在全世世界已有數(shù)以以千計的成功功先例,從而而也積累了開開發(fā)的經(jīng)驗。SAS研究所愿與你分享這些經(jīng)驗:亦即在提供SAS數(shù)據(jù)倉庫軟件產(chǎn)品時,還可向你提供建立數(shù)據(jù)倉庫的方法學,咨詢服務,以至建立數(shù)據(jù)倉庫的服務。數(shù)據(jù)倉庫并不等同于數(shù)據(jù)庫,數(shù)據(jù)倉庫也有其開發(fā)的特點。根據(jù)SAS的經(jīng)驗建立一個數(shù)據(jù)倉庫會有以下五方面的工作:任務和環(huán)境

40、的評評估需求的收集和分分析構造數(shù)據(jù)倉庫數(shù)據(jù)倉庫技術的的培訓回顧、總結再發(fā)發(fā)展任務和環(huán)境的評評估數(shù)據(jù)倉庫是建立立在原有的運運行系統(tǒng)之上上的。因此要要結合單位的的現(xiàn)狀來明確確數(shù)據(jù)倉庫的的目標任務。除除了業(yè)務現(xiàn)狀狀外,特別要要搞清任務所所面對的數(shù)據(jù)據(jù)源所在系統(tǒng)統(tǒng)和其中的數(shù)數(shù)據(jù)的狀況。通通過對這些情情況的評估,看看建立數(shù)據(jù)倉倉庫的這個任任務是否是可可行的;所能能建立的數(shù)據(jù)據(jù)倉庫是不是是用戶所期望望的;在此有有沒有不可逾逾越的障礙。最最好能確定評評定將來數(shù)據(jù)據(jù)倉庫系統(tǒng)成成功與否的基基本原則。開展評估工作一一定要有高層層負責人參加加,最好他就就是將來使用用數(shù)據(jù)倉庫部部門的負責人人。這樣從他他這里就可以以了

41、解到全部部的業(yè)務工作作狀況。他也也最清楚今后后的工作目標標及對任務的的期望,以及及和競爭對手手比較有什么么差距。在評評估工作開展展過程中,他他應當及時的的提出問題,并并檢查、回顧顧工作的進展展。在他的領導下要要組成一個項項目組,并有有以下人員參參加:項目總總負責人,與與數(shù)據(jù)倉庫相相關的所有業(yè)業(yè)務單位的負負責人,計算算機軟/硬件負責人人,向數(shù)據(jù)倉倉庫提供數(shù)據(jù)據(jù)的數(shù)據(jù)庫管管理員以及網(wǎng)網(wǎng)絡方面的人人員。項目組組要進行項目目定義,并首首先按要達到到的目標初步步確定數(shù)據(jù)倉倉庫的主題。進進一步說明這這個主題的層層次結構,及及所涉及的相相關業(yè)務處理理。最好還能能設立幾個可可量化的工作作指標。除了業(yè)務工作外外

42、,還要對相相關的信息技技術狀況進行行評估:數(shù)據(jù)據(jù)源的數(shù)據(jù)庫庫類型,工作作平臺,數(shù)據(jù)據(jù)量,數(shù)據(jù)的的質量等;將將要建立數(shù)據(jù)據(jù)倉庫的環(huán)境境狀況,以及及所利用的網(wǎng)網(wǎng)絡技術狀況況。全部評估工作應應有正規(guī)的文文檔記載,并并交數(shù)據(jù)倉庫庫負責人審定定。需求的收集和分分析數(shù)據(jù)倉庫是為支支持決策服務務的。故首先先要看決策者者(亦即領導導)的需求,即即:現(xiàn)在最重重要的工作目目標是什么;怎樣衡量這這個目標是成成功的達到了了;現(xiàn)在是怎怎樣獲得決策策支持信息的的;和競爭對對手比差距是是什么。領導的決策總是是由一批具體體工作人員支支持的,所以以還應當從他他們這里收集集具體的需求求,并加以分分析:對應前前面所定的主主題,現(xiàn)在

43、利利用什么信息息或報表(最最好有實例);這報表中還還缺什么信息息;這報表是是如何制作出出來的;有沒沒有緊急、突突發(fā)的決策信信息要求,其其內(nèi)容是什么么;還希望數(shù)數(shù)據(jù)倉庫為他他們做些什么么等。在此基礎上確定定:當前共同同的業(yè)務問題題是什么;希希望開發(fā)怎樣樣的功能來解解決這些問題題;由此定義義好業(yè)務處理理的規(guī)則;初初步估計功能能的規(guī)模和數(shù)數(shù)據(jù)量;與此此同時還要定定義、理清業(yè)業(yè)務和編程需需要的代碼?;谏鲜鰳I(yè)務需需求和分析即即可開始制定定系統(tǒng)的邏輯輯模型。此外,還要對實實現(xiàn)這些業(yè)務務需求時,對對信息技術的的需求加以分分析:每一個個數(shù)據(jù)源的物物理存儲狀況況、運行平臺臺、數(shù)據(jù)質量量如何;確認認硬件、網(wǎng)絡絡

44、和軟件的限限制條件;數(shù)數(shù)據(jù)裝載和更更新的策略和和問題;數(shù)據(jù)據(jù)量和占用空空間的估計;從信息技術術看數(shù)據(jù)的質質量有什么問問題等。最后,還是制作作文檔。其內(nèi)內(nèi)容應包括:項目概述差距分析系統(tǒng)基本架構圖圖示邏輯模型物理模型數(shù)據(jù)倉庫初始裝裝載和更新的的策略數(shù)據(jù)倉庫的運行行計劃決策信息展現(xiàn)的的希望和需求求數(shù)據(jù)倉庫建成的的時限構造數(shù)據(jù)倉庫構造數(shù)據(jù)倉庫包包括了數(shù)據(jù)倉倉庫的管理,數(shù)數(shù)據(jù)倉庫的組組織和決策支支持信息的展展現(xiàn)三部分。數(shù)據(jù)倉庫的管理理通過建立以以下諸項內(nèi)容容實現(xiàn)之:設設置和編寫取取用數(shù)據(jù)的程程序;設置和和編寫數(shù)據(jù)轉轉換程序;設設置和編寫數(shù)數(shù)據(jù)更新程序序;設置和編編寫運行的接接口程序;建建立這一階段段的所

45、有管理理用數(shù)據(jù)Metaddata;此此階段所有程程序統(tǒng)一標準準命名和建檔檔。數(shù)據(jù)倉庫的組織織包括了:規(guī)規(guī)劃數(shù)據(jù)倉庫庫的初始裝載載;在數(shù)據(jù)倉倉庫中建立所所需的索引;除了數(shù)據(jù)表表外,建立數(shù)數(shù)據(jù)視窗(VView);進行數(shù)據(jù)倉倉庫及工作平平臺的安全檢檢查;裝入數(shù)數(shù)據(jù)和應用功功能;建立這這一階段的所所有管理用數(shù)數(shù)據(jù)Meetadatta。決策支持信息的的展現(xiàn)SASS有強大的工工具軟件可供供使用:SAAS/STAAT是國際上上統(tǒng)計分析領領域的標準軟軟件,涵蓋了了所有實用數(shù)數(shù)理統(tǒng)計分析析方法;SAAS/EISS是一個成熟熟的決策支持持表現(xiàn)工具,也也是快速開發(fā)發(fā)工具并采用用了面向對象象的開發(fā)方式式;SAS/AF

46、也是一一個應用開發(fā)發(fā)工具,并含含有眾多現(xiàn)成成功能的SAAS軟件作為為方法庫;SSAS/ETTS提供了豐豐富的計量經(jīng)經(jīng)濟學和時間間序列分析方方法,是研究究復雜系統(tǒng)和和進行預測的的有力工具;SAS/GGIS是集地地理信息系統(tǒng)統(tǒng)與空間數(shù)據(jù)據(jù)顯示分析于于一體的軟件件;SAS還提供供了人工神經(jīng)經(jīng)元網(wǎng)絡的功功能;SASS/ASSIIST采用了了面向菜單的的驅動界面,借借助它可使用用許多其它SSAS軟件;SAS/IINSIGHHT是一個可可視化的數(shù)據(jù)據(jù)探索工具;SAS/OOR提供了全全面的運籌學學方法;通過過ODBC,OLE等還可可集成許多現(xiàn)現(xiàn)有的桌面工工具。利用這些工具可可預先制作好好許多常規(guī)的的信息市場

47、項項目(Inffomartt)供支持決決策使用,亦亦可利用這些些工具直接操操作主題數(shù)據(jù)據(jù)以得出新的的決策支持信信息。數(shù)據(jù)倉庫技術的的培訓數(shù)據(jù)倉庫是支持持其使用者進進行決策的,即即使是建成了了非常好的數(shù)數(shù)據(jù)倉庫,人人對系統(tǒng)的運運作仍是決定定性的因素。人人利用數(shù)據(jù)倉倉庫決策的成成功才是數(shù)據(jù)據(jù)倉庫的成功功,所以建成成數(shù)據(jù)倉庫后后要認真進行行最終用戶的的培訓。首先先要向用戶介介紹數(shù)據(jù)倉庫庫全部的情況況,用戶掌握握的越深入,將將來運用的就就更好;數(shù)據(jù)據(jù)是向用戶介介紹的重點,不不僅要介紹詳詳盡的數(shù)據(jù)內(nèi)內(nèi)容,而且要要介紹系統(tǒng)如如何保障數(shù)據(jù)據(jù)的質量、完完整性和可靠靠性,并且讓讓他們在今后后使用中進一一步注意這

48、些些問題,很可可能這就是以以后維護,改改進的地方;Metaddata是數(shù)數(shù)據(jù)倉庫的管管理性數(shù)據(jù),要要告訴用戶什什么是Mettadataa,在何處,如如何使用它;圖形化的界界面和各項功功能當然是培培訓的主要內(nèi)內(nèi)容;還要介介紹數(shù)據(jù)的更更新計劃和此此后數(shù)據(jù)的可可用性;匯總總層次的增加加,可能是用用戶新需求的的內(nèi)容,要讓讓他們知道如如何和開發(fā)人人員一起完成成這件事;最最后,不要忘忘記安全規(guī)范范的培訓。假如數(shù)據(jù)倉庫的的管理員不是是系統(tǒng)的開發(fā)發(fā)者,那末該該員亦屬培訓訓范圍。培訓訓內(nèi)容是:數(shù)數(shù)據(jù)倉庫的邏邏輯和物理模模型;從OLLTP系統(tǒng)到到數(shù)據(jù)倉庫的的數(shù)據(jù)流;全全部的數(shù)據(jù)轉轉換操作;所所有Metaadata

49、的的所在和內(nèi)容容,管理員對對Metaddata要有有相當?shù)氖煜はこ潭炔拍軇賱偃喂ぷ?;?shù)數(shù)據(jù)裝載和更更新的策略;所有安全性性問題及其測測度;所有程程序文檔資料料的管理;等等等?;仡櫋⒖偨Y再發(fā)發(fā)展在數(shù)據(jù)倉庫的開開發(fā)過程中要要不斷的回顧顧哪些地方可可以做的更好好;業(yè)務部門門對開發(fā)的支支持是否到位位;雙方如何何合作的更好好;什么是業(yè)業(yè)務部門最立立竿見影的效效益,知道了了就要抓住它它;什么是開開發(fā)部門最立立竿見影的效效益,就要利利用它更好地地為用戶服務務。開發(fā)有了一定進進展,就要慎慎重地看看:主題的范圍圍選擇是否恰恰當;是否應應參與的部門門都積極主動動地參與了工工作;有什么么階段成果;發(fā)布這些成成果的反

50、映如如何;業(yè)務和和開發(fā)部門分分別有什么反反映;公司層層的領導是否否看到了初步步成果;若有有問題及時改改進。在數(shù)據(jù)倉庫開發(fā)發(fā)完成后要檢檢查:數(shù)據(jù)倉倉庫的采用是是否對公司有有所推進;數(shù)數(shù)據(jù)倉庫的采采用是否提高高了公司的競競爭優(yōu)勢;投投資的回報率率是否達到了了預計的水平平;是否有公公司的其它部部門可利用數(shù)數(shù)據(jù)倉庫獲得得效益;有沒沒有得到未曾曾期望過的效效益。數(shù)據(jù)倉庫的開發(fā)發(fā)往往是從一一個簡明的急急需主題開始始,從中積累累經(jīng)驗,并由由此也可能會會激發(fā)用戶的的新需求,然然后不斷擴大大數(shù)據(jù)倉庫的的內(nèi)容和規(guī)模模。只要你穩(wěn)穩(wěn)扎穩(wěn)打,循循序漸進,SSAS一定能能幫你建立好好你們的數(shù)據(jù)據(jù)倉庫,并使使您的部門利利用

51、它獲得更更大的效益。SAS的數(shù)據(jù)倉倉庫產(chǎn)品SAS/WWASAS的數(shù)據(jù)倉倉庫是一個非非常成熟的軟軟件。它有一一個順應需求求的發(fā)展歷史史,在發(fā)展中中不斷完善,實實際上已是本本領域的權威威產(chǎn)品。連續(xù)續(xù)兩年的獲獎獎更說明了業(yè)業(yè)界的擁戴。SAS的數(shù)據(jù)倉倉庫產(chǎn)品SAS系統(tǒng),多多年來就以它它的數(shù)據(jù)的存存取,管理,分分析和展現(xiàn)能能力供用戶作作為決策支持持的工具來使使用。SASS的數(shù)據(jù)倉庫庫產(chǎn)品SSAS/Waarehouuse Addminisstratoor(簡稱SASS/WA)一一方面將原有有的這些工具具整合在一起起;另外,為為了更規(guī)范地地建立,維護護數(shù)據(jù)倉庫和和更方便地對對數(shù)據(jù)倉庫和和數(shù)據(jù)市場進進行存取,

52、又又添加了新的的功能和工具具:定義數(shù)據(jù)倉庫及及其主題傳送和匯總整理理數(shù)據(jù)更新匯總數(shù)據(jù)建立,管理和取取用查看meetadatta設置數(shù)據(jù)市場定義數(shù)據(jù)倉庫及及其主題在SAS/WAA中設置了友友好的用戶界界面供用戶定定義自己數(shù)據(jù)據(jù)倉庫的構成成。在前文中中已介紹過SSAS數(shù)據(jù)倉倉庫的體系結結構。在SAAS/WA導導引的定義過過程中保證了了數(shù)據(jù)倉庫的的規(guī)范化和體體系中諸元素素的內(nèi)在的應應有聯(lián)系。在在進行這些定定義后,按照照這些聯(lián)系就就形成了一個個規(guī)范化的數(shù)數(shù)據(jù)倉庫體系系。SAS/WA在每一一步的操作中中都提供了缺缺省的元素特特性,但是根根據(jù)你的特殊殊需要,也可可以對它進行行更改。在這里特別要指指出的是:

53、你你所定義的數(shù)數(shù)據(jù)倉庫,可可以建立在SSAS數(shù)據(jù)庫庫中;可建立立在一般的DDBMS中;還可以建立立在SAS的多維維數(shù)據(jù)庫產(chǎn)品品SAS/MMDDB中。在在SAS/MMDDB中可可形成E.FF.Coddd所指出的運運作OLAPP的最佳數(shù)據(jù)據(jù)結構多維數(shù)據(jù)據(jù)結構。這將將大大提高數(shù)數(shù)據(jù)查詢、訪訪問的速度和和方便程度。傳送和匯總整理理數(shù)據(jù)這是通過SASS/WA的Proceess的Editoor來進行的的,它可以定定義四種處理理過程:運行數(shù)據(jù)的映射射(Mappping)在此定義從輸入入數(shù)據(jù)源中取取出哪些數(shù)據(jù)據(jù),這些數(shù)據(jù)據(jù)如何轉換,然然后將它們裝裝載到哪個主主題數(shù)據(jù)表中中去。數(shù)據(jù)傳送將數(shù)據(jù)從其所在在的計算機系

54、系統(tǒng)中選出,SAS/WA對它進行相應處理,然后使用PROC UPLOAD或者PROC DOWNLOAD再把它送到數(shù)據(jù)倉庫所在計算機系統(tǒng)中。在圖1中表示了數(shù)據(jù)的傳送過程的一個示例。記錄選取器按照你規(guī)定的某某些選取規(guī)則則選出一個數(shù)數(shù)據(jù)子集。形形成數(shù)據(jù)倉庫庫的其它元素素,如相應的的表,數(shù)據(jù)市市場或是VIIEW等。用戶出口除了SAS/WWA所規(guī)定的的數(shù)據(jù)倉庫的的操作過程外外,用戶在各各個環(huán)節(jié)均可可插入認為需需要的數(shù)據(jù)操操作,如圖11所示:圖1數(shù)據(jù)倉庫的的數(shù)據(jù)傳送過過程示例更新匯總數(shù)據(jù)數(shù)據(jù)倉庫中的數(shù)數(shù)據(jù)是按你確確定的時序,自自動的進行主主題數(shù)據(jù)更新新的。更新實實際上有兩種種含義即在原原有數(shù)據(jù)表中中進行某

55、些數(shù)數(shù)據(jù)的更新;或者是產(chǎn)生生一個新的時時間區(qū)間的數(shù)數(shù)據(jù)新版本。無無論是哪一種種情況,SAAS/WA都都會按你預先先規(guī)定的規(guī)則則產(chǎn)生一個新新的匯總數(shù)據(jù)據(jù)。因為匯總總數(shù)據(jù)可能對對數(shù)據(jù)倉庫中中的許多信息息元素都有關關系,這樣就就保證了全體體信息的一致致性。建立,管理和取取用查看meetadatta企業(yè)的數(shù)據(jù)倉庫庫可能是從許許多不同的大大系統(tǒng)中取出出數(shù)據(jù)建立的的,因此其規(guī)規(guī)??赡鼙仍械臄?shù)據(jù)庫庫都要大的多多。面對這巨巨大的數(shù)據(jù)倉倉庫,從建立立伊始就要保保證其可管理理性。在通過SAS/WA建立數(shù)數(shù)據(jù)倉庫的過過程中,將形形成一個若干干個數(shù)據(jù)倉庫庫共用的meetadatta其中包括括了:數(shù)據(jù)倉庫中的各各個

56、元素所存存放的地方在每臺計算機系系統(tǒng)中都有哪哪些數(shù)據(jù)倉庫庫的什么內(nèi)容容如何從運行系統(tǒng)統(tǒng)的數(shù)據(jù)源中中取出所需的的信息其它數(shù)據(jù)倉庫管管理員和用戶戶間需要溝通通的信息metadatta不僅是數(shù)數(shù)據(jù)倉庫的文文檔資料,可可供管理,維維護人員使用用,而且亦可可供用戶查詢詢,使之更好好的了解數(shù)據(jù)據(jù)倉庫,提高高自己的使用用水平。設置數(shù)據(jù)市場數(shù)據(jù)市場(Daata Maart)是為為了更方便用用戶的信息利利用而設置的的。日常的許許多決策支持持就是需要相相應的一組數(shù)數(shù)據(jù)。數(shù)據(jù)市市場的設置,以以其恰好對應應需求的針對對性;信息的的廣泛綜合性性(可能是跨跨主題的,預預先處理好的的);以及和和整個數(shù)據(jù)倉倉庫更新的同同步節(jié)

57、奏;最最及時的滿足足了用戶決策策支持的需要要。SAS數(shù)據(jù)倉庫庫的方法學作為一個成熟的的產(chǎn)品SASS不僅提供給給你一套數(shù)據(jù)據(jù)倉庫的計算算機輔助設計計工具;而且且向你提供SSAS建立數(shù)數(shù)據(jù)倉庫的成成功經(jīng)驗SAS數(shù)據(jù)據(jù)倉庫的方法法學。包括:如何建立好數(shù)據(jù)據(jù)倉庫的開發(fā)發(fā)隊伍如何進行數(shù)據(jù)倉倉庫的需求分分析在一定系統(tǒng)環(huán)境境中確定建立立數(shù)據(jù)倉庫對對信息技術的的需求數(shù)據(jù)倉庫的設計計和原形化開開發(fā)方法數(shù)據(jù)倉庫的投運運SAS的這些成成功經(jīng)驗可以以幫你少走彎彎路,開發(fā)迅迅速;同時,依依照SAS的成功功經(jīng)驗還給你你創(chuàng)造了一個個使決策支持持系統(tǒng)從無到到有、從小到到大可持續(xù)穩(wěn)穩(wěn)定地發(fā)展的的局面。SAS數(shù)據(jù)倉庫庫系統(tǒng)的全方

58、方位集成性數(shù)據(jù)倉庫的數(shù)據(jù)據(jù)來源可能是是許多的計算算機系統(tǒng)和許許多不同的數(shù)數(shù)據(jù)載體。在在一個企業(yè)中中為了不同業(yè)業(yè)務部門的需需要亦可能要要建立多個數(shù)數(shù)據(jù)倉庫,這這些數(shù)據(jù)倉庫庫也可能要建建立在不同的的系統(tǒng)平臺上上。SAS可以適適應最復雜的的環(huán)境,建立立統(tǒng)一管理,更更新的集成式式的數(shù)據(jù)倉庫庫系統(tǒng)。如圖圖2所示例:圖2 SASS系統(tǒng)支持的的多系統(tǒng)環(huán)境境下的數(shù)據(jù)倉倉庫架構示例例在這個系統(tǒng)中有有:統(tǒng)一的數(shù)據(jù)倉庫庫管理機制SAS/Warehhouse Adminnistraator對應多數(shù)據(jù)源和和多個數(shù)據(jù)倉倉庫有統(tǒng)一的的文檔資料metaadata利用SAS跨平平臺、跨數(shù)據(jù)據(jù)庫的存取能能力實現(xiàn)數(shù)據(jù)據(jù)的統(tǒng)一管理理

59、和更新SAS系統(tǒng)的強強大的數(shù)據(jù)倉倉庫技術,SSAS和業(yè)界界絕大多數(shù)廠廠家的長期友友好合作所形形成的跨平臺臺和環(huán)境的可可操作能力是是你建立數(shù)據(jù)據(jù)倉庫時的唯唯一最佳選擇擇。SAS幫助你進進行數(shù)據(jù)挖掘掘早期的計算機主主要就是用來來進行數(shù)據(jù)處處理或稱數(shù)值值計算的。后后來隨著計算算機技術及其其周邊設備和和通訊能力的的發(fā)展,計算算機更多地用用于了大量繁繁雜事務的在在線處理,生生產(chǎn)設備的實實時控制等。在在此過程中,計計算機系統(tǒng)積積累了越來越越多的數(shù)據(jù),數(shù)數(shù)據(jù)處理的任任務就更加繁繁重。到今天天,即使是發(fā)發(fā)展中的我們們中國,在一一個企業(yè)中有有數(shù)以幾十或或上百GB(10字節(jié))計計的生產(chǎn)經(jīng)營營數(shù)據(jù)已不是是什么希奇的

60、的事情了。企企業(yè)的數(shù)據(jù)和和由此而產(chǎn)生生的信息是企企業(yè)的重要財財富。它最真真實、具體的的反映了企業(yè)業(yè)運作的本質質狀況。但是是,面對堆積積如“山”的數(shù)據(jù),你你可能并未看看清企業(yè)運作作的本質規(guī)律律是什么,或或者說你至少少是未能全部部看清楚。面面對激烈競爭爭的市場經(jīng)濟濟,企業(yè)的經(jīng)經(jīng)營和管理者者任何不符合合客觀事物規(guī)規(guī)律性的決策策都會給企業(yè)業(yè)帶來損失,甚甚至失敗。運運用有力的工工具,不斷地地探索企業(yè)成成敗、得失的的原委,并以以此不斷完善善企業(yè)運作,這這是每一個成成功的企業(yè)家家必不可少的的工作任務。美美國SAS軟件從從60年代在北北卡洲立大學學開創(chuàng)伊始就就致力于計算算機數(shù)據(jù)處理理的研究。幾幾十年來無數(shù)數(shù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論