olap(在線分析處理)_第1頁
olap(在線分析處理)_第2頁
olap(在線分析處理)_第3頁
olap(在線分析處理)_第4頁
olap(在線分析處理)_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、項目名稱 OLAP(在線分析處理)技術(shù) 摘 要隨著計算機技術(shù)的廣泛應(yīng)用,企業(yè)每天都要產(chǎn)生大量的數(shù)據(jù),如何從這些數(shù)據(jù)中提取對企業(yè)決策分析有用的信息,是企業(yè)決策管理人員所面臨的一個難題。傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)即聯(lián)機事務(wù)處理系統(tǒng)(OnlineTransactionProcessing,簡稱OLTP),作為數(shù)據(jù)管理手段,主要用于事務(wù)處理,但它對分析處理的支持一直不能令人滿意。因此,人們逐漸嘗試對OLTP數(shù)據(jù)庫中的數(shù)據(jù)進行再加工,形成一個綜合的、面向分析的環(huán)境,以更好地支持決策分析。本文主要論述了OLAP(在線分析處理)的基本概念,分析闡述了OLAP的發(fā)展背景、基本概念、特征、主要的分析動作,及基于數(shù)據(jù)倉庫的

2、OLAP的三種存儲機制。重點研究了OLAP基本分類情況、實現(xiàn)的標準和體系結(jié)構(gòu)技術(shù)。 關(guān)鍵詞:OLAP;數(shù)據(jù)處理;事務(wù)處理系統(tǒng)正 文1 發(fā)展背景60年代,關(guān)系數(shù)據(jù)庫之父E.F.Cdd提出了關(guān)系模型,促進了聯(lián)機事務(wù)處理(OLTP)的發(fā)展(數(shù)據(jù)以表格的形式而非文件方式存儲)。1993年,E.F.Cdd提出了OLAP(聯(lián)機分析處理)概念,認為OLTP已不能滿足終端用戶對數(shù)據(jù)庫查詢分析的需要,SQL對大型數(shù)據(jù)庫進行的簡單查詢也不能滿足終端用戶分析的要求。用戶的決策分析需要對關(guān)系數(shù)據(jù)庫進行大量計算才能得到結(jié)果,而查詢的結(jié)果并不能滿足決策者提出的需求。因此,E.F.Cdd提出了多維數(shù)據(jù)庫和多維分析的概念,即

3、OLAP技術(shù)概念。1OLTP與OLAP的不同點:OLTP數(shù)據(jù)OLAP數(shù)據(jù)原始數(shù)據(jù)導出數(shù)據(jù)細節(jié)性數(shù)據(jù)綜合性和提煉性數(shù)據(jù)當前值數(shù)據(jù)歷史數(shù)據(jù)可更新不可更新,但周期性刷新一次處理的數(shù)據(jù)量小一次處理的數(shù)據(jù)量大面向應(yīng)用,事務(wù)驅(qū)動面向分析,分析驅(qū)動面向操作人員,支持日常操作面向決策人員,支持管理需要2 關(guān)于OLAP2.1 定義OLAP(聯(lián)機分析處理) :是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)維特性的信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術(shù)OLAP委員會的定義。1OLAP的目標:是滿足決策支持或多維環(huán)境特定

4、的查詢和報表需求,它的技術(shù)核心是“維”這個概念,因此OLAP也可以說是多維數(shù)據(jù)分析工具的集合。2.2 OLAP相關(guān)基本概念:1、維:是人們觀察數(shù)據(jù)的特定角度,是考慮問題時的一類屬性,屬性集合構(gòu)成一個維(時間維、地理維等)。2、維的層次:人們觀察數(shù)據(jù)的某個特定角度(即某個維)還可以存在細節(jié)程度不同的各個描述方面(時間維:日期、月份、季度、年)。3、維的成員:維的一個取值。是數(shù)據(jù)項在某維中位置的描述。(“某年某月某日”是在時間維上位置的描述)4、多維數(shù)組:維和變量的組合表示。一個多維數(shù)組可以表示為:(維1,維2,維n,變量)。(時間,地區(qū),產(chǎn)品,銷售額)5、數(shù)據(jù)單元(單元格):多維數(shù)組的取值。(2

5、000年1月,上海,筆記本電腦,$)22.3 OLAP的特性1、快速性:用戶對OLAP的快速反應(yīng)能力有很高的要求,主要是指計算機的計算的反應(yīng)速度,系統(tǒng)應(yīng)能在5秒內(nèi)對用戶的大部分分析要求做出反應(yīng),但對業(yè)務(wù)數(shù)據(jù)的實時信息卻很難反應(yīng)。 2、可分析性:OLAP系統(tǒng)應(yīng)能處理與應(yīng)用有關(guān)的任何邏輯分析和統(tǒng)計分析。3、多維性:多維性是OLAP的關(guān)鍵屬性。系統(tǒng)必須提供對數(shù)據(jù)的多維視圖和分析,包括對層次維和多重層次維的完全支持。4、信息性:不論數(shù)據(jù)量有多大,也不管數(shù)據(jù)存儲在何處,OLAP系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量信息。2.4 OLAP多維數(shù)據(jù)結(jié)構(gòu)1、超立方結(jié)構(gòu)(Hypercube) :超立方結(jié)構(gòu)指用三維

6、或更多的維數(shù)來描述一個對象,每個維彼此垂直。數(shù)據(jù)的測量值發(fā)生在維的交叉點上,數(shù)據(jù)空間的各個部分都有相同的維屬性。(收縮超立方結(jié)構(gòu)。這種結(jié)構(gòu)的數(shù)據(jù)密度更大,數(shù)據(jù)的維數(shù)更少,并可加入額外的分析維)。 2、多立方結(jié)構(gòu)(Multicube):即將超立方結(jié)構(gòu)變?yōu)樽恿⒎浇Y(jié)構(gòu)。面向某一特定應(yīng)用對維進行分割, 它具有很強的靈活性,提高了數(shù)據(jù)(特別是稀疏數(shù)據(jù))的分析效率。 33 OLAP多維數(shù)據(jù)分析1、切片和切塊(Slice and Dice):在多維數(shù)據(jù)結(jié)構(gòu)中,按二維進行切片,按三維進行切塊,可得到所需要的數(shù)據(jù)。如在“城市、產(chǎn)品、時間”三維立方體中進行切塊和切片,可得到各城市、各產(chǎn)品的銷售情況。4OLAP分析

7、示意圖:2、鉆取(Drill) :鉆取包含向下鉆取(Drill-down)和向上鉆取(Drill-up)/上卷(Roll-up)操作, 鉆取的深度與維所劃分的層次相對應(yīng)。43、旋轉(zhuǎn)(Rotate)/轉(zhuǎn)軸(Pivot):通過旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。4 OLAP分類4.1 OLAP分類4.2 OLTP、ROLAP與MOLAP模式4.3 ROLAP的星型模式(Star Schema)事實表:用來存儲事實的度量值和各個維的碼值。維表:用來存放維的元數(shù)據(jù)(維的層次、成員類別等描述信息)。4.4 MOLAP的多維立方體(Multicube)4.5 數(shù)據(jù)組織形式4.6 ROLAP與MOLAP的性能對比R

8、OLAPMOLAP優(yōu)勢沒有大小限制 現(xiàn)有的關(guān)系數(shù)據(jù)庫的技術(shù)可以沿用可以通過SQL 實現(xiàn)詳細數(shù)據(jù)與概要數(shù)據(jù)的存儲 現(xiàn)有關(guān)系型數(shù)據(jù)庫已經(jīng)對OLAP 做了很多優(yōu)化,包括并行存儲、并行查詢、并行數(shù)據(jù)管理、基于成本的查詢優(yōu)化、位圖索引、SQL 的OLAP 擴展(cube,rollup) 等大大提高ROALP 的速度5性能好、響應(yīng)速度快 專為OLAP所設(shè)計 支持高性能的決策支持計算復(fù)雜的跨維計算多用戶的讀寫操作n 行級的計算缺點一般比MDD 響應(yīng)速度慢 不支持有關(guān)預(yù)計算的讀寫操作 SQL 無法完成部分計算無法完成多行的計算無法完成維之間的計算增加系統(tǒng)復(fù)雜度,增加系統(tǒng)培訓與維護費用受操作系統(tǒng)平臺中文件大小的

9、限制,難以達到TB 級(只能1020G)需要進行預(yù)計算,可能導致數(shù)據(jù)爆炸無法支持維的動態(tài)變化缺乏數(shù)據(jù)模型和數(shù)據(jù)訪問的標準65 OLAP體系結(jié)構(gòu)6 OLAP評價準則1. OLAP模型必須提供多維概念模型 2. 透明性準則 3. 存取能力準則 4. 穩(wěn)定的報表性能 5. 客戶/服務(wù)器體系結(jié)構(gòu) 6. 維的等同性準則 7. 動態(tài)稀疏矩陣處理準則 8. 多用戶支持能力準則 9. 非受限的跨維操作 10. 直觀的數(shù)據(jù)處理 11. 靈活的報表生成 12. 非受限的維與維的層次 4參考文獻1OLAP:北大高科網(wǎng)站,/2劉春霞,基于數(shù)據(jù)倉庫聯(lián)機分析處理技術(shù)的研究.軟件導刊,2010,02:9-23王付山,潘東靜.聯(lián)機分析處理技術(shù)的應(yīng)用研究.德州學院學報,2006,10:22-5.4OLAP:/link?url=DFHj7g2_w05ELyN66tOsn_Oge1LyonR2NAwHMKj9euSFyGMYc-1gN32lugSgFpy_xgRoSVN1FIqZKfDgyKvT2ZWh

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論