版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3章聯(lián)機(jī)分析處理
3.1OLAP概念3.2OLAP的數(shù)據(jù)模型3.3多維數(shù)據(jù)的顯示3.4多維數(shù)據(jù)分析3.5OLAP的結(jié)構(gòu)與分析工具1第3章聯(lián)機(jī)分析處理
3.1OLAP概念1
聯(lián)機(jī)分析處理(OnLineAnalyticalProcessing,OLAP)在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,聯(lián)機(jī)分析處理是重要的數(shù)據(jù)分析工具。
OLAP的基本思想是從多方面和多角度以多維的形式來(lái)觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。2聯(lián)機(jī)分析處理(OnLineAnalytic3.1OLAP概念
OLAP是在OLTP的基礎(chǔ)上發(fā)展起來(lái)的。
OLTP是以數(shù)據(jù)庫(kù)為基礎(chǔ)的,面對(duì)的是操作人員和低層管理人員,對(duì)基本數(shù)據(jù)的查詢(xún)和增、刪、改等進(jìn)行處理。
OLAP是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的數(shù)據(jù)分析處理。它有兩個(gè)特點(diǎn):一是在線性(OnLine),由客戶(hù)機(jī)/服務(wù)器這種體系結(jié)構(gòu)來(lái)完成的;二是多維分析,這也是OLAP的核心所在。33.1OLAP概念OLAP是在OLTP的基礎(chǔ)上發(fā)3.1.1OLAP定義1.OLAP理事會(huì)給出的定義聯(lián)機(jī)分析處理(OLAP)是一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個(gè)方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。這些信息是從原始數(shù)據(jù)轉(zhuǎn)換過(guò)來(lái)的,按照用戶(hù)的理解,它反映了企業(yè)真實(shí)的方方面面。43.1.1OLAP定義1.OLAP理事會(huì)給出的定義42.OLAP的簡(jiǎn)單定義
聯(lián)機(jī)分析處理是共享多維信息的快速分析。它體現(xiàn)了四個(gè)特征:(1)快速性:用戶(hù)對(duì)OLAP的快速反應(yīng)能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計(jì)分析。(3)多維性:系統(tǒng)必須提供對(duì)數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應(yīng)能及時(shí)獲得信息,并且管理大容量的信息。
52.OLAP的簡(jiǎn)單定義聯(lián)機(jī)分析處理是共
1993年,E.F.Codd提出OLAP的12條準(zhǔn)則,用來(lái)評(píng)價(jià)分析處理工具,這也是他繼關(guān)系數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)庫(kù)提出的兩個(gè)“12條準(zhǔn)則”后提出的第三個(gè)“12條準(zhǔn)則”。其主要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶(hù)/服務(wù)器結(jié)構(gòu);多用戶(hù)支持;一致的報(bào)表性能等。
3.1.2OLAP準(zhǔn)則
61993年,E.F.Codd提出OLAP的12條準(zhǔn)則1.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的概念模型也應(yīng)是多維的。用戶(hù)可以對(duì)多維數(shù)據(jù)模型進(jìn)行切片、切塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括和聚集)分析。71.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的4.一致穩(wěn)定的報(bào)表性能
報(bào)表操作不應(yīng)隨維數(shù)增加而削弱,即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增加時(shí),提供的報(bào)表能力和響應(yīng)速度不應(yīng)該有明顯的降低。
84.一致穩(wěn)定的報(bào)表性能報(bào)表操作不應(yīng)隨維數(shù)增加而削弱5.客戶(hù)/服務(wù)器體系結(jié)構(gòu)
OLAP是建立在客戶(hù)/服務(wù)器體系結(jié)構(gòu)上的。
多維數(shù)據(jù)庫(kù)服務(wù)器能夠被不同的應(yīng)用和工具所訪問(wèn)。
客戶(hù)端負(fù)責(zé)應(yīng)用邏輯及用戶(hù)界面。95.客戶(hù)/服務(wù)器體系結(jié)構(gòu)OLAP是建立在客戶(hù)/服務(wù)
8.多用戶(hù)支持能力
當(dāng)多個(gè)用戶(hù)要在同一分析模式上并行工作,OLAP工具應(yīng)能夠提供并發(fā)訪問(wèn)等功能。
11.靈活的報(bào)表生成
報(bào)表必須充分反映數(shù)據(jù)分析模型的多維特征,并可按用戶(hù)需要的方式來(lái)顯示它。108.多用戶(hù)支持能力10
OLAP是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析。
(1)變量:變量是數(shù)據(jù)的實(shí)際意義,即描述數(shù)據(jù)“是什么”。
(2)維:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時(shí)間維等。
(3)維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次。如日、月、季、年是時(shí)間維的層次。
(4)維成員:維的一個(gè)取值稱(chēng)為該維的一個(gè)維成員。如“某年某月某日”是時(shí)間維的一個(gè)成員。
3.1.3OLAP的基本概念
11OLAP是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析。3.1(5)多維數(shù)組:一個(gè)多維數(shù)組可以表示為:(維1,維2,……,維n,變量)一個(gè)4維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時(shí)間,銷(xiāo)售渠道,銷(xiāo)售額)。(6)數(shù)據(jù)單元(單元格):多維數(shù)組的取值稱(chēng)為數(shù)據(jù)單元。如:4維數(shù)據(jù)單元(牙膏,上海,1998年12月,批發(fā),銷(xiāo)售額為100000)。
OLAP的基本概念(續(xù))12(5)多維數(shù)組:一個(gè)多維數(shù)組可以表示為:OLAP的基本概念(3.2OLAP的數(shù)據(jù)模型
3.2.1MOLAP數(shù)據(jù)模型3.2.2ROLAP數(shù)據(jù)模型3.2.3MOLAP與ROLAP的比較3.2.4HOLAP數(shù)據(jù)模型133.2OLAP的數(shù)據(jù)模型3.2.1MOLAP數(shù)據(jù)模型133.2.1MOLAP的數(shù)據(jù)模型
MOLAP是基于多維數(shù)據(jù)庫(kù)存儲(chǔ)方式建立的OLAP;表現(xiàn)為“超立方”結(jié)構(gòu),采用類(lèi)似于多維數(shù)組的結(jié)構(gòu)。例如,二維MDDB(數(shù)組,即矩陣)的數(shù)據(jù)組織見(jiàn)表3.1所示。
北京上海廣州衣服600700500鞋800900700帽子10020080表3.1MOLAP的數(shù)據(jù)模型143.2.1MOLAP的數(shù)據(jù)模型MOLAP是基于多維在查詢(xún)中除查詢(xún)一般的“衣服在廣州的銷(xiāo)售量”外,有時(shí)查詢(xún)“衣服的總銷(xiāo)售量”等問(wèn)題,涉及到多個(gè)數(shù)據(jù)項(xiàng)求和,如果采取臨時(shí)進(jìn)行累加,會(huì)使查詢(xún)效率大大降低,為此需增加匯總數(shù)據(jù)項(xiàng)。
北京上海廣州總和衣服6007005001800鞋8009007002400帽子10020080380總和1500180012804580表多維數(shù)據(jù)庫(kù)中晗綜合數(shù)據(jù)的組織15在查詢(xún)中除查詢(xún)一般的“衣服在廣州的銷(xiāo)售量”外,有時(shí)3.2.2ROLAP數(shù)據(jù)模型ROLAP是基于關(guān)系數(shù)據(jù)庫(kù)的OLAP。它是一個(gè)平面結(jié)構(gòu),用關(guān)系數(shù)據(jù)庫(kù)表示多維數(shù)據(jù)時(shí),采用星型模型。163.2.2ROLAP數(shù)據(jù)模型ROLAP是基于關(guān)系數(shù)據(jù)庫(kù)的OL產(chǎn)品名地區(qū)銷(xiāo)售量衣服北京600衣服上海700衣服廣州500鞋北京800鞋上海900鞋廣州700帽子北京100帽子上海200帽子廣州80表3.3關(guān)系數(shù)據(jù)庫(kù)RDBMS數(shù)據(jù)組織17產(chǎn)品名地區(qū)銷(xiāo)售量衣服北京600衣服上海700衣服廣州500鞋3.2.3MOLAP與ROLAP的比較1.數(shù)據(jù)存取速度2.數(shù)據(jù)存儲(chǔ)的容量3.多維計(jì)算的能力4.維度變化的適應(yīng)性5.數(shù)據(jù)變化的適應(yīng)性6.軟硬件平臺(tái)的適應(yīng)性7.元數(shù)據(jù)管理183.2.3MOLAP與ROLAP的比較1.數(shù)據(jù)存取速度181.數(shù)據(jù)存取速度ROLAP服務(wù)器需要將SQL語(yǔ)句轉(zhuǎn)化為多維存儲(chǔ)語(yǔ)句,臨時(shí)“拼合”出多維數(shù)據(jù)立方體。因此,ROLAP的響應(yīng)時(shí)間較長(zhǎng)。
MOLAP在數(shù)據(jù)存儲(chǔ)速度上性能好,響應(yīng)速度快。191.數(shù)據(jù)存取速度ROLAP服務(wù)器需要將SQL語(yǔ)句轉(zhuǎn)化為多維存2.數(shù)據(jù)存儲(chǔ)的容量ROLAP使用的傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方法,在存儲(chǔ)容量上基本沒(méi)有限制。MOLAP通常采用多平面疊加成立體的方式存放數(shù)據(jù)。當(dāng)數(shù)據(jù)量超過(guò)操作系統(tǒng)最大文件長(zhǎng)度時(shí),需要進(jìn)行數(shù)據(jù)分割。多維數(shù)據(jù)庫(kù)的數(shù)據(jù)量級(jí)難以達(dá)到太大的字節(jié)級(jí)。202.數(shù)據(jù)存儲(chǔ)的容量ROLAP使用的傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方法,3.多維計(jì)算的能力MOLAP能夠支持高性能的決策支持計(jì)算。ROLAP無(wú)法完成多行的計(jì)算和維之間的計(jì)算。213.多維計(jì)算的能力MOLAP能夠支持高性能的決策支持計(jì)算。24.維度變化的適應(yīng)性MOLAP增加新的維度,則多維數(shù)據(jù)庫(kù)通常需要重新建立。ROLAP對(duì)于維表的變更有很好的適應(yīng)性。224.維度變化的適應(yīng)性MOLAP增加新的維度,則多維數(shù)據(jù)庫(kù)通常5.數(shù)據(jù)變化的適應(yīng)性當(dāng)數(shù)據(jù)頻繁的變化時(shí),MOLAP需要進(jìn)行大量的重新計(jì)算,甚至重新建立索引乃至重構(gòu)多維數(shù)據(jù)庫(kù)。在ROLAP中靈活性較好,對(duì)于數(shù)據(jù)變化的適應(yīng)性高。235.數(shù)據(jù)變化的適應(yīng)性當(dāng)數(shù)據(jù)頻繁的變化時(shí),MOLAP需要進(jìn)行大6.軟硬件平臺(tái)的適應(yīng)性ROLAP對(duì)軟硬件平臺(tái)的適應(yīng)性很好,而MOLAP相對(duì)較差。7.元數(shù)據(jù)管理目前在元數(shù)據(jù)的管理,MOLAP和ROLAP都沒(méi)有成形的標(biāo)準(zhǔn)。246.軟硬件平臺(tái)的適應(yīng)性24MOLAP和ROLAP的對(duì)比簡(jiǎn)表MOLAPROLAP固定維可變維維交叉計(jì)算多維視圖行級(jí)計(jì)算超大型數(shù)據(jù)庫(kù)讀-寫(xiě)應(yīng)用維數(shù)據(jù)變化速度快數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)25MOLAP和ROLAP的對(duì)比簡(jiǎn)表MOLAPROLAP固定維可3.2.4HOLAP數(shù)據(jù)模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之間。在HOLAP中,對(duì)最常用的維度和維層次,使用多維數(shù)據(jù)表來(lái)存儲(chǔ),對(duì)于用戶(hù)不常用的維度和數(shù)據(jù),采用ROLAP星型結(jié)構(gòu)來(lái)存儲(chǔ)。在HOLAP的多維數(shù)據(jù)表中的數(shù)據(jù)維度少于MOLAP中的維度表,數(shù)據(jù)存儲(chǔ)容量也少于MOLAP方式。HOLAP在數(shù)據(jù)存取速度上又低于MOLAP。263.2.4HOLAP數(shù)據(jù)模型HOLAP(HybridOL3.3多維數(shù)據(jù)的顯示3.3.1多維數(shù)據(jù)顯示方法3.3.2多維類(lèi)型結(jié)構(gòu)(MTS)3.3.3多維數(shù)據(jù)的分析視圖273.3多維數(shù)據(jù)的顯示3.3.1多維數(shù)據(jù)顯示方法273.3.1多維數(shù)據(jù)顯示方法多維數(shù)據(jù)的顯示只能在平面上展現(xiàn)出來(lái)。三維數(shù)據(jù)無(wú)法在平面上展現(xiàn)出來(lái)。三維數(shù)據(jù)顯示見(jiàn)表3.6所示。283.3.1多維數(shù)據(jù)顯示方法多維數(shù)據(jù)的顯示只能在平面上展現(xiàn)出產(chǎn)品名地區(qū) 時(shí)間銷(xiāo)售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服廣州1月150衣服廣州2月250衣服廣州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋廣州1月150鞋廣州2月250鞋廣州3月300…………29產(chǎn)品名地區(qū) 時(shí)間銷(xiāo)售量衣服北京1月100衣服北京2月200衣3.3.2多維類(lèi)型結(jié)構(gòu)(MTS)表示方法是:每一個(gè)維度用一條線段來(lái)表示。維度中的每一個(gè)成員都用線段上的一個(gè)單位區(qū)間來(lái)表示。例如,用三個(gè)線段分別表示時(shí)間、產(chǎn)品和指標(biāo)三個(gè)維的多維類(lèi)型結(jié)構(gòu)如圖3.3所示。303.3.2多維類(lèi)型結(jié)構(gòu)(MTS)表示方法是:每一個(gè)維度用一在圖3.3多維類(lèi)型結(jié)構(gòu)(MTS)中,指定時(shí)間維成員是3月,產(chǎn)品維成員是鞋,指標(biāo)維成員是銷(xiāo)售量,這樣它代表了三維數(shù)據(jù)總得一個(gè)空間數(shù)據(jù)點(diǎn),如圖3.4所示。31在圖3.3多維類(lèi)型結(jié)構(gòu)(MTS)中,指定時(shí)間維成員是3月,產(chǎn)3.3.3多維數(shù)據(jù)的分析視圖在平面的屏幕上顯示多維數(shù)據(jù),是利用行、列和頁(yè)面三個(gè)顯示組來(lái)表示的。例如,對(duì)上例的四維MTS實(shí)例,在頁(yè)面上選定商店維度中“商店3”,在行中選定時(shí)間維的“1月、2月、3月”共3個(gè)成員,在列中選定產(chǎn)品維中的“上衣、褲、帽子”三個(gè)成員,以及指標(biāo)維中的“固定成本、直接銷(xiāo)售”二個(gè)成員。該四維數(shù)據(jù)的顯示如圖3.6所示。商店3(頁(yè)面)上衣褲帽子直接銷(xiāo)售固定成本直接銷(xiāo)售固定成本直接銷(xiāo)售固定成本1月4503505504505004002月3802804603604003203月400310480410450400323.3.3多維數(shù)據(jù)的分析視圖在平面的屏幕上顯示多維數(shù)據(jù),是利對(duì)于更多維度的數(shù)據(jù)顯示,需要選擇維度及其成員分布在行或者列中。在頁(yè)面上可以選定多個(gè)維度,但每個(gè)維度只能顯示一個(gè)成員。在行或者列中一般只選擇二個(gè)維,每個(gè)維可以多個(gè)成員。例如,對(duì)6個(gè)維度數(shù)據(jù),它的MTS如圖3.7所示。33對(duì)于更多維度的數(shù)據(jù)顯示,需要選擇維度及其成員分布在行或者列中對(duì)以上6維數(shù)據(jù)中,設(shè)定頁(yè)面維度為商店的成員是“商店3”,客戶(hù)維度成員是“老年”。行維度含時(shí)間維和產(chǎn)品維共2個(gè)維度,其中時(shí)間維中成員為“1月、2月、3月”。產(chǎn)品維中成員為“桌子、臺(tái)燈”。列維度含指標(biāo)維和場(chǎng)景維共2個(gè)維度,其中指標(biāo)維中成員為“直接銷(xiāo)售、間接銷(xiāo)售、總銷(xiāo)售”。場(chǎng)景維中成員為“實(shí)際、計(jì)劃”。具體的顯示數(shù)據(jù)如圖3.8所示。商店3,老年(頁(yè)面)直接銷(xiāo)售間接銷(xiāo)售總銷(xiāo)售實(shí)際計(jì)劃實(shí)際計(jì)劃實(shí)際計(jì)劃1月桌子250300125150375450臺(tái)燈2653201331604004802月桌子333400167200500600臺(tái)燈2833401421704255103月桌子350420175210525630臺(tái)燈25030012515037545034對(duì)以上6維數(shù)據(jù)中,設(shè)定頁(yè)面維度為商店的成員是“商店3”,客戶(hù)3.4OALP的多維數(shù)據(jù)分析3.4.1多維數(shù)據(jù)分析的基本操作3.4.2廣義OLAP功能3.4.3多維數(shù)據(jù)分析實(shí)例353.4OALP的多維數(shù)據(jù)分析3.4.1多維數(shù)據(jù)分析的基本操作例如,以“產(chǎn)品、城市、時(shí)間”三維數(shù)據(jù),如圖36例如,以“產(chǎn)品、城市、時(shí)間”三維數(shù)據(jù),如圖363.4.1多維數(shù)據(jù)分析的基本操作
1.切片選定多維數(shù)組的一個(gè)二維子集的操作叫做切片。例如:對(duì)三維數(shù)據(jù),通過(guò)“切片”,分別從城市和產(chǎn)品等不同的角度觀察銷(xiāo)售情況:
373.4.1多維數(shù)據(jù)分析的基本操作1.切片372.切塊切塊有兩種情況:(1)在多維數(shù)組的某一個(gè)維上選定某一區(qū)間的維成員的操作切塊可以看成是在切片的基礎(chǔ)上,確定某一個(gè)維成員的區(qū)間得到的片段,也即由多個(gè)切片疊合起來(lái)。(2)選定多維數(shù)組的一個(gè)三維子集的操作在多維數(shù)組(維1,維2,……,維n,變量)中選定3個(gè)維,維i、維j、維k,在這3個(gè)維上分別取一個(gè)區(qū)間,或任意維成員,而其它維都取定一個(gè)維成員。382.切塊切塊有兩種情況:383.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆取(drillup)操作。向下鉆取是使用戶(hù)在多層數(shù)據(jù)中能通過(guò)導(dǎo)航信息而獲得更多的細(xì)節(jié)性數(shù)據(jù)。向上鉆取獲取概括性的數(shù)據(jù)。393.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆取(鉆?。豪?,2005年各部門(mén)銷(xiāo)售收入表如下:40鉆?。豪?,2005年各部門(mén)銷(xiāo)售收入表如下:40對(duì)時(shí)間維進(jìn)行下鉆操作,獲得新表如下:2005年部門(mén)1季度2季度3季度4季度部門(mén)1200200350150部門(mén)225050150150部門(mén)320015018027041對(duì)時(shí)間維進(jìn)行下鉆操作,獲得新表如下:2005年部門(mén)1季度2季4.旋轉(zhuǎn)通過(guò)旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。旋轉(zhuǎn)操作相當(dāng)于平面數(shù)據(jù)將坐標(biāo)軸旋轉(zhuǎn)。例如,旋轉(zhuǎn)可能包含了交換行和列,或是把某一個(gè)行維移到列維中去?;蚴前秧?yè)面顯示中的一個(gè)維和頁(yè)面外的維進(jìn)行交換(令其成為新的行或列中的一個(gè))424.旋轉(zhuǎn)通過(guò)旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。旋轉(zhuǎn)操作相當(dāng)于平面數(shù)旋轉(zhuǎn)時(shí)間維產(chǎn)品維產(chǎn)品維時(shí)間維(a)行列交換旋轉(zhuǎn)以改變顯示布局時(shí)間維地區(qū)維產(chǎn)品維時(shí)間維產(chǎn)品維地區(qū)維43旋轉(zhuǎn)時(shí)間維產(chǎn)品維產(chǎn)品維時(shí)間維(a)行列交換旋轉(zhuǎn)以改變時(shí)間維旋轉(zhuǎn)前的數(shù)據(jù)實(shí)例旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)后再切片44旋轉(zhuǎn)前的數(shù)據(jù)實(shí)例旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)后再切片443.4.2廣義OLAP功能
1、基本代理操作
當(dāng)系統(tǒng)處于某種特殊狀態(tài)時(shí)“代理”提醒分析員。
(1)示警報(bào)告
定義一些條件,一但條件滿足,系統(tǒng)會(huì)提醒分析員去做分析。如每日?qǐng)?bào)告完成或月定貨完成等通知分析員作分析。(2)時(shí)間報(bào)告按日歷和時(shí)鐘提醒分析員。
(3)異常報(bào)告
當(dāng)超出邊界條件時(shí)提醒分析員。如銷(xiāo)售情況已超出預(yù)定義閾值的上限或下限時(shí)提醒分析員。453.4.2廣義OLAP功能1、基本代理操作452.?dāng)?shù)據(jù)分析模型E.F.Codd將數(shù)據(jù)模型分為4類(lèi)模型:(1)絕對(duì)模型通過(guò)比較歷史數(shù)據(jù)值或行為來(lái)描述過(guò)去發(fā)生的事實(shí)。絕對(duì)模型只能對(duì)歷史數(shù)據(jù)進(jìn)行比較,并且利用回歸分析等一些分析方法得出趨勢(shì)信息。462.?dāng)?shù)據(jù)分析模型E.F.Codd將數(shù)據(jù)模型分為4類(lèi)模型:(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細(xì)化,找出事實(shí)發(fā)生的原因。
假設(shè)今年銷(xiāo)售量下降,那么解釋模型應(yīng)當(dāng)能找出原因,即下滑與時(shí)間、地區(qū)、商品及銷(xiāo)售渠道四者中的何種因素有關(guān)。47(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細(xì)化,找出事(3)思考模型說(shuō)明在一維或多維上引入一組具體變量或參數(shù)后將會(huì)發(fā)生什么。例如該公司決策者為了了解某商品的銷(xiāo)售量是否與顧客的年齡有關(guān),引入了行變量-年齡,即在當(dāng)前的多維視圖上增加了顧客的年齡維。48(3)思考模型說(shuō)明在一維或多維上引入一組具體變量或參數(shù)后將會(huì)(4)公式模型該模型表示在多個(gè)維上,需要引入哪些變量或參數(shù),以及引入后所產(chǎn)生的結(jié)果。公式模型自動(dòng)完成上述變量引入工作,從而最終找出與銷(xiāo)量有關(guān)的全部因素,并給出了引入后的結(jié)果。49(4)公式模型該模型表示在多個(gè)維上,需要引入哪些變量或參數(shù),3.商業(yè)分析模型具體的商業(yè)分析模型有:(1)分銷(xiāo)渠道的分析模型(2)客戶(hù)利潤(rùn)貢獻(xiàn)度模型(3)客戶(hù)關(guān)系(信用)優(yōu)化模型(4)風(fēng)險(xiǎn)評(píng)估模型503.商業(yè)分析模型具體的商業(yè)分析模型有:50(1)分銷(xiāo)渠道的分析模型通過(guò)客戶(hù)、渠道、產(chǎn)品或服務(wù)三者之間的關(guān)系,了解客戶(hù)的購(gòu)買(mǎi)行為、客戶(hù)和渠道對(duì)業(yè)務(wù)收入的貢獻(xiàn)、哪些客戶(hù)比較喜好由什么渠道在何時(shí)和銀行打交道。為此,銀行需要建立客戶(hù)購(gòu)買(mǎi)傾向模型和渠道喜好模型等。51(1)分銷(xiāo)渠道的分析模型通過(guò)客戶(hù)、渠道、產(chǎn)品或服務(wù)三者之間的(2)客戶(hù)利潤(rùn)貢獻(xiàn)度模型通過(guò)該模型能了解每一位客戶(hù)對(duì)銀行的總利潤(rùn)貢獻(xiàn)度。知道哪些利潤(rùn)高的客戶(hù)需要留住,采用什么方法留住客戶(hù),交叉銷(xiāo)售改善客戶(hù)的利潤(rùn)貢獻(xiàn)度,哪些客戶(hù)應(yīng)該爭(zhēng)取,完成個(gè)性化服務(wù)。52(2)客戶(hù)利潤(rùn)貢獻(xiàn)度模型通過(guò)該模型能了解每一位客戶(hù)對(duì)(3)客戶(hù)關(guān)系(信用)優(yōu)化模型銀行對(duì)客戶(hù)的每一筆交易中,知道客戶(hù)需要什么產(chǎn)品或服務(wù),例如,定期存款是希望退休養(yǎng)老使用,申請(qǐng)信用卡需要現(xiàn)金消費(fèi),詢(xún)問(wèn)放貸利息需要住房貸款等。通過(guò)模型計(jì)算,主動(dòng)地對(duì)客戶(hù)溝通并進(jìn)行交叉銷(xiāo)售,達(dá)到留住客戶(hù)和增加利潤(rùn)的目標(biāo)。53(3)客戶(hù)關(guān)系(信用)優(yōu)化模型銀行對(duì)客戶(hù)的每一筆交易中,知道(4)風(fēng)險(xiǎn)評(píng)估模型模擬風(fēng)險(xiǎn)和利潤(rùn)間的關(guān)系,建立風(fēng)險(xiǎn)評(píng)估的數(shù)學(xué)模型,在滿足高利潤(rùn)、低風(fēng)險(xiǎn)客戶(hù)需求的前提下,達(dá)到銀行收益的極大化。54(4)風(fēng)險(xiǎn)評(píng)估模型模擬風(fēng)險(xiǎn)和利潤(rùn)間的關(guān)系,建立風(fēng)險(xiǎn)評(píng)估的數(shù)學(xué)
假設(shè)有一個(gè)5維數(shù)據(jù)模型,5個(gè)維分別為:商店,方案,部門(mén),時(shí)間,銷(xiāo)售。
1.多維數(shù)據(jù)存儲(chǔ)
在指定“商店=ALL,方案=現(xiàn)有”情況的三維表(行為部門(mén),列為時(shí)間和銷(xiāo)售量)3.4.3多維數(shù)據(jù)分析實(shí)例
55假設(shè)有一個(gè)5維數(shù)據(jù)模型,5個(gè)維分別為:商店,方案
20042005%增長(zhǎng)率銷(xiāo)售量利潤(rùn)增長(zhǎng)%銷(xiāo)售量利潤(rùn)增長(zhǎng)%銷(xiāo)售量利潤(rùn)增長(zhǎng)服裝234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽車(chē)375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9指定商店、方案后的三維表
56
20042005%增長(zhǎng)率銷(xiāo)售量利潤(rùn)增長(zhǎng)%銷(xiāo)售量利潤(rùn)增長(zhǎng)%銷(xiāo)
20042005%增長(zhǎng)率銷(xiāo)售利潤(rùn)增長(zhǎng)%銷(xiāo)售利潤(rùn)增長(zhǎng)%銷(xiāo)售利潤(rùn)增長(zhǎng)汽車(chē)375,09822.4325,40227.2(13.2)21.4維修195,05114.2180,78615.0(7.3)5.6附件116,28043.9122,54547.55.38.2音樂(lè)63,7678.222,07114.2(63.4)7.3
2、向下鉆取對(duì)汽車(chē)部門(mén)向下鉆取出具體項(xiàng)目的銷(xiāo)售情況和利潤(rùn)增長(zhǎng)情況。
57
20042005%增長(zhǎng)率銷(xiāo)售利潤(rùn)增長(zhǎng)%銷(xiāo)售利潤(rùn)增長(zhǎng)%銷(xiāo)售利
2005銷(xiāo)售量服裝381,102家具66,005汽車(chē)325,402所有其它306,6773、切片表切片(Slice)操作是除去一些列或行不顯示
58
2005銷(xiāo)售量服裝381,102家具66,005汽車(chē)325
2005銷(xiāo)售量現(xiàn)有計(jì)劃差量差量%服裝381,102350,00031.18.9家具66,00569,000(2,995)(4.3)汽車(chē)325,402300,00025,4028.5所有其它306,677350,000(44,322)12.74、旋轉(zhuǎn)表這次旋轉(zhuǎn)操作得到2005年的交叉表方案為:現(xiàn)有、計(jì)劃、差量、差量%。59
2005銷(xiāo)售量現(xiàn)有計(jì)劃差量差量%服裝381,102350,3.5OLAP結(jié)構(gòu)與分析工具3.5.1OLAP結(jié)構(gòu)3.5.2OLAP的Web結(jié)構(gòu)603.5OLAP結(jié)構(gòu)與分析工具3.5.1OLAP結(jié)構(gòu)603.5.1OLAP結(jié)構(gòu)1.OLAP邏輯結(jié)構(gòu)(1)OLAP視圖:對(duì)于用戶(hù)來(lái)說(shuō)他是數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中數(shù)據(jù)的多維數(shù)據(jù)表示,不管數(shù)據(jù)怎樣存儲(chǔ)和存儲(chǔ)在何處。(2)數(shù)據(jù)存儲(chǔ):要求選擇數(shù)據(jù)實(shí)際存儲(chǔ)的方式和實(shí)際存儲(chǔ)的位置,兩種常用的選擇是多維數(shù)據(jù)存儲(chǔ)和關(guān)系數(shù)據(jù)存儲(chǔ)。613.5.1OLAP結(jié)構(gòu)1.OLAP邏輯結(jié)構(gòu)(1)OLAP視2.OLAP物理結(jié)構(gòu)多維數(shù)據(jù)存儲(chǔ)放在OLAP服務(wù)器中,抽取數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),然后將其轉(zhuǎn)換成多維數(shù)據(jù)結(jié)構(gòu),并把OLAP服務(wù)器傳給客戶(hù)端,這時(shí)客戶(hù)端就變成”瘦“客戶(hù)端,這是一種經(jīng)典的三層結(jié)構(gòu)。多維數(shù)據(jù)存儲(chǔ)于客戶(hù)端,數(shù)據(jù)分析也在客戶(hù)端,這樣就形成了“胖”客戶(hù)端622.OLAP物理結(jié)構(gòu)多維數(shù)據(jù)存儲(chǔ)放在OLAP服務(wù)器中,抽取數(shù)3.5.2OLAP的Web結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)OLAP服務(wù)器Web服務(wù)器客戶(hù)瀏覽器CGIAPIHTMLJavaappletsActiveXcontrolJavascipt當(dāng)使用web結(jié)構(gòu)組織OLAP應(yīng)用時(shí),其組織結(jié)構(gòu)如圖所示。Web服務(wù)器負(fù)責(zé)完成瀏覽器與OLAP服務(wù)器、數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)之間的通信連接。633.5.2OLAP的Web結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)OLAP服務(wù)器W3.5.3OLAP工具及評(píng)價(jià)目前許多公司已經(jīng)推出了相應(yīng)的OLAP支持工具,如ORACLE、IBM、BusinessObject、SAS、NCR等等。OLAP服務(wù)器和工具可以按以下五個(gè)方面來(lái)進(jìn)行評(píng)價(jià):特征和功能、訪問(wèn)性能、OLAP服務(wù)引擎、管理以及全局結(jié)構(gòu)視圖。用戶(hù)可以從這五個(gè)方面分析市場(chǎng)上的OLAP產(chǎn)品,也可以把它們作為應(yīng)用系統(tǒng)中OLAP需求分析指標(biāo)。643.5.3OLAP工具及評(píng)價(jià)目前許多公司已經(jīng)推出了相應(yīng)的OOLAP服務(wù)器和工具應(yīng)能完成以下功能:支持多維和維中的層次;聚集、概括、預(yù)計(jì)算和導(dǎo)出數(shù)據(jù);提供計(jì)算邏輯、公式和分析過(guò)程;提供比較分析能力;進(jìn)行跨維計(jì)算;沿單個(gè)或多個(gè)維的軸以及交叉表等來(lái)進(jìn)行細(xì)剖和瀏覽。65OLAP服務(wù)器和工具應(yīng)能完成以下功能:支持多維和維中的層次;習(xí)題1、2、3、5、9、12、14、15、1866習(xí)題1、2、3、5、9、12、14、15、1866第3章聯(lián)機(jī)分析處理
3.1OLAP概念3.2OLAP的數(shù)據(jù)模型3.3多維數(shù)據(jù)的顯示3.4多維數(shù)據(jù)分析3.5OLAP的結(jié)構(gòu)與分析工具67第3章聯(lián)機(jī)分析處理
3.1OLAP概念1
聯(lián)機(jī)分析處理(OnLineAnalyticalProcessing,OLAP)在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,聯(lián)機(jī)分析處理是重要的數(shù)據(jù)分析工具。
OLAP的基本思想是從多方面和多角度以多維的形式來(lái)觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。68聯(lián)機(jī)分析處理(OnLineAnalytic3.1OLAP概念
OLAP是在OLTP的基礎(chǔ)上發(fā)展起來(lái)的。
OLTP是以數(shù)據(jù)庫(kù)為基礎(chǔ)的,面對(duì)的是操作人員和低層管理人員,對(duì)基本數(shù)據(jù)的查詢(xún)和增、刪、改等進(jìn)行處理。
OLAP是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的數(shù)據(jù)分析處理。它有兩個(gè)特點(diǎn):一是在線性(OnLine),由客戶(hù)機(jī)/服務(wù)器這種體系結(jié)構(gòu)來(lái)完成的;二是多維分析,這也是OLAP的核心所在。693.1OLAP概念OLAP是在OLTP的基礎(chǔ)上發(fā)3.1.1OLAP定義1.OLAP理事會(huì)給出的定義聯(lián)機(jī)分析處理(OLAP)是一種軟件技術(shù),它使分析人員能夠迅速、一致、交互地從各個(gè)方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。這些信息是從原始數(shù)據(jù)轉(zhuǎn)換過(guò)來(lái)的,按照用戶(hù)的理解,它反映了企業(yè)真實(shí)的方方面面。703.1.1OLAP定義1.OLAP理事會(huì)給出的定義42.OLAP的簡(jiǎn)單定義
聯(lián)機(jī)分析處理是共享多維信息的快速分析。它體現(xiàn)了四個(gè)特征:(1)快速性:用戶(hù)對(duì)OLAP的快速反應(yīng)能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計(jì)分析。(3)多維性:系統(tǒng)必須提供對(duì)數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應(yīng)能及時(shí)獲得信息,并且管理大容量的信息。
712.OLAP的簡(jiǎn)單定義聯(lián)機(jī)分析處理是共
1993年,E.F.Codd提出OLAP的12條準(zhǔn)則,用來(lái)評(píng)價(jià)分析處理工具,這也是他繼關(guān)系數(shù)據(jù)庫(kù)和分布式數(shù)據(jù)庫(kù)提出的兩個(gè)“12條準(zhǔn)則”后提出的第三個(gè)“12條準(zhǔn)則”。其主要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶(hù)/服務(wù)器結(jié)構(gòu);多用戶(hù)支持;一致的報(bào)表性能等。
3.1.2OLAP準(zhǔn)則
721993年,E.F.Codd提出OLAP的12條準(zhǔn)則1.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的概念模型也應(yīng)是多維的。用戶(hù)可以對(duì)多維數(shù)據(jù)模型進(jìn)行切片、切塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括和聚集)分析。731.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的4.一致穩(wěn)定的報(bào)表性能
報(bào)表操作不應(yīng)隨維數(shù)增加而削弱,即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增加時(shí),提供的報(bào)表能力和響應(yīng)速度不應(yīng)該有明顯的降低。
744.一致穩(wěn)定的報(bào)表性能報(bào)表操作不應(yīng)隨維數(shù)增加而削弱5.客戶(hù)/服務(wù)器體系結(jié)構(gòu)
OLAP是建立在客戶(hù)/服務(wù)器體系結(jié)構(gòu)上的。
多維數(shù)據(jù)庫(kù)服務(wù)器能夠被不同的應(yīng)用和工具所訪問(wèn)。
客戶(hù)端負(fù)責(zé)應(yīng)用邏輯及用戶(hù)界面。755.客戶(hù)/服務(wù)器體系結(jié)構(gòu)OLAP是建立在客戶(hù)/服務(wù)
8.多用戶(hù)支持能力
當(dāng)多個(gè)用戶(hù)要在同一分析模式上并行工作,OLAP工具應(yīng)能夠提供并發(fā)訪問(wèn)等功能。
11.靈活的報(bào)表生成
報(bào)表必須充分反映數(shù)據(jù)分析模型的多維特征,并可按用戶(hù)需要的方式來(lái)顯示它。768.多用戶(hù)支持能力10
OLAP是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析。
(1)變量:變量是數(shù)據(jù)的實(shí)際意義,即描述數(shù)據(jù)“是什么”。
(2)維:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時(shí)間維等。
(3)維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次。如日、月、季、年是時(shí)間維的層次。
(4)維成員:維的一個(gè)取值稱(chēng)為該維的一個(gè)維成員。如“某年某月某日”是時(shí)間維的一個(gè)成員。
3.1.3OLAP的基本概念
77OLAP是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析。3.1(5)多維數(shù)組:一個(gè)多維數(shù)組可以表示為:(維1,維2,……,維n,變量)一個(gè)4維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時(shí)間,銷(xiāo)售渠道,銷(xiāo)售額)。(6)數(shù)據(jù)單元(單元格):多維數(shù)組的取值稱(chēng)為數(shù)據(jù)單元。如:4維數(shù)據(jù)單元(牙膏,上海,1998年12月,批發(fā),銷(xiāo)售額為100000)。
OLAP的基本概念(續(xù))78(5)多維數(shù)組:一個(gè)多維數(shù)組可以表示為:OLAP的基本概念(3.2OLAP的數(shù)據(jù)模型
3.2.1MOLAP數(shù)據(jù)模型3.2.2ROLAP數(shù)據(jù)模型3.2.3MOLAP與ROLAP的比較3.2.4HOLAP數(shù)據(jù)模型793.2OLAP的數(shù)據(jù)模型3.2.1MOLAP數(shù)據(jù)模型133.2.1MOLAP的數(shù)據(jù)模型
MOLAP是基于多維數(shù)據(jù)庫(kù)存儲(chǔ)方式建立的OLAP;表現(xiàn)為“超立方”結(jié)構(gòu),采用類(lèi)似于多維數(shù)組的結(jié)構(gòu)。例如,二維MDDB(數(shù)組,即矩陣)的數(shù)據(jù)組織見(jiàn)表3.1所示。
北京上海廣州衣服600700500鞋800900700帽子10020080表3.1MOLAP的數(shù)據(jù)模型803.2.1MOLAP的數(shù)據(jù)模型MOLAP是基于多維在查詢(xún)中除查詢(xún)一般的“衣服在廣州的銷(xiāo)售量”外,有時(shí)查詢(xún)“衣服的總銷(xiāo)售量”等問(wèn)題,涉及到多個(gè)數(shù)據(jù)項(xiàng)求和,如果采取臨時(shí)進(jìn)行累加,會(huì)使查詢(xún)效率大大降低,為此需增加匯總數(shù)據(jù)項(xiàng)。
北京上海廣州總和衣服6007005001800鞋8009007002400帽子10020080380總和1500180012804580表多維數(shù)據(jù)庫(kù)中晗綜合數(shù)據(jù)的組織81在查詢(xún)中除查詢(xún)一般的“衣服在廣州的銷(xiāo)售量”外,有時(shí)3.2.2ROLAP數(shù)據(jù)模型ROLAP是基于關(guān)系數(shù)據(jù)庫(kù)的OLAP。它是一個(gè)平面結(jié)構(gòu),用關(guān)系數(shù)據(jù)庫(kù)表示多維數(shù)據(jù)時(shí),采用星型模型。823.2.2ROLAP數(shù)據(jù)模型ROLAP是基于關(guān)系數(shù)據(jù)庫(kù)的OL產(chǎn)品名地區(qū)銷(xiāo)售量衣服北京600衣服上海700衣服廣州500鞋北京800鞋上海900鞋廣州700帽子北京100帽子上海200帽子廣州80表3.3關(guān)系數(shù)據(jù)庫(kù)RDBMS數(shù)據(jù)組織83產(chǎn)品名地區(qū)銷(xiāo)售量衣服北京600衣服上海700衣服廣州500鞋3.2.3MOLAP與ROLAP的比較1.數(shù)據(jù)存取速度2.數(shù)據(jù)存儲(chǔ)的容量3.多維計(jì)算的能力4.維度變化的適應(yīng)性5.數(shù)據(jù)變化的適應(yīng)性6.軟硬件平臺(tái)的適應(yīng)性7.元數(shù)據(jù)管理843.2.3MOLAP與ROLAP的比較1.數(shù)據(jù)存取速度181.數(shù)據(jù)存取速度ROLAP服務(wù)器需要將SQL語(yǔ)句轉(zhuǎn)化為多維存儲(chǔ)語(yǔ)句,臨時(shí)“拼合”出多維數(shù)據(jù)立方體。因此,ROLAP的響應(yīng)時(shí)間較長(zhǎng)。
MOLAP在數(shù)據(jù)存儲(chǔ)速度上性能好,響應(yīng)速度快。851.數(shù)據(jù)存取速度ROLAP服務(wù)器需要將SQL語(yǔ)句轉(zhuǎn)化為多維存2.數(shù)據(jù)存儲(chǔ)的容量ROLAP使用的傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方法,在存儲(chǔ)容量上基本沒(méi)有限制。MOLAP通常采用多平面疊加成立體的方式存放數(shù)據(jù)。當(dāng)數(shù)據(jù)量超過(guò)操作系統(tǒng)最大文件長(zhǎng)度時(shí),需要進(jìn)行數(shù)據(jù)分割。多維數(shù)據(jù)庫(kù)的數(shù)據(jù)量級(jí)難以達(dá)到太大的字節(jié)級(jí)。862.數(shù)據(jù)存儲(chǔ)的容量ROLAP使用的傳統(tǒng)關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)方法,3.多維計(jì)算的能力MOLAP能夠支持高性能的決策支持計(jì)算。ROLAP無(wú)法完成多行的計(jì)算和維之間的計(jì)算。873.多維計(jì)算的能力MOLAP能夠支持高性能的決策支持計(jì)算。24.維度變化的適應(yīng)性MOLAP增加新的維度,則多維數(shù)據(jù)庫(kù)通常需要重新建立。ROLAP對(duì)于維表的變更有很好的適應(yīng)性。884.維度變化的適應(yīng)性MOLAP增加新的維度,則多維數(shù)據(jù)庫(kù)通常5.數(shù)據(jù)變化的適應(yīng)性當(dāng)數(shù)據(jù)頻繁的變化時(shí),MOLAP需要進(jìn)行大量的重新計(jì)算,甚至重新建立索引乃至重構(gòu)多維數(shù)據(jù)庫(kù)。在ROLAP中靈活性較好,對(duì)于數(shù)據(jù)變化的適應(yīng)性高。895.數(shù)據(jù)變化的適應(yīng)性當(dāng)數(shù)據(jù)頻繁的變化時(shí),MOLAP需要進(jìn)行大6.軟硬件平臺(tái)的適應(yīng)性ROLAP對(duì)軟硬件平臺(tái)的適應(yīng)性很好,而MOLAP相對(duì)較差。7.元數(shù)據(jù)管理目前在元數(shù)據(jù)的管理,MOLAP和ROLAP都沒(méi)有成形的標(biāo)準(zhǔn)。906.軟硬件平臺(tái)的適應(yīng)性24MOLAP和ROLAP的對(duì)比簡(jiǎn)表MOLAPROLAP固定維可變維維交叉計(jì)算多維視圖行級(jí)計(jì)算超大型數(shù)據(jù)庫(kù)讀-寫(xiě)應(yīng)用維數(shù)據(jù)變化速度快數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)91MOLAP和ROLAP的對(duì)比簡(jiǎn)表MOLAPROLAP固定維可3.2.4HOLAP數(shù)據(jù)模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之間。在HOLAP中,對(duì)最常用的維度和維層次,使用多維數(shù)據(jù)表來(lái)存儲(chǔ),對(duì)于用戶(hù)不常用的維度和數(shù)據(jù),采用ROLAP星型結(jié)構(gòu)來(lái)存儲(chǔ)。在HOLAP的多維數(shù)據(jù)表中的數(shù)據(jù)維度少于MOLAP中的維度表,數(shù)據(jù)存儲(chǔ)容量也少于MOLAP方式。HOLAP在數(shù)據(jù)存取速度上又低于MOLAP。923.2.4HOLAP數(shù)據(jù)模型HOLAP(HybridOL3.3多維數(shù)據(jù)的顯示3.3.1多維數(shù)據(jù)顯示方法3.3.2多維類(lèi)型結(jié)構(gòu)(MTS)3.3.3多維數(shù)據(jù)的分析視圖933.3多維數(shù)據(jù)的顯示3.3.1多維數(shù)據(jù)顯示方法273.3.1多維數(shù)據(jù)顯示方法多維數(shù)據(jù)的顯示只能在平面上展現(xiàn)出來(lái)。三維數(shù)據(jù)無(wú)法在平面上展現(xiàn)出來(lái)。三維數(shù)據(jù)顯示見(jiàn)表3.6所示。943.3.1多維數(shù)據(jù)顯示方法多維數(shù)據(jù)的顯示只能在平面上展現(xiàn)出產(chǎn)品名地區(qū) 時(shí)間銷(xiāo)售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服廣州1月150衣服廣州2月250衣服廣州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋廣州1月150鞋廣州2月250鞋廣州3月300…………95產(chǎn)品名地區(qū) 時(shí)間銷(xiāo)售量衣服北京1月100衣服北京2月200衣3.3.2多維類(lèi)型結(jié)構(gòu)(MTS)表示方法是:每一個(gè)維度用一條線段來(lái)表示。維度中的每一個(gè)成員都用線段上的一個(gè)單位區(qū)間來(lái)表示。例如,用三個(gè)線段分別表示時(shí)間、產(chǎn)品和指標(biāo)三個(gè)維的多維類(lèi)型結(jié)構(gòu)如圖3.3所示。963.3.2多維類(lèi)型結(jié)構(gòu)(MTS)表示方法是:每一個(gè)維度用一在圖3.3多維類(lèi)型結(jié)構(gòu)(MTS)中,指定時(shí)間維成員是3月,產(chǎn)品維成員是鞋,指標(biāo)維成員是銷(xiāo)售量,這樣它代表了三維數(shù)據(jù)總得一個(gè)空間數(shù)據(jù)點(diǎn),如圖3.4所示。97在圖3.3多維類(lèi)型結(jié)構(gòu)(MTS)中,指定時(shí)間維成員是3月,產(chǎn)3.3.3多維數(shù)據(jù)的分析視圖在平面的屏幕上顯示多維數(shù)據(jù),是利用行、列和頁(yè)面三個(gè)顯示組來(lái)表示的。例如,對(duì)上例的四維MTS實(shí)例,在頁(yè)面上選定商店維度中“商店3”,在行中選定時(shí)間維的“1月、2月、3月”共3個(gè)成員,在列中選定產(chǎn)品維中的“上衣、褲、帽子”三個(gè)成員,以及指標(biāo)維中的“固定成本、直接銷(xiāo)售”二個(gè)成員。該四維數(shù)據(jù)的顯示如圖3.6所示。商店3(頁(yè)面)上衣褲帽子直接銷(xiāo)售固定成本直接銷(xiāo)售固定成本直接銷(xiāo)售固定成本1月4503505504505004002月3802804603604003203月400310480410450400983.3.3多維數(shù)據(jù)的分析視圖在平面的屏幕上顯示多維數(shù)據(jù),是利對(duì)于更多維度的數(shù)據(jù)顯示,需要選擇維度及其成員分布在行或者列中。在頁(yè)面上可以選定多個(gè)維度,但每個(gè)維度只能顯示一個(gè)成員。在行或者列中一般只選擇二個(gè)維,每個(gè)維可以多個(gè)成員。例如,對(duì)6個(gè)維度數(shù)據(jù),它的MTS如圖3.7所示。99對(duì)于更多維度的數(shù)據(jù)顯示,需要選擇維度及其成員分布在行或者列中對(duì)以上6維數(shù)據(jù)中,設(shè)定頁(yè)面維度為商店的成員是“商店3”,客戶(hù)維度成員是“老年”。行維度含時(shí)間維和產(chǎn)品維共2個(gè)維度,其中時(shí)間維中成員為“1月、2月、3月”。產(chǎn)品維中成員為“桌子、臺(tái)燈”。列維度含指標(biāo)維和場(chǎng)景維共2個(gè)維度,其中指標(biāo)維中成員為“直接銷(xiāo)售、間接銷(xiāo)售、總銷(xiāo)售”。場(chǎng)景維中成員為“實(shí)際、計(jì)劃”。具體的顯示數(shù)據(jù)如圖3.8所示。商店3,老年(頁(yè)面)直接銷(xiāo)售間接銷(xiāo)售總銷(xiāo)售實(shí)際計(jì)劃實(shí)際計(jì)劃實(shí)際計(jì)劃1月桌子250300125150375450臺(tái)燈2653201331604004802月桌子333400167200500600臺(tái)燈2833401421704255103月桌子350420175210525630臺(tái)燈250300125150375450100對(duì)以上6維數(shù)據(jù)中,設(shè)定頁(yè)面維度為商店的成員是“商店3”,客戶(hù)3.4OALP的多維數(shù)據(jù)分析3.4.1多維數(shù)據(jù)分析的基本操作3.4.2廣義OLAP功能3.4.3多維數(shù)據(jù)分析實(shí)例1013.4OALP的多維數(shù)據(jù)分析3.4.1多維數(shù)據(jù)分析的基本操作例如,以“產(chǎn)品、城市、時(shí)間”三維數(shù)據(jù),如圖102例如,以“產(chǎn)品、城市、時(shí)間”三維數(shù)據(jù),如圖363.4.1多維數(shù)據(jù)分析的基本操作
1.切片選定多維數(shù)組的一個(gè)二維子集的操作叫做切片。例如:對(duì)三維數(shù)據(jù),通過(guò)“切片”,分別從城市和產(chǎn)品等不同的角度觀察銷(xiāo)售情況:
1033.4.1多維數(shù)據(jù)分析的基本操作1.切片372.切塊切塊有兩種情況:(1)在多維數(shù)組的某一個(gè)維上選定某一區(qū)間的維成員的操作切塊可以看成是在切片的基礎(chǔ)上,確定某一個(gè)維成員的區(qū)間得到的片段,也即由多個(gè)切片疊合起來(lái)。(2)選定多維數(shù)組的一個(gè)三維子集的操作在多維數(shù)組(維1,維2,……,維n,變量)中選定3個(gè)維,維i、維j、維k,在這3個(gè)維上分別取一個(gè)區(qū)間,或任意維成員,而其它維都取定一個(gè)維成員。1042.切塊切塊有兩種情況:383.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆?。╠rillup)操作。向下鉆取是使用戶(hù)在多層數(shù)據(jù)中能通過(guò)導(dǎo)航信息而獲得更多的細(xì)節(jié)性數(shù)據(jù)。向上鉆取獲取概括性的數(shù)據(jù)。1053.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆?。ㄣ@?。豪?,2005年各部門(mén)銷(xiāo)售收入表如下:106鉆?。豪?,2005年各部門(mén)銷(xiāo)售收入表如下:40對(duì)時(shí)間維進(jìn)行下鉆操作,獲得新表如下:2005年部門(mén)1季度2季度3季度4季度部門(mén)1200200350150部門(mén)225050150150部門(mén)3200150180270107對(duì)時(shí)間維進(jìn)行下鉆操作,獲得新表如下:2005年部門(mén)1季度2季4.旋轉(zhuǎn)通過(guò)旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。旋轉(zhuǎn)操作相當(dāng)于平面數(shù)據(jù)將坐標(biāo)軸旋轉(zhuǎn)。例如,旋轉(zhuǎn)可能包含了交換行和列,或是把某一個(gè)行維移到列維中去。或是把頁(yè)面顯示中的一個(gè)維和頁(yè)面外的維進(jìn)行交換(令其成為新的行或列中的一個(gè))1084.旋轉(zhuǎn)通過(guò)旋轉(zhuǎn)可以得到不同視角的數(shù)據(jù)。旋轉(zhuǎn)操作相當(dāng)于平面數(shù)旋轉(zhuǎn)時(shí)間維產(chǎn)品維產(chǎn)品維時(shí)間維(a)行列交換旋轉(zhuǎn)以改變顯示布局時(shí)間維地區(qū)維產(chǎn)品維時(shí)間維產(chǎn)品維地區(qū)維109旋轉(zhuǎn)時(shí)間維產(chǎn)品維產(chǎn)品維時(shí)間維(a)行列交換旋轉(zhuǎn)以改變時(shí)間維旋轉(zhuǎn)前的數(shù)據(jù)實(shí)例旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)后再切片110旋轉(zhuǎn)前的數(shù)據(jù)實(shí)例旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)后再切片443.4.2廣義OLAP功能
1、基本代理操作
當(dāng)系統(tǒng)處于某種特殊狀態(tài)時(shí)“代理”提醒分析員。
(1)示警報(bào)告
定義一些條件,一但條件滿足,系統(tǒng)會(huì)提醒分析員去做分析。如每日?qǐng)?bào)告完成或月定貨完成等通知分析員作分析。(2)時(shí)間報(bào)告按日歷和時(shí)鐘提醒分析員。
(3)異常報(bào)告
當(dāng)超出邊界條件時(shí)提醒分析員。如銷(xiāo)售情況已超出預(yù)定義閾值的上限或下限時(shí)提醒分析員。1113.4.2廣義OLAP功能1、基本代理操作452.?dāng)?shù)據(jù)分析模型E.F.Codd將數(shù)據(jù)模型分為4類(lèi)模型:(1)絕對(duì)模型通過(guò)比較歷史數(shù)據(jù)值或行為來(lái)描述過(guò)去發(fā)生的事實(shí)。絕對(duì)模型只能對(duì)歷史數(shù)據(jù)進(jìn)行比較,并且利用回歸分析等一些分析方法得出趨勢(shì)信息。1122.?dāng)?shù)據(jù)分析模型E.F.Codd將數(shù)據(jù)模型分為4類(lèi)模型:(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細(xì)化,找出事實(shí)發(fā)生的原因。
假設(shè)今年銷(xiāo)售量下降,那么解釋模型應(yīng)當(dāng)能找出原因,即下滑與時(shí)間、地區(qū)、商品及銷(xiāo)售渠道四者中的何種因素有關(guān)。113(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細(xì)化,找出事(3)思考模型說(shuō)明在一維或多維上引入一組具體變量或參數(shù)后將會(huì)發(fā)生什么。例如該公司決策者為了了解某商品的銷(xiāo)售量是否與顧客的年齡有關(guān),引入了行變量-年齡,即在當(dāng)前的多維視圖上增加了顧客的年齡維。114(3)思考模型說(shuō)明在一維或多維上引入一組具體變量或參數(shù)后將會(huì)(4)公式模型該模型表示在多個(gè)維上,需要引入哪些變量或參數(shù),以及引入后所產(chǎn)生的結(jié)果。公式模型自動(dòng)完成上述變量引入工作,從而最終找出與銷(xiāo)量有關(guān)的全部因素,并給出了引入后的結(jié)果。115(4)公式模型該模型表示在多個(gè)維上,需要引入哪些變量或參數(shù),3.商業(yè)分析模型具體的商業(yè)分析模型有:(1)分銷(xiāo)渠道的分析模型(2)客戶(hù)利潤(rùn)貢獻(xiàn)度模型(3)客戶(hù)關(guān)系(信用)優(yōu)化模型(4)風(fēng)險(xiǎn)評(píng)估模型1163.商業(yè)分析模型具體的商業(yè)分析模型有:50(1)分銷(xiāo)渠道的分析模型通過(guò)客戶(hù)、渠道、產(chǎn)品或服務(wù)三者之間的關(guān)系,了解客戶(hù)的購(gòu)買(mǎi)行為、客戶(hù)和渠道對(duì)業(yè)務(wù)收入的貢獻(xiàn)、哪些客戶(hù)比較喜好由什么渠道在何時(shí)和銀行打交道。為此,銀行需要建立客戶(hù)購(gòu)買(mǎi)傾向模型和渠道喜好模型等。117(1)分銷(xiāo)渠道的分析模型通過(guò)客戶(hù)、渠道、產(chǎn)品或服務(wù)三者之間的(2)客戶(hù)利潤(rùn)貢獻(xiàn)度模型通過(guò)該模型能了解每一位客戶(hù)對(duì)銀行的總利潤(rùn)貢獻(xiàn)度。知道哪些利潤(rùn)高的客戶(hù)需要留住,采用什么方法留住客戶(hù),交叉銷(xiāo)售改善客戶(hù)的利潤(rùn)貢獻(xiàn)度,哪些客戶(hù)應(yīng)該爭(zhēng)取,完成個(gè)性化服務(wù)。118(2)客戶(hù)利潤(rùn)貢獻(xiàn)度模型通過(guò)該模型能了解每一位客戶(hù)對(duì)(3)客戶(hù)關(guān)系(信用)優(yōu)化模型銀行對(duì)客戶(hù)的每一筆交易中,知道客戶(hù)需要什么產(chǎn)品或服務(wù),例如,定期存款是希望退休養(yǎng)老使用,申請(qǐng)信用卡需要現(xiàn)金消費(fèi),詢(xún)問(wèn)放貸利息需要住房貸款等。通過(guò)模型計(jì)算,主動(dòng)地對(duì)客戶(hù)溝通并進(jìn)行交叉銷(xiāo)售,達(dá)到留住客戶(hù)和增加利潤(rùn)的目標(biāo)。119(3)客戶(hù)關(guān)系(信用)優(yōu)化模型銀行對(duì)客戶(hù)的每一筆交易中,知道(4)風(fēng)險(xiǎn)評(píng)估模型模擬風(fēng)險(xiǎn)和利潤(rùn)間的關(guān)系,建立風(fēng)險(xiǎn)評(píng)估的數(shù)學(xué)模型,在滿足高利潤(rùn)、低風(fēng)險(xiǎn)客戶(hù)需求的前提下,達(dá)到銀行收益的極大化。120(4)風(fēng)險(xiǎn)評(píng)估模型模擬風(fēng)險(xiǎn)和利潤(rùn)間的關(guān)系,建立風(fēng)險(xiǎn)評(píng)估的數(shù)學(xué)
假設(shè)有一個(gè)5維數(shù)據(jù)模型,5個(gè)維分別為:商店,方案,部門(mén),時(shí)間,銷(xiāo)售。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年長(zhǎng)租公寓物業(yè)租賃居間服務(wù)條款3篇
- 通風(fēng)除塵凈化課程設(shè)計(jì)
- 2025年雨傘租賃與廣告投放綜合服務(wù)合同3篇
- 2025年面粉產(chǎn)品包裝設(shè)計(jì)與印刷合同4篇
- 年度防霧涂料競(jìng)爭(zhēng)策略分析報(bào)告
- 年度地震專(zhuān)用儀器戰(zhàn)略市場(chǎng)規(guī)劃報(bào)告
- 年度重組水蛭素單克隆抗體戰(zhàn)略市場(chǎng)規(guī)劃報(bào)告
- 硬件課程設(shè)計(jì)哪個(gè)簡(jiǎn)單
- 植筋的施工方案
- 2025年度預(yù)制混凝土承臺(tái)基礎(chǔ)工程采購(gòu)合同4篇
- 2024電子商務(wù)平臺(tái)用戶(hù)隱私保護(hù)協(xié)議3篇
- 安徽省蕪湖市2023-2024學(xué)年高一上學(xué)期期末考試 英語(yǔ) 含答案
- 電力工程施工安全風(fēng)險(xiǎn)評(píng)估與防控
- 醫(yī)學(xué)教程 常見(jiàn)體表腫瘤與腫塊課件
- 內(nèi)分泌系統(tǒng)異常與虛勞病關(guān)系
- 智聯(lián)招聘在線測(cè)評(píng)題
- DB3418T 008-2019 宣紙潤(rùn)墨性感官評(píng)判方法
- 【魔鏡洞察】2024藥食同源保健品滋補(bǔ)品行業(yè)分析報(bào)告
- 生豬屠宰獸醫(yī)衛(wèi)生檢驗(yàn)人員理論考試題及答案
- 鋼筋桁架樓承板施工方案
- 2024年駐村第一書(shū)記工作總結(jié)干貨3篇
評(píng)論
0/150
提交評(píng)論