商務智能教學課件:09 Dimensional Modeling 3_第1頁
商務智能教學課件:09 Dimensional Modeling 3_第2頁
商務智能教學課件:09 Dimensional Modeling 3_第3頁
商務智能教學課件:09 Dimensional Modeling 3_第4頁
商務智能教學課件:09 Dimensional Modeling 3_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、多維建模Dimensional Modeling 2多維建模多維建模初步多維建模案例一,零售營銷多維建模案例二,庫存管理多維建模案例三,訂單管理多維建模案例四,客戶關系管理訂單管理訂單事務方案事實表規(guī)范化方面的考慮維度設計策略日期維度的角色模仿維度表的多屬性體系結構雜項維度事實表設計策略多種貨幣與計量單位不同粒度層次上度量值的分配考慮贏利與虧損事實的票據(jù)處理事務方案訂單處理流水線的累積快照方案三種不同類型事實表的比較數(shù)據(jù)倉庫中的實時分區(qū)3訂單管理的引入(1/3)訂單管理所關注的業(yè)務處理流程報價,生成訂單,安排生產(chǎn)計劃,組織貨物的裝運發(fā)送,票據(jù)處理所關注的分析對象數(shù)量:訂購,生產(chǎn),裝運收入:訂購

2、額,貼現(xiàn)額,凈訂購額45訂單管理的引入(2/3)數(shù)據(jù)倉庫的總線矩陣子集(訂單管理部分)日期產(chǎn)品顧客讓利營銷代表發(fā)貨貨主報價訂單裝運發(fā)票6訂單管理的引入(3/3)最基本的訂單事務事實表為訂單的每個訂單分列項建立一個記錄行(元組)所包含的度量值有訂購量訂單增值總額訂單貼現(xiàn)金額訂單增值余額(訂單增值總額-貼現(xiàn))訂單事務事實表7訂單事務事實訂單日期關鍵字(FK)請求裝貨日期關鍵字(FK)產(chǎn)品關鍵字(FK)收貨顧客關鍵字(FK)營銷代表關鍵字(FK)交易關鍵字(FK)訂單編號(DD)訂單分列項編號(DD)訂購量總訂購額訂購交易貼現(xiàn)金額凈訂購額訂單日期維度訂單日期關鍵字(PK)訂單日期訂單日期星期訂單日期

3、月及其他收貨顧客維度營銷代表維度交易維度請求裝運日期維度請求裝運日期關鍵字(PK)請求裝運日期請求裝運日期星期請求裝運日期月及其他產(chǎn)品維度8事實表的規(guī)范化考慮(1/4)事實表的規(guī)范化將一張事實表中的多個度量值分解組裝成多個事實表事實表規(guī)范化的目的在對事實表進行規(guī)范后,可以連同標識事實類型維度一起得到單一的一般性事實規(guī)范化的時機事實行的事實設置比較稀疏不在事實之間施加運算9事實表的規(guī)范化考慮(2/4)方案A(反規(guī)范化):假設有一個由10個外關鍵字屬性,5個度量值屬性以及100萬行元組所構成的事實表方案B(規(guī)范化):將上述的一張事實表分解為只記錄單個度量值的5張事實表方案A方案B結構復雜性1張表,

4、15個屬性5張表,55個屬性數(shù)據(jù)量1500萬個屬性值最多5500萬個屬性值數(shù)據(jù)訪問可以直接在SQL語句中進行數(shù)學計算,以獲得新的度量值首先需要執(zhí)行表的聯(lián)接操作,然后才能進行數(shù)學計算。而聯(lián)接操作需要更多的時間開銷10事實表的規(guī)范化考慮(3/4)一般不考慮事實表的規(guī)范化。除非不同度量值的計算處于不同的粒度層次上,那么則需要將它們分解到不同的事實表中去如果可以將“粗”粒度的度量值分配到“細”的粒度層次上,那么則可以在盡量細的粒度層次上通過統(tǒng)一粒度層次來建立一張統(tǒng)一的事實表事實表中的粒度層次越“細”,則可以提供的分析操作就越多11事實表的規(guī)范化考慮(4/4)粒度無法統(tǒng)一的案例:訂單的折扣購買總金額訂單

5、折扣 = 實際購買金額這是針對訂單事實的度量值,我們不能將其細化到訂單分列項事實上雖然不影響整個訂單的購買金額的計算,但是:會影響到沿著商品維度(或其它訂單分列項元組中的維度屬性)的分析操作12維度設計策略基于數(shù)據(jù)倉庫總線的設計思想,訂單管理維度模型可以與前述的其它維度模型共享一組公共的維度表,如:日期維,產(chǎn)品維,顧客維,針對訂單管理的特殊性,在維度表的設計過程中還需要考慮下列問題維度的角色模仿維度表的多屬性體系結構雜項維度13日期維度的角色模仿(1/3)在基于多事務的訂單管理事實表中,存在著若干個日期類型的外關鍵字每一個日期外關鍵字都對應著訂單處理過程中的某一個業(yè)務處理步驟,如:訂單的創(chuàng)建日

6、期,產(chǎn)品加工日期,成品入庫日期,請求裝運日期,計劃裝運日期,實際裝運日期,到貨日期,發(fā)票日期,實現(xiàn)方式為每個日期類型的外關鍵字建立一個獨立的日期維表所有日期類型的外關鍵字共享同一個物理的日期維表14日期維度的角色模仿(2/3)單個維度同時在同一個事實表出現(xiàn)幾次建立多組合的維度訂單日期裝貨日期(365365)角色模仿日期維度的角色模仿后臺只維持一個單一的日期維度表為事實表中的每一個日期外關鍵字建立一個日期維表上的視圖優(yōu)點:降低存儲空間開銷,方便使用15日期維度的角色模仿(3/3)例如:Create view ORDER_DATE(ORDER_DATE_KEY, ORDER_DAY_OF_WEEK

7、,ORDER_MONTH,)As select DATE_KEY, DAY_OF_WEEK,MONTH, from DATECreate view REQ_SHIP_DATE(REQ_SHIP_DATE_KEY, REQ_SHIP_DAY_OF_WEEK, REQ_SHIP_MONTH,)As select DATE_KEY, DAY_OF_WEEK,MONTH, from DATE日期維度在單個事實表中承擔不同角色16維度表的屬性體系結構(1/2)在一個維度表中通常存在著若干組用于描述維度表中的元組在不同方面的描述屬性在許多非體系屬性之外,存在一個或而多個屬性體系結構例如:商品維子類描述,分

8、類描述,部門描述包裝類型描述,包裝尺寸含脂量描述,食物類型描述重量,重量單位,儲藏類型描述貨架期限描述,貨架寬、高、深17維度表的屬性體系結構(2/2)星形模型雪花模型瀏覽性能存儲空間在雪花/雪暴模型中,能夠通過子維度作為公共維度連接多個多維模型的,應充分考慮維度的規(guī)范化收貨顧客維度(1/4)18訂單事務事實訂單日期關鍵字(FK)請求裝貨日期關鍵字(FK)產(chǎn)品關鍵字(FK)收貨顧客關鍵字(FK)營銷代表關鍵字(FK)交易關鍵字(FK)訂單編號(DD)訂單分列項編號(DD)訂購量總訂購額訂購交易貼現(xiàn)金額凈訂購額收貨顧客維度收貨顧客關鍵字(PK)收貨顧客ID(自然關鍵字)收貨顧客姓名收貨顧客地址收

9、貨顧客城市收貨顧客州收貨顧客郵編+4收貨顧客郵編收貨顧客郵編地區(qū)收貨顧客郵編分段中心收票顧客姓名收票顧客地址屬性顧客機構名稱顧客母公司名稱客戶信貸分類指定的營銷代表姓名指定的營銷代表組名稱指定的銷售政區(qū)指定的銷售地區(qū)訂單日期維度請求裝貨日期維度產(chǎn)品維度營銷代表維度交易維度合并維度 vs. 獨立維度收貨顧客維度(2/4)粒度:為每個分離的收貨地址包含一行內(nèi)容收貨顧客維表中的屬性體系結構收貨地址收票地址顧客機構體系地址 顧客單位與簽收單營銷機構1920收貨顧客維度(3/4)營銷機構(作為一個單獨的維度還是放在顧客維度表)營銷代表 與 收貨地址之間的關系(同體系?)“一對一”或“多對一”高度相關 合

10、并為一個收貨顧客維度隨著時間或產(chǎn)品產(chǎn)生變化 兩個獨立的維度如果營銷代表與收貨顧客獨立地參與了其它的事實表建立各自獨立的維度表21收貨顧客維度(4/4)當實體之間存在固定的、不隨時間變化的、強烈相關的關系時,需要作為單一維度進行建模其他情況下需要分割需要考慮維度過多的情況,如果方案已經(jīng)確定維度數(shù)量(例如,25)則充分考慮維度組合的問題22交易維度如果期限、打折等交易信息存在相關,則組合成一個維度訂單事務事實訂單日期關鍵字(FK)請求裝貨日期關鍵字(FK)產(chǎn)品關鍵字(FK)收貨顧客關鍵字(FK)營銷代表關鍵字(FK)交易關鍵字(FK)訂單編號(DD)訂單分列項編號(DD)訂購量總訂購額訂購交易貼現(xiàn)

11、金額凈訂購額交易維度交易關鍵字(PK)交易描述交易條款描述交易條款類型描述打折描述打折類型描述具體激勵描述具體激勵類型描述訂單日期維度請求裝貨日期維度產(chǎn)品維度營銷代表維度收貨顧客維度23訂單編號退化維度來源于操作性數(shù)據(jù)環(huán)境的訂單細節(jié)已經(jīng)從訂單標題中剝離出來形成獨立的維度訂單日期收貨顧客地址訂單編號用于對訂單上的分列項目進行分組,因此仍然有效偶爾用于數(shù)據(jù)倉庫反向連接操作型領域24雜項維度(1/3)從復雜的數(shù)據(jù)源中提取與事實、維度相關的字段后,往往還有大量在小范圍內(nèi)選取離散值的指示符與標志將標志與指示符不加改變地留在事實表行中事實表膨脹將每個標志與指示符放在本身的單獨維度中維度膨脹將所有標志與指示

12、符從設計中剝離出來刪除難以理解的,雜亂的,或者與分析操作無關的維度屬性也可以將它們組裝成一個或多個獨立的雜項維度表(junk dimension)25雜項維度(2/3)訂單指示符關鍵字支付類型描述支付類型組訂單出/入指示符代辦信用指示符訂單類型指示符1現(xiàn)金現(xiàn)金輸入訂單可代辦一般2現(xiàn)金現(xiàn)金輸入訂單非代辦展覽3現(xiàn)金現(xiàn)金輸入訂單非代辦示范4現(xiàn)金現(xiàn)金輸出訂單可代辦一般5發(fā)現(xiàn)者信用卡信用卡輸出訂單非代辦展覽6發(fā)現(xiàn)者信用卡信用卡輸入訂單可代辦一般7發(fā)現(xiàn)者信用卡信用卡輸入訂單非代辦展覽8發(fā)現(xiàn)者信用卡信用卡輸入訂單非代辦示范9發(fā)現(xiàn)者信用卡信用卡輸出訂單可代辦一般10發(fā)現(xiàn)者信用卡信用卡輸出訂單非代辦展覽11萬事

13、達信用卡信用卡輸入訂單可代辦一般12萬事達信用卡信用卡輸入訂單非代辦展覽13萬事達信用卡信用卡輸入訂單非代辦示范14萬事達信用卡信用卡輸出訂單可代辦一般26雜項維度(3/3)預先為所有組合創(chuàng)建雜項維度行 vs. 實際遇到的組合創(chuàng)建雜項維度行組合可能大小 vs. 組合預計大小雜項維度可以用以維護附在事實行上的自由注釋字段參數(shù)化自由注釋字段自由注釋的數(shù)量遠小于事實行的數(shù)量需要引入“非注釋行” 的代理關鍵字27多種流通貨幣選擇一個標準的通用貨幣,并建立其它貨幣與之轉(zhuǎn)換關系不同貨幣之間的匯率是隨著時間變化的同時貨幣之間的互兌匯率也是不盡相同的建立貨幣事實表貨幣和國家之間不一一對應28每日貨幣互兌事實表

14、跟蹤多種貨幣支持兩種貨幣形式的事實表支持多種貨幣形式的事實報表29粒度不同的標題與分列項事實訂單的運費 僅適用于整份訂單處理方法在較低層次事實表中盡可能包含所有可用的高層事實表中的事實但這樣的實現(xiàn)方式并不能適用于所有的情況不能在同一個事實表中混用不同粒度的事實解決辦法:向下分配事實將運費與其他標題級事實展現(xiàn)在用于整個訂購的聚集表中30分配注意:由于產(chǎn)品不用于訂單標題,所以事實表中沒有產(chǎn)品維度標題事實分配到分列項層次后,就可以按產(chǎn)品維度分析事實訂單標題事實到訂單分列項的分配31發(fā)票事務(1/2)(裝運)發(fā)票的內(nèi)容發(fā)貨日期,目的地,顧客具有多個分列項(對應著發(fā)送的不同商品)不同的分列項有不同的數(shù)量

15、、價格、貼現(xiàn)與打折等內(nèi)容發(fā)票總額發(fā)票事實表的設計建立對應各個分列項的事實新的維度:發(fā)貨,貨運人,顧客滿意度32發(fā)票事務(2/2)發(fā)貨維度為每個制造商貨?;蜓b貨點建立一個維度元組,包括:名字,地址,聯(lián)系人,存儲設施類型等維度屬性貨運人維度描述將產(chǎn)品從制造商運送給顧客所使用的方法與運載工具33裝運發(fā)票分列項事務事實發(fā)票日期關鍵字(FK)請求裝運日期關鍵字(FK)實際裝運日期關鍵字(FK)產(chǎn)品關鍵字(FK)收貨顧客關鍵字(FK)交易關鍵字(FK)貨主關鍵字(FK)顧客滿意度關鍵字(FK)發(fā)票編號(DD)訂單編號(DD)裝運量增值發(fā)票總額增值打折總額增值貼現(xiàn)總額增值發(fā)票凈額增值不變生產(chǎn)成本增值可變生產(chǎn)

16、成本增值儲藏成本增值調(diào)配成本按時裝運分列項計數(shù)全部裝運分列項計數(shù)完好裝運分列項計數(shù)產(chǎn)品維度交易維度貨主維度日期維度(3種角色)收貨顧客維度發(fā)貨維度客戶滿意度維度贏利與虧損事實34訂單任務流水線訂單后備成品加工分發(fā)成品庫存裝運發(fā)票訂單任務累積快照(1/2)35訂單作業(yè)累積事實訂單日期關鍵字(FK)后備日期關鍵字(FK)產(chǎn)品加工日期關鍵字(FK)成品庫存處理日期關鍵字(FK)請求裝運日期關鍵字(FK)計劃裝運日期關鍵字(FK)實際裝運日期關鍵字(FK)到貨日期關鍵字(FK)發(fā)票日期關鍵字(FK)產(chǎn)品關鍵字(FK)顧客關鍵字(FK)營銷代表關鍵字(FK)交易關鍵字(FK)生產(chǎn)設備關鍵字(FK)倉庫關

17、鍵字(FK)貨主關鍵字(FK)訂單編號(DD)訂單分列項編號(DD)發(fā)票編號(DD)(其它度量值)產(chǎn)品維度營銷代表維度生產(chǎn)設備維度日期維度(9種角色)顧客維度交易維度倉庫維度貨主維度訂單任務累積快照(2/2)36訂單作業(yè)累積事實(各種外關鍵字FK)訂購量訂購額加工提交量加工檢測合格量加工檢測不合格量成品庫存量批準銷售量裝運量裝運損壞量顧客退貨量發(fā)票量發(fā)票額訂購到加工分發(fā)延遲加工到庫存分發(fā)延遲庫存到裝運延遲訂購到裝運延遲產(chǎn)品維度營銷代表維度生產(chǎn)設備維度日期維度(9種角色)顧客維度交易維度倉庫維度貨主維度37支持多計量單位的事實表轉(zhuǎn)換因子因子一般不作為維度屬性。而是封裝在事實表中在用戶接口中,視圖

18、是因子乘積組合結果業(yè)務范圍內(nèi)的不同職能機構想看到以不同計量單位表示的相同性能指標將所有事實與不同計量單位之間的轉(zhuǎn)換因子存放在同一個事實表中多個計量單位38三種類型事實表的比較39實時分區(qū)(1/2)在數(shù)據(jù)倉庫環(huán)境中,對實時業(yè)務數(shù)據(jù)的訪問需要在常規(guī)靜態(tài)數(shù)據(jù)倉庫的前面建立一個物理的實時分區(qū)對實時分區(qū)的約束要求包括靜態(tài)數(shù)據(jù)倉庫最后一次更新以來出現(xiàn)的所有行為盡可能無縫地連接到靜態(tài)數(shù)據(jù)倉庫事實表的粒度與內(nèi)容上能夠輕松地建立索引,以致于總是可以不斷吸納新來的數(shù)據(jù)40實時分區(qū)(2/2)三種不同類型的實時分區(qū)事務粒度 當天的記錄(并非統(tǒng)計結果)周期快照 最近一個周期內(nèi)的統(tǒng)計結果對非/半加性事實的考慮累積快照 只記錄最近被更新的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論