



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、概述在多維分析的商業(yè)智能解決方案中,根據(jù)事實表和維度表的關(guān)系,又可將常見的模型分為星 型模型和雪花型模型。在設(shè)計邏輯型數(shù)據(jù)的模型的時候,就應(yīng)考慮數(shù)據(jù)是按照星型模型還是 雪花型模型進(jìn)行組織。當(dāng)所有維表都直接連接到“事實表”上時,整個圖解就像星星一樣,故將該模型稱為星型模型, 如圖1。星型架構(gòu)是一種非正規(guī)化的結(jié)構(gòu),多維數(shù)據(jù)集的每一個維度都直接與事實表相連接,不存 在漸變維度,所以數(shù)據(jù)有一定的冗余,如在地域維度表中,存在國家A省B的城市C以 及國家A省B的城市D兩條記錄,那么國家A和省B的信息分別存儲了兩次,即存 在冗余。圖1.銷售數(shù)據(jù)倉庫中的星型模型笛門在司司處 總分代魚叵譴藝門道當(dāng)有一個或多
2、個維表沒有直接連接到事實表上,而是通過其他維表連接到事實表上時,其圖 解就像多個雪花連接在一起,故稱雪花模型。雪花模型是對星型模型的擴(kuò)展。它對星型模型 的維表進(jìn)一步層次化,原有的各維表可能被擴(kuò)展為小的事實表,形成一些局部的層次區(qū) 域,這些被分解的表都連接到主維度表而不是事實表。如圖2,將地域維表又分解為國家, 省份,城市等維表。它的優(yōu)點(diǎn)是:通過最大限度地減少數(shù)據(jù)存儲量以及聯(lián)合較小的維表來 改善查詢性能。雪花型結(jié)構(gòu)去除了數(shù)據(jù)冗余。圖2.銷售數(shù)據(jù)倉庫中的雪花型模型星型模型因為數(shù)據(jù)的冗余所以很多統(tǒng)計查詢不需要做外部的連接,因此一般情況下效率比 雪花型模型要高。星型結(jié)構(gòu)不用考慮很多正規(guī)化的因素,設(shè)計與
3、實現(xiàn)都比較簡單。雪花型模 型由于去除了冗余,有些統(tǒng)計就需要通過表的聯(lián)接才能產(chǎn)生,所以效率不一定有星型模型高。 正規(guī)化也是一種比較復(fù)雜的過程,相應(yīng)的數(shù)據(jù)庫結(jié)構(gòu)設(shè)計、數(shù)據(jù)的ETL、以及后期的維護(hù)都 要復(fù)雜一些。因此在冗余可以接受的前提下,實際運(yùn)用中星型模型使用更多,也更有效率。二、使用選擇星形模型(Star Schema)和雪花模型(Snowflake Schema)是數(shù)據(jù)倉庫中常用到的兩種方式, 而它們之間的對比要從四個角度來進(jìn)行討論。數(shù)據(jù)優(yōu)化雪花模型使用的是規(guī)范化數(shù)據(jù),也就是說數(shù)據(jù)在數(shù)據(jù)庫內(nèi)部是組織好的,以便消除冗余, 因此它能夠有效地減少數(shù)據(jù)量。通過引用完整性,其業(yè)務(wù)層級和維度都將存儲在數(shù)據(jù)
4、模型 之中。圖1雪花模型相比較而言,星形模型實用的是反規(guī)范化數(shù)據(jù)。在星形模型中,維度直接指的是事實表, 業(yè)務(wù)層級不會通過維度之間的參照完整性來部署。圖2星形模型業(yè)務(wù)模型主鍵是一個單獨(dú)的唯一鍵(數(shù)據(jù)屬性),為特殊數(shù)據(jù)所選擇。在上面的例子中,Advertiser_ID 就將是一個主鍵。外鍵(參考屬性)僅僅是一個表中的字段,用來匹配其他維度表中的主鍵。在我們所引用的例子中,Advertiser_ID將是Account_dimension的一個外鍵。在雪花模型中,數(shù)據(jù)模型的業(yè)務(wù)層級是由一個不同維度表主鍵-外鍵的關(guān)系來代表的。而在 星形模型中,所有必要的維度表在事實表中都只擁有外鍵。性能第三個區(qū)別在于性能的不同。雪花模型在維度表、事實表之間的連接很多,因此性能方面 會比較低。舉個例子,如果你想要知道Advertiser的詳細(xì)信息,雪花模型就會請求許多信息, 比如Advertiser Name ID以及那些廣告主和客戶表的地址需要連接起來,然后再與事實表 連接。而星形模型的連接就少的多,在這個模型中,如果你需要上述信息,你只要將Advertiser 的維度表和事實表連接即可。ETL 雪花模型加載數(shù)據(jù)集市,因此ETL操作在設(shè)計上更加復(fù)雜,而且由于附屬模型的限制,不 能并行化。星形模型加載維度表,不需要再維度之間添加附屬模型,因此ETL就相對簡單,而且可以 實現(xiàn)高度的并行化??偨Y(jié)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 會展產(chǎn)品合同范本
- 出口種子銷售合同范本
- 轉(zhuǎn)賣音響合同范本
- 勞務(wù)外包合同范例
- 中介委托租房電子合同范本
- 凱倫股合同范本
- 養(yǎng)牛合伙合同范本
- 北海吊車出租合同范本
- 公司中途入股合同范本
- 產(chǎn)品服務(wù)合同范例
- 110kV升壓站構(gòu)支架組立施工方案
- 材料化學(xué)課件
- 智能傳感器芯片
- -《多軸數(shù)控加工及工藝》(第二版)教案
- 智能交通概論全套教學(xué)課件
- 生物醫(yī)學(xué)工程倫理 課件全套 第1-10章 生物醫(yī)學(xué)工程與倫理-醫(yī)學(xué)技術(shù)選擇與應(yīng)用的倫理問題
- 燒結(jié)機(jī)安裝使用說明書
- 新戰(zhàn)略營銷課件
- (完整版)部編一年級下冊語文《春夏秋冬》ppt
- 人文地理學(xué)考試名詞解釋全套
- 新華書店業(yè)務(wù)崗位職責(zé)共3篇
評論
0/150
提交評論