數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要Adhoc報(bào)表系統(tǒng)_第1頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要Adhoc報(bào)表系統(tǒng)_第2頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要Adhoc報(bào)表系統(tǒng)_第3頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要Adhoc報(bào)表系統(tǒng)_第4頁(yè)
數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要Adhoc報(bào)表系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要數(shù)據(jù)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)精要終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)Ad-hoc釋義:即時(shí)的、隨意的、特殊的前言前言n數(shù)據(jù)庫(kù)扮演的角色 也叫聯(lián)機(jī)事務(wù)處理OLAP(Online Transactional Processing),數(shù)據(jù)庫(kù)保存由日常管理過程中涉及的業(yè)務(wù)操作創(chuàng)建的操作型結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)記錄系統(tǒng)管理行為(通過各種業(yè)務(wù)邏輯來交互)。反映細(xì)粒度的事務(wù)數(shù)據(jù),保存時(shí)間短。主要依賴關(guān)系模式建模方法論。n數(shù)據(jù)倉(cāng)庫(kù)扮演的角色 也叫聯(lián)機(jī)分析處理OLAP(Online Analytical Processing),數(shù)據(jù)由聯(lián)機(jī)事務(wù)處理來,經(jīng)過選擇和聚集,變?yōu)榻y(tǒng)計(jì)分析事實(shí)產(chǎn)生的因果,輔助決策制定(通過各種

2、統(tǒng)計(jì)分析報(bào)表來交互)。反映大范圍的事實(shí)數(shù)據(jù)(業(yè)務(wù)事件的累積),保存時(shí)間長(zhǎng)。主要依賴多維模式建模方法論n主題、事實(shí)和事件(請(qǐng)注意語(yǔ)義) 事實(shí)是一個(gè)主題,比如:銷售、配送、住院、手術(shù)等。一個(gè)主題對(duì)應(yīng)了多個(gè)相互關(guān)聯(lián)的關(guān)系模式,也可以叫做相關(guān)關(guān)系表。事實(shí)的實(shí)例對(duì)應(yīng)著發(fā)生的事件,比如:一個(gè)執(zhí)行的銷售、配送、住院、手術(shù)等都是一個(gè)事件。每個(gè)事實(shí)由一組提供了事件的量化描述的度量的屬性值描述,比如:銷售收入、配送量、住院支出、手術(shù)時(shí)間等n通過語(yǔ)義將數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)結(jié)合在一起從報(bào)表到報(bào)表存在的問題及對(duì)策綱領(lǐng)從報(bào)表到報(bào)表存在的問題及對(duì)策綱領(lǐng)n 對(duì)策綱領(lǐng)n 實(shí)體(關(guān)系所代表的實(shí)體)原子化,是指實(shí)體本身不能再分解n 屬

3、性原子化,是指實(shí)體的屬性(值域所代表的屬性)本身不能再分解n 主鍵原子化,是指實(shí)體的主鍵本身是一個(gè)唯一的ID字段n 聯(lián)系原子化,是指實(shí)體間的聯(lián)系(關(guān)系所代表的聯(lián)系)都是一對(duì)多的聯(lián)系n 命題原子化,是指語(yǔ)義角度的聯(lián)系原子化n現(xiàn)實(shí)(面對(duì)單一主題,數(shù)據(jù)規(guī)模極小,僅是面對(duì)招投標(biāo)業(yè)務(wù)追蹤)1)第二個(gè)表是從第一個(gè)表通過高級(jí)程序員編寫VBA程序?qū)崿F(xiàn),第一個(gè)表也是專業(yè)定崗員工通過Excel專用表單維護(hù)和更新的,背后其實(shí)還是高級(jí)程序員的工作價(jià)值體現(xiàn)2)信息化崗位需求及配置:高級(jí)程序員四名,六個(gè)專業(yè)業(yè)務(wù)人員。滿負(fù)荷工作以應(yīng)對(duì)數(shù)據(jù)變動(dòng)和操作功能變動(dòng)n解決方案:報(bào)表列表化,去除冗余數(shù)據(jù),建模信息化模型(數(shù)據(jù)庫(kù)模型)并

4、影射和實(shí)現(xiàn)為Access桌面數(shù)據(jù)庫(kù)應(yīng)用問題的導(dǎo)入問題的導(dǎo)入- -從從ExcelExcel表格出發(fā)引出的問題表格出發(fā)引出的問題結(jié)構(gòu)良好的表,范式,SQL語(yǔ)言,關(guān)系模式及E-R圖n基本表與中間表、臨時(shí)表不同,基本表及其字段之間的關(guān)系,應(yīng)盡量滿足第三范式,是結(jié)構(gòu)良好的表,它可以消除刪除行,改變行,修改行(實(shí)例)的錯(cuò)誤和異常。它具有如下四個(gè)特性:(1) 原子性,基本表中的字段是不可再分解的。(2) 原始性,基本表中的記錄是原始數(shù)據(jù)(基礎(chǔ)數(shù)據(jù))的記錄。(3) 演繹性,由基本表與代碼表中的數(shù)據(jù),可以派生出所有的輸出數(shù)據(jù)。(4) 穩(wěn)定性,基本表的結(jié)構(gòu)是相對(duì)穩(wěn)定的,表中的記錄是要長(zhǎng)期保存的。(5)基本表的每個(gè)

5、決定因子都必須是候選建。(6)非基本表必須分解為兩個(gè)或多個(gè)基本表。n三個(gè)基本范式:(1) 1NF是對(duì)屬性的原子性約束,要求屬性具有原子性,不可再分解。(2) 2NF是對(duì)記錄的惟一性約束,要求記錄有惟一標(biāo)識(shí),即實(shí)體的惟一性。(3) 3NF是對(duì)字段冗余性的約束,即任何字段不能由其他字段派生出來,它要求字段沒有冗余n大多數(shù)結(jié)構(gòu)不良好的表,會(huì)產(chǎn)生或包含大量的冗余數(shù)據(jù),同時(shí)可能會(huì)出現(xiàn)刪除行,改變行,修改行的錯(cuò)誤和異常,這都是都是使用了SQL DML CURD語(yǔ)句產(chǎn)生的。像中間表、報(bào)表和臨時(shí)表:(1) 中間表是存放統(tǒng)計(jì)分析數(shù)據(jù)的表,它是為數(shù)據(jù)倉(cāng)庫(kù)、輸出報(bào)表或查詢結(jié)果而設(shè)計(jì)的,有時(shí)它沒有主鍵與外鍵(數(shù)據(jù)倉(cāng)庫(kù)

6、除外)。(2) 臨時(shí)表是程序員個(gè)人設(shè)計(jì)的,存放臨時(shí)記錄,為個(gè)人所用。(3) 基表和中間表由DBA維護(hù),臨時(shí)表由程序員自己用程序自動(dòng)維護(hù)。n關(guān)系是一個(gè)由行和列組成的二維表,不一定結(jié)構(gòu)良好,特征為:行包括實(shí)體的數(shù)據(jù),列包含實(shí)體性質(zhì)的數(shù)據(jù),表中的單元格存儲(chǔ)單個(gè)值,每列的所有實(shí)體類型一致,每列具有唯一名稱,列的順序任意,行的順序任意,任意兩行互不重復(fù)。這是最大的復(fù)合關(guān)系模式的條件,符合這個(gè)要求的表就是關(guān)系型表格。n通過E-R圖將這些概念反映出來,通過名詞性和動(dòng)詞性,完全可以描述客觀世界,其中名詞性描述實(shí)體,動(dòng)詞性描述聯(lián)系或動(dòng)作影響,通過動(dòng)詞性將不同的實(shí)體關(guān)聯(lián)在一起第一目標(biāo)或者叫基礎(chǔ)目標(biāo):統(tǒng)計(jì),匯總及分

7、析報(bào)表的工作盡量地自動(dòng)用Excel或Spreadsheet做,幾乎不需人為干預(yù)目錄目錄n E-R模型的概念與表示n 實(shí)體-聯(lián)系方法(概念模型及設(shè)計(jì),關(guān)注現(xiàn)實(shí)世界)n 關(guān)系模式的規(guī)范化(消除數(shù)據(jù)冗余,避免操作異常)n E-R圖向關(guān)系表(Schema)的轉(zhuǎn)換(邏輯模型及設(shè)計(jì),關(guān)注信息世界)n 多維模式與統(tǒng)計(jì)分析的關(guān)系n Excel或Spreadsheet在統(tǒng)計(jì)分析中的角色n 統(tǒng)計(jì)分析系統(tǒng)(多維模式建構(gòu))的演進(jìn)n 終極目標(biāo):Ad-hoc報(bào)表系統(tǒng)關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義關(guān)于現(xiàn)實(shí)世界事實(shí)及描述的定義n 事實(shí)包括以下四個(gè)方面: 第一:事實(shí)是指“某物具有某種性質(zhì)或某些事物具有某種關(guān)系?!?與原子命題、分

8、子命題的分類相對(duì)應(yīng),事實(shí)可以分為原子事實(shí)、分子事實(shí)。其中,原子事實(shí)是最基本、最簡(jiǎn)單的事實(shí),從中不能再析出其它事實(shí);分子事實(shí)是原子事實(shí)的復(fù)合 第二:事實(shí)具有客觀性。“大多數(shù)的事實(shí)的存在都不依靠我們的意愿;這就是為什么我們把它們叫作嚴(yán)峻的、不肯遷就的或不可抗拒的理由。大部分物理事實(shí)的存在不僅不依靠我們的意愿,而且也不依靠我們的存在” 第三:現(xiàn)實(shí)世界由各種各樣的事實(shí)組合而成,事實(shí)屬于現(xiàn)實(shí)世界 第四:事實(shí)決定命題的真?zhèn)?,“事?shí)是使得命題為真或?yàn)榧俚臇|西”。具體說來,原子命題的真假取決于它是否與原子事實(shí)相符合,分子命題的真假取決于組成它的原子命題的真假n 現(xiàn)實(shí)世界的語(yǔ)義描述的存在 第一:原子命題 第二:

9、分子命題 第三:段落(由多個(gè)邏輯緊密相關(guān)的分子命題構(gòu)成) 第四:主題(由多個(gè)邏輯緊密相關(guān)的段落構(gòu)成)E-RE-R模型的概念與表示模型的概念與表示n E-R圖也稱實(shí)體-聯(lián)系圖(Entity Relationship Diagram),提供了表示實(shí)體類型、實(shí)體屬性和相關(guān)實(shí)體之間聯(lián)系(三個(gè)要素)的方法,用來描述現(xiàn)實(shí)世界的概念模型n 關(guān)系數(shù)據(jù)庫(kù)使用實(shí)體-聯(lián)系模型(E-R模型)進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì),以構(gòu)造信息世界的邏輯模型。E-R數(shù)據(jù)庫(kù)設(shè)計(jì)工具提供了一個(gè)“方框與箭頭”的繪圖工具,幫助數(shù)據(jù)庫(kù)用戶建立E-R圖來描繪數(shù)據(jù),邏輯及現(xiàn)實(shí)世界n E-R圖可以手繪,亦可以借用Case工具(Power Designer,Vi

10、sio或SQL Power Architect)做出n 考察單獨(dú)的一個(gè)聯(lián)系(動(dòng)詞類型的語(yǔ)義連接及構(gòu)造能力),聯(lián)系及相互關(guān)聯(lián)的實(shí)體形成的一個(gè)描述,構(gòu)造了一個(gè)最基本的原子命題E-RE-R模型的概念與表示模型的概念與表示實(shí)體集-語(yǔ)義(名詞類性)n 實(shí)體(Entity)n 事物就是在行動(dòng)影響下物質(zhì)本身的改變,或者進(jìn)行??陀^存在并可相互區(qū)別的事物稱為實(shí)體。實(shí)體可以是具體的,也可以是抽象的概念或聯(lián)系。n 具有共性的一類實(shí)體可歸類為一個(gè)實(shí)體集(Entity set)。n 屬性(Attribute)n 實(shí)體所具有的某一特性稱為屬性。n 一個(gè)實(shí)體可以由若干個(gè)屬性來刻畫。n 域(Domain)n 屬性的取值范圍或

11、類型。n 鍵或標(biāo)識(shí)符(Key)n 標(biāo)識(shí)符是實(shí)體中一個(gè)或多個(gè)屬性的集合,可用來唯一標(biāo)識(shí)實(shí)體中的一個(gè)實(shí)例。每個(gè)實(shí)體都必須至少有一個(gè)標(biāo)識(shí)符。如果實(shí)體只有一個(gè)標(biāo)識(shí)符,則它為實(shí)體的主標(biāo)識(shí)符。如果實(shí)體有多個(gè)標(biāo)識(shí)符,則其中一個(gè)被指定為主標(biāo)識(shí)符,其余的標(biāo)識(shí)符就是次標(biāo)識(shí)符(候選標(biāo)識(shí)符)E-RE-R模型的概念與表示模型的概念與表示聯(lián)系集-語(yǔ)義(動(dòng)詞類型)n 實(shí)體之間可以通過聯(lián)系來相互關(guān)聯(lián)。與實(shí)體和實(shí)體集對(duì)應(yīng),聯(lián)系也可以分為聯(lián)系和聯(lián)系集,聯(lián)系集是實(shí)體集之間的聯(lián)系,聯(lián)系是實(shí)體之間的聯(lián)系,聯(lián)系是具有方向性的。n 聯(lián)系具有方向性,每個(gè)方向上都有一個(gè)基數(shù)。n 聯(lián)系的兩個(gè)方向上各自包含有一角色名,描述該方向聯(lián)系的作用。n 按

12、照實(shí)體類型中實(shí)例之間的數(shù)量對(duì)應(yīng)關(guān)系,通??蓪⒙?lián)系分為4個(gè)基本聯(lián)系分為類,即一對(duì)一(ONE TO ONE)聯(lián)系、一對(duì)多(ONE TO MANY)聯(lián)系、多對(duì)一(MANY TO ONE)聯(lián)系和多對(duì)多聯(lián)系(MANY TO MANY)。n 三個(gè)特殊聯(lián)系n 每個(gè)實(shí)體類型都有自己的標(biāo)識(shí)符,如果兩個(gè)實(shí)體集之間發(fā)生聯(lián)系,其中一個(gè)實(shí)體類型的標(biāo)識(shí)符進(jìn)入另一個(gè)實(shí)體類型并與該實(shí)體類型中的標(biāo)識(shí)符共同組成其標(biāo)識(shí)符時(shí),這種聯(lián)系則稱為標(biāo)定聯(lián)系,也叫依賴聯(lián)系。反之稱為非標(biāo)定聯(lián)系,也叫非依賴聯(lián)系。n 遞歸聯(lián)系是實(shí)體集內(nèi)部實(shí)例之間的一種聯(lián)系,通常形象地稱為自反聯(lián)系。同一實(shí)體類型中不同實(shí)體集之間的聯(lián)系也稱為遞歸聯(lián)系。E-RE-R模型的

13、概念與表示(使用模型的概念與表示(使用CaseCase工具時(shí)的圖符及事例)工具時(shí)的圖符及事例)E-RE-R模型的概念與表示模型的概念與表示E-R圖的設(shè)計(jì)步驟 n 第一步:針對(duì)特定的應(yīng)用,確定實(shí)體、屬性和實(shí)體間的聯(lián)系,畫出局部E-R圖。n 第二步:綜合各個(gè)局部E-R圖,產(chǎn)生反映數(shù)據(jù)庫(kù)整體概念的總體E-R圖。E-RE-R模型的概念與表示(手繪草圖事例)模型的概念與表示(手繪草圖事例)弱實(shí)體集n 有些實(shí)體集的所有屬性都不足以形成主碼,這樣的實(shí)體集稱為弱實(shí)體集(Weak Entity Set),依賴于其它實(shí)體集而存在。n 與此相對(duì),其屬性可以形成主碼的實(shí)體集稱為強(qiáng)實(shí)體集。n 弱實(shí)體集所依賴的實(shí)體集稱為

14、標(biāo)識(shí)實(shí)體集(identifying entity set),相應(yīng)的關(guān)系為標(biāo)識(shí)聯(lián)系(identifying relationship)。OrderItemdatestatuspaymentorder#item#tagIncludeE-RE-R模型的概念與表示模型的概念與表示n 弱實(shí)體集通常沒有主鍵。n 以訂單的分項(xiàng)為例,訂單項(xiàng)實(shí)體集可能有編號(hào)(局部的編號(hào))、商品名稱、數(shù)量、單價(jià)等屬性,但是這些屬性不足以識(shí)別一個(gè)定單項(xiàng),因?yàn)橥耆锌赡茉诹硗庖粡堄唵沃谐霈F(xiàn)相同的內(nèi)容。n 必須把訂單的關(guān)鍵字(如一個(gè)全局的訂單編號(hào))和定單項(xiàng)的局部編號(hào)結(jié)合起來才能標(biāo)示一個(gè)定單項(xiàng)。n 弱實(shí)體集的屬性中,用來與標(biāo)識(shí)實(shí)體集的鍵

15、結(jié)合以識(shí)別一個(gè)弱實(shí)體集的屬性稱為部分鍵(partial key)。n 弱實(shí)體集的主鍵=它的標(biāo)識(shí)實(shí)體集的鍵+它的部分鍵E-RE-R模型的概念與表示(手繪草圖事例)模型的概念與表示(手繪草圖事例)n E-R圖使用雙線矩形表示弱實(shí)體集,弱實(shí)體集與其標(biāo)識(shí)實(shí)體集之間的聯(lián)系用雙線菱形表示,弱實(shí)體集的部分鍵使用虛下劃線表示。OrderItemdatestatuspaymentorder #item #tagIncludeE-RE-R模型的概念與表示模型的概念與表示n實(shí)體集的層次關(guān)系n 現(xiàn)實(shí)世界中的很多概念之間都具體層次關(guān)系。 n E-R模型使用實(shí)體集間的繼承和ISA關(guān)系來描述這種概念間的層次關(guān)系n 實(shí)體集老

16、師或?qū)W生都繼承自實(shí)體集人,并且實(shí)體集老師或?qū)W生與實(shí)體集人之間都滿足ISA關(guān)系,即老師或?qū)W生都是人的一種。n ISA關(guān)系可以從兩個(gè)方向進(jìn)行設(shè)計(jì)n 從自上而下的方向,首先設(shè)計(jì)出人這一實(shí)體,然后根據(jù)屬性的不同,將兩種不同的人具體化(specification)為老師或者學(xué)生。n 從自下而上的方向,首先設(shè)計(jì)出老師或?qū)W生,然后將他們的共性提取出來,泛化(generalization)為人。E-RE-R模型的概念與表示模型的概念與表示n 層次關(guān)系的約束n 從子實(shí)體集之間是否相交角度,不相交(disjoin)泛化要求繼承自同一父輩的多個(gè)子實(shí)體集之沒有交集,重疊(overlapping)泛化則允許有交集。n

17、從泛化是否完全角度,全參與泛化要求所有父輩實(shí)體都必須同時(shí)也是某一子輩實(shí)體,部分泛化則允許不是任何子輩實(shí)體的父輩實(shí)體存在。n 例如,在采用會(huì)員制的銷售系統(tǒng)中,顧客被分為會(huì)員(VIP)與非會(huì)員(NONVIP)兩種,會(huì)員擁有消費(fèi)積分(credit),非會(huì)員擁有固定的折扣率(discount)。一個(gè)顧客要么是會(huì)員、要么是非會(huì)員,二者必取其一,因此為全參與不相交。E-RE-R模型的概念與表示(手繪草圖事例)模型的概念與表示(手繪草圖事例)CustomerISAVIPNONVIPcreditdiscountdisjoincustomer #namegenderbirthdaycityaddressemai

18、lE-RE-R圖符(手繪草圖事例)圖符(手繪草圖事例)EAEARA實(shí)體集屬性弱實(shí)體集多值屬性聯(lián)系集導(dǎo)出屬性R弱實(shí)體集的確定聯(lián)系集A主鍵A弱實(shí)體集的區(qū)別屬性R多對(duì)多聯(lián)系R多對(duì)一聯(lián)系R一對(duì)一聯(lián)系RE實(shí)體集在聯(lián)系中的全參與ISA泛化或特殊化ISA不相交泛化disjoinISA全參與泛化RE角色指示標(biāo)示角色名RE重復(fù)次數(shù)約定1.h實(shí)體實(shí)體- -聯(lián)系方法聯(lián)系方法實(shí)體還是屬性n 凡是滿足以下兩條準(zhǔn)則的事物,一般均可作為屬性對(duì)待。 n 作為屬性,不能再具有需要描述的性質(zhì)。屬性必須是不可分的數(shù)據(jù)項(xiàng),不能包含其他屬性。n 屬性不能與其他實(shí)體具有聯(lián)系,即E-R圖中所表示的聯(lián)系是實(shí)體之間的聯(lián)系。n 例如書籍是一個(gè)實(shí)

19、體,書號(hào)、書名、作者、出版社、定價(jià)是書籍的屬性,如果應(yīng)用系統(tǒng)不再需要作者的其他信息,如電話、住址、個(gè)人主頁(yè)等,那么根據(jù)原則1可以將作者作為書籍的屬性對(duì)待。但是如果這些信息是必須的,那么作者作為一個(gè)實(shí)體看待更為恰當(dāng)。實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例) bookisbntitlepricepresswritten_bynameauthorauthorcityserial bookisbntitlepricepressauthor實(shí)體實(shí)體- -聯(lián)系方法聯(lián)系方法實(shí)體還是聯(lián)系n 一般來說,實(shí)體對(duì)應(yīng)現(xiàn)實(shí)世界中實(shí)際存在的事物,是名詞類型;聯(lián)系對(duì)應(yīng)的概念一般是一種動(dòng)作,是動(dòng)詞類型。

20、n 例如:n 書和作者都是現(xiàn)實(shí)世界中的名詞,因此作為實(shí)體。n 而written_by表示作者寫書這一動(dòng)作,因此作為聯(lián)系。n 映射基數(shù)往往影響到一個(gè)概念是作為實(shí)體還是聯(lián)系的選擇。 n 若一項(xiàng)貸款只能由一個(gè)分行發(fā)放,并且只能由一個(gè)客戶借貸,則將Loan作為Customer與Branch之間的聯(lián)系比較合適。n 但如果允許多個(gè)客戶共同借貸同一項(xiàng)貸款 ,在這種情況下,將Loan作為實(shí)體。實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)二元關(guān)系還是多元關(guān)系n 數(shù)據(jù)庫(kù)中使用得最多的是二元聯(lián)系。n 通常,將多元關(guān)系轉(zhuǎn)換為二元關(guān)系。n 如學(xué)校選課系統(tǒng),涉及到學(xué)生、教室、教師、課程等多個(gè)實(shí)體,可表示

21、為一個(gè)四元關(guān)系。 學(xué)生學(xué)生上課上課教室教室教師教師課程課程學(xué)生學(xué)生選課選課課程課程授課授課教師教師地點(diǎn)地點(diǎn)教室教室實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)n 但也有一些情況下使用多元聯(lián)系更好(如需要表達(dá)多個(gè)實(shí)體集間的約束時(shí))n 如學(xué)校選課系統(tǒng)中若一門課程可由多個(gè)教師教授,并且若課程和教師確定,則上課的地點(diǎn)也隨之確定。教師課程教室上課實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)聯(lián)系屬性的放置n 影響聯(lián)系屬性放置的主要因素是聯(lián)系的映射基數(shù)。n 對(duì)于一對(duì)一或一對(duì)多聯(lián)系,選擇作為聯(lián)系屬性或?qū)嶓w屬性只是體現(xiàn)語(yǔ)義側(cè)重點(diǎn)的不同 n 如銷售系統(tǒng)需要記錄顧客(Custom

22、er)與訂單(Order)之間的關(guān)系(Possess)。由于一個(gè)訂單只能由一個(gè)顧客所有,因此為顧客與訂單之間為一對(duì)多關(guān)系。這時(shí),記錄生成訂單日期的屬性(date)既可以作為聯(lián)系Possess的屬性,也可作為訂單的屬性。 OrderdatestatuspaymentorderPossesCustomer實(shí)體實(shí)體- -聯(lián)系方法(手繪草圖事例)聯(lián)系方法(手繪草圖事例)n 對(duì)于多對(duì)多聯(lián)系,聯(lián)系的屬性不能作為實(shí)體的屬性。n 如,顧客與希望書籍之間的聯(lián)系希望購(gòu)買(Wish_for)。n Wish_for有一屬性date,表示顧客發(fā)出購(gòu)買意向的日期,這一屬性不能作為參與聯(lián)系的兩個(gè)實(shí)體Customer或Boo

23、k的屬性。BookWish_forCustomerdate實(shí)例實(shí)例在線書店數(shù)據(jù)庫(kù)在線書店數(shù)據(jù)庫(kù)n 類似于Amazon的在線書店系統(tǒng)所用的數(shù)據(jù)庫(kù)n數(shù)據(jù)庫(kù)中要求存儲(chǔ)所有書籍的相關(guān)信息,并對(duì)書加以分類;n顧客的有關(guān)信息也要求存儲(chǔ)在數(shù)據(jù)庫(kù)中,并且允許用戶選擇自己感興趣的書籍類別及希望購(gòu)買的圖書;n顧客在決定購(gòu)買時(shí)可以發(fā)出訂單,同一訂單可以包含多種書,每種書可一次購(gòu)買多本。顧客在訂單中提供送貨地址,系統(tǒng)根據(jù)訂單發(fā)貨。實(shí)例在線書店數(shù)據(jù)庫(kù)E-R圖(手繪草圖事例)B o o kW r i t t e n _ b yA u t h o rt i t l ep r i c ep r e s sI S B Na u

24、 t h o r #n a m ec i t ys e r i a ly e a rB e l o n g _ t oC a t e g o r yc a t e g o r y #t a gC o n t a i ns u bs u p e rc u s t o m e r #n a m eg e n d e rb i r t h d a yc i t ya d d r e s se m a i lC u s t o m e rO r d e rI t e md a t es t a t u sp a y m e n to r d e r #i t e m #q t yI n c l u d

25、 en a m ea d d r e s sP o s s e s sI S AV I PN O N V I Pc r e d i td i s c o u n tF o u n d _ a tW i s h _ f o rI n t e r e s t _ i nd a t ed a t es t a t u sd i s j o i ns t o c k實(shí)例實(shí)例在線書店數(shù)據(jù)庫(kù)在線書店數(shù)據(jù)庫(kù)n 合并分E-R圖n 各分E-R圖之間的沖突主要有三類:n 屬性沖突 (1) 屬性域沖突,即屬性值的類型、取值范圍或取值集合不同。例如:屬性“訂單號(hào)”有的定義為字符型,有的為數(shù)值型。 (2) 屬性取值單位

26、沖突。例如:屬性“庫(kù)存”有的以冊(cè)為單位,有的以千冊(cè)為單位。 n 命名沖突 (1) 同名異義。不同意義對(duì)象相同名稱。例如:Author和Customer均有屬性name。 (2) 異名同義(一義多名)。同意義對(duì)象不相同名稱。例如:“項(xiàng)目”和“課題”。實(shí)例實(shí)例在線書店數(shù)據(jù)庫(kù)在線書店數(shù)據(jù)庫(kù)n 結(jié)構(gòu)沖突 (1) 同一對(duì)象在不同應(yīng)用中具有不同的抽象。例如: “作者”在某一局部應(yīng)用中被當(dāng)作實(shí)體,而在另一局部應(yīng)用中則被當(dāng)作屬性。 (2) 同一實(shí)體在不同局部視圖中所包含的屬性不完全相同,或者屬性的排列次序不完全相同。 (3) 實(shí)體之間的聯(lián)系在不同局部視圖中呈現(xiàn)不同的類型。例如:實(shí)體E1與E2在局部應(yīng)用A中是多

27、對(duì)多聯(lián)系,而在局部應(yīng)用B中是一對(duì)多聯(lián)系;又如在局部應(yīng)用X中E1與E2發(fā)生聯(lián)系,而在局部應(yīng)用Y中E1、E2、E3三者之間有聯(lián)系。 n 解決方法是根據(jù)應(yīng)用的語(yǔ)義對(duì)實(shí)體聯(lián)系的類型進(jìn)行綜合或調(diào)整。 關(guān)系模式關(guān)系模式n設(shè)計(jì)范式(范式,數(shù)據(jù)庫(kù)設(shè)計(jì)范式,數(shù)據(jù)庫(kù)關(guān)系表的設(shè)計(jì)范式)是符合某一種級(jí)別的關(guān)系模式的集合。構(gòu)造數(shù)據(jù)庫(kù)必須遵循一定的規(guī)則。在關(guān)系數(shù)據(jù)庫(kù)中,這種規(guī)則或者叫約束就是范式。關(guān)系數(shù)據(jù)庫(kù)中的關(guān)系必須滿足一定的要求,即滿足不同的范式n第一范式(1NF):在任何一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,第一范式(1NF)是對(duì)關(guān)系模式的基本要求,不滿足第一范式(1NF)的數(shù)據(jù)庫(kù)就不是關(guān)系數(shù)據(jù)庫(kù)。所謂第一范式(1NF)是指數(shù)據(jù)庫(kù)表的

28、每一列都是不可分割的基本數(shù)據(jù)項(xiàng),同一列中不能有多個(gè)值,即實(shí)體中的某個(gè)屬性不能有多個(gè)值或者不能有重復(fù)的屬性。如果出現(xiàn),就可能需要定義一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間為一對(duì)多關(guān)系n第二范式(2NF):數(shù)據(jù)庫(kù)表中不存在非關(guān)鍵字段對(duì)任一候選關(guān)鍵字段的部分函數(shù)依賴(部分函數(shù)依賴指的是存在組合關(guān)鍵字中的某些字段決定非關(guān)鍵字段的情況),也即所有非關(guān)鍵字段都完全依賴于任意一組候選關(guān)鍵字。如果存在,那么這個(gè)屬性和主關(guān)鍵字的這一部分應(yīng)該分離出來形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系n第三范式(3NF) :要求一個(gè)數(shù)據(jù)庫(kù)表中不包含已在其它表中已包含的非主關(guān)鍵字信息。例如,存在一個(gè)部門信息表,其中每個(gè)部門

29、有部門編號(hào)(dept_id)、部門名稱、部門簡(jiǎn)介等信息。那么在員工信息表中列出部門編號(hào)后就不能再將部門名稱、部門簡(jiǎn)介等與部門有關(guān)的信息再加入員工信息表中。如果不存在部門信息表,則根據(jù)第三范式(3NF)也應(yīng)該構(gòu)建它,否則就會(huì)有大量的數(shù)據(jù)冗余。如果存在,應(yīng)該分離這一部分出來形成一個(gè)新的實(shí)體,新實(shí)體與原實(shí)體之間是一對(duì)多的關(guān)系n關(guān)鍵要理解定義這種范式標(biāo)準(zhǔn)的主要目的是為了減少數(shù)據(jù)冗余,數(shù)據(jù)冗余產(chǎn)生的本質(zhì)就是在一個(gè)表中存在字段與字段之間的一對(duì)多,或者多對(duì)多關(guān)系。滿足這些規(guī)范的數(shù)據(jù)庫(kù)是簡(jiǎn)潔的、結(jié)構(gòu)明晰的,同時(shí),也不會(huì)發(fā)生插入(insert)、刪除(delete)和更新(update)操作異常。反之則是亂七八

30、糟,不僅給數(shù)據(jù)庫(kù)的編程人員制造麻煩,而且面目可憎,可能存儲(chǔ)了大量不需要的冗余信息。解決這個(gè)幾對(duì)幾的關(guān)系問題,就能輕易實(shí)現(xiàn)滿足第三范式的數(shù)據(jù)庫(kù)設(shè)計(jì)n思考題思考題:假定選課關(guān)系表為SelectCourse(學(xué)號(hào), 姓名, 年齡, 課程名稱, 成績(jī), 學(xué)分),關(guān)鍵字為組合關(guān)鍵字(學(xué)號(hào), 課程名稱),因?yàn)榇嬖谌缦聸Q定關(guān)系:(學(xué)號(hào), 課程名稱) (姓名, 年齡, 成績(jī), 學(xué)分) 這個(gè)數(shù)據(jù)庫(kù)表不滿足第二范式,因?yàn)榇嬖谌缦聸Q定關(guān)系:(課程名稱) (學(xué)分) (學(xué)號(hào)) (姓名, 年齡) 即存在組合關(guān)鍵字中的字段決定非關(guān)鍵字的情況。 n造成的潛在問題:造成的潛在問題: (1) 數(shù)據(jù)冗余: 同一門課程由n個(gè)學(xué)生選修

31、,“學(xué)分”就重復(fù)n-1次;同一個(gè)學(xué)生選修了m門課程,姓名和年齡就重復(fù)了m-1次。(2) 更新異常: 若調(diào)整了某門課程的學(xué)分,數(shù)據(jù)表中所有行的“學(xué)分”值都要更新,否則會(huì)出現(xiàn)同一門課程學(xué)分不同的情況。 (3) 插入異常:假設(shè)要開設(shè)一門新的課程,暫時(shí)還沒有人選修。這樣,由于還沒有“學(xué)號(hào)”關(guān)鍵字,課程名稱和學(xué)分也無法記錄入數(shù)據(jù)庫(kù)。 (4) 刪除異常: 假設(shè)一批學(xué)生已經(jīng)完成課程的選修,這些選修記錄就應(yīng)該從數(shù)據(jù)庫(kù)表中刪除。但是,與此同時(shí),課程名稱和學(xué)分信息也被刪除了。很顯然,這也會(huì)導(dǎo)致插入異常。 把選課關(guān)系表SelectCourse改為如下三個(gè)表:學(xué)生:Student(學(xué)號(hào), 姓名, 年齡); 課程:Co

32、urse(課程名稱, 學(xué)分);選課關(guān)系:SelectCourse(學(xué)號(hào), 課程名稱, 成績(jī))。 這樣的數(shù)據(jù)庫(kù)表是符合第二范式的, 消除了數(shù)據(jù)冗余、更新異常、插入異常和刪除異常。 另外,所有單關(guān)鍵字的數(shù)據(jù)庫(kù)表都符合第二范式,因?yàn)椴豢赡艽嬖诮M合關(guān)鍵字。 E-RE-R圖向關(guān)系模式的轉(zhuǎn)換及主題數(shù)據(jù)庫(kù)圖向關(guān)系模式的轉(zhuǎn)換及主題數(shù)據(jù)庫(kù)n通過實(shí)體聯(lián)系方法可以方便得得到現(xiàn)實(shí)世界的一個(gè)抽象模型,但這一模型并不能為數(shù)據(jù)庫(kù)管理系統(tǒng)接受。要完成從現(xiàn)實(shí)世界到信息世界的轉(zhuǎn)化,還必須將實(shí)體聯(lián)系方法所得的E-R圖轉(zhuǎn)化為關(guān)系表定義。n注意:一定要區(qū)分語(yǔ)義,包括名詞性和動(dòng)詞性。先是動(dòng)詞性,代表聯(lián)系集,其次是名詞性,代表聯(lián)系集的動(dòng)詞

33、性所依賴、影響和作用的實(shí)體集n分析并確定主題:主題數(shù)據(jù)庫(kù)是面向業(yè)務(wù),面向事務(wù),面向事實(shí)和事件的主題的數(shù)據(jù)組織存儲(chǔ),例如,企業(yè)中需要建立的典型的主題數(shù)據(jù)庫(kù)有:產(chǎn)品、客戶、零部件、供應(yīng)商、訂貨、員工、文件資料、工程規(guī)范等。其中產(chǎn)品、客戶、零部件等數(shù)據(jù)庫(kù)的結(jié)構(gòu),是對(duì)有關(guān)單證、報(bào)表的數(shù)據(jù)項(xiàng)進(jìn)行分析整理而設(shè)計(jì)的,不是按單證、報(bào)表的原樣建立的。這些主題數(shù)據(jù)庫(kù)與企業(yè)管理中要解決的主要問題相關(guān)聯(lián),而不是與通常的計(jì)算機(jī)應(yīng)用項(xiàng)目相關(guān)聯(lián)。n一個(gè)主題數(shù)據(jù)庫(kù)的科學(xué)的數(shù)據(jù)結(jié)構(gòu):是由多個(gè)達(dá)到“基本表” (Base Table)規(guī)范的數(shù)據(jù)實(shí)體構(gòu)成的,這些基本表具有如下的特性: 1)原子性基本表中的數(shù)據(jù)項(xiàng)是數(shù)據(jù)元素(即最小的、

34、不能再分解的信息單元); 2)演繹性可由基本表中的數(shù)據(jù)生成全部輸出數(shù)據(jù)(即這些基本表是精練的,經(jīng)過計(jì)算或操作(自動(dòng)化)處理可以產(chǎn)生全部企業(yè)管理所需要的數(shù)據(jù)); 3)規(guī)范性基本表中數(shù)據(jù)滿足三范式(3NF)要求,這是依據(jù)科學(xué)的、能滿足演繹性推算要求、并能保證快捷存取的數(shù)據(jù)結(jié)構(gòu)。實(shí)體的轉(zhuǎn)換實(shí)體的轉(zhuǎn)換 n 將一個(gè)普通實(shí)體(非弱實(shí)體)轉(zhuǎn)換為表定義是相當(dāng)直觀的,實(shí)體的每個(gè)屬性對(duì)應(yīng)表中的一個(gè)字段,實(shí)體的主鍵對(duì)應(yīng)表的主鍵。n 如Book實(shí)體轉(zhuǎn)化到表的結(jié)果為:n Book(isbn#, title, price, press, stock)聯(lián)系的轉(zhuǎn)換聯(lián)系的轉(zhuǎn)換n 一個(gè)多對(duì)多聯(lián)系在轉(zhuǎn)換后也對(duì)應(yīng)一個(gè)新的交叉實(shí)體表,

35、表中的屬性包括n 參與聯(lián)系各實(shí)體的主鍵n 聯(lián)系的描述屬性n 參與聯(lián)系各實(shí)體的主鍵之和構(gòu)成新的交叉實(shí)體表的超鍵。n 如多對(duì)多聯(lián)系Written_by轉(zhuǎn)化為表之后其主鍵將由參與該聯(lián)系的兩個(gè)實(shí)體Book和Author的主鍵構(gòu)成,如下:n Written_by(isbn#, author#, serial)聯(lián)系的轉(zhuǎn)換聯(lián)系的轉(zhuǎn)換n 一對(duì)一和一對(duì)多聯(lián)系n A與B之間是一對(duì)多聯(lián)系,不轉(zhuǎn)換為一張單獨(dú)的表,而只在B轉(zhuǎn)換后的表中增加A的主鍵屬性(當(dāng)然這些屬性將形成一個(gè)引用到A的主鍵的一個(gè)外鍵),以此表示某B實(shí)體所從屬的A實(shí)體。n 這種方法可以產(chǎn)生更少的表,有利于提高數(shù)據(jù)庫(kù)性能,還可以表達(dá)更多的約束 n 如對(duì)于聯(lián)系

36、Possess,將在Order表中增加一列customer#表示訂單從屬的顧客弱實(shí)體的轉(zhuǎn)換弱實(shí)體的轉(zhuǎn)換 n 由于弱實(shí)體總是全參與它與它的標(biāo)識(shí)實(shí)體之間的多對(duì)一聯(lián)系,因此可以采用上面提出的一對(duì)多聯(lián)系方法進(jìn)行轉(zhuǎn)換。n 弱實(shí)體轉(zhuǎn)換后生成的表的主鍵由標(biāo)識(shí)實(shí)體的主鍵與弱實(shí)體本身的部分鍵組合而成。n 如弱實(shí)體Item轉(zhuǎn)換后,構(gòu)成如下:n Item(order# ,item# , isbn ,qty)實(shí)體層次的轉(zhuǎn)換實(shí)體層次的轉(zhuǎn)換 n 將實(shí)體層次轉(zhuǎn)換為表定義時(shí)可采用兩種方法n 父輩實(shí)體與子輩實(shí)體都轉(zhuǎn)換為單獨(dú)的表通用方法,任何情況適用。n 每一個(gè)子輩實(shí)體轉(zhuǎn)換為單獨(dú)的表,其中既包含各子輩實(shí)體的特殊屬性,也包含子輩與

37、父輩實(shí)體的公有屬性。只適用全參與泛化,因無法比哦啊是不從屬于任何子輩實(shí)體的父輩實(shí)體n 如Customer與VIP、NONVIP之間的全參與泛化可用第二種方法轉(zhuǎn)換為:VIP(customer#,name,gender,birthday,city,address,email,credit)NONVIP( customer# ,name,gender,birthday,city,address,email,discount)一些實(shí)際的考慮一些實(shí)際的考慮n 一般來說,在將E-R圖轉(zhuǎn)換到關(guān)系表定義的過程中,需要考慮兩個(gè)實(shí)際的問題:性能與數(shù)據(jù)規(guī)范化。n 提高數(shù)據(jù)庫(kù)性能的一個(gè)重要方法是進(jìn)行數(shù)據(jù)冗余,不要跨表

38、進(jìn)行處理。n 用一個(gè)表記錄所有父子實(shí)體,而用一個(gè)字段來表示實(shí)體的類型。n 請(qǐng)大家依據(jù)關(guān)系模式規(guī)范化理論討論如下實(shí)體是否要拆分成不同的實(shí)體集和聯(lián)系集,還是不拆分:例如:Customer( customer# ,name,gender,birthday,city,address,email,credit,discount,customer-type)在線書店數(shù)據(jù)庫(kù)及關(guān)系模式在線書店數(shù)據(jù)庫(kù)及關(guān)系模式n Book(isbn#,title,price,press,stock)n Author(author# ,name,city)n Written_by(isbn,author# ,serial)n C

39、ategory(category# ,super# ,tag)n Customer( customer# ,name,gender,birthday,city,address,email,credit,discount,customer_type)n Interest_in(customer# ,category# ,date)n Wish_for(customer# ,isbn# ,date,status)n Order(order# ,customer# ,date,status,payment,name,address)n Item(item# ,order# ,isbn,qty)思考題

40、思考題n 電話計(jì)費(fèi)系統(tǒng)關(guān)于不同業(yè)務(wù)或叫特殊功能需求,比如:國(guó)內(nèi)長(zhǎng)途,港澳長(zhǎng)途,國(guó)際長(zhǎng)途等,如何設(shè)計(jì)數(shù)據(jù)庫(kù)滿足:n 表結(jié)構(gòu)不變,永遠(yuǎn)滿足需求,比如:減少業(yè)務(wù),增加業(yè)務(wù)n 基于類似Excel表格的設(shè)計(jì)和基于E-R圖實(shí)體聯(lián)系模型(關(guān)系模式/模型)的設(shè)計(jì)比較數(shù)據(jù)的統(tǒng)計(jì)分析及報(bào)表的展示功能數(shù)據(jù)的統(tǒng)計(jì)分析及報(bào)表的展示功能n 報(bào)表展示與制作是面向業(yè)務(wù)統(tǒng)計(jì)分析人員的最終體驗(yàn),是最高層的數(shù)據(jù)統(tǒng)計(jì)分析應(yīng)用的需求和表達(dá)n真實(shí)例子展開(Practical Data Warehouse and Business Intelligence Insights)n單主題1)加拿大電信2007年的年度銷售報(bào)表(1)2)加拿大電

41、信2007年的季度銷售報(bào)表(4)3)加拿大電信2007年的月度銷售報(bào)表(12)4)加拿大電信2007年每省的年度銷售報(bào)表(10)5)加拿大電信2007年的每省的季度銷售報(bào)表(40)6)加拿大電信2007年的每省的月度銷售報(bào)表(120)7)若每省有十個(gè)縣,則需要報(bào)表10*12*10=1200 n多主題這樣如果一個(gè)主題像上面的報(bào)表需求量,則有多少主題,報(bào)表數(shù)量是冪乘數(shù)的關(guān)系,尤其是同比和環(huán)比這樣的統(tǒng)計(jì)需求n工作場(chǎng)景描述(Just Build It) 1)新建報(bào)表時(shí),大多數(shù)人都是使用Microsoft Excel利用原有已經(jīng)被Excel表格加工過的數(shù)據(jù),很少使用初始規(guī)范化的數(shù)據(jù)源2)一個(gè)報(bào)表因?yàn)榧庸?/p>

42、過的而造成的數(shù)據(jù)分散,需要多個(gè)業(yè)務(wù)人員協(xié)作完成3)多人協(xié)作時(shí)數(shù)據(jù)不一致,數(shù)據(jù)不規(guī)范嚴(yán)重影響工作進(jìn)度n 解決方案n使用多維建模方法論,建立以業(yè)務(wù)事件為導(dǎo)向的以主題(統(tǒng)計(jì)分析涉及的不同領(lǐng)域數(shù)據(jù))為相關(guān)的事實(shí)表庫(kù)(統(tǒng)計(jì)分析涉及不同數(shù)據(jù)事件模型),通過對(duì)多維模型的鉆取、切取、旋轉(zhuǎn)等操作實(shí)現(xiàn)報(bào)表的動(dòng)態(tài)化和個(gè)性化,消除眾多關(guān)聯(lián)的中間報(bào)表,以實(shí)現(xiàn)Ad-hoc報(bào)表(自動(dòng)化程度高的報(bào)表)n逐步從依賴類似Microsoft Excel(分散部署,數(shù)據(jù)不一致及不規(guī)范的始作俑者)表格過渡到多維統(tǒng)計(jì)分析到數(shù)據(jù)集市再到數(shù)據(jù)倉(cāng)庫(kù)的路線ExcelExcel報(bào)表與事實(shí)表的相互轉(zhuǎn)換關(guān)系報(bào)表與事實(shí)表的相互轉(zhuǎn)換關(guān)系單一的Excel列

43、表,有數(shù)據(jù)冗余,存在增刪改的異常Excel報(bào)表,依據(jù)習(xí)慣行為建立,沒有考慮增刪改的操作關(guān)聯(lián)的Excel列表,消除數(shù)據(jù)冗余,增刪改的異常不存在例如:多種產(chǎn)品只能放在一個(gè)倉(cāng)庫(kù)中,一個(gè)倉(cāng)庫(kù)有多個(gè)管理員。構(gòu)造關(guān)系模式(倉(cāng)庫(kù)管理員,倉(cāng)庫(kù)號(hào),庫(kù)存產(chǎn)品號(hào)),存在數(shù)據(jù)冗余,重新構(gòu)造或修改為相互關(guān)聯(lián)的關(guān)系模式(倉(cāng)庫(kù)號(hào),倉(cāng)庫(kù)管理員),(倉(cāng)庫(kù)號(hào),庫(kù)存產(chǎn)品號(hào))思考:(系名,教師名,學(xué)生名)存在數(shù)據(jù)冗余嗎,怎樣修改或構(gòu)造實(shí)際上相互關(guān)聯(lián)的關(guān)系模式(E-R模型或主題數(shù)據(jù)庫(kù))記錄了操作影響的單一事務(wù)或形成了一個(gè)事件,事件將多個(gè)實(shí)體關(guān)聯(lián)在一起,這是業(yè)務(wù)操作型數(shù)據(jù)庫(kù)系統(tǒng)的最為顯著的特征,事件構(gòu)成了事實(shí),事實(shí)形成了主題(主題數(shù)據(jù)庫(kù)

44、),可以被度量(統(tǒng)計(jì)分析)。理論上通過集合論的關(guān)系運(yùn)算,可以得到任意統(tǒng)計(jì)分析結(jié)果,所以相對(duì)完美的解決方案是逆序,不要按習(xí)慣先做報(bào)表,有了問題(增刪改異常及新的查詢需求)才回溯數(shù)據(jù)源表:駐留在操作型關(guān)系數(shù)據(jù)庫(kù)端中間表:駐留在操作型關(guān)系數(shù)據(jù)庫(kù)端或被倒出,駐留在Excel端統(tǒng)計(jì)分析表:駐留在Excel端多維模式多維模式(OLAP)(OLAP)的星型和雪花模型的星型和雪花模型n多維模式:由一個(gè)事實(shí)表(Fact Table)和一組維表(Dimension Table)組成。每個(gè)維表都有一個(gè)維作為主鍵,所有這些維的主鍵組合成事實(shí)表的主鍵。事實(shí)表的非主鍵屬性稱為事實(shí)(Fact),它們一般都是數(shù)值或其他可以進(jìn)

45、行計(jì)算的數(shù)據(jù);而維表大都是文字、時(shí)間等類型的數(shù)據(jù),按這種方式組織好數(shù)據(jù)我們就可以按照不同的維(事實(shí)表主鍵的部分或全部)來對(duì)這些事實(shí)數(shù)據(jù)進(jìn)行求和(summary)、求平均(average)、計(jì)數(shù)(count)、百分比(percent)的聚集計(jì)算,甚至可以做2080分析。這樣就可以從不同的角度的數(shù)據(jù)來分析單一業(yè)務(wù)主題的事件情況n當(dāng)所有維表都直接連接到事實(shí)表上時(shí),將該模型稱為星型模型n當(dāng)有一個(gè)或多個(gè)維表沒有直接連接到事實(shí)表上,而是通過其他維表連接到事實(shí)表上時(shí),將該模型稱為雪花模型。雪花模型是對(duì)星型模型的維表進(jìn)一步層次化的結(jié)果多維模式多維模式(OLAP)(OLAP)的基本操作類型的基本操作類型n 鉆取

46、(Drill-up和Drill-down) Drill-up是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù),或者減少維數(shù)。Drill-down則相反,它從匯總數(shù)據(jù)深入到細(xì)節(jié)數(shù)據(jù)進(jìn)行觀察或增加新維。鉆取報(bào)表是指用戶通過單擊其他報(bào)表中的鏈接打開的報(bào)表。鉆取報(bào)表通常包含某原始匯總報(bào)表中所包含的某項(xiàng)的詳細(xì)信息n 切取(Slice和Dice) 切片(Slice)和切塊(Dice是在一部分維上選定值后,關(guān)心度量數(shù)據(jù)在剩余維上的分布。如果剩余的維只有兩個(gè),則是切片。如果有三個(gè)或以上,則是切塊n 透視(Pivot) Pivot是變換維的方向,即在表格中重新安排維的放置(例如行列互換)。透視是模型中跟蹤不

47、同數(shù)據(jù)集的對(duì)象的子集。通常為特定的用戶組或業(yè)務(wù)方案定義透視,從而便于導(dǎo)航大型數(shù)據(jù)集。在透視中,表、列和度量值(包括 KPI)定義為字段對(duì)象??梢赃x擇將在各透視中包括的字段。例如,單個(gè)模型可以包含產(chǎn)品、銷售、財(cái)務(wù)、員工和地理數(shù)據(jù)。在銷售部要求產(chǎn)品、銷售、促銷和地理數(shù)據(jù)時(shí),可能不需要員工和財(cái)務(wù)數(shù)據(jù)。同樣,人力資源部門不需要與銷售促銷和地理有關(guān)的數(shù)據(jù)n 注意:請(qǐng)關(guān)注這些術(shù)語(yǔ)和英語(yǔ)專用詞多維模式多維模式(OLAP)(OLAP)的基本操作類型事例的基本操作類型事例ExcelExcel表格和關(guān)系模式表格和關(guān)系模式( (規(guī)范化表規(guī)范化表) )的關(guān)系的關(guān)系nExcel表格和Excel列表的區(qū)別 Microso

48、ft Web(Microsoft Web(微軟官網(wǎng)) Excel Excel 列表注釋列表注釋 Excel列表是 Excel 2003 中的新增功能。列表是您可以與較大的工作表獨(dú)立開來而單獨(dú)進(jìn)行操作的一部分工作表,這樣操作對(duì)周圍任何數(shù)據(jù)都沒有影響。例如,可以添加數(shù)據(jù)、對(duì)數(shù)據(jù)進(jìn)行排序、重新排列列表中的行,而不影響周圍的單元格。Excel 列表還可以加快工作速度,因?yàn)樗峁┝艘唤M數(shù)據(jù)操作工具,包括“自動(dòng)篩選”按鈕和一組聚合函數(shù),可以從同一位置使用這些聚合函數(shù)。同時(shí)還可以使用 Excel 列表從不同的外部數(shù)據(jù)源(關(guān)系模式)創(chuàng)建數(shù)據(jù)透視表(Pivot)。右面是一個(gè)典型的 Excel 2003 列表 是

49、 “自動(dòng)篩選自動(dòng)篩選”按鈕按鈕:該按鈕會(huì)自動(dòng)顯示,它們所提供的功能與早期版本的 Excel 功能相同。您可以使用該按鈕快速對(duì)數(shù)據(jù)進(jìn)行排序和篩選、查找高低值等等是邊框邊框:邊框?qū)⒘斜碇械膯卧衽c周圍數(shù)據(jù)區(qū)分開是“插入插入”行行:星號(hào)表示行。您可以直接在該行的單元格中鍵入數(shù)據(jù),列表會(huì)自動(dòng)調(diào)整大小以容納新數(shù)據(jù)是“匯總匯總”行行:單擊此行中的某個(gè)單元格可以從聚合函數(shù)列表中進(jìn)行選擇。您可以使用“列表列表”工具欄顯示或隱藏“匯總”行。當(dāng)您顯示“匯總”行時(shí),如果右側(cè)的列中包含數(shù)字?jǐn)?shù)據(jù),Excel 會(huì)將該列中的數(shù)據(jù)自動(dòng)進(jìn)行相加是聚合函數(shù)聚合函數(shù):選擇某個(gè)函數(shù)以將其插入到“匯總”行中選定的單元格。您不必手動(dòng)輸入

50、該函數(shù),這樣您可以在更短的時(shí)間內(nèi)更準(zhǔn)確地添加計(jì)算是調(diào)整手柄調(diào)整手柄:通過拖動(dòng)該手柄可以修改列表的大小ExcelExcel列表與多維模式列表與多維模式(OLAP)(OLAP)的關(guān)系的關(guān)系n在Excel中,在沒有連接任何OLAP數(shù)據(jù)源的情況下,也支持旋轉(zhuǎn)透視表(Pivot),這算是一種非常簡(jiǎn)易的OLAP前端(微軟官網(wǎng))nOLAP是為了提高檢索數(shù)據(jù)的速度。因?yàn)樵趧?chuàng)建或更改報(bào)表時(shí),會(huì)計(jì)算匯總值,這樣就只有較少數(shù)據(jù)送到 Excel 中。此方法使得可以處理的源數(shù)據(jù)比使用傳統(tǒng)數(shù)據(jù)庫(kù)組織的數(shù)據(jù)更多。因?yàn)閷?duì)于傳統(tǒng)數(shù)據(jù)庫(kù),Excel 必須先檢索所有單個(gè)記錄后,再計(jì)算匯總值(微軟官網(wǎng))n在 Excel 中的 OLAP 和非 OLAP 數(shù)據(jù)透視表的區(qū)別(微軟官網(wǎng))ExcelExcel列表與列表與ExcelExcel數(shù)據(jù)透視表的關(guān)系數(shù)據(jù)透視表的關(guān)系n 用戶可以從

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論