數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)_第1頁
數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)_第2頁
數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)_第3頁
數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)_第4頁
數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)第8章數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)

本章導(dǎo)讀數(shù)據(jù)庫是計(jì)算機(jī)科學(xué)技術(shù)中發(fā)展最快,應(yīng)用最廣泛的重要分支之一,它已經(jīng)成為計(jì)算機(jī)信息系統(tǒng)和計(jì)算機(jī)應(yīng)用系統(tǒng)的重要技術(shù)基礎(chǔ)和支柱。探究其發(fā)展的基礎(chǔ)可以涉及到兩種源動力。一種是方法論的發(fā)展,其中較為典型的代表是:面向?qū)ο髷?shù)據(jù)庫(OODB)技術(shù)、分布式數(shù)據(jù)庫(DDB)技術(shù)和多媒體數(shù)據(jù)庫(MDB)技術(shù)的發(fā)展和形成;另一種是數(shù)據(jù)庫技術(shù)與相關(guān)技術(shù)的有機(jī)結(jié)合,如主動數(shù)據(jù)庫、并行數(shù)據(jù)庫、工程數(shù)據(jù)庫、時態(tài)數(shù)據(jù)庫、模糊數(shù)據(jù)庫、演繹數(shù)據(jù)庫、統(tǒng)計(jì)數(shù)據(jù)庫、空間數(shù)據(jù)庫、知識庫和科學(xué)與文獻(xiàn)數(shù)據(jù)庫等,它們都是特定技術(shù)領(lǐng)域的知識通過數(shù)據(jù)庫技術(shù),實(shí)現(xiàn)對特定數(shù)據(jù)對象的計(jì)算機(jī)管理并實(shí)現(xiàn)對被管理數(shù)據(jù)對象的操作。仲愷農(nóng)業(yè)工程學(xué)院第8章數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)本章要點(diǎn)數(shù)據(jù)庫技術(shù)發(fā)展的主要特點(diǎn)新一代數(shù)據(jù)庫技術(shù)的特點(diǎn)掌握數(shù)據(jù)模型的發(fā)展面向應(yīng)用的數(shù)據(jù)庫新技術(shù)仲愷農(nóng)業(yè)工程學(xué)院第8章數(shù)據(jù)庫技術(shù)發(fā)展動態(tài)8.1面向?qū)ο髷?shù)據(jù)庫系統(tǒng)

8.2分布式數(shù)據(jù)庫系統(tǒng)8.3并行數(shù)據(jù)庫系統(tǒng)

8.4其他數(shù)據(jù)庫

8.5數(shù)據(jù)倉庫

本章小結(jié)仲愷農(nóng)業(yè)工程學(xué)院8.1面向?qū)ο髷?shù)據(jù)庫系統(tǒng)8.1.1面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的基本概念8.1.2面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的特征8.1.3面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的查詢8.1.4面向?qū)ο髷?shù)據(jù)庫系統(tǒng)的并發(fā)控制8.1.5面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng)OODBMS仲愷農(nóng)業(yè)工程學(xué)院8.2分布式數(shù)據(jù)庫系統(tǒng)

8.2.1分布式數(shù)據(jù)庫及其分類1.分布式數(shù)據(jù)庫(DistributedDataBase,DDB)分布式數(shù)據(jù)庫是計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中各場地(Site)或節(jié)點(diǎn)(Node)上數(shù)據(jù)庫的邏輯集合。它是一組結(jié)構(gòu)化的數(shù)據(jù)集合,邏輯上屬于同一系統(tǒng),而物理上分布在計(jì)算機(jī)網(wǎng)絡(luò)的不同節(jié)點(diǎn)上,具有分布性和邏輯協(xié)調(diào)性的特點(diǎn)。分布性是指數(shù)據(jù)不是存放在單一場地為單個計(jì)算機(jī)配置的存儲設(shè)備上,而是按全局需要將數(shù)據(jù)劃分成一定結(jié)構(gòu)的數(shù)據(jù)子集,分散地存儲在各個場地(節(jié)點(diǎn))上。邏輯協(xié)調(diào)性是指各場地上的數(shù)據(jù)子集,相互間由嚴(yán)密的約束規(guī)則加以限定,而在邏輯上是一個整體。實(shí)際上,基于以上兩個特性的DDB是虛擬的、邏輯的,即是由許多LDB邏輯組織而成的,它是針對于全體用戶的、全局的數(shù)據(jù)庫。仲愷農(nóng)業(yè)工程學(xué)院8.2.1分布式數(shù)據(jù)庫及其分類2.分布式數(shù)據(jù)庫的分類分布式數(shù)據(jù)庫的類型很多,根據(jù)不同的準(zhǔn)則,有不同的分類方法。我們從數(shù)據(jù)冗余、全局?jǐn)?shù)據(jù)庫的構(gòu)成、數(shù)據(jù)庫分級結(jié)構(gòu)和本地?cái)?shù)據(jù)庫的配置等方面對它們分類。(1)按數(shù)據(jù)冗余分類,全局分布數(shù)據(jù)庫的數(shù)據(jù)分布到網(wǎng)絡(luò)中各結(jié)點(diǎn)時,會有如下情況:完全復(fù)制型、完全分割型、子集復(fù)制型、子集分布型。(2)按全局?jǐn)?shù)據(jù)庫的構(gòu)成分類:同構(gòu)型分布數(shù)據(jù)庫、異構(gòu)型分布數(shù)據(jù)庫。(3)按本地?cái)?shù)據(jù)庫的配置方式可分成:可分布訪問的集中數(shù)據(jù)庫、中心數(shù)據(jù)庫加專用數(shù)據(jù)庫、多級分布數(shù)據(jù)庫、水平分布數(shù)據(jù)庫。(4)按本地?cái)?shù)據(jù)庫的數(shù)據(jù)是否全部集成到全局?jǐn)?shù)據(jù)庫中分類:對等型分布數(shù)據(jù)庫(Peer-to-PeerDBS)、多數(shù)據(jù)庫系統(tǒng)(Multi-DBS)。仲愷農(nóng)業(yè)工程學(xué)院8.2.2分布式數(shù)據(jù)庫的分級結(jié)構(gòu)1.對等型分布數(shù)據(jù)庫的分級結(jié)構(gòu)對等型的分級結(jié)構(gòu)如圖8-1,它的全局概念模式是所有結(jié)點(diǎn)本地概念模式的并集。圖8-1ANSI/SPARC分布DB參考結(jié)構(gòu)仲愷農(nóng)業(yè)工程學(xué)院8.2.2分布式數(shù)據(jù)庫的分級結(jié)構(gòu)2.多數(shù)據(jù)庫系統(tǒng)的分級結(jié)構(gòu)多數(shù)據(jù)庫放寬了分布數(shù)據(jù)庫中所有數(shù)據(jù)從邏輯上看必須都在一個全局?jǐn)?shù)據(jù)庫中的要求,允許部分?jǐn)?shù)據(jù)只供本地用戶使用。這里又有兩種參考結(jié)構(gòu):(1)帶有全局要領(lǐng)模式的參考結(jié)構(gòu)如圖8-2所示。在此種結(jié)構(gòu)中,全局概念模式是本地概念模式的集成。本地用戶的外模式定義在本地概念模式上,不改變本地用戶原來使用本地?cái)?shù)據(jù)庫的方式。全局用戶的外模式定義在全局概念模式上,用統(tǒng)一的語言訪問多數(shù)據(jù)庫。仲愷農(nóng)業(yè)工程學(xué)院2.多數(shù)據(jù)庫系統(tǒng)的分級結(jié)構(gòu)

圖8-2有全局概念模式的MDBS結(jié)構(gòu)仲愷農(nóng)業(yè)工程學(xué)院2.多數(shù)據(jù)庫系統(tǒng)的分級結(jié)構(gòu)(2)無全局要領(lǐng)模式的參考結(jié)構(gòu)如圖8-3所示。在此種結(jié)構(gòu)中,將MDBS分布為兩層:本地系統(tǒng)層和多數(shù)據(jù)庫層。本地系統(tǒng)層由各本地?cái)?shù)據(jù)庫組成;多數(shù)據(jù)庫層由多數(shù)據(jù)庫用戶的外模式組成。這些外模式可以定義在一個或多個本地概念模式上。用戶用編程通過外模式訪問MDBS,而實(shí)現(xiàn)對各本地?cái)?shù)據(jù)庫訪問的責(zé)任交給多數(shù)據(jù)庫層與本地系統(tǒng)層之間的映射。仲愷農(nóng)業(yè)工程學(xué)院2.多數(shù)據(jù)庫系統(tǒng)的分級結(jié)構(gòu)圖8-3無全局概念模式的MDBS結(jié)構(gòu)仲愷農(nóng)業(yè)工程學(xué)院3.聯(lián)邦式數(shù)據(jù)庫的分級結(jié)構(gòu)聯(lián)邦數(shù)據(jù)庫系統(tǒng)由一組既協(xié)同工作又獨(dú)立自治的部件數(shù)據(jù)庫系統(tǒng)組成。這些部件DBS可以是CDB、DDB、甚至是另一個FDBS。如圖8-4所示,聯(lián)邦數(shù)據(jù)庫結(jié)構(gòu)包含如下幾個部分:圖8-4聯(lián)邦數(shù)據(jù)庫結(jié)構(gòu)仲愷農(nóng)業(yè)工程學(xué)院3.聯(lián)邦式數(shù)據(jù)庫的分級結(jié)構(gòu)(1)本地模式:它是部件DBS的概念模式。(2)部件模式:它是本地模式經(jīng)轉(zhuǎn)換器處理后變成FDBS公共數(shù)據(jù)模型的形式。(3)輸出模式:它給出了部件模式可被FDBS使用的一個子集和一些訪問控制信息。(4)聯(lián)邦模式:它是各輸出模式的并集,由各輸出模式經(jīng)構(gòu)造器生成。(5)外模式:外模式由聯(lián)邦模式經(jīng)過濾器導(dǎo)出,其數(shù)據(jù)模型可以不同。(6)轉(zhuǎn)換器:把一種數(shù)據(jù)模型(格式)轉(zhuǎn)換為另一種數(shù)據(jù)模型(格式)。把一種數(shù)據(jù)語言轉(zhuǎn)換為另一種數(shù)據(jù)語言。(7)過濾器:限制從一層處理器傳送到另一層處理器的命令和相應(yīng)的數(shù)據(jù)。(8)構(gòu)造器:把單個處理器的操作,分解、復(fù)制成多個操作(查詢分解)。把多個處理器產(chǎn)生的數(shù)據(jù)合并成單個數(shù)據(jù)集合(模式集成)。仲愷農(nóng)業(yè)工程學(xué)院8.2.3數(shù)據(jù)分布在構(gòu)成分布式數(shù)據(jù)庫系統(tǒng)的運(yùn)行環(huán)境時,必須考慮構(gòu)成分布式數(shù)據(jù)庫系統(tǒng)所應(yīng)用的各個組成部分各自如何使用數(shù)據(jù)的問題,所以,分布式數(shù)據(jù)庫系統(tǒng)同樣存在著分布式數(shù)據(jù)庫DDB的設(shè)計(jì)問題,這就是數(shù)據(jù)分布。它包括了分布式數(shù)據(jù)庫的邏輯劃分和物理分配,以及用戶對分布式數(shù)據(jù)庫的劃分或分配的感知程度(透明度)。數(shù)據(jù)分布的主要目的是提高訪問的局部性。即通過數(shù)據(jù)的合理分布,盡可能地使更多的數(shù)據(jù)能夠就地存放,以減少遠(yuǎn)距離的數(shù)據(jù)訪問,但在任何分布式數(shù)據(jù)庫中,達(dá)到所有數(shù)據(jù)的訪問都局部化是不可能的。即使多復(fù)本也只能達(dá)到讀的完全局部化,對于數(shù)據(jù)的更新則需各個復(fù)本同步更新,因此仍然需要進(jìn)行遠(yuǎn)程訪問。一個成功的分布式數(shù)據(jù)庫的設(shè)計(jì)應(yīng)使訪問的局部性能更好。數(shù)據(jù)分布的目的是為了就地訪問而不是分布訪問。仲愷農(nóng)業(yè)工程學(xué)院8.2.3數(shù)據(jù)分布數(shù)據(jù)分布包括分割和分配兩個方面,可以描述為以下兩個步驟:先從邏輯上將全局概念模式,即全局關(guān)系模式,劃分成若干邏輯片段(子關(guān)系)——分割;再按一定的冗余度將片段分配到各個節(jié)點(diǎn)上,這時邏輯片段就成為具體的物理片段——分配。對分布式數(shù)據(jù)庫分割后,仍應(yīng)保持DDB原有的特質(zhì),所以分割后的各邏輯關(guān)系之間應(yīng)遵循下列原則:(1)完整性原則。全局關(guān)系的所有數(shù)據(jù)必須包括在任何一個片段中,不允許出現(xiàn)某個數(shù)據(jù)屬于全局關(guān)系,但卻不屬于任何片段。(2)重構(gòu)性原則。所有片段必須能重構(gòu)(逆操作)成全局關(guān)系。(3)不相交原則。不允許一個全局關(guān)系的某些數(shù)據(jù)既屬于該全局關(guān)系的某一個片段又屬于該全局關(guān)系的另一個片段。即要求一個全局關(guān)系被分割后得到的各個數(shù)據(jù)片段必須是相互不重疊的。仲愷農(nóng)業(yè)工程學(xué)院8.2.3數(shù)據(jù)分布分割后的工作便是分配,分配的目標(biāo)是將已分割好的片段分配到不同的場地中去,使得某節(jié)點(diǎn)對某片段的訪問盡量為本地訪問。分配的過程是線性的,亦即分割的輸出是分配的輸入。顯然,分割與分配有著天然的聯(lián)系,二者的區(qū)別僅在于分割著眼于全局,分配則考慮片段關(guān)系。數(shù)據(jù)分配一般有以下幾種方式:(1)集中型。數(shù)據(jù)雖經(jīng)劃分,但所有邏輯片段完全集中在一個場地上,仍然像一個集中數(shù)據(jù)庫一樣。(2)分割型。數(shù)據(jù)被劃分后,所有邏輯片段各自分配在一個場地上,所有場地上分配的只是全局關(guān)系的一個子關(guān)系。(3)混合型。數(shù)據(jù)被劃分后的邏輯片段根據(jù)需要分配,共享的片段在需要共享的場地上重復(fù)設(shè)置,高度私用的片段只設(shè)置在所需要的場地上。仲愷農(nóng)業(yè)工程學(xué)院8.3并行數(shù)據(jù)庫系統(tǒng)

8.3.1并行結(jié)構(gòu)模型8.3.2數(shù)據(jù)分置與數(shù)據(jù)偏斜仲愷農(nóng)業(yè)工程學(xué)院8.3.1并行結(jié)構(gòu)模型并行計(jì)算機(jī)是并行數(shù)據(jù)庫的基礎(chǔ)。1986年,美國學(xué)者M(jìn).Stonebraker提出了并行計(jì)算機(jī)的3種并行結(jié)構(gòu)模型。(1)共享主存結(jié)構(gòu)(SharedMemory)簡稱SM結(jié)構(gòu),也稱全共享結(jié)構(gòu)(SE-SharedEverything)。在此種結(jié)構(gòu)中,各處理機(jī)通過共享主存通信,每個處理機(jī)都能訪問任一存儲單元和任一磁盤單元,處理機(jī)與存儲器之間通過高速總線或交叉開關(guān)連接,如圖8-5(a)。這是目前較成熟的結(jié)構(gòu),居市場主流。采用該結(jié)構(gòu)的機(jī)器有IBM的IBM3090,BULL的DPS8,Sequent和Encore公司的對稱多處理機(jī)等。該結(jié)構(gòu)的優(yōu)點(diǎn)是:結(jié)構(gòu)簡單、負(fù)載均衡、通信效率高。缺點(diǎn)是:維護(hù)開銷大、可擴(kuò)充性受限制、可用性低。建立在這種結(jié)構(gòu)上的并行數(shù)據(jù)庫系統(tǒng)有:XPRS、DBS3、Volcalno、IBM3090上的DB2等。仲愷農(nóng)業(yè)工程學(xué)院8.3.1并行結(jié)構(gòu)模型(2)共享磁盤結(jié)構(gòu)(Shared-Disk)簡稱SD結(jié)構(gòu),如圖8-5(b)。在此種結(jié)構(gòu)中,每個處理機(jī)有自己的內(nèi)存,通過高速互連網(wǎng),可以訪問任何磁盤。這種結(jié)構(gòu)的優(yōu)點(diǎn)是可擴(kuò)充性好,負(fù)載均衡,維護(hù)開銷不大,可用性較高。缺點(diǎn)是復(fù)雜度較高,潛在性能較低的問題。建立在該類結(jié)構(gòu)上的并行數(shù)據(jù)庫系統(tǒng)有IBM的IMS/VS數(shù)據(jù)共享產(chǎn)品,DEC公司的VAXDBMS和Rdb產(chǎn)品,以及在DECcluster和NCUBE計(jì)算機(jī)上的ORACLE數(shù)據(jù)庫實(shí)現(xiàn)等。仲愷農(nóng)業(yè)工程學(xué)院8.3.1并行結(jié)構(gòu)模型(3)無共享結(jié)構(gòu)(SharedNothing)簡稱SN結(jié)構(gòu),如圖8-5(c)。這是一種松耦合系統(tǒng),每個計(jì)算機(jī)系統(tǒng)通過高速網(wǎng)絡(luò)互連,各計(jì)算機(jī)系統(tǒng)獨(dú)占自己的主存與磁盤,這種結(jié)構(gòu)的并行數(shù)據(jù)庫本質(zhì)上是一種分布數(shù)據(jù)庫。無共享結(jié)構(gòu)的優(yōu)點(diǎn)很突出:它的擴(kuò)充性好,增加新結(jié)點(diǎn)系統(tǒng)可平衡地增長,線性加速比好,在多個結(jié)點(diǎn)上復(fù)制數(shù)據(jù),可增加系統(tǒng)可用性、可靠性,資源競爭對系統(tǒng)的干擾小,系統(tǒng)維護(hù)開銷不大。而該結(jié)構(gòu)的缺點(diǎn)是復(fù)雜度高,負(fù)載平衡難于達(dá)到,因?yàn)樗蕾囉跀?shù)據(jù)庫中數(shù)據(jù)的分割與放置。建立在該結(jié)構(gòu)上的并行數(shù)據(jù)庫有Teradata的DBC、Tandem的NonStopSQL產(chǎn)品以及原型系統(tǒng)BUBBA、EDS、GAMMA、GRACE、PRISMA等。仲愷農(nóng)業(yè)工程學(xué)院8.3.1并行結(jié)構(gòu)模型

(a)共享主存(b)共享磁盤

(c)無共享

圖8-5并行結(jié)構(gòu)模型仲愷農(nóng)業(yè)工程學(xué)院8.3.2數(shù)據(jù)分置與數(shù)據(jù)偏斜1.?dāng)?shù)據(jù)分置類似于分布數(shù)據(jù)庫中的數(shù)據(jù)分布,并行數(shù)據(jù)庫中的數(shù)據(jù)如何分布到各結(jié)點(diǎn)的存儲設(shè)備上去呢?這就是數(shù)據(jù)分置(DataPlacement)問題。它由數(shù)據(jù)劃分和分配兩部分組成。要把數(shù)據(jù)分置到不同結(jié)點(diǎn)上,首先要對數(shù)據(jù)進(jìn)行劃分(Partitioning),這類似于分布數(shù)據(jù)庫中的全局關(guān)系分段。分段與分布是以用戶使用數(shù)據(jù)的方式以及在什么結(jié)點(diǎn)使用為依據(jù)的。與此不同,并行數(shù)據(jù)庫的用戶查詢并不與特定結(jié)點(diǎn)相聯(lián)系,數(shù)據(jù)分置不考慮特定用戶的特定應(yīng)用,它的目標(biāo)是有利于用戶查詢的并行處理?;镜臄?shù)據(jù)分置方法有:輪回分置法(Round-Robin)、哈希分置法(Hash)、范圍分置法(Range)以及多維數(shù)據(jù)分置法(Multi-Dimension)等。仲愷農(nóng)業(yè)工程學(xué)院8.3.2數(shù)據(jù)分置與數(shù)據(jù)偏斜2.?dāng)?shù)據(jù)偏斜(DataSkew)數(shù)據(jù)偏斜是對并行執(zhí)行效果有影響的數(shù)據(jù)分布不均勻的總稱。Walton等人將數(shù)據(jù)偏斜分類如下:(1)屬性值偏斜。這是數(shù)據(jù)集本身固有的。如我國人口信息中,民族屬性的值分布不均,漢族比少數(shù)民族多得多。(2)元組分置偏斜。數(shù)據(jù)初始分置時使用哈希分置或范圍分置方法由分置屬性分布不均引起的。(3)選擇性偏斜。由選擇謂詞時對每個結(jié)點(diǎn)的選擇率不同引起的,它使選擇操作在每個結(jié)點(diǎn)產(chǎn)生的結(jié)果大小不均。仲愷農(nóng)業(yè)工程學(xué)院8.3.2數(shù)據(jù)分置與數(shù)據(jù)偏斜(4)重分置偏斜。在兩次操作中間,對第一次操作的結(jié)果重新分置,供第二次操作使用。與元組分置偏斜類似,重新分置也可能引起數(shù)據(jù)偏斜。(5)連接結(jié)果偏斜。由結(jié)點(diǎn)間數(shù)據(jù)分置偏斜,連接選擇率不同造成的。數(shù)據(jù)偏斜不能很好地發(fā)揮操作的并行性、負(fù)載的均衡性,顯著地降低了并行數(shù)據(jù)庫系統(tǒng)的性能。有些文章研究了抗數(shù)據(jù)偏斜的方法,減少數(shù)據(jù)偏斜對并行數(shù)據(jù)庫的影響。仲愷農(nóng)業(yè)工程學(xué)院8.4其他數(shù)據(jù)庫

8.4.1模糊數(shù)據(jù)庫8.4.2模糊演繹數(shù)據(jù)庫8.4.3空間數(shù)據(jù)庫8.4.4統(tǒng)計(jì)與科學(xué)數(shù)據(jù)庫8.4.5時態(tài)和歷史數(shù)據(jù)庫8.4.6實(shí)時數(shù)據(jù)庫8.4.7主存數(shù)據(jù)庫8.4.8移動數(shù)據(jù)庫8.4.9多媒體數(shù)據(jù)庫8.4.10主動數(shù)據(jù)庫8.4.11工程數(shù)據(jù)庫仲愷農(nóng)業(yè)工程學(xué)院8.5數(shù)據(jù)倉庫8.5.1數(shù)據(jù)倉庫概念和特點(diǎn)數(shù)據(jù)倉庫(DataWarehouse)是一個面向主題的(SubjectOriented)、集成的(Integrate)、相對穩(wěn)定的(Non-Volatile)、反映歷史變化(TimeVariant)的數(shù)據(jù)集合,用于支持管理決策。對于數(shù)據(jù)倉庫的概念我們可以從兩個層次予以理解,首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)數(shù)據(jù)源的有效集成,集成后按照主題進(jìn)行重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。根據(jù)數(shù)據(jù)倉庫概念的含義,數(shù)據(jù)倉庫擁有以下四個特點(diǎn):仲愷農(nóng)業(yè)工程學(xué)院8.5.1數(shù)據(jù)倉庫概念和特點(diǎn)(1)面向主題。主題是一個抽象的概念,指用戶使用數(shù)據(jù)倉庫進(jìn)行決策時所關(guān)心的重點(diǎn)方面,一個主題通常與多個操作型信息系統(tǒng)相關(guān)。(2)集成的。數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)抽取、清理的基礎(chǔ)上經(jīng)過系統(tǒng)加工、匯總和整理得到的,必須消除源數(shù)據(jù)中的不一致性,以保證數(shù)據(jù)倉庫內(nèi)的信息是關(guān)于整個企業(yè)的一致的全局信息。(3)相對穩(wěn)定的。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫以后,一般情況下將被長期保留,也就是數(shù)據(jù)倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。(4)反映歷史變化。數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時點(diǎn)(如開始應(yīng)用數(shù)據(jù)倉庫的時點(diǎn))到目前的各個階段的信息,通過這些信息,可以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預(yù)測。仲愷農(nóng)業(yè)工程學(xué)院8.5.2數(shù)據(jù)倉庫的體系結(jié)構(gòu)整個數(shù)據(jù)倉庫系統(tǒng)是一個包含四個層次的體系結(jié)構(gòu),具體如圖8-10所示。

圖8-10數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)仲愷農(nóng)業(yè)工程學(xué)院8.5.2數(shù)據(jù)倉庫的體系結(jié)構(gòu)數(shù)據(jù)源:是數(shù)據(jù)倉庫系統(tǒng)的基礎(chǔ),是整個系統(tǒng)的數(shù)據(jù)源泉。通常包括企業(yè)內(nèi)部信息和外部信息。內(nèi)部信息包括存放于RDBMS中的各種業(yè)務(wù)處理數(shù)據(jù)和各類文檔數(shù)據(jù)。外部信息包括各類法律法規(guī)、市場信息和競爭對手的信息等。仲愷農(nóng)業(yè)工程學(xué)院8.5.2數(shù)據(jù)倉庫的體系結(jié)構(gòu)數(shù)據(jù)的存儲與管理:是整個數(shù)據(jù)倉庫系統(tǒng)的核心。數(shù)據(jù)倉庫的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫,同時也決定了其對外部數(shù)據(jù)的表現(xiàn)形式。要決定采用什么產(chǎn)品和技術(shù)來建立數(shù)據(jù)倉庫的核心,則需要從數(shù)據(jù)倉庫的技術(shù)特點(diǎn)著手分析。針對現(xiàn)有各業(yè)務(wù)系統(tǒng)的數(shù)據(jù),進(jìn)行抽取、清理,并有效集成,按照主題進(jìn)行組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論