老師課件-第2章數(shù)據(jù)模型_第1頁
老師課件-第2章數(shù)據(jù)模型_第2頁
老師課件-第2章數(shù)據(jù)模型_第3頁
老師課件-第2章數(shù)據(jù)模型_第4頁
老師課件-第2章數(shù)據(jù)模型_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章數(shù)據(jù)模型授課:彭云建單位:自動(dòng)化科學(xué)與工程學(xué)院電話:Email:本章學(xué)習(xí)目標(biāo)理解模型和數(shù)據(jù)模型的基本概念。理解概念數(shù)據(jù)模型的基本概念。掌握E-R模型的表示方法。掌握數(shù)據(jù)模型的三要素。了解層次、網(wǎng)狀模型的基本特點(diǎn)。掌握關(guān)系模型的基本概念。了解面向?qū)ο蠛桶虢Y(jié)構(gòu)化數(shù)據(jù)模型的特點(diǎn)。本章概述生活中,人們對于模型并不陌生,例如航空模型、航海模型等,它可以幫助人們對客觀事物進(jìn)行學(xué)習(xí)和理解。計(jì)算機(jī)不能直接處理現(xiàn)實(shí)世界中的具體事物,所以必須要借助于一個(gè)工具將現(xiàn)實(shí)世界的事物及其相互聯(lián)系轉(zhuǎn)換成數(shù)據(jù)庫系統(tǒng)中計(jì)算機(jī)能夠處理的數(shù)據(jù),這個(gè)工具就是數(shù)據(jù)模型。數(shù)據(jù)模型的基本概念和數(shù)據(jù)庫系統(tǒng)涉及的概念模型、層次模型、網(wǎng)狀模型、關(guān)系模型、面向?qū)ο髷?shù)據(jù)模型和半結(jié)構(gòu)化數(shù)據(jù)模型的基本概念和設(shè)計(jì)方法,為后面的數(shù)據(jù)庫設(shè)計(jì)打下基礎(chǔ)。主要內(nèi)容2.1模型與數(shù)據(jù)模型2.3邏輯數(shù)據(jù)模型2.4半結(jié)構(gòu)化數(shù)據(jù)模型2.2概念數(shù)據(jù)模型主要內(nèi)容2.1模型與數(shù)據(jù)模型2.3邏輯數(shù)據(jù)模型2.4半結(jié)構(gòu)化數(shù)據(jù)模型2.2概念數(shù)據(jù)模型2.1模型與數(shù)據(jù)模型由于計(jì)算機(jī)不可能直接處理現(xiàn)實(shí)世界中的具體事物,為了對客觀事物及其聯(lián)系進(jìn)行有效的描述與刻畫,需要引入模型的概念。模型是對現(xiàn)實(shí)世界特征的模擬和抽象。數(shù)據(jù)模型也是一種模型,它是現(xiàn)實(shí)世界數(shù)據(jù)特征的抽象,是用來描述數(shù)據(jù)的一組概念和定義。不同的數(shù)據(jù)模型實(shí)際上是提供給我們模型化數(shù)據(jù)和信息的不同工具。根據(jù)模型應(yīng)用的不同目的,可以將這些模型劃分為三類,它們分屬于三個(gè)不同的層次。第一類模型是概念數(shù)據(jù)模型,簡稱概念模型。它是按用戶的觀點(diǎn)來對數(shù)據(jù)和信息建模,不涉及DBMS的具體技術(shù),主要用于數(shù)據(jù)庫設(shè)計(jì)。第二類模型是邏輯數(shù)據(jù)模型,簡稱邏輯模型。它是按計(jì)算機(jī)系統(tǒng)的觀點(diǎn)對數(shù)據(jù)建模,主要用于DBMS的實(shí)現(xiàn)。不同的DBMS提供不同的邏輯數(shù)據(jù)模型,常用的有層次模型、網(wǎng)狀模型、關(guān)系模型、面向?qū)ο竽P偷?。第三類是物理?shù)據(jù)模型,簡稱物理模型。它是對數(shù)據(jù)最底層的抽象,它描述數(shù)據(jù)在物理存儲(chǔ)介質(zhì)上的組織結(jié)構(gòu)和存取方法,是面向計(jì)算機(jī)系統(tǒng)的,與具體的DBMS、操作系統(tǒng)和計(jì)算機(jī)硬件密切相關(guān)。物理模型的具體實(shí)現(xiàn)是DBMS的任務(wù),DBMS為了保證物理模型的獨(dú)立性與可移植性,大部分的實(shí)現(xiàn)工作由系統(tǒng)自動(dòng)完成,數(shù)據(jù)庫設(shè)計(jì)人員只需要設(shè)計(jì)索引、聚集等特殊結(jié)構(gòu)。2.1模型與數(shù)據(jù)模型為了把現(xiàn)實(shí)世界中的具體事物抽象、組織為某一DBMS支持的數(shù)據(jù)模型,人們常常首先通過選擇、分類、命名等將現(xiàn)實(shí)世界中的客觀對象抽象為信息世界中的某一種信息結(jié)構(gòu),這種信息結(jié)構(gòu)并不依賴于具體的計(jì)算機(jī)系統(tǒng),是一種概念級(jí)的數(shù)據(jù)模型;然后將信息世界的概念數(shù)據(jù)模型轉(zhuǎn)換為機(jī)器世界里計(jì)算機(jī)上某一DBMS支持的邏輯數(shù)據(jù)模型,邏輯數(shù)據(jù)模型最終還要由DBMS轉(zhuǎn)換為面向計(jì)算機(jī)系統(tǒng)的物理數(shù)據(jù)模型,這一過程如圖2-1所示。從現(xiàn)實(shí)世界到概念數(shù)據(jù)模型的抽象是由數(shù)據(jù)庫設(shè)計(jì)人員來完成的;從概念數(shù)據(jù)模型到邏輯數(shù)據(jù)模型的轉(zhuǎn)換可以由數(shù)據(jù)庫設(shè)計(jì)人員來完成,也可以用數(shù)據(jù)庫設(shè)計(jì)工具協(xié)助設(shè)計(jì)人員完成;從邏輯數(shù)據(jù)模型到物理數(shù)據(jù)模型的轉(zhuǎn)換一般由DBMS來完成。2.2概念數(shù)據(jù)模型2.2概念數(shù)據(jù)模型2.3邏輯數(shù)據(jù)模型2.4半結(jié)構(gòu)化數(shù)據(jù)模型2.1模型與數(shù)據(jù)模型2.2概念數(shù)據(jù)模型概念數(shù)據(jù)模型(ConceptualDataModel)也稱為信息模型。它是對客觀事物及其聯(lián)系的抽象,用于信息世界的建模,是現(xiàn)實(shí)世界到信息世界的第一層抽象,是數(shù)據(jù)庫設(shè)計(jì)人員進(jìn)行數(shù)據(jù)庫設(shè)計(jì)的有力工具。概念數(shù)據(jù)模型擺脫了計(jì)算機(jī)系統(tǒng)及數(shù)據(jù)庫管理系統(tǒng)的具體技術(shù)問題,集中精力分析數(shù)據(jù)以及數(shù)據(jù)之間的聯(lián)系等,與具體的數(shù)據(jù)庫管理系統(tǒng)無關(guān)。概念數(shù)據(jù)模型必須換成邏輯數(shù)據(jù)模型,才能在數(shù)據(jù)庫管理系統(tǒng)中實(shí)現(xiàn)。它強(qiáng)調(diào)其語義表達(dá)能力,即能夠較方便、直接地表達(dá)應(yīng)用中的各種語義知識(shí)。這類模型概念簡單、清晰、易于被用戶理解,是數(shù)據(jù)庫設(shè)計(jì)人員和用戶之間進(jìn)行交流的語言。PeterPin-ShanChen在1976年提出的實(shí)體-聯(lián)系方法,簡稱E-R模型(Entity-RelationshipModel),是最為著名的一種概念模型的表示方法,該方法用E-R圖來描述現(xiàn)實(shí)世界的概念模型。E-R模型能夠清楚地表達(dá)被描述對象的語義,用圖形化方式描述數(shù)據(jù)及其之間的關(guān)系,簡單、容易理解掌握、且易被轉(zhuǎn)換成關(guān)系數(shù)據(jù)模型。為了適應(yīng)新的應(yīng)用需求,在基本E-R模型的基礎(chǔ)上又提出了擴(kuò)展實(shí)體聯(lián)系模型(ExtendEntity-RelationshipModel),簡稱為“EER模型”,這種模型能表示更多的語義,擴(kuò)充了子類型的概念,為面向?qū)ο蟮臄?shù)據(jù)庫設(shè)計(jì)提供了有效工具。本書重點(diǎn)研究關(guān)系數(shù)據(jù)庫,所以在此僅詳細(xì)介紹基本的E-R模型。2.2概念數(shù)據(jù)模型1.概念模型的基本概念(1)實(shí)體(Entity)客觀存在并可相互區(qū)分的事物稱為實(shí)體。實(shí)體可以是具體的人、事和物,也可以是抽象的概念或聯(lián)系,例如,學(xué)生是一個(gè)實(shí)體。(2)屬性(Atribute)實(shí)體所具有的若干特征稱為屬性,其中每一個(gè)特征就成為實(shí)體的一個(gè)屬性。屬性必須相對實(shí)體而存在。例如學(xué)生實(shí)體可以由學(xué)號(hào)、姓名、性別、出生年份、所屬院系、入學(xué)年份等屬性組成(94002268,張山,男,l976,計(jì)算機(jī)系,l994),這些屬性組合起來表征了某一個(gè)學(xué)生。(3)碼(Key)唯一標(biāo)識(shí)實(shí)體的屬性集稱為碼。例如學(xué)號(hào)是學(xué)生實(shí)體的碼。(4)域(Domain)屬性的取值范圍稱為該屬性的域。例如,學(xué)號(hào)的域?yàn)?位整數(shù),姓名的域?yàn)樽址?,年齡的域?yàn)樾∮?8的整數(shù),性別的域?yàn)?男,女)。2.2概念數(shù)據(jù)模型(5)實(shí)體型(EntityType)實(shí)體型由實(shí)體名稱和屬性名稱集合組成的形式來抽象和刻畫同一類實(shí)體。例如,學(xué)生(學(xué)號(hào),姓名,性別,出生年份,所屬院系)就是一個(gè)實(shí)體型。(6)實(shí)體集(EntitySet)同一類型實(shí)體的集合稱為實(shí)體集。例如,全體學(xué)生就是一個(gè)實(shí)體集。(7)聯(lián)系(Relationship)現(xiàn)實(shí)世界中事物之間的聯(lián)系在概念模型中必然要加以反映。一般存在兩類聯(lián)系:一是實(shí)體內(nèi)部的聯(lián)系,通常是指組成實(shí)體的各屬性之間的聯(lián)系;二是實(shí)體之間的聯(lián)系,通常是指不同實(shí)體之間的聯(lián)系。2.聯(lián)系兩個(gè)實(shí)體型之間的聯(lián)系稱為二元聯(lián)系,是現(xiàn)實(shí)世界大量存在的聯(lián)系,可以分為三類,如圖2-2所示。(1)一對一(1:1)聯(lián)系2.2概念數(shù)據(jù)模型對于兩個(gè)實(shí)體集A和B,若A中的每一個(gè)值在B中至多有一個(gè)實(shí)體值與之對應(yīng),反之亦然,則稱實(shí)體集A和B具有一對一的聯(lián)系,記為1:1。例如,學(xué)校里面,一個(gè)學(xué)校只有一個(gè)正校長,而一個(gè)校長只在一個(gè)學(xué)校中任職,則學(xué)校與校長之間具有一對一聯(lián)系。(2)一對多(1:n)聯(lián)系對于兩個(gè)實(shí)體集A和B,若A中的每一個(gè)值在B中有多個(gè)實(shí)體值與之對應(yīng),反之B中每一個(gè)實(shí)體值在A中至多有一個(gè)實(shí)體值與之對應(yīng),則稱實(shí)體集A和B具有一對多的聯(lián)系,記為1:n。例如,一個(gè)專業(yè)中有若干名學(xué)生,而每個(gè)學(xué)生只在一個(gè)專業(yè)中學(xué)習(xí),則專業(yè)與學(xué)生之間具有一對多聯(lián)系。(3)多對多(m:n)聯(lián)系對于兩個(gè)實(shí)體集A和B,若A中每一個(gè)實(shí)體值在B中有多個(gè)實(shí)體值與之對應(yīng),反之亦然,則稱實(shí)體集A與實(shí)體集B具有多對多聯(lián)系,記為m:n。例如,一個(gè)教師可以有很多學(xué)生,一個(gè)學(xué)生也可以有很多個(gè)老師,則教師與學(xué)生之間具有多對多聯(lián)系。2.2概念數(shù)據(jù)模型實(shí)際上,一對一聯(lián)系是一對多聯(lián)系的特例,而一對多聯(lián)系又是多對多聯(lián)系的特例。一般地,三個(gè)以上的實(shí)體型之間也存在著一對一、一對多、多對多的聯(lián)系,稱為多元聯(lián)系。例如,對于課程、教師與參考書三個(gè)實(shí)體型,如果一門課程可以有若干個(gè)教師講授,使用若干本參考書,而每一個(gè)教師只講授一門課程,每一本參考書只供一門課程使用,則課程與教師、參考書之間的聯(lián)系是一對多的,如圖2-3所示。2.2概念數(shù)據(jù)模型同一個(gè)實(shí)體集內(nèi)的各實(shí)體之間也可以存在一對一、一對多、多對多的聯(lián)系,稱為一元聯(lián)系。例如職工實(shí)體集內(nèi)部具有領(lǐng)導(dǎo)與被領(lǐng)導(dǎo)的聯(lián)系,即某一職工(干部)領(lǐng)導(dǎo)若干名職工,而一個(gè)職工僅被另外一個(gè)職工直接領(lǐng)導(dǎo)。因此,這是一對多的聯(lián)系,如圖2-4所示。3.概念模型的表示方法概念模型的表示方法很多,其中最著名也是最常用的表示法是E-R方法(實(shí)體聯(lián)系方法),它用E-R圖來描述現(xiàn)實(shí)世界的概念模型。E-R方法也稱為E-R模型。E-R圖的主要成分是實(shí)體型、屬性和聯(lián)系。2.2概念數(shù)據(jù)模型實(shí)體型:用矩形表示,矩形框內(nèi)寫明實(shí)體名。屬性:用橢圓形表示,并用無向邊把實(shí)體與屬性連接起來。聯(lián)系:用菱形表示,菱形框內(nèi)寫明聯(lián)系名,并用無向邊分別把菱形與有關(guān)實(shí)體相連接,在無向邊旁標(biāo)上聯(lián)系的類型(1:1、1:n或m:n)。需要注意的是,如果一個(gè)聯(lián)系具有屬性,則這些屬性也要用無向邊與該聯(lián)系連接起來。例如:學(xué)校中有一個(gè)校長和若干個(gè)班級(jí),每個(gè)班級(jí)有若干個(gè)教師和學(xué)生,每個(gè)教師教授許多學(xué)生,每個(gè)學(xué)生都有學(xué)號(hào)、姓名、性別、班級(jí)、入學(xué)時(shí)間屬性。則此學(xué)校的E-R圖如圖2-5所示2.2概念數(shù)據(jù)模型2.2概念數(shù)據(jù)模型需要說明的是,E-R圖的繪制有兩種方法:集成法和分離法。集成法是將一個(gè)系統(tǒng)的所有實(shí)體、實(shí)體屬性,實(shí)體與實(shí)體之間的聯(lián)系全部畫在一個(gè)圖上,形成一個(gè)完整的E-R圖。這種畫法適合描述規(guī)模不大的數(shù)據(jù)庫系統(tǒng),上例即是集成法繪制的E-R圖。分離法是先分別畫各個(gè)實(shí)體及其屬性圖,然后再畫實(shí)體間聯(lián)系圖,這種畫法適合描述規(guī)模較大的數(shù)據(jù)庫系統(tǒng)。主要內(nèi)容2.2概念數(shù)據(jù)模型2.3邏輯數(shù)據(jù)模型2.4半結(jié)構(gòu)化數(shù)據(jù)模型2.1模型與數(shù)據(jù)模型2.3邏輯數(shù)據(jù)模型2.3.1邏輯數(shù)據(jù)模型概述1.數(shù)據(jù)模型的三要素邏輯數(shù)據(jù)模型(LogicDataModel)又稱為結(jié)構(gòu)數(shù)據(jù)模型(StructureDataModel)。邏輯數(shù)據(jù)模型的任務(wù)是描述計(jì)算機(jī)世界中數(shù)據(jù)及數(shù)據(jù)之間的關(guān)系及數(shù)據(jù)存儲(chǔ)、處理的特征。它是按計(jì)算機(jī)系統(tǒng)的觀點(diǎn)組織數(shù)據(jù),關(guān)注數(shù)據(jù)結(jié)構(gòu),是嚴(yán)格定義的一組概念的集合,這些概念精確地描述了系統(tǒng)的靜態(tài)特性、動(dòng)態(tài)特性和完整性約束條件。因此,邏輯數(shù)據(jù)模型通常由數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作和完整性約束三部分組成,也稱為數(shù)據(jù)模型的三要素。(1)數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)結(jié)構(gòu)是對實(shí)體型和實(shí)體間聯(lián)系的表達(dá)和實(shí)現(xiàn),是所研究的對象類型的集合。這些對象是數(shù)據(jù)庫的組成部分,它們包括兩類,一類是與數(shù)據(jù)類型、內(nèi)容、性質(zhì)有關(guān)的描述,例如網(wǎng)狀模型中的數(shù)據(jù)項(xiàng)、記錄,關(guān)系模型中的域、屬性、關(guān)系等;另一類是與數(shù)據(jù)之間聯(lián)系有關(guān)的描述。例如關(guān)系模型中的外鍵。數(shù)據(jù)結(jié)構(gòu)是對數(shù)據(jù)模型靜態(tài)特性的描述。2.3邏輯數(shù)據(jù)模型數(shù)據(jù)結(jié)構(gòu)是刻畫一個(gè)數(shù)據(jù)模型性質(zhì)最重要的方面,因此,在數(shù)據(jù)庫系統(tǒng)中,人們通常按照數(shù)據(jù)結(jié)構(gòu)的類型來命名數(shù)據(jù)模型。例如層次結(jié)構(gòu)、網(wǎng)狀結(jié)構(gòu)和關(guān)系結(jié)構(gòu)的數(shù)據(jù)模型分別命名為層次模型、網(wǎng)狀模型和關(guān)系模型。(2)數(shù)據(jù)操作數(shù)據(jù)操作是指對數(shù)據(jù)庫中各種對象(型)的實(shí)例(值)允許執(zhí)行的操作的集合,包括操作及相應(yīng)的操作規(guī)則。數(shù)據(jù)庫主要有數(shù)據(jù)查詢和數(shù)據(jù)更新兩大類操作。數(shù)據(jù)模型必須定義這些操作的確切含義、操作符號(hào)、操作規(guī)則以及實(shí)現(xiàn)操作的語言。數(shù)據(jù)操作是對數(shù)據(jù)模型動(dòng)態(tài)特性的描述。(3)數(shù)據(jù)的約束條件數(shù)據(jù)的約束條件是一組完整性規(guī)則的集合。完整性規(guī)則是給定的數(shù)據(jù)模型中數(shù)據(jù)及其聯(lián)系所具有的制約和依存規(guī)則,用以限定符合數(shù)據(jù)模型的數(shù)據(jù)庫狀態(tài)以及狀態(tài)的變化,以保證數(shù)據(jù)的正確、有效、相容。數(shù)據(jù)模型必須遵守基本的通用的完整性約束條件。例如,在關(guān)系模型中,任何關(guān)系必須滿足實(shí)體完整性和參照完整性兩個(gè)條件。2.3邏輯數(shù)據(jù)模型另外,數(shù)據(jù)模型還應(yīng)該提供用戶自定義完整性約束條件的機(jī)制,以反映具體應(yīng)用所涉及的數(shù)據(jù)必須遵守的特定的語義約束條件。例如,在學(xué)校的數(shù)據(jù)庫中規(guī)定大學(xué)生入學(xué)年齡不得超過30歲,學(xué)生累計(jì)成績不得有三門以上不及格等。2.邏輯數(shù)據(jù)模型的分類目前,數(shù)據(jù)庫領(lǐng)域中最常用的邏輯數(shù)據(jù)模型有層次模型(HierarchicalModel)、網(wǎng)狀模型(NetworkModel)、關(guān)系模型(RelationalModel)和面向?qū)ο竽P?ObjectOrientedModel),其中層次模型和網(wǎng)狀模型統(tǒng)稱為非關(guān)系模型。非關(guān)系模型的數(shù)據(jù)庫系統(tǒng)在20世紀(jì)70年代至80年代初非常流行,在當(dāng)時(shí)的數(shù)據(jù)庫系統(tǒng)產(chǎn)品中占據(jù)了主導(dǎo)地位,現(xiàn)在已逐漸被關(guān)系模型的數(shù)據(jù)庫系統(tǒng)取代,但由于早期開發(fā)的應(yīng)用系統(tǒng)都是基于層次數(shù)據(jù)庫或網(wǎng)狀數(shù)據(jù)庫系統(tǒng)的,因此,目前仍有不少層次數(shù)據(jù)庫或網(wǎng)狀數(shù)據(jù)庫系統(tǒng)在繼續(xù)使用。20世紀(jì)80年代以來,面向?qū)ο蟮姆椒ê图夹g(shù)在計(jì)算機(jī)各個(gè)領(lǐng)域,包括程序設(shè)計(jì)語言、軟件工程、信息系統(tǒng)設(shè)計(jì)、計(jì)算機(jī)硬件設(shè)計(jì)等各方面都產(chǎn)生了深遠(yuǎn)的影響,也促進(jìn)數(shù)據(jù)庫中面向?qū)ο髷?shù)據(jù)模型的研究和發(fā)展。2.3邏輯數(shù)據(jù)模型2.3.2層次模型層次模型是數(shù)據(jù)庫系統(tǒng)中最早出現(xiàn)的數(shù)據(jù)模型。層次數(shù)據(jù)庫系統(tǒng)的典型代表是IBM公司的IMS(InformationManagementSystem)數(shù)據(jù)庫管理系統(tǒng),曾經(jīng)得到廣泛的使用。

層次模型是按照層次結(jié)構(gòu)的形式組織數(shù)據(jù)庫數(shù)據(jù)的數(shù)據(jù)模型,用樹形結(jié)構(gòu)來表示各類實(shí)體以及實(shí)體間的聯(lián)系?,F(xiàn)實(shí)世界中許多實(shí)體之間的聯(lián)系本來就呈現(xiàn)出一種很自然的層次關(guān)系,如家族關(guān)系、軍隊(duì)編制、行政機(jī)構(gòu)等。1.層次模型的數(shù)據(jù)結(jié)構(gòu)層次模型建立在“樹”的概念基礎(chǔ)之上,應(yīng)滿足下面兩個(gè)基本條件:(1)有且只有一個(gè)結(jié)點(diǎn)沒有雙親結(jié)點(diǎn),這個(gè)結(jié)點(diǎn)稱為根結(jié)點(diǎn);(2)根結(jié)點(diǎn)以外的其他結(jié)點(diǎn)有且只有一個(gè)雙親結(jié)點(diǎn)。在層次模型中,每個(gè)結(jié)點(diǎn)表示一個(gè)記錄類型,記錄之間的聯(lián)系用結(jié)點(diǎn)之間的連線(有向邊)表示,這種聯(lián)系只能是父子之間的一對多(包括一對一)的聯(lián)系,表示“一”的記錄類型是父節(jié)點(diǎn),表示“多”的記錄類型是子節(jié)點(diǎn)。每個(gè)記錄類型包含若干個(gè)字段,記錄類型描述的是實(shí)體,字段描述的是實(shí)體的屬性。2.3邏輯數(shù)據(jù)模型層次模型像一棵倒立的樹,除根節(jié)點(diǎn)外,每個(gè)節(jié)點(diǎn)的雙親是唯一的,一個(gè)層次模型的例子如圖2-6所示:在層次模型中,同一雙親的子女結(jié)點(diǎn)稱為兄弟結(jié)點(diǎn),沒有子女結(jié)點(diǎn)的結(jié)點(diǎn)稱為葉節(jié)點(diǎn)。圖2-6中,R1為根結(jié)點(diǎn);R2和R3為兄弟結(jié)點(diǎn),是R1的子女結(jié)點(diǎn);R4和R5為兄弟結(jié)點(diǎn),是R2的子女結(jié)點(diǎn);R3、R4和R5為葉結(jié)點(diǎn)。2.3邏輯數(shù)據(jù)模型圖2-7是一個(gè)教師學(xué)生層次模型。該層次模型有4個(gè)記錄類型,即實(shí)體。實(shí)體系是根結(jié)點(diǎn),由系編號(hào)、系名、地點(diǎn)3個(gè)屬性組成。它有兩個(gè)子女結(jié)點(diǎn),分別是教研室實(shí)體和學(xué)生實(shí)體。實(shí)體教研室是系的子女結(jié)點(diǎn),同時(shí)又是教師實(shí)體的雙親結(jié)點(diǎn),它由教研室編號(hào)、教研室名兩個(gè)屬性組成。實(shí)體學(xué)生由學(xué)號(hào)、姓名、成績3個(gè)屬性組成。實(shí)體教師由教師號(hào)、姓名、研究方向3個(gè)屬性組成。學(xué)生與教師是葉子結(jié)點(diǎn),它們沒有子女結(jié)點(diǎn)。由系到教研室、教研室到教師、系到學(xué)生都是一對多的聯(lián)系。2.3邏輯數(shù)據(jù)模型2.層次模型的數(shù)據(jù)操作與完整性約束層次模型的數(shù)據(jù)操作主要有查詢、插入、刪除和更新。進(jìn)行插入、刪除、更新操作時(shí)要滿足層次模型的完整性約束條件。進(jìn)行插入操作時(shí),如果沒有相應(yīng)的雙親結(jié)點(diǎn)值就不能插入它的子女結(jié)點(diǎn)值。例如在圖2-7的層次數(shù)據(jù)庫中,如果新調(diào)入一名教師,但尚未分配到某個(gè)教研室,這時(shí)就不能將新的教師插入到數(shù)據(jù)庫中。進(jìn)行刪除操作時(shí),如果刪除雙親結(jié)點(diǎn)值,則相應(yīng)的子女結(jié)點(diǎn)值也被同時(shí)刪除。例如在圖2-7中的層次數(shù)據(jù)庫中,如果刪除網(wǎng)絡(luò)教研室,則該教研室的所有教師的數(shù)據(jù)將全部丟失。進(jìn)行更新操作時(shí),應(yīng)更新所有相應(yīng)記錄,以保證數(shù)據(jù)的一致性。3.層次模型的優(yōu)缺點(diǎn)層次模型的優(yōu)點(diǎn)主要有:(1)層次模型的數(shù)據(jù)結(jié)構(gòu)比較簡單。(2)對于實(shí)體間聯(lián)系是固定的且預(yù)先定義好的應(yīng)用系統(tǒng),采用層次模型實(shí)現(xiàn),其性能優(yōu)于關(guān)系模型,不低于網(wǎng)狀模型。(3)層次數(shù)據(jù)模型提供了良好的完整性支持。2.3邏輯數(shù)據(jù)模型層次模型的缺點(diǎn)主要有:(1)現(xiàn)實(shí)世界中很多聯(lián)系是非層次性的,如多對多聯(lián)系、一個(gè)結(jié)點(diǎn)具有多個(gè)雙親等,層次模型表示這類聯(lián)系的方法很不靈活,只能通過引入冗余數(shù)據(jù)(易產(chǎn)生不一致性)或創(chuàng)建非自然的數(shù)據(jù)組織(引入虛擬結(jié)點(diǎn))來解決。(2)對插入和刪除操作的限制比較多。(3)查詢子女結(jié)點(diǎn)必須通過雙親結(jié)點(diǎn)。(4)由于結(jié)構(gòu)嚴(yán)密,層次命令趨于程序化。

層次模型還具有一個(gè)基本特點(diǎn),任何一個(gè)給定的記錄值只有按其路徑查看時(shí)才能顯示它的全部意義,沒有一個(gè)子女記錄值能夠脫離雙親記錄值而獨(dú)立存在。因此層次模型對具有一對多的層次關(guān)系的描述非常直觀、自然、容易理解。2.3.3網(wǎng)狀模型在現(xiàn)實(shí)世界中事物之間的聯(lián)系更多是非層次關(guān)系的,用層次模型表示非樹形結(jié)構(gòu)很不直接,網(wǎng)狀模型則可以克服這一缺點(diǎn)。2.3邏輯數(shù)據(jù)模型網(wǎng)狀數(shù)據(jù)模型的典型代表是DBTG系統(tǒng),亦稱CODASYL系統(tǒng),這是20世紀(jì)70年代數(shù)據(jù)系統(tǒng)語言研究會(huì)(ConferenceOnDataSystemLanguage,CODASYL)下屬的數(shù)據(jù)庫任務(wù)組(DataBaseTaskGroup,DBTG)提出的一個(gè)系統(tǒng)方案。DBTG系統(tǒng)雖然不是實(shí)際的軟件系統(tǒng),但是它提出的基本概念、方法和技術(shù)具有普遍意義,對于網(wǎng)狀數(shù)據(jù)庫系統(tǒng)的研制和發(fā)展起了重大的影響。后來許多系統(tǒng)都采用DBTG模型或者簡化的DBTG模型,例如CuUinetSoftware公司的IDMS等。1.網(wǎng)狀模型的數(shù)據(jù)結(jié)構(gòu)網(wǎng)狀模型建立在連通有向圖的基礎(chǔ)之上,應(yīng)滿足以下兩個(gè)基本條件:(1)允許一個(gè)以上的結(jié)點(diǎn)無雙親;(2)一個(gè)結(jié)點(diǎn)可以有多于一個(gè)的雙親。網(wǎng)狀模型是一種比層次模型更具普遍性的結(jié)構(gòu)。它去掉了層次模型的兩個(gè)限制,允許多個(gè)結(jié)點(diǎn)沒有雙親結(jié)點(diǎn),允許結(jié)點(diǎn)有多個(gè)雙親結(jié)點(diǎn),此外它還允許兩個(gè)結(jié)點(diǎn)之間有多種聯(lián)系(稱之為復(fù)合聯(lián)系)。因此,網(wǎng)狀模型可以更直接地去描述現(xiàn)實(shí)世界,而層次模型實(shí)際上是網(wǎng)狀模型的一個(gè)特例。2.3邏輯數(shù)據(jù)模型與層次模型一樣,網(wǎng)狀模型中每個(gè)結(jié)點(diǎn)表示一個(gè)記錄類型(實(shí)體),每個(gè)記錄類型可包含若干個(gè)字段(屬性),結(jié)點(diǎn)間的連線表示實(shí)體之間一對多的父子聯(lián)系。從定義可以看出,層次模型中子女結(jié)點(diǎn)與雙親結(jié)點(diǎn)的聯(lián)系是唯一的,而在網(wǎng)狀模型中這種聯(lián)系可以不唯一。因此,要為每個(gè)聯(lián)系命名,并指出與該聯(lián)系有關(guān)的雙親記錄和子女記錄。例如圖2-8是網(wǎng)狀模型的一個(gè)例子,圖2-8中R3有兩個(gè)雙親記錄R1和R2,因此,把R1與R3之問的聯(lián)系命名為L1,R2與R3之間的聯(lián)系命名為L2。實(shí)際的商品化網(wǎng)狀數(shù)據(jù)庫系統(tǒng)對網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)都有不同的限制,這時(shí)就需要把現(xiàn)實(shí)世界一般的網(wǎng)狀結(jié)構(gòu)轉(zhuǎn)換成系統(tǒng)所能處理的結(jié)構(gòu)。2.3邏輯數(shù)據(jù)模型下面以學(xué)生選課為例,看一看網(wǎng)狀模型是怎樣來組織數(shù)據(jù)的。按照常規(guī),一個(gè)學(xué)生可以選修若干門課程,某一課程可以被多個(gè)學(xué)生選修,因此,學(xué)生與課程之間是多對多的聯(lián)系。這樣的實(shí)體聯(lián)系圖不能直接用網(wǎng)狀模型來表示,因?yàn)榫W(wǎng)狀模型中不能直接表示實(shí)體之間多對多的聯(lián)系。為此引進(jìn)一個(gè)學(xué)生選課的聯(lián)結(jié)記錄,它由三個(gè)數(shù)據(jù)項(xiàng)組成,即學(xué)號(hào)、課程號(hào)、成績,表示某個(gè)學(xué)生選修某一門課程及其成績。

2.3邏輯數(shù)據(jù)模型這樣,學(xué)生選課數(shù)據(jù)庫包括三個(gè)記錄類型:學(xué)生、課程和選課。

每個(gè)學(xué)生可以選修多門課程。顯然對于學(xué)生記錄中的一個(gè)值,選課記錄中可以有多個(gè)值與之聯(lián)系;而選課記錄中的一個(gè)值,只能與學(xué)生記錄中的一個(gè)值聯(lián)系。學(xué)生與選課之間的聯(lián)系是一對多的聯(lián)系,聯(lián)系名為學(xué)生-選課。同樣,課程與選課之間的聯(lián)系也是一對多的聯(lián)系,聯(lián)系名為課程-選課。圖2-9為學(xué)生選課的網(wǎng)狀模型。2.網(wǎng)狀模型的數(shù)據(jù)操作與完整性約束

網(wǎng)狀模型的數(shù)據(jù)操作主要包括查詢、插入、刪除和更新。進(jìn)行插入操作時(shí),允許插入尚未確定雙親結(jié)點(diǎn)值的子女結(jié)點(diǎn)值。進(jìn)行刪除操作時(shí),只允許刪除雙親結(jié)點(diǎn)值。進(jìn)行更新操作時(shí)只需更新指定記錄即可。因此,一般來說,網(wǎng)狀模型沒有層次模型那樣嚴(yán)格的完整性約束條件,但具體的網(wǎng)狀數(shù)據(jù)庫系統(tǒng)(如DBTG)對數(shù)據(jù)操作都加了一些限制,提供了一定的完整性約束。DBTG在模式DDL中提供了定義DBTG數(shù)據(jù)庫完整性的若干概念和語句,主要有:2.3邏輯數(shù)據(jù)模型(1)支持記錄碼的概念,碼即唯一標(biāo)識(shí)記錄的數(shù)據(jù)項(xiàng)的集合。例如,學(xué)生記錄(圖2-9)中學(xué)號(hào)是碼,因此數(shù)據(jù)庫中不允許學(xué)生記錄中學(xué)號(hào)出現(xiàn)重復(fù)值。(2)保證一個(gè)聯(lián)系中雙親記錄和子女記錄之間是一對多的聯(lián)系。(3)可以支持雙親記錄和子女記錄之間某些約束條件。如有些子女記錄要求雙親記錄存在才能插入,雙親記錄刪除時(shí)也連同刪除。例如圖2-9中選課記錄就應(yīng)該滿足這種約束條件,學(xué)生選課記錄值必須是數(shù)據(jù)庫中存在的某一學(xué)生選修存在的某一課程的選修記錄。DBTG提供了“屬籍類別”的概念來描述這類約束條件。3.網(wǎng)狀數(shù)據(jù)模型的優(yōu)缺點(diǎn)網(wǎng)狀數(shù)據(jù)模型的優(yōu)點(diǎn)主要有:(1)能夠更為直接地描述現(xiàn)實(shí)世界。如一個(gè)結(jié)點(diǎn)可以有多個(gè)雙親,結(jié)點(diǎn)之間可以有多種聯(lián)系。(2)具有良好的性能,存取效率較高。網(wǎng)狀數(shù)據(jù)模型的缺點(diǎn)主要有:2.3邏輯數(shù)據(jù)模型(1)結(jié)構(gòu)比較復(fù)雜,而且應(yīng)用環(huán)境越大,數(shù)據(jù)庫的結(jié)構(gòu)就變得越復(fù)雜,不利于最終用戶掌握。(2)其數(shù)據(jù)定義語言(DDL),數(shù)據(jù)操作語言(DML)語言復(fù)雜,用戶不容易使用。由于記錄之間聯(lián)系是通過存取路徑實(shí)現(xiàn)的,應(yīng)用程序在訪問數(shù)據(jù)時(shí)必須選擇適當(dāng)?shù)拇嫒÷窂?,因此,用戶必須了解系統(tǒng)結(jié)構(gòu)的細(xì)節(jié),加重了編寫應(yīng)用程序的負(fù)擔(dān)。2.3.4關(guān)系模型關(guān)系模型是目前最重要的、應(yīng)用最廣泛的一種數(shù)據(jù)模型。目前,主流的數(shù)據(jù)庫系統(tǒng)大部分都是基于關(guān)系模型的關(guān)系數(shù)據(jù)庫系統(tǒng)(RelationalDataBaseSystem,RDBS)。1970年美國IBM公司SanJose研究室的研究員E.F.Codd首次提出了數(shù)據(jù)庫系統(tǒng)的關(guān)系模型,開創(chuàng)了數(shù)據(jù)庫關(guān)系方法和關(guān)系數(shù)據(jù)理論的研究,為數(shù)據(jù)庫技術(shù)奠定了理論基礎(chǔ)。20世紀(jì)80年代以來,計(jì)算機(jī)廠商新推出的DBMS幾乎都支持關(guān)系模型,非關(guān)系模型的產(chǎn)品也大都添加了關(guān)系接口,數(shù)據(jù)庫領(lǐng)域當(dāng)前的研究工作也都是以關(guān)系方法為基礎(chǔ),所以本書的重點(diǎn)也將放在關(guān)系數(shù)據(jù)庫上。2.3邏輯數(shù)據(jù)模型1.關(guān)系模型的數(shù)據(jù)結(jié)構(gòu)關(guān)系模型的數(shù)據(jù)結(jié)構(gòu)建立在集合論中“關(guān)系”這個(gè)數(shù)學(xué)概念的基礎(chǔ)之上,有著嚴(yán)格的數(shù)學(xué)定義。這里只簡單勾畫一下關(guān)系模型。在用戶觀點(diǎn)來看,關(guān)系模型的數(shù)據(jù)結(jié)構(gòu)非常簡單,每個(gè)關(guān)系的數(shù)據(jù)結(jié)構(gòu)是一張二維表,它由行和列組成。這張表既可以用來描述實(shí)體,也可以用來描述實(shí)體間的聯(lián)系。現(xiàn)在以學(xué)生表為例,介紹關(guān)系模型中的一些術(shù)語,如表2-1所示。關(guān)系(Relation):一個(gè)關(guān)系通常對應(yīng)一張二維表,如上述的這張學(xué)生表;元組(Tuple):表中的一行即為一個(gè)元組,也稱為記錄;屬性(Attribute):表中的一列即為一個(gè)屬性,給每一個(gè)屬性起一個(gè)名稱即屬性名,如上表有五列,對應(yīng)五個(gè)屬性(學(xué)號(hào),姓名,性別,年齡,系名);碼(Key):表中的某個(gè)屬性組,它可以唯一確定一個(gè)元組,如表中的學(xué)號(hào),可以唯一確定一個(gè)學(xué)生記錄,也就成為本關(guān)系的碼;域(Domain):屬性的取值范圍,如人的年齡域在l~150歲之間,大學(xué)生年齡屬性的域是(14~38),性別的域是(男,女),系別的域是一個(gè)學(xué)校所有系名的集合;2.3邏輯數(shù)據(jù)模型分量(Component):元組中的一個(gè)屬性值;關(guān)系模式(Relationalschema):對關(guān)系的描述,一般表示為:關(guān)系名(屬性l,屬性2,…,屬性n)。例如上表的關(guān)系可描述為:學(xué)生(學(xué)號(hào),姓名,性別,年齡,系名)。在關(guān)系模型中,實(shí)體以及實(shí)體間的聯(lián)系都是用關(guān)系來表示。關(guān)系模型要求關(guān)系必須是規(guī)范化的,即要求關(guān)系必須滿足一定的規(guī)范條件,這些規(guī)范條件中最基本的一條就是,關(guān)系的每一個(gè)分量必須是一個(gè)不可分的數(shù)據(jù)項(xiàng),也就是說,不允許表中還有表,如表2-2中工資和扣除是可分的數(shù)據(jù)項(xiàng),工資又分為基本工資、津貼和職務(wù)工資,扣除又分為房租和水電。因此,表2-2就不符合關(guān)系模型要求。2.3邏輯數(shù)據(jù)模型2.關(guān)系模型的數(shù)據(jù)操作與完整性約束關(guān)系數(shù)據(jù)模型的操作主要包括查詢、插入、刪除和修改數(shù)據(jù)。這些操作必須滿足關(guān)系的完整性約束條件。關(guān)系模型中數(shù)據(jù)操作的特點(diǎn)是集合操作方式,即操作對象和操作結(jié)果都是集合,這種操作方式也稱為一次一集合的方式。相應(yīng)的,非關(guān)系數(shù)據(jù)模型的操作方式是一次一記錄的方式。關(guān)系的完整性約束條件包括三大類:實(shí)體完整性、參照完整性和用戶定義的完整性。實(shí)體完整性定義數(shù)據(jù)庫中每一個(gè)基本關(guān)系的主碼應(yīng)滿足的條件,能夠保證元組的唯一性。參照完整性定義表之間的引用關(guān)系,即參照與被參照關(guān)系。用戶定義完整性是用戶針對具體的應(yīng)用環(huán)境制定的數(shù)據(jù)規(guī)則,反映某一具體應(yīng)用所涉及的數(shù)據(jù)必須滿足的語義要求。數(shù)據(jù)完整性約束的具體內(nèi)容將在第3章詳細(xì)介紹。2.3邏輯數(shù)據(jù)模型3.關(guān)系模型的優(yōu)缺點(diǎn)關(guān)系數(shù)據(jù)模型的優(yōu)點(diǎn)主要體現(xiàn)在如下幾點(diǎn):

(1)關(guān)系模型與非關(guān)系模型不同,它是建立在嚴(yán)格的數(shù)學(xué)理論基礎(chǔ)上的。(2)關(guān)系模型的概念單一,實(shí)體與實(shí)體間的聯(lián)系都用關(guān)系表示,對數(shù)據(jù)的檢索結(jié)果也是關(guān)系(即表),所以其數(shù)據(jù)結(jié)構(gòu)簡單、清晰,用戶易懂易用。(3)關(guān)系模型的物理存儲(chǔ)和存取路徑對用戶透明,從而具有更高的數(shù)據(jù)獨(dú)立性、更好的安全保密性,簡化了程序員的工作和數(shù)據(jù)庫開發(fā)工作。關(guān)系數(shù)據(jù)模型的缺點(diǎn):(1)由于存取路徑對用戶透明,查詢效率往往不如非關(guān)系數(shù)據(jù)模型高。因此,為了提高性能,必須對用戶的查詢請求進(jìn)行優(yōu)化,這就增加了開發(fā)數(shù)據(jù)庫管理系統(tǒng)的難度和負(fù)擔(dān)。(2)關(guān)系數(shù)據(jù)模型不能以自然的方式表示實(shí)體集間的聯(lián)系,存在語義信息不足、數(shù)據(jù)類型過少等弱點(diǎn)。2.3邏輯數(shù)據(jù)模型2.3.5面向?qū)ο髷?shù)據(jù)模型面向?qū)ο髷?shù)據(jù)模型(Object-OrientedDataModel)吸取了層次、網(wǎng)狀、關(guān)系等各種數(shù)據(jù)模型的優(yōu)點(diǎn),并借鑒面向?qū)ο蟮脑O(shè)計(jì)方法,可以表達(dá)更為復(fù)雜的數(shù)據(jù)結(jié)構(gòu),對于具有復(fù)雜要求和嵌套遞歸關(guān)系的數(shù)據(jù)形式具有很強(qiáng)的表達(dá)能力。是近幾年來迅速崛起并得到飛速發(fā)展的數(shù)據(jù)模型。在面向?qū)ο髷?shù)據(jù)模型中,現(xiàn)實(shí)世界的任意實(shí)體都統(tǒng)一地用對象表示,每個(gè)對象都有唯一的標(biāo)識(shí),稱為對象標(biāo)識(shí)(ObjectIdentifier,OID)。每一個(gè)對象的定義包含狀態(tài)和行為兩個(gè)方面,狀態(tài)由一組屬性組成,行為由一組方法組成。通過方法可以改變對象的狀態(tài),對對象進(jìn)行各種數(shù)據(jù)庫操作。對象在被刪除前是永久存在的,即具有持久性。具有相同屬性和方法的對象構(gòu)成一個(gè)對象類(簡稱為類),一個(gè)對象是某一類的實(shí)例。例如,CUSTOMER類不僅含有客戶的屬性(比如CUST.ID、CUST.NAME和CUST.ADDRESS等),還包含模仿客戶行為(如修改訂單)的過程。具體的某個(gè)客戶,如王維是CUSTOMER類中的一個(gè)對象。在該對象內(nèi)部,用類的屬性CUST.ID的值來唯一區(qū)分每個(gè)客戶(對象),該類的所有對象共享類的行為模式。2.3邏輯數(shù)據(jù)模型在面向?qū)ο髷?shù)據(jù)庫中,對象是狀態(tài)和行為的封裝。從對象外部看,對象的狀態(tài)和行為是不可見的,對象之間的通信是通過消息傳遞來調(diào)用對象中的屬性和方法,從而內(nèi)部執(zhí)行要求的操作,操作的結(jié)果仍以消息的形式返回。面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng)(OODBMS)是數(shù)據(jù)庫管理中最新的方法,它們始于工程和設(shè)計(jì)領(lǐng)域的應(yīng)用,并且成為廣受金融、電信和萬維網(wǎng)(WWW)應(yīng)用歡迎的系統(tǒng)。它適用于多媒體應(yīng)用以及復(fù)雜的、很難在關(guān)系DBMS里模擬和處理的關(guān)系。1.面向?qū)ο竽P偷臄?shù)據(jù)結(jié)構(gòu)面向?qū)ο髷?shù)據(jù)模型的數(shù)據(jù)結(jié)構(gòu)是非常容易變化的。與傳統(tǒng)的數(shù)據(jù)庫(如層次、網(wǎng)狀或關(guān)系)不同,對象模型沒有單一固定的數(shù)據(jù)結(jié)構(gòu)。編程人員可以給類或?qū)ο箢愋投x任何有用的結(jié)構(gòu),例如鏈表、集合、數(shù)組等。此外,對象可以包含可變的復(fù)雜度,利用多重類型和多重結(jié)構(gòu)。2.面向?qū)ο髷?shù)據(jù)模型的優(yōu)缺點(diǎn)2.3邏輯數(shù)據(jù)模型面向?qū)ο髷?shù)據(jù)模型的優(yōu)點(diǎn):(1)適合處理各種各樣的數(shù)據(jù)類型與傳統(tǒng)的數(shù)據(jù)庫(如層次、網(wǎng)狀或關(guān)系)不同,面向?qū)ο髷?shù)據(jù)庫適合存儲(chǔ)不同類型的數(shù)據(jù),例如,圖片、聲音、視頻,包括文本、數(shù)字等。面向?qū)ο髷?shù)據(jù)模型結(jié)合了面向?qū)ο蟪绦蛟O(shè)計(jì)與數(shù)據(jù)庫技術(shù),因而提供了一個(gè)集成應(yīng)用開發(fā)系統(tǒng)。(2)提高了開發(fā)效率面向?qū)ο髷?shù)據(jù)模型提供強(qiáng)大的特性,例如繼承、多態(tài)和動(dòng)態(tài)綁定,這樣允許用戶不用編寫特定對象的代碼就可以構(gòu)成對象并提供解決方案。這些特性能有效地提高數(shù)據(jù)庫應(yīng)用程序開發(fā)人員的開發(fā)效率。(3)改善數(shù)據(jù)訪問面向?qū)ο髷?shù)據(jù)模型明確地表示聯(lián)系,支持導(dǎo)航式和關(guān)聯(lián)式兩種方式的信息訪問。它比2.3邏輯數(shù)據(jù)模型基于關(guān)系值的聯(lián)系更能提高數(shù)據(jù)訪問性能。面向?qū)ο髷?shù)據(jù)模型的缺點(diǎn):(1)沒有準(zhǔn)確的定義很難提供一個(gè)準(zhǔn)確的定義來說明面向?qū)ο驞BMS應(yīng)建成什么樣,這是因?yàn)樵撁Q已經(jīng)應(yīng)用到很多不同的產(chǎn)品和原型中,而這些產(chǎn)品和原型考慮的方面可能不一樣。(2)維護(hù)困難隨著組織信息需求的改變,對象的定義也要求改變并且需移植現(xiàn)有數(shù)據(jù)庫,以完成新對象的定義。當(dāng)改變對象的定義和移植數(shù)據(jù)庫時(shí),它可能面臨真正的挑戰(zhàn)。(3)不適合所有應(yīng)用面向?qū)ο髷?shù)據(jù)模型適合于需要管理數(shù)據(jù)對象之間存在復(fù)雜關(guān)系的應(yīng)用,特別適合于特定的應(yīng)用,例如工程、電子商務(wù)、醫(yī)療等,但并不適合所有應(yīng)用,當(dāng)用于普通應(yīng)用時(shí),其性能會(huì)降低并要求很高的處理能力。3.面向?qū)ο髷?shù)據(jù)模型與關(guān)系數(shù)據(jù)模型的對比2.3邏輯數(shù)據(jù)模型針對數(shù)據(jù)模型的三要素,對關(guān)系數(shù)據(jù)模型和面向?qū)ο髷?shù)據(jù)模型進(jìn)行比較:(1)在關(guān)系模型中基本數(shù)據(jù)結(jié)構(gòu)是表,而面向?qū)ο髷?shù)據(jù)模型中對應(yīng)的是類;關(guān)系中的數(shù)據(jù)元組相當(dāng)于面向?qū)ο髷?shù)據(jù)模型中的實(shí)例。(2)在關(guān)系數(shù)據(jù)模型中的數(shù)據(jù)操作都?xì)w結(jié)為對關(guān)系的運(yùn)算;在面向?qū)ο髷?shù)據(jù)模型中,對類的操作分為兩部分:一是封裝在類內(nèi)的操作即方法;二是類間相互溝通的操作即消息。(3)在關(guān)系數(shù)據(jù)模型中有實(shí)體完整性、參照完整性和用戶定義的完整性約束,約束條件可以用邏輯公式表示;在面向?qū)ο髷?shù)據(jù)模型中可以用方法或消息表示約束,稱為完整性約束消息。主要內(nèi)容2.4半結(jié)構(gòu)化數(shù)據(jù)模型2.1模型與數(shù)據(jù)模型2.3邏輯數(shù)據(jù)模型2.2概念數(shù)據(jù)模型2.4半結(jié)構(gòu)化數(shù)據(jù)模型關(guān)系數(shù)據(jù)庫中的數(shù)據(jù)是模式固定的結(jié)構(gòu)化數(shù)據(jù)。模式固定可以使數(shù)據(jù)組織成一定的數(shù)據(jù)結(jié)構(gòu),這樣能有效地支持查詢響應(yīng),但難以實(shí)現(xiàn)對數(shù)據(jù)結(jié)構(gòu)的動(dòng)態(tài)修改。半結(jié)構(gòu)化數(shù)據(jù)是介于結(jié)構(gòu)化數(shù)據(jù)和完全無結(jié)構(gòu)數(shù)據(jù)(如聲音文件、圖像文件等)之間的數(shù)據(jù)。它具有一定的結(jié)構(gòu),但是結(jié)構(gòu)不完整、不規(guī)則,或者結(jié)構(gòu)是隱含的,例如HTML文檔就是半結(jié)構(gòu)化數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)主要來源于網(wǎng)絡(luò),因?yàn)榫W(wǎng)絡(luò)對于數(shù)據(jù)的存儲(chǔ)是無嚴(yán)格模式限制的,如常見的HTML、XML等文件,就存在著大量結(jié)構(gòu)和內(nèi)容都不固定的數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)模型允許那些相同類型的數(shù)據(jù)項(xiàng)有不同的屬性集的數(shù)據(jù)說明。這和結(jié)構(gòu)化的數(shù)據(jù)模型形成了對比,因?yàn)樵谀切?shù)據(jù)模型中所有某種特定類型的數(shù)據(jù)項(xiàng)必須有相同的屬性集。半結(jié)構(gòu)化數(shù)據(jù)的產(chǎn)生背景和自身特點(diǎn)決定了要求其查詢必須能處理如下情形:(1)數(shù)據(jù)缺失與關(guān)系數(shù)據(jù)庫和面向?qū)ο髷?shù)據(jù)庫中的數(shù)據(jù)不同,半結(jié)構(gòu)化數(shù)據(jù)的模式不固定,同類實(shí)體的結(jié)構(gòu)也可能不同,這樣查詢時(shí)就會(huì)出現(xiàn)缺失數(shù)據(jù)。例如在公司人事檔案庫中,已婚雇員會(huì)有配偶項(xiàng)信息,而未婚的雇員則無該項(xiàng)信息;某些雇員有E-mail地址和家庭電話,而有些卻沒有,查詢這些項(xiàng)時(shí)就會(huì)有很多空值。因此,應(yīng)保證查詢在缺失數(shù)據(jù)時(shí)仍有意義.

2.4半結(jié)構(gòu)化數(shù)據(jù)模型(2)單值和集合值屬性兼容在傳統(tǒng)查詢語言如SQL、OQL、XSQL中,單值和集合值屬性是不兼容的,即集合不能按單值處理,單值也不能按集合處理。半結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)多樣可變,單值和集合結(jié)果的出現(xiàn)無法預(yù)料,用戶不能預(yù)先對數(shù)據(jù)結(jié)構(gòu)和模式進(jìn)行細(xì)致了解;同一查詢對不同半結(jié)構(gòu)化數(shù)據(jù),結(jié)果可能是單值,也可能是多值的。因此,要保證用兼容方式處理查詢的單值和集合值屬性。(3)查詢對象類型各異在WWW和異構(gòu)信息源集成時(shí),會(huì)有不少內(nèi)容相同而類型各異的問題。如一信息源上的電話信息是用字符串表示,而另一信息源上則可能用整數(shù)表示;有些電話信息上可能帶區(qū)號(hào),而有些則不帶。又如WWW上的主頁,相同實(shí)體的類型差異也很大,如主頁里的朋友項(xiàng),有的是用字符串給出名字,有的則帶有簡單描述信息或是指向其朋友的網(wǎng)絡(luò)地址。這就要求查詢處理時(shí)有寬松的類型限制或沒有類型檢查。(4)查詢返回結(jié)果異構(gòu)半結(jié)構(gòu)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論