第一章 數據庫系統(tǒng)概論_第1頁
第一章 數據庫系統(tǒng)概論_第2頁
第一章 數據庫系統(tǒng)概論_第3頁
第一章 數據庫系統(tǒng)概論_第4頁
第一章 數據庫系統(tǒng)概論_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章數據庫系統(tǒng)概論

主要講解內容數據數據庫數據庫管理系統(tǒng)數據庫系統(tǒng)數據庫系統(tǒng)的組成數據庫技術的發(fā)展歷史數據庫系統(tǒng)階段的主要特點數據庫系統(tǒng)結構三級模式結構與二級(層)映象功能數據的獨立性物理獨立性與邏輯獨立性數據庫系統(tǒng)的體系結構數據庫管理系統(tǒng)數據庫管理系統(tǒng)的主要功能數據庫管理系統(tǒng)的組成概念模型E-R表示方法

數據模型層次網狀關系人工管理階段文件系統(tǒng)階段1.1數據管理技術的發(fā)展應用程序1應用程序2應用程序n數據庫系統(tǒng)階段數據1數據2數據n文件系統(tǒng)物理文件1物理文件2物理文件n數據庫管理系統(tǒng)數據庫1.1數據管理技術的發(fā)展人工管理階段文件系統(tǒng)階段數據庫系統(tǒng)階段時間-50年代中期50年代后期-60年代中期60年代后期—應用背景科學計算科學計算、管理大規(guī)模管理硬件背景無直接存取存儲設備磁盤、磁鼓大容量磁盤軟件背景沒有操作系統(tǒng)有操作系統(tǒng)(文件系統(tǒng))有DBMS處理方式批處理批處理聯(lián)機實時處理批處理聯(lián)機實時處理分布處理數據庫技術的三個階段(續(xù)1)人工管理階段文件系統(tǒng)階段數據庫系統(tǒng)階段數據保存方式數據不保存以文件的形式長期保存,但無結構以數據形式保存,有結構數據管理考慮安排數據的物理存儲位置與數據文件名打交道對所有數據實行統(tǒng)一、集中、獨立的管理數據與程序數據面向程序數據與程序脫離數據與程序脫離實現數據的共享數據的管理者人文件系統(tǒng)DBMS數據面向的對象某一應用程序某一應用程序現實世界數據庫技術的三個階段(續(xù)2)人工管理階段文件系統(tǒng)階段數據庫系統(tǒng)階段數據的共享程度無共享共享性差共享性高數據的冗余度冗余度極大冗余度大冗余度小數據的獨立性不獨立,完全依賴于程序獨立性差具有高度的物理獨立性和一定的邏輯獨立性數據的結構化無結構記錄內有結構整體無結構整體結構化用數據模型描述數據的控制能力應用程序自己控制應用程序自己控制由DBMS提供數據的安全性、完整性、并發(fā)控制和恢復能力基本概念數據

描述現實世界中各種事物的符號記錄數據庫

長期儲存在計算機中的、有組織的、可共享的數據的集合數據庫管理系統(tǒng)

數據庫管理系統(tǒng)是為數據庫的建立、使用和維護而配置的軟件。它建立在操作系統(tǒng)的基礎上,對數據庫進行統(tǒng)一的管理和控制。數據庫系統(tǒng)

是實現在組織地、動態(tài)地存儲大量相關的結構化數據,方便各類用戶使用數據庫的計算機軟件/硬件資源的集合。數據庫系統(tǒng)由5部分組成:硬件系統(tǒng)、數據庫集合、數據庫管理系統(tǒng)及相關軟件、數據庫管理員和用戶。1.2數據描述1.2.1數據描述的3個領域從事物的特征到計算機中數據的表示,數據描述要經歷3個不同的領域:現實世界、信息世界和機器世界。信息世界指現實世界在人們頭腦中的反映。人們用文字、符號、圖形、圖像、聲音等方式記載下現實世界的信息,我們稱之為信息世界。在信息世界中,常用的術語有以下4個:實體(Entity):客觀存在可以相互區(qū)別的事物稱為實體。實體可以是具體的對象,例如:一個員工、一本教材等。也可以是抽象的事件,例如:一次旅游、一場球賽等。實體集(EntitySet):性質相同的同類實體的集合稱為實體集。例如,學生等。屬性(Attribute):實體有很多特性,每一個特性稱為一個屬性。每個屬性有一個數據類型和值域。例如:大學生有學號、姓名、年齡、性別等屬性。學號、姓名、性別的數據類型是字符串,而年齡的數據類型是整數,其值域在13~30之間。實體標識符(Identifier):能惟一標識每個實體的屬性或屬性集稱為實體標識符,或簡稱鍵。例如,學生的學號可以作為學生實體標識符機器世界信息世界的信息在機器中以數據形式存儲,成為機器世界。在機器世界中,常用的術語有以下4個:字段(Field):標記實體屬性的命名單位稱為字段或數據項。它是可以命名的最小信息單位,所以又稱為數據元素或初等項。字段的命名往往與屬性名相同。例如:一個學生記錄中有學號、姓名、年齡、性別等字段。記錄(Record):字段的有序集合稱為記錄。一般用一個記錄描述一個實體,所以記錄又可以定義為能完整地描述一個實體的字段集。例如:一個學生記錄由有序的字段集組成:(學號,姓名,年齡,性別)?;颈恚˙asicTable):描述一個實體集的所有記錄的集合。有的數據庫管理系統(tǒng),一個基本表就對應一個數據文件(File)。關鍵碼(Key):能惟一標識基本表中每個記錄的字段或字段集。1.2.2數據聯(lián)系的描述1對1、1對多、多對多1.3數據模型數據模型是表示實體類型和實體間聯(lián)系的模型,是現實世界中的事物及其間聯(lián)系的一種抽象表示,是一種形式化描述數據、數據間聯(lián)系以及有關語義約束規(guī)則的方法。對象的抽象過程第一級抽象現實世界信息世界概念模型機器世界數據模型第二級抽象事物個體 實體 記錄事物總體 實體集 文件特征 屬性 字段事物間聯(lián)系 實體模型 數據模型認識抽象轉換第一級抽象:概念模型

數據模型是數據庫系統(tǒng)的核心和基礎。各種機器上實現的DBMS軟件都是基于某種數據模型的。為了把現實世界中的具體事物抽象、組織為某一DBMS支持的數據模型,人們常常首先將現實世界抽象為信息世界,然后將信息世界轉換為機器世界。也就是說,首先把現實世界中的客觀對象抽象為某一種信息結構,這種信息結構并不依賴于具體的計算機系統(tǒng),不是某一個DBMS支持的數據模型,而是概念級的模型;然后再把概念模型轉換為計算機上某一DBMS支持的數據模型,不難看出,概念模型實際上是現實世界到機器世界的一個中間層次。概念模型1)信息世界中的基本概念(1)實體客觀存在并相互區(qū)別的事物(2)實體集

1.性質相同的同類實體的集合

2.實體整體

3.例子所有的學生(3)屬性1.實體所具有的某一特性2.用若干個屬性來描述實體3.包含(1)屬性的型:學生(姓名,系別……)(2)屬性的值:學生(張三,計算機系……)(4)實體型1.用若干個屬性型所組成的集合表征一個實體類型2.用實體名及其屬性名集合來抽象和刻畫同類實體3.例如:學生(學號、姓名、系別……)(5)碼1.唯一標識實體的屬性集2.實體鍵、關鍵字(段)3.把某個實體個體與其他實體個體區(qū)分來開(成績表)(6)域1.屬性的取值范圍(7)聯(lián)系1.一對一聯(lián)系(1:1)2.一對多聯(lián)系(1:n)3.多對多聯(lián)系(m:n)2)概念模型的表示方法(實體聯(lián)系方法)(1)實體-聯(lián)系方法(E-R圖)由來

E-R數據模型,即實體-聯(lián)系模型,是P.P.S.Chen于1976年提出的一種語義數據模型.用E-R數據模型描述現實世界,不必考慮信息的存儲機構,存取路徑及存取效率如何在計算機中實現.所以該模型是面向現實世界,而不是面向機器的實現.(2)E-R數據模型的基本概念

設計E—R數據模型的目標是有效地和自然地模擬現實世界,而不是它在機器中如何實現,因此E—R數據模型只應包含那些對描述現實世界有普遍意義的抽象概念。下面介紹E—R數據模型的3個基本的抽象概念:實體、聯(lián)系和屬性。1實體(Entny)

實體是客觀存在的且可以區(qū)別的事物。現實世界由各種各樣的實體組成。實體可以是有生命的,也可以是無生命的;可以是具體的,也可以是抽象的概念。例如學生、教師、文化藝術、信息技術、夢、愛與恨……都是實體。所以,實體具有客觀存在和可區(qū)分的墓本特征。在數據庫設計中,常常關心具有相同性質的實體的集合。這種具有相同性質的一類實體的集合稱為實體集(EntitySets),如全校學生的集合組成學生實體集。實體集中各個實體是借助實體標識符(稱為關鍵字)加以區(qū)別的。例如,可以定義學校的“教師”為一實體集,而學校中每個教師都是該實體集的成員。2.聯(lián)系(Relationship)

聯(lián)系是實體集之間關系的抽象表示,即對現實世界中事物之間關系的描述。如教師實體集與學生實體集間的“講授”聯(lián)系,公司實體集與職工實體集之間的“聘任”聯(lián)系等。如果參與聯(lián)系的實體集的數目為n,則稱這種聯(lián)系數為n元聯(lián)系。根據聯(lián)系的元數不同,通常把聯(lián)系分為如下幾類:

(1)二元聯(lián)系:只有兩個實體集參與的聯(lián)系稱為二元聯(lián)系,它是現實世界中大量存在的聯(lián)系。E—R數據模型中為了給聯(lián)系提供更多的語義,二元聯(lián)系可進——步區(qū)分為1:1、l:n和m:n三種,并在E—R圖中顯式地表示出這些語義。(2)多元聯(lián)系:參與聯(lián)系的實體集個數>=3時,稱為多元聯(lián)系例:學生書店和圖書購成“購書”聯(lián)系是三元聯(lián)系(3)自反聯(lián)系:它描述了同一實體集內兩部分實體之間的聯(lián)系,是一種特殊的二元聯(lián)系。也可區(qū)分為1:1,1:M和M:N例:人中的夫與妻職工中的領導與被領導3.屬性(Attribute)

實體或聯(lián)系所具有的特征稱之為屬性。實體由特征來表征和區(qū)分,通常一個實體可以由多個屬性來描述,即實體可用屬性集表示。例如學生實體可用學號、姓名、性別、年齡、系、籍貫等屬性來描述。不僅實體可以用屬性來描述,聯(lián)系也可以用屬性來描述使其語義更加豐富。例如學生實休集和課程實體集間存在m:n的“選課”聯(lián)系,這種聯(lián)系可以有“成績”、“選修時間”等屬性。有關屬性的幾點說明如下:表示方法1.實體型:矩形+實體名2.屬性:橢圓形,無向邊與實體連接3.聯(lián)系:菱形+聯(lián)系名,無向邊與實體連接,邊上標注聯(lián)系類型在E=R圖中,有時為了突出各實體集之間的聯(lián)系,略去了實體集或聯(lián)系的屬性.這種省去了屬性的E=R圖稱為E-R簡圖校長負責學校11系部聘任教師1n教師教學學生mnE-R圖實例職工號姓名性別年齡職稱書號書名簡介價格課程名學分課程號專業(yè)系班編號成績學號姓名性別年齡教師參考書講授課程mn1選修mn領導1n學生組成班級n1實體集聯(lián)系學員屬性第二級抽象機器世界的數據模型數據模型

1)實體模型→數據模型

2)實體集→文件

3)實體→記錄

4)實體型→記錄型

5)屬性→數據項、字段數據模型種類層次模型(HierarchicalModel)

網狀模型(NetworkModel)

關系模型(RelationalModel)層次模型

代表系統(tǒng)IBM的IMS

數據結構樹型結構(一對多關系)1:1或1:N

只有一個根結點:無雙親其他結點有且只有一個雙親基本概念兄弟同一個雙親的結點稱為兄弟葉子無子女的結點,稱為葉子學校行政機構的層次模型校教研室系科處研究所研究室層次模型示例

優(yōu)點1.數據模型簡單2.若實體間的關系固定,性能優(yōu)于關系模型3.良好的完整性支持缺點1.描述現實世界的非層次性很笨拙2.插入和刪除操作限制較多3.必須通過雙親才能找到子結點4.由于結構嚴密,層次命令趨于程序化網狀模型(1)代表系統(tǒng)

CODASYL的DBTG(2)數據結構:網狀結構1.允許多個結點無雙親2.允許結點有多個雙親3.允許結點間有多個聯(lián)系(復合聯(lián)系)

操縱與完整性約束1.允許插入無雙親的子結點2.允許只刪除雙親結點3.更新操作較簡單存儲結構1.鏈接法優(yōu)點1.能夠直接描述現實世界2.存取效率較高缺點1.數據描述語言極其復雜2.數據獨立性差關系模型(1)代表系統(tǒng)1.Oracle2.Sybase3.VFP4.Access5.xBASE(2)數據結構:關系模型(規(guī)范的二維表)(3)概念1.關系:整個二維表2.關系名:表格名稱3.元組:行數據(記錄)4.屬性名:列名稱(字段名)5.屬性:列數據(字段)6.主碼:唯一確定元組的屬性組(關鍵字)7.域:屬性的取值范圍8.分量:元組中的一個屬性值9.關系模式:關系名(屬性……),如:學生(學號,姓名,性別,系別,年齡,籍貫)(4)操縱與完整性約束1.操縱:查詢、更新(插入、修改、刪除)2.完整性:實體完整性、參照完整性、用戶定義完整性3.操作的對象與結果都是關系4.數據獨立性高(隱蔽存取路徑)(5)存儲結構1.以文件形式存儲表(6)優(yōu)點1.有嚴格的數學概念作基礎2.關系模型的概念單一3.存取路徑對用戶透明(7)缺點1.查詢效率不高關系數據模型學號姓名性別年齡籍貫9901李勇男20江蘇9902劉晨女19山東9903王明女20北京9999張立男18陜西學生學籍記錄表關系名關系元組(行)屬性(列)主碼男女域分量關系模式:學生(學號、姓名、性別、年齡、籍貫)屬性名數據庫中的表/關系學號 姓名 專業(yè) 選修課程 任課教師9003105 張鵬 計算機應用 計算機系統(tǒng)結構 唐飛9003212 吳俊武 計算機軟件 數據結構 王小棟9003223 廖凱 計算機軟件 程序設計語言 陸非9003214 李娜 計算機軟件 形式語言 蔣濤…

學生選課登記表表、關系:由關系模式和元組構成值域:列數據的取值范圍如,十個漢字以內的文字串關系模式:由表名和屬性名構成如,學生選課登記表(學號,姓名,專業(yè),選修課程,任課教師)列、字段、屬性、數據項:列有名稱(屬性名),有值/數據(數據項)如,屬性名為“專業(yè)”,數據項為“計算機應用”,“計算機軟件”行、元組、記錄:由數據構成表名:學生選課登記表如,(9003212,吳俊武,計算機軟件,數據結構,王小棟)(9003223,廖凱,計算機軟件,程序設計語言,陸非)1.4數據庫系統(tǒng)的體系結構注:我們可以從不同的角度考察數據庫體系結構;從數據庫管理系統(tǒng)的抽象層次看,數據庫系統(tǒng)通常采用三級模式結構。從最終用戶角度來看,數據庫系統(tǒng)分為單用戶結構、主從式結構、分布式結構和客戶/服務器結構。1)模式(1)數據庫中全體數據的邏輯結構和特征的描述(2)僅涉及到數據類型的描述,不涉及到具體的數值(實例)(3)模式是穩(wěn)定的,實例是相對變動的(4)模式反映數據的結構和關系,實例反映數據庫某時刻的狀態(tài)數據庫系統(tǒng)的三級模式結構數據庫系統(tǒng)的三級模式結構_外模式(1)外模式(也叫子模式或用戶模式)1.是數據庫用戶看見和使用的局部數據的邏輯結構和特性的描述2.是數據庫用戶的數據視圖3.描述數據的局部邏輯結構4.是概念模式的邏輯子集5.有多個外模式(不同的用戶有不同的外模式)6.用戶通過外模式訪問數據庫7.與用戶看待數據庫方式有關的層數據庫系統(tǒng)的三級模式結構_模式(2)概念模式(邏輯模式或簡稱模式)1.是數據庫中全體數據的邏輯結構和特性的描述2.是所有用戶的公共數據視圖3.所有個別用戶視圖綜合起來的用戶共同視圖4.描述數據的全局邏輯結構5.只有一個概念模式,它是數據系統(tǒng)三級模式結構的中間層數據庫系統(tǒng)的三級模式結構_內模式(3)內模式(存儲模式)1.與實際存儲數據方式有關的層2.數據的物理結構和存儲結構的描述3.數據在數據庫內部的表示方式4.描述數據的物理存儲結構5.存儲方式、索引、壓縮加密6.只有一個內模式2)數據庫的二層映象功能與數據獨立性

正是這兩層映像保證了數據庫系統(tǒng)中的數據具有較高的數據邏輯獨立性與數據物理獨立性(1)外模式/概念模式的映象1.定義外模式與概念模式的對應關系2.概念模式改變→改變映象→外模式不變→應用程序不變3.保證數據的邏輯獨立性(2)概念模式/內模式的映象1.定義數據的全局邏輯結構與存儲結構的對應關系2.存儲結構改變→映象改變→概念模式不變→3.保證數據的物理獨立性3)三級結構帶來的優(yōu)點(1)保證數據的獨立性(2)簡化了用戶的使用(3)減少冗余,利于共享(4)有利于數據的安全操作4)數據庫系統(tǒng)的體系結構(從最終用戶角度來看)單用戶主從式分布式客戶機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論