第五章數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第1頁
第五章數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第2頁
第五章數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第3頁
第五章數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第4頁
第五章數(shù)據(jù)庫和數(shù)據(jù)庫管理系統(tǒng)_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 版權(quán)所有 2011-2013 長安大學(xué)經(jīng)濟與管理學(xué)院Management Information Systems 版權(quán)所有 2011-2013 長安大學(xué)經(jīng)濟與管理學(xué)院 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P35.1 數(shù)據(jù)庫管理系統(tǒng)的軟件層次 硬件 操作系統(tǒng)數(shù)據(jù)庫管理系統(tǒng) 系統(tǒng)軟件 應(yīng)用軟件 用戶MIS軟件層次 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P45.2 數(shù)據(jù)組織l 數(shù)據(jù):對現(xiàn)實事物的記錄或描述。數(shù)據(jù):對現(xiàn)實事物的記錄或描述。 可包括若干數(shù)據(jù)項可包括若干數(shù)據(jù)項 與數(shù)字、數(shù)值與數(shù)字、數(shù)值1,2,31,2,3有區(qū)別有區(qū)別 在在DBDB中,能被計算機接受和處理的數(shù)

2、字、字符、中,能被計算機接受和處理的數(shù)字、字符、圖形、聲音統(tǒng)稱為數(shù)據(jù)。圖形、聲音統(tǒng)稱為數(shù)據(jù)。 比如,職工的數(shù)據(jù)可包括:姓名(字符),年比如,職工的數(shù)據(jù)可包括:姓名(字符),年齡(數(shù)字),照片(圖像)等。齡(數(shù)字),照片(圖像)等。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P55.2 數(shù)據(jù)組織l數(shù)據(jù)模型數(shù)據(jù)模型 是對數(shù)據(jù)的某種抽象表示形式,是描述數(shù)據(jù)的一組概念和定是對數(shù)據(jù)的某種抽象表示形式,是描述數(shù)據(jù)的一組概念和定義。數(shù)據(jù)模型決定了對數(shù)據(jù)項的組織方式。描述包括:義。數(shù)據(jù)模型決定了對數(shù)據(jù)項的組織方式。描述包括:靜態(tài)(結(jié)構(gòu)、聯(lián)系、約束)靜態(tài)(結(jié)構(gòu)、聯(lián)系、約束)動態(tài):定義在數(shù)據(jù)上的操作動態(tài)

3、:定義在數(shù)據(jù)上的操作 n邏輯數(shù)據(jù)模型與物理數(shù)據(jù)模型邏輯數(shù)據(jù)模型與物理數(shù)據(jù)模型 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P65.2 數(shù)據(jù)組織n數(shù)據(jù)項(數(shù)據(jù)項(FieldField):描述實體的一個屬性。):描述實體的一個屬性。n記錄(記錄(RecordRecord):與數(shù)據(jù)處理的某一對象有關(guān)的一切數(shù)據(jù)項):與數(shù)據(jù)處理的某一對象有關(guān)的一切數(shù)據(jù)項排列成一個記錄。排列成一個記錄。Collection of related fieldsCollection of related fieldsn文件(文件(FileFile):相關(guān)記錄的集合構(gòu)成文件。):相關(guān)記錄的集合構(gòu)成文件。 Collect

4、ion of related recordsCollection of related records 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P75.2 數(shù)據(jù)組織數(shù)據(jù)層次 層次 示例 數(shù)據(jù)庫 學(xué)生數(shù)據(jù)庫課程文件,簡歷文件,財務(wù)文件 文件課程號課程名學(xué)分學(xué)時J101數(shù)學(xué)10100Y201物理880W301化學(xué)880 記錄課課程號號課課程名學(xué)學(xué)分學(xué)時學(xué)時 J101數(shù)學(xué)10100 數(shù)據(jù)項 J101(課程號字段) 字節(jié) 10101010(字母J的ASC11碼) 位 0A hierarchy of several levels of data has been devised that d

5、ifferentiates between the most simple groupings or elements of data and more complex data elements. 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P85.2 數(shù)據(jù)組織n實體:數(shù)據(jù)所代表的事件或事物,實體:數(shù)據(jù)所代表的事件或事物, 如職工甲(如職工甲(PersonPerson,PlacePlace,ThingThing,EventEvent about which data must be kept about which data must be kept)n屬性:實體的特征。(屬性:實體

6、的特征。(Description of a Description of a particular ENITYparticular ENITY)n屬性域:屬性值的變化范圍。屬性域:屬性值的變化范圍。n實體集:實體的集合。如全廠職工。實體集:實體的集合。如全廠職工。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P95.2 數(shù)據(jù)組織n現(xiàn)實世界現(xiàn)實世界 存在于人們頭腦之外的客觀世界存在于人們頭腦之外的客觀世界 n信息世界信息世界 現(xiàn)實世界在人們頭腦中的反映,人們把它用文字和符號記現(xiàn)實世界在人們頭腦中的反映,人們把它用文字和符號記載下來。載下來。n 數(shù)據(jù)世界數(shù)據(jù)世界 信息世界的信息在機器世界中

7、以數(shù)據(jù)形式存儲。信息世界的信息在機器世界中以數(shù)據(jù)形式存儲。 現(xiàn)實現(xiàn)實 世界世界 信息世信息世 界或概界或概念模型念模型 數(shù)據(jù)數(shù)據(jù) 世界世界 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P105.2 數(shù)據(jù)組織現(xiàn)實世界現(xiàn)實世界信息世界數(shù)數(shù)據(jù)世界例子全體實實體集文件某場場全體職職工的個個人數(shù)數(shù)據(jù)資資料個個體實實體記錄記錄職職工張張三的數(shù)數(shù)據(jù)特征屬屬性數(shù)數(shù)據(jù)項項(字段) (張張三,男,25,工程師師) 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P115.2 數(shù)據(jù)組織Field in Each RecordUniquely Identifies THIS Record For Retr

8、ieval Updating Sorting 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P125.3 文件組織n文件結(jié)構(gòu)(組織)問題不是文件結(jié)構(gòu)(組織)問題不是DBDB出現(xiàn)后才有的,在文件系統(tǒng)中出現(xiàn)后才有的,在文件系統(tǒng)中已經(jīng)充分研究過。目前,文件管理仍是已經(jīng)充分研究過。目前,文件管理仍是OSOS的主要功能之一。的主要功能之一。有些有些DBMSDBMS就以就以O(shè)SOS的文件管理作為其物理層的基礎(chǔ)。更多的的文件管理作為其物理層的基礎(chǔ)。更多的DBMSDBMS獨立設(shè)計存儲結(jié)構(gòu)。獨立設(shè)計存儲結(jié)構(gòu)。nDBDB中的文件既繼承了傳統(tǒng)系統(tǒng)的某些技術(shù),又有與之相區(qū)別中的文件既繼承了傳統(tǒng)系統(tǒng)的某些技術(shù),又

9、有與之相區(qū)別的特點。的特點。n文件組織關(guān)系到數(shù)據(jù)處理的效率和對記錄的操作方式。文件組織關(guān)系到數(shù)據(jù)處理的效率和對記錄的操作方式。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P135.3 文件組織n記錄按其在文件中的邏輯順序依次進入存儲介質(zhì)而建立的文記錄按其在文件中的邏輯順序依次進入存儲介質(zhì)而建立的文件,一個記錄緊接前一個記錄順序排列。如磁帶文件。件,一個記錄緊接前一個記錄順序排列。如磁帶文件。n連續(xù)存取的速度快,適用于批處理和定期處理任務(wù)。連續(xù)存取的速度快,適用于批處理和定期處理任務(wù)。 如,數(shù)據(jù)備份和定期的財務(wù)報表。如,數(shù)據(jù)備份和定期的財務(wù)報表。 版權(quán)所有 2011-2015 長安大學(xué)

10、經(jīng)濟與管理學(xué)院P145.3 文件組織n 將記錄的某一屬性用散列函數(shù)直接映射成記錄的地址。將記錄的某一屬性用散列函數(shù)直接映射成記錄的地址。n 在數(shù)據(jù)庫系統(tǒng)中用的還不多。在數(shù)據(jù)庫系統(tǒng)中用的還不多。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P155.3 文件組織關(guān)鍵字關(guān)鍵字(學(xué)號)(學(xué)號) 地址地址1101G1102C1103E1104A 學(xué)號學(xué)號 姓名姓名 專業(yè)專業(yè)1104 張三MIS1102 李四MIS1103 錢亮MIS1101 于明MIS索引表數(shù)據(jù)文件索引文件的一般結(jié)構(gòu)索引文件的一般結(jié)構(gòu)兩部分:索引區(qū)數(shù)據(jù)區(qū)前部分:數(shù)據(jù)項、通常就是關(guān)鍵字后部分:記錄的存儲地址指針ACEG 版權(quán)所有

11、 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P165.3 文件組織n先根據(jù)關(guān)鍵字從索引表中查出記錄所在的位置,然后再到該先根據(jù)關(guān)鍵字從索引表中查出記錄所在的位置,然后再到該位置取出數(shù)據(jù)。位置取出數(shù)據(jù)。n邏輯順序與記錄的物理順序無關(guān)。邏輯順序與記錄的物理順序無關(guān)。n提高查詢效率。提高查詢效率。n索引本身要占一定的存儲空間。索引本身要占一定的存儲空間。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P175.3 文件組織n不出現(xiàn)或很少出現(xiàn)在查詢條件中的屬性。不出現(xiàn)或很少出現(xiàn)在查詢條件中的屬性。n屬性值很少的屬性,如:性別,用索引還不如順序掃描。屬性值很少的屬性,如:性別,用索引還不如順序掃描

12、。n屬性值分布嚴重不均的屬性,如:職工年齡。屬性值分布嚴重不均的屬性,如:職工年齡。n經(jīng)常更新的屬性或表,因為更新時索引需要保護。經(jīng)常更新的屬性或表,因為更新時索引需要保護。滿足下列條件之一的屬性或表不宜建立索引:滿足下列條件之一的屬性或表不宜建立索引: 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P185.3 文件組織n主關(guān)鍵字一般可以建立索引。主關(guān)鍵字一般可以建立索引。n以讀為主或只讀的表,只要需要,且存儲空間允許,可建以讀為主或只讀的表,只要需要,且存儲空間允許,可建索引。索引。n有些查詢可以從索引直接得到結(jié)果,不必訪問數(shù)據(jù)塊,宜有些查詢可以從索引直接得到結(jié)果,不必訪問數(shù)據(jù)塊,宜

13、建索引。如查詢某屬性的建索引。如查詢某屬性的MINMIN或或MAXMAX。n對于等值查詢(即查詢條件中以等號為比較符),如果滿對于等值查詢(即查詢條件中以等號為比較符),如果滿足條件的元組是少量的,可考慮在有關(guān)的屬性上建索引。足條件的元組是少量的,可考慮在有關(guān)的屬性上建索引。宜建索引:宜建索引: 數(shù)據(jù)庫系統(tǒng)運行以后還可以進行調(diào)整,有些索引一時難以決定數(shù)據(jù)庫系統(tǒng)運行以后還可以進行調(diào)整,有些索引一時難以決定是否建立,可留待運行時通過實驗來確定。是否建立,可留待運行時通過實驗來確定。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P195.4 數(shù)據(jù)管理技術(shù)的發(fā)展(1 1)人工管理階段)人工管理

14、階段應(yīng)用程序應(yīng)用程序1 1數(shù)據(jù)組數(shù)據(jù)組1 1應(yīng)用程序應(yīng)用程序2 2數(shù)據(jù)組數(shù)據(jù)組2 2應(yīng)用程序應(yīng)用程序n n數(shù)據(jù)組數(shù)據(jù)組n n 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P205.4 數(shù)據(jù)管理技術(shù)的發(fā)展(2 2)文件管理階段)文件管理階段應(yīng)用程序1數(shù)據(jù)文件2應(yīng)用程序2應(yīng)用程序n文件系統(tǒng)操作系統(tǒng)操作系統(tǒng)數(shù)據(jù)文件1數(shù)據(jù)文件n 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P215.4 數(shù)據(jù)管理技術(shù)的發(fā)展n數(shù)據(jù)和程序結(jié)合為一個不可分的整體。數(shù)據(jù)和程序結(jié)合為一個不可分的整體。n一組數(shù)據(jù)對應(yīng)一個應(yīng)用程序。一組數(shù)據(jù)對應(yīng)一個應(yīng)用程序。n數(shù)據(jù)文件應(yīng)應(yīng)用程序的要求而建立。數(shù)據(jù)文件應(yīng)應(yīng)用程序的要求而

15、建立。n程序和數(shù)據(jù)有一定的獨立性,仍相互依賴。程序和數(shù)據(jù)有一定的獨立性,仍相互依賴。n各文件相互獨立,分散保管。數(shù)據(jù)的一致性不易控制。各文件相互獨立,分散保管。數(shù)據(jù)的一致性不易控制。n文件系統(tǒng)是用戶和用戶應(yīng)用程序與數(shù)據(jù)文件間的接口。文件系統(tǒng)是用戶和用戶應(yīng)用程序與數(shù)據(jù)文件間的接口。人工管理階段文件管理階段 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P225.4 數(shù)據(jù)管理技術(shù)的發(fā)展(3 3)數(shù)據(jù)庫方法階段)數(shù)據(jù)庫方法階段使用數(shù)據(jù)庫管理系統(tǒng)使用數(shù)據(jù)庫管理系統(tǒng)DBMSDBMS。不僅描述數(shù)據(jù)本身,還描述數(shù)據(jù)之間的聯(lián)系。不僅描述數(shù)據(jù)本身,還描述數(shù)據(jù)之間的聯(lián)系。數(shù)據(jù)在統(tǒng)一控制下,為盡可能多的用戶服

16、務(wù)。數(shù)據(jù)在統(tǒng)一控制下,為盡可能多的用戶服務(wù)。 用戶或用戶程序數(shù)據(jù)庫管理系統(tǒng)如Access,F(xiàn)oxpro,Oracle,DB2等用戶或用戶程序用戶或用戶程序數(shù)據(jù)庫 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P235.4 數(shù)據(jù)管理技術(shù)的發(fā)展硬件數(shù)據(jù)庫 OS DBMS批處理接口批處理接口用戶接口用戶接口應(yīng)用程序應(yīng)用程序數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成DBMSDBMS,負責數(shù)據(jù),負責數(shù)據(jù)庫的定義、建立、庫的定義、建立、操縱、管理和維護操縱、管理和維護 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P245.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫的優(yōu)點:數(shù)據(jù)庫的優(yōu)點:n數(shù)據(jù)

17、獨立性強數(shù)據(jù)獨立性強物理獨立性強,數(shù)據(jù)庫的物理組織發(fā)生變化不影響數(shù)據(jù)的物理獨立性強,數(shù)據(jù)庫的物理組織發(fā)生變化不影響數(shù)據(jù)的邏輯結(jié)構(gòu)。邏輯結(jié)構(gòu)。邏輯獨立性強,數(shù)據(jù)庫的邏輯結(jié)構(gòu)改變時,無須改變應(yīng)用邏輯獨立性強,數(shù)據(jù)庫的邏輯結(jié)構(gòu)改變時,無須改變應(yīng)用程序。程序。n數(shù)據(jù)冗余度(數(shù)據(jù)冗余度(data redundancydata redundancy)小。)小。n數(shù)據(jù)的共享性高。數(shù)據(jù)的共享性高。n數(shù)據(jù)的一致性好。數(shù)據(jù)的一致性好。n有數(shù)據(jù)安全和完整性保障。有數(shù)據(jù)安全和完整性保障。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P255.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成 ANSI ANS

18、I 提出的數(shù)據(jù)庫結(jié)構(gòu)的標準化建議:提出的數(shù)據(jù)庫結(jié)構(gòu)的標準化建議:p用戶級,用戶級,亦稱外模式。亦稱外模式。 是數(shù)據(jù)庫用戶看到的數(shù)據(jù)視圖。是數(shù)據(jù)庫用戶看到的數(shù)據(jù)視圖。p概念級,稱為概念模式,模式。概念級,稱為概念模式,模式。 對數(shù)據(jù)庫整體邏輯結(jié)構(gòu)的描述。對數(shù)據(jù)庫整體邏輯結(jié)構(gòu)的描述。 統(tǒng)一考慮所有用戶現(xiàn)在和未來的需求,并把這些需求所涉及統(tǒng)一考慮所有用戶現(xiàn)在和未來的需求,并把這些需求所涉及的記錄及記錄間的聯(lián)系有機地結(jié)合成一個邏輯整體。的記錄及記錄間的聯(lián)系有機地結(jié)合成一個邏輯整體。p物理級,又稱內(nèi)模式或存儲模式。物理級,又稱內(nèi)模式或存儲模式。 對數(shù)據(jù)物理結(jié)構(gòu)和存儲方式的描述,對用戶是透明的。對數(shù)據(jù)物理

19、結(jié)構(gòu)和存儲方式的描述,對用戶是透明的。 物理組織修改后,不必修改模式。物理組織修改后,不必修改模式。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P265.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成用戶用戶用戶子模式子模式子模式-模式映射模式模式/存儲模式映射 存儲模式用戶級概念級物理級用戶視圖DBA視圖系統(tǒng)管理員視圖 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P275.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成pDBDB概念模型:層次模型、網(wǎng)絡(luò)模型、關(guān)系模型概念模型:層次模型、網(wǎng)絡(luò)模型、關(guān)系模型 pRDBRDB在在8080年代退出,新推出的年代退出,新推出的

20、DBMSDBMS幾乎都支持關(guān)系模型。幾乎都支持關(guān)系模型。 p關(guān)系模型以表(關(guān)系模型以表(TableTable)這一統(tǒng)一形式來表示數(shù)據(jù)的邏輯結(jié)構(gòu)。)這一統(tǒng)一形式來表示數(shù)據(jù)的邏輯結(jié)構(gòu)。p關(guān)系數(shù)據(jù)庫有一套完善的關(guān)系代數(shù)理論和方法支持。關(guān)系數(shù)據(jù)庫有一套完善的關(guān)系代數(shù)理論和方法支持。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P285.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成(一)層次模型(一)層次模型p層次模型的數(shù)據(jù)結(jié)構(gòu)層次模型的數(shù)據(jù)結(jié)構(gòu)用樹形結(jié)構(gòu)來表示實體之間聯(lián)系的模型叫層次模型。用樹形結(jié)構(gòu)來表示實體之間聯(lián)系的模型叫層次模型。層次數(shù)據(jù)庫系統(tǒng)的典型代表是層次數(shù)據(jù)庫系統(tǒng)的典型代表是I

21、BMIBM公司的公司的IMSIMS系統(tǒng)。系統(tǒng)。 p特點特點每個記錄只有一個父節(jié)點,每個記錄只有一個父節(jié)點, 當表示當表示M:NM:N關(guān)系時必然存關(guān)系時必然存在冗余。在冗余。只有一個節(jié)點無父節(jié)點。只有一個節(jié)點無父節(jié)點??偸菑母赣涗浿赶蜃佑涗???偸菑母赣涗浿赶蜃佑涗洝?版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P295.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成一個單位的層次模型可有多棵樹構(gòu)成。一個單位的層次模型可有多棵樹構(gòu)成。聯(lián)系一般用指針實現(xiàn)(或物理鄰接)聯(lián)系一般用指針實現(xiàn)(或物理鄰接)每一個記錄只有一條查找路徑。每一個記錄只有一條查找路徑。 (二)網(wǎng)狀模型(二)網(wǎng)狀模型p

22、概念概念 用有向圖結(jié)構(gòu)表示實體類型及實體間的聯(lián)系。用有向圖結(jié)構(gòu)表示實體類型及實體間的聯(lián)系。 網(wǎng)狀數(shù)據(jù)模型的典型代表是網(wǎng)狀數(shù)據(jù)模型的典型代表是DBTGDBTG系統(tǒng)系統(tǒng) 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P305.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成。 p 特點特點 可以有一個以上的結(jié)點無父結(jié)點??梢杂幸粋€以上的結(jié)點無父結(jié)點。 至少有一個節(jié)點多于一個父節(jié)點。至少有一個節(jié)點多于一個父節(jié)點。 聯(lián)系由指針實現(xiàn)。聯(lián)系由指針實現(xiàn)。 每個記錄可有多條查找路徑。每個記錄可有多條查找路徑。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P315.4 數(shù)據(jù)管理技術(shù)的發(fā)展學(xué)號姓名

23、 年齡 性別 課號姓名 年齡 性別 學(xué)生s課程c 通過通過LinkLink聯(lián)系記錄表達聯(lián)系記錄表達m m:n n關(guān)系。關(guān)系。 用戶在使用網(wǎng)狀用戶在使用網(wǎng)狀DBDB時,不但要說明做什么,而且還要說明怎時,不但要說明做什么,而且還要說明怎么做,即給出存儲路徑。么做,即給出存儲路徑。學(xué)號課程號 成績 學(xué)生選課sc 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P325.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成(三)關(guān)系模型(三)關(guān)系模型l Data in Table Formatl 關(guān)系Relation:Tablel 元組Tuple: Row(Record) in Tablel Fi

24、eld: Colum(Attribute) in TableHoursRateTotalABLE40.5010.35410.58BAXTER38.508.75332.50CHEN42.709.25440.50DENVER35.909.50341.75 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P335.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成代號代號生產(chǎn)廠家生產(chǎn)廠家城市城市S2機床配件廠北京S4工業(yè)設(shè)備廠西安代號代號編號編號數(shù)量數(shù)量S2P1300S2P2400S4P2300S4P2500S4P2600編編號號名稱名稱材質(zhì)材質(zhì)規(guī)格規(guī)格P1螺絲帽鋼12P2螺栓鐵27P4螺絲釘銅

25、14P5法蘭盤鋁12從漢從漢川機川機床廠床廠購進購進了那了那些零些零部件?部件? 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P345.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成l在在RDBRDB中,用戶需要用多個相關(guān)聯(lián)的表中的信息來生成中,用戶需要用多個相關(guān)聯(lián)的表中的信息來生成 管理所需的報表。通過關(guān)系運算,可以將任何兩個有共管理所需的報表。通過關(guān)系運算,可以將任何兩個有共 同數(shù)據(jù)項的表關(guān)聯(lián)起來,這是同數(shù)據(jù)項的表關(guān)聯(lián)起來,這是RDBRDB的威力所在。的威力所在。l 關(guān)系數(shù)據(jù)庫的三種基本操作:關(guān)系數(shù)據(jù)庫的三種基本操作: (1 1)選擇:在表中找出符合指定條件的記錄。)選擇:在表

26、中找出符合指定條件的記錄。 (2 2)連接:把相關(guān)的表合并起來,向用戶提供比單個表更)連接:把相關(guān)的表合并起來,向用戶提供比單個表更 多的信息。多的信息。(3 3)投影:在已有表的基礎(chǔ)上,選定所需的列建立一個新表。)投影:在已有表的基礎(chǔ)上,選定所需的列建立一個新表。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P355.4 數(shù)據(jù)管理技術(shù)的發(fā)展數(shù)據(jù)庫系統(tǒng)組成數(shù)據(jù)庫系統(tǒng)組成代號代號生產(chǎn)廠家生產(chǎn)廠家城市城市S2機床配件廠北京S4工業(yè)設(shè)備廠西安代號代號編號編號數(shù)量數(shù)量S2P1300S2P2400S4P2300S4P2500S4P2600編編號號名稱名稱材質(zhì)材質(zhì)規(guī)格規(guī)格P1螺絲帽鋼12P2螺栓鐵

27、27P4螺絲釘銅14P5法蘭盤鋁12 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P365.4 數(shù)據(jù)管理技術(shù)的發(fā)展代號代號生產(chǎn)廠家生產(chǎn)廠家城市城市編號編號數(shù)量數(shù)量名稱名稱材質(zhì)材質(zhì)規(guī)格規(guī)格S2機床配件廠北京P1300螺絲帽鋼12S2機床配件廠北京P2400螺栓鐵17S4工業(yè)設(shè)備廠西安P2300螺栓鐵17S4工業(yè)設(shè)備廠西安P4500螺絲釘銅14S4工業(yè)設(shè)備廠西安P5600法蘭盤鋁12 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P375.4 數(shù)據(jù)管理技術(shù)的發(fā)展 為什么不在設(shè)計數(shù)據(jù)庫時就用上述這張大表? 問題: 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P385.4 數(shù)據(jù)管

28、理技術(shù)的發(fā)展代號代號生產(chǎn)廠家生產(chǎn)廠家城市城市編號編號數(shù)量數(shù)量名稱名稱材質(zhì)材質(zhì)規(guī)格規(guī)格S2機床配件廠北京P1300螺絲帽鋼12S2機床配件廠北京P2400螺栓鐵17S4工業(yè)設(shè)備廠西安P2300螺栓鐵17S4工業(yè)設(shè)備廠西安P4500螺絲釘銅14S4工業(yè)設(shè)備廠西安P5600法蘭盤鋁12 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P395.4 數(shù)據(jù)管理技術(shù)的發(fā)展缺點:缺點:l 數(shù)據(jù)冗余度大。如,設(shè)備廠出現(xiàn)的次數(shù)。數(shù)據(jù)冗余度大。如,設(shè)備廠出現(xiàn)的次數(shù)。l 插入異常,如,要添插入異常,如,要添“鋼帽鋼帽”,因沒進貨,則無法插入。,因沒進貨,則無法插入。l 刪除異常。如,沒進北京螺帽,則把螺帽材質(zhì)為

29、刪除異常。如,沒進北京螺帽,則把螺帽材質(zhì)為“鋼鋼”的的 信息去掉。信息去掉。l 更新異常,如,要更換螺栓規(guī)格,則要逐一更換。更新異常,如,要更換螺栓規(guī)格,則要逐一更換。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P405.4 數(shù)據(jù)管理技術(shù)的發(fā)展關(guān)系模型的規(guī)范化理論l 關(guān)系模型的好壞對數(shù)據(jù)的存儲、操作有很大影響,因此, 一般要對得到的關(guān)系模式進行優(yōu)化(規(guī)范化)。l 規(guī)范化理論是E.F.Codd在1971年提出的,研究關(guān)系模型中各 屬性之間的關(guān)系,探討關(guān)系模型應(yīng)具備的性質(zhì)和設(shè)計方法。初步得到的關(guān)系模型優(yōu)化后的關(guān)系模型(數(shù)據(jù)庫設(shè)計結(jié)果)規(guī)范化理論 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟

30、與管理學(xué)院P415.4 數(shù)據(jù)管理技術(shù)的發(fā)展范式的定義:l 1NF: 如果一個關(guān)系模式R的所有屬性都是基本的,不可分割 的,則稱R為第一范式。l 2NF:如果關(guān)系模式R是1NF,而且非關(guān)鍵字的屬性完全函數(shù)依賴于關(guān)鍵字屬性,那么關(guān)系模式R是第二范式。l 3NF: 如果關(guān)系模式R是2NF,而且每個非關(guān)鍵字的屬性不是傳遞依賴于關(guān)鍵字,那么關(guān)系模式R是第三范式。l BCNF: 若關(guān)系模式R中的每個決定因素,都是R的一個候選 關(guān)鍵字,則稱R是BCNF。 5NF4NF BCNF 3NF2NF1NF 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P425.4 數(shù)據(jù)管理技術(shù)的發(fā)展范式實例:例子: 下面的關(guān)

31、系 物資價稅表不滿足第一范式的條件,不是第一范式。 去掉可分割的數(shù)據(jù)項后,可得到下面的關(guān)系,它已是第一范式。 物資編碼物資編碼 物資名稱物資名稱物資價稅物資價稅 物資金額物資金額 增值稅額增值稅額 0101003生鐵生鐵600.00102.00物資編碼物資編碼物資名稱物資名稱物資金額物資金額增值稅額增值稅額 0101003生鐵生鐵600.00102.00 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P435.4 數(shù)據(jù)管理技術(shù)的發(fā)展例子: 下面的關(guān)系模式中,主碼為“教師代碼”。非主屬性“院系名稱”依賴于主碼“教師代碼”,而“院系負責人”又依賴于“院系名稱”。因此,“院系負責人”傳遞依賴于

32、主碼“教師代碼”,該關(guān)系不是第三范式。教師代碼教師代碼教師名稱教師名稱院系名稱院系名稱院系負責人院系負責人 Y0001江濤江濤應(yīng)用學(xué)院應(yīng)用學(xué)院李利華李利華 Y0002張為張為應(yīng)用學(xué)院應(yīng)用學(xué)院李利華李利華 Y0003何麗麗何麗麗應(yīng)用學(xué)院應(yīng)用學(xué)院李利華李利華 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P445.4 數(shù)據(jù)管理技術(shù)的發(fā)展 上例中消除傳遞依賴關(guān)系的辦法是將關(guān)系“教師”分解為如下兩個滿足第三范式的關(guān)系:(教師代碼,教師名稱,院系名稱,院系負責人) l 教師(教師代碼,教師名稱,院系名稱)l 院系(院系名稱,院系負責人) 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P455

33、.4 數(shù)據(jù)管理技術(shù)的發(fā)展 規(guī)范化小結(jié):l 在關(guān)系數(shù)據(jù)庫中,對關(guān)系模式的基本要求是滿足第一范式,這樣的關(guān)系模式就是合法的,允許的,但有些關(guān)系模式存在數(shù)據(jù)冗余、存儲操作異常等不足,因此,要進一步改善關(guān)系模式,這就是規(guī)范化的目的。l 關(guān)系模式的規(guī)范化過程是采用投影分解的方法來實現(xiàn)的,分解時應(yīng)注意保證分解前和分解后的等價性。 l 規(guī)范化等級的選擇要綜合考慮多種因素,要在減少數(shù)據(jù)冗余、消除存儲操作異常和響應(yīng)時間之間做出合理的折中。一般而言,規(guī)范化等級越高,檢索時需要的連接操作就越多,DBMS的開銷就越大,響應(yīng)時間變長。l 實際研制和開發(fā)數(shù)據(jù)庫系統(tǒng)時,多采用3NF和BCNF. 版權(quán)所有 2011-2015

34、 長安大學(xué)經(jīng)濟與管理學(xué)院P465.4 數(shù)據(jù)管理技術(shù)的發(fā)展 數(shù)據(jù)庫是信息系統(tǒng)的核心組成部分。數(shù)據(jù)庫設(shè)計在信息系統(tǒng)的開發(fā)中占有重要的地位,數(shù)據(jù)庫設(shè)計的質(zhì)量將影響信息系統(tǒng)的運行效率及用戶對數(shù)據(jù)使用的滿意度。 如何根據(jù)企業(yè)中用戶的需求及企業(yè)生存環(huán)境,在指定的數(shù)據(jù)庫管理系統(tǒng)上,設(shè)計企業(yè)數(shù)據(jù)庫的邏輯模型,最后構(gòu)建成企業(yè)數(shù)據(jù)庫。這是一個。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P475.4 數(shù)據(jù)管理技術(shù)的發(fā)展一、信息的轉(zhuǎn)換 信息是人們提供關(guān)于現(xiàn)實世界客觀存在事物的反映,數(shù)據(jù)則是用來表示信息的一種符號。若要將反映客觀事物狀態(tài)的數(shù)據(jù),經(jīng)過一定的組織,成為計算機內(nèi)的數(shù)據(jù),將經(jīng)歷三個不同的狀態(tài):,如下

35、圖所示。 在不同的世界中使用的概念與術(shù)語是不同的,但它們在轉(zhuǎn)換過程中都有一一對應(yīng)的關(guān)系,如下表所示。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P485.4 數(shù)據(jù)管理技術(shù)的發(fā)展圖圖 三個不同的世界三個不同的世界 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P495.4 數(shù)據(jù)管理技術(shù)的發(fā)展表表 三個不同的世界術(shù)語對照三個不同的世界術(shù)語對照客觀世界信息世界(概念世界)計算機世界(數(shù)據(jù)世界)組織(事物及其聯(lián)系)實體及其聯(lián)系(概念模型)數(shù)據(jù)庫(數(shù)據(jù)模型)事物類(總體)實體集文件事物(對象、個體)實體記錄特征(性質(zhì))屬性數(shù)據(jù)項 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P50

36、5.4 數(shù)據(jù)管理技術(shù)的發(fā)展例如:l 現(xiàn)實世界中一個“事物”,對應(yīng)于信息世界中的一個“實體”。l 實體可以是一個學(xué)生、一個零件或一張訂貨合同。l 事物總有一些來反映事物的特征,實體對應(yīng)也有一些來反映實體的特征,如學(xué)生的學(xué)號、姓名等。l 實體的屬性在計算機世界中用描述,實體屬性的集合在計算機世界中用描述。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P515.4 數(shù)據(jù)管理技術(shù)的發(fā)展l 具有相同屬性的事物的集合,如一群學(xué)生、一群教師、授課計劃,就形成了。它們是信息世界中的(簡稱實體),在計算機世界中,則形成一個個,如學(xué)生文件、教師文件和課程計劃文件 。l 涉及同一事務(wù)的事物有多個,相互之間又

37、有錯綜,如學(xué)生、教師授課計劃的教學(xué)系統(tǒng),因此反映在信息世界就有(學(xué)習(xí)關(guān)系),反映在計算機世界就形成了(許多邏輯數(shù)據(jù)文件的集合)。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P525.4 數(shù)據(jù)管理技術(shù)的發(fā)展二、數(shù)據(jù)庫設(shè)計步驟 (1) 對現(xiàn)實世界進行需求分析。 對現(xiàn)實世界要處理的對象(組織、部門企業(yè)等)進行詳細調(diào)查。調(diào)查的重點是“數(shù)據(jù)”和“處理”,通過調(diào)查獲得每個信息使用者對數(shù)據(jù)庫的要求。 1、了解組織機構(gòu)情況,為分析信息流做準備。2、了解各部門業(yè)務(wù)情況,調(diào)查各部門輸入和使用的數(shù)據(jù)及處理數(shù)據(jù)的方式與算法。3、確定數(shù)據(jù)庫的信息組成及計算機系統(tǒng)應(yīng)實現(xiàn)的功能。 版權(quán)所有 2011-2015 長

38、安大學(xué)經(jīng)濟與管理學(xué)院P535.4 數(shù)據(jù)管理技術(shù)的發(fā)展二、數(shù)據(jù)庫設(shè)計步驟 (2) 建立信息世界中E-R(概念)模型 E-entity代表實體,R-relation代表關(guān)系。E-R圖就是描述實體間關(guān)系的圖解。通過對現(xiàn)實世界的需求分析,應(yīng)用“E-R圖”建立信息世界中的實體、屬性和實體間聯(lián)系的概念模型,從而轉(zhuǎn)入信息世界。 建立概念模型分兩步走: 第一步:建立分E-R圖; 第二步:綜合分E-R圖,產(chǎn)生總E-R圖。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P545.4 數(shù)據(jù)管理技術(shù)的發(fā)展二、數(shù)據(jù)庫設(shè)計步驟 (3) 從E-R圖導(dǎo)出計算機世界的關(guān)系數(shù)據(jù)模型l E-R圖是建立數(shù)據(jù)模型的基礎(chǔ)。l 從E

39、-R圖出發(fā)導(dǎo)出計算機系統(tǒng)上安裝的DBMS所能接受的數(shù)據(jù)模型,這一步工作在數(shù)據(jù)庫設(shè)計中稱為邏輯設(shè)計。l 重點掌握由E-R圖轉(zhuǎn)換為關(guān)系數(shù)據(jù)模型,即把E-R圖轉(zhuǎn)換為一個個關(guān)系框架,使之相互聯(lián)系構(gòu)成一個整體結(jié)構(gòu)化了的數(shù)據(jù)模型,轉(zhuǎn)化的原則如下: 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P555.4 數(shù)據(jù)管理技術(shù)的發(fā)展二、數(shù)據(jù)庫設(shè)計步驟 1、E-R圖中的每個實體,都相應(yīng)地轉(zhuǎn)換為一個關(guān)系,該關(guān)系包括對應(yīng)實體的全部屬性,并應(yīng)根據(jù)該關(guān)系表達的語義確定出關(guān)鍵字,因為關(guān)系中的關(guān)鍵字屬性是實現(xiàn)不同關(guān)系聯(lián)系的主要手段。2、對于E-R圖中聯(lián)系,根據(jù)不同的聯(lián)系方式,或?qū)⒙?lián)系反映在關(guān)系中,或?qū)⒙?lián)系轉(zhuǎn)換成一個關(guān)系。

40、 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P565.4 數(shù)據(jù)管理技術(shù)的發(fā)展三、數(shù)據(jù)庫設(shè)計實例:某學(xué)院“教學(xué)管理”數(shù)據(jù)庫模型的設(shè)計 (1) 設(shè)計“系和教師關(guān)系”的分E-R圖。l 該學(xué)院下設(shè)四個系:管理工程系、會計系、市場營銷系和信息管理系。每個系有一個系主任主管該系工作,則將系設(shè)為一個實體,該實體具有以下屬性:系代號、系名、系主任名、辦公地點、電話。其中系代號是主關(guān)鍵字,如圖示。l 該學(xué)院聘請了一定數(shù)量的專職教師。則將“教師” 設(shè)為一個實體,該實體具有以下屬性:教師編號、教師 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P575.4 數(shù)據(jù)管理技術(shù)的發(fā)展 姓名、專業(yè)特長。其中教

41、師編號是主關(guān)鍵字,如圖示。l 學(xué)院聘請教師后,分配到各系。一個系有多個教師;一個教師只能屬于一個系。系實體與教師實體之間發(fā)生一對多(1:m)的“分配”聯(lián)系。如圖示。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P585.4 數(shù)據(jù)管理技術(shù)的發(fā)展 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P595.4 數(shù)據(jù)管理技術(shù)的發(fā)展 (2) 設(shè)計“學(xué)生和課程關(guān)系”的分E-R圖。l 學(xué)院每年招收新生,分配到各個專業(yè)。則將“學(xué)生”設(shè)為一個實體,該實體具有如下屬性:學(xué)號、姓名、性別、年齡、系代號,其中學(xué)號為主關(guān)鍵字。l 學(xué)院制訂了教學(xué)計劃,設(shè)置多項課程。則將“課程”設(shè)為一個實體,該實體具有如下屬性

42、:課程號、課程名、學(xué)分。設(shè)課程號為主關(guān)鍵字。l 學(xué)生根據(jù)專業(yè)要求,每年學(xué)習(xí)多門課程,每門課程則被多個學(xué)生選讀。學(xué)生必須參加考試,獲取成績。因此, 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P605.4 數(shù)據(jù)管理技術(shù)的發(fā)展 成績屬于學(xué)生和課程發(fā)生聯(lián)系后產(chǎn)生的屬性?!皩W(xué)生和課程關(guān)系”分E-R圖見下圖。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P615.4 數(shù)據(jù)管理技術(shù)的發(fā)展 (5) 將學(xué)院“教學(xué)管理”的E-R圖所描述的信息(概念)世界中的概念模型轉(zhuǎn)化為計算機上由關(guān)系型DBMS支持的關(guān)系數(shù)據(jù)模型。 數(shù)據(jù)庫設(shè)計原則中有:一是將所有的實體轉(zhuǎn)化為關(guān)系;二是根據(jù)不同的聯(lián)系方式,將聯(lián)系反

43、映在關(guān)系中或?qū)⒙?lián)系轉(zhuǎn)換成關(guān)系。(具體過程略,見教材P187). 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P625.4 數(shù)據(jù)管理技術(shù)的發(fā)展 (3) 設(shè)計“教師和課程關(guān)系”的分E-R圖。l教師在教學(xué)活動中與課程發(fā)生聯(lián)系。一個教師可以上多門課程;一門課程也可以由多個教師講授。教師授課任務(wù)完成后,將被學(xué)生和院方評估。因此,“教師與課程關(guān)系”的分E-R圖見上圖。(4)將上述三個分E-R圖綜合,建立學(xué)院教學(xué)管理總E-R圖。l由于學(xué)院教學(xué)管理各分E-R圖中,教師與課程是同名實體,根據(jù)綜合分E-R圖的原則:消除同名實體,則教學(xué)管理總E-R圖如上圖所示。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與

44、管理學(xué)院P635.5 數(shù)據(jù)倉庫和商業(yè)智能p 決策對企業(yè)管理越來越重要 目前,企業(yè)面臨的商業(yè)競爭日趨激烈,企業(yè)的決策任務(wù)越來越重,決策頻率越來越高,多數(shù)企業(yè)都開始重視信息的策略性價值,重視數(shù)據(jù)分析。p 企業(yè)積累了大量的寶貴數(shù)據(jù) 隨著信息技術(shù)在企業(yè)的廣泛應(yīng)用,企業(yè)通過傳統(tǒng)的文件方式和數(shù)據(jù)庫系統(tǒng)存儲并積累了大量數(shù)據(jù),也為數(shù)據(jù)分析和利用提供了重要的基礎(chǔ)。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P645.5 數(shù)據(jù)倉庫和商業(yè)智能p 企業(yè)有可能通過數(shù)據(jù)分析作出優(yōu)化的決策 有了前面兩個條件,企業(yè)在面對數(shù)據(jù)資源時,不再是簡單地處理數(shù)據(jù),而是更多地關(guān)注如何使用數(shù)據(jù),采用了數(shù)據(jù)倉庫、聯(lián)機分析處理、數(shù)據(jù)

45、挖掘和商業(yè)智能等新興技術(shù)。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P655.5 數(shù)據(jù)倉庫和商業(yè)智能一、概念 數(shù)據(jù)倉庫之父W.H.Inmon的定義: 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P665.5 數(shù)據(jù)倉庫和商業(yè)智能l 數(shù)據(jù)倉庫是一個大的數(shù)據(jù)集合;l 數(shù)據(jù)倉庫的目標是支持企業(yè)的管理決策;l 數(shù)據(jù)倉庫的數(shù)據(jù)存儲和組織方式是面向主題的,即根據(jù)分析主題的需求把所有相關(guān)數(shù)據(jù)組織在一起;l 數(shù)據(jù)倉庫中的數(shù)據(jù)內(nèi)容不再是零散或細節(jié)的,而是集成和綜合的,已經(jīng)消除了數(shù)據(jù)在表達上和含義上的不一致性;l 由于數(shù)據(jù)倉庫中的數(shù)據(jù)加上了時間維度,數(shù)據(jù)修改的可能性就很小,幾乎不用傳統(tǒng)數(shù)據(jù)庫的u

46、pdate操作,因此數(shù)據(jù)倉庫 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P675.5 數(shù)據(jù)倉庫和商業(yè)智能是非易失的;另一方面,正是由于數(shù)據(jù)倉庫中所有的基礎(chǔ)數(shù)據(jù)都是針對某時間點的,隨著時間的變化,不斷需要載入新的數(shù)據(jù),或者淘汰舊的數(shù)據(jù),即是隨時間變化的。 二、數(shù)據(jù)倉庫的數(shù)據(jù)來源 數(shù)據(jù)倉庫的數(shù)據(jù)都來自于許多不同的業(yè)務(wù)數(shù)據(jù)庫,并按主題進行數(shù)據(jù)組織,如下圖示。 數(shù)據(jù)倉庫的數(shù)據(jù)導(dǎo)入一般需要ETL(extract-transform-load,即數(shù)據(jù)抽取、轉(zhuǎn)換、裝載)工具,ETL過程包括數(shù)據(jù)抽取 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P685.5 數(shù)據(jù)倉庫和商業(yè)智能(extract

47、)、轉(zhuǎn)換(transform)、清洗(cleansing)、裝載(load)等環(huán)節(jié),最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P695.5 數(shù)據(jù)倉庫和商業(yè)智能一、概念的提出 “聯(lián)機分析處理(on-line analytical processing,OLAP)”是關(guān)系數(shù)據(jù)庫的奠基人E.F.Codd于1993年提出的,主要是對于大量的的綜合、分析和歸納。二、OLAP的特征及應(yīng)用l 一個主要操作是“多維分析”,即通過對信息的多種可能的觀察形式進行快速、穩(wěn)定、一致和交互性的存取,允許管理決策人員對數(shù)據(jù)進行深入分析。 版權(quán)所有 2

48、011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P705.5 數(shù)據(jù)倉庫和商業(yè)智能l 多維分析是建立在“多維視圖”的基礎(chǔ)上進行的。多維視圖是多維度的立體結(jié)構(gòu),即包含了若干層的行和列,數(shù)據(jù)的表示用不同層次中的不同緯度表達,表示數(shù)據(jù)的多維度信息稱為超立體結(jié)構(gòu)(cube),如下圖所示。 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P715.5 數(shù)據(jù)倉庫和商業(yè)智能 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P725.5 數(shù)據(jù)倉庫和商業(yè)智能一、概念的提出 數(shù)據(jù)挖掘(data mining)是從大量數(shù)據(jù)中自動發(fā)現(xiàn)隱藏的有用知識的過程,是從大量數(shù)據(jù)中挖掘“寶藏”的過程。二、數(shù)據(jù)挖掘的內(nèi)涵 數(shù)據(jù)挖掘發(fā)現(xiàn)的知識有:l 行為模式l 數(shù)據(jù)關(guān)聯(lián)l 變化趨勢l 異常情況和有意義的結(jié)構(gòu) 版權(quán)所有 2011-2015 長安大學(xué)經(jīng)濟與管理學(xué)院P735.5 數(shù)據(jù)倉庫和商業(yè)智能三、數(shù)據(jù)挖掘和OLAP的區(qū)別l 數(shù)據(jù)挖掘和OLAP都是使用數(shù)據(jù)倉庫數(shù)據(jù)的重要工具。l OLAP工具主要是展現(xiàn)數(shù)據(jù),啟發(fā)數(shù)據(jù)分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論