




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、27/28數(shù)據(jù)治理數(shù)據(jù)治理包括數(shù)據(jù)的存儲(chǔ)、檢索和操縱。為了能夠在系統(tǒng)開(kāi)發(fā)和開(kāi)展業(yè)務(wù)工作期間有效地與信息服務(wù)人員進(jìn)行聯(lián)系,用戶治理人員應(yīng)具備本章中所提到的有關(guān)概念、方法和術(shù)語(yǔ)方面的業(yè)務(wù)知識(shí)。 數(shù)據(jù)和信息計(jì)算機(jī)系統(tǒng)并不存儲(chǔ)信息,只存儲(chǔ)數(shù)據(jù)。數(shù)據(jù)是獲得信息的原始材料,為了滿足定期存取的需要,它們被存儲(chǔ)在二級(jí)(輔助)存儲(chǔ)設(shè)備(磁盤和磁帶)上。信息是通過(guò)同化、聚合和加工后的有特定含義的數(shù)據(jù)。為了突擊數(shù)據(jù)和信息之間的差不,我們考察下面的例子。一個(gè)部門領(lǐng)導(dǎo)要求每個(gè)職工分不在一張紙上寫下他們的年齡。每張紙只有一行含義簡(jiǎn)單的數(shù)據(jù)。然而經(jīng)理能夠從這些數(shù)據(jù)中獲得信息。他能夠以此確定超過(guò)50歲的職工有多少、職工平均年
2、齡是多少,最年輕的職工年齡是多少等等。人們經(jīng)常使用信息處理那個(gè)詞匯容易造成誤解,實(shí)際上,它的真正含義是為了產(chǎn)生信息而處理數(shù)據(jù)。數(shù)據(jù)組織的層次體系任何信息系統(tǒng)都有一個(gè)數(shù)據(jù)組織的層次體系。在該層次體系中,每一后繼層差不多上其前驅(qū)層數(shù)據(jù)元組合的結(jié)果,最終實(shí)現(xiàn)一個(gè)綜合的數(shù)據(jù)庫(kù)。處于第一層的位用戶是不必了解的,而其它五層則是用戶輸入和請(qǐng)求數(shù)據(jù)時(shí)合理的需要。數(shù)據(jù)是一切信息系統(tǒng)的基礎(chǔ)。一個(gè)高質(zhì)量的計(jì)算機(jī)信息系統(tǒng)的最終用戶必須具備數(shù)據(jù)的組織及其處理方面的知識(shí)。? 位位是主存儲(chǔ)器和輔助存儲(chǔ)器的差不多單位。計(jì)算機(jī)是電子的,因而只能實(shí)現(xiàn)兩種狀態(tài)。從物理上講,能夠通過(guò)不同途徑來(lái)實(shí)現(xiàn)這兩種狀態(tài)(電流的方向,開(kāi)關(guān),涂在帶
3、上和盤上的鐵淦氧的磁性排列)。由于每一位只能表示兩種狀態(tài),因此,必須將位組合才能形成字母數(shù)字字符。由位組合成的字母數(shù)字字符被臨時(shí)存放在主存儲(chǔ)器中,或永久地存放在輔助存儲(chǔ)器中。在主存和輔存中存放的是字母數(shù)字字符的內(nèi)部表示形式(例如,假如采納EBC-DIC編碼體制,則11000010表示字母A,而11110001表示數(shù)字1)。在輸入時(shí),對(duì)字母數(shù)字字符進(jìn)行編碼以形成若干位的組合,而在輸出時(shí)進(jìn)行譯碼。目前還沒(méi)有工業(yè)標(biāo)準(zhǔn)的編碼體制。最為流行的編碼體制是六位二進(jìn)制編碼的十進(jìn)制碼(BCD),七位ASCII碼以及八位擴(kuò)充二進(jìn)制編碼的十進(jìn)制交換碼(EBCDIC-發(fā)音為eb-se-dik)。六位編碼最多能夠表示6
4、4個(gè)字符(2?6)。七位編碼能夠表示128個(gè)字符,而八位編碼能夠表示256個(gè)字符。讀者可能會(huì)問(wèn):既然用六位就能夠?qū)σ粋€(gè)字符編碼。什么緣故還要用八位來(lái)編碼?這是因?yàn)榱淮a的64種可能的組合只夠表示字母、數(shù)字和18個(gè)專門符號(hào)。假如希望有表示大寫和小寫字母,那么六位編碼就不夠用了。因此,就需要具有128種組合的七位編碼。目前還難以想象出對(duì)128種以上的位的組合需要。引進(jìn)八位編碼體制(EBCDIC)是為了利用這一個(gè)事實(shí),即只用4位(24-具有16種可能的組合)來(lái)表示一個(gè)數(shù)值數(shù)據(jù)。因此,一個(gè)8位的編碼實(shí)際上能夠用來(lái)表示兩個(gè)十進(jìn)制數(shù)字。由于所存儲(chǔ)的數(shù)據(jù)多數(shù)是數(shù)值數(shù)據(jù),因此將兩個(gè)數(shù)字的編碼壓縮成八位能夠節(jié)約
5、存儲(chǔ)空間。EBCDIC的8位組合稱之為一個(gè)字節(jié)。而B(niǎo)CD的六位就構(gòu)成一個(gè)字節(jié)。在BCD和ASCII編碼體制中,字節(jié)是字符的同義詞。在EBCDIC編碼體制中,由于能夠?qū)蓚€(gè)數(shù)字壓縮到一個(gè)字節(jié)中,因此EBCDIC的字節(jié)與字符間并不一一對(duì)應(yīng)。然而,在涉及到存儲(chǔ)容量時(shí),則經(jīng)常交替地使用字符和字節(jié)。一個(gè)磁盤組能夠有800兆字節(jié)容量(即800兆字節(jié)的永久存儲(chǔ)器),而一臺(tái)計(jì)算機(jī)的主存能夠有8兆字節(jié)(作為處理用的兆字節(jié)的高速臨時(shí)存儲(chǔ)器)。較小的存儲(chǔ)設(shè)備用千字節(jié)(一千個(gè)字節(jié)的倍數(shù)來(lái)度量)。通常將兆和千分不縮寫M和K。在邏輯上講,一個(gè)EBCDIC字節(jié)是8位,而實(shí)際上它有9位。由于要將這些位在計(jì)算機(jī)和外部設(shè)備(或遠(yuǎn)
6、程終端)之間傳送,因此在計(jì)算機(jī)硬件中使用了一種內(nèi)部校驗(yàn)方法來(lái)保證傳送數(shù)據(jù)的準(zhǔn)確性。這種構(gòu)驗(yàn)方法之一是給傳送的數(shù)據(jù)附加一位奇偶校驗(yàn)位,用該位來(lái)發(fā)覺(jué)在傳送過(guò)程中是否丟失了一位。計(jì)算機(jī)能夠采納偶數(shù)奇偶校驗(yàn)或奇數(shù)奇偶校驗(yàn)法,即每一字符要包含偶數(shù)個(gè)或奇數(shù)個(gè)開(kāi)狀態(tài)位。假定某臺(tái)計(jì)算機(jī)采納偶數(shù)奇偶校驗(yàn)法,假如要將一個(gè)EBCDIC的字母A(它具有奇數(shù)個(gè)開(kāi)位-11000001)寫到磁帶上,那么在傳送之前為了維持偶校驗(yàn),則需要增加一位奇偶位(即:111000001-偶數(shù)個(gè)開(kāi)位),在將字符寫到磁帶之前,硬件自動(dòng)計(jì)算開(kāi)位的個(gè)數(shù)。假如計(jì)算機(jī)結(jié)果是奇數(shù),則講明差不多出現(xiàn)了奇偶校驗(yàn)錯(cuò)誤,計(jì)算機(jī)自動(dòng)向操作員發(fā)出警告。? 字符(
7、字節(jié))在通過(guò)鍵盤(光符號(hào)識(shí)不器或其他輸入設(shè)備)輸入一個(gè)字符時(shí),機(jī)器直接將字符翻譯成某特定的編碼系統(tǒng)中一串位的組合。一個(gè)計(jì)算機(jī)系統(tǒng)能夠使用不止一種編碼體制。例如,某些計(jì)算機(jī)系統(tǒng)中將ASCII編碼體制用于數(shù)據(jù)通信,而將EBCDIC編碼體制用于數(shù)據(jù)存儲(chǔ)。? 數(shù)據(jù)元描述數(shù)據(jù)元的最好方法是舉例講明。一個(gè)人的社會(huì)保險(xiǎn)號(hào)、姓名、信用卡號(hào)、街道地址和婚姻狀況等差不多上數(shù)據(jù)元。在數(shù)據(jù)的層次體系中,數(shù)據(jù)元是最低一層的邏輯單位,為了形成一個(gè)邏輯單位,需要將若干位和若干字節(jié)組合在一起。一個(gè)日期不一定是一個(gè)數(shù)據(jù)元,它能夠是三個(gè)數(shù)據(jù)元:年、月、日。對(duì)地址來(lái)講,也是同樣的。一個(gè)地址中能夠包括州、都市、街道地址和郵政碼這四個(gè)
8、數(shù)據(jù)元。從邏輯上能夠把日期和地址都看成是一個(gè)數(shù)據(jù)元,然而輸出這種數(shù)據(jù)元是不方便的。例如,通常在輸出時(shí)總是把街道地址單寫一行,因而應(yīng)該把一個(gè)地址的幾個(gè)數(shù)據(jù)元分開(kāi)。此外,由于姓名和地址文件經(jīng)常按郵政碼排序,因此,需要將郵政碼作為一個(gè)邏輯實(shí)體(數(shù)據(jù)元)來(lái)對(duì)待。依照上下文的需要,有時(shí)也把數(shù)據(jù)元稱作為字段(記錄中的字段)。數(shù)據(jù)元是泛指的,而數(shù)據(jù)項(xiàng)才是實(shí)際的實(shí)體(或?qū)嶋H的值)。例如,社會(huì)保險(xiǎn)號(hào)是一個(gè)數(shù)據(jù)元,而445487279和44214158則是兩個(gè)數(shù)據(jù)項(xiàng)。為了節(jié)約輸入數(shù)據(jù)時(shí)敲打鍵盤的時(shí)刻和存儲(chǔ)空間,在輸入數(shù)據(jù)時(shí)通常將數(shù)據(jù)元編碼。例如,通常將職工主文件中的性不數(shù)據(jù)元編碼,如此,數(shù)據(jù)錄入員就能夠簡(jiǎn)單的輸入
9、M或F來(lái)代替Male(男)或Female(女)。在輸出時(shí)再將M和F分不翻譯成男或女。在設(shè)計(jì)數(shù)據(jù)元時(shí),能夠使一個(gè)數(shù)據(jù)項(xiàng)(如帳號(hào))的編碼具有特定的含義,從而能夠向用戶提供信息。例如,能夠?qū)⒁粋€(gè)大學(xué)的六位帳號(hào)編碼如下:表20.6.1舉一個(gè)例子,RBI001將表示生物系的1另研究項(xiàng)目的帳號(hào)。? 記錄將邏輯上相關(guān)的數(shù)據(jù)元組合在一起就形成一個(gè)記錄。表20.6.2列舉了一個(gè)職工記錄中可能包含的若干數(shù)據(jù)元,以及作為職工記錄的一個(gè)值的若干數(shù)據(jù)項(xiàng)。記錄是能夠從數(shù)據(jù)庫(kù)中存取的最低一層的邏輯單位。例如,假如一個(gè)人事經(jīng)理需要明白阿溫肥訪芩溝幕橐鱟純觶敲矗桶閹惱黽鍬即癰嬤腥隼床偷街鞔娼寫懟? 文件文件是邏輯上相關(guān)的記錄的
10、集合。職工主文件包含每一個(gè)職工的記錄。庫(kù)存文件包含每一種庫(kù)存物資的記錄。應(yīng)收帳目文件包含每個(gè)顧客的記錄。文件那個(gè)詞有時(shí)也指某臺(tái)二級(jí)存儲(chǔ)設(shè)備上的一塊已命名的區(qū)域,該區(qū)域中能夠包含程序代碼、教材、數(shù)據(jù),甚至還能夠包含輸出報(bào)表。? 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)是一種作為計(jì)算機(jī)系統(tǒng)資源共享的全部數(shù)據(jù)之集合。有時(shí)依照不同應(yīng)用領(lǐng)域可將該資源共享數(shù)據(jù)分成若干段。例如,財(cái)會(huì)數(shù)據(jù)庫(kù)能夠劃分為一個(gè)應(yīng)用領(lǐng)域,它能夠包含六個(gè)不同的文件。讀者應(yīng)該注意到:用文件來(lái)組織數(shù)據(jù)這種方法將帶來(lái)數(shù)據(jù)的冗余。也確實(shí)是講,為了在處理時(shí)使用,必須將某些數(shù)據(jù)元重復(fù)地存放在幾個(gè)文件中。例如,在一所大學(xué)的安置辦公室、宿舍治理處、財(cái)務(wù)支持辦公室以及注冊(cè)處等都有
11、可能保存學(xué)生文件。像學(xué)生名、校內(nèi)地址這類數(shù)據(jù)元幾乎在每個(gè)文件中都重復(fù)出現(xiàn)。在對(duì)開(kāi)發(fā)一個(gè)綜合的學(xué)生信息系統(tǒng)進(jìn)行可行性分析時(shí),一些系統(tǒng)分析員在美國(guó)西南部一所規(guī)模專門大的大學(xué)中發(fā)覺(jué)有75個(gè)計(jì)算機(jī)文件中都包含學(xué)生名和校內(nèi)地址。采納先進(jìn)的數(shù)據(jù)庫(kù)治理系統(tǒng)比之傳統(tǒng)的文件系統(tǒng)有較大的改進(jìn),它使得用戶能夠?qū)⒋鎯?chǔ)數(shù)據(jù)的重復(fù)程度減至最小。數(shù)據(jù)的操縱和檢索-綜合數(shù)據(jù)庫(kù)治理系統(tǒng) 到目前為止,我們集中討論了傳統(tǒng)的文件處理。此處,文件是作為一個(gè)獨(dú)立的邏輯實(shí)體來(lái)處理的,而且通常與某個(gè)特定的業(yè)務(wù)領(lǐng)域相聯(lián)系。為了把業(yè)務(wù)上相近的那些部門的文件綜合在一起,必須預(yù)先排序記錄和合并文件。如此做可能耗費(fèi)大量的時(shí)刻,有時(shí)甚至是不可能實(shí)現(xiàn)的。
12、通常,文件是為了滿足特定業(yè)務(wù)領(lǐng)域某部門的專門需要而設(shè)計(jì)的,假如某部門想使用保存在一個(gè)文件上的部分?jǐn)?shù)據(jù),而該文件是另一部門為自己使用而設(shè)計(jì)的,那么他們必須抽取這些數(shù)據(jù)并重新整理后才能使用。大多數(shù)部門總是寧愿建立和保持和一個(gè)類似(而不同)的文件以更好地滿足自己的使用要求,而不愿兼顧其他部門的業(yè)務(wù)需要。如此做的結(jié)果形成了大量的帶有重復(fù)數(shù)據(jù)的文件。前面的例子中差不多提到,某所大學(xué)就保存了75個(gè)獨(dú)立的計(jì)算機(jī)文件,而每個(gè)文件中都包含有學(xué)生記錄。每當(dāng)一個(gè)學(xué)生結(jié)婚了或者改換了住處時(shí),則必須修改75個(gè)文件。數(shù)據(jù)的冗余會(huì)使成本提高,而設(shè)計(jì)一個(gè)綜合的資源共享數(shù)據(jù)庫(kù)則能夠把數(shù)據(jù)冗余度降低到最小程度。綜合的資源共享數(shù)據(jù)
13、庫(kù)把公司看作一個(gè)整體來(lái)提供服務(wù),而不只是為公司某專門部門服務(wù)。利用數(shù)據(jù)庫(kù)治理系統(tǒng)(DBMS)軟件就可能實(shí)現(xiàn)一個(gè)綜合的數(shù)據(jù)庫(kù)。早在70年代初期就出現(xiàn)了DBMS技術(shù),然而直到70年代末期仍未得到普遍的同意。早期的DBMS軟件包效率不高,實(shí)際上比傳統(tǒng)的文件處理的要求更高的硬件能力。目前DBMS對(duì)硬件的要求差不多降低了,甚至在小型計(jì)算機(jī)系統(tǒng)上也能運(yùn)行DBMS軟件,造成推遲同意和實(shí)現(xiàn)DBMS技術(shù)的要緊緣故可能是信息服務(wù)人員缺乏專門的知識(shí),而且用戶治理人員又不愿合作和支持建立一個(gè)共享的數(shù)據(jù)庫(kù)。目前關(guān)于設(shè)計(jì)和運(yùn)行DBMS軟件差不多有了廣泛的了解,而且部分用戶治理人員差不多認(rèn)識(shí)到應(yīng)該把信息作為一個(gè)公司的資源來(lái)
14、看待。? 數(shù)據(jù)庫(kù)環(huán)境的好處1.經(jīng)濟(jì)上的好處。通過(guò)先進(jìn)的數(shù)據(jù)結(jié)構(gòu)技術(shù),DBMS提供了最小化數(shù)據(jù)冗余度的可能性。因此,為了提高處理效率,即使有了DBMS關(guān)心,有時(shí)還需要在共享的數(shù)據(jù)庫(kù)中保留一定的重復(fù)數(shù)據(jù)。由于減少了數(shù)據(jù)的冗余度,從而也簡(jiǎn)化了收集和更新數(shù)據(jù)的過(guò)程。就前面的例子而言,只需要在一處(數(shù)據(jù)庫(kù)中)更新學(xué)生地址就能夠了。2.數(shù)據(jù)庫(kù)技術(shù)也給信息服務(wù)專業(yè)人員帶來(lái)的好處。綜合資源共享數(shù)據(jù)庫(kù)為系統(tǒng)分析員打開(kāi)了嶄新的大門。數(shù)據(jù)庫(kù)能向系統(tǒng)分析員提供傳統(tǒng)文件所不能提供的信息。由于有了DBMS,就更容易得到數(shù)據(jù),因此使程序設(shè)計(jì)任務(wù)要比原先更為簡(jiǎn)單。此外,數(shù)據(jù)是獨(dú)立于程序的。這意味著用戶治理人員能夠增加數(shù)據(jù)庫(kù)中
15、的數(shù)據(jù)、修改庫(kù)中的現(xiàn)有數(shù)據(jù)或者從庫(kù)中刪除數(shù)據(jù),這些并不阻礙現(xiàn)有的程序,而在過(guò)去則需要測(cè)試和修改幾十個(gè)(有時(shí)幾百個(gè))程序。因此,數(shù)據(jù)庫(kù)治理系統(tǒng)還有其它重要的優(yōu)點(diǎn),然而這些已超出本書(shū)的范圍。3.信息方面的好處。一個(gè)綜合資源共享數(shù)據(jù)庫(kù)能以有序的方式提供一種滿足信息要求的結(jié)構(gòu)。實(shí)際上,數(shù)據(jù)庫(kù)是能夠充分利用公司信息資源的唯一工具。由于數(shù)據(jù)庫(kù)和DBMS在產(chǎn)生報(bào)表方面提供了極大的靈活性,因此,也給決策過(guò)程帶來(lái)了同樣的靈活性。4.DBMS軟件在支持聯(lián)機(jī)系統(tǒng)方面是特不有價(jià)值的。共享數(shù)據(jù)庫(kù)不僅可供多個(gè)用戶存取而且還特不能反映出數(shù)據(jù)的當(dāng)前狀態(tài)。關(guān)于許多查詢來(lái)講,及時(shí)性是專門關(guān)鍵的。例如,某個(gè)經(jīng)理由于設(shè)備故障不得不關(guān)
16、閉某個(gè)工作站,現(xiàn)在他有可能要查詢其它工作站的狀態(tài),同時(shí)利用得到的信息來(lái)改變進(jìn)行中的工作路線。? 方法DBMS克服了傳統(tǒng)文件處理的局限性。它依靠靈活多變的數(shù)據(jù)結(jié)構(gòu)(將數(shù)據(jù)元及記錄彼此聯(lián)系的方法)來(lái)做到這一點(diǎn)?;诓煌瑪?shù)據(jù)結(jié)構(gòu)的DBMS之間差不專門大。有三種設(shè)計(jì)DBMS軟件的方法1.數(shù)據(jù)系統(tǒng)語(yǔ)言會(huì)議(CODASYL)設(shè)計(jì)并公布的基于網(wǎng)絡(luò)或叢形數(shù)據(jù)結(jié)構(gòu)的DBMS指南。2.IBM的信息治理系統(tǒng)(IBS)使用的一種層次結(jié)構(gòu)。3.某些最近設(shè)計(jì)的基于關(guān)系數(shù)據(jù)結(jié)構(gòu)的DBMS。上述的每一種方法是差不多概念和術(shù)語(yǔ)的差不都專門大。因此,為了減少混淆和便于理解,以下的闡述和討論只使用網(wǎng)絡(luò)方法。? 庫(kù)設(shè)計(jì)1.數(shù)據(jù)庫(kù)設(shè)計(jì)
17、方法我們通過(guò)下面的例子來(lái)講明數(shù)據(jù)庫(kù)治理系統(tǒng)和一種數(shù)據(jù)庫(kù)設(shè)計(jì)方法的原理。考察下述情況。某圖書(shū)館保存了一個(gè)文件,該文件每一個(gè)記錄都包含了下述數(shù)據(jù)元:(1)書(shū)名(2)作者(3)出版社(4)出版社地址(5)類不(6)出版年份圖書(shū)館館長(zhǎng)希望在獲得決策信息方面有更多的靈活性。而現(xiàn)在文件不可能滿足其要求。通過(guò)與信息處理人員交換意見(jiàn)之后,他們決定實(shí)現(xiàn)一個(gè)基于CODASYL的數(shù)據(jù)庫(kù)治理系統(tǒng)。檢查現(xiàn)有文件發(fā)覺(jué)某些數(shù)據(jù)重復(fù)出現(xiàn)。每本書(shū)(每一書(shū)名)都分不有一個(gè)記錄。因此,寫過(guò)幾本書(shū)的作者的名字在他寫的每本書(shū)的記錄中重復(fù)出現(xiàn)。在一個(gè)圖書(shū)館里可能有某出版社出版的數(shù)百本,甚至數(shù)千本書(shū),然而在該文件的每本書(shū)的記錄中都重復(fù)地出
18、現(xiàn)出版社名和出版社地址。2.設(shè)立數(shù)據(jù)庫(kù)的步驟設(shè)計(jì)數(shù)據(jù)庫(kù)的方法之一是使用主題詞一屬性矩陣作為識(shí)不記錄和這些記錄之間關(guān)系的一個(gè)輔助工具。以下各步驟描述了這種設(shè)計(jì)數(shù)據(jù)庫(kù)的方法。第一步,在圖20.6.10的主題詞一屬性矩陣的左邊列出了邏輯主題詞。在本例中,這些主題詞是:書(shū)名、作者和出版社。在矩陣的頂端列出了所有可能的屬性。屬性是提供與主題詞有關(guān)的信息的任一數(shù)據(jù)元。圖20.6.10 主題詞屬性矩陣第二步:在屬性與主題詞之間的關(guān)系有一對(duì)一的,一對(duì)多的或者不存在關(guān)系。例如,一特定書(shū)名只有一個(gè)出版社。因此在書(shū)名與出版社之間存在一對(duì)一的關(guān)系。然而,一個(gè)書(shū)名能夠有幾個(gè)作者。因而,在書(shū)名與作者之間存在一對(duì)多的關(guān)系。
19、在圖20.6.11中用表示一對(duì)一關(guān)系,用M表示一對(duì)多關(guān)系,而且空白表示無(wú)關(guān)系存在。第三步:數(shù)據(jù)庫(kù)記錄類似于傳統(tǒng)文件的記錄,它是相關(guān)數(shù)據(jù)元的集合。能夠?qū)⒂涗洀臄?shù)據(jù)庫(kù)中讀出來(lái),也能夠?qū)⒂涗泴懙綌?shù)據(jù)庫(kù)中去。數(shù)據(jù)庫(kù)記錄也稱為節(jié)段。在這一步,用主題詞屬性矩陣來(lái)標(biāo)識(shí)記錄。這是通過(guò)列出與每個(gè)主題詞一對(duì)一關(guān)系的屬性來(lái)實(shí)現(xiàn)的。通常,對(duì)應(yīng)每個(gè)主題都有一個(gè)記錄,書(shū)名記錄包含出版社、出版年份和類不,如下所示:第四步:數(shù)據(jù)庫(kù)設(shè)計(jì)過(guò)程的下一步是建立記錄之間的關(guān)系。圖20.6.11給出主題屬性矩陣中指出的一對(duì)多的關(guān)系。出版社與書(shū)名之間的一對(duì)多的關(guān)系是用兩個(gè)記錄之間的一條連線來(lái)指出的,該連線有一箭頭指向出版社記錄。指向書(shū)名記
20、錄的兩個(gè)箭頭表示每個(gè)出版社能夠有一個(gè)以上的書(shū)名。這種出版社書(shū)名的組合稱之為一個(gè)系。其它的系是:書(shū)名-作者、作者-出版社、作者-書(shū)名和出版社-作者。多對(duì)多的關(guān)系(每一端都有兩個(gè)箭頭)在處理時(shí)可能會(huì)引起混淆,因而是不同意的。圖20.6.12 一個(gè)完整的網(wǎng)絡(luò)模型第五步:下一步消去冗余的屬性和系。記住,我們的目的是將作者、書(shū)名和出版社記錄輸入到數(shù)據(jù)庫(kù),然后經(jīng)由系建立的聯(lián)系從不同的記錄中檢索數(shù)據(jù)。因此,必須消去對(duì)此目的是冗余的那些系。在本例中,顯而易見(jiàn)作者-出版社系或作者-書(shū)名系是冗余(重復(fù))的,由于作者與書(shū)名相匹配的機(jī)會(huì)比它與出版社匹配的機(jī)會(huì)多,因此應(yīng)該消去作者-出版社系。圖20.6.12給出了結(jié)果模
21、式。該模式是數(shù)據(jù)庫(kù)邏輯結(jié)構(gòu)的一種圖式表示。現(xiàn)在圖書(shū)館館長(zhǎng)能夠進(jìn)行如下的查詢:列出某作者寫的所有書(shū)的書(shū)名;按字母順序列出由Pientice-Hall在1981年出版的那些書(shū)的書(shū)名;列出1987年以來(lái)至少在三個(gè)出版社出版書(shū)的那些作者。該數(shù)據(jù)庫(kù)(正如所設(shè)計(jì)的那樣)專門容易實(shí)現(xiàn)上述查詢及其它類似的查詢。對(duì)圖書(shū)館原有文件來(lái)講,類似的查詢不僅要求處理整個(gè)文件,而且可能還要處理好幾遍。有時(shí),還要求對(duì)文件進(jìn)行排序和合并。假如圖書(shū)館館長(zhǎng)在一年之后決定需要另一個(gè)記錄或?qū)傩?,那么,?shù)據(jù)庫(kù)治理員(DBA)能夠重新產(chǎn)生數(shù)據(jù)庫(kù),增加屬性,甚至增加系而不阻礙現(xiàn)在的程序。圖20.6.13表示該模式,而圖20.6.13表示數(shù)據(jù)
22、庫(kù)結(jié)構(gòu)的一個(gè)值。模式與值的關(guān)系類似于數(shù)據(jù)元與數(shù)據(jù)項(xiàng)的關(guān)系。一個(gè)是數(shù)據(jù)的定義,而另一個(gè)是實(shí)際的值或內(nèi)容。數(shù)據(jù)庫(kù)的概念與用途? 數(shù)據(jù)庫(kù)的概念什么是數(shù)據(jù)庫(kù)呢?當(dāng)人們從不同的角度來(lái)描述這一概念時(shí)就有不同的定義(因此是描述性的)。例如,稱數(shù)據(jù)庫(kù)是一個(gè)記錄保存系統(tǒng)(該定義強(qiáng)調(diào)了數(shù)據(jù)庫(kù)是若干記錄的集合)。又如稱數(shù)據(jù)庫(kù)是人們?yōu)榻鉀Q特定的任務(wù),以一定的組織方式存儲(chǔ)在一起的相關(guān)的數(shù)據(jù)的集合(該定義側(cè)重于數(shù)據(jù)的組織)。更有甚者稱數(shù)據(jù)庫(kù)是一個(gè)數(shù)據(jù)倉(cāng)庫(kù)。因此,這種講法盡管形象,但并不嚴(yán)謹(jǐn)。嚴(yán)格地講,數(shù)據(jù)庫(kù)是按照數(shù)據(jù)結(jié)構(gòu)來(lái)組織、存儲(chǔ)和治理數(shù)據(jù)的倉(cāng)庫(kù)。在經(jīng)濟(jì)治理的日常工作中,常常需要把某些相關(guān)的數(shù)據(jù)放進(jìn)如此倉(cāng)庫(kù),并依照治理
23、的需要進(jìn)行相應(yīng)的處理。例如,企業(yè)或事業(yè)單位的人事部門常常要把本單位職工的差不多情況(職工號(hào)、姓名、年齡、性不、籍貫、工資、簡(jiǎn)歷等)存放在表20.6.3中,這張表就能夠看成是一個(gè)數(shù)據(jù)庫(kù)。有了那個(gè)數(shù)據(jù)倉(cāng)庫(kù)我們就能夠依照需要隨時(shí)查詢某職工的差不多情況,也能夠查詢工資在某個(gè)范圍內(nèi)的職工人數(shù)等等。這些工作假如都能在計(jì)算機(jī)上自動(dòng)進(jìn)行,那我們的人事治理就能夠達(dá)到極高的水平。此外,在財(cái)務(wù)治理、倉(cāng)庫(kù)治理、生產(chǎn)治理中也需要建立眾多的這種數(shù)據(jù)庫(kù),使其能夠利用計(jì)算機(jī)實(shí)現(xiàn)財(cái)務(wù)、倉(cāng)庫(kù)、生產(chǎn)的自動(dòng)化治理。J.Martin給數(shù)據(jù)庫(kù)下了一個(gè)比較完整的定義:數(shù)據(jù)庫(kù)是存儲(chǔ)在一起的相關(guān)數(shù)據(jù)的集合,這些數(shù)據(jù)是結(jié)構(gòu)化的,無(wú)有害的或不必要
24、的冗余,并為多種應(yīng)用服務(wù);數(shù)據(jù)的存儲(chǔ)獨(dú)立于使用它的程序;對(duì)數(shù)據(jù)庫(kù)插入新數(shù)據(jù),修改和檢索原有數(shù)據(jù)均能按一種公用的和可操縱的方式進(jìn)行。當(dāng)某個(gè)系統(tǒng)中存在結(jié)構(gòu)上完全分開(kāi)的若干個(gè)數(shù)據(jù)庫(kù)時(shí),則該系統(tǒng)包含一個(gè)數(shù)據(jù)庫(kù)集合。? 數(shù)據(jù)庫(kù)的優(yōu)點(diǎn)使用數(shù)據(jù)庫(kù)能夠帶來(lái)許多好處:如減少了數(shù)據(jù)的冗余度,從而大大地節(jié)約了數(shù)據(jù)的存儲(chǔ)空間;實(shí)現(xiàn)數(shù)據(jù)資源的充分共享等等。此外,數(shù)據(jù)庫(kù)技術(shù)還為用戶提供了特不簡(jiǎn)便的使用手段使用戶易于編寫有關(guān)數(shù)據(jù)庫(kù)應(yīng)用程序。特不是近年來(lái)推出的微型計(jì)算機(jī)關(guān)系數(shù)據(jù)庫(kù)治理系統(tǒng)dBASELL,操作直觀,使用靈活,編程方便,環(huán)境適應(yīng)廣泛(一般的十六位機(jī),如IBM/PC/XT,國(guó)產(chǎn)長(zhǎng)城0520等均可運(yùn)行種軟件),數(shù)據(jù)處
25、理能力極強(qiáng)。數(shù)據(jù)庫(kù)在我國(guó)正得到愈來(lái)愈廣泛的應(yīng)用,必將成為經(jīng)濟(jì)治理的有力工具。數(shù)據(jù)庫(kù)是通過(guò)數(shù)據(jù)庫(kù)治理系統(tǒng)(DBMS-DATA BASE MANAGEMENT SYSTEM)軟件來(lái)實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)、治理與使用的dBASELL確實(shí)是一種數(shù)據(jù)庫(kù)治理系統(tǒng)軟件。? 數(shù)據(jù)庫(kù)結(jié)構(gòu)與數(shù)據(jù)庫(kù)種類數(shù)據(jù)庫(kù)通常分為層次式數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)式數(shù)據(jù)庫(kù)和關(guān)系式數(shù)據(jù)庫(kù)三種。而不同的數(shù)據(jù)庫(kù)是按不同的數(shù)據(jù)結(jié)構(gòu)來(lái)聯(lián)系和組織的。1.數(shù)據(jù)結(jié)構(gòu)模型(1)數(shù)據(jù)結(jié)構(gòu)所謂數(shù)據(jù)結(jié)構(gòu)是指數(shù)據(jù)的組織形式或數(shù)據(jù)之間的聯(lián)系。假如用D表示數(shù)據(jù),用R表示數(shù)據(jù)對(duì)象之間存在的關(guān)系集合,則將DS(D,R)稱為數(shù)據(jù)結(jié)構(gòu)。例如,設(shè)有一個(gè)電話號(hào)碼簿,它記錄了n個(gè)人的名字和相應(yīng)的
26、電話號(hào)碼。為了方便地查找某人的電話號(hào)碼,將人名和號(hào)碼按字典順序排列,并在名字的后面跟隨著對(duì)應(yīng)的電話號(hào)碼。如此,若要查找某人的電話號(hào)碼(假定他的名字的第一個(gè)字母是Y),那么只須查找以Y開(kāi)頭的那些名字就能夠了。該例中,數(shù)據(jù)的集合D確實(shí)是人名和電話號(hào)碼,它們之間的聯(lián)系R確實(shí)是按字典順序的排列,其相應(yīng)的數(shù)據(jù)結(jié)構(gòu)確實(shí)是DS(D,R),即一個(gè)數(shù)組。(2)數(shù)據(jù)結(jié)構(gòu)種類數(shù)據(jù)結(jié)構(gòu)又分為數(shù)據(jù)的邏輯結(jié)構(gòu)和數(shù)據(jù)的物理結(jié)構(gòu)。數(shù)據(jù)的邏輯結(jié)構(gòu)是從邏輯的角度(即數(shù)據(jù)間的聯(lián)系和組織方式)來(lái)觀看數(shù)據(jù),分析數(shù)據(jù),與數(shù)據(jù)的存儲(chǔ)位置無(wú)關(guān)。數(shù)據(jù)的物理結(jié)構(gòu)是指數(shù)據(jù)在計(jì)算機(jī)中存放的結(jié)構(gòu),即數(shù)據(jù)的邏輯結(jié)構(gòu)在計(jì)算機(jī)中的實(shí)現(xiàn)形式,因此物理結(jié)構(gòu)也被
27、稱為存儲(chǔ)結(jié)構(gòu)。本節(jié)只研究數(shù)據(jù)的邏輯結(jié)構(gòu),并將反映和實(shí)現(xiàn)數(shù)據(jù)聯(lián)系的方法稱為數(shù)據(jù)模型。目前,比較流行的數(shù)據(jù)模型有三種,即按圖論理論建立的層次結(jié)構(gòu)模型和網(wǎng)狀結(jié)構(gòu)模型以及按關(guān)系理論建立的關(guān)系結(jié)構(gòu)模型。2.層次、網(wǎng)狀和關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)(1)層次結(jié)構(gòu)模型層次結(jié)構(gòu)模型實(shí)質(zhì)上是一種有根結(jié)點(diǎn)的定向有序樹(shù)(在數(shù)學(xué)中樹(shù)被定義為一個(gè)無(wú)回的連通圖)。例如圖20.6.4是一個(gè)高等學(xué)校的組織結(jié)構(gòu)圖。那個(gè)組織結(jié)構(gòu)圖像一棵樹(shù),校部確實(shí)是樹(shù)根(稱為根結(jié)點(diǎn)),各系、專業(yè)、教師、學(xué)生等為枝點(diǎn)(稱為結(jié)點(diǎn)),樹(shù)根與枝點(diǎn)之間的聯(lián)系稱為邊,樹(shù)根與邊之比為1:N,即樹(shù)根只有一個(gè),樹(shù)枝有N個(gè)。這種數(shù)據(jù)結(jié)構(gòu)模型的一般結(jié)構(gòu)見(jiàn)圖20.6.5所示。圖20
28、.6.4 高等學(xué)校的組織結(jié)構(gòu)圖 圖20.6.5 層次結(jié)構(gòu)模型圖20.6.5中,Ri(i1,2,6)代表記錄(即數(shù)據(jù)的集合),其中R1確實(shí)是根結(jié)點(diǎn)(假如Ri看成是一個(gè)家族,則R1確實(shí)是祖先,它是R2、R3、R4的雙親,而R2、R3、R4互為兄弟),R5、R6也是兄弟,且其雙親為R3。R2、R4、R5、R6又被稱為葉結(jié)點(diǎn)(即無(wú)子女的結(jié)點(diǎn))。如此,Ri(i1,2,6)就組成了以R1為樹(shù)根的一棵樹(shù),這確實(shí)是一個(gè)層次數(shù)據(jù)結(jié)構(gòu)模型。按照層次模型建立的數(shù)據(jù)庫(kù)系統(tǒng)稱為層次模型數(shù)據(jù)庫(kù)系統(tǒng)。IMS(Information Manage-mentSystem)是其典型代表。(2)網(wǎng)狀結(jié)構(gòu)模型?在圖20.6.6中,給
29、出了某醫(yī)院大夫、病房和病人之間的聯(lián)系。即每個(gè)大夫負(fù)責(zé)治療三個(gè)病人,每個(gè)病房可住一到四個(gè)病人。假如將大夫看成是一個(gè)數(shù)據(jù)集合,病人和病房分不是另外兩個(gè)數(shù)據(jù)集合,那么大夫、病人和病房的比例關(guān)系確實(shí)是M:N:P(即M個(gè)大夫,N個(gè)病人,P間病房)。這種數(shù)據(jù)結(jié)構(gòu)確實(shí)是網(wǎng)狀數(shù)據(jù)結(jié)構(gòu),它的一般結(jié)構(gòu)模型如圖20.6.7所示。在圖中,記錄Ri(i1,2,8)滿足以下條件:能夠有一個(gè)以上的結(jié)點(diǎn)無(wú)雙親(如R1、R2、R3)。至少有一個(gè)結(jié)點(diǎn)有多于一個(gè)以上的雙親。在大夫、病人、病房例中,大夫集合有若干個(gè)結(jié)點(diǎn)(M個(gè)大夫結(jié)點(diǎn))無(wú)雙親,而病房集合有P個(gè)結(jié)點(diǎn)(即病房),并有一個(gè)以上的雙親(即病人)。圖20.6.6 大夫、病房和病
30、人之間的關(guān)系圖20.6.7 網(wǎng)狀結(jié)構(gòu)模型按照網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)建立的數(shù)據(jù)庫(kù)系統(tǒng)稱為網(wǎng)狀數(shù)據(jù)庫(kù)系統(tǒng),其典型代表是DBTG(Data Base Task Group)。用數(shù)學(xué)方法可將網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)化為層次數(shù)據(jù)結(jié)構(gòu)。(3)關(guān)系結(jié)構(gòu)模型關(guān)系式數(shù)據(jù)結(jié)構(gòu)把一些復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸結(jié)為簡(jiǎn)單的二元關(guān)系(即二維表格形式)。例如某單位的職工關(guān)系確實(shí)是一個(gè)二元關(guān)系(見(jiàn)表20.6.8)。那個(gè)四行六列的表格的每一列稱為一個(gè)字段(即屬性),字段名相當(dāng)于標(biāo)題欄中的標(biāo)題(屬性名稱);表的每一行是包含了六個(gè)屬性(工號(hào)、姓名、年齡、性不、職務(wù)、工資)的一個(gè)六元組,即一個(gè)人的記錄。那個(gè)表格清晰地反映出該單位職工的差不多情況。表20.6.8
31、職工差不多情況通常一個(gè)m行、n列的二維表格的結(jié)構(gòu)如表20.6.9所示。表中每一行表示一個(gè)記錄值,每一列表示一個(gè)屬性(即字段或數(shù)據(jù)項(xiàng))。該表一共有m個(gè)記錄。每個(gè)記錄包含n個(gè)屬性。作為一個(gè)關(guān)系的二維表,必須滿足以下條件:(1)表中每一列必須是差不多數(shù)據(jù)項(xiàng)(即不可再分解)。(2)表中每一列必須具有相同的數(shù)據(jù)類型(例如字符型或數(shù)值型)。(3)表中每一列的名字必須是唯一的。(4)表中不應(yīng)有內(nèi)容完全相同的行。(5)行的順序與列的順序不阻礙表格中所表示的信息的含義。由關(guān)系數(shù)據(jù)結(jié)構(gòu)組成的數(shù)據(jù)庫(kù)系統(tǒng)被稱為關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)。在關(guān)系數(shù)據(jù)庫(kù)中,對(duì)數(shù)據(jù)的操作幾乎全部建立在一個(gè)或多個(gè)關(guān)系表格上,通過(guò)對(duì)這些關(guān)系表格的分類、合
32、并、連接或選取等運(yùn)算來(lái)實(shí)現(xiàn)數(shù)據(jù)的治理。dBASEII確實(shí)是這類數(shù)據(jù)庫(kù)治理系統(tǒng)的典型代表。關(guān)于一個(gè)實(shí)際的應(yīng)用問(wèn)題(如人事治理問(wèn)題),有時(shí)需要多個(gè)關(guān)系才能實(shí)現(xiàn)。用dBASEII建立起來(lái)的一個(gè)關(guān)系稱為一個(gè)數(shù)據(jù)庫(kù)(或稱數(shù)據(jù)庫(kù)文件),而把對(duì)應(yīng)多個(gè)關(guān)系建立起來(lái)的多個(gè)數(shù)據(jù)庫(kù)稱為數(shù)據(jù)庫(kù)系統(tǒng)。dBASEII的另一個(gè)重要功能是通過(guò)建立命令文件來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)庫(kù)的使用和治理,關(guān)于一個(gè)數(shù)據(jù)庫(kù)系統(tǒng)相應(yīng)的命令序列文件,稱為該數(shù)據(jù)庫(kù)的應(yīng)用系統(tǒng)。因此,能夠概括地講,一個(gè)關(guān)系稱為一個(gè)數(shù)據(jù)庫(kù),若干個(gè)數(shù)據(jù)庫(kù)能夠構(gòu)成一個(gè)數(shù)據(jù)庫(kù)系統(tǒng)。數(shù)據(jù)庫(kù)系統(tǒng)能夠派生出各種不同類型的輔助文件和建立它的應(yīng)用系統(tǒng)。? 數(shù)據(jù)庫(kù)的要求與特性為了使各種類型的數(shù)據(jù)庫(kù)系統(tǒng)能夠充分發(fā)揮它們的優(yōu)越性,必須對(duì)數(shù)據(jù)庫(kù)治理系統(tǒng)的使用提出一些明確的要求。1.建立數(shù)據(jù)庫(kù)文件的要求(1)盡量減少數(shù)據(jù)的重復(fù),使數(shù)據(jù)具有最小的冗余度。計(jì)算機(jī)早期應(yīng)用中
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 租客合同終止租房協(xié)議
- 技術(shù)開(kāi)發(fā)與轉(zhuǎn)讓合同保密范本
- 智能化系統(tǒng)供貨安裝合同樣本
- 礦山企業(yè)輪換工勞動(dòng)合同模板及示例
- 農(nóng)村土地出租權(quán)屬合同樣本
- 標(biāo)準(zhǔn)貨物銷售合同簡(jiǎn)版
- 城市配送服務(wù)合同一覽
- 小學(xué)生種花演講課件
- 影視設(shè)備行業(yè)交流服務(wù)批發(fā)考核試卷
- 廣播電視節(jié)目的心理影響與教育意義考核試卷
- 低溫絕熱液氧瓶充裝操作規(guī)程模版(2篇)
- 大眾汽車使用說(shuō)明書(shū)
- (高清版)DZT 0145-2017 土壤地球化學(xué)測(cè)量規(guī)程
- 供熱公司安全教育知識(shí)
- 高中英語(yǔ)課程綱要
- 《藥物設(shè)計(jì)學(xué)》課件
- 隨機(jī)微分方程
- 道路設(shè)施施工現(xiàn)場(chǎng)安全管理基本要求
- 公寓樓改造裝修施工方案
- 煙臺(tái)大學(xué)化學(xué)化工學(xué)院實(shí)驗(yàn)室儀器設(shè)備搬遷項(xiàng)目
- 2022版10kV架空配電線路無(wú)人機(jī)自主巡檢作業(yè)導(dǎo)則
評(píng)論
0/150
提交評(píng)論