分布式數據庫綜述報告_第1頁
分布式數據庫綜述報告_第2頁
分布式數據庫綜述報告_第3頁
分布式數據庫綜述報告_第4頁
分布式數據庫綜述報告_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上電子科技大學研究生課程綜合考核報告 課程名稱:數據庫新技術 教師姓名:胡旺 學生姓名:董輝 學 號: 1 成 績: 學 期:2015年下學期 分布式數據庫綜述報告摘要  隨著傳統的數據庫技術日趨成熟、計算機網絡技術的飛速發(fā)展和應用范圍的擴充,數據庫應用已經普遍建立于計算機網絡之上。這時集中式數據庫系統表現出它的不足:數據按實際需要已在網絡上分布存儲,再采用集中式處理,勢必造成通信開銷大;應用程序集中在一臺計算機上運行,一旦該計算機發(fā)生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規(guī)模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式DB的“

2、集中計算”概念向“分布計算”概念發(fā)展。分布計算主要體現在客戶機服務器模式和分布式數據庫體系結構兩個方面。分布式數據庫系統通常使用較小的計算機系統,每臺計算機可單獨放在一個地方,每臺計算機中都有DBMS的一份完整拷貝副本,并具有自己局部的數據庫,位于不同地點的許多計算機通過網絡互相連接,共同組成一個完整的、全局的大型數據庫。DDBS已成為信息處理學科的重要領域,正在迅速發(fā)展,原因基于以下幾點:它可以解決組織機構分散而數據需要相互聯系的問題。如果一個組織機構需要增加新的相對自主的組織單位來擴充機構,則分布式數據庫系統可以在對當前機構影響最小的情況下進行擴充。均衡負載的需要。數據的分解采用使局部應用

3、達到最大,這使得各處理機之間的相互干擾降到最低。負載在各處理機之間分擔,可以避免臨界瓶頸。當現有機構中已存在幾個數據庫系統,而且實現全局應用的必要性增加時,就可以由這些數據庫自下而上構成分布式數據庫系統。關鍵詞:分布式數據庫 集群 數據存儲1. 分布式數據庫產生背景 20世紀六十年代末和七十年代出現了比較成熟的數據庫系統。以IMS為代表的層次型數據庫系統于1968年問世。20世紀七十年代初,美國CODASYL的數據庫任務組的提出了有名的網絡數據庫模型DBTG。分布式數據庫的研究始于20世紀70年代中期。E. F. Codd于20世紀七十年代中期提出了關系數據庫。世界上第一個分布式數據庫系統SD

4、D-1是由美國計算機公司(CCA)于1979年在DEC計算機上實現。七十年代,計算機科學技術的發(fā)展與飛速發(fā)展的現代通信技術相結合,導致了計算機網絡的出現。這個時期,世界上先后建成了許多規(guī)模巨大的、全國性的廣域計算機網絡對經濟、國防、情報、科學技術和社會生活產生了深刻的影響。隨著微型計算機的廣泛應用,又自然地提出了這樣的新問題,為了加強和擴大微型計算機處理數據的功能,要求將許多分布在不同地點上的微型計算機互連起來,共同工作。這樣,進入了分布式數據庫時代。20世紀90年代以來,分布式數據庫系統進入商品化應用階段,傳統的關系數據庫產品均發(fā)展成以計算機網絡及多任務操作系統為核心的分布式數據庫產品,同時

5、分布式數據庫逐步向客戶機服務器模式發(fā)展。 隨著傳統的數據庫技術日趨成熟、計算機網絡技術的飛速發(fā)展和應用范圍的擴充,數據庫應用已經普遍建立于計算機網絡之上。這時集中式數據庫系統表現出它的不足:數據按實際需要已在網絡上分布存儲,再采用集中式處理,勢必造成通信開銷大;應用程序集中在一臺計算機上運行,一旦該計算機發(fā)生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規(guī)模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式DB的“集中計算”概念向“分布計算”概念發(fā)展,以分布式為主要特征的數據庫系統的研究與開發(fā)受到人們的注意。分布式數據庫是數據庫技術與網絡技術相結合的產物,在數據庫領域已形成一

6、個分支。2. 國內外研究進展 分布式數據庫系統(Distributed Database system,簡稱DDBS)已有20多年的發(fā)展歷史,經歷了一個從產生到發(fā)展的過程,取得了長足的進步,許多技術問題被提出并得到了解決。20世紀90年代起,DDBS己進入商品化應用階段,當前,分布式數據庫技術已經成熟并得到廣泛應用。一些數據庫廠商在不斷推出和改進自己的分布式數據庫產品,以適應多種需要和擴大市場的占有份額。但是,實現和建立分布式數據庫系統絕對不是數據庫技術與網絡技術的簡單結合,而是在這兩種技術相互滲透和有機融合后的技術升華,它又產生了很多新的技術。而且,分布式數據庫系統雖然基于集中式數據庫系統,

7、但分布式數據庫系統卻有它自己的特色和理論基礎。由于數據的分布環(huán)境形成了很大的固有的技術難度,使得分布式數據庫系統的應用被推遲。至今完全遵循分布式數據庫系統規(guī)則,特別是實現完全分布透明性的商用系統還很難見到。 2.1 分布式數據庫國內發(fā)展現狀 我國對分布式數據庫系統的研究約在20世紀80年代初期開始,一些科研單位和高校先后建立和實現了幾個各具特色的分布式數據庫系統。如由中國科學院數學研究所設計,由該所與上??茖W技術大學、華東師范大學合作實現的CPOREL,武漢大學研制的WDDBS和WOODDBS,東北大學研制的DMDFO系統等,尤其值得一提的是華中科技大學達夢數據庫多媒體研究所開發(fā)的DMZ多媒體

8、數據庫,它解決了異構數據庫系統實現數據的共享和透明訪問的難度。他們的工作對我國分布式數據庫技術的理論研究和應用開發(fā)起到了積極的推動作用。 2.2 分布式數據庫國外發(fā)展現狀 國外對分布數據管理的研究有兩個方面:一是單項的研究。比如數據的分布問題,通信問題等。在研究一個問題時,假定其它因素是不變的,得出研究成果。此處還要研究的是要將各種因素綜合起來,研究它們的相互作用和結果。數據庫設計和更新同步之間就有密切的聯系,對于更新要求,依據不同的更新同步方案,對通信系統的要求也隨著不同。因此,就要對這些因素綜合地考慮。二是對計算機網絡的研究。計算機網絡技術的迅速發(fā)展, 已經很大程度地影響到了數據庫和分布數

9、據庫的領域。不管是在遠程網絡還是局域網領域,都發(fā)生了很多的變比。局域網和遠程網之間的處理差別,必然會導致處理數據庫和分布數據庫問題的顯然不同的一些原則和方法。分布式數據庫系統已經成為信息處理學科的重要領域,正在迅速發(fā)展之中。3. 分布式數據庫實現思路及體系結構 分布式數據庫系統是在集中式數據庫系統的基礎上發(fā)展起來的,由分布式數據庫管理系統和分布式數據庫組成,是數據庫技術與計算機網絡技術的產物。分布式數據庫管理系統是具有管理分布數據庫功能的計算機系統,分布式數據庫則是一組邏輯上屬同一系統,但物理上分布在計算機網絡的不同結點的結構化數據的集合,由分布于計算機網絡上的多個邏輯相關的數據庫組成。網絡中

10、的每個結點(場地)具有獨立處理的能力(稱為本地自治),可執(zhí)行局部應用,同時,每個結點通過網絡通訊系統也能執(zhí)行全局應用。所謂局部應用即僅對本結點的數據庫執(zhí)行某些應用。所謂全局應用(或分布應用)是指對兩個以上結點的數據庫執(zhí)行某些應用。支持全局應用的系統才能稱為分布式數據庫系統。對用戶來說,一個分布式數據庫系統邏輯上看如同集中式數據庫系統一樣,用戶可在任何一個場地執(zhí)行全局應用。 分布式數據庫系統抽象為4層的結構模式。這種結構模式得到了國內外的支持和認同。4層模式劃分為全局外層、全局概念層、局部概念層和局部內層,在各層間還有相應的層間映射。這種4層模式適用于同構型分布式數據庫系統,也適用于異構型分布式

11、數據庫系統。4. 分布式數據庫主要特點及優(yōu)缺點DDBS的基本特點:(1)物理分布性:數據不是存儲在一個場地上,而是存儲在計算機網絡的多個場地上。邏輯整體性:數據物理分布在各個場地,但邏輯上是一個整體,它們被所有用戶(全局用戶)共享,并由一個DDBMS統一管理。(2)場地自治性:各場地上的數據由本地的DBMS管理,具有自治處理能力,完成本場地的應用(局部應用)。(3)場地之間協作性:各場地雖然具有高度的自治性,但是又相互協作構成一個整體。DDBS的其他特點(1)數據獨立性 (2)集中與自治相結合的控制機制 (3)適當增加數據冗余度 (4)事務管理的分布性DDBS的優(yōu)點 (1)具有靈活的體系結構

12、(2)適應分布式的管理和控制機構 (3)經濟性能優(yōu)越 (4)系統的可靠性高、可用性好 (5)局部應用的響應速度快 (5)可擴展性好,易于集成現有的系統DDBS的缺點 (1)系統開銷較大,主要花在通信部分 。(2)復雜的存取結構(如輔助索引、文件的鏈接技術),在集中式DBS中是有效存取數據的重要技術,但在分布式系統中不一定有效。 (3)數據的安全性和保密性較難處理。5.分布式數據庫發(fā)展趨勢 未來分布式數據庫的發(fā)展趨勢,除了解決當前面臨的技術挑戰(zhàn)還有一些更好的發(fā)展方向。比如與人工智能的有機結合、與面向對象技術的結合、應用并行計算機、高性能工作站對其影響顯著,也引導著分布式數據庫的發(fā)展趨勢。人工智能

13、和分布式數據庫的相結合是數據庫技術發(fā)展的重要方向之一,這種結合能夠使分布式數據庫更加智能化,即數據挖掘和知識工程。兩技術的結合能夠旨在發(fā)現大量數據中的新信息、所蘊含的知識,而這些內容將為人們的生活提供便利與幫助。傳統的數據庫技術僅僅是一種數據處理、分析方面的技術,它的優(yōu)勢在于對數據進行存儲、管理、檢索,而邏輯推理能力是數據庫技術所不具備的。另一方面,人工智能則可以通過計算機模擬人的大腦思維過程,邏輯推理和判斷是人工智能技術的主要特征。智能化的分布式數據庫應該是人工智能分布式數據庫技術的有機結合,同時具有兩者的優(yōu)點且避免他們的缺點,而這也就是分布式知識庫系統。知識庫是存儲事實的外延數據庫和存儲常

14、用知識的內涵數據庫的聯合體。以關系代數為理論基礎的關系數據庫管理系是非常嚴格的數據庫系統。目前,它已經能夠滿足現實生活中的眾多應用。然而,隨著近些年軟件工程技術的發(fā)展,傳統的結構化的軟件編程方法已經逐步進入到基于面向對象的編程時代,這一點也逐漸滲透到數據庫技術領域,也推動著分布式數據庫的應用發(fā)展由傳統領域往面向對象領域的擴展。分布式面向對象數據庫具有以下幾個優(yōu)點,高性能和高可用性,能夠很好的適應面向對象數據庫的高度分布,同時,它還支持異構數據庫,也擁有隱藏信息的特性。 隨著數據庫技術的迅猛發(fā)展,新一代數據庫必將具有數據量大和結構復雜的特點,而新的 數據庫應用則需要具有復雜數據處理操作和高效事物

15、處理能力,這也就需要高性能的數據庫系統支持。近些年,并行計算機系統發(fā)展迅猛,而并行計算機機群為高性能數據庫系統的實現帶來了強有力的支持。在這個基礎上建立的數據庫系統稱為并行數據庫系統。并行數據服務器系統和分布式數據庫相比,具有以下三點重要的不同:應用目標不同,并行數據服務器中并不苛求最大程度的本地處理能力;實現方式不同,在并行服務器系統中,站點間工作負載主要利用高速網絡相互調節(jié);各站點的地位不同,即并行服務器系統中不存在局部應用和全局應用的概念,站點之間是完全不獨立的?,F在隨著大數據和云時代的到來,面對海量的數據,在將來的計算機發(fā)展歷程中分布式數據庫系統將會越來越重要,我們也相信在不久的將來,分布式數據庫系統會給我們的生活帶來更多的便捷。6.結論 數據庫技術的產生,主要是為了方便人們自動化管理和使用日常生活中的海量數據。利用數據庫系統對數據進行自動化地管理、分析,能夠有效提供人們的工作效率。而隨著傳統的人工管理數據文件的方式逐漸被取代,它也逐漸被廣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論