版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)中心方案設(shè)計V2.0數(shù)據(jù)中心方案設(shè)計V2.0/NUMPAGES30數(shù)據(jù)中心方案設(shè)計V2.0數(shù)據(jù)中心方案設(shè)計V2.0數(shù)據(jù)中心方案設(shè)計Bychja、系統(tǒng)拓?fù)鋱Db、
建立一個集中分散、異構(gòu)、可擴(kuò)充、可集成、有統(tǒng)一數(shù)據(jù)模型、有多種角度視圖的、可交換的和安全可靠的復(fù)合數(shù)據(jù)庫系統(tǒng)。它將成為政府各種業(yè)務(wù)系統(tǒng)、政府部門之間協(xié)同工作的數(shù)據(jù)中心,是政府門戶的信息中心,多媒體、文檔資料和政策法規(guī)的存儲中心和預(yù)測決策所需的數(shù)據(jù)倉庫中心。
對于一個完整的電子政務(wù)系統(tǒng)來說,統(tǒng)一的框架和相應(yīng)的數(shù)據(jù)模式是十分重要的。電子政務(wù)的構(gòu)建,正經(jīng)歷著由以技術(shù)為中心向以數(shù)據(jù)為中心的方向轉(zhuǎn)變,沒有數(shù)據(jù)也就沒有信息,也就沒有政府網(wǎng)站及電子政府。數(shù)據(jù)中心在電子政務(wù)系統(tǒng)中處于中心地位,具有公共數(shù)據(jù)(信息)庫、模型庫、文件交換站以及發(fā)布信息的政府門戶網(wǎng)站的功能,各數(shù)據(jù)源將自己的數(shù)據(jù)上傳給數(shù)據(jù)中心,而各部門根據(jù)自己的需要從數(shù)據(jù)中心獲取數(shù)據(jù),實(shí)施自己的應(yīng)用。
按信息的應(yīng)用屬性,可將電子政務(wù)的數(shù)據(jù)類型分為空間數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、政務(wù)數(shù)據(jù)、專題數(shù)據(jù)和多媒體語音數(shù)據(jù)。整合政務(wù)信息資源,建設(shè)和改造政務(wù)數(shù)據(jù)庫,并建立人口、法人機(jī)構(gòu)、空間地理和自然資源、以及宏觀經(jīng)濟(jì)四個基礎(chǔ)數(shù)據(jù)庫,將成為我國今后數(shù)年電子政務(wù)建設(shè)的關(guān)鍵。
由于我國政府各部門對信息化建設(shè)的深遠(yuǎn)意義認(rèn)識不夠,以及政務(wù)建設(shè)有一個發(fā)展過程,造成了政府各部門、城市各行業(yè)信息化發(fā)展步調(diào)不一,從而使政務(wù)信息化建設(shè)存在一些問題:
㈠、信息的共享、公開沒有立發(fā),信息采集、儲存標(biāo)準(zhǔn)不統(tǒng)一,造成了互聯(lián)互通不暢,共享程度低。
㈡、信息共享機(jī)制尚未建立,各職能部門內(nèi)部的信息相對封閉,產(chǎn)生了信息孤島效應(yīng),造成了信息資源的巨大浪費(fèi)。
㈢、大部分單位業(yè)務(wù)應(yīng)用系統(tǒng)還未形成一個內(nèi)部資源共享、有效運(yùn)行的整體,需要在電子政務(wù)設(shè)計建設(shè)的過場中進(jìn)行整合和改造。
㈣、網(wǎng)絡(luò)建設(shè)各自為政,結(jié)構(gòu)不合理,互連互通十分困難。
㈤、安全性存在隱患,人門還不放心在網(wǎng)上共享數(shù)據(jù)。
基于以上問題,需要在法律、技術(shù)、設(shè)備、管理等多方面加以考慮。
政府?dāng)?shù)據(jù)資源的建設(shè),將有助于打破各級政府和部門對信息的壟斷和封閉,能夠有效整合政務(wù)信息資源,強(qiáng)化對信息資源的不斷開發(fā)、更新和維護(hù);從長遠(yuǎn)來說,這項工作的開展,將有助于推動政府信息資源對社會的開放,使之發(fā)揮巨大的社會效益和經(jīng)濟(jì)效益。(2)政務(wù)敘詞表
電子政務(wù)與電子商務(wù)的一個顯著不同是前者是為主題所驅(qū)動的,而后者是交易驅(qū)動的。在主題驅(qū)動系統(tǒng)中,規(guī)范主題詞(敘詞)庫是至關(guān)重要的,因?yàn)樗菐靸?nèi)資源組織、管理以及庫際資源交換的基礎(chǔ)。規(guī)范政務(wù)敘詞表即是對所有入庫資源進(jìn)行科學(xué)標(biāo)引、描述與分類,通過敘詞嚴(yán)格的語義內(nèi)涵和位屬關(guān)聯(lián),建立所有資源在主題層的映射關(guān)系,對各類信息產(chǎn)品和服務(wù)過程起到基準(zhǔn)性、規(guī)范性、參照性、結(jié)構(gòu)性和工具性的支持作用,以實(shí)現(xiàn)全庫資源的有序化,并提升其可用性。
如"Internet"有"因特網(wǎng)"、"互聯(lián)網(wǎng)"、"網(wǎng)際網(wǎng)路"等名稱,僅以其中一個名稱進(jìn)行全文檢索、關(guān)鍵詞檢索等并不能保證文獻(xiàn)的查全率。而嚴(yán)格定義的敘詞表會在這些表達(dá)間建立關(guān)聯(lián),同時還會給出相關(guān)同位詞,如"Internet"的同位詞有"Intranet"(即"內(nèi)部網(wǎng)"、"企業(yè)網(wǎng)"、"內(nèi)聯(lián)網(wǎng)"、"內(nèi)特網(wǎng)"等),以及"Extranet"("外部網(wǎng)"、"外聯(lián)網(wǎng)"、"外特網(wǎng)")等,上位詞有"計算機(jī)網(wǎng)絡(luò)"、"網(wǎng)絡(luò)"以及"無線互聯(lián)網(wǎng)"、"移動互聯(lián)網(wǎng)"等下位詞。
資源庫中所有的文獻(xiàn)資源只有在標(biāo)引并與敘詞庫建立映射后,才能使用戶在主題查詢時能進(jìn)退自如。政務(wù)資源敘詞表大致由如下分詞表組成:機(jī)關(guān)公文主題詞表、宏觀經(jīng)濟(jì)主題詞表、行業(yè)主題詞表、社會事業(yè)主題詞表以及科學(xué)與技術(shù)主題詞表等。(3)信息分類、代碼和指標(biāo)體系表
分類與代碼對于庫中信息的組織管理和服務(wù)是極其重要的,同時,隨著國際經(jīng)濟(jì)一體化進(jìn)程的加快,與國際標(biāo)準(zhǔn)信息分類體系的兼容問題也日益重要。這些分類代碼體系涉及到國民經(jīng)濟(jì)行業(yè)分類代碼、聯(lián)合國及各國海關(guān)協(xié)調(diào)制度(HS)分類與代碼、北美工業(yè)標(biāo)準(zhǔn)分類代碼(NAICS體系)、全國行政區(qū)劃分類與代碼(擴(kuò)展到鄉(xiāng)鎮(zhèn)級)、全國工農(nóng)業(yè)產(chǎn)品/商品分類代碼、各主導(dǎo)行業(yè)信息分類與代碼以及文件格式及其結(jié)構(gòu)描述規(guī)范代碼等。
此外,各種指標(biāo)體系與格式化文件對于政府的宏觀管理和決策分析也是極其重要的。此類數(shù)據(jù)常以表格形式出現(xiàn),并在各級機(jī)關(guān)部門中流轉(zhuǎn)生成,它們之間的交換也以表格形式進(jìn)行。所以,字段統(tǒng)一、代碼統(tǒng)一、格式統(tǒng)一、定義統(tǒng)一的表格是主管部門從事經(jīng)濟(jì)分析、數(shù)據(jù)再處理和決策支持的前提。(4)GIS平臺
幾乎所有的經(jīng)濟(jì)、產(chǎn)業(yè)與社會信息都與地理空間信息相關(guān),近年來GIS已融入IT業(yè)的主體,并成為各類數(shù)據(jù)綜合可視化的基礎(chǔ)平臺。與專業(yè)數(shù)據(jù)結(jié)合的各類專題電子地圖更是各地政府進(jìn)行區(qū)域經(jīng)濟(jì)與社會發(fā)展規(guī)劃、開展招商引資、比較本地與周邊地區(qū)競爭優(yōu)勢不可缺少的工具。同時,政務(wù)數(shù)據(jù)庫的資源只有在與GIS整合后,才能產(chǎn)生質(zhì)變,真正為政府宏觀調(diào)控起到?jīng)Q策支持的作用。(5)服務(wù)資源
電子政務(wù)系統(tǒng)的服務(wù)對象有4類:政府機(jī)構(gòu)、公務(wù)員、公民、企業(yè)單位。服務(wù)資源即指直接為這4類客戶提供服務(wù)的信息。其中包括政府系統(tǒng)辦公數(shù)據(jù)、各類業(yè)務(wù)數(shù)據(jù)、國家政策指令,各種政務(wù)圖像、視頻,還包括電子商務(wù)、工商、稅務(wù)、金融、海關(guān)、法律、衛(wèi)生、醫(yī)療、教育、職業(yè)等基礎(chǔ)設(shè)施服務(wù)信息。
(1)靜態(tài)數(shù)據(jù)與動態(tài)數(shù)據(jù)
電子政務(wù)數(shù)據(jù)中心必須滿足電子政務(wù)平臺進(jìn)行數(shù)據(jù)交換的需要,同時還必須滿足在平臺上建立的各業(yè)務(wù)系統(tǒng)進(jìn)行綜合業(yè)務(wù)處理的要求,并為門戶系統(tǒng)提供各種靜態(tài)和動態(tài)的數(shù)據(jù)、信息。所謂靜態(tài)信息是指對電子政務(wù)的運(yùn)行中不經(jīng)常變化,供各個業(yè)務(wù)系統(tǒng)查詢、處理的數(shù)據(jù)或信息:政策、法規(guī)、元數(shù)據(jù)、資料庫、各種多媒體數(shù)據(jù)等,它們會隨著時間而逐步增大。所謂動態(tài)數(shù)據(jù)是指隨著運(yùn)行而增加、修改的數(shù)據(jù):并聯(lián)審批中文件流轉(zhuǎn)狀態(tài)數(shù)據(jù),反映企業(yè)、個人所處狀態(tài)的數(shù)據(jù),國民經(jīng)濟(jì)運(yùn)行狀態(tài)的數(shù)據(jù)等。動態(tài)數(shù)據(jù)同各個局委辦的信息密切相關(guān),但又是面向主題的,如社會保險這個主題,實(shí)際上同保險、工資、稅務(wù)和銀行密切相關(guān);個人信用使用主題,它的數(shù)據(jù)與銀行、稅務(wù)、個人消費(fèi)、個人收入密切相關(guān)。(2)微觀應(yīng)用與宏觀應(yīng)用的數(shù)據(jù)共享
政府業(yè)務(wù)中的信息應(yīng)用有微觀的應(yīng)用與宏觀應(yīng)用之分,微觀數(shù)據(jù)的應(yīng)用主要是針對個案的事務(wù)處理。比如工商登記,業(yè)務(wù)申報,稅務(wù)處理,個人勞保、補(bǔ)助、婚喪、駕照、護(hù)照、醫(yī)療等等。微觀事務(wù)處理的業(yè)務(wù)既包含對社會市場秩序的監(jiān)管,又包含對企業(yè)、對公眾的服務(wù)。這類事務(wù)處理的工作主要是由基層的一線人員來承擔(dān)的,其信息共享的特點(diǎn)是:由來自不同方面的信息要圍繞一個主體來整合起來,比如將醫(yī)療衛(wèi)生、計劃生育、社會保障等信息依據(jù)人的身份證號碼整合起來,這就構(gòu)成了以人為主題的數(shù)據(jù)庫。同樣還可以建立以法人為主題的數(shù)據(jù)庫來整合法人的信息咨詢。實(shí)際上,微觀信息共享的核心是將不同來源的數(shù)據(jù)資源,整合為主題數(shù)據(jù)庫。
微觀數(shù)據(jù)的收集經(jīng)常是由不同的主管部門來做的,如公安、稅務(wù)、衛(wèi)生部門、社保部門、工商部門等。要讓這些部門收集的數(shù)據(jù)依據(jù)主題(主體)整合起來并不是容易的,首先必須要解決這些部門主觀上的抵制,這是一個政務(wù)改革與利益處置的問題。在技術(shù)上,要求有非常標(biāo)準(zhǔn)化的唯一的主體編碼,并要開放數(shù)據(jù)結(jié)構(gòu),這樣才有利于可共享的主題數(shù)據(jù)庫的誕生。進(jìn)一步,我們應(yīng)當(dāng)盡量通過一表式的調(diào)查、登記,將盡可能多的數(shù)據(jù)集中地通過一次調(diào)查來完成,從而能盡量地節(jié)約成本。由于管理的角度不一樣,我們很難通過一個主題數(shù)據(jù)來集中所有的共享數(shù)據(jù),也許,我們還是需要幾個系統(tǒng)來分別處理各自的業(yè)務(wù),但是,經(jīng)過數(shù)據(jù)整合設(shè)計之后的系統(tǒng),肯定能夠降低數(shù)據(jù)收集的總成本,并為微觀業(yè)務(wù)提供更有效的服務(wù)。宏觀應(yīng)用的數(shù)據(jù)共享,主要是為領(lǐng)導(dǎo)層服務(wù),希望通過共享數(shù)據(jù)資源來提高政府的決策水平。然而如何從紛繁龐雜的數(shù)據(jù)中挖掘出有用的信息進(jìn)行預(yù)測分析,如何更好地管理和決策呢?我們可以選擇數(shù)據(jù)倉庫(DataWarehouse)作為決策支持系統(tǒng)的核心。數(shù)據(jù)倉庫是支持管理決策過程的、面向主題的、集成的、不可更新的且隨時間不斷變化的數(shù)據(jù)集合。利用數(shù)據(jù)倉庫,對源數(shù)據(jù)經(jīng)過提取、轉(zhuǎn)換、加載形成統(tǒng)一的數(shù)據(jù)格式,再利用數(shù)據(jù)挖掘和OLAP分析工具為決策者提供所需的信息。
數(shù)據(jù)倉庫的使用者主要是機(jī)關(guān)單位、市委領(lǐng)導(dǎo)等決策相關(guān)人員,為他們提供在業(yè)務(wù)辦公基礎(chǔ)數(shù)據(jù)庫的基礎(chǔ)上各種層次匯總的數(shù)據(jù),幫助他們進(jìn)行各種決策支持。對于數(shù)據(jù)倉庫的概念我們可以從兩個層次予以理解,首先,數(shù)據(jù)倉庫用于支持決策,面向分析型數(shù)據(jù)處理,它不同于現(xiàn)有的業(yè)務(wù)型數(shù)據(jù)庫;其次,數(shù)據(jù)倉庫是對多個異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù),而且存放在數(shù)據(jù)倉庫中的數(shù)據(jù)一般不再修改。數(shù)據(jù)倉庫主要有三方面的作用:首先,數(shù)據(jù)倉庫提供了標(biāo)準(zhǔn)的報表和圖表功能,其中的數(shù)據(jù)來源于不同的多個事務(wù)處理系統(tǒng),因此,數(shù)據(jù)倉庫的報表和圖表是關(guān)于整個集成信息的報表和圖表;其次,數(shù)據(jù)倉庫支持多維分析,多維分析是通過把一個實(shí)體的多項重要的屬性定義為多個維度,使得用戶能方便地匯總數(shù)據(jù)集,簡化了數(shù)據(jù)的分析處理邏輯,并能對不同維度值的數(shù)據(jù)進(jìn)行比較,而維度則表示了對信息的不同理解角度。應(yīng)用多維分析可以在一個查詢中對不同階段的數(shù)據(jù)進(jìn)行縱向或橫向比較,這在決策過程中非常有用;第三,數(shù)據(jù)倉庫是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵基礎(chǔ),數(shù)據(jù)挖掘技術(shù)要在已有數(shù)據(jù)中識別數(shù)據(jù)的模式,以幫助用戶理解現(xiàn)有的信息,并在已有信息的基礎(chǔ)上,對未來的狀況作出預(yù)測。
雖然數(shù)據(jù)倉庫也有面向主題的定義,但這些主題是較長時間的,具有戰(zhàn)略定義的主題。
由以上分析可見,根據(jù)數(shù)據(jù)庫的操作性、數(shù)據(jù)的語義,應(yīng)該把數(shù)據(jù)庫分為三大類:一般意義的數(shù)據(jù)庫即關(guān)系數(shù)據(jù)庫、文本數(shù)據(jù)庫(DB);供綜合業(yè)務(wù)系統(tǒng)和門戶使用的面向主題的數(shù)據(jù)庫(OSD);數(shù)據(jù)倉庫,它是供內(nèi)門戶決策者使用的數(shù)據(jù)庫(DW)。DB數(shù)據(jù)主要分布在各局委辦,數(shù)據(jù)中心只有少量的;所以它是集中分布的。面向主題的操作數(shù)據(jù)庫(OSD)是電子政務(wù)數(shù)據(jù)中心的主體,它是DB按主題映射的數(shù)據(jù)庫;數(shù)據(jù)倉庫建立在DB和OSD之上的主題數(shù)據(jù)庫。
這三種數(shù)據(jù)庫的關(guān)系描述如下:
面向主題的操作數(shù)據(jù)庫是數(shù)據(jù)庫體系的中間層,一方面包含全局一致的、細(xì)節(jié)的、當(dāng)前或接近當(dāng)前的數(shù)據(jù);另一方面它是面向主題的,集成的數(shù)據(jù)環(huán)境,且數(shù)據(jù)量小,供各個綜合業(yè)務(wù)系統(tǒng)查詢處理使用,主要用作輔助完成日常決策的數(shù)據(jù)分析處理。所以這種數(shù)據(jù)庫的主要特征是:
l系統(tǒng)功能
表4-1
設(shè)計目標(biāo)處理類型主要功能需求特征
中層輔助決策與綜合查詢?nèi)粘9芾砗涂刂频臎Q策,事務(wù)處理與決策分析并存聯(lián)機(jī)事務(wù)處理聯(lián)機(jī)分析綜合全局中層
l數(shù)據(jù)特征
表4-2
內(nèi)容來源組織穩(wěn)定性綜合性特征
當(dāng)前或接近當(dāng)前的數(shù)據(jù)政府系統(tǒng)內(nèi)部主題較穩(wěn)定允許更新某一主題的綜合和詳細(xì)數(shù)據(jù)全域一致的數(shù)據(jù)環(huán)境
l數(shù)據(jù)庫的主要用戶
該數(shù)據(jù)庫是反映某一主題的數(shù)據(jù),其用戶是政府工作人員和就某一主題進(jìn)行綜合查詢的人員。(3)集中分布式數(shù)據(jù)管理
當(dāng)我們的微觀數(shù)據(jù)規(guī)模非常大的時候,依靠集中的數(shù)據(jù)處理會是很不方便的,我們可以將數(shù)據(jù)庫建設(shè)分散化,由本地來進(jìn)行數(shù)據(jù)收集、整理和數(shù)據(jù)庫更新。然而,數(shù)據(jù)的使用卻不能是地區(qū)化的,數(shù)據(jù)的查詢是全國范圍的。這樣,共享數(shù)據(jù)的管理與共享數(shù)據(jù)的使用范圍就會不一致。為了解決這一問題,可以考慮使用標(biāo)準(zhǔn)的目錄數(shù)據(jù)庫,統(tǒng)一結(jié)構(gòu)的目錄數(shù)據(jù)庫將允許多層次分布式的建立自己的子系統(tǒng),而又能自然形成一個整體,以支持統(tǒng)一的數(shù)據(jù)庫查詢,這對于建立大規(guī)模的主題數(shù)據(jù)庫體系是非常有效的。數(shù)據(jù)就近的管理與聯(lián)合統(tǒng)一的使用不僅會大大提高數(shù)據(jù)共享的范圍,而且會有效地降低數(shù)據(jù)維護(hù)管理的成本。數(shù)據(jù)元表示是在數(shù)據(jù)處理和信息交換過程中數(shù)據(jù)元所采用的格式。如數(shù)據(jù)的長度、數(shù)據(jù)的類型等都要給予說明,數(shù)據(jù)元的格式受數(shù)據(jù)元的屬性及應(yīng)用環(huán)境限定。
數(shù)據(jù)元可分為通用數(shù)據(jù)元和應(yīng)用數(shù)據(jù)元。通用數(shù)據(jù)元是獨(dú)立于任何具體的應(yīng)用而存在的數(shù)據(jù)元,其功能是為應(yīng)用領(lǐng)域的數(shù)據(jù)元設(shè)計也就是為應(yīng)用數(shù)據(jù)元的設(shè)計提供一部通用數(shù)據(jù)元字典。應(yīng)用數(shù)據(jù)元是在特定領(lǐng)域內(nèi)使用的數(shù)據(jù)元集,例如在電子政務(wù)領(lǐng)域的應(yīng)用。從這個意義上來講國家標(biāo)準(zhǔn)《數(shù)據(jù)元及交換格式、信息交換、日期和時間表示法》就應(yīng)該是一部通用數(shù)據(jù)元字典。所謂數(shù)據(jù)元的標(biāo)準(zhǔn)化就是對數(shù)據(jù)元的總則、定義、描述、分類、表示和注冊等制定統(tǒng)一的標(biāo)準(zhǔn),并加以貫徹、實(shí)施的過程。在大量繁雜的政務(wù)信息中,哪些概念可以作為我們定義數(shù)據(jù)元的基礎(chǔ),數(shù)據(jù)元概念的特性中哪一個可以繼承下來作為派生的通用數(shù)據(jù)元的特性,通用數(shù)據(jù)元特性中的又有哪些可以被應(yīng)用數(shù)據(jù)元所繼承。以上這些問題都是數(shù)據(jù)元標(biāo)準(zhǔn)化過程所要解決的。隨著社會的發(fā)展,信息在社會各個行業(yè)中的作用不斷提高,數(shù)據(jù)元標(biāo)準(zhǔn)也越來越引起各個行業(yè)的重視。人們認(rèn)識到只要對信息按共同約定的規(guī)則進(jìn)行統(tǒng)一組織、分類與表示,使用同一的概念,并用相同的表示,就能做到共識,不致產(chǎn)生歧義。這種簡化的概念表述,提高了數(shù)據(jù)的準(zhǔn)確性,有利于數(shù)據(jù)的共享、交換。
各政務(wù)系統(tǒng)所要處理的對象主要是數(shù)據(jù),數(shù)據(jù)元標(biāo)準(zhǔn)所要起的作用就是用一個統(tǒng)一的標(biāo)準(zhǔn)來描述、定義、規(guī)范這些系統(tǒng)所要處理的數(shù)據(jù),為系統(tǒng)間的數(shù)據(jù)共享、數(shù)據(jù)交換提供一個公用的信息接口。這個公用的信息接口的基礎(chǔ)是政府部門的數(shù)據(jù)環(huán)境建設(shè),而數(shù)據(jù)環(huán)境建設(shè)的基礎(chǔ)就是用數(shù)據(jù)元標(biāo)準(zhǔn)來描述數(shù)據(jù)源,建立電子政務(wù)領(lǐng)域的應(yīng)用數(shù)據(jù)元字典。這個公用的信息接口實(shí)際上就是我們對政務(wù)領(lǐng)域的信息以數(shù)據(jù)元標(biāo)準(zhǔn)進(jìn)行描述,形成一個大家都廣泛接受,并在政務(wù)系統(tǒng)的開發(fā)過程中遵守的規(guī)則。在此基礎(chǔ)上,各種系統(tǒng)之間的數(shù)據(jù)共享、數(shù)據(jù)交換成為可能。數(shù)據(jù)元的標(biāo)準(zhǔn)化過程起到了一個針對要處理的數(shù)據(jù)源進(jìn)行規(guī)范化的作用。通過這個過程,規(guī)范了其中的概念、定義、以及知識的描述,形成了數(shù)據(jù)元詞典,根據(jù)這個詞典一方面數(shù)據(jù)庫的內(nèi)容的規(guī)范有了依據(jù),另一方面數(shù)據(jù)庫的結(jié)構(gòu)也得到了規(guī)范。圖4-9四層元數(shù)據(jù)體系結(jié)構(gòu)l數(shù)據(jù)層(0層)是用戶對象層,它表示的是"目標(biāo)"數(shù)據(jù),即我們所希望描述的信息。比如在特定關(guān)系數(shù)據(jù)庫中表示為特定表的實(shí)例。例如,公民基本信息表中某個具體公民的信息,相當(dāng)于公民基本信息表中的一條記錄。
CitizenNoNameAgeAddress
張三28武漢
李四45北京l模型層(1層)包含描述目標(biāo)數(shù)據(jù)的數(shù)據(jù)模型。比如在特定關(guān)系數(shù)據(jù)庫中表示為特定的表、特定表的約束(主鍵、外鍵等)、特定表的結(jié)構(gòu)等。例如,公民基本信息表的結(jié)構(gòu),即該表中包含哪些列,以及各個列的數(shù)據(jù)類型等。
TableColumnAttribute
CitizenCitizenNoNumeric
NameString
AgeNumeric
AddressStringl元模型(2層)包含了定義模型層的元數(shù)據(jù),也就是表示M1層元數(shù)據(jù)的抽象語言。比如在關(guān)系數(shù)據(jù)庫系統(tǒng)中,表示為特定數(shù)據(jù)庫中表的定義、列的定義、主鍵的定義和外鍵的定義等。相當(dāng)于UML元模型定義的很多元素如類,操作,屬性,關(guān)聯(lián)等等。
DataStoreComponent……
FileTable
Column
Attr
l元元模型層(3層)是由定義元數(shù)據(jù)結(jié)構(gòu)和語法的描述組成,也可以說它是定義各種元數(shù)據(jù)的抽象語言。傳統(tǒng)的元數(shù)據(jù)集成
圖4-10是數(shù)據(jù)中心中一個典型的信息供應(yīng)鏈(ISC)的示例。信息從其源頭(即原始數(shù)據(jù)的提供者)流出,經(jīng)過一系列精煉過程,最終產(chǎn)生信息產(chǎn)品。這些產(chǎn)品可能對于高層決策者來說具有重大的戰(zhàn)略價值。
圖4-10數(shù)據(jù)中心中的信息供應(yīng)鏈
以上每個軟件產(chǎn)品和工具,在它們能在數(shù)據(jù)層上有效集成之前,必須在元數(shù)據(jù)層上被集成。元數(shù)據(jù)集成是有效的數(shù)據(jù)集成的一個先決條件。然而,元數(shù)據(jù)的集成是十分困難的,因?yàn)榇蠖鄶?shù)的業(yè)務(wù)產(chǎn)品使用千差萬別的格式存儲元數(shù)據(jù)。具有不同元數(shù)據(jù)的工具,往往是通過建立復(fù)雜的元數(shù)據(jù)橋來集成的。元數(shù)據(jù)橋是一種能將一個產(chǎn)品的元數(shù)據(jù)轉(zhuǎn)換成另一個產(chǎn)品所需元數(shù)據(jù)格式的一段軟件。元數(shù)據(jù)橋的構(gòu)建是一項艱巨、耗費(fèi)大的過程。這樣的橋需要具有它要集成的每個產(chǎn)品的元數(shù)據(jù)結(jié)構(gòu)和接口的詳細(xì)知識;關(guān)于不同模型間如何相互映射的知識也要融入橋中。
圖4-11在信息供應(yīng)鏈中增加一個元數(shù)據(jù)庫
圖4-11中使用了元數(shù)據(jù)庫,它突出顯示了定義對全局可獲得的、和廣泛被理解的元數(shù)據(jù)是有必要的。元數(shù)據(jù)庫是具有特定目的的數(shù)據(jù)庫,它存儲、控制所處環(huán)境中,除它自身之外的所有相關(guān)的元數(shù)據(jù)組件,并對這些元數(shù)據(jù)組件是可獲得的。從圖中我們可以看到,各種軟件產(chǎn)品從中央元數(shù)據(jù)庫中提取全局?jǐn)?shù)據(jù),而不是通過與其它產(chǎn)品的點(diǎn)到點(diǎn)連接。這個存儲庫包含了定義信息供應(yīng)鏈(可推廣至數(shù)據(jù)中心)的所有元數(shù)據(jù)的單一定義。這個定義基于一個針對存儲庫產(chǎn)品本身的元數(shù)據(jù)模型。每個產(chǎn)品必須實(shí)現(xiàn)它自己的存儲庫訪問層(即另一種形式的橋),該層理解與特定存儲庫相關(guān)的元數(shù)據(jù)結(jié)構(gòu)(例如接口和元模型),還知道如何將這些與存儲庫相關(guān)的結(jié)構(gòu)映射為與產(chǎn)品相關(guān)的元數(shù)據(jù)結(jié)構(gòu)。這種類型的配置通常稱為星型元數(shù)據(jù)體系結(jié)構(gòu)。
以上這個方法雖然減輕了建立很多點(diǎn)到點(diǎn)的橋的需要,但建立橋的問題仍然沒有完全消除。我們還是需要為每一個軟件組件開發(fā)一個不同的訪問層(該層可以由產(chǎn)品廠商、存儲庫廠商或者第三方顧問開發(fā)),每一個訪問層仍然是與某一特定的存儲庫產(chǎn)品相關(guān)的?;谀P偷脑獢?shù)據(jù)集成可以有效地解決這個問題。基于模型的元數(shù)據(jù)集成
用一種形式化語言(如UML)描述的模型(圖4-12)可以被用來定義描述某種信息結(jié)構(gòu)或模式的元數(shù)據(jù)。這種形式化語言可以被翻譯成相應(yīng)的元數(shù)據(jù)定義,后者能被用來創(chuàng)建信息結(jié)構(gòu)本身的真正的實(shí)例。這些各式各樣的形式化模型通常是平臺無關(guān)的,它們并不顯示用來配置實(shí)際的信息結(jié)構(gòu)的計算機(jī)平臺的物理特性,因?yàn)樾问交UZ言(如UML以及其它各種數(shù)據(jù)建模語言)的定義通常是與平臺無關(guān)的。一個SQLDDL語句集可以被看成是一個與平臺相關(guān)的模型,因?yàn)樗鼈冇靡粋€特定計算機(jī)平臺的語言定義目標(biāo)信息結(jié)構(gòu)(例如,一個與SQL兼容的關(guān)系數(shù)據(jù)庫引擎)。將一個形式化模型轉(zhuǎn)換為SQLDDL的假定的翻譯過程,稱為將與平臺無關(guān)的模型映射為與平臺相關(guān)的模型,該映射是基于翻譯過程所實(shí)現(xiàn)的某些形式化映射的規(guī)則集。
圖4-12簡單關(guān)系數(shù)據(jù)表模型
由上我們可以得出三個非常重要的結(jié)論:
▅一個信息結(jié)構(gòu)的任何形式化模型都是定義該信息結(jié)構(gòu)的元數(shù)據(jù)(元數(shù)據(jù)本質(zhì)上是它所描述的數(shù)據(jù)的一個形式化模型)
▅元數(shù)據(jù),當(dāng)用一個形式化的、與平臺無關(guān)的模型表示時,可以獨(dú)立于任何特定的目標(biāo)平臺而存在。
▅元數(shù)據(jù),當(dāng)用一個形式化的、與平臺無關(guān)的模型表示時,可以被翻譯成若干與平臺相關(guān)的模型中的任何一個,每一個代表一個不同的目標(biāo)平臺(當(dāng)然要特定適當(dāng)?shù)挠成湟?guī)則以及實(shí)現(xiàn)這些規(guī)則)。
元數(shù)據(jù)集成的一個可能的方法就是開發(fā)一個元數(shù)據(jù)的外部表示,它不依賴于任何一個特定的產(chǎn)品和工具。這樣一個表示是基于信息結(jié)構(gòu)的形式化的、與平臺無關(guān)的模型,該模型用一種恰當(dāng)?shù)恼Z言(如UML)描述。一個產(chǎn)品用這樣一個形式化模型作為它自己的元數(shù)據(jù)的基礎(chǔ),通過調(diào)用一個恰當(dāng)?shù)膶?dǎo)入映射(importmapping)過程將這個形式化模型翻譯成它自己的、與產(chǎn)品相關(guān)的元數(shù)據(jù)的實(shí)例。類似的,一個產(chǎn)品可以通過一個將它自己的內(nèi)部元數(shù)據(jù)翻譯成一個與平臺無關(guān)的形式化模型的導(dǎo)出映射(exportmapping)過程,將它所有的元數(shù)據(jù)顯示給其它產(chǎn)品。
這個方案在哪些方面優(yōu)于前面提到元數(shù)據(jù)橋解決方案呢?元數(shù)據(jù)橋的主要問題是每座橋要在兩個與產(chǎn)品相關(guān)的模型之間進(jìn)行映射,橋本質(zhì)上需要將元數(shù)據(jù)從一個產(chǎn)品的元模型規(guī)定的格式轉(zhuǎn)換成另一個與產(chǎn)品相關(guān)的元模型所規(guī)定格式?,F(xiàn)在,元模型本身被外部化(externalized),與特定的實(shí)現(xiàn)平臺無關(guān);并且,產(chǎn)品交換的元數(shù)據(jù)也基于這個公共的、外部的元模型,這樣,在各自的實(shí)現(xiàn)模型間翻譯的問題也就不存在了。
這種元數(shù)據(jù)級的集成和互操作方法稱為模型驅(qū)動的元數(shù)據(jù)體系結(jié)構(gòu)。從根本上說,它是由軟件產(chǎn)品之間元數(shù)據(jù)的交換構(gòu)成,這里的元數(shù)據(jù)定義是以形式化的、與平臺無關(guān)的模型來表示的。參與的軟件產(chǎn)品和工具就定義整個域的公共元模型達(dá)成一致,這樣它們就能很方便的理解該元模型的任何實(shí)例(例如可能被交換的、任何共享的元數(shù)據(jù))。任何產(chǎn)品將這個共享的元數(shù)據(jù)映射為它自己內(nèi)部的元數(shù)據(jù)表式方式。這要求元模型在它的領(lǐng)域有一個完整的描述。
OMG的公共倉庫元模型(CommonWarehouseMetamodel)CWM就是一個基于模型的元數(shù)據(jù)集成的實(shí)現(xiàn)典范,它是一個完整描述數(shù)據(jù)倉庫和業(yè)務(wù)分析領(lǐng)域的元模型。作為一個元模型,CWM提供了構(gòu)建元數(shù)據(jù)(例如模型或者元模型的實(shí)例)所需的語義和語法。
CWM實(shí)際上是由若干互不相同但又緊密相關(guān)的元模型構(gòu)成。圖4-13描述了CWM的總體結(jié)構(gòu),每一塊代表CWM的一個元模型(或包)。由CWM某個包的得到的某特定的模型(例如,某個元模型的實(shí)例)定義了描述對應(yīng)功能域中數(shù)據(jù)的元數(shù)據(jù)。例如,由關(guān)系元模型得到的某個模型是描述某些關(guān)系數(shù)據(jù)的實(shí)例(即產(chǎn)品數(shù)據(jù)表的行集合)的元數(shù)據(jù)。
管理層Management數(shù)據(jù)倉庫處理包WarehouseProcess數(shù)據(jù)倉庫操作包WarehouseOperation
分析層Analysis轉(zhuǎn)換包Transformation聯(lián)機(jī)分析、處理包OLAP數(shù)據(jù)挖掘包DataMining信息可視化包InformationVisualization業(yè)務(wù)命名規(guī)則包BusinessNomenclature
資源層Resource對象包Object關(guān)系包Relational記錄包Record多維包MultidimensionalXML包XML
基礎(chǔ)層Foundation業(yè)務(wù)信息包BusinessInformation數(shù)據(jù)類型包DataType表達(dá)式包Expressions鍵和索引包KeysandIndexes軟件配置包SoftwareDeployment類型映射包TypeMapping
對象模型層ObjectModel核心包Core行為包Behavioral聯(lián)系包Relationships實(shí)例包Instance
圖4.13CWM元模型層次圖
另外,基于模型的元數(shù)據(jù)集成體系結(jié)構(gòu)要求有一種形式化語言,它能夠以共享的、與平臺無關(guān)的模型來表示元數(shù)據(jù)。在CWM中,這種語言是UML(事實(shí)上是UML的一個特定子集)。
首先,最低的一層是對象層,這個UML的子層用作CWM的基本元模型。對象層由4個元模型構(gòu)成:核心元模型、行為元模型、關(guān)系元模型和實(shí)例元模型。其中的關(guān)系元模型定義了模型元素之間的基本關(guān)系(如表和列之間的關(guān)聯(lián))。
基礎(chǔ)層為更高層次提供CWM特定的服務(wù)。例如,數(shù)據(jù)類型元模型為定義基本數(shù)據(jù)類型和構(gòu)造數(shù)據(jù)類型提供基礎(chǔ)結(jié)構(gòu);類型映射元模型定義的新類型使我們能夠在不同類型的系統(tǒng)之間建立映射模型(對于確保不同軟件工具和平臺之間的互操作性很顯然是必不可少的);索引元模型同樣以對象層的基本模型元素為基礎(chǔ),定義了唯一鍵和外鍵的抽象概念,這對于建立關(guān)系數(shù)據(jù)庫的模型至關(guān)重要,同時它對面向記錄的和多維的數(shù)據(jù)庫同樣重要。業(yè)務(wù)信息元模型定義的元素支持對基本業(yè)務(wù)信息的建模。
資源層定義了各種數(shù)據(jù)資源的不同類型。該層含有的元模型包,允許描述面向?qū)ο蟮臄?shù)據(jù)庫和應(yīng)用系統(tǒng)、關(guān)系數(shù)據(jù)庫管理系統(tǒng)、傳統(tǒng)的面向記錄的數(shù)據(jù)源(諸如文件和記錄模型數(shù)據(jù)庫管理系統(tǒng)),以及由聯(lián)線分析處理(OLAP)工具和XML流建立的多維數(shù)據(jù)庫。數(shù)據(jù)倉庫和ISC(信息供應(yīng)鏈)中需要管理的各種數(shù)據(jù)資源,我們可以用CWM去定義表示各種類型的數(shù)據(jù)資源的元數(shù)據(jù)。
分析層中最重要的是轉(zhuǎn)換元模型,這個元模型定義的模型元素用來指定數(shù)據(jù)資源模型(資源層元模型的實(shí)例)之間源和目標(biāo)的映射及轉(zhuǎn)換,同時也指定數(shù)據(jù)資源模型和各種分析模型之間源和目標(biāo)的映射及轉(zhuǎn)換。分析層還提供了數(shù)據(jù)挖掘、業(yè)務(wù)術(shù)語、信息可視化元模型,它們支持對面向分析的元數(shù)據(jù)進(jìn)行建模。數(shù)據(jù)挖掘元模型定義的模型元素用來指定與各種數(shù)據(jù)挖掘工具相關(guān)的元數(shù)據(jù),這些工具經(jīng)常用來從各種數(shù)據(jù)資源中抽取重要的模式和趨勢;業(yè)務(wù)術(shù)語元模型定義的元數(shù)據(jù)負(fù)責(zé)定義業(yè)務(wù)術(shù)語和概念并對其分類;可視化元模型定義的模型元素能夠創(chuàng)建與先進(jìn)的報表工具和可視化工具相關(guān)的元數(shù)據(jù)??偠灾@些元模型提供了建立支持ISC(信息供應(yīng)鏈)分析階段的那些元數(shù)據(jù)所需的語義結(jié)構(gòu)。
最后,管理層元模型支持?jǐn)?shù)據(jù)倉庫的日常操作和管理。數(shù)據(jù)倉庫過程元模型使我們能夠?qū)δ承┨囟ǖ臄?shù)據(jù)倉庫過程進(jìn)行建模,例如ETL(數(shù)據(jù)提取、轉(zhuǎn)換和裝載)過程;數(shù)據(jù)倉庫操作元模型定義的模型元素用來創(chuàng)建定義特定的周期性的常規(guī)操作的元數(shù)據(jù),例如預(yù)定的事件及其相互的依賴關(guān)系。這些元數(shù)據(jù)對于ETL(數(shù)據(jù)提取,轉(zhuǎn)換和裝載)工具,基于時間的排序工具以及其它倉庫管理工具十分有用。
由上,CWM提供了基于模型的元數(shù)據(jù)集成體系結(jié)構(gòu)所需的、用于描述問題域的語義完整的公共元模型。如果構(gòu)建數(shù)據(jù)中心用到的各種軟件產(chǎn)品、工具和數(shù)據(jù)庫產(chǎn)品就CWM元模型達(dá)成一致,它們就都能理解CWM元模型的實(shí)例(模型或者元數(shù)據(jù)),元數(shù)據(jù)很容易在各部分之間進(jìn)行交換和共享。一個關(guān)于數(shù)據(jù)中心的完整的模型,從前端的數(shù)據(jù)資源,到轉(zhuǎn)換和凈化,再到終端用戶分析,再到數(shù)據(jù)倉庫管理,都能用CWM的元模型來建立。公共元模型,作為基于模型的元數(shù)據(jù)集成方法的核心,必須依照一定的形式化規(guī)則(一種抽象語言)來建立,以確保所有的軟件都能用相同的、預(yù)期的方式對其進(jìn)行解釋。對CWM而言,OMG的元對象設(shè)施MOF提供了所需的形式化規(guī)則集。MOF是為元模型規(guī)范定義公共抽象語言的一種OMG標(biāo)準(zhǔn)。MOF本質(zhì)上是一種元-元模型,或者說是元模型的模型(有時候稱為本體(ontology)),它定義了對離散系統(tǒng)建模要用到的元模型中的基本元素、語法和結(jié)構(gòu)。MOF是UML和CWM的公共模型,MOF使不同的元模型(代表不同領(lǐng)域)可以互操作。遵循MOF規(guī)范的應(yīng)用軟件一點(diǎn)也不了解某個模型實(shí)例與特定領(lǐng)域相關(guān)的接口的情況,但是它仍然能夠通過使用反射接口的通用操作對該模型進(jìn)行讀取和更新的操作。
MOF的語義一般定義了支持模型創(chuàng)建、發(fā)現(xiàn)、轉(zhuǎn)換和更新的某些元數(shù)據(jù)庫服務(wù)。特別的,MOF定義了模型生命周期的語義。模型生命周期定義了關(guān)于元數(shù)據(jù)的創(chuàng)建和發(fā)布的有效操作,特別是結(jié)合到可視化建模的時候(例如,面向UML建模的工具)。例如,新開發(fā)的元模型可以存儲在MOF存儲庫中,并與其它以存在的元模型結(jié)合起來使用。一個支持MOF的存儲庫除了負(fù)責(zé)元數(shù)據(jù)的創(chuàng)建和獲取,還提供了很多重要的元數(shù)據(jù)相關(guān)服務(wù)(例如持續(xù)化、版本控制、查詢等)。
總而言之,MOF試圖給出建立元對象模型的統(tǒng)一規(guī)范,其主要活動是描述元對象和建立元對象模型,以便通過共享元數(shù)據(jù),達(dá)到不同操作系統(tǒng)的、不同應(yīng)用程序、不同數(shù)據(jù)庫平臺等的互操作性的目的?;谀P偷脑獢?shù)據(jù)集成方法還要求有一個用于交換共享元數(shù)據(jù)實(shí)例的公共交換格式,以及訪問元數(shù)據(jù)的公共程序接口。CWM使用的XML互換編碼XMI是定義如何將支持MOF的元模型(如CWM)映射到XML的一個OMG標(biāo)準(zhǔn)。XMI精確定義了在XML文檔中如何用XML標(biāo)簽定義CWM元模型的實(shí)例。CWM元模型用來定義以XMLDTD形式表示的XML標(biāo)簽集。然后CWM的元數(shù)據(jù)(例如CWM元模型的實(shí)例)在XML文檔中被序列化(serialized)。每個元數(shù)據(jù)的實(shí)例都作為XML元素的內(nèi)容存儲起來,而這些元素是由適當(dāng)?shù)脑P蜆?biāo)簽限定的。
XMI解決了用基于標(biāo)簽的語言表示對象及其關(guān)聯(lián)時面臨的許多難題。另外,XMI只是使用XML的一種方法,這意味著標(biāo)簽和標(biāo)簽描述的項(元素內(nèi)容)可以打包到同一個文件,使得應(yīng)用程序能夠很容易的理解文檔內(nèi)容。內(nèi)容的交流既是自描述也是異步的,這也是基于XML和XMI的交互在分布異構(gòu)環(huán)境中為什么這么重要的原因。對CWM元數(shù)據(jù)資源的程序訪問是由從支持MOF的元模型到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年股權(quán)激勵合同:股權(quán)獎勵與業(yè)績掛鉤條款3篇
- 2025年度濾袋材料費(fèi)用合同采購與項目進(jìn)度管理合同3篇
- 2025年度網(wǎng)絡(luò)安全防護(hù)設(shè)備采購合同范本與安全等級保護(hù)2篇
- 學(xué)生校園欺凌情況調(diào)查問卷
- 敢于擔(dān)當(dāng)善于化解難題體會
- 護(hù)理人力資源管理1
- 黨史知識競賽題庫及答案-一起學(xué)習(xí)黨史吧
- 八一南昌起義的意義是什么
- 2024版地方特色農(nóng)產(chǎn)品購銷合作合同版
- 2024集體土地租賃協(xié)議書
- 事業(yè)單位登記管理講座課件
- 柴油加氫設(shè)備-加氫循環(huán)氫壓縮機(jī)
- 中小學(xué)德育工作指南考核試題及答案
- 雪夜的老人閱讀答案6篇
- 2022數(shù)學(xué)課程標(biāo)準(zhǔn)解讀及實(shí)踐:八下平行四邊形大單元設(shè)計
- 昌樂二中271課堂教學(xué)模式
- 深基坑變形監(jiān)測方案
- 衛(wèi)生專業(yè)技術(shù)資格任職聘用證明表
- GB/T 3077-2015合金結(jié)構(gòu)鋼
- GB/T 25003-2010VHF/UHF頻段無線電監(jiān)測站電磁環(huán)境保護(hù)要求和測試方法
- GB/T 15326-1994旋轉(zhuǎn)軸唇形密封圈外觀質(zhì)量
評論
0/150
提交評論