版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、沈陽東軟軟件股份有限公司 - PAGE I -智慧城市云數(shù)據(jù)中心方案建議書東軟集團股份有限公司PAGE 第目 錄 TOC o 1-3 h z u HYPERLINK l _Toc484797143 第1章項目總體設(shè)計方案 PAGEREF _Toc484797143 h 2 HYPERLINK l _Toc484797144 1.1總體標準規(guī)范架構(gòu) PAGEREF _Toc484797144 h 2 HYPERLINK l _Toc484797145 1.2目錄系統(tǒng)業(yè)務(wù)架構(gòu) PAGEREF _Toc484797145 h 3 HYPERLINK l _Toc484797146 1.3目錄系統(tǒng)技術(shù)
2、架構(gòu) PAGEREF _Toc484797146 h 4 HYPERLINK l _Toc484797147 1.4目錄系統(tǒng)數(shù)據(jù)結(jié)構(gòu) PAGEREF _Toc484797147 h 5 HYPERLINK l _Toc484797148 第2章項目詳細設(shè)計方案 PAGEREF _Toc484797148 h 6 HYPERLINK l _Toc484797149 2.1信息資源標準規(guī)范體系設(shè)計 PAGEREF _Toc484797149 h 6 HYPERLINK l _Toc484797150 2.2信息資源目錄管理體系設(shè)計 PAGEREF _Toc484797150 h 9 HYPERLI
3、NK l _Toc484797151 2.2.1資源目錄總體使用方式 PAGEREF _Toc484797151 h 11 HYPERLINK l _Toc484797152 2.2.2目錄節(jié)點的管理機制設(shè)計 PAGEREF _Toc484797152 h 11 HYPERLINK l _Toc484797153 2.2.3目錄維護機制設(shè)計 PAGEREF _Toc484797153 h 20 HYPERLINK l _Toc484797154 2.2.4資源獲取方式設(shè)計 PAGEREF _Toc484797154 h 23 HYPERLINK l _Toc484797155 2.2.5目錄安
4、全設(shè)計 PAGEREF _Toc484797155 h 30 HYPERLINK l _Toc484797156 2.3目錄系統(tǒng)功能建設(shè) PAGEREF _Toc484797156 h 32 HYPERLINK l _Toc484797157 2.3.1目錄編目功能 PAGEREF _Toc484797157 h 32 HYPERLINK l _Toc484797158 2.3.2目錄管理功能 PAGEREF _Toc484797158 h 45 HYPERLINK l _Toc484797159 2.3.3目錄報送功能 PAGEREF _Toc484797159 h 56 HYPERLINK
5、 l _Toc484797160 2.3.4目錄服務(wù)功能 PAGEREF _Toc484797160 h 64項目總體設(shè)計方案總體標準規(guī)范架構(gòu)圖 2 SEQ 圖 * ARABIC s 2 1數(shù)據(jù)中心標準規(guī)范結(jié)構(gòu)設(shè)計圖智慧城市數(shù)據(jù)中心標準規(guī)范體系由一系列的規(guī)范、機制、制度組成。具體包括數(shù)據(jù)標準規(guī)范、技術(shù)標準規(guī)范、管理標準規(guī)范、業(yè)務(wù)標準規(guī)范和管理標準5大部分。業(yè)務(wù)標準規(guī)范:業(yè)務(wù)功能規(guī)范、業(yè)務(wù)流程規(guī)范、業(yè)務(wù)接口規(guī)范。數(shù)據(jù)標準規(guī)范:數(shù)據(jù)字段標準、數(shù)據(jù)表名規(guī)范、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)交換規(guī)范。技術(shù)標準規(guī)范:通過技術(shù)標準規(guī)范實現(xiàn)各業(yè)務(wù)系統(tǒng)與政務(wù)數(shù)據(jù)中心之間的數(shù)據(jù)級和應(yīng)用級整合,并提高業(yè)務(wù)系統(tǒng)之間的應(yīng)用集成,互連互
6、通的能力。管理標準規(guī)范:標準管理、數(shù)據(jù)管理、項目管理,用于指導數(shù)據(jù)中心日常的運行管理、數(shù)據(jù)維護。安全規(guī)范:物理安全規(guī)范、系統(tǒng)安全規(guī)范、網(wǎng)絡(luò)安全規(guī)范、應(yīng)用規(guī)范。目錄系統(tǒng)業(yè)務(wù)架構(gòu)圖 2 SEQ 圖 * ARABIC s 2 2 資源目錄管理業(yè)務(wù)模型示意圖按國家電子信息資源目錄體系標準的相關(guān)要求,信息資源目錄體系管理架構(gòu)包括信息資源目錄體系使用和管理的三個角色和六項活動。三個角色是信息資源目錄的提供者、管理者和使用者。六項活動包括規(guī)劃、編目、注冊、發(fā)布、維護、查詢。提供者負責本部門信息資源目錄內(nèi)容的規(guī)劃和編目,管理者負責信息資源目錄內(nèi)容的注冊、發(fā)布以及系統(tǒng)維護,使用者可以查詢信息資源目錄內(nèi)容。按政務(wù)
7、信息資源標識符編碼方案標識目錄中的資源以及按主題分類(或行業(yè)分類、服務(wù)分類、資源形態(tài)分類)對公共資源和交換資源進行劃分。最后,按國家電子信息資源目錄體系管理架構(gòu),設(shè)計并實現(xiàn)相關(guān)活動和過程,就完成了信息資源目錄體系的規(guī)劃。目錄系統(tǒng)技術(shù)架構(gòu)圖 23目錄技術(shù)架構(gòu)總體技術(shù)架構(gòu)分為基礎(chǔ)支撐層(包括主機、網(wǎng)絡(luò)等IT基礎(chǔ)設(shè)施)、應(yīng)用支撐層(包括各種技術(shù)組件)、信息資源層(包括各種基礎(chǔ)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)和元數(shù)據(jù))、業(yè)務(wù)功能層(主要包括各種目錄管理功能)。主要技術(shù)特點包括:采用面向服務(wù)的技術(shù)架構(gòu),松耦合的設(shè)計模式,保證系統(tǒng)的靈活性、可擴展性和良好的維護性;采用廣泛接受的標準如XML、Web Service和SOAP
8、等標準,遵循國家電子政務(wù)標準化指南及相關(guān)標準,結(jié)合工程招標書提出的的各類數(shù)據(jù)采集、交換的要求,保證數(shù)據(jù)集成和系統(tǒng)之間的互聯(lián)互通的功能實現(xiàn);以業(yè)務(wù)流程為核心,整個系統(tǒng)架構(gòu)設(shè)計的出發(fā)點是幫助工程系統(tǒng)的用戶使用某種技術(shù)手段來完成業(yè)務(wù)流程;采用多層的系統(tǒng)架構(gòu)設(shè)計,針對工程信息系統(tǒng)的整個業(yè)務(wù)模式和IT環(huán)境,在充分考慮到系統(tǒng)擴展性的要求基礎(chǔ)上,系統(tǒng)架構(gòu)應(yīng)設(shè)計多層的體系結(jié)構(gòu)模型。目錄系統(tǒng)數(shù)據(jù)結(jié)構(gòu)根據(jù)不同類別信息的特點,分別構(gòu)建主題目錄、文獻目錄、分類目錄、專題目錄等。對于納入各種關(guān)系型數(shù)據(jù)庫管理的結(jié)構(gòu)化數(shù)據(jù),按照樹型結(jié)構(gòu)建立指標體系。目錄內(nèi)容包括標題、編碼、訪問控制、目標路徑、指標屬性、來源、時間等字段。圖
9、 24目錄體系的數(shù)據(jù)架構(gòu)下面以示例形式說明信息資源目錄的數(shù)據(jù)屬性:政務(wù)信息資源資目錄數(shù)據(jù)屬性(示例)序號名稱說明1資源代碼即資源標識編碼2資源名稱3資源出版日期4資源摘要5資源負責單位編碼編碼與單位代碼表關(guān)聯(lián)6關(guān)鍵字描述資源的關(guān)鍵字集合7地域范圍8資源有效期起始時間9資源有效期終止時間10資源使用限制11資源安全限制級別12資源語種13資源字符集14資源按主題分類代碼15資源按行業(yè)分類代碼16資源按服務(wù)分類代碼17資源按媒介分類代碼18資源類型19元數(shù)據(jù)標識符即數(shù)據(jù)中心中的字段20元數(shù)據(jù)語種21元數(shù)據(jù)聯(lián)系單位編碼22元數(shù)據(jù)安全限制分級項目詳細設(shè)計方案信息資源標準規(guī)范體系設(shè)計公共資源目錄接口 公
10、共資源目錄定義了公共資源目錄所需的通用模型和實現(xiàn)。給出公共資源目錄服務(wù)的通用模型,并對基于該通用模型的技術(shù)實現(xiàn)進行了規(guī)定。 公共資源目錄接口主要參考Z39.50 協(xié)議,定義公共資源目錄的通用模型和目錄實現(xiàn)。在接口定義中,主要給出公共接口、發(fā)現(xiàn)服務(wù)接口、目錄訪問接口和目錄管理接口,并詳細定義了每個接口的請求和響應(yīng)消息。 交換服務(wù)目錄接口 交換服務(wù)目錄接口定義了交換服務(wù)目錄所需的數(shù)據(jù)結(jié)構(gòu)和接口。定義交換服務(wù)接口的格式表達規(guī)則、數(shù)據(jù)結(jié)構(gòu)和接口定義。 交換服務(wù)目錄接口主要參考UDDI 協(xié)議,定義了交換服務(wù)目錄的核心數(shù)據(jù)結(jié)構(gòu)和API 接口。這些核心數(shù)據(jù)結(jié)構(gòu)給出了核心數(shù)據(jù)元、分類體系和標識符編碼規(guī)則在目錄
11、服務(wù)器中的組織結(jié)構(gòu)。在API 接口的定義中,主要給出了交換服務(wù)目錄的查詢、發(fā)布和管理接口,并詳細定義了每個接口的句法、參數(shù)、返回值和差錯處理。核心數(shù)據(jù)元核心數(shù)據(jù)元定義了描述政務(wù)信息資源所需的核心數(shù)據(jù)元的數(shù)據(jù)項集合、各數(shù)據(jù)項語義定義和著錄規(guī)則等。它提供了有關(guān)政務(wù)信息資源的標識、內(nèi)容、管理、維護的描述信息。 核心數(shù)據(jù)元是信息資源目錄體系建設(shè)的主要內(nèi)容。通過核心數(shù)據(jù)元,用戶可了解政務(wù)信息資源的基本內(nèi)容,發(fā)現(xiàn)和定位政務(wù)信息資源。主要包含以下內(nèi)容:(1) 標準體例要求的必須部分(2) 一致性要求以及符號與約定(3) 核心數(shù)據(jù)元定義(4) 參考文獻政務(wù)信息資源分類政務(wù)信息資源分類是電子政務(wù)的基礎(chǔ)性工作,是
12、政務(wù)信息資源采集、加工、存儲、保護和使用的必要工具。標準規(guī)定了政務(wù)信息資源的分類原則和方法,為信息資源目錄體系提供分類方案,為政務(wù)信息資源分類體系的建立和維護提供了依據(jù)。主要內(nèi)容如下:1、確定政務(wù)信息資源的四種分類 電子政務(wù)包括了政府對政府、政府對企業(yè)、政府對公眾三種典型的政務(wù)活動。在這三種政務(wù)活動中,政務(wù)部門為履行管理國家事務(wù)的職責而采集、加工、使用政務(wù)信息資源,政務(wù)信息資源都具有確定的主題含義,以某種形態(tài)存在,并且可以為用戶提供某種類型的服務(wù)。圍繞著電子政務(wù)信息資源,存在著多種角色:政務(wù)信息資源的提供者、使用者和管理者。各種角色通過不同分類,對政務(wù)信息資源進行組織、查找和管理。通過對政務(wù)信
13、息資源多個角度特征的刻畫,形成了多種分類,為政務(wù)信息資源的組織、查找和管理提供多種途徑。標準確定了從政務(wù)信息資源的主題內(nèi)涵、產(chǎn)生行業(yè)部門、提供的服務(wù)和資源的物理形態(tài)等四個角度進行刻畫,形成了以主題分類為核心,以服務(wù)分類、行業(yè)分類和資源形態(tài)分類為輔助的分類方案。四種分類體現(xiàn)了政務(wù)信息資源的產(chǎn)生、處理、使用、維護和管理過程中的不同視角,能夠較好地滿足對政務(wù)信息資源組織、查找和管理的需求,而且易于理解和接受。 2、主題分類、行業(yè)分類、服務(wù)分類和資源形態(tài)分類之間關(guān)系 資源形態(tài)分類根據(jù)政務(wù)信息資源的外表特征進行劃分,獨立于其內(nèi)容。主題分類、行業(yè)分類和服務(wù)分類屬于內(nèi)容特征的分類,主題分類揭示了政務(wù)信息資源
14、內(nèi)容主題的不同,是其基礎(chǔ)性分類。行業(yè)分類體現(xiàn)了政府部門行業(yè)的特點,服務(wù)分類則描述了政務(wù)信息資源面向用戶提供功能服務(wù)的劃分,行業(yè)分類和服務(wù)分類是對主題分類的輔助性分類。政務(wù)信息資源標識碼編碼方案規(guī)定了政務(wù)信息資源標識符的編碼的結(jié)構(gòu)、前段碼和后段碼的管理與分配原則。 參照國際上通行的信息資源編碼方法以及我國的信息資源標識的發(fā)展趨勢, 政務(wù)信息資源標識符由前段碼和后段碼兩部分組成,前段碼和后段碼之間用“/” 隔開。前段碼共5 位,由10 個阿拉伯數(shù)字(09)和26 個大寫英文字母(AZ) 組成。后段碼長度不固定,可以采用GB 18030 中規(guī)定的任意字符。前段碼由信息資源前段碼管理中心進行統(tǒng)一管理,
15、并分配給目錄管理者或相關(guān)的政府部門; 后段碼由各目錄管理者或政府部門自行確定其編碼方案。如圖:圖 STYLEREF 1 s 3 SEQ 圖 * ARABIC s 1 3政務(wù)信息資源標識碼編碼方案信息資源目錄管理體系設(shè)計信息資源資源目錄體系建設(shè)需要圍繞政務(wù)資源信息采集、組織、分類、保存、發(fā)布與使用等信息生命周期各環(huán)節(jié)建立規(guī)范和標準。信息資源目錄體系主要有元數(shù)據(jù)、分類表、主題詞表、唯一標識、信息組織、導航、發(fā)現(xiàn)、定位與服務(wù)等關(guān)鍵要素,目錄體系的建設(shè)主要要圍繞以上要素設(shè)計切實可行的技術(shù)方案。圖 3 SEQ 圖 * ARABIC s 2 1信息資源目錄管理體系架構(gòu)圖資源目錄總體使用方式圖 32資源目錄
16、的技術(shù)形態(tài)目錄體系是以元數(shù)據(jù)為核心技術(shù),用于發(fā)現(xiàn)、訪問信息資源的服務(wù)接口。目錄服務(wù)是必須實現(xiàn)的,它提供對網(wǎng)絡(luò)基礎(chǔ)信息資源的查找、瀏覽、定位功能。服務(wù)體系提供對網(wǎng)絡(luò)基礎(chǔ)信息資源的信息級或服務(wù)級的訪問和獲取。從上圖可以看出,信息資源目錄系統(tǒng)可以劃分為以下四個主要部分:編目:完成對元數(shù)據(jù)的管理和入庫,并可形成待審核的信息資源目錄。編目報送:利用數(shù)據(jù)交換平臺實現(xiàn)目錄的自動報送、分發(fā)和監(jiān)控。目錄管理:完成信息資源目錄的審核和發(fā)布。目錄服務(wù):實現(xiàn)對信息資源目錄的查詢。目錄節(jié)點的管理機制設(shè)計前段碼和后段碼管理流程設(shè)計根據(jù)國家電子信息資源目錄體系的第5部分標示編碼標準,電子政務(wù)信息資源的標示編碼須由前段碼和后
17、端碼構(gòu)成(如下圖所示)。圖 33目錄信息標志的結(jié)構(gòu)示意圖各級目錄管理者和各級政務(wù)部門應(yīng)在籌建政務(wù)信息目錄系統(tǒng)之初申請前段碼,以便在開展信息資源目錄建設(shè)時實現(xiàn)對信息資源的唯一標識。目錄管理者申請前段碼時,首先應(yīng)向上級目錄管理者提出,上級目錄管理者在認定符合條件后,代其向前段碼管理中心申請前段碼。圖 34前段碼管理流程如果沒有上級目錄管理者,目錄管理者可以直接向前段碼管理中心提出申請,前段碼管理中心認定其符合條件后,可直接為其分配前段碼。政務(wù)部門申請前段碼時,首先應(yīng)向平級目錄管理者提出,平級目錄管理者認為其符合條件后,代其向前段碼管理中心申請前段碼。如果沒有平級目錄管理者,政務(wù)部門可直接向前段碼管
18、理中心提出申請,前段碼管理中心認定其符合條件后,可直接為其分配前段碼。前段碼的申請流程對于目錄管理者,無上級目錄管理者的,前段碼管理中心根據(jù)該目錄管理者提交的申請材料,為目錄管理者分配前段碼。有上級目錄管理者的,申請材料應(yīng)先向上級目錄管理者提出。對于政務(wù)部門,由平級的目錄管理者審查其前段碼申請材料,代其向前段碼管理中心提出申請。如果沒有平級的目錄管理者,則可以直接向前段碼管理中心提出申請。政務(wù)部門獲得前段碼需具備如下條件:正在建立或已經(jīng)建立了部門的信息資源目錄;具備在本部門范圍內(nèi)管理和分配后段碼的能力和設(shè)施;其他必要的條件。前段碼的申請流程如下圖:圖 35前段碼的申請流程前段碼的審核流程政務(wù)部
19、門或目錄管理者將前段碼申請和有關(guān)材料提交前段碼管理中心后,前段碼管理中心依據(jù)如下流程對申請進行審核。圖 36前段碼的審核流程前段碼管理中心首先對提交前段碼申請的機構(gòu)的身份進行判定,如果該申請為目錄管理者代其下級目錄管理者或平級的政務(wù)部門提出,則直接進入前段碼生成階段。如果該申請為目錄管理者/政務(wù)部門直接提出的,則前段碼管理中心從其系統(tǒng)中查詢該目錄管理者/政務(wù)部門是否存在上級/平級目錄管理者,如果存在,則將申請返回給該目錄管理者或政務(wù)部門。如果上級/平級目錄管理者不存在,則審查該目錄管理者/政務(wù)部門所提交的申請及有關(guān)材料。如果審查通過,則進入前段碼生成階段,否則,將申請返回給該目錄管理者或政務(wù)部
20、門。生成前段碼的流程 前段碼管理中心對審核通過的申請進行如下處理:圖 37生成前段碼的流程前段碼管理中心將前段碼申請中的申請者的隸屬關(guān)系提取出來,輸入前段碼生成器,再根據(jù)內(nèi)建的前段碼分配規(guī)則,為申請者生成前段碼。前段碼管理中心將前段碼及有關(guān)信息保存。通知前段碼的流程 前段碼管理中心依據(jù)如下的流程將生成的前段碼告知申請者。圖 38通知前段碼的流程如果前段碼申請由目錄管理者代為提出,則前段碼管理中心將生成的前段碼用安全的方式發(fā)送給該目錄管理者,該目錄管理者再將前段碼轉(zhuǎn)發(fā)給申請前段碼的目錄管理者或政務(wù)部門。不論前段碼申請是否由目錄管理者代為提出,前段碼管理中心都直接將帳號/密碼用安全的方式發(fā)送給申請
21、前段碼的目錄管理者或政務(wù)部門。前段碼擁有者修改、查看資料的流程 目錄管理者或政務(wù)部門獲得前段碼的同時,向前段碼管理中心提交了其自身的有關(guān)信息,便于前段碼管理中心對前段碼進行統(tǒng)一管理和分配。目錄管理者或政務(wù)部門還可以依據(jù)如下流程對提交給前段碼管理中心的信息進行訪問和修改。圖 39前段碼擁有者修改、查看資料的流程所有目錄管理者和政務(wù)部門通過用戶名和密碼訪問其前段碼及有關(guān)信息。如果為查看信息,目錄管理者可查看其下屬的所有目錄管理者和以及平級的、下級的政務(wù)部門的前段碼和相關(guān)信息。政務(wù)部門只能讀取其自身的前段碼和相關(guān)信息。如果為修改信息,目錄管理者/政務(wù)部門提交其修改信息的同時,還要向前段碼管理中心提交
22、書面的證明材料。前段碼管理中心收到有效的書面證明材料后,批準目錄管理者/政務(wù)部門對信息進行修改。特殊情況處理 1) 如果一個目錄管理者開始時并無上級目錄管理者,而一定時期后其上級目錄管理者產(chǎn)生,則新產(chǎn)生的上級目錄管理者根據(jù)以上的申請程序申請前段碼。獲得前段碼的同時,前段碼管理中心將其下屬的目錄管理者和政務(wù)部門的前段碼及有關(guān)信息的查看權(quán)限發(fā)送給該目錄管理者。2) 如果目錄管理者或政務(wù)部門獲得前段碼后,經(jīng)過一定時期卻未實際建立信息資源目錄,前段碼管理中心應(yīng)將該前段碼收回。3) 當兩個目錄管理者合并為一個目錄管理者時,將出現(xiàn)一個目錄管理者同時擁有兩個前段碼的情況。此時,新的目錄管理者應(yīng)只使用其中一個
23、前段碼,另一前段碼由前段碼管理中心收回。這時,原系統(tǒng)中兩個前段碼的資源標識符都繼續(xù)有效。信息資源的注冊、審核和發(fā)布流程設(shè)計根據(jù)共享文件存儲的位置不同,注冊/存儲/發(fā)布管理流程又可分成中心集中存儲的注冊/存儲/發(fā)布管理流程,以及本地存儲的注冊/存儲/發(fā)布管理流程。1、中心集中存儲的注冊/存儲/發(fā)布管理流程中心集中存儲的注冊/存儲/發(fā)布管理流程見下圖。圖 310集中存儲方式下的注冊/存儲/發(fā)布流程示意圖在此流程中,共享文件提供者根據(jù)下發(fā)的元數(shù)據(jù)規(guī)范編制共享文件的元數(shù)據(jù)屬性,同時按照前段碼,利用編碼工具生成共享文件UID,然后將元數(shù)據(jù)文件及編碼后的共享文件一起提交給政務(wù)共享文件存儲中心。后續(xù)的流程在
24、圖中已經(jīng)比較詳細故在此不再敷述。在此流程關(guān)鍵點是存儲和注冊都在政務(wù)資源注冊中心。2、本地存儲的注冊/存儲/發(fā)布管理流程本地存儲的注冊/存儲/發(fā)布管理流程如下圖所示。圖 311本地存儲方式下的注冊/存儲/發(fā)布流程示意圖在這種存儲方式下,文件提供者和存儲者都在政務(wù)中心,此流程與集中存放的不同點在于對于存儲在本地的文件由文件提供者直接將經(jīng)過編碼和元數(shù)據(jù)屬性文件提交到政務(wù)資源的注冊中心,其余的流程與集中存儲的一致。目錄維護機制設(shè)計由于信息資源涉及到政務(wù)數(shù)據(jù)中心、各政府部門,信息資源目錄應(yīng)采用集中分布式管理與存儲,在政務(wù)外網(wǎng)平臺存儲和提供信息資源總目錄,政務(wù)數(shù)據(jù)中心存儲和提供相關(guān)信息資源分目錄,可與信息
25、資源總目錄定時同步,提供基于總目錄的導航服務(wù)。信息資源核心元數(shù)據(jù)和下級的信息資源核心元數(shù)據(jù),通過各級信息資源目錄服務(wù)系統(tǒng)實現(xiàn)目錄關(guān)聯(lián),構(gòu)成整體信息資源目錄體系。信息資源使用者和應(yīng)用系統(tǒng),通過信息資源目錄服務(wù)系統(tǒng),得到具體信息資源目錄信息和定位信息。目錄系統(tǒng)所對應(yīng)的信息資源內(nèi)容,可通過應(yīng)用支撐平臺提供的數(shù)據(jù)交換組件實現(xiàn)橫向、縱向信息資源內(nèi)容采集。目錄交換機制設(shè)計目錄交換,主要采用應(yīng)用支撐平臺提供的數(shù)據(jù)交換組件實現(xiàn),數(shù)據(jù)交換組件為兩級應(yīng)用支撐平臺中的不同應(yīng)用系統(tǒng)、不同數(shù)據(jù)中心之間的橫向和縱向信息交換提供支持和服務(wù)。圖 312數(shù)據(jù)交換組件目錄交換傳輸應(yīng)用圖如圖所示,數(shù)據(jù)交換組件至少提供如下功能:(1
26、)支持拖拽式圖形化數(shù)據(jù)交換的流程建模與設(shè)計(2)提供可視化的管理控制功能,能夠靈活的按需配置(3)提供交換節(jié)點擴展計算能力保障復(fù)雜業(yè)務(wù)實現(xiàn) (4)支持強大的數(shù)據(jù)格式轉(zhuǎn)換與映射能力(5)提供多種標準連接器與適配器(6)支持跨應(yīng)用基于消息數(shù)據(jù)、Web服務(wù)的業(yè)務(wù)協(xié)同管理(7)提供多種數(shù)據(jù)交換方式,包括消息的同步通信、異步通信和會話通信模式,滿足不同的數(shù)據(jù)交換方式的要求; (8)保障傳輸可靠性,通過斷點續(xù)傳、集群、事務(wù)技術(shù)等多種技術(shù)保證數(shù)據(jù)傳遞的可靠性; 目錄更新機制設(shè)計圖 313 目錄更新業(yè)務(wù)交換模型業(yè)務(wù)交換模型描述了數(shù)據(jù)中心信息共享與交換中資源目錄更新的機制與流程。其流程為:節(jié)點必須首先在中心進行
27、注冊,取得節(jié)點標識。節(jié)點與中心進行數(shù)據(jù)交換時,中心通過節(jié)點標識信息確認消息的來源方(即發(fā)送方)和目的地(即接收方);中心的信息數(shù)據(jù)來源于各節(jié)點。節(jié)點負責維護業(yè)務(wù)上歸屬本節(jié)點的信息數(shù)據(jù),此節(jié)點即該數(shù)據(jù)的業(yè)務(wù)歸屬方或業(yè)務(wù)歸屬節(jié)點;中心數(shù)據(jù)采集由節(jié)點通過數(shù)據(jù)上傳方式實現(xiàn);數(shù)據(jù)比對是為了保證中心采集的信息數(shù)據(jù)與該數(shù)據(jù)業(yè)務(wù)歸屬方數(shù)據(jù)的一致性。中心作為數(shù)據(jù)比對的發(fā)起方,將比對數(shù)據(jù)發(fā)送到該數(shù)據(jù)業(yè)務(wù)歸屬節(jié)點進行數(shù)據(jù)比對,比對結(jié)果由節(jié)點返回;對于節(jié)點更新的數(shù)據(jù),節(jié)點通過定時或?qū)崟r方式將更新數(shù)據(jù)上傳到中心;或者,中心定時從節(jié)點讀??;再者,節(jié)點向中心發(fā)送數(shù)據(jù)更新通知,中心收到更新通知后,從節(jié)點讀取更新數(shù)據(jù);節(jié)點可以
28、在中心訂閱信息數(shù)據(jù),當訂閱數(shù)據(jù)發(fā)生更改后,中心將更新數(shù)據(jù)發(fā)送到訂閱節(jié)點,從廣義上實現(xiàn)異步方式的數(shù)據(jù)同步;中心向節(jié)點提供信息的查詢服務(wù),實現(xiàn)信息共享;中心可以通過廣播方式向節(jié)點發(fā)送管理類信息,如目錄更新通知信息等。資源獲取方式設(shè)計通過應(yīng)用支撐平臺提供的數(shù)據(jù)交換組件及政務(wù)信息目錄系統(tǒng)提供的資源錄入與提交功能,實現(xiàn)目錄信息關(guān)聯(lián)資源的獲取。數(shù)據(jù)交換方式獲取資源信息資源交換模式分為以下三種:1、集中交換模式信息資源集中存儲于共享信息庫中,信息資源提供者或使用者通過訪問共享信息庫實現(xiàn)信息資源交換。2、分布交換模式信息資源分布存儲于各業(yè)務(wù)信息庫中,信息資源提供者和使用者通過交換結(jié)點提供的交換服務(wù)實現(xiàn)兩者之間
29、信息資源定向傳送的交換模式。分布式交換模式可劃分為有中心交換和無中心交換。3、混合模式集中交換模式和分布交換模式的組合,既可通過共享信息庫實現(xiàn)信息交換,又可通過直接互相訪問或通過中心交換結(jié)點實現(xiàn)信息交換。資源的獲取主要通過兩種方式進行,一為手工填報,二為自動獲取。手工填報,主要通過政務(wù)信息目錄系統(tǒng)提供的資源錄入與提交功能實現(xiàn),具體描述見本章資源目錄管理功能設(shè)計部分。下面著重闡述自動獲取資源的方式:自動獲取主要通過數(shù)據(jù)交換進行,基于統(tǒng)一支撐平臺提供的交換組件進行各數(shù)據(jù)交換節(jié)點定制模塊的定制開發(fā)。通過數(shù)據(jù)流程定制工具用戶能靈活的對數(shù)據(jù)交換流程進行設(shè)置,系統(tǒng)調(diào)用統(tǒng)一支撐平臺的按照交換流程配置模板文件
30、進行數(shù)據(jù)交換操作。按照業(yè)務(wù)需求的不同,交換實現(xiàn)的方式也有所不同。數(shù)據(jù)交換獲取資源的處理數(shù)據(jù)交換處理模塊解析數(shù)據(jù)交換節(jié)點定制工具定制出的數(shù)據(jù)交換流程模板文件,按照模板文件的配置調(diào)用應(yīng)用支撐平臺的數(shù)據(jù)交換組件中的相關(guān)工具進行交換處理。數(shù)據(jù)交換處理模塊遵循以下原則進行設(shè)計:交換分為內(nèi)部數(shù)據(jù)交換和與其它外部用戶交換,即內(nèi)部交換和外部交換,交換處理邏輯如下圖所示。圖 314數(shù)據(jù)交換邏輯數(shù)據(jù)交換中的參與者包括:提供者、管理者和使用者。1、提供者:負責本部門可以共享的信息資源的組織、管理及更新;負責對本部門共享目錄內(nèi)容的管理維護;負責與使用者、管理者協(xié)商并確定共享信息的內(nèi)容、模式、更新周期;2、管理者:負責
31、共享區(qū)中各功能的管理維護;負責對信息共享流程進行規(guī)劃、配置及部署;負責對本部門目錄服務(wù)運行的管理維護;3、使用者:根據(jù)需要提出信息資源共享需求;與提供者、管理者協(xié)商并確定共享內(nèi)容、模式、更新周期;對部門業(yè)務(wù)共享信息庫進行管理維護;對于共享獲得的信息內(nèi)容在授權(quán)范圍內(nèi)進行使用。外部交換與內(nèi)部交換描述如下:1、外部交換(1)部門向外部共享數(shù)據(jù)數(shù)據(jù)提供方通過從業(yè)務(wù)信息庫中提取數(shù)據(jù)形成一定主題的共享數(shù)據(jù),并后提交管理者確認是否可以共享。管理者確認后進行目錄編制并將目錄注冊到共享信息庫中,通過數(shù)據(jù)交換總線將共享的數(shù)據(jù)及目錄信息裝載到共享目錄庫、共享信息庫中,同時將組織數(shù)據(jù)的結(jié)構(gòu)信息記錄到交換數(shù)據(jù)記錄庫中。
32、數(shù)據(jù)使用方通過目錄服務(wù)系統(tǒng)的瀏覽查詢功能發(fā)現(xiàn)需要的信息資源,通過數(shù)據(jù)下載或主題訂閱功能下載數(shù)據(jù)或訂閱進入本地交換信息庫。目錄內(nèi)容是一個服務(wù)引用,數(shù)據(jù)使用方則可以將服務(wù)的引用地址發(fā)送給使用服務(wù)的應(yīng)用系統(tǒng);同時數(shù)據(jù)使用方可以在線瀏覽目錄內(nèi)的數(shù)據(jù)信息。(2)部門與外部交換數(shù)據(jù)使用者通過自己的交換前置系統(tǒng)將交換數(shù)據(jù)的請求提交到數(shù)據(jù)提供方的交換管理系統(tǒng),提交的內(nèi)容包括交換數(shù)據(jù)的內(nèi)容描述或交換數(shù)據(jù)的格式。提供方得交換前置系統(tǒng)接收請求并自動發(fā)送給交換管理系統(tǒng),提供者查看交換請求,并根據(jù)申請要求從業(yè)務(wù)數(shù)據(jù)庫中挑選相關(guān)數(shù)據(jù)字段形成滿足交換需求的數(shù)據(jù)。管理者對形成的交換數(shù)據(jù)進行審批確認,然后進行目錄編制和目錄注冊
33、。通過橋接系統(tǒng)和數(shù)據(jù)交換總線將交換數(shù)據(jù)及目錄信息裝載到交換信息庫,同時將組織數(shù)據(jù)的結(jié)構(gòu)信息記錄到交換數(shù)據(jù)記錄庫中,最后通過交換前置系統(tǒng)給數(shù)據(jù)請求方發(fā)送處理結(jié)果信息。使用者在交換前置系統(tǒng)收到消息后,通過前置交換系統(tǒng)查看提供方的交換目錄庫及交換信息庫授權(quán)數(shù)據(jù),將交換數(shù)據(jù)下載到本地或通過同步定期進入本地共享信息庫。如果目錄內(nèi)容只是一個服務(wù)引用,可將服務(wù)的引用地址發(fā)送給使用服務(wù)的應(yīng)用系統(tǒng);同時使用者可以在線瀏覽交換數(shù)據(jù)的抽樣信息。2、內(nèi)部交換(1)內(nèi)部共享數(shù)據(jù)數(shù)據(jù)提供方從業(yè)務(wù)信息庫中提取、編制數(shù)據(jù)后提交管理者確認。管理者對該數(shù)據(jù)確認后進行編目及目錄注冊,通過數(shù)據(jù)交換總線將共享的數(shù)據(jù)及目錄信息裝載到應(yīng)用
34、目錄庫及應(yīng)用信息庫中,同時將數(shù)據(jù)的結(jié)構(gòu)信息記錄到交換數(shù)據(jù)記錄庫中。數(shù)據(jù)使用方通過目錄服務(wù)系統(tǒng)的瀏覽查詢功能查找需要的信息資源目錄,并能夠進行信息瀏覽和共享數(shù)據(jù)下載。(2)內(nèi)部交換數(shù)據(jù)使用者通過本地的交換前置系統(tǒng)提交換數(shù)據(jù)請求或者交換數(shù)據(jù)的內(nèi)容到數(shù)據(jù)提供方的交換管理系統(tǒng)。提供者在交換管理系統(tǒng)接收到請求后,由管理員根據(jù)申請要求從業(yè)務(wù)數(shù)據(jù)庫中挑選相關(guān)數(shù)據(jù)字段形成滿足交換需求的數(shù)據(jù)。管理者對該數(shù)據(jù)確認后,進行目錄編制和錄注冊,通過交換橋接、數(shù)據(jù)交換總線將交換的數(shù)據(jù)及目錄信息裝載到應(yīng)用目錄庫及應(yīng)用信息庫中,同時將組織數(shù)據(jù)的過程記錄到交換數(shù)據(jù)記錄庫中。并通過交換前置系統(tǒng)通知數(shù)據(jù)請求方交換處理結(jié)束。使用者在
35、收到處理結(jié)果消息后.通過目錄服務(wù)系統(tǒng)瀏覽應(yīng)用目錄庫及應(yīng)用信息庫,在相應(yīng)有權(quán)限訪問的目錄中下載或訂閱數(shù)據(jù)到本地。數(shù)據(jù)交換獲取資源的控制管理數(shù)據(jù)交換控制管理工具提供以下功能:1、交換管理為處理數(shù)據(jù)交換請求提供工具,包括交換數(shù)據(jù)預(yù)覽工具、處理請求管理工具、交換數(shù)據(jù)格式設(shè)計工具、消息格式設(shè)置工具等。(1)處理請求管理工具:展示通過分揀后的數(shù)據(jù),供數(shù)據(jù)提供方進行處理。提供數(shù)據(jù)請求的查看,以及請求方歷史請求信息的查看功能。同時可以對交換信息記錄庫進行檢索查詢,看是否有類似的需求共享或交換記錄,如有可復(fù)用原來的設(shè)置。(2)交換數(shù)據(jù)格式設(shè)計工具:在進行數(shù)據(jù)交換請求設(shè)計過程中,根據(jù)請求方發(fā)過來的請求內(nèi)容分別處理
36、。文字類需求,提供方則需要使用數(shù)據(jù)格式設(shè)計工具來進行交換數(shù)據(jù)的提取設(shè)計;數(shù)據(jù)格式類需求,提供方則采用數(shù)據(jù)映射工具來進行交換數(shù)據(jù)的提取設(shè)計。(3)消息格式設(shè)計工具:數(shù)據(jù)格式設(shè)定后,要根據(jù)數(shù)據(jù)請求方與提供方之間的數(shù)據(jù)傳輸通道協(xié)議進行消息格式設(shè)計或選擇。(4)交換數(shù)據(jù)預(yù)覽工具:在數(shù)據(jù)格式設(shè)計完成后,可以通過交換數(shù)據(jù)預(yù)覽工具對要交換出去的數(shù)據(jù)進行預(yù)提取,并提供全數(shù)據(jù)和隨機抽樣數(shù)據(jù)兩種方式進行交換數(shù)據(jù)的預(yù)覽,數(shù)據(jù)提供方根據(jù)預(yù)覽后的情況判斷設(shè)計是否準確。2、目錄管理主要提供對共享或交換數(shù)據(jù)的目錄編制和目錄注冊功能,同時提供共享數(shù)據(jù)的設(shè)計工具。(1)目錄編制工具完成目錄的編制審批和發(fā)布功能,包含:目錄維護,
37、根據(jù)元數(shù)據(jù)庫中的數(shù)據(jù)實體進行目錄項維護及管理,形成新的用于交換的交換數(shù)據(jù)實體,并建立目錄與數(shù)據(jù)實體之間的鉤稽關(guān)系;目錄提交審批,提出將某目錄發(fā)布的申請,并依據(jù)流程進行相關(guān)審批;目錄內(nèi)容摘要,形成目錄內(nèi)容的摘要,包括所提供的數(shù)據(jù)項、數(shù)據(jù)的發(fā)布方等;目錄停止及廢除;提示停止、廢除產(chǎn)生的相關(guān)影響,例如有人還在進行訂閱及交換、有人正在訪問等。(2)目錄注冊工具對編制好的目錄進行注冊發(fā)布,包括:目錄注冊管理,設(shè)計目錄的層次結(jié)構(gòu)、上下級關(guān)系等;目錄移動、復(fù)制,提供目錄層次調(diào)整,目錄復(fù)制;目錄刪除提供刪除已注冊的目錄內(nèi)容;注冊目錄同步,提供從外部注冊目錄(如應(yīng)用目錄庫、共享目錄庫、交換目錄庫)移動、復(fù)制的目
38、錄同步及同步策略管理。(3)共享數(shù)據(jù)設(shè)計工具:提供進行數(shù)據(jù)共享的圖形化設(shè)計工具,并且自動標識為無權(quán)限目錄注冊3、其他管理工具(1)事件觸發(fā)管理工具:提供交換、共享數(shù)據(jù)服務(wù)事件注冊及發(fā)布;提供外部對事件觸發(fā)訂閱確認管理工具。(2)任務(wù)及調(diào)度管理工具:任務(wù)的注冊管理,任務(wù)組的設(shè)置,任務(wù)調(diào)度策略設(shè)置,以及任務(wù)執(zhí)行調(diào)度的圖形化設(shè)置。(3)跟蹤管理工具:對需要進行跟蹤的模塊或任務(wù)進行跟蹤設(shè)置,包含跟蹤的粒度及內(nèi)容設(shè)置,并提供可跟蹤內(nèi)容的注冊及掃描。(4)適配器管理工具:提供適配器的分類及適配器注冊,包括適配器的實現(xiàn)類、輸入、輸出參數(shù)接口,并提供適配器的查詢檢索。(5)歸檔設(shè)計工具:提供對交換系統(tǒng)中交換規(guī)
39、則、橋接規(guī)則、請求、審批意見、跟蹤信息、流程配置、任務(wù)設(shè)置等數(shù)據(jù)的定期備份策略,包括命名規(guī)則、備份位置、備份事件等設(shè)置。并提供歷史歸檔的管理功能,以及歸檔的恢復(fù)功能。目錄安全設(shè)計目錄安全設(shè)計,主要涉及身份認證、授權(quán)和通訊等幾個方面。目錄認證方式目錄的認證方式主要有以下三種:匿名:不需要用戶名和密碼訪問系統(tǒng)。簡單用戶名和密碼:用戶名和密碼以明文的方式在網(wǎng)絡(luò)中傳輸,在目錄服務(wù)器上實現(xiàn)認證?;跀?shù)字證書的身份認證:支持客戶端以數(shù)字證書表明身份,同時也支持對服務(wù)器對進行身份鑒定?;跀?shù)字證書的身份認證是安全級別最高的身份驗證方式。目錄的授權(quán)目錄服務(wù)中的授權(quán),是規(guī)定某個實體可以對目錄進行何種訪問操作且只
40、能進行所規(guī)定訪問操作的規(guī)則。訪問控制機制目錄授權(quán)主要由訪問控制機制來完成,并可以實現(xiàn)與數(shù)字證書相結(jié)合的訪問控制。訪問控制指對用戶的訪問權(quán)限進行管理和授權(quán)。一旦用戶通過認證,客戶身份被目錄服務(wù)器識別后,就可以查出訪問控制信息,并用它來確定客戶進程是否有足夠的權(quán)限進行所請求的操作。在LDAP中訪問控制的對象是條目,一些條目允許高級別用戶進行更新操作;一些條目允許所有用戶進行查詢操作;一些條目禁止匿名用戶進行訪問。同時被認證被授權(quán)的用戶信息,也是作為條目信息在目錄服務(wù)中存在的,這樣授權(quán)用戶就是以普通數(shù)據(jù)的形式存在,對用戶數(shù)據(jù)的管理也潛在地實現(xiàn)了對用戶權(quán)限的管理。授權(quán)管理授權(quán)管理主要用于維護元數(shù)據(jù)管理
41、平臺的使用者授權(quán),功能設(shè)計上采用兩級管理機制,包括授權(quán)角色組創(chuàng)建維護和角色組成員帳號的創(chuàng)建維護,使得系統(tǒng)既可以在組一級配置細膩的訪問授權(quán)策略,又可以通過添加組成員的方式高效的管理帳號權(quán)限,兼顧了功能的完整性與可維護性。帳號的身份認證服務(wù)由系統(tǒng)管理平臺統(tǒng)一提供,通過認證與授權(quán)分離,有效地解決了統(tǒng)一帳號在各系統(tǒng)中的共用問題,并為遠期實現(xiàn)全系統(tǒng)單點登陸提供了可信的、成熟的基礎(chǔ)平臺。1、維護角色組維護角色組功能主要用于管、劃分角色,并給角色受權(quán),在實際使用過程中我們可以將角色劃分為超級用戶、系統(tǒng)管理員、審核員、行政管理員、一般用戶等多種角色組,并賦予創(chuàng)建用戶、創(chuàng)建分中心節(jié)點、維護元數(shù)據(jù)、查看元數(shù)據(jù)、搜
42、索元數(shù)據(jù)、檢查元數(shù)據(jù)等各種具體權(quán)限。角色組維護功能設(shè)計主要包括新增組、刪除組、打印組列表、維護組授權(quán)、打印當前組的詳細授權(quán)報告等功能。系統(tǒng)中每個功能模塊都設(shè)計有授權(quán)類別注冊接口,具體的授權(quán)種類由整個系統(tǒng)的各功能模塊主動注冊完成。系統(tǒng)授權(quán)注冊表由系統(tǒng)管理員通過底層數(shù)據(jù)庫管理工具進行管理。2、維護帳號維護帳號功能用于維護使用系統(tǒng)的基本帳號信息,包括創(chuàng)建帳號、刪除帳號、帳號名稱、帳號密碼、帳號證書(本期不使用)、帳號身份、帳號角色、帳號聯(lián)系方式、帳號介紹等基本人員信息,今后為了管理方便可能會構(gòu)筑人員組織目錄數(shù)據(jù)庫用于統(tǒng)一維護帳號,但考慮到本示范項目的具體要求,所以本期項目不考慮人員目錄問題。帳號維護
43、功能設(shè)計包括新增帳號、刪除帳號、打印帳號列表、更新帳號屬性,打印帳號詳細信息等功能,帳號的具體屬性項由系統(tǒng)管理員通過底層系統(tǒng)配置工具配置完成。3、維護角色組成員維護角色組成員功能一個輔助功能,主要為了使系統(tǒng)管理員和領(lǐng)導層能夠直觀的了解角色組的成員構(gòu)成,并以此為依據(jù)對帳號和角色組進行管理。同時,管理員也可通過這個工具從管理角色組的角度為具體的帳號單獨或批量的賦予角色信息,簡化了管理過程,提高了維護效率。維護角色組成員設(shè)計主要有打印角色組功能,刪除、添加角色組成員、打印角色組成員列表等功能,如果在“維護帳號”功能中對帳號角色信息又修改的話,此頁面會自動刷新角色組成員列表。目錄系統(tǒng)功能建設(shè)基于應(yīng)用支
44、撐平臺中的信息資源編目工具,結(jié)合數(shù)據(jù)交換組件及目錄服務(wù)組件,遵循業(yè)務(wù)基礎(chǔ)共享數(shù)據(jù)元和代碼集規(guī)范。目錄編目功能智慧城市政務(wù)信息編目功能是基于核心元數(shù)據(jù)標準開發(fā)的元數(shù)據(jù)生成系統(tǒng)。提供者使用政務(wù)信息編目功能從不同形態(tài)的信息資源中,手工或自動抽取出元數(shù)據(jù)。圖 3 SEQ 圖 * ARABIC s 2 15政務(wù)信息編目功能結(jié)構(gòu)主要包括7個功能模塊,分別為內(nèi)容抽取、內(nèi)容錄入、元數(shù)據(jù)生成、資源編碼生成、資源分類、原文主題詞提取、元數(shù)據(jù)管理、配置管理。其中,元數(shù)據(jù)生成包括元數(shù)據(jù)自動生成方式元數(shù)據(jù)抽取、元數(shù)據(jù)手工錄入元數(shù)據(jù)編輯兩種功能。元數(shù)據(jù)抽取主要針對的對象有以下幾種:已有目錄:信息系統(tǒng)中現(xiàn)有的目錄資源。網(wǎng)頁
45、:信息系統(tǒng)中網(wǎng)站資源,例如門戶網(wǎng)站。數(shù)據(jù)庫:信息系統(tǒng)中的各種數(shù)據(jù)庫資源,包括關(guān)系型數(shù)據(jù)庫、XML數(shù)據(jù)庫等。格式化電子文件:系統(tǒng)中的電子文件,例如Word、PDF、XLS等文件。內(nèi)容抽取通過信息資源編目工具提供的接口,定制抽取程序,實現(xiàn)自動生成元數(shù)據(jù)的功能,即元數(shù)據(jù)抽取。信息資源編目工具提供的接口,應(yīng)該能夠處理以下幾類信息:WEB資源元數(shù)據(jù)抽取、電子文檔元數(shù)據(jù)抽取、數(shù)據(jù)庫元數(shù)據(jù)抽取。通過元數(shù)據(jù)自動抽取,提供者可以方便、快捷地獲得大量的元數(shù)據(jù)信息。抽取的對象元數(shù)據(jù)抽取主要針對的對象有以下幾種:圖 STYLEREF 2 s 2.4 SEQ 圖 * ARABIC s 2 2元數(shù)據(jù)抽取對象已有目錄:政務(wù)
46、信息現(xiàn)有系統(tǒng)中現(xiàn)有的目錄資源。網(wǎng)頁:政務(wù)信息現(xiàn)有系統(tǒng)中網(wǎng)站資源,例如門戶網(wǎng)站。數(shù)據(jù)庫:政務(wù)信息現(xiàn)有系統(tǒng)中的各種數(shù)據(jù)庫資源,包括關(guān)系型數(shù)據(jù)庫、XML數(shù)據(jù)庫等。格式化電子文件:系統(tǒng)中的電子文件,例如Word、PDF、XLS等文件。元數(shù)據(jù)抽取的流程元數(shù)據(jù)抽取的流程有4個主要步驟,分別為:圖 STYLEREF 2 s 2.4 SEQ 圖 * ARABIC s 2 3元數(shù)據(jù)抽取流程數(shù)據(jù)源信息獲?。航鉀Q要從哪個數(shù)據(jù)源獲得元數(shù)據(jù)的問題。內(nèi)容/結(jié)構(gòu)分析:解決要從數(shù)據(jù)源中獲得哪些元數(shù)據(jù)的問題。元數(shù)據(jù)提?。航鉀Q如何從數(shù)據(jù)源中獲取元數(shù)據(jù)的問題。存儲入庫:解決元數(shù)據(jù)存儲的問題。WEB資源元數(shù)據(jù)抽取WEB資源元數(shù)據(jù)抽取
47、包括兩個核心功能,分別為采集系統(tǒng)和存儲系統(tǒng)。圖 STYLEREF 2 s 2.4 SEQ 圖 * ARABIC s 2 4 WEB資源元數(shù)據(jù)抽取流程采集系統(tǒng),針對一個專題,我們分四步進行數(shù)據(jù)采集:利用搜索引擎,對我們設(shè)定的專題進行泛搜索,確定探索的范圍;利用網(wǎng)絡(luò)蜘蛛,在確定的探索范圍內(nèi)進行泛探索,探尋可能有價值的站點;對有價值的信息源進行監(jiān)視,定時捕獲更新的內(nèi)容;數(shù)據(jù)清洗,對捕獲的內(nèi)容進行清洗,只保留我們關(guān)注的有價值的信息。存儲系統(tǒng),把捕獲的Web頁面分解為元數(shù)據(jù)、并分類保存在這里存儲的概念不僅是把數(shù)據(jù)放到數(shù)據(jù)庫或者保存到硬盤上,更重要的是根據(jù)一定的目錄體系標準,把數(shù)據(jù)分解為元數(shù)據(jù),然后進行存
48、儲。電子文檔的元數(shù)據(jù)抽取對于電子文檔,首先政府各部門的文檔格式不盡相同,另外它們的安全級別也各不相同,同時由于信息化建設(shè)水平的不一致,有的部門文檔分散在各處,有的部門文檔是集中存放的,甚至已經(jīng)建立了完善的電子系統(tǒng)進行管理。針對以上狀況,對于電子文檔的元數(shù)據(jù)抽取需要進行以下的抽取流程:整理歸檔對于分散在各處的電子文檔(紙質(zhì)文檔需要先進行電子化處理),必須由專人進行統(tǒng)一整理,根據(jù)公開共享的前提進行集中,這種集中可以是物理上集中的,也可以是邏輯上集中的。但要滿足以下原則,第一根據(jù)安全級別,便于外界訪問;第二便于文檔的增量發(fā)布;第三便于采集工具的自動化采集編目。各部門只有在文檔完全整理歸檔的情況下,進
49、行自動化采集才是切實可行的。在整理歸檔的時候,各部門根據(jù)各自情況進行歸檔,沒有必要千篇一律,也沒有必要制定繁瑣和呆板的規(guī)則,只要能夠滿足以上的原則即可。根據(jù)安全級別,建立相應(yīng)的訪問機制由于受到安全級別的限制,所以對于需要共享的數(shù)據(jù)要進行安全方面的限制,限制的手段可以有:用戶名/密碼、數(shù)字證書、物理隔斷等等,根據(jù)實際情況建立安全訪問機制,做到重要信息不泄露,不丟失。編目處理現(xiàn)階段,主流格式的電子文檔,主要包含:word、excel、ppt、pdf等。對主流格式的電子文檔,要提供自動采集工具進行編目處理。采集的范圍主要是文檔的標題和內(nèi)容,對于其它的元數(shù)據(jù)內(nèi)容,要提供手工配置的方式進行輔助。另外,在
50、工具的采集效率上,要提高增量文檔發(fā)布后的采集效率。對于格式特殊、內(nèi)容有加密算法的文檔,是很難通過抓取工具進行采集的,這些文檔主要通過手工編目的方式來處理。對于存在管理庫的文檔,就需要對數(shù)據(jù)庫來進行編目采集,詳見數(shù)據(jù)庫元數(shù)據(jù)抽取部分。保存元數(shù)據(jù)采集后的數(shù)據(jù)要放到數(shù)據(jù)庫或者保存到硬盤上,另外要根據(jù)目錄體系標準,把數(shù)據(jù)分解為元數(shù)據(jù),然后進行存儲數(shù)據(jù)庫元數(shù)據(jù)抽取思路:確定數(shù)據(jù)庫抽取的范圍手工進行sql語句的編寫和機器自動配置相結(jié)合,自動配置如:指定數(shù)據(jù)源,指定抽取表的范圍,指定主鍵等等將數(shù)據(jù)從業(yè)務(wù)庫提取到相應(yīng)的可訪問的數(shù)據(jù)庫當中,中間要有防火墻等安全保障措施對于增量發(fā)布的數(shù)據(jù),要有相對應(yīng)的發(fā)布機制不同
51、等級的訪問機制要建立數(shù)據(jù)如何展現(xiàn),可以建立通用級的查詢程序,主要以B/S方式為主,具有可配置性,對發(fā)布庫的數(shù)據(jù)進行查詢,最終得展現(xiàn)結(jié)果以網(wǎng)頁形式展現(xiàn)最好對于不同的數(shù)據(jù)源,如:mysql、oracle、db2等要有通用性對于抓取的效率,應(yīng)該有一定的標準,應(yīng)該達到xx級;應(yīng)該支持自動輪詢抓取操作內(nèi)容錄入信息資源編目工具,應(yīng)該設(shè)計有元數(shù)據(jù)編輯器的功能,元數(shù)據(jù)編輯器具有元數(shù)據(jù)內(nèi)容錄入、標準邏輯分析、格式文件輸出、元數(shù)據(jù)完整性檢查、基于元素的復(fù)制等功能。1、編目對象元數(shù)據(jù)編輯器的編目對象包括2類:數(shù)據(jù)集元數(shù)據(jù)數(shù)據(jù)集是可以標識的數(shù)據(jù)集合,它能夠用一個數(shù)據(jù)字典唯一描述。在數(shù)據(jù)組成上,它是由若干數(shù)據(jù)記錄組成的
52、數(shù)據(jù)集合。各部門都有相關(guān)的數(shù)據(jù)集,例如國家重點企業(yè)資產(chǎn)數(shù)據(jù)集、中國結(jié)核病流行病學數(shù)據(jù)集等。信息庫元數(shù)據(jù)信息庫一般由面向特定主題的若干數(shù)據(jù)集組成。例如國家電子政務(wù)建設(shè)中的四大基礎(chǔ)庫(人口、法人、地理空間和宏觀經(jīng)濟數(shù)據(jù)庫)。2、元數(shù)據(jù)編輯器的主要功能元數(shù)據(jù)內(nèi)容錄入元數(shù)據(jù)內(nèi)容錄入用于元數(shù)據(jù)內(nèi)容的錄入處理,根據(jù)核心元數(shù)據(jù)標準,幫助和引導錄入人員建立符合要求的信息資源元數(shù)據(jù)。元數(shù)據(jù)內(nèi)容錄入動態(tài)地完成編輯元數(shù)據(jù)所需的處理,包括元素內(nèi)容編輯組件動態(tài)生成、元素關(guān)系自動關(guān)聯(lián)和元素值域檢查等。其中編輯組件動態(tài)生成功能根據(jù)元數(shù)據(jù)標準定義的元素數(shù)據(jù)類型和取值方式動態(tài)地確定界面編輯組件的形式,使界面極具友好性;元素關(guān)系
53、自動關(guān)聯(lián)保證了元素之間的約束關(guān)系能夠被編輯器自動的處理,減少了由于編輯人員對標準的理解錯誤而產(chǎn)生元數(shù)據(jù)結(jié)構(gòu)錯誤的可能;元素值域檢查可對用戶輸入的數(shù)據(jù)的有效性進行判斷,以確保元數(shù)據(jù)信息內(nèi)容的正確性。標準邏輯分析元數(shù)據(jù)編輯器對描述元素的處理不依賴于特定的元數(shù)據(jù)標準,也就是說編輯器對元數(shù)據(jù)標準邏輯的分析和處理是獨立于標準本身的。編輯器的標準邏輯分析功能通過元數(shù)據(jù)標準的XML描述獲得元素之間的制約關(guān)系、值域等處理邏輯。因此編輯器可以很好的適應(yīng)標準的不斷更新和升級。格式文件輸出元數(shù)據(jù)編輯器輸出的文檔必須具為大多數(shù)系統(tǒng)所識別,為此,元數(shù)據(jù)編輯器為用戶提供xml等文檔輸出格式。元數(shù)據(jù)完整性檢查為保證元數(shù)據(jù)的
54、完整性,編輯器提供了元數(shù)據(jù)完整性檢查功能。利用該功能,編輯器可以在輸出文檔之前對各個描述元素的組織關(guān)系、元素內(nèi)容的完整性加以檢查,發(fā)現(xiàn)編輯過程中可能遺留的問題,并提示用戶加以修正。通過完整性檢查的元數(shù)據(jù)將嚴格復(fù)合相應(yīng)元數(shù)據(jù)內(nèi)容標準所做的規(guī)定?;谠氐膹?fù)制在實際應(yīng)用中,同一個信息資源往往具有許多相同的特征,在元數(shù)據(jù)中則體現(xiàn)為包含內(nèi)容相同的元素。為便于元數(shù)據(jù)的編寫,編輯器提供了基于元素的數(shù)據(jù)復(fù)制功能,實現(xiàn)復(fù)合相同內(nèi)容標準的元數(shù)據(jù)之間的元素復(fù)制。例如,當元數(shù)據(jù)具有相同復(fù)合元素時,用戶可以復(fù)制該元素。這時編輯器將自動地在目標元數(shù)據(jù)中生成與源元數(shù)據(jù)中相同的元素子樹,并復(fù)制其中各個數(shù)據(jù)元素的值?;谠?/p>
55、的復(fù)制功能,可以在很大程度上提供元數(shù)據(jù)文檔的編寫效率。資源編碼生成資源編碼生成為元數(shù)據(jù)生成模塊提供資源ID生成功能。信息資源ID由兩部分構(gòu)成:前段碼分隔符(/)后段碼。后段碼由擁有前段碼的目錄管理者或政務(wù)部門自行管理和分配,必須保證在本部門范圍內(nèi)的唯一性。后段碼原則上采用順序號,由程序自動生成。編制后段碼時應(yīng)考慮代碼的穩(wěn)定性和簡潔性。后段碼可以采用現(xiàn)有的編碼體系?,F(xiàn)有的編碼體系必須在一定范圍內(nèi)被權(quán)威機構(gòu)所認可,比如具有穩(wěn)定的編碼規(guī)則,并有專人管理。這些編碼體系可以是國際或國家范圍內(nèi)認可的編碼體系,比如ISBN號、ISSN號等,也可以是一個部門內(nèi)部為其所管理的信息資源分配的流水號。資源分類與主題
56、詞提取資源分類模塊為元數(shù)據(jù)生成模塊提供信息資源分類信息,并根據(jù)資源信息,抽取主題詞。資源分類信息將對應(yīng)于核心元數(shù)據(jù)標準中的類目名稱、類目編碼和分類標準等三項。類目名稱類目編碼分類標準.資源分類主題詞將對應(yīng)于核心元數(shù)據(jù)標準中的關(guān)鍵字。人工分類根據(jù)資源信息有無原文,可以將分類方式分為以下幾種:1、分類標準、類目名稱和類目編碼的關(guān)聯(lián)。以科工委網(wǎng)絡(luò)(內(nèi)網(wǎng)和普密網(wǎng))信息資源分類報告為標準,確定分類標準、類目名稱和類目編碼的關(guān)聯(lián)關(guān)系,實現(xiàn):1)類目名稱和類目編碼之間的自動映射;2)類目名稱或類目編碼到分類標準的自動映射;2、語法審核。 1)值域?qū)徍?。審核著錄人員的賦值是否屬于規(guī)定的值域; 2)結(jié)構(gòu)審核。審
57、核相關(guān)字段的結(jié)構(gòu)和出現(xiàn)次數(shù)是否符合標準規(guī)定;3、手工點選功能:1)相關(guān)類目樹的展現(xiàn)。在編目人員進行賦值的時候,展現(xiàn)相關(guān)類目樹,編目人員通過對類目的點選實現(xiàn)對相關(guān)字段的賦值。2)分類標準、類目名稱和類目編碼的關(guān)聯(lián)。 點選類目樹中的節(jié)點,實現(xiàn)對分類標準、類目名稱和類目編碼字段的自動賦值。4、機輔分類、自動分類功能:1)根據(jù)著錄對象的內(nèi)容,實現(xiàn)機輔分類或自動分類。2)根據(jù)著錄對象已存在的相關(guān)元數(shù)據(jù),實現(xiàn)機輔分類或自動分類。原文主題詞提取根據(jù)編目操作員提供的信息資源原文,實現(xiàn)主題詞的自動抽取。與元數(shù)據(jù)生成模塊的交互根據(jù)分類方式的不同,資源分類與主題詞提取模塊與元數(shù)據(jù)生成模塊的交互有以下幾種方式:資源分
58、類與主題詞提取模塊為元數(shù)據(jù)生成模塊中用戶手工鍵入的資源分類進行合法性判斷,以防用戶錄入非法的資源分類信息。資源分類與主題詞提取模塊為元數(shù)據(jù)生成模塊提供資源分類類目樹,供編目人員選擇。資源分類與主題詞提取模塊根據(jù)元數(shù)據(jù)生成模塊提供的資源信息原文,實現(xiàn)機輔分類與主題詞提取,即自動給出分類類目和主題詞??紤]到自動分類的準確性,編目人員可以進行手工調(diào)整。元數(shù)據(jù)管理編目管理系統(tǒng)中的元數(shù)據(jù)管理是管理本部門內(nèi)部的生成的元數(shù)據(jù)。主要包括元數(shù)據(jù)檢查和元數(shù)據(jù)的日常維護。元數(shù)據(jù)檢查元數(shù)據(jù)檢查是指檢查員對操作員生成的元數(shù)據(jù)進行合法性檢查。主要檢查信息資源元數(shù)據(jù)的內(nèi)容、格式符合標準規(guī)范的要求,信息資源元數(shù)據(jù)內(nèi)容必須符合
59、信息資源目錄體系 第3部分:核心元數(shù)據(jù)的要求。信息資源分類必須符合信息資源目錄體系 第4部分:信息資源分類的要求。形式化審核工作由工作系統(tǒng)自動完成。其他非形式化的審核工作,例如資源分類是否準確、主題詞提取是否準確等等,需要由檢查員完成。未通過審核要求的信息資源元數(shù)據(jù)需要操作員重新修訂后提交。元數(shù)據(jù)維護元數(shù)據(jù)維護包括對元數(shù)據(jù)的查詢、增、刪、改等操作。配置管理用戶管理管理系統(tǒng)中的用戶基本信息、角色信息。用戶基本信息管理用戶基本信息包括用戶名、密碼、電子郵件、聯(lián)系電話等基本數(shù)據(jù)。系統(tǒng)管理員可以對用戶基本信息進行增、刪、改、查等基本操作。角色管理系統(tǒng)設(shè)置四種角色:操作員、檢查員、元數(shù)據(jù)管理員和系統(tǒng)管理
60、員。操作員:負責生成元數(shù)據(jù)工作。檢查員:負責檢查操作員的工作成果,即檢查元數(shù)據(jù)的合法性。元數(shù)據(jù)管理員:負責管理元數(shù)據(jù)。系統(tǒng)管理員:負責系統(tǒng)配置、用戶、角色管理等工作。日志管理操作日志是指用戶對系統(tǒng)、數(shù)據(jù)庫、網(wǎng)絡(luò)等訪問、使用等行為描述的記錄,該記錄將有助于幫助系統(tǒng)管理員分析解決系統(tǒng)故障、網(wǎng)絡(luò)堵塞、分析統(tǒng)計等問題。日志分類應(yīng)用日志系統(tǒng)日志在設(shè)計系統(tǒng)時要考慮將不同系統(tǒng)的操作日志提取和保存,以方便系統(tǒng)管理員的使用。數(shù)據(jù)庫日志與系統(tǒng)開發(fā)商一樣,數(shù)據(jù)庫開發(fā)商在開發(fā)數(shù)據(jù)庫系統(tǒng)時也考慮到了數(shù)據(jù)庫日志的機制。數(shù)據(jù)庫日志記錄了數(shù)據(jù)庫中數(shù)據(jù)的增、刪、改、查等情況,我們也考慮將數(shù)據(jù)庫系統(tǒng)日志提取并保存到系統(tǒng)操作日志數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育環(huán)境下學生體能提升的教學方案創(chuàng)新
- 小小茶韻大千世界-小學生茶文化探索之旅
- 教育領(lǐng)域中的交通安全意識培養(yǎng)
- 足浴店前臺服務(wù)工作總結(jié)
- 教育政策與學術(shù)文化節(jié)的互動關(guān)系
- 小學生課外綜合實踐活動的策略與方法研究
- 商業(yè)項目創(chuàng)意策劃與實施商業(yè)策劃工作匯報要點
- 展會現(xiàn)場管理與品牌傳播的協(xié)同效應(yīng)
- 紗窗合同范本
- 零用貸借款合同模板
- 工作證明模板下載免費
- 顛茄流浸膏實驗方案及總結(jié)
- 投標人情況表
- GB/T 34241-2017卷式聚酰胺復(fù)合反滲透膜元件
- GB/T 12494-1990食品機械專用白油
- 運輸供應(yīng)商年度評價表
- 北京語言大學保衛(wèi)處管理崗位工作人員招考聘用【共500題附答案解析】模擬試卷
- 肺癌的診治指南課件
- 人教版七年級下冊數(shù)學全冊完整版課件
- 商場裝修改造施工組織設(shè)計
- 統(tǒng)編版一年級語文上冊 第5單元教材解讀 PPT
評論
0/150
提交評論