大數(shù)據(jù)平臺方案設計_第1頁
大數(shù)據(jù)平臺方案設計_第2頁
大數(shù)據(jù)平臺方案設計_第3頁
大數(shù)據(jù)平臺方案設計_第4頁
大數(shù)據(jù)平臺方案設計_第5頁
已閱讀5頁,還剩151頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、項目技術方案大數(shù)據(jù)平臺方案設計1.1 需求分析1.1.1 采購范圍與基本要求建設XX高新區(qū)開發(fā)區(qū)智慧園區(qū)的人口庫(12萬居民)、法人庫(1200家企業(yè))、地理信息庫(已建設區(qū)域35平方公里的3維電子地圖、未建設區(qū)域80平方公里的航拍電子地圖)、視頻庫(1000個攝像點)、大數(shù)據(jù)處理平臺、數(shù)據(jù)管理服務平臺。1.1.2 建設內容要求 人口庫人口庫的基本信息以公安部門戶籍和暫住人口信息為基礎,整合人社、計生、民政、教育等多個部門信息資源,建設統(tǒng)一規(guī)范的人口庫和人口信息服務平臺。(1)人口庫的內容目錄序號信息目錄(一級)信息目錄(二級)可能的信息源單位1人口基本信息人員信息(常駐)公安局

2、2人員信息(暫?。?戶籍成員信息4死亡信息5人員車輛信息駕駛人員信息公安局(交警系統(tǒng))6機動車信息7電動車信息8社居民區(qū)服務信息房主信息房管局、村(居)委會9房屋變動信息10社區(qū)黨建信息黨員信息組織人社局、村(居)委會11培養(yǎng)黨員信息12黨員流入信息13黨員流出信息14社居民區(qū)服務信息準生證信息社會發(fā)展局15婚前檢查信息16孕前檢查信息17婚育證信息18節(jié)育手術信息19計生處罰信息20衛(wèi)生信息社區(qū)衛(wèi)生服務機構信息社會發(fā)展局21醫(yī)療機構信息22醫(yī)療資源信息23衛(wèi)生許可信息24民政信息社會組織信息社會發(fā)展局25區(qū)域地名信息26最低保障收入人員信息27精準扶貧對象信息村居管理委員會28社保基本信息單

3、位信息組織人社局29參保人員信息30養(yǎng)老保險信息退休待遇信息31轉移人員信息32失業(yè)信息失業(yè)登記和失業(yè)保險信息33醫(yī)療信息城鎮(zhèn)職工基本醫(yī)療保險賬戶信息34門慢信息35定點醫(yī)療機構和定點零售藥店信息36工傷信息傷殘認定信息37勞動能力鑒定信息38工傷待遇信息(2)人口信息服務平臺功能需求數(shù)據(jù)庫層:能夠安全存儲人口庫的內容目錄中列出的信息內容,對居民、企業(yè)、政府提供安全的人口信息服務,為人口大數(shù)據(jù)分析提供基本數(shù)據(jù)源。應用支撐層:包括門戶框架、數(shù)據(jù)庫維護、報表組件、數(shù)據(jù)挖掘等,用于為應用層提供應用支撐。數(shù)據(jù)挖掘提供常見的數(shù)據(jù)分析/挖掘工具、通用算法,利用大數(shù)據(jù)平臺的計算能力進行分析,對人口庫數(shù)據(jù)進行

4、數(shù)據(jù)挖掘與發(fā)現(xiàn),提供有價值的分析結果。應用層:包括人口信息服務、人口專題分析、公共服務等。 法人庫法人庫以工商部門的企業(yè)信息為基礎,整合各參建部門系統(tǒng)中的法人信息,如機構代碼、機構名稱、機構類型、經濟行業(yè)、業(yè)務經營范圍、機構地址、法定代表人等字段信息,建成標識統(tǒng)一、結構科學、查詢快捷、動態(tài)管理的法人信息庫。制定與交換平臺對應的相關標準、制度和規(guī)范管理體系,實現(xiàn)工商局、地稅局、國稅局、質量技術監(jiān)督局等法人數(shù)據(jù)相關業(yè)務部門之間的網絡互聯(lián)和業(yè)務數(shù)據(jù)的實時交換與應用。(1)法人庫的內容目錄序號信息目錄(一級)信息目錄(二級)可能的信息源單位1企業(yè)基本信息股東(投資者)信息工商質監(jiān)局,企業(yè)

5、2法人信息3地址與聯(lián)系信息4工商注冊信息工商登記信息工商質監(jiān)局5工商變更信息6工商注銷信息7工商吊銷信息8稅務信息稅務登記信息稅務局9稅務注銷信息10稅務登記驗換證信息11企業(yè)發(fā)票信息12企業(yè)經營信息組織架構企業(yè)13發(fā)展戰(zhàn)略14品牌15產品與服務信息16人力資源信息17高端技術和設備18財務報表19資質信息20信用信息21榮譽信息22文化23違規(guī)處罰等不良信息(2)法人信息服務平臺功能需求數(shù)據(jù)庫層:能夠安全存儲法人庫的內容目錄中列出的信息內容,對居民、企業(yè)、政府提供安全的法人信息服務,為法人大數(shù)據(jù)分析提供基本數(shù)據(jù)源。應用支撐層:包括門戶框架、數(shù)據(jù)庫維護、統(tǒng)計與報表組件、數(shù)據(jù)挖掘等,用于為應用層

6、提供應用支撐。數(shù)據(jù)挖掘提供常見的數(shù)據(jù)分析/挖掘工具、通用算法,利用大數(shù)據(jù)平臺的計算能力進行分析,對法人庫數(shù)據(jù)進行數(shù)據(jù)挖掘與發(fā)現(xiàn),提供有價值的分析結果。應用層:包括法人信息服務、法人專題分析、公共服務等。 地理信息庫以國土資源部空間地理數(shù)據(jù)框架作為基礎,采用分布式存儲并行計算的技術思路統(tǒng)一搭建地理信息庫,再與智慧園區(qū)建設涉及的各類專題圖層進行融合、關聯(lián),實現(xiàn)統(tǒng)一共享,逐漸形成XX高新區(qū)權威、豐富的地理信息數(shù)據(jù)庫。要求根據(jù)不同信息資源類別,提供數(shù)據(jù)庫表結構設計。地理信息庫維護文件主要提供地圖基本操作、地圖測量、圖層控制、空間分析等信息服務功能。地理信息庫配置一套高性能GIS工具軟件,

7、基于高性能云GIS平臺搭建,實現(xiàn)空間數(shù)據(jù)的統(tǒng)一管理,完成空間數(shù)據(jù)檢查、轉換、入庫、管理、制圖顯示、服務發(fā)布等一系列空間數(shù)據(jù)分析處理功能。(1)地理信息庫的內容目錄序號信息目錄(一級)信息目錄(二級)可能的信息源單位1電子地圖數(shù)據(jù)三維電子地圖:已建設區(qū)域30平方公里國土資源部、中標單位測量航拍電子地圖:未建設區(qū)域60平方公里2地理實體數(shù)據(jù)建筑、道路、水系、綠地、農田等國土資源部、中標單位測量3三維模型數(shù)據(jù)已建設區(qū)域30平方公里,分等級實現(xiàn)重點城區(qū)精細三維模型數(shù)據(jù)和其它地區(qū)簡易模型數(shù)據(jù)中標單位測量、建設4城市部件數(shù)據(jù)路燈、交通燈、屏顯、導示牌、標志性行道樹、線纜、地下管網等城管等部門5規(guī)劃數(shù)據(jù)規(guī)劃

8、用地數(shù)據(jù)規(guī)劃局6POI數(shù)據(jù)企業(yè)(項目)數(shù)據(jù)規(guī)劃局、辦公室等(2)地理信息庫管理平臺功能需求數(shù)據(jù)處理:格式轉換、坐標轉換、屬性編輯、數(shù)據(jù)裁切。數(shù)據(jù)質檢:矢量數(shù)據(jù)檢查、柵格數(shù)據(jù)檢查、三維模型數(shù)據(jù)檢查、元數(shù)據(jù)檢查。入庫更新:矢量數(shù)據(jù)入庫、影像數(shù)據(jù)入庫、三維模型數(shù)據(jù)入庫、元數(shù)據(jù)入庫。數(shù)據(jù)輸出:矢量數(shù)據(jù)提取、柵格數(shù)據(jù)提取。查詢?yōu)g覽:地圖瀏覽、數(shù)據(jù)加載、SQL查詢、空間查詢、數(shù)據(jù)對比瀏覽、元數(shù)據(jù)查詢。歷史數(shù)據(jù)管理:歷史版本數(shù)據(jù)比較、版本數(shù)據(jù)提取。系統(tǒng)管理:權限管理、日志管理、備份恢復。 視頻庫(1)視頻庫的內容目錄序號信息目錄(一級)信息目錄(二級)可能的信息源單位1視頻視頻目錄視頻監(jiān)控系統(tǒng)

9、數(shù)字攝像裝置視頻文件2視頻特征視頻特征文件(2)視頻庫管理平臺功能需求與視頻監(jiān)控系統(tǒng)的接口、視頻入庫、視頻目錄管理、視頻文件管理、視頻特征文件生成、視頻檢索、視頻異常發(fā)現(xiàn)等。 大數(shù)據(jù)處理平臺(1)大數(shù)據(jù)基礎平臺提供基礎管控、基礎服務的大數(shù)據(jù)基礎支撐功能。大數(shù)據(jù)基礎平臺要充分利用目前先進的大數(shù)據(jù)處理技術,保證系統(tǒng)技術的前瞻性和先進性。大數(shù)據(jù)基礎平臺要求提供海量數(shù)據(jù)的采集、存儲、計算、接口服務能力;需要滿足海量、異構的大數(shù)據(jù)的存儲、共享、開放及分析挖掘方面的要求;需要采用主流的大數(shù)據(jù)的技術架構,全面滿足結構化數(shù)據(jù)、半構化數(shù)據(jù)及非結構化數(shù)據(jù)的存儲、處理及計算要求;提供多種數(shù)據(jù)采集工具,

10、支持多種格式數(shù)據(jù)采集;提供接口服務,供二次開發(fā)應用等。大數(shù)據(jù)基礎平臺要求能夠管理大數(shù)據(jù)中心集群的物理服務器資源,控制分布式程序運行,隱藏下層故障恢復和數(shù)據(jù)冗余等細節(jié),為大數(shù)據(jù)處理平臺提供統(tǒng)一的管理、監(jiān)控、維護等日常管理功能。主要包括:資源管理、安全管理、運維管理、集群部署及監(jiān)控、任務調度等功能,同時配備友好的管理界面。數(shù)據(jù)采集要求大數(shù)據(jù)處理平臺數(shù)據(jù)主要來自數(shù)據(jù)資源中心,包括基礎庫(人口庫、法人庫、地理信息庫、視頻庫)數(shù)據(jù)、主題庫(業(yè)務數(shù)據(jù)庫)數(shù)據(jù)和互聯(lián)網數(shù)據(jù),同時也支持其他外部系統(tǒng)數(shù)據(jù)來源。數(shù)據(jù)采集系統(tǒng)要求提供多種數(shù)據(jù)采集工具,支持多種格式數(shù)據(jù)采集。對于結構化數(shù)據(jù)、非結構化數(shù)據(jù)以及網絡數(shù)據(jù)采用

11、不同的采集工具進行數(shù)據(jù)導入。支持多種數(shù)據(jù)采集方式,比如ETL、FTP、文件導入導出、關系數(shù)據(jù)庫數(shù)據(jù)等。分布式存儲要求平臺能夠根據(jù)結構化數(shù)據(jù)和非結構數(shù)據(jù)的不同特點,分別提供數(shù)據(jù)倉庫和分布式列式數(shù)據(jù)庫存儲服務,底層支撐技術支持分布式文件系統(tǒng),所有的數(shù)據(jù)可以形成多份副本均勻分布存儲在各個服務節(jié)點的存儲上,保證數(shù)據(jù)可靠性和提高讀寫效率。大數(shù)據(jù)計算引擎要求離線計算引擎(Mapreduce):離線分布式計算作為一個海量結構化數(shù)據(jù)離線處理與分析服務,著力于實時性要求不高的海量數(shù)據(jù)(TB/PB級別)離線處理。支持并行化、容錯、數(shù)據(jù)分布、負載均衡。離線計算引擎需要具有PB級的存儲處理能力和計算吞吐能力,支持多應

12、用多實例并發(fā)同時計算并隔離應用數(shù)據(jù)和程序的能力。支持Mapreduce等批量數(shù)據(jù)分布式計算框架。支持分布式內存計算框架。支持作業(yè)查詢預處理調度算法,可根據(jù)業(yè)務屬性對指定的多個隊列按照優(yōu)先級的配置進行任務的提交。具備高可靠性,支持主控節(jié)點雙機,避免單點故障不可恢復。具備高度可擴展,可動態(tài)增加/削減計算節(jié)點,真正實現(xiàn)彈性計算。 支持離線計算組件界面配置化,可以對配置進行查看和修改,并立刻生效。支持離線計算組件性能指標界面可視化,通過界面實時監(jiān)控組件性能指標。支持多租戶權限管理能力,支持不同用戶之間的資源隔離。支持多應用多實例并發(fā)同時計算并隔離應用數(shù)據(jù)和程序的能力。內存計算引擎(Spark):基于內

13、存的迭代計算框架,適用于需要多次操作特定數(shù)據(jù)集的應用場合。由于中間輸出和結果可以保存在內存中,從而不再需要讀寫分布式文件系統(tǒng),能更好地適用于數(shù)據(jù)挖掘與機器學習等需要迭代的算法。支持作業(yè)查詢預處理調度算法,可以根據(jù)業(yè)務屬性對指定的多個隊列按照優(yōu)先級的配置進行任務的提交。支持審計日志可查詢,在管理運維的界面中可以進行內存計算引擎日志的查詢。支持相關存儲目錄規(guī)整,對內存計算引擎的數(shù)據(jù)目錄進行規(guī)整,修改默認配置,并提供界面上的修改配置的地方。支持配置界面化,能夠在管理運維界面上對內存計算引擎的配置進行查看和修改,并能夠同步到前臺立刻生效。支持通過界面展示性能指標,能夠在界面上查看內存計算引擎的性能指標

14、數(shù)據(jù)。支持on Yarn 等方式,在管理運維界面上安裝服務,可以在安裝的時候,選擇On Yarn等的方式安裝。支持內存計算引擎的Master的HA等,可以對內存計算引擎的master角色進行HA等部署,以保證該節(jié)點的高可用性。實時計算引擎(例如spark streaming、Storm):實時分布式計算需要提供大吞吐量的實時流式數(shù)據(jù)處理。要求保證高可靠性的前提下讓數(shù)據(jù)處理更加實時,具備低延時、容錯和分布計算特性。采用分布式計算框架提供實時計算服務,可按需擴容。支持高并發(fā)低延時的數(shù)據(jù)處理。計算引擎:支持SPARK STREAMING等實時計算框架、STORM分布式流式計算框架兩種計算框架功能。支

15、持對流數(shù)據(jù)的處理,數(shù)據(jù)可以建立關聯(lián)處理。高效處理數(shù)據(jù):支持消息的分流、合流、聚合的消息處理。數(shù)據(jù)按業(yè)務分析,可支持不同的應用接入,并對應不同的應用輸出計算結果。事件監(jiān)測:對數(shù)據(jù)處理低延時,滿足事件監(jiān)控等實時性要求很高的場景。具備高可靠性,支持主控節(jié)點雙機,具備自動容錯能力,避免單點故障不可恢復。支持實時計算組件界面配置化,可以對配置進行查看和修改,配置修改立刻生效。支持實時計算組件性能指標界面可視化,通過界面實時監(jiān)控實時計算組件性能指標。全文搜索引擎(例如solr)提供豐富的查詢語言,同時實現(xiàn)可配置、可擴展并對查詢性能進行優(yōu)化,提供一個完善的功能管理界面??梢詫崿F(xiàn)集中式的配置信息、自動容錯、查

16、詢時自動負載均衡、自動分發(fā)的索引和索引分片和事務日志等多種特色功能??梢詫λ阉饕婕线M行快照,可以周期、定時創(chuàng)建集合快照,對索引數(shù)據(jù)進行備份。提供搜索引擎數(shù)據(jù)切換自動化工具,一鍵式操作實現(xiàn)搜索引擎數(shù)據(jù)從一個集群切換到另外一個集群,安全可靠。提供搜索引擎節(jié)點擴容數(shù)據(jù)重分布自動化工具,搜索引擎節(jié)點擴容后數(shù)據(jù)均勻的重分布到新增節(jié)點上,負載均勻的分擔到各節(jié)點上。支持搜索引擎服務自動拉起功能,提高可靠性。除管理平臺界面手工停止服務之外的異常服務停止后都會自動拉起,保證服務連續(xù)可用。資源管理(例如yarn)資源管理要求能夠實現(xiàn)調度和分配集群的內存和計算等資源給上層應用和服務,能夠管理運行在集群節(jié)點上的任

17、務的生命周期和資源使用,提供靜態(tài)資源池和動態(tài)資源池功能。在多用戶運行環(huán)境中,能夠支持計算額度和訪問控制,作業(yè)優(yōu)先級和資源搶占,達到在保障公平的前提下,有效地共享集群資源。支持VIP隊列管理,支持根據(jù)業(yè)務需要指定作業(yè)在指定的計算節(jié)點上運行,隔離重點任務和普通任務,保障重點任務的物理資源。要求給出詳細的設計方案。資源管理能夠面向海量數(shù)據(jù)處理和大規(guī)模計算類型的復雜應用提供統(tǒng)一的資源管理和調度。提供通用的并行計算框架,要求兼容批量分布式計算、內存分布式計算、流式計算等多種編程模式。具備高可擴展性,支持作業(yè)定點調度,支持優(yōu)先級高的作業(yè)優(yōu)先分配到資源。能夠自動檢測故障和系統(tǒng)熱點,重試失敗任務,保證作業(yè)穩(wěn)定

18、可靠運行完成。支持作業(yè)定點調度,指定作業(yè)在哪些主機上運行,隔離重點任務和普通任務。支持隊列增加優(yōu)先級屬性,優(yōu)先級高的作業(yè)優(yōu)先分配到資源。支持白名單功能,限制客戶端向集群的resourcemanager提交作業(yè)。支持提交權限,限制無權用戶提交作業(yè)并運行。支持隊列屬性修改圖形化,在圖形化界面中配置新增、修改、刪除隊列屬性。支持隊列屬性增加“最大作業(yè)提交數(shù)”屬性,在圖形化界面中新增“最大作業(yè)提交數(shù)”屬性可配置分布式協(xié)作服務(例如Zookeeper)分布式協(xié)作服務提供分布式、高可用的協(xié)作服務,可以用來構建分布式應用。它能為分布式文件系統(tǒng)、分布式列式數(shù)據(jù)庫、離線計算、資源管理與調度、數(shù)據(jù)倉庫等大數(shù)據(jù)組件

19、提供重要的功能支撐。在分布式應用中,通常需要分布式協(xié)作服務來提供可靠的、可擴展的、分布式的、可配置的協(xié)調機制來統(tǒng)一各系統(tǒng)的狀態(tài)。幫助系統(tǒng)避免單點故障,建立可靠的應用程序。 提供分布式協(xié)作服務和維護配置信息。安全管理安全管理能夠提供以用戶為單位的身份認證和授權,能夠對集群數(shù)據(jù)資源和服務進行訪問控制,包括系統(tǒng)用戶、應用用戶的身份和權限管理,日志管理等。運維管理主機管理:可以對已經添加的主機及其運行狀態(tài)進行查詢,可以對單臺主機進行全面監(jiān)控。通過在已添加主機安裝代理,支持通過代理訪問計算集群提供相關組件服務和操作。要求給出詳細的設計方案。服務管理:對大數(shù)據(jù)平臺包含的各個組件服務提供的管理界面,可對各組

20、件運行狀態(tài)進行監(jiān)控,可執(zhí)行啟、停操作;除手動停止服務外,系統(tǒng)監(jiān)測到服務異常終止時可以自動拉起服務,并可以根據(jù)需要打開或關閉自動拉起開關??蓪唧w角色實例進行管理。為避免應用之間在申請組件服務時相互干擾,提升應用的健壯性和可靠性,應支持相同組件的服務既共享物理資源,又相互獨立。要求給出詳細的設計方案。告警管理:告警管理功能包括告警查看、閥值設置。監(jiān)控系統(tǒng)各類異常,在管理界面上實時呈現(xiàn)。支持集群內不同節(jié)點差異化告警閾值設置。系統(tǒng)管理:包括系統(tǒng)配置、巡檢、備份。其中,系統(tǒng)配置包含版本設置和SNMP設置。巡檢功能需要支持自動巡檢和手動巡檢兩種方式。提供備份功能,包含快照和集群間備份。支持服務日志級別動

21、態(tài)調整,支持組件配置項快速查找功能,并且用戶可以根據(jù)需要新增自定義組件配置項。展現(xiàn)界面設計詳細展示大數(shù)據(jù)平臺的運行情況。界面展示內容包括主頁界面、集群界面、主機管理界面、告警管理界面、安裝界面、系統(tǒng)管理界面、日志界面、安全界面等。主頁界面:可以整體查看集群的整體運行狀況,包括主機、服務等資源的數(shù)量、在線情況;運行負載情況;以及告警信息。集群界面:包含服務管理、靜態(tài)資源池、動態(tài)資源池等;其中,服務管理界面提供對大數(shù)據(jù)平臺各組件運行狀態(tài)進行監(jiān)控,可執(zhí)行啟、停操作;靜態(tài)資源池界面和動態(tài)資源池界面可對根據(jù)服務狀態(tài)對資源進行靜態(tài)和動態(tài)調整。主機界面:可以查詢已添加的主機及其運行狀態(tài),也可對單臺主機進行全

22、面監(jiān)控。告警界面:主要包含告警查看和閥值設置。安裝界面:包括安裝集群、安裝主機、安裝服務、機架管理、升級服務、升級主機。系統(tǒng)管理界面:包含巡檢報告、開關設置、版本設置等內容。日志界面:分為操作日志、系統(tǒng)日志、安全日志??梢园凑詹樵儣l件對日志進行查詢操作,并可對日志可以進行分類、刪除、過濾、導出。安全界面:包含部門管理、用戶管理、角色管理等。集群部署及監(jiān)控集群部署與監(jiān)控能夠提供整個云操作系統(tǒng)以及上層應用服務的部署、配置管理以及服務的自檢和自舉。集群部署:支持自動化的安裝部署,使用工具進行自動安裝,簡單快捷。主要功能包括:集群安裝、主機安裝、服務安裝、服務升級、主機升級、機架管理。運行監(jiān)控:可以整

23、體查看大數(shù)據(jù)集群的整體運行狀況。包括主機、服務等資源的數(shù)量、在線情況;運行負載情況;以及告警信息。同時監(jiān)控大數(shù)據(jù)平臺各組件運行狀態(tài)、硬件資源占用情況(硬盤、CPU、內存等)等,如果被監(jiān)控對象出現(xiàn)異常情況,監(jiān)控系統(tǒng)就會在相關管理告警頁面發(fā)出告警通知。(2)大數(shù)據(jù)多維分析查詢系統(tǒng)總體要求大數(shù)據(jù)多維查詢系統(tǒng)要求提供超大數(shù)據(jù)規(guī)模數(shù)據(jù)查詢,支持PB級數(shù)據(jù)量。針對海量數(shù)據(jù)可以進行任意維度的密集計算與檢索, 支持建立OLAP Cube,提供MOLAP能力。支持高并發(fā)、低延時的在線數(shù)據(jù)應用系統(tǒng),能夠提供高并發(fā)的實時計算查詢服務, 對于百億行級別的數(shù)據(jù)可在亞秒級時間返回查詢結果。大數(shù)據(jù)多維查詢系統(tǒng)主要面向傳統(tǒng)架

24、構中OLAP(聯(lián)機分析處理)數(shù)據(jù)訪問場景,利用多維分析技術,針對特定分析主題,設計多種可能的觀察方式,設計相應的分析主題結構,使用戶在多維模型基礎上進行快速、穩(wěn)定、交互式訪問,以達到復雜分析和數(shù)據(jù)預測的作用,實現(xiàn)實時聯(lián)機分析處理的效果,面向高并發(fā)、海量、低延時的業(yè)務場景。 創(chuàng)建數(shù)據(jù)模型系統(tǒng)能夠根據(jù)維度和指標的要求,從現(xiàn)有的數(shù)據(jù)表中選擇可對應維度或指標的字段,將這些字段的信息分別保存在維度表和度量表中。支持層級維度、聯(lián)合維度、可推導維度等維度降維優(yōu)化技術。根據(jù)業(yè)務的聚合需求,支持定義度量的聚合形式,包括SUM、MIN、MAX、COUNT、COUNT_DISTINCT等??啥x分區(qū)類型、分區(qū)列和開

25、始日期等,以支持采用增量構建方式對Cube進行構建。分析查詢處理系統(tǒng)能夠根據(jù)維度指標定義及關聯(lián)關系,提供多維數(shù)據(jù)的分析查詢處理,在查詢過程中能夠分別根據(jù)上鉆、下鉆、切片、切塊、旋轉、TOPN等操作進行相應的處理。支持web頁面向導式模型構建及任務監(jiān)控。支持ANSI SQL查詢標準,對外提供標準的ODBC、 JDBC驅動及REST API接口。(3)大數(shù)據(jù)智能分析系統(tǒng)總體要求大數(shù)據(jù)智能分析系統(tǒng)提供各類數(shù)據(jù)的融合與共享服務,要求集成豐富的數(shù)據(jù)挖掘算法,能夠對海量數(shù)據(jù)提供高效的分析和計算。數(shù)據(jù)分析挖掘引擎支持并行化統(tǒng)計算法和機器學習基礎算法庫,支持的并行化基礎算法,能夠處理大數(shù)據(jù)集。算法庫大數(shù)據(jù)智能

26、分析平臺,需集成豐富的機器學習、數(shù)據(jù)挖掘算法,包括但不限于分類、預測與回歸、聚類、降維、推薦/協(xié)同過濾、相似度等算法,支持對海量數(shù)據(jù)進行高效的分析和計算,支持圖計算和圖挖掘,支持用戶擴展算法庫。聚類分析:集成常用的聚類分析算法對數(shù)據(jù)進行抽象的分組分類。分類分析:在設定好的分類之中,對數(shù)據(jù)進行歸類。關聯(lián)分析:集成常用關聯(lián)分析算法,對數(shù)據(jù)之間的關聯(lián)關系進行分析,得出不同數(shù)據(jù)之間的關聯(lián)關系?;貧w分析:集成常用回歸分析算法。特征分析:集成常用特征分析算法,挖掘數(shù)據(jù)潛在的特征。圖挖掘:基于圖和圖并行計算框架提供圖挖掘工具,主要包含:連通圖、最短路徑、三角關系計數(shù)、社區(qū)關系。智能分析系統(tǒng)數(shù)據(jù)準備:通過對業(yè)

27、務需求分析,搜索所有與業(yè)務對象有關的內部和外部數(shù)據(jù)信息,從中選擇出適用于數(shù)據(jù)挖掘應用的數(shù)據(jù),并進行數(shù)據(jù)預處理。數(shù)據(jù)預處理可以加快分析過程,提高分析結果的精度,針對不同的數(shù)據(jù)類型缺失值的處理各不相同,需要結合業(yè)務場景。數(shù)據(jù)探索:通過統(tǒng)計分析和關聯(lián)分析等手段,能夠深入挖掘多源多維數(shù)據(jù)之間的關聯(lián)性,從不同的維度分析數(shù)據(jù),加深對數(shù)據(jù)的理解,提取可能對業(yè)務結果相關的影響因子,探索發(fā)掘數(shù)據(jù)的內在規(guī)律特征,為分析模型對業(yè)務進行定量與定性的結合分析。數(shù)據(jù)構建:根據(jù)數(shù)據(jù)源類型、業(yè)務要求建立對應的數(shù)據(jù)模型。通過分類、聚類、關聯(lián)、回歸、特征分析等機器學習算法和分析方法,對海量多樣化數(shù)據(jù)進行進行模型構建和數(shù)據(jù)分析挖掘

28、。數(shù)據(jù)模型的設計包括設計和準備數(shù)據(jù)源,數(shù)據(jù)的處理,選取和設計數(shù)據(jù)算法。數(shù)據(jù)模型的建立是一個預定義、評估、優(yōu)化的過程。模型評估:利用評估算法對模型進行評估,評估數(shù)據(jù)分析結果的合理性、合法性,評價模型的優(yōu)劣。根據(jù)分析結果及時調整和優(yōu)化數(shù)據(jù)模型,如果結果不符合預期,需要調整參數(shù)進行機器學習,重新估算。可視化智能分析工具:要求提供可視化智能分析工具,加速數(shù)據(jù)分析模型設計??梢暬悄芊治鎏准閿?shù)據(jù)分析提供直觀的圖形化用戶界面,用于設計分析流程。實現(xiàn)完整的建模步驟,從數(shù)據(jù)加載、匯集、到轉化和準備階段,再到數(shù)據(jù)分析和產生預測階段。 數(shù)據(jù)管理服務平臺數(shù)據(jù)管理服務平臺是一個管理、展現(xiàn)平臺,主要包括

29、:數(shù)據(jù)治理與監(jiān)控系統(tǒng)、數(shù)據(jù)服務集成管理系統(tǒng)和大數(shù)據(jù)展現(xiàn)門戶等。(1)數(shù)據(jù)治理與監(jiān)控系統(tǒng)數(shù)據(jù)治理與監(jiān)控系統(tǒng)是一個數(shù)據(jù)治理和數(shù)據(jù)監(jiān)控的綜合管理系統(tǒng),對數(shù)據(jù)資源中心和大數(shù)據(jù)處理平臺兩大部分數(shù)據(jù)進行治理和管控。數(shù)據(jù)治理按照數(shù)據(jù)全生命周期來管理,要求包含:數(shù)據(jù)源管理、數(shù)據(jù)質量管理、數(shù)據(jù)地圖管理、數(shù)據(jù)血緣管理、數(shù)據(jù)安全管理和元數(shù)據(jù)管理等;數(shù)據(jù)監(jiān)控與數(shù)據(jù)治理相輔相成,實現(xiàn)對數(shù)據(jù)資源的全程監(jiān)控,包括:全局數(shù)據(jù)監(jiān)控、部門數(shù)據(jù)監(jiān)控、數(shù)據(jù)存儲使用監(jiān)控和數(shù)據(jù)異常監(jiān)控等內容。數(shù)據(jù)標準管理術語標準管理: 包括限定詞、同義詞、術語等信息庫的管理。元數(shù)據(jù)管理:元數(shù)據(jù)記錄了數(shù)據(jù)源的結構信息,有了元數(shù)據(jù)才能對數(shù)據(jù)源進行各種操作,

30、元數(shù)據(jù)管理需要提供對各數(shù)據(jù)源的元數(shù)據(jù)進行注冊,加載,查看等功能。數(shù)據(jù)源管理:數(shù)據(jù)源管理包括:基礎環(huán)境的管理、標準編碼管理等?;A環(huán)境管理:基礎環(huán)境配置管理用于進行一些基礎信息的配置,包括:源、目標數(shù)據(jù)源的配置、標準數(shù)據(jù)庫表結構配置及其編碼表的配置等。標準編碼表管理用于對數(shù)據(jù)中心數(shù)據(jù)涉及的編碼表及其編碼項進行定義。數(shù)據(jù)處理管理提供完善的數(shù)據(jù)處理功能,如數(shù)據(jù)清洗、數(shù)據(jù)比對、數(shù)據(jù)加載、數(shù)據(jù)轉換、數(shù)據(jù)共享等功能。數(shù)據(jù)規(guī)則與質量管理數(shù)據(jù)質量監(jiān)控是根據(jù)預設的規(guī)則來檢測數(shù)據(jù)中的質量問題,檢測規(guī)則可自主配置,也可以自主編寫規(guī)則表達式。數(shù)據(jù)質量監(jiān)控與系統(tǒng)調度關聯(lián)使用,發(fā)現(xiàn)臟數(shù)據(jù),避免錯誤的數(shù)據(jù)流入下游應用。數(shù)據(jù)

31、地圖數(shù)據(jù)全局視圖:展示從外部源到內部庫,到輸出數(shù)據(jù)庫的數(shù)據(jù)整體流向,展示類別數(shù)目、庫數(shù)目、表數(shù)目、分別統(tǒng)計庫、表、字段、作業(yè)、任務等數(shù)量。從表數(shù)目和數(shù)據(jù)存儲量的角度展示數(shù)據(jù)庫中按月度變化的動態(tài)信息,以直觀的圖形化進行動態(tài)展示。并且可以區(qū)分不同部門進行統(tǒng)計。數(shù)據(jù)動態(tài)分布:從表數(shù)目和數(shù)據(jù)存儲量的角度展示數(shù)據(jù)倉庫中按月度變化的動態(tài)信息,以直觀的圖形化進行動態(tài)展示。并且可以區(qū)分不同部門或者租戶進行統(tǒng)計。數(shù)據(jù)血緣:數(shù)據(jù)血緣以歷史事實的方式記錄每項數(shù)據(jù)的來源,處理過程,應用對接情況等,記錄了數(shù)據(jù)表在治理過程中的全鏈血緣關系。數(shù)據(jù)血緣就是通過對數(shù)據(jù)處理的全過程追蹤,找到以某個數(shù)據(jù)對象為起點的所有與該對象相關

32、的元數(shù)據(jù)和它們之間關系的一種技術手段。(2)數(shù)據(jù)服務集成管理系統(tǒng)搭建基于企業(yè)服務總線(ESB)的服務集成管理系統(tǒng),構建數(shù)據(jù)服務的統(tǒng)一通信通道,即使在協(xié)議不同、格式不同、標準不同的情況下,服務與對接服務之間都可以實現(xiàn)交互通信,傳遞消息,以便實現(xiàn)服務集成管理目標,從而實現(xiàn)各類數(shù)據(jù)服務的統(tǒng)一管理,面向政府用于、企業(yè)、公眾、開發(fā)者,提供便捷的數(shù)據(jù)服務。具體包括:服務注冊與發(fā)布提供服務定義、注冊、審核和發(fā)布功能,發(fā)布前可以對服務的配置參數(shù)進行審核與修改,配置通道,發(fā)布后,自動生成/更新對應服務的配置文件(如WSDL),連同服務參數(shù)配置,更新至服務目錄中;提供對注冊/發(fā)布服務的連通性測試;服務生命周期管理

33、提供服務的注冊、變更、下線的申請、審核、復核功能,檢查和確認服務狀態(tài)以執(zhí)行變更、下線;根據(jù)服務優(yōu)化管理中的服務拓撲分析,調整服務層級分類或整合服務,以實現(xiàn)優(yōu)化;提供服務版本的管理;流程管理支持服務申請、服務變更、服務下線等服務生命周期管理中相關流程的管理功能;服務目錄管理提供服務目錄的瀏覽和檢索;提供服務目錄/服務定義/服務狀態(tài)的查詢和管理,包括權限的過濾和管理;接入系統(tǒng)管理設置和管理服務請求方和接入請求系統(tǒng)的映射關系;設置和管理服務提供方和接入服務系統(tǒng)的映射關系;設置和管理服務請求方、服務提供方在服務治理系統(tǒng)的用戶映射關系;接口數(shù)據(jù)管理提供數(shù)據(jù)字典的定義和管理,提供服務方法接口和數(shù)據(jù)字典字段

34、的映射關系設置。(3)大數(shù)據(jù)展現(xiàn)門戶大數(shù)據(jù)展現(xiàn)門戶是智慧園區(qū)大數(shù)據(jù)中心對外服務窗口,門戶包括兩個方面:政務數(shù)據(jù)資源門戶(內部數(shù)據(jù)門戶)和公眾數(shù)據(jù)門戶(外部數(shù)據(jù)門戶)。政務數(shù)據(jù)資源門戶作為大數(shù)據(jù)管理部門信息發(fā)布和資源服務的總管理入口,為各級政府部門提供信息資源展示、在線信息服務、信息檢索、系統(tǒng)集成訪問等功能。另外,針對系統(tǒng)管理員、各級領導、政務用戶的不同應用需求,提供個性化工作臺。公眾數(shù)據(jù)門戶提供政務部門可公開各類數(shù)據(jù)的下載與服務,為企業(yè)和個人開展政務信息資源的社會化開發(fā)利用提供數(shù)據(jù)支撐,推動信息資源增值服務業(yè)的發(fā)展以及相關數(shù)據(jù)分析與研究工作的開展。政務數(shù)據(jù)資源門戶門戶基本管理:政務數(shù)據(jù)資源門戶

35、主要是提供政務大數(shù)據(jù)中心數(shù)據(jù)成果的展示和應用訪問入口的應用集成。提供單點登錄、訪問權限管理,后臺內容管理等功能。在線查詢服務:針對政務數(shù)據(jù)中心,開發(fā)高效率的在線查詢服務。人口信息、法人信息、宏觀經濟、信用信息等面向政府部門提供信息服務,空間地理信息服務包括地圖基本操作、地圖測量、圖層控制、空間分析以及相關數(shù)據(jù)融合等信息服務功能。信息資源綜合展示:能通過可視化的方式展示區(qū)域內信息資源的全景,即:部門信息資源的分布情況,需求情況、使用情況,需要按照不同視角進行呈現(xiàn),要求包含但不限于:資產總體視圖、組織機構視角、服務對象視角、信息資源視角、協(xié)同主題視角。用戶交流模塊:為用戶提供交流的手段,每個授權用

36、戶都可以在交流板塊上提出問題、見解或者是進行討論,針對交流的問題可以選擇是否公開。用戶幫助模塊:為用戶提供平臺功能及其操作方法的介紹和幫助說明,使各級用戶盡快掌握使用方法。公眾數(shù)據(jù)門戶為了實現(xiàn)政務數(shù)據(jù)對社會的開放,帶動大數(shù)據(jù)產業(yè)發(fā)展,利用政務大數(shù)據(jù)促進信息產業(yè)創(chuàng)業(yè)創(chuàng)新,建設數(shù)據(jù)對外開放的門戶,實現(xiàn)政務大數(shù)據(jù)的對外開放。針對公眾數(shù)據(jù)門戶將要充分利用政府門戶網站,在現(xiàn)有的門戶網站上開辟一個政務數(shù)據(jù)開放的入口,點擊后即可進入公眾數(shù)據(jù)門戶。公眾數(shù)據(jù)門戶的主要功能有:資源目錄、數(shù)據(jù)開放接口、APP應用、互動交流等。資源目錄:社會公眾可以通過資源目錄查找到需要的數(shù)據(jù),找到相應數(shù)據(jù)的獲取方式,數(shù)據(jù)可以是通過

37、下載方式獲取也可以通過數(shù)據(jù)接口的方式獲取,無論哪種方式都需要用戶注冊認證后才可以獲取。用戶可以通過數(shù)據(jù)資源主題的方式查找,也可以用戶數(shù)據(jù)來源各部門的方式查找。數(shù)據(jù)開放接口:用戶可以通過此功能查找到可以調用的數(shù)據(jù)接口,并可以查找到數(shù)據(jù)接口的調用方式、說明文檔、代碼示例等相關內容,通過功能應用開發(fā)人員可以方便的通過數(shù)據(jù)接口獲取所需要的數(shù)據(jù)。互動交流:互動交流功能是網站用戶與網站管理人員進行互動交流的模塊,在這里網站管理人員可以將網站的使用說明和一些常遇到的問題及解決方法公布出來,網站管理人員也可以在此公布調查問卷,征求普通用戶的意見。同時,普通用戶也可以在這里提出自己的疑問,讓管理人員進行解答。1

38、.2 設計方案1.2.1 總體平臺設計 總體架構智慧園區(qū)大數(shù)據(jù)平臺的核心是建立面向宏觀經濟發(fā)展、社會公共服務的數(shù)據(jù)庫和數(shù)據(jù)服務??傮w架構由支撐體系(標準規(guī)范支撐體系、管理運行維護支撐體系、安全支撐體系)、網絡系統(tǒng)、信息共享平臺軟硬件系統(tǒng)環(huán)境、數(shù)據(jù)庫體系(中心交換庫、基礎數(shù)據(jù)庫、主題庫、發(fā)布庫、宏觀經濟數(shù)據(jù)庫管理系統(tǒng)、元數(shù)據(jù)庫系統(tǒng))、應用系統(tǒng)(數(shù)據(jù)交換處理系統(tǒng)、應用支撐系統(tǒng)、數(shù)據(jù)綜合分析系統(tǒng))組成。圖 大數(shù)據(jù)平臺總體架構圖信息共享平臺通過網絡收集統(tǒng)計系統(tǒng)和各共建部門的信息資源,并有效地將這些信息資源進行分類整理,實現(xiàn)跨部門、跨行業(yè)的宏觀經濟管理信息共享,并向用戶提供數(shù)據(jù)服務;數(shù)據(jù)庫

39、體系:由元數(shù)據(jù)控制,實現(xiàn)數(shù)據(jù)的交換、存儲和發(fā)布,整合共建單位現(xiàn)有信息資源,構建主題庫和發(fā)布庫,為數(shù)據(jù)服務提供支持。 體系結構圖智慧園區(qū)公共基礎數(shù)據(jù)庫信息共享平臺劃分為工作(生產)區(qū)、發(fā)布(共享)區(qū)和互聯(lián)網信息發(fā)布區(qū)。在工作(生產)區(qū)構建宏觀經濟數(shù)據(jù)的采集、整合、處理和存儲系統(tǒng);在發(fā)布(共享)區(qū)構建宏觀經濟數(shù)據(jù)的發(fā)布與共享、存儲與備份和專網門戶系統(tǒng)等環(huán)境支撐系統(tǒng);在互聯(lián)網信息發(fā)布區(qū)構建互聯(lián)網門戶系統(tǒng),為社會公眾提供宏觀經濟信息服務。如下圖表所示:圖 園區(qū)大數(shù)據(jù)平臺體系結構圖 總體流程圖智慧園區(qū)大數(shù)據(jù)平臺采用在線填報、數(shù)據(jù)庫對接和基于消息的數(shù)據(jù)交換三種采集方式,集中采集

40、、整合、存儲各共建部門指標數(shù)據(jù)。中心交換數(shù)據(jù)庫存儲各共建部門交換來的原貌數(shù)據(jù),基礎數(shù)據(jù)庫是對原貌數(shù)據(jù)進行審核轉換和加工而成,是主題數(shù)據(jù)庫和發(fā)布庫構成的基礎。元數(shù)據(jù)庫對數(shù)據(jù)的采集交換、整合、存儲、分析和發(fā)布全過程進行定義和約束。專網和互聯(lián)網的用戶可通過門戶系統(tǒng),分別對發(fā)布(共享)區(qū)和互聯(lián)網信息發(fā)布區(qū)的數(shù)據(jù)進行訪問。智慧園區(qū)大數(shù)據(jù)平臺總體流程圖如下:圖 園區(qū)大數(shù)據(jù)平臺總體流程圖1.2.2 人口基礎數(shù)據(jù)庫設計在沒有數(shù)據(jù)標準的情況下,人口基礎數(shù)據(jù)庫數(shù)據(jù)中心對同一個數(shù)據(jù)字段可以從多個數(shù)據(jù)來源采集數(shù)據(jù)。如:婚姻狀態(tài)字段可以從計生部門和公安部門采集。對于同一個數(shù)據(jù)字段,中心對于該數(shù)據(jù)字段保存多個來源的版本。

41、人口基礎數(shù)據(jù)管理系統(tǒng)提供工具、服務來展現(xiàn)數(shù)據(jù)的不一致性,數(shù)據(jù)管理員根據(jù)工作制度,對數(shù)據(jù)字段進行電話等多種手段核實字段的真實數(shù)值。中心通過數(shù)據(jù)交換系統(tǒng)以數(shù)據(jù)服務的方式從各業(yè)務部門采集數(shù)據(jù),保存到公共數(shù)據(jù)緩存庫,使用人口基礎數(shù)據(jù)管理維護系統(tǒng)進行數(shù)據(jù)比對、沖突檢查、數(shù)據(jù)審核、數(shù)據(jù)轉換。當數(shù)據(jù)達到一致性、完整性要求時,數(shù)據(jù)將由公共數(shù)據(jù)緩存庫轉存到人口基礎數(shù)據(jù)發(fā)布庫中,并通過數(shù)據(jù)交換系統(tǒng)以訂閱/發(fā)布的方式提供給各業(yè)務部門使用。人口基礎數(shù)據(jù)管理系統(tǒng)維護一個面向對象的公共數(shù)據(jù)模型,公共數(shù)據(jù)模型是公共數(shù)據(jù)標準規(guī)范的實現(xiàn)。公共數(shù)據(jù)維護系統(tǒng)控制著公共數(shù)據(jù)的輸入和輸出,為數(shù)據(jù)質量把關。人口基礎信息綜合查詢系統(tǒng)采用B

42、/S結構,客戶端采用瀏覽器,用戶界面是實現(xiàn)不同功能的網頁。綜合查詢系統(tǒng)的操作頁面要求易于使用,使用戶能夠方便快捷的對網頁提供的各項功能進行操作。采用菜單樹的方式展開系統(tǒng)的功能。人口基礎信息綜合查詢系統(tǒng)可以有針對性地,按照用戶授權的不同,為不同用戶提供不同層次的人口資源公共查詢服務。人口基礎信息功能如下圖所示。人口基礎數(shù)據(jù)庫管理應用系統(tǒng)功能模塊列表:編號一級模塊二級模塊三模塊1系統(tǒng)管理用戶角色管理系統(tǒng)帳戶管理2角色信息管理3部門帳戶管理公安帳戶管理4社保帳戶管理5衛(wèi)生帳戶管理6計生帳戶管理7民政帳戶管理8系統(tǒng)監(jiān)控管理系統(tǒng)日志管理9系統(tǒng)網絡布局10部門交換頻率11接收處理接收數(shù)據(jù)查看接收公安數(shù)據(jù)1

43、2接收社保數(shù)據(jù)13接收衛(wèi)生數(shù)據(jù)14接收計生數(shù)據(jù)15接收民政信息16清洗比對管理清洗規(guī)則管理17比對規(guī)則管理18清洗比對結果清洗結果查看19比對結果查看20手工比對歷史21手工比對管理手工比對信息22手工比對歷史23反饋信息查看反饋信息列表24授權管理數(shù)據(jù)授權管理申請查看授權25查看授權申請26數(shù)據(jù)交換申請數(shù)據(jù)交換申請27交換申請列表28交換審批列表29信息服務人口信息服務人口信息查詢30人口碼表信息人口碼表信息31人口共享指標可共享指標32統(tǒng)計分析基礎信息統(tǒng)計人口性別統(tǒng)計33人口年齡統(tǒng)計34人口文化程度35人口民族統(tǒng)計36地區(qū)分布統(tǒng)計地區(qū)人口統(tǒng)計37人員參保分析社保人員情況38參合人員情況39

44、計劃生育分析地區(qū)育齡分布40育齡婦女比例 數(shù)據(jù)接收服務接收數(shù)據(jù)的查詢是針對各部門交換匯總的信息,進行以部門為單位的信息查詢。通過查詢工作,可以了解各部門實際提交的信息情況,并實現(xiàn)信息詳查和統(tǒng)計工作。系統(tǒng)提供了按部門查詢的查詢方式。 中心數(shù)據(jù)查詢人口中心數(shù)據(jù),就是經過數(shù)據(jù)比對梳理完成的人口基礎信息。針對人口信息量大,涵蓋范圍廣、內容繁雜的特點,在人口基礎信息中心數(shù)據(jù)庫設計中,采用信息擴展和關聯(lián)的方法,逐級分領域和部門展示人口基礎信息和擴展信息。如下圖所示。圖 人口基礎信息關聯(lián)設計系統(tǒng)根據(jù)部門需求進行查詢分類,各部門根據(jù)本部門業(yè)務相關信息進行檢索。如公安部門可根據(jù)身份證

45、號、姓名、性別、民族為檢索條件,進行基本信息的查詢;可根據(jù)姓名、暫住證號、身份證號為檢索條件,進行暫住人口信息的查詢操作。其他部門檢索與查詢操作類似。 決策支持子系統(tǒng)決策支持子系統(tǒng)是根據(jù)業(yè)務需要,基于人口基礎信息,進行數(shù)據(jù)挖掘,實現(xiàn)統(tǒng)計報表操作,為領導決策提供快速的報表支持。查詢列表如下圖所示。圖 決策支持子系統(tǒng)查詢列表 授權管理授權管理,就是提供信息需求部門申請查詢授權,信息提供部門審批授權的功能。申請部門選擇對應的信息表,向信源部門提出申請;信源部門根據(jù)業(yè)務規(guī)則,對申請部門提供授權或不授權,此外,授權功能提供時限控制和授權使用次數(shù)控制。 數(shù)據(jù)清洗比

46、對管理數(shù)據(jù)比對系統(tǒng)通過數(shù)據(jù)比對引擎,實現(xiàn)對人口基礎信息的比對工作。 依據(jù)的業(yè)務需要,數(shù)據(jù)比對包括比對操作,各部門數(shù)據(jù)的過濾查詢,各部門信息比對入庫結果查詢。人口基礎信息的比對,依據(jù)其特點,采用自動比對和人工參與比對結合的方式,實現(xiàn)基礎信息的比對功能。數(shù)據(jù)過濾查詢是針對部門提交的數(shù)據(jù),進行梳理過濾與清洗,得出的清洗出的問題數(shù)據(jù)進行查詢操作。與數(shù)據(jù)過濾查詢類似,數(shù)據(jù)入庫查詢是將部門信息與人口基礎信息總表信息進行比對,并經過相關部門審批確認,比對出現(xiàn)差異錯誤信息的查詢。 信息核驗結合比對系統(tǒng)人工比對功能,提供部門提出比對結果意見功能。當部門業(yè)務信息進入比對系統(tǒng)后,如出現(xiàn)基礎信息庫和業(yè)務

47、應用源頭部門信息不匹配,需要業(yè)務人員參與的情況下,提供業(yè)務部門信息核驗功能。 系統(tǒng)管理系統(tǒng)管理功能是實現(xiàn)對使用人口基礎信息查詢系統(tǒng)的用戶進行管理。人口基礎信息綜合查詢系統(tǒng)提供用戶、角色、權限的設定。即每個申請的用戶,根據(jù)其角色,享有角色指定的權限。系統(tǒng)管理員可以根據(jù)用戶情況,賦予固定角色。系統(tǒng)管理員可制定新增用戶指定角色以及分配權限。系統(tǒng)管理分為用戶管理和角色管理。(1)用戶管理:管理系統(tǒng)用戶,以及給系統(tǒng)用戶分配角色和權限。(2)角色管理:角色管理是對每個角色進行查詢,并分配相應權限,系統(tǒng)管理員可以根據(jù)角色權限,以及每個用戶的允許查詢權限為用戶授權。1.2.3 法人基礎數(shù)據(jù)庫設計

48、法人基礎數(shù)據(jù)庫系統(tǒng)實現(xiàn)法人基礎數(shù)據(jù)查詢、統(tǒng)計和管理等功能的應用系統(tǒng)。系統(tǒng)主要功能包括:法人基礎信息管理應用系統(tǒng)功能模塊列表:編號一級模塊二級模塊三級模塊1系統(tǒng)管理用戶角色管理系統(tǒng)帳戶管理2角色信息管理3部門帳戶管理市場監(jiān)管帳戶管理4民政帳戶管理5地稅帳戶管理6國稅帳戶管理7系統(tǒng)監(jiān)控管理系統(tǒng)日志管理8系統(tǒng)網絡布局9部門交換頻率10接收處理接收數(shù)據(jù)查看接收工商數(shù)據(jù)11接收質監(jiān)數(shù)據(jù)12接收民政數(shù)據(jù)13接收地稅數(shù)據(jù)14接收國稅信息15清洗比對管理清洗規(guī)則管理16比對規(guī)則管理17清洗比對結果清洗結果查看18比對結果查看19手工比對歷史20手工比對管理手工比對信息21手工比對歷史22部門數(shù)據(jù)比對工商有質監(jiān)

49、無23授權管理數(shù)據(jù)授權管理申請查看授權24查看授權申請25數(shù)據(jù)交換申請數(shù)據(jù)交換申請26交換申請列表27交換審批列表28共享信息管理信息公開管理29信息管理日志30信息服務法人信息服務法人信息查詢31部門信息統(tǒng)計部門信息總數(shù)32法人碼表信息法人碼表信息33統(tǒng)計分析基礎信息統(tǒng)計企業(yè)增長趨勢34行業(yè)類型統(tǒng)計行業(yè)類型統(tǒng)計35企業(yè)類型統(tǒng)計企業(yè)類型統(tǒng)計36部門數(shù)據(jù)差異部門數(shù)據(jù)差異 系統(tǒng)管理管理系統(tǒng)用戶,以及給系統(tǒng)用戶分配權限,其中包括用戶角色管理、角色信息管理、部門賬戶管理、系統(tǒng)日志管理、系統(tǒng)網絡布局查看以及部門交換頻率查看。如下圖所示: 授權服務法人基礎數(shù)據(jù)庫系統(tǒng)設計原則遵循

50、“誰提供誰維護”的原則,在中心形成的法人基礎數(shù)據(jù)庫中的法人信息,對于公開開放的數(shù)據(jù),不需要經過部門授權就可以查看,但對于部門未開放或者指定對象開放的數(shù)據(jù),其他部門需要查詢該部門的數(shù)據(jù)需要向數(shù)據(jù)提供部門提出申請,在申請通過后,才可在授權允許的范圍內進行查詢。授權服務主要功能包括:(1)數(shù)據(jù)授權管理:通過申請查看授權向數(shù)據(jù)提供部門提出查詢申請,信息所屬部門可以對其他部門對本部門信息提請的查看申請進行審批授權??梢栽O置授權的查看次數(shù)和有效期限,也可以永久授權。(2)數(shù)據(jù)交換申請:如果部門希望其他部門數(shù)據(jù)交換到本部門,通過數(shù)據(jù)交換申請向數(shù)據(jù)所屬部門發(fā)送申請,申請得到授權后,通過自主交換的方式將數(shù)據(jù)交換

51、到本部門的指定數(shù)據(jù)庫內。(3)共享信息管理:部門設置信息共享的級別,包括:授權開放、公眾開放、部門開放等。同時通過信息管理日志查看用戶的操作記錄,以確保信息的安全。 接收服務提供中心接收到各部門原始數(shù)據(jù)的查詢功能,以及數(shù)據(jù)的清洗比對功能,具體功能包括:n 接收數(shù)據(jù)查看:查詢中心接收到各部門發(fā)送的原始數(shù)據(jù)。清洗比對管理:管理和維護各個部門提供的原始數(shù)據(jù)的清洗和比對規(guī)則。可以增加、刪除及保存規(guī)則。在系統(tǒng)后臺會根據(jù)制定的規(guī)則來對接收的數(shù)據(jù)進行清洗和比對處理。清洗比對結果:可以根據(jù)清洗和比對批次、時間段等條件查詢清洗和比對結果,如比對成功和不成功的數(shù)據(jù)量及所占比例,以及未匹配數(shù)據(jù)的詳細數(shù)

52、據(jù)和未匹配成功的原因(如企業(yè)注冊號相同,企業(yè)名稱不同等)。手工比對管理:對于通過比對規(guī)則比對不一致的數(shù)據(jù),通過手工比對管理進行手工比對,比對一致的,通過手工操作更新中心法人信息庫,比對仍不一致的,反饋到未匹配數(shù)據(jù)表,通過交換平臺反饋相關部門進行核查。手動比對管理主要解決數(shù)據(jù)比較特殊,無法制定通用比對規(guī)則的數(shù)據(jù)之間的比對。部門數(shù)據(jù)比對:進行部門間的數(shù)據(jù)比對,如工商有質監(jiān)無的數(shù)據(jù)、工商有國稅無、工商有地稅無、質監(jiān)有國稅無、質監(jiān)有社保無、國稅有社保無等。 信息服務根據(jù)查詢條件或者組合條件查詢法人信息,返回的結果為清洗比對后的準確數(shù)據(jù),對于需要授權的數(shù)據(jù),需要先通過授權服務進行授權申請。

53、具體功能包括:(1)法人信息服務:查詢法人信息,用戶也可按條件查詢。(2)部門信息統(tǒng)計:查看各部門法人信息的數(shù)據(jù)總量。(3)法人碼表信息:對于有國家標準的代碼表,均會轉換成國家標準的代碼存入法人基礎信息庫,如行業(yè)類別、法定代表人性別等,對于部門專有的代碼表,通過法人碼表信息列出,供其他部門下載和使用。 統(tǒng)計分析提供報表統(tǒng)計功能,結合各類基礎信息,形成各類報表,提供多種統(tǒng)計功能,輔助領導決策。提供列表、折線圖和柱狀圖等多種展示方式,統(tǒng)計內容主要包括:基礎信息統(tǒng)計、行業(yè)類型統(tǒng)計、企業(yè)類型統(tǒng)計、部門數(shù)據(jù)差異統(tǒng)計等。1.2.4 地理信息基礎數(shù)據(jù)庫設計 基礎數(shù)據(jù)(1) 遙感影

54、像數(shù)據(jù)本項目是XX高新區(qū)主要區(qū)域影像數(shù)據(jù),建設范圍為30平方公里。(2) 遙感影像數(shù)據(jù)處理Ø 幾何校正,正射校正遙感影像在獲取過程中,受到如大氣吸收與散射、傳感器定標、地形等因素的影響,且它們會隨時間的不同而有所差異。因此,在多時相遙感影像中,除了地物的變化會引起影像中輻射值的變化外,不變的地物在不同時相影像中的輻射值也會有差異。利用多時相遙感影像的光譜信息來檢測地物變化狀況的動態(tài)監(jiān)測,其重要前提是要消除不變地物的輻射值差異。Ø 數(shù)據(jù)融合數(shù)據(jù)融合實質上是將高分辨率影像空間特征與低分辨率影像多光譜特征組合到一副影像,使得融合后影像即具有高分辨率影像空間特征,又具有低分辨率影像

55、多光譜特征。Ø 數(shù)據(jù)裁剪與鑲嵌a. 鑲嵌當研究區(qū)超出單幅遙感影像所覆蓋的范圍時,通常需要將兩幅或多幅影像拼接起來形成一幅或一系列覆蓋全區(qū)的較大的影像。在進行影像的鑲嵌時,需要確定一幅參考影像,參考影像將作為輸出鑲嵌影像的基準,決定鑲嵌影像的對比度匹配、以及輸出影像的像元大小和數(shù)據(jù)類型等。鑲嵌得兩幅或多幅影像選擇相同或相近的成像時間,使得影像的色調保持一致。但接邊色調相差太大時,可以利用直方圖均衡、色彩平滑等使得接邊盡量一致,但用于變化信息提取時,相鄰影像的色調不允許平滑,避免信息變異。b. 裁剪影像裁剪的目的是將研究之外的區(qū)域去除,常用的是按照行政區(qū)劃邊界或自然區(qū)劃邊界進行影像的分幅裁剪。 Ø 圖像增強圖像增強是指按特定的需要突出一幅圖像中的某些信息,同時削弱或去除某些不需要信息的處理方法,其目的是使得處理后的圖像對某種特定的應用,比原始圖像更合適。處理的結果使圖像更適應于人的視覺特性或機器的識別系統(tǒng)。圖像增強主要可分為三類:頻域圖像增強方法、小波域圖像增強方法、空域圖像增強方法。Ø 勻光勻色

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論