版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理項(xiàng)目解
決方案
目錄
1系統(tǒng)總體設(shè)計(jì)................................................................1
1.1云計(jì)算系統(tǒng)設(shè)計(jì)方案概述.............................................1
1.1.1系統(tǒng)基本需求及功能..............................................1
1.1.2主要建設(shè)目標(biāo)和建設(shè)原則.........................................2
1.1.3系統(tǒng)的主要技術(shù)特點(diǎn).............................................2
1.1.4系統(tǒng)的主要性能指標(biāo).............................................3
1.2系統(tǒng)總體構(gòu)架.......................................................5
1.2.1系統(tǒng)基本組成與構(gòu)架.............................................5
1.2.2系統(tǒng)功能構(gòu)架....................................................5
1.2.3系統(tǒng)總體構(gòu)架與功能模塊........................................10
1.3系統(tǒng)基本功能與處理方案.............................................11
1.3.1交管數(shù)據(jù)入庫功能與處理方案....................................11
1.3.2數(shù)據(jù)存儲(chǔ)功能與處理方案........................................13
1.3.3查詢分析功能與處理方案........................................14
1.4系統(tǒng)可靠性與擴(kuò)展性................................................15
1.4.1系統(tǒng)可靠性.....................................................15
1.4.2系統(tǒng)擴(kuò)展性.....................................................17
1.5系統(tǒng)設(shè)計(jì)性能.......................................................18
1.5.1交管數(shù)據(jù)流量處理能力...........................................18
1.5.2數(shù)據(jù)存儲(chǔ)能力...................................................18
1.5.3查詢分析計(jì)算性能...............................................19
1.6定制開發(fā)方案.......................................................19
2硬件云平臺(tái)建設(shè)方案.........................................................22
2.1管理控制臺(tái)服務(wù)器詳細(xì)指標(biāo)..........................................22
3軟件系統(tǒng)設(shè)計(jì)與關(guān)鍵技術(shù)方法................................................24
3.1系統(tǒng)軟件平臺(tái).......................................................24
3.2歷史數(shù)據(jù)匯聚上報(bào)處理流程..........................................24
3.3實(shí)時(shí)數(shù)據(jù)入庫流程...................................................25
3.4數(shù)據(jù)存儲(chǔ)子系統(tǒng).....................................................26
3.4.1海量數(shù)據(jù)分布式數(shù)據(jù)存儲(chǔ)構(gòu)架....................................26
3.4.2適應(yīng)應(yīng)用需求的混合存儲(chǔ)策略....................................28
3.4.3分布式云存儲(chǔ)數(shù)據(jù)存儲(chǔ)..........................................28
3.4.4數(shù)據(jù)立方數(shù)據(jù)存儲(chǔ)...............................................32
3.4.5Database數(shù)據(jù)存儲(chǔ).............................................34
3.4.6數(shù)據(jù)存儲(chǔ)的可靠性...............................................36
3.4.7數(shù)據(jù)壓縮.......................................................37
3.5數(shù)據(jù)查詢與統(tǒng)計(jì)分析子系統(tǒng)..........................................39
3.5.1數(shù)據(jù)查詢與統(tǒng)計(jì)分析系統(tǒng)基本構(gòu)架................................39
3.5.2交管數(shù)據(jù)查詢功能與用戶界面....................................39
3.5.3實(shí)時(shí)報(bào)警功能與用戶界面........................................40
3.5.4車輛軌跡回放功能與用戶界面....................................41
3.6基于云方案的交管數(shù)據(jù)查詢索引與查詢優(yōu)化技術(shù).......................41
3.6,1基于分布式數(shù)據(jù)庫的交管數(shù)據(jù)查詢索引處理方案...................41
3.7交管數(shù)據(jù)處理集群的可靠性與負(fù)載均衡設(shè)計(jì)...........................42
3.7.1負(fù)載均衡處理機(jī)的單點(diǎn)失效容錯(cuò)處理.............................42
3.7.2查詢處理機(jī)的單點(diǎn)失效容錯(cuò)處理..................................46
3.8計(jì)算與存儲(chǔ)集群的可靠性與負(fù)載均衡設(shè)計(jì).............................47
3.8.1計(jì)算與存儲(chǔ)集群Master單點(diǎn)失效容錯(cuò)處理........................47
3.8.2計(jì)算與存儲(chǔ)集群的負(fù)載均衡處理..................................53
3.8.3分布式云存儲(chǔ)的可靠性設(shè)計(jì)......................................56
3.8.4數(shù)據(jù)立方可靠性設(shè)計(jì)............................................58
3.8.5分布式云處理計(jì)算可靠性設(shè)計(jì)....................................60
3.9查詢統(tǒng)計(jì)計(jì)算可靠性與負(fù)載均衡設(shè)計(jì).................................62
3.9.1基于Zookeeper的單點(diǎn)失效和負(fù)載均衡設(shè)計(jì).......................62
3.10系統(tǒng)安全性設(shè)計(jì)....................................................64
3.10.1安全保障體系框架...........................................64
3.10.2云計(jì)算平臺(tái)的多級(jí)信任保護(hù)..................................66
3.10.3基于多級(jí)信任保護(hù)的訪問控制................................70
3.10.4云平臺(tái)安全審計(jì)............................................72
3.10.5云計(jì)算綜合安全網(wǎng)關(guān)........................................76
4實(shí)施方案....................................................錯(cuò)誤!未定義書簽。
4.1時(shí)間進(jìn)度............................................錯(cuò)誤!未定義書簽。
4.2測(cè)試和驗(yàn)收..........................................錯(cuò)誤!未定義書簽。
4.3技術(shù)支持服務(wù)........................................錯(cuò)誤!未定義書簽。
4.4培訓(xùn)服務(wù)............................................錯(cuò)誤!未定義書簽。
圖表1"3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的基本組成與構(gòu)架...............5
圖表2"3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)總體構(gòu)架與功能模塊圖..........10
圖表3"3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)架構(gòu)..........................12
圖表4數(shù)據(jù)存儲(chǔ)處理架構(gòu)....................................................13
圖表5交管數(shù)據(jù)接入........................................................14
圖表6分布式文件存儲(chǔ)系統(tǒng)吞吐量指標(biāo).......................................19
圖表7系統(tǒng)軟件結(jié)構(gòu)........................................................24
圖表8數(shù)據(jù)匯聚上報(bào)處理流程................................................25
圖表9實(shí)時(shí)數(shù)據(jù)入庫流程....................................................25
圖表10分布式計(jì)算流程.....................................................26
圖表11分布式云計(jì)算結(jié)構(gòu)...................................................27
圖表12分布式云存儲(chǔ)結(jié)構(gòu)...................................................30
圖表13分布式云存儲(chǔ)Namenode,DataNode和客戶端們之間的交互............32
圖表14分布式云存儲(chǔ)數(shù)據(jù)壓縮與組織........................................38
圖表15數(shù)據(jù)查詢子系統(tǒng)構(gòu)架.................................................39
圖表16用戶界面圖.........................................................40
圖表17實(shí)時(shí)報(bào)警功能.......................................................40
圖表18車輛軌跡回放.......................................................41
圖表19負(fù)載均衡機(jī)分布圖...................................................43
圖表20負(fù)載均衡機(jī)宕機(jī)預(yù)案.................................................44
圖表21Master節(jié)點(diǎn)宕機(jī)預(yù)案................................................45
圖表22查詢處理單點(diǎn)失效容錯(cuò)處理..........................................46
圖表23Master單點(diǎn)失效容錯(cuò)處理............................................47
圖表24AvatarNodeO以Pimary啟動(dòng)過程......................................49
圖表25AvatarNodel以Standby啟動(dòng)過程......................................50
圖表26DataNode啟動(dòng)過程..................................................50
圖表27AvatarNodeO宕機(jī)后的狀態(tài)............................................51
圖表28AvatarNodel切換為Primary過程......................................51
圖表29AvatarNodeO重啟過程................................................52
圖表30AvatarNode啟動(dòng)切換流程圖...........................................53
圖表31Avatar體系架構(gòu)圖...................................................56
圖表32數(shù)據(jù)立方系統(tǒng)架構(gòu)...................................................58
圖表33作業(yè)提交...........................................................61
圖表34JobTrackerO宕機(jī).....................................................61
圖表35作業(yè)注銷...........................................................62
圖表36Zookeeper基本工作結(jié)構(gòu)圖............................................62
圖表37基于Zookeeper的查詢分析計(jì)算單點(diǎn)失效和............................64
圖表38基于深度防護(hù)戰(zhàn)略的IATF模型........................................64
圖表39云部署模型的實(shí)現(xiàn)...................................................65
圖表40多級(jí)信任保護(hù).......................................................66
圖表41基于可信第三方的平臺(tái)認(rèn)證..........................................67
圖表42主要因素平臺(tái)證書...................................................67
圖表43云存儲(chǔ)安全子系統(tǒng)接口關(guān)系圖........................................70
圖表44基于多級(jí)信任保護(hù)的多級(jí)訪問控制流程................................71
圖表45數(shù)據(jù)安全交換平臺(tái)...................................................71
圖表46云存儲(chǔ)安全審計(jì)體系結(jié)構(gòu).............................................73
圖表47安全日志審計(jì)系統(tǒng)結(jié)構(gòu)圖............................................75
圖表48Cloud-USG三種部署模式77
1系統(tǒng)總體設(shè)計(jì)
1.1云計(jì)算系統(tǒng)設(shè)計(jì)方案概述
1.1.1系統(tǒng)基本需求及功能
按照全省公安機(jī)關(guān)XX工程建設(shè)的要求,需要對(duì)全市500多個(gè)車輛監(jiān)控點(diǎn)實(shí)
時(shí)抓拍的車輛軌跡數(shù)據(jù)進(jìn)行及時(shí)匯聚、管理和分析服務(wù)。目前,全市已經(jīng)建成江
寧、浦口、六合、高淳、漂水及市政府信息中心等六個(gè)數(shù)據(jù)分中心數(shù)據(jù)庫。經(jīng)初
步測(cè)算,僅集中存儲(chǔ)全市XX文字?jǐn)?shù)據(jù)、圖片的位置索引,以及車牌小圖片片段
數(shù)據(jù)(圖像數(shù)據(jù)在需要時(shí)可以按照索引自動(dòng)到相應(yīng)的分中心圖片系統(tǒng)進(jìn)行分布調(diào)
用),按照數(shù)據(jù)存儲(chǔ)3年要求,總記錄數(shù)近200億條,原始數(shù)據(jù)總存儲(chǔ)容量約
120TB,高峰時(shí)段每秒產(chǎn)生的數(shù)據(jù)將超過1萬條記錄(每條記錄5K數(shù)據(jù)量,包括
文字?jǐn)?shù)據(jù)、圖片索引和號(hào)牌特征圖片)。加上要為原始數(shù)據(jù)記錄創(chuàng)建查詢索引以
及保存從原始數(shù)據(jù)統(tǒng)計(jì)分析出的中間結(jié)果數(shù)據(jù),需提供總量為150TB的原始數(shù)據(jù)
存儲(chǔ)量。
如此龐大的數(shù)據(jù)量使得現(xiàn)有的關(guān)系式數(shù)據(jù)庫已經(jīng)難以提供相應(yīng)的數(shù)據(jù)存儲(chǔ)
管理和處理能力。為此,需要考慮基于云平臺(tái)的分布式海量數(shù)據(jù)存儲(chǔ)和處理解決
方案。
本項(xiàng)目的基本建設(shè)要求是:在市局集中建設(shè)一套適應(yīng)海量數(shù)據(jù)處理的高性能
道路圖像監(jiān)控?cái)?shù)據(jù)存儲(chǔ)和計(jì)算平臺(tái),該平臺(tái)將從現(xiàn)有的六個(gè)數(shù)據(jù)分中心獲取和匯
聚道路監(jiān)控?cái)?shù)據(jù),以便提供集中式的道路監(jiān)控?cái)?shù)據(jù)管理功能,為開展各種車輛監(jiān)
控?cái)?shù)據(jù)應(yīng)用提供海量數(shù)據(jù)存儲(chǔ)管理和計(jì)算服務(wù)能力。
系統(tǒng)的基本功能和性能如下:
海量歷史交通監(jiān)控?cái)?shù)據(jù)匯總
能夠?qū)Π賰|級(jí)的海量歷史交通監(jiān)控?cái)?shù)據(jù)進(jìn)行匯總處理。
海量原始交通監(jiān)控?cái)?shù)據(jù)上報(bào)
能夠?qū)Π賰|級(jí)的海量上報(bào)交通監(jiān)控?cái)?shù)據(jù)進(jìn)行上報(bào)處理。
海量原始數(shù)據(jù)實(shí)時(shí)入庫、生成索引
能夠?qū)α髁砍^10000條/m的全量原始交通監(jiān)控?cái)?shù)據(jù)流進(jìn)行實(shí)時(shí)處理。
海量數(shù)據(jù)存儲(chǔ)、計(jì)算
能夠存儲(chǔ)百億級(jí)別的數(shù)據(jù),并完成各種復(fù)雜業(yè)務(wù)應(yīng)用計(jì)算。
百億級(jí)數(shù)據(jù)秒級(jí)查詢能力
高效索引算法,智能化調(diào)度任務(wù)系統(tǒng),滿足秒級(jí)查詢速度。
秒級(jí)實(shí)時(shí)業(yè)務(wù)響應(yīng)
高效實(shí)時(shí)數(shù)據(jù)通道,對(duì)于像實(shí)時(shí)監(jiān)控、告警等實(shí)時(shí)業(yè)務(wù),提供秒級(jí)響應(yīng)時(shí)間。
1.1.2主要建設(shè)目標(biāo)和建設(shè)原則
建設(shè)目標(biāo):利用大量普通的性價(jià)比高的商用服務(wù)器,構(gòu)建一個(gè)高性能的云計(jì)
算平臺(tái),對(duì)峰值流量超過10000條/秒、5年高達(dá)400TB的總數(shù)據(jù)量進(jìn)行存儲(chǔ)處
理,以便為實(shí)時(shí)監(jiān)控、報(bào)警監(jiān)控、車輛軌跡回放、電子地圖、報(bào)警管理、布控管
理、設(shè)備管理、事件檢測(cè)報(bào)警、流量統(tǒng)計(jì)和分析等多種應(yīng)用業(yè)務(wù)提供海量數(shù)據(jù)存
儲(chǔ)管理支撐和計(jì)算服務(wù)能力。
建設(shè)原則:
(1)前瞻性技術(shù)與實(shí)際應(yīng)用環(huán)境相結(jié)合
在技術(shù)方案上,本系統(tǒng)必須充分利用目前先進(jìn)的云計(jì)算和海量數(shù)據(jù)處理相關(guān)
技術(shù),保證系統(tǒng)技術(shù)的前瞻性和先進(jìn)性。
(2)高可靠性、高擴(kuò)展性、高可獲得性、實(shí)時(shí)性和高性價(jià)比的云平臺(tái)
與此同時(shí),通過利用業(yè)界成熟的云計(jì)算和海量數(shù)據(jù)并行計(jì)算平臺(tái)和技術(shù),提
供切實(shí)可行的海量數(shù)據(jù)存儲(chǔ)處理解決方案,并保證所設(shè)計(jì)實(shí)現(xiàn)的系統(tǒng)具有高可靠
性、高擴(kuò)展性和高可獲得性;同時(shí),通過云平臺(tái)的海量數(shù)據(jù)并行處理,保證數(shù)據(jù)
查詢響應(yīng)的實(shí)時(shí)性;此外,系統(tǒng)將利用比傳統(tǒng)方案更為低廉的價(jià)格,提供更高的
處理能力,達(dá)到較之傳統(tǒng)方案至少一個(gè)數(shù)量級(jí)的性價(jià)比提升。
(3)遵循公安320工程相關(guān)標(biāo)準(zhǔn)規(guī)范
在項(xiàng)目設(shè)計(jì)和工程實(shí)施上,本項(xiàng)目所有的數(shù)據(jù)格式、接口等要遵循公安320
工程相關(guān)標(biāo)準(zhǔn)規(guī)范。
1.1.3系統(tǒng)的主要技術(shù)特點(diǎn)
實(shí)時(shí)性:系統(tǒng)在分布式海量數(shù)據(jù)存儲(chǔ)和并行處理能力的支撐下,需要實(shí)時(shí)完
成交管數(shù)據(jù)獲取、入庫、以及數(shù)據(jù)匯總、上報(bào)、查詢、分析計(jì)算和管理等工作,
保證海量數(shù)據(jù)的獲取和入庫不會(huì)出現(xiàn)數(shù)據(jù)堆積現(xiàn)象,各類基本的數(shù)據(jù)查詢操作基
本都在秒級(jí)完成,大規(guī)?;驈?fù)雜的分析計(jì)算在分鐘級(jí)完成,實(shí)現(xiàn)傳統(tǒng)數(shù)據(jù)庫所難
以達(dá)到的處理能力和處理效率。
高可靠性:系統(tǒng)應(yīng)采用目前業(yè)界成熟可靠的海量數(shù)據(jù)處理平臺(tái)和技術(shù),需要
考慮數(shù)據(jù)存儲(chǔ)和計(jì)算時(shí)的系統(tǒng)可靠性,避免系統(tǒng)主節(jié)點(diǎn)的單點(diǎn)失效,并具有存儲(chǔ)
和計(jì)算節(jié)點(diǎn)失效檢測(cè)和恢復(fù)的容錯(cuò)處理能力,保證不出現(xiàn)系統(tǒng)癱瘓和數(shù)據(jù)出錯(cuò)現(xiàn)
象。
高可擴(kuò)展性:系統(tǒng)構(gòu)架和方案必須具有高可擴(kuò)展性,保證在將來應(yīng)用系統(tǒng)規(guī)
模擴(kuò)大時(shí)能根據(jù)需要隨時(shí)增加節(jié)點(diǎn)以擴(kuò)大系統(tǒng)的數(shù)據(jù)存儲(chǔ)能力和計(jì)算能力;并能
在不停機(jī)的情況下增加節(jié)點(diǎn),以保證應(yīng)用服務(wù)的連續(xù)性。
高可獲得性:項(xiàng)目使用市場(chǎng)上標(biāo)準(zhǔn)的普通商用服務(wù)器,采用標(biāo)準(zhǔn)的網(wǎng)絡(luò)構(gòu)建
云計(jì)算平臺(tái),云計(jì)算平臺(tái)通用性強(qiáng),且任何節(jié)點(diǎn)損壞都易于更換和維護(hù);云計(jì)算
系統(tǒng)軟件盡可能采用業(yè)界廣為使用的開源系統(tǒng),既節(jié)省軟件費(fèi)用,也易于獲得。
高性價(jià)比:替代使用價(jià)格昂貴的高端專用存儲(chǔ)和計(jì)算設(shè)備,采用價(jià)格不高的
普通服務(wù)器,大大節(jié)省系統(tǒng)的構(gòu)建和維護(hù)成本,同時(shí)通過云計(jì)算平臺(tái)的并行化計(jì)
算能力可提供比傳統(tǒng)方案更高的計(jì)算性能,獲得很高的性價(jià)比。
全業(yè)務(wù)支持:海量數(shù)據(jù)分布存儲(chǔ),少量數(shù)據(jù)關(guān)系復(fù)雜或?qū)崟r(shí)性要求很高的數(shù)
據(jù)存放于關(guān)系數(shù)據(jù)庫,采用這種分布式海量數(shù)據(jù)存儲(chǔ)為主、關(guān)系數(shù)據(jù)庫為輔的混
合式數(shù)據(jù)存儲(chǔ)模式,可存儲(chǔ)各種不同規(guī)模和不同媒體和類型的數(shù)據(jù),滿足各種不
同的數(shù)據(jù)處理和應(yīng)用業(yè)務(wù)需求。
1.1.4系統(tǒng)的主要性能指標(biāo)
數(shù)據(jù)存儲(chǔ)和處理指標(biāo)
3年的原始道路監(jiān)控?cái)?shù)據(jù)量為300TB,加上要為原始數(shù)據(jù)記錄創(chuàng)建查詢索引
以及保存從原始數(shù)據(jù)統(tǒng)計(jì)分析出的中間結(jié)果數(shù)據(jù),需提供總量為250TB的數(shù)據(jù)存
儲(chǔ)量;為了保證數(shù)據(jù)存儲(chǔ)的可靠性防止數(shù)據(jù)丟失,系統(tǒng)要求采用3倍副本方式保
存數(shù)據(jù),因此,云平臺(tái)需要提供250x3=750TB的總存儲(chǔ)量。同時(shí),系統(tǒng)必須能
實(shí)時(shí)接收和處理峰值流量高達(dá)1萬條/秒的實(shí)時(shí)入庫數(shù)據(jù),包括實(shí)時(shí)接收保存和
創(chuàng)建索引處理。
硬件系統(tǒng)指標(biāo)
為了保證計(jì)算集群的存儲(chǔ)和計(jì)算性能,每個(gè)服務(wù)器節(jié)點(diǎn)配置為不低于2顆
Intel至強(qiáng)5645六核處理器,內(nèi)存24G,6X2T(RAID0)SAS熱插拔硬盤;而集
群計(jì)算和存儲(chǔ)主控節(jié)點(diǎn)配置為不低于2顆Intel至強(qiáng)5660六核處理器,內(nèi)存
32G,5X2T(RAID1)SAS熱插拔硬盤;關(guān)系數(shù)據(jù)庫服務(wù)器配置為不低于2顆Intel
至強(qiáng)5660六核處理器,內(nèi)存24G,3X2T(RAID1)SAS熱插拔硬盤;應(yīng)用分析服
務(wù)器和數(shù)據(jù)采集服務(wù)器配置均為不低于2顆Intel至強(qiáng)5645六核處理器,內(nèi)存
16G,應(yīng)用服務(wù)器采用600GB15000轉(zhuǎn)SAS熱插拔硬盤,數(shù)據(jù)采集服務(wù)器采用
2T(RAID1)SAS熱插拔硬盤。詳細(xì)指標(biāo)要求參見本文建設(shè)內(nèi)容部分描述。
計(jì)算響應(yīng)時(shí)間
實(shí)時(shí)入庫時(shí)延:道路監(jiān)控?cái)?shù)據(jù)從分中心獲取后入庫處理(包括創(chuàng)建查詢索引)
時(shí)的時(shí)間延遲小于5秒,并保證不會(huì)出現(xiàn)數(shù)據(jù)堆積現(xiàn)象。
查詢響應(yīng):查詢響應(yīng)依賴于上層應(yīng)用的具體查詢分析的復(fù)雜程度、查詢時(shí)所
涉及到的時(shí)間跨度和具體數(shù)據(jù)量、及上層應(yīng)用查詢具體的設(shè)計(jì)實(shí)現(xiàn)方法。由于本
項(xiàng)目并不包括上層應(yīng)用的開發(fā),因此,本項(xiàng)目中難以確定和評(píng)估上層應(yīng)用的查詢
響應(yīng)時(shí)間。但為了保證本項(xiàng)目所設(shè)計(jì)實(shí)現(xiàn)的系統(tǒng)能滿足實(shí)時(shí)查詢響應(yīng)能力、并制
定項(xiàng)目驗(yàn)收時(shí)的有效評(píng)估標(biāo)準(zhǔn),本項(xiàng)目要求對(duì)最常用的指定車輛牌號(hào)在不同時(shí)間
段的查詢能達(dá)到實(shí)時(shí)響應(yīng)。具體要求是,平均計(jì)算,對(duì)單個(gè)車輛牌號(hào)1個(gè)月內(nèi)的
軌跡查詢返回和結(jié)果讀出在1秒內(nèi)完成,6個(gè)月內(nèi)的軌跡查詢返回和結(jié)果讀出在
5秒內(nèi)完成,6T2個(gè)月內(nèi)的軌跡查詢返回和結(jié)果讀出在10秒內(nèi)完成(其中全部
查詢結(jié)束至第一個(gè)結(jié)果讀出應(yīng)在3秒內(nèi)完成),而1-3年的軌跡查詢和結(jié)果返回
應(yīng)在30秒內(nèi)完成(其中全部查詢結(jié)束至第一個(gè)結(jié)果讀出應(yīng)在10秒內(nèi)完成)。
1.2系統(tǒng)總體構(gòu)架
1.2.1系統(tǒng)基本組成與構(gòu)架
“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理項(xiàng)目是一個(gè)處于交管數(shù)據(jù)采集與交管數(shù)
據(jù)監(jiān)測(cè)應(yīng)用之間的系統(tǒng)。從系統(tǒng)基本組成與構(gòu)架上來看,該共享平臺(tái)由7個(gè)主要
部分組成:歷史數(shù)據(jù)匯聚系統(tǒng)、實(shí)時(shí)數(shù)據(jù)入庫系統(tǒng)、數(shù)據(jù)存儲(chǔ)管理系統(tǒng)、數(shù)據(jù)上
報(bào)處理系統(tǒng),數(shù)據(jù)應(yīng)用接口、數(shù)據(jù)查詢導(dǎo)出系統(tǒng)以及系統(tǒng)管理。
在基礎(chǔ)設(shè)施構(gòu)架上,在市局集中建設(shè)一套適應(yīng)海量數(shù)據(jù)處理的高性能道路圖
像監(jiān)控?cái)?shù)據(jù)存儲(chǔ)和計(jì)算平臺(tái),作為“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理項(xiàng)目的基
礎(chǔ)設(shè)施和支撐平臺(tái)。
圖表1“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的基本組成與構(gòu)架
1.2.2系統(tǒng)功能構(gòu)架
“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)需要提供的7大數(shù)據(jù)處理和服務(wù)
功能描述如下。
(1)歷史數(shù)據(jù)匯聚
歷史數(shù)據(jù)匯總處理主要負(fù)責(zé)把XX市6個(gè)分散的數(shù)據(jù)中心的歷史數(shù)據(jù),進(jìn)行
讀取解析處理,并將處理后的歷史數(shù)據(jù)匯入一個(gè)統(tǒng)一的數(shù)據(jù)中心。
在內(nèi)部處理模塊上,歷史數(shù)據(jù)匯總系統(tǒng)主要包括三個(gè)模塊:讀取模塊、解析
模塊和匯總模塊。讀取模塊主要負(fù)責(zé)各個(gè)數(shù)據(jù)中心歷史數(shù)據(jù)的讀取處理,解析模
塊主要負(fù)責(zé)把讀取到的歷史數(shù)據(jù)解析成合理的數(shù)據(jù)格式,而匯總模塊主要負(fù)責(zé)把
解析好的歷史數(shù)據(jù)上傳到統(tǒng)一的數(shù)據(jù)中心。
在系統(tǒng)構(gòu)架上,為了滿足6個(gè)分散的數(shù)據(jù)中心處理需要,需要在每一個(gè)數(shù)據(jù)
中心處安裝一個(gè)數(shù)據(jù)匯總程序。
接口調(diào)用說明:
鑒于歷史數(shù)據(jù)是存儲(chǔ)在Oracle關(guān)系數(shù)據(jù)庫中,在這里數(shù)據(jù)匯總程序的讀取
模塊將通過結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)訪問接口(如JDBC)訪問和讀取其中的歷史數(shù)據(jù)。匯
總模塊則會(huì)利用“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的云存儲(chǔ)系統(tǒng)提供的
數(shù)據(jù)添加接口把解析好的歷史數(shù)據(jù)添加到云存儲(chǔ)系統(tǒng)中。(這里的數(shù)據(jù)添加接口
以jar包的方式集成到數(shù)據(jù)匯總程序中。調(diào)用十分方便、簡(jiǎn)潔,調(diào)用方法類似于
一般的應(yīng)用程序利用JDBC向傳統(tǒng)的關(guān)系數(shù)據(jù)庫中添加數(shù)據(jù)。)
接口安全性說明:
數(shù)據(jù)添加接口把從Oracle數(shù)據(jù)庫中讀取到的歷史數(shù)據(jù),利用網(wǎng)絡(luò),傳輸給
云存儲(chǔ)系統(tǒng),由云存儲(chǔ)系統(tǒng)完成歷史數(shù)據(jù)的入庫操作。當(dāng)整個(gè)流程都準(zhǔn)確無誤的
完成后,云存儲(chǔ)系統(tǒng)會(huì)返還一個(gè)“成功”標(biāo)記給數(shù)據(jù)匯總系統(tǒng)。當(dāng)數(shù)據(jù)匯總系統(tǒng)
明確的得到了“成功”標(biāo)記后,記錄下這條已經(jīng)完成匯總操作的數(shù)據(jù),然后進(jìn)行
下一條歷史數(shù)據(jù)的匯總操作。否則會(huì)判斷本次匯總操作失敗,并進(jìn)行失敗處理(如:
判定本次匯總操作失敗的原因、記錄到日志中、進(jìn)行再次匯總操作等)。這樣可
以最大限度上,保證在各種異常情況下(如:網(wǎng)絡(luò)阻塞)數(shù)據(jù)匯總的安全性。
是否有必要使用消息中間件(如IBMMQ):
MQ負(fù)責(zé)在兩個(gè)系統(tǒng)之間傳遞消息:這兩個(gè)系統(tǒng)可以是異構(gòu)的,處于不同硬
件、不同操作系統(tǒng)、用不同語言編寫,只需要簡(jiǎn)單的調(diào)用幾個(gè)MQ的API,就可以
互相通訊,你不必考慮底層系統(tǒng)和網(wǎng)絡(luò)的復(fù)雜性。
而“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的數(shù)據(jù)匯總系統(tǒng)和云存儲(chǔ)系統(tǒng)
并不是一般的兩個(gè)相互孤立的系統(tǒng),它們之間的關(guān)系很類似于應(yīng)用程序?qū)τ趥鹘y(tǒng)
數(shù)據(jù)庫的關(guān)系。消息中間件在這么并沒有相應(yīng)的應(yīng)用場(chǎng)景。
但MQ的功能僅限于消息隊(duì)列:至于應(yīng)用A發(fā)給應(yīng)用B的消息格式是怎樣的、
能不能被應(yīng)用B解析,MQ管不了,他只是盡力將消息發(fā)到目的地(MQ能夠應(yīng)付
多種異常情況,例如網(wǎng)絡(luò)阻塞、臨時(shí)中斷等等)。
“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的數(shù)據(jù)匯總系統(tǒng)已經(jīng)能夠?qū)Χ喾N
異常情況進(jìn)行處理。
故從分析來看,數(shù)據(jù)匯總系統(tǒng)和云存儲(chǔ)系統(tǒng)之間不需要再加入一個(gè)中間件來
保證數(shù)據(jù)傳輸?shù)陌踩浴?/p>
(2)實(shí)時(shí)數(shù)據(jù)入庫
實(shí)時(shí)數(shù)據(jù)入庫主要負(fù)責(zé)從分中心所采集的全市每個(gè)卡口產(chǎn)生的實(shí)時(shí)數(shù)據(jù)同
步地傳送給本系統(tǒng)進(jìn)行實(shí)時(shí)入庫處理(需要通過網(wǎng)閘等安全隔離交換設(shè)備)。
在內(nèi)部處理模塊上,實(shí)時(shí)數(shù)據(jù)入庫系統(tǒng)主要包括三個(gè)模塊:接受模塊、解析
模塊和數(shù)據(jù)入庫模塊。接受模塊主要負(fù)責(zé)接收每個(gè)卡口產(chǎn)生的數(shù)據(jù)流,解析模塊
主要負(fù)責(zé)把接受到的數(shù)據(jù)流解析成合理的數(shù)據(jù)格式,而數(shù)據(jù)入庫模塊負(fù)責(zé)把解析
好的數(shù)據(jù)加入到市數(shù)據(jù)中心。
在系統(tǒng)架構(gòu)上,為了使每個(gè)卡口的數(shù)據(jù)能實(shí)時(shí)入庫市數(shù)據(jù)中心,需要在每一
個(gè)負(fù)責(zé)接受卡口數(shù)據(jù)的工控機(jī)上安裝一個(gè)實(shí)時(shí)數(shù)據(jù)入庫系統(tǒng)。
接口調(diào)用及安全性說明:
同數(shù)據(jù)匯總系統(tǒng),區(qū)別在于:數(shù)據(jù)匯總的數(shù)據(jù)來源于關(guān)系數(shù)據(jù)庫,而實(shí)時(shí)數(shù)
據(jù)上報(bào)系統(tǒng)的數(shù)據(jù)來源于接受卡口數(shù)據(jù)的工控機(jī)。
(3)數(shù)據(jù)存儲(chǔ)管理
原始交管數(shù)據(jù),將全部存儲(chǔ)在“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的
云存儲(chǔ)資源中。資源池提供兩種存儲(chǔ)資源:一種是結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)資源,用于存
儲(chǔ)少量的接口中間數(shù)據(jù);另一種是分布式文件系統(tǒng),用于存儲(chǔ)海量的非結(jié)構(gòu)化數(shù)
據(jù)。為了滿足和適應(yīng)數(shù)據(jù)量、數(shù)據(jù)特征和查詢處理的不同需求,將采用一種混搭
式的數(shù)據(jù)存儲(chǔ)方案。
對(duì)容量巨大、常規(guī)數(shù)據(jù)庫難以處理的數(shù)據(jù),如交管數(shù)據(jù),將主要存儲(chǔ)在基于
分布式云存儲(chǔ)的分布式文件系統(tǒng)中;這些數(shù)據(jù)將通過分布式云存儲(chǔ)接口進(jìn)行訪問
和計(jì)算處理。而對(duì)于部分?jǐn)?shù)據(jù)量不大、且查詢響應(yīng)性能要求很高的數(shù)據(jù),如用于
報(bào)警比對(duì)的中間數(shù)據(jù),將被存放在關(guān)系數(shù)據(jù)庫中。關(guān)系數(shù)據(jù)庫將采用Oracle10g
版本。這些數(shù)據(jù)將通過結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)訪問接口(如JDBC)進(jìn)行訪問。
在存儲(chǔ)構(gòu)架上,若以存儲(chǔ)3年的原始交管數(shù)據(jù)、報(bào)警信息數(shù)據(jù)和針對(duì)快速查
詢建立的索引數(shù)據(jù),在10000條/s的交管數(shù)據(jù)流量下,將大約需要512TB的存
儲(chǔ)容量,按照每個(gè)存儲(chǔ)節(jié)點(diǎn)16TB的存儲(chǔ)容量,加上少量的冗余節(jié)點(diǎn),將需要32
個(gè)存儲(chǔ)節(jié)點(diǎn)。
(4)數(shù)據(jù)上報(bào)處理
數(shù)據(jù)上報(bào)處理負(fù)責(zé)把市局?jǐn)?shù)據(jù)中心的數(shù)據(jù),按照一定的匯總格式需求(按時(shí)
間段或一定的數(shù)據(jù)量),上報(bào)給省廳數(shù)據(jù)中心。
在內(nèi)部處理模塊上,上報(bào)數(shù)據(jù)上報(bào)系統(tǒng)主要包括三個(gè)模塊:讀取模塊、解析
模塊和上報(bào)模塊。讀取模塊主要負(fù)責(zé)市數(shù)據(jù)中心需要上報(bào)數(shù)據(jù)的讀取處理,解析
模塊主要負(fù)責(zé)把讀取到的數(shù)據(jù)解析成合理的數(shù)據(jù)格式,而上報(bào)模塊主要負(fù)責(zé)把解
析好的數(shù)據(jù)上傳到的省廳數(shù)據(jù)中心。
在系統(tǒng)構(gòu)架上,為了滿足市數(shù)據(jù)中心處理需要,需要在市數(shù)據(jù)中心處安裝一
個(gè)數(shù)據(jù)上報(bào)程序。而省廳數(shù)據(jù)中心需要提供數(shù)據(jù)上報(bào)的接口。
(5)數(shù)據(jù)應(yīng)用接口
數(shù)據(jù)應(yīng)用接口主要提供包括交管信息查詢、報(bào)警信息查詢、事件檢測(cè)報(bào)警、
流量統(tǒng)計(jì)和分析等功能。
車輛軌跡查詢處理時(shí),由于交管數(shù)據(jù)量巨大,難以存儲(chǔ)在常規(guī)的關(guān)系數(shù)據(jù)庫
中,而如果直接存儲(chǔ)在分布式云存儲(chǔ)或數(shù)據(jù)立方中又難以保證查詢效率。為此,
需要考慮對(duì)交管數(shù)據(jù)進(jìn)行索引處理,并將索引數(shù)據(jù)存儲(chǔ)在分布式云存儲(chǔ)或數(shù)據(jù)立
方中。為了建立交管數(shù)據(jù)索引,需要在交管數(shù)據(jù)傳送到云存儲(chǔ)系統(tǒng)中時(shí),進(jìn)行實(shí)
時(shí)的索引處理。但由于交管數(shù)據(jù)流量巨大,需要調(diào)度使用多臺(tái)服務(wù)器節(jié)點(diǎn)進(jìn)行并
行處理。止匕外,用戶從客戶端發(fā)起以上各種數(shù)據(jù)查詢分析任務(wù)時(shí),也會(huì)產(chǎn)生大量
并發(fā)的查詢?nèi)蝿?wù)。以上各種查詢分析計(jì)算任務(wù)的處理將需要考慮在計(jì)算集群上進(jìn)
行并行化任務(wù)調(diào)度和負(fù)載均衡處理。這些并行計(jì)算任務(wù)及負(fù)載均衡處理將使用
Zookeeper基于計(jì)算集群完成統(tǒng)一的控制和實(shí)現(xiàn)。
在系統(tǒng)構(gòu)架上,以上查詢分析計(jì)算任務(wù)將需要使用一個(gè)大規(guī)模數(shù)據(jù)并行計(jì)算
集群。在編程實(shí)現(xiàn)上,存儲(chǔ)在數(shù)據(jù)庫中的數(shù)據(jù)將使用常規(guī)的數(shù)據(jù)庫查詢語言實(shí)現(xiàn);
對(duì)存儲(chǔ)在分布式文件系統(tǒng)中的交管數(shù)據(jù),針對(duì)不同的處理要求,在數(shù)據(jù)量極大而
處理實(shí)時(shí)性要求不是特別高的情況下,為了方便對(duì)海量數(shù)據(jù)的并行處理,將采用
分布式云處理編程方式實(shí)現(xiàn);而對(duì)于那些實(shí)時(shí)性要求很高的查詢分析計(jì)算,由于
分布式云處理啟動(dòng)作業(yè)需要較長(zhǎng)的時(shí)間開銷,將不適合采用分布式云處理編程實(shí)
現(xiàn),而需要用非分布式云處理編程方式實(shí)現(xiàn)。
接口調(diào)用說明:
這里的各類查詢分析應(yīng)用的接口,都會(huì)以Java方法的形式封裝在jar包里,
提供給其他應(yīng)用系統(tǒng)。其他應(yīng)用系統(tǒng)通過調(diào)用jar包里的對(duì)應(yīng)的Java方法,便
可以獲取想要的數(shù)據(jù)(具體的使用類似于利用JDBC提供的Java方法從數(shù)據(jù)庫獲
取指定條件的數(shù)據(jù))。對(duì)于查詢結(jié)果數(shù)據(jù)數(shù)目過大的情況,我們采用分頁查詢的
方法,以保證能在很短的時(shí)間內(nèi)響應(yīng)用戶的請(qǐng)求。
(6)數(shù)據(jù)查詢導(dǎo)出
在實(shí)際使用中,可能用戶會(huì)對(duì)某一時(shí)間段或者類型的數(shù)據(jù)特別關(guān)心,就可以
通過數(shù)據(jù)管理系統(tǒng)查詢并導(dǎo)出這部分?jǐn)?shù)據(jù)以供使用。
包括數(shù)據(jù)查詢和數(shù)據(jù)導(dǎo)出兩大部分。數(shù)據(jù)查詢讓用戶以自定義的條件查詢出
數(shù)據(jù),而數(shù)據(jù)導(dǎo)出就是將這些數(shù)據(jù)以合理的格式導(dǎo)出到數(shù)據(jù)中心以外。
(7)系統(tǒng)管理
系統(tǒng)管理主要包括“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)的配置管理、
系統(tǒng)安全管理、系統(tǒng)用戶管理,以及數(shù)據(jù)備份、系統(tǒng)故障監(jiān)測(cè)復(fù)等管理維護(hù)功能。
配置管理是其中最主要的部分,是系統(tǒng)各個(gè)模塊正常運(yùn)行的基礎(chǔ)。系統(tǒng)應(yīng)能
夠?qū)W(wǎng)絡(luò)地址、設(shè)備地址等進(jìn)行配置;能夠?qū)τ脩糇鰴?quán)限管理,以防止數(shù)據(jù)外泄;
并能及時(shí)有效的對(duì)數(shù)據(jù)進(jìn)行備份和故障檢測(cè)等工作,防止數(shù)據(jù)的意外丟失。系統(tǒng)
應(yīng)支持樹圖、數(shù)據(jù)表格、網(wǎng)絡(luò)拓?fù)鋱D形式展示配置數(shù)據(jù)。
1.2.3系統(tǒng)總體構(gòu)架與功能模塊
基于以上基本的系統(tǒng)組成和功能構(gòu)架,系統(tǒng)的詳細(xì)總體構(gòu)架和功能模塊設(shè)計(jì)
如圖所示。
客
戶盛
實(shí)時(shí)跟查詢網(wǎng)絡(luò)管
端
蹤界面界面理界面
實(shí)時(shí)報(bào)警交管數(shù)據(jù)煙攵電t
交
管Web服務(wù)程序拓?fù)涔芾?/p>
數(shù)并行查詢?nèi)蝿?wù)分發(fā)
告警預(yù)警
據(jù)
交管數(shù)據(jù)車輛軌跡軌跡查詢多?約v管理
處分析對(duì)比查詢[查詢]車輛
理網(wǎng)絡(luò)指標(biāo)
■用戶管理
基于zookeeper索引、計(jì)算,查詢并行
軟監(jiān)視
.計(jì)算任務(wù)負(fù)栽均衡調(diào)度與單點(diǎn)容錯(cuò)控制
件
■其他計(jì)算[流量統(tǒng)計(jì)I查器引]自系統(tǒng)其他系統(tǒng)
層網(wǎng)管管理
數(shù)
據(jù)
層
系
數(shù)據(jù)庫訪問接口HDFS訪問接口HBase接口Hadoop編程接口
統(tǒng)
軟修動(dòng)云存儲(chǔ)系統(tǒng)綜合分析云計(jì)尊軟件平臺(tái)
件
MapZooHApache.
層H8ase
ReduceKeeper
硬
件??
平
接n與骨理腰務(wù)器
臺(tái)
層
圖表2“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)總體構(gòu)架與功能模塊圖
上圖中,自底向上分為五個(gè)層面。最下層是硬件平臺(tái)層,將使用XX市公安
局云計(jì)算中心所提供的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源。從系統(tǒng)處理系統(tǒng)的角度看,這一
層主要包括云存儲(chǔ)計(jì)算集群,此外還包括接口和管理服務(wù)器、包括用于實(shí)現(xiàn)客戶
端訪問的Web服務(wù)器。
第二層是系統(tǒng)軟件層,包括移動(dòng)的云存儲(chǔ)系統(tǒng)軟件,綜合分析云計(jì)算軟件平
臺(tái),以及Web服務(wù)軟件等。云存儲(chǔ)系統(tǒng)將提供基于Oracle10g關(guān)系數(shù)據(jù)庫的結(jié)
構(gòu)化數(shù)據(jù)存儲(chǔ)訪問能力,以及基于分布式云存儲(chǔ)的分布式文件系統(tǒng)存儲(chǔ)訪問能力,
分別提供基于JDBC/SQL的數(shù)據(jù)庫訪問接口以及分布式云存儲(chǔ)訪問接口。綜合分
析云計(jì)算軟件平臺(tái)可提供對(duì)分布式云存儲(chǔ)、數(shù)據(jù)立方數(shù)據(jù)的訪問,并提供分布式
云處理編程模型和接口、以及非分布式云處理模型的編程接口,以及用于實(shí)現(xiàn)并
行計(jì)算任務(wù)負(fù)載均衡和服務(wù)器單點(diǎn)失效恢復(fù)的Zookeeper。
第三層是“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)中的數(shù)據(jù)層,包括原始
交管數(shù)據(jù)、索引數(shù)據(jù)、用于分析的中間數(shù)據(jù)、以及系統(tǒng)配置數(shù)據(jù)等。其中,原始
交管數(shù)據(jù)、索引數(shù)據(jù)等海量數(shù)據(jù)將存儲(chǔ)在XX公安局云存儲(chǔ)系統(tǒng)的分布式云存儲(chǔ)
分布式文件系統(tǒng)中,用分布式云存儲(chǔ)接口進(jìn)行存儲(chǔ)和訪問處理;而其它用于分析
的中間數(shù)據(jù)等數(shù)據(jù)量不大、但處理響應(yīng)性能要求較高的數(shù)據(jù),將存儲(chǔ)在云存儲(chǔ)系
統(tǒng)的關(guān)系數(shù)據(jù)庫系統(tǒng)中,用JDBC/SQL進(jìn)行存儲(chǔ)和訪問處理。
第四層是交管數(shù)據(jù)處理軟件層,主要完成“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處
理云平臺(tái)所需要提供的諸多功能,包括實(shí)時(shí)監(jiān)控、報(bào)警監(jiān)控、車輛軌跡查詢與回
放、電子地圖、報(bào)警管理、布控管理、設(shè)備管理、事件檢測(cè)報(bào)警、流量統(tǒng)計(jì)和分
析、系統(tǒng)管理等功能。
最上層是客戶端用戶界面軟件,主要供用戶查詢和監(jiān)視相關(guān)的數(shù)據(jù)信息,除
了事件檢測(cè)報(bào)警不需要用戶界面外,其它部分都需要實(shí)現(xiàn)對(duì)應(yīng)的用戶界面。
1.3系統(tǒng)基本功能與處理方案
1.3.1交管數(shù)據(jù)入庫功能與處理方案
交管數(shù)據(jù)入庫系統(tǒng)總架構(gòu)如圖:
應(yīng)用層
應(yīng)用層其他增值應(yīng)用
軟件架構(gòu)層z\
存儲(chǔ)與管理子系統(tǒng)
警數(shù)據(jù)查詢模塊
分布式存儲(chǔ)系統(tǒng)
報(bào)警信息存儲(chǔ)模塊
交管數(shù)據(jù)查詢模塊
拓?fù)涔芾硭饕鎯?chǔ)模塊
實(shí)時(shí)報(bào)警模塊
交管數(shù)據(jù)存儲(chǔ)模塊
實(shí)時(shí)監(jiān)控模塊
自實(shí)時(shí)報(bào)警分析
建立索引
數(shù)據(jù)推送數(shù)據(jù)推送數(shù)據(jù)推送
交管數(shù)據(jù)解析交管數(shù)據(jù)解析
負(fù)載均衡模塊
交管數(shù)據(jù)入庫
圖表3“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)架構(gòu)
“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)通過實(shí)時(shí)數(shù)據(jù)入庫系統(tǒng)接入
采集層的交管數(shù)據(jù),數(shù)據(jù)分配進(jìn)入負(fù)載均衡機(jī),負(fù)載均衡機(jī)根據(jù)集群各節(jié)點(diǎn)負(fù)載
情況,動(dòng)態(tài)分配交管數(shù)據(jù)到各存儲(chǔ)處理機(jī),進(jìn)行報(bào)警檢測(cè)、建立索引等處理,
同時(shí)將交管數(shù)據(jù)存入分步式存儲(chǔ)系統(tǒng)。
負(fù)載均衡機(jī)功能
監(jiān)控所集群機(jī)器負(fù)載情況,動(dòng)態(tài)分配交管數(shù)據(jù)。監(jiān)控所有集群機(jī)器,如果發(fā)
現(xiàn)問題,那么就把分配給這臺(tái)機(jī)器的交管數(shù)據(jù)重新分配到其他機(jī)器,去除單點(diǎn)故
障,提高系統(tǒng)可靠性。
負(fù)載均衡機(jī)采用Paxos算法解決一致性問題,集群在某一時(shí)刻只有一個(gè)
Master負(fù)責(zé)均衡能力,當(dāng)Master宕機(jī)后,其他節(jié)點(diǎn)重新選舉Master。保證負(fù)載
均衡機(jī)不會(huì)存在單點(diǎn)問題,集群機(jī)器一致性。
實(shí)時(shí)業(yè)務(wù)
對(duì)于實(shí)時(shí)性要求高的業(yè)務(wù)應(yīng)用,如:實(shí)時(shí)監(jiān)控、實(shí)時(shí)報(bào)警,走實(shí)時(shí)專道。
1.3.2數(shù)據(jù)存儲(chǔ)功能與處理方案
數(shù)據(jù)存儲(chǔ)處理總架如圖:
應(yīng)用層
處理層
交管信息查詢接口系統(tǒng)管理接口
并行計(jì)算
交管信息查詢模塊實(shí)時(shí)報(bào)警分析
報(bào)警信息查詢模塊流量統(tǒng)計(jì)
建立索引模塊
主控
分類存帳效據(jù)索引數(shù)據(jù)系綾配置信息
鍍塊
交管數(shù)據(jù)交管數(shù)據(jù)索引黑名單管理
交管數(shù)據(jù)車主信息
報(bào)警數(shù)據(jù)報(bào)警數(shù)據(jù)索引
布控信息
基礎(chǔ)配置信息
平臺(tái)層
物理層
DataNodeNameNode
圖表4數(shù)據(jù)存儲(chǔ)處理架構(gòu)
數(shù)據(jù)存儲(chǔ)系統(tǒng)提供如下功能:
交管數(shù)據(jù)處理:接收來自數(shù)據(jù)匯總和數(shù)據(jù)入庫系統(tǒng)的交管數(shù)據(jù),索引模塊
實(shí)時(shí)生成索引,以提高查詢速度。生成的索引存儲(chǔ)到分布式云存儲(chǔ)中,以供查詢
交管數(shù)據(jù)使用。
專題業(yè)務(wù)分析,通過分布式云處理并行計(jì)算,同期提取業(yè)務(wù)數(shù)據(jù),將結(jié)果分
存兩路,一路存入數(shù)據(jù)立方或日志詳單存儲(chǔ),一路存入關(guān)系型數(shù)據(jù)庫。
報(bào)警數(shù)據(jù)處理
“3.20”道路圖像監(jiān)控?cái)?shù)據(jù)匯聚處理云平臺(tái)對(duì)接收到的實(shí)時(shí)交管數(shù)據(jù)進(jìn)行計(jì)
算,以判斷這輛車有沒有符合報(bào)警條件。如果符合,會(huì)對(duì)報(bào)警信息入庫,并同時(shí)
通過對(duì)外實(shí)時(shí)報(bào)警的接口,將報(bào)警信息迅速展示到用戶界面上。
1.3.3查詢分析功能與處理方案
交管數(shù)據(jù)查詢構(gòu)架如圖:
圖表5交管數(shù)據(jù)接入
當(dāng)客戶發(fā)起請(qǐng)求后,客戶端把請(qǐng)求發(fā)向查詢接口服務(wù)器,查詢接口服務(wù)器
解析查詢請(qǐng)求,后向Master任務(wù)調(diào)度機(jī)發(fā)送查詢?nèi)蝿?wù)執(zhí)行命令;Master回應(yīng)執(zhí)
行命令節(jié)點(diǎn)信息,查詢服務(wù)器根據(jù)節(jié)點(diǎn)信息將查詢命令發(fā)向查詢計(jì)算模塊,進(jìn)行
具體查詢操作,將查詢結(jié)果返回給客戶端,呈現(xiàn)給用戶。
1.4系統(tǒng)可靠性與擴(kuò)展性
1.4.1系統(tǒng)可靠性
分布式云存儲(chǔ)可靠性概述:
分布式云存儲(chǔ)包括元數(shù)據(jù)節(jié)點(diǎn)(Namenode)和數(shù)據(jù)節(jié)點(diǎn)(Datanode),Namenode
是一個(gè)中心服務(wù)器,負(fù)責(zé)管理文件系統(tǒng)的Namespace和客戶端對(duì)文件的訪問。,
Datanode在集群中一般是一個(gè)節(jié)點(diǎn)一個(gè),Datanode是文件系統(tǒng)中真正存儲(chǔ)數(shù)據(jù)
的地方。
DataNode所在機(jī)器掛了怎么辦?
分布式云存儲(chǔ)(分布式云計(jì)算DistributedFileSystem)默認(rèn)的最基本的
存儲(chǔ)單位是64M的數(shù)據(jù)塊(block)o一個(gè)文件對(duì)應(yīng)的所有BLOCK全部按照一定
的部署策略存在于DataNode上,文件的所有block為了容錯(cuò)都會(huì)被復(fù)制(一般
為3份),每個(gè)文件的block大小和replication因子都是可配置的。Datanode
每3分鐘向Namenode發(fā)送心跳,如果10分鐘datanode沒有向Namenode發(fā)送心
跳,則Namenode認(rèn)為該Datanode已經(jīng)dead,Namenode將取出該Datanode上對(duì)
應(yīng)的block,對(duì)其進(jìn)行復(fù)制。
Namenode掛了怎么辦?
Namenode主控服務(wù)器,為了避免主節(jié)點(diǎn)失效而影響整個(gè)系統(tǒng)正常工作,我
們采用基于分布式云存儲(chǔ)的改進(jìn)方案Avatar,同時(shí)可開啟兩個(gè)Namenode,主
Namenode和secondNamenode,實(shí)際工作的只有主Namenode0主Namenode將所
有關(guān)于文件和目錄的操作記錄都會(huì)寫入日志,并定時(shí)序列化到本地做鏡像,并且
保存到本地的NFS服務(wù)器,同時(shí)secondNamenode讀取主Namenode所在NFS服務(wù)
器的日志并對(duì)鏡像日志做Checkpoint。故障后,secondNamenode升級(jí)為Namenode,
通過鏡像數(shù)據(jù)和文件日志迅速恢復(fù)系統(tǒng)。數(shù)據(jù)服務(wù)器可通過分布式協(xié)同服務(wù)機(jī)制
得知關(guān)于主控服務(wù)器的更迭情況,然后向新的主控注冊(cè)并繼續(xù)發(fā)送心跳。
數(shù)據(jù)立方可靠性概述:
數(shù)據(jù)立方系統(tǒng)由數(shù)據(jù)立方集群和ZooKeeper集群組成。數(shù)據(jù)立方的可靠性由
其自身的ZooKeeper機(jī)制保證。數(shù)據(jù)立方包括Hregion服務(wù)器群和Master主服
務(wù)器構(gòu)成。Master負(fù)責(zé)管理Hregion。物理上,一張表是被拆成多個(gè)塊,一張完
整的表格是保存在多個(gè)Hregion上面的。
master掛掉怎么辦?
由于master只維護(hù)表和region的元數(shù)據(jù),因此master下線短時(shí)間內(nèi)對(duì)整
個(gè)數(shù)據(jù)立方集群沒有影響,master保存的信息全是可以冗余信息(都可以從系
統(tǒng)其它地方收集到或者計(jì)算出來),因此,啟動(dòng)數(shù)據(jù)立方時(shí)可以再啟動(dòng)一個(gè)備用
的master,實(shí)際工作的只有主master,當(dāng)主master所在節(jié)點(diǎn)宕機(jī),會(huì)自動(dòng)切換
到備用master所在節(jié)點(diǎn)。
Hregionserver掛掉怎么辦?
物理上,表格分為多個(gè)Region一張表是被拆成多個(gè)塊,一張完整的表格是
保存在多個(gè)Hregionserver上面的。并且分布在多臺(tái)Hregionserver中,物理上
所有數(shù)據(jù)存儲(chǔ)在分布式云計(jì)算的分布式云存儲(chǔ)上,由一些子表服務(wù)器來提供數(shù)據(jù)
服務(wù),提供服務(wù)時(shí),子表先查HMemcache,如果沒有,再查分布式云存儲(chǔ)上的
HStore,由分布式云存儲(chǔ)來保證數(shù)據(jù)的可靠性。如果丟失Region的數(shù)據(jù)所在節(jié)
點(diǎn)的datanode宕機(jī),分布式云存儲(chǔ)會(huì)自動(dòng)映射到其他節(jié)點(diǎn),從而保證Region數(shù)
據(jù)的可靠性。
ZooKeeper掛掉怎么辦?
Zookeeper分為2個(gè)部分:服務(wù)器端和客戶端。啟動(dòng)Zookeeper服務(wù)器集群
環(huán)境后,多個(gè)Zookeeper服務(wù)器在工作前會(huì)選舉出一個(gè)Leader,在接下來的工
作中這個(gè)被選舉出來的Leader死了,而剩下的Zookeeper服務(wù)器會(huì)知道這個(gè)
Leader死掉了,在活著的Zookeeper集群中會(huì)繼續(xù)選出一個(gè)Leader,選舉出
leader的目的是為了可以在分布式的環(huán)境中保證數(shù)據(jù)的一致性。
分布式云處理可靠性概述:
分布式云處理整體上可以分為這么幾條執(zhí)行的線索,JobTracker與
JobTracker是一個(gè)master服務(wù),軟件啟動(dòng)之后JobTracker接收job,負(fù)責(zé)調(diào)度
job的每一個(gè)子任務(wù)task運(yùn)行于TaskTracker上,并監(jiān)控它們,如果發(fā)現(xiàn)有失
敗的task就重新運(yùn)行它。一般情況應(yīng)該把JobTracker部署在單獨(dú)的機(jī)器上。
TaskTracker是運(yùn)行于多個(gè)節(jié)點(diǎn)上的slaver服務(wù)。TaskTracker主動(dòng)與
JobTracker通信,接收作業(yè),并負(fù)責(zé)直接執(zhí)行每一個(gè)任務(wù)。TaskTracker都需要
運(yùn)行在分布式云存儲(chǔ)的DataNode上,
JobTrackerO掛掉怎么辦?
在系統(tǒng)啟動(dòng)時(shí)同時(shí)啟動(dòng)備份JobTrackerl節(jié)點(diǎn),當(dāng)JobTrackerO節(jié)點(diǎn)宕機(jī)
時(shí),ZooKeeper會(huì)在其上啟動(dòng)JobTracker進(jìn)程替代JobTrackerO節(jié)點(diǎn),虛擬IP
會(huì)指向此節(jié)點(diǎn),TaskTracker會(huì)注冊(cè)到此節(jié)點(diǎn)上,未完成的分布式云處理作業(yè)會(huì)
被ZooKeeper調(diào)度到此節(jié)點(diǎn)上重新執(zhí)行。
TaskTracker掛掉怎么辦?
JobTracker是一個(gè)master服務(wù),軟件啟動(dòng)之后JobTracker接收job,負(fù)責(zé)
調(diào)度job的每一個(gè)子任務(wù)task運(yùn)行于TaskTracker上,并監(jiān)控它們,如果發(fā)現(xiàn)
有失敗的task就重新運(yùn)行它。并且將其負(fù)責(zé)的task分配給其他TaskTracker
上。
1.4.2系統(tǒng)擴(kuò)展性
已有的分布式云計(jì)算集群規(guī)模
分布式云計(jì)算是一個(gè)相當(dāng)有彈性和擴(kuò)展性的平臺(tái),它既可以在成千上萬的機(jī)
器上跑,也可以在很小規(guī)模上運(yùn)行。目前最大的分布式云計(jì)算集群有四千臺(tái)機(jī)器。
分布式云計(jì)算擴(kuò)展優(yōu)勢(shì):
與其它分布式系統(tǒng)相比,使用分布式云計(jì)算的好處在于它的水平的可擴(kuò)展性,
在少量結(jié)點(diǎn)上,用分布式云計(jì)算處理有限的數(shù)據(jù)時(shí),不能展示分布式云計(jì)算的性
能,因?yàn)殚_始分布式云計(jì)算程序相關(guān)的代價(jià)比較高,其它并行/分布程序方式,
比如MPI(MessageP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度水電能源供應(yīng)合同補(bǔ)充協(xié)議3篇
- 教育科技推動(dòng)的小學(xué)數(shù)學(xué)教學(xué)變革實(shí)踐
- 2025年度高端商務(wù)酒店租賃合同-包含酒店管理服務(wù)協(xié)議2篇
- 足球大單元計(jì)劃 斜傳直插二過一 說課稿-2023-2024學(xué)年高一上學(xué)期體育與健康人教版必修第一冊(cè)
- 第三單元第3課時(shí)角的度量(說課稿)-2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)人教版
- 第二單元-走進(jìn)表格新世界-第一課《創(chuàng)建工作表》說課稿 2024-2025學(xué)年遼師大版(2015)初中信息技術(shù)七年級(jí)上冊(cè)
- 九下第六單元大單元說課稿
- 2023-2024學(xué)年北京版(2013)小學(xué)信息技術(shù)第一冊(cè) 第一單元第3課計(jì)算機(jī)的硬件和軟件(說課稿)
- 《智能網(wǎng)聯(lián)汽車 自動(dòng)駕駛地圖增量更新 第2部分:情報(bào)資料要求》
- 《第四章 第5節(jié) 光的色散》說課稿-2023-2024學(xué)年初中物理人教版八年級(jí)上冊(cè)
- 傷口敷料種類及作用-課件
- 手術(shù)室護(hù)理實(shí)踐指南2023年
- 電力安全工作規(guī)程(變電部分)課件
- 新人教版六年級(jí)下冊(cè)數(shù)學(xué)全冊(cè)課件
- 環(huán)保設(shè)施安全風(fēng)險(xiǎn)告知卡
- 卵石地層樁基旋挖鉆施工方案
- (完整word版)手卡模板
- GB/T 4091-2001常規(guī)控制圖
- GB/T 13912-2020金屬覆蓋層鋼鐵制件熱浸鍍鋅層技術(shù)要求及試驗(yàn)方法
- GB 18399-2001棉花加工機(jī)械安全要求
- 陜西省延安市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會(huì)明細(xì)
評(píng)論
0/150
提交評(píng)論