




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上安防大數(shù)據(jù)技術(shù)難點分析與解決方案2015-04-09 11:53:32 來源:CPS中安網(wǎng) 作者:鄧長春 責(zé)任編輯: sillyna 摘要:在安防領(lǐng)域,大數(shù)據(jù)具有廣闊的應(yīng)用場景,帶來深度的價值。經(jīng)過初步摸索,安防大數(shù)據(jù)也面臨一些技術(shù)難點。對于這些問題,我們分析安防行業(yè)特有的場景特點,探討一些貼切的解決方案,使得大數(shù)據(jù)技術(shù)更好地為安防業(yè)服務(wù)。 【CPS 】伴隨著大數(shù)據(jù)技術(shù)在IT領(lǐng)域的持續(xù)發(fā)展與成熟,大數(shù)據(jù)逐步滲透到各行各業(yè)。在領(lǐng)域,大數(shù)據(jù)具有廣闊的應(yīng)用場景,帶來深度的價值。經(jīng)
2、過初步摸索,安防大數(shù)據(jù)也面臨一些技術(shù)難點。對于這些問題,我們分析特有的場景特點,探討一些貼切的解決方案,使得大數(shù)據(jù)技術(shù)更好地為安防業(yè)服務(wù)。大數(shù)據(jù)當(dāng)前在各行業(yè)的應(yīng)用大數(shù)據(jù)技術(shù)發(fā)端于IT領(lǐng)域,當(dāng)前在互聯(lián)網(wǎng)、電子商務(wù)中應(yīng)用得最為成熟。Google公司根據(jù)用戶海量的搜索日志,成功預(yù)測病情在北美的蔓延情況;通過分析處理大量的語料庫,為用戶提供精準(zhǔn)的在線翻譯。亞馬遜根據(jù)用戶過往的購買行為,分析出特定用戶群的購買“口味”,從而在自己的網(wǎng)站中提供精準(zhǔn)的廣告推薦。而國內(nèi)的淘寶網(wǎng),通過分析網(wǎng)民瀏覽商品的日志,給買家提供到特定商品的關(guān)聯(lián)匹配。在其他行業(yè),大數(shù)據(jù)的使用也屢見不鮮:在衛(wèi)生行業(yè),基于全民的電子檔案與電子病
3、歷庫正在構(gòu)建。通過全民電子病歷庫,我們能分析全民的健康狀況,監(jiān)控相關(guān)疾病的蔓延走勢,為做好衛(wèi)生防范措施提供參考。在電力行業(yè),通過分析大區(qū)域的用電記錄,能夠優(yōu)化電力企業(yè)管理模式,提升企業(yè)經(jīng)營水平,為基建決策提供有力參考,提高智能控制水平,加強(qiáng)電力的協(xié)同管理。同樣對于整個國家,通過分析用電情況,在宏觀掌握國家的經(jīng)濟(jì)狀況,為制定經(jīng)濟(jì)政策提供參考。在物流行業(yè),通過分析大量以往的配送記錄,在宏觀上掌握大類物品的流向,提前把物品運(yùn)送到特定區(qū)域,提高送貨效率。在國外,一家大型的超市,通過分析交通與商品大體流向,能在精確的時間范圍內(nèi),把特定類商品送到特定的門店,減少庫存時間,提高周轉(zhuǎn)率,創(chuàng)造企業(yè)利潤。同樣,在
4、安防領(lǐng)域,大數(shù)據(jù)也得到廣泛使用。大數(shù)據(jù)助力安防行業(yè)經(jīng)過一段時間的摸索,大數(shù)據(jù)助力安防行業(yè)的發(fā)展取得相當(dāng)?shù)某尚В糠制髽I(yè)如??低暤纫呀?jīng)有了較多的成熟項目案例。在智慧交通方面,海康威視借助大數(shù)據(jù)技術(shù),交通管理系統(tǒng)能夠在惡劣的網(wǎng)絡(luò)環(huán)境,對城區(qū)交通要道進(jìn)行拍攝與錄制,同時把圖片與視頻數(shù)據(jù)輸往后端的大數(shù)據(jù)處理平臺。通過后端大數(shù)據(jù)處理,識別繁忙的路段,提前做好交通分流措施。借助車牌識別技術(shù),綜合各卡口的過車記錄,能夠分析特定車輛的運(yùn)行軌跡。同樣,通過對大量行車違法記錄的模式識別,能在特定路段對具有違規(guī)傾向的車輛進(jìn)行報警,比如在高架橋,高速公路上。通過對城市周邊主要卡口大量的行車記錄分析,能識別出異常的進(jìn)
5、出城的記錄,做好防范措施。在公安執(zhí)法方面,海康威視通過人臉識別技術(shù),提高對犯罪嫌疑人追查的效率。通過對大量異常行為的模式特征提取,能提前判別違法行為,比如在火車站,通過對扒手外觀打扮,行為舉止,作案時的動作特征分析,能夠提前把嫌疑信息告知車站治安人員,提高執(zhí)法的效率。在平安城市、,方方面面,安防大數(shù)據(jù)也引領(lǐng)很多新奇的應(yīng)用。安防大數(shù)據(jù)當(dāng)前面臨的技術(shù)難點然而,伴隨著大數(shù)據(jù)在安防領(lǐng)域越來越深入的應(yīng)用,也突現(xiàn)出一些技術(shù)難點。在IT領(lǐng)域,大數(shù)據(jù)技術(shù)發(fā)展較為成熟,針對不同的應(yīng)用場景有較為豐富的技術(shù)選型以及技術(shù)路線,其中很多技術(shù)可以移植應(yīng)用到安防領(lǐng)域中。但I(xiàn)T與安防畢竟是兩個不同的領(lǐng)域,兩者之間存在很多不一
6、樣的地方。最大的不同,就是數(shù)據(jù)本身的不同,主要體現(xiàn)在一下方面:數(shù)據(jù)類型不同。在IT領(lǐng)域,大數(shù)據(jù)處理的對象往往是網(wǎng)頁索引、用戶行為、日志記錄等字符型數(shù)據(jù),這些是結(jié)構(gòu)化、方便計算識別處理的數(shù)據(jù)。而在安防領(lǐng)域,數(shù)據(jù)往往以圖片、音頻、視頻等非結(jié)構(gòu)化的數(shù)據(jù),往往計算機(jī)不能直接識別,這些數(shù)據(jù)只有在人面前才顯得有意義。數(shù)據(jù)量在數(shù)量級上的不同。在互聯(lián)網(wǎng)領(lǐng)域,單條日志記錄一般在一百字節(jié)之內(nèi),到了1PB的日志記錄,已經(jīng)是一個足夠大的量。但在安防領(lǐng)域,一張普通的縮略圖就幾百KB,如果考慮高清攝像,高清視頻,這個數(shù)量要更大。一個普通的中等城市,在主要交通卡口拍攝的圖片,一年下來就能積壓幾個PB的數(shù)據(jù),如果考慮視頻,這
7、個數(shù)據(jù)量更大。對數(shù)據(jù)的實時性要求不同。在互聯(lián)網(wǎng)行業(yè),以日志型數(shù)據(jù)分析為主的典型應(yīng)用中,對實時性要求沒那么高,比如淘寶的推薦系統(tǒng),是否分析最近一個小時用戶的瀏覽記錄對于推薦效果關(guān)系不大。而在安防領(lǐng)域,前端攝像頭錄制的都是實時流,這是一個不間斷的數(shù)據(jù)流,最近錄制的數(shù)據(jù)超過一定時間沒有得到有效保存,將會永遠(yuǎn)被丟失。針對安防領(lǐng)域與IT領(lǐng)域在數(shù)據(jù)本身上的異同,把適合IT領(lǐng)域常規(guī)的大數(shù)據(jù)技術(shù)搬到安防領(lǐng)域就會碰到一些技術(shù)難點,表現(xiàn)如下:存儲成本問題。在IT領(lǐng)域,海量的數(shù)據(jù)往往保存在分布式存儲系統(tǒng)中,為了提高數(shù)據(jù)的可靠性,一份數(shù)據(jù)往往復(fù)制成幾份相同的副本,分別保存在不同的節(jié)點中,當(dāng)其中一些副本丟失時,可以從其
8、他節(jié)點讀出數(shù)據(jù)。比如在Hadoop中,一份數(shù)據(jù)往往在集群中保存了相同的3份。如果有1PB的原始數(shù)據(jù),則至少要占用3PB的磁盤空間。而在安防領(lǐng)域,幾個交通卡口的視頻,在一個較短的時間內(nèi),如果不覆蓋之前的數(shù)據(jù),就能輕易積壓幾個PB。由于圖像、音頻、視頻數(shù)據(jù)本身的量太大,生搬傳統(tǒng)的多副本策略成本過高,我們需要設(shè)計出一些更高效同時不損失可用性的方案。小文件存儲問題。這個問題是大數(shù)據(jù)技術(shù)面臨的一個共性問題,但在安防領(lǐng)域可能又突現(xiàn)得較為嚴(yán)重。在互聯(lián)網(wǎng),小文本、圖片、音樂都是小文件,當(dāng)層積較多時,都面臨如何存取這些海量小文件的問題。而在安防行業(yè),小文件主要以圖片為主,比如一個城市的主要交通卡口在一年內(nèi),就能
9、產(chǎn)生百億張圖片。對于這些海量的小文件的存儲,涉及到大量元數(shù)據(jù)的管理,保證存取的性能是問題的關(guān)鍵。當(dāng)然,問題并不可怕,通過分析研究安防應(yīng)用場景,我們摸索出一些貼合安防大數(shù)據(jù)的解決方案。解決問題的方向引入擦除碼(ErasureCode)技術(shù),節(jié)省存儲空間。擦除碼是一個在通信理論中的術(shù)語,其基本思想就是:一條原始信息由K個符號構(gòu)成,在信息發(fā)送前,通過某種具有冗余功能的數(shù)學(xué)映射,生成由(K+M)個符號組成的編碼后的信息,然后把編碼后的信息通過信道發(fā)送給接受方,由于信道的不可靠特性,在信息傳輸?shù)倪^程中可能會丟失幾個符號,接受方在接受到信息后,只要丟失的符號不超過M個,則接受方在剩余的符號中通過逆向的數(shù)學(xué)
10、變換,能還原出由K個符號組成的原始信息。圖-1:信息在信道中的傳輸過程如上圖所示:原始信息由A、B、C三個符號組成,現(xiàn)在通過編碼函數(shù)f對其進(jìn)行編碼,生成編碼后的信息為a、b、c、d、e,編碼后的信息在信道上進(jìn)行傳輸,在傳輸?shù)倪^程中由于某種原因符號a與b丟失了,接受方只接受到了三個符號c、d、e,接受方通過解碼函數(shù)-f(實際上就是編碼函數(shù)的逆函數(shù))進(jìn)行解碼,能夠計算出原始的信息A、B、C。由上可看出,信道雖然不可靠,但在信道上丟失的兩個符號并不影響我們整個信息的傳輸,我們唯一要做的工作就是在發(fā)送信息前與接收信息后做一定的編碼與解碼工作。受上面思想的啟迪,在分布式存儲系統(tǒng)中,一個大文件分成若干塊,
11、這些不同的塊分發(fā)到不同的節(jié)點中,現(xiàn)在假設(shè)一個文件由K個數(shù)據(jù)塊組成,我們通過編碼后變成(K+M)個編碼塊,再把這(K+M)個編碼塊分發(fā)到不同的節(jié)點中。現(xiàn)在由于集群中幾個節(jié)點失敗,丟失了幾個塊,只要丟失的塊數(shù)不超過M,我們依然能從其他節(jié)點中讀入K個編碼塊,通過解碼運(yùn)算,得出我們之前的K個數(shù)據(jù)塊,也就還原出那個完整的文件。而在分布式系統(tǒng)中,超過M個數(shù)據(jù)節(jié)點同時失效的可能性很小,由此可以看出,雖然存在節(jié)點失敗的情況,但依然不影響我們數(shù)據(jù)存儲的可靠性。這里引入額外的存儲空間為(M/K)倍,而傳統(tǒng)的N副本策略,引入的額外存儲空間為(N-1)倍,通過調(diào)節(jié)M與K的關(guān)系,我們能把存儲空間降到1.3倍,這與傳統(tǒng)H
12、adoop占用存儲空3倍相比,具有巨大的節(jié)省價值。在工程實踐中,我們通過數(shù)據(jù)分條帶,優(yōu)化編碼分組策略,進(jìn)行高效快速的編解碼計算,既保證數(shù)據(jù)存取的性能,又節(jié)省了大量的磁盤空間。如圖-2,數(shù)據(jù)橫向分條帶,同一個條帶內(nèi),左邊為原始數(shù)據(jù)(K=4),右邊為編碼后的數(shù)據(jù)(M=2),存儲時,把同一個條帶內(nèi)的所有數(shù)據(jù)分發(fā)到分布式系統(tǒng)上的不同節(jié)點。當(dāng)處于同一個條帶內(nèi)的數(shù)據(jù)丟失塊數(shù)不超過2時,依然能從剩下的數(shù)據(jù)塊中通過解碼計算出原始的數(shù)據(jù)。圖-2:數(shù)據(jù)分條帶,進(jìn)行編碼存儲建立索引,小文件合并成大文件集中存儲。對于大量的數(shù)據(jù),單機(jī)無法存儲,借助分布式存儲技術(shù),將數(shù)據(jù)分散存儲到不同的節(jié)點上。但主流的HDFS分布式存儲
13、系統(tǒng)適合存儲少量的大文件,就是文件個數(shù)較少,但單個文件的很大。如果大量的小文件樸素的存放在HDFS中,由于要管理的元數(shù)據(jù)巨大,嚴(yán)重印象集群的可擴(kuò)展性,以及文件本身的存儲性能。解決問題的思路是,把大量的小文件合成一個大文件,同時對這些小文件建立索引,索引信息集中管理。當(dāng)要讀取文件時,先查找索引信息,根據(jù)查找出的索引信息再定位到那個大文件具體位置,讀出小文件。圖-3小文件合成大文件,并且建立索引如圖-3,上面為把若干小文件合成一個大的文件,下面為針對這些小文件建立的索引,所有的索引又合成一個索引文件。在工程實踐中,我們又對索引文件的結(jié)構(gòu)進(jìn)行了優(yōu)化,引入了哈希索引結(jié)構(gòu),由于哈希定位過程相當(dāng)過,所以提升了小文件的讀取性能。同時,由于索引文件很小,我們除把索引文件持久化到底層文件系統(tǒng),還同時把索引信息讀入內(nèi)存,這樣極大提升了文件存取效率。結(jié)語隨著大數(shù)據(jù)技術(shù)的逐步發(fā)展與深入應(yīng)用,它會給我們帶來越來越多的潛在價值。當(dāng)安防行業(yè)進(jìn)入就計算化時代后,各種前端設(shè)備采集大量的圖片、音頻、視頻,這個數(shù)據(jù)在一個較小的區(qū)域一個較短的時間內(nèi),就能積攢海量的數(shù)據(jù),要掌握并且成功挖掘出這些數(shù)據(jù)的價值,更好的為安防服務(wù),急需我們掌握大數(shù)據(jù)技術(shù)。目前,安防行業(yè)僅有??低暤葮O個別企業(yè)掌
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公共關(guān)系學(xué)網(wǎng)絡(luò)公關(guān)試題及答案
- 生物醫(yī)學(xué)新技術(shù)研究進(jìn)展試題
- 社區(qū)景觀設(shè)計案例分析
- 商業(yè)合作推廣活動策劃協(xié)議
- 安保服務(wù)合同終止協(xié)議書
- 歷史學(xué)世界近現(xiàn)代史試題匯編
- 行政管理公共關(guān)系學(xué)資源配置試題及答案
- 辯論社團(tuán)技能提升計劃
- 蛋糕模型設(shè)計軟件介紹
- 廈門春招考試試題及答案
- 正畸沙龍專用宣教PPT-口腔正畸正當(dāng)時
- 康復(fù)治療技術(shù)(康復(fù)養(yǎng)老服務(wù))專業(yè)群建設(shè)方案
- 阿帕套裝汽車改燈燈光升級ppt課件
- 防止水電站水淹廠房措施研究報告
- 年產(chǎn)12.5萬噸鹽酸工程二段吸收工序工藝設(shè)計
- 衛(wèi)生監(jiān)督稽查規(guī)范
- dn2000輸水管道壓力試驗方案(精)
- 修正責(zé)任準(zhǔn)備金
- authorware7程序設(shè)計制作一個時鐘
- 變速器換擋叉的加工工藝規(guī)程及工裝設(shè)計帶圖紙】
- 安措費(fèi)及清單
評論
0/150
提交評論