版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1.背景2.項(xiàng)目?jī)?nèi)容3.項(xiàng)目方案3.1cStor云存儲(chǔ)系統(tǒng)介紹3.1.1cStor云存儲(chǔ)系統(tǒng)簡(jiǎn)介cStor云存儲(chǔ)系統(tǒng)是南京云創(chuàng)存儲(chǔ)科技有限公司自主研發(fā)的高科技產(chǎn)品,是一種軟件與硬件相結(jié)合的系統(tǒng),其中專有技術(shù)和軟件是高附加值部分。與目前國(guó)際上知名的云存儲(chǔ)技術(shù)相比,具有超高性價(jià)比、高可靠、通用、免維護(hù)的優(yōu)勢(shì),可以廣泛應(yīng)用于需要存儲(chǔ)大量數(shù)據(jù)的應(yīng)用場(chǎng)合(如安防、廣電、電信、互聯(lián)網(wǎng)、銀行等領(lǐng)域)。特別地,cStor每個(gè)標(biāo)準(zhǔn)機(jī)架的最高容量可達(dá)1024TB以上,是國(guó)際最高水平的3倍,擁有成本和運(yùn)營(yíng)成本都僅為同類產(chǎn)品的幾分之一。下圖1-1為cStor云存儲(chǔ)產(chǎn)品C1000系列存儲(chǔ)機(jī)柜。圖1-1cStorC1000系列產(chǎn)品存儲(chǔ)機(jī)柜3.1.2C1000系列產(chǎn)品特性C1000系列云存儲(chǔ)產(chǎn)品是南京云創(chuàng)存儲(chǔ)科技有限公司的第一代云存儲(chǔ)產(chǎn)品,它具有如下特性:高可靠性系統(tǒng)中采用廉價(jià)的大容量存儲(chǔ)服務(wù)節(jié)點(diǎn),通過(guò)cStor系統(tǒng)軟件實(shí)現(xiàn)統(tǒng)一管理和容錯(cuò),提供高效、穩(wěn)定服務(wù)。與使用專用服務(wù)器相比,可以將系統(tǒng)構(gòu)建成本節(jié)省5-10倍以上,且規(guī)模越大,優(yōu)勢(shì)越明顯。在降低系統(tǒng)的構(gòu)建成本的同時(shí),系統(tǒng)的可靠性不僅沒(méi)有收到影響,相反,通過(guò)一系列的可靠性保障機(jī)制,使得cStor系統(tǒng)具有高可靠性的特性。在cStor云存儲(chǔ)系統(tǒng)中,數(shù)據(jù)具有多個(gè)副本(默認(rèn)情況下是2份,可以根據(jù)需要設(shè)置),任意節(jié)點(diǎn)出現(xiàn)故障,系統(tǒng)將會(huì)自動(dòng)復(fù)制數(shù)據(jù)副本到新的節(jié)點(diǎn)上,不會(huì)丟失數(shù)據(jù)。這樣,在節(jié)點(diǎn)發(fā)生故障的情況下,也可以實(shí)現(xiàn)數(shù)據(jù)的無(wú)間斷服務(wù)。同時(shí),元數(shù)據(jù)管理節(jié)點(diǎn)采用雙機(jī)鏡像模式容錯(cuò),如果有一節(jié)點(diǎn)出現(xiàn)故障,另一節(jié)點(diǎn)自動(dòng)接替。高性能cStor采用控制流與數(shù)據(jù)流分離的技術(shù),數(shù)據(jù)的存儲(chǔ)或讀取實(shí)際上是與各個(gè)存儲(chǔ)節(jié)點(diǎn)上并行讀寫;這樣隨著存儲(chǔ)節(jié)點(diǎn)數(shù)目的增多,整個(gè)系統(tǒng)的吞吐量和IO性能將呈線性增長(zhǎng)。同時(shí),cStor采用負(fù)載均衡技術(shù),自動(dòng)均衡各服務(wù)器負(fù)載,使得各存儲(chǔ)節(jié)點(diǎn)的性能調(diào)節(jié)到最高。在線伸縮cStor云存儲(chǔ)系統(tǒng)擴(kuò)容非常方便,支持不停止服務(wù)的情況下,動(dòng)態(tài)加入新的存儲(chǔ)節(jié)點(diǎn),無(wú)需任何操作,即實(shí)現(xiàn)擴(kuò)容;同時(shí),無(wú)需人為干預(yù),也可以摘下任意節(jié)點(diǎn),系統(tǒng)自動(dòng)縮小規(guī)模而不丟失數(shù)據(jù),存儲(chǔ)在此節(jié)點(diǎn)上的數(shù)據(jù)將會(huì)重新備份到其他節(jié)點(diǎn)上。通用易用cStor云存儲(chǔ)系統(tǒng)提供標(biāo)準(zhǔn)POSIX接口,無(wú)論是哪種操作系統(tǒng)下的應(yīng)用程序,都可以不經(jīng)修改將云存儲(chǔ)當(dāng)成自己的海量磁盤來(lái)使用。同時(shí),也提供專用的API接口,供開(kāi)發(fā)人員調(diào)用。智能管理提供基于WEB的管理平臺(tái),所有的管理工作均由cStor管理模塊自動(dòng)完成,使用人員無(wú)需任何專業(yè)知識(shí)便可以輕松管理整個(gè)系統(tǒng)。通過(guò)管理平臺(tái),可以對(duì)cStor中的所有節(jié)點(diǎn)實(shí)行無(wú)間斷監(jiān)控,用戶通過(guò)監(jiān)控界面可以清楚地了解到每一個(gè)節(jié)點(diǎn)和磁盤的運(yùn)行情況。
3.1.3產(chǎn)品技術(shù)架構(gòu)C1000系列產(chǎn)品采用cStor分布式云存儲(chǔ)文件系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行集中式海量存儲(chǔ)和統(tǒng)一管理,其技術(shù)架構(gòu)和關(guān)鍵技術(shù)在下面的章節(jié)中分別詳細(xì)介紹。技術(shù)架構(gòu)cStor云存儲(chǔ)文件系統(tǒng)采用分布式的存儲(chǔ)機(jī)制,將數(shù)據(jù)分散存儲(chǔ)在多臺(tái)獨(dú)立的存儲(chǔ)服務(wù)器上。它采用包括元數(shù)據(jù)管理服務(wù)器(MasterServer)和數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn)服務(wù)器(ChunkServer)以及客戶端節(jié)點(diǎn)的結(jié)構(gòu)構(gòu)成一個(gè)虛擬的海量存儲(chǔ)卷,如下圖所示。圖2-1cStor云存儲(chǔ)系統(tǒng)架構(gòu)其中,MasterServer保存系統(tǒng)的元數(shù)據(jù),負(fù)責(zé)對(duì)整個(gè)文件系統(tǒng)的管理,MasterServer在邏輯上只有一個(gè),但采用主備雙機(jī)鏡像的方式,保證系統(tǒng)的不間斷服務(wù);ChunkServer負(fù)責(zé)具體的數(shù)據(jù)存儲(chǔ)工作,數(shù)據(jù)以文件的形式存儲(chǔ)在ChunkServer上,ChunkServer的個(gè)數(shù)可以有多個(gè),它的數(shù)目直接決定了cStor云存儲(chǔ)系統(tǒng)的規(guī)模;客戶端即為服務(wù)器對(duì)外提供數(shù)據(jù)存儲(chǔ)和訪問(wèn)服務(wù)的窗口,通常情況下,客戶端都部署在ChunkServer上,每一個(gè)塊數(shù)據(jù)服務(wù)器,及時(shí)存儲(chǔ)服務(wù)器也是客戶端服務(wù)器。對(duì)每一個(gè)節(jié)點(diǎn),cStor云存儲(chǔ)系統(tǒng)提供的管理監(jiān)控中心都可以對(duì)其進(jìn)行管理,包括設(shè)備運(yùn)行狀態(tài)、磁盤運(yùn)行狀態(tài)、服務(wù)在線情況以及異常告警等功能;另外,網(wǎng)管監(jiān)控中心還提供有如FTP賬戶添加等客戶端管理和配置工具。這種分布式系統(tǒng)最大的好處是有利于存儲(chǔ)系統(tǒng)的擴(kuò)展和實(shí)現(xiàn),在小規(guī)模的數(shù)據(jù)擴(kuò)展時(shí),只需要添加具體的ChunkServer即可,而不需要添加整套設(shè)備。下圖2-2為cStor云存儲(chǔ)系統(tǒng)部署示意圖。圖2-2cStor云存儲(chǔ)系統(tǒng)部署示意圖cStor云存儲(chǔ)系統(tǒng)所有的節(jié)點(diǎn)均通過(guò)網(wǎng)絡(luò)的方式連接起來(lái),其中存儲(chǔ)節(jié)點(diǎn)采用廉價(jià)的計(jì)算機(jī)節(jié)點(diǎn),運(yùn)用自適應(yīng)副本管理技術(shù)進(jìn)行容錯(cuò)。所有存儲(chǔ)節(jié)點(diǎn)同時(shí)擔(dān)任對(duì)外服務(wù)功能,客戶端分別掛載到不同存儲(chǔ)節(jié)點(diǎn)訪問(wèn)云存儲(chǔ)系統(tǒng)。通過(guò)增加或者減少存儲(chǔ)節(jié)點(diǎn)的方式,即可以對(duì)存儲(chǔ)系統(tǒng)進(jìn)行在線伸縮,由于采用了自適應(yīng)副本管理技術(shù)進(jìn)行容錯(cuò),系統(tǒng)在線伸縮的過(guò)程中,不影響系統(tǒng)對(duì)外提供服務(wù)。下面簡(jiǎn)單的介紹下cStor系統(tǒng)的工作原理和管理機(jī)制。工作原理對(duì)于cStor云存儲(chǔ)的用戶來(lái)說(shuō),通過(guò)cStor客戶端可以將海量云存儲(chǔ)系統(tǒng)映射成一個(gè)本地海量磁盤(Windows客戶端)或者映射到一個(gè)目錄(Linux客戶端),對(duì)于此磁盤或者目錄的讀寫操作,即可實(shí)現(xiàn)云存儲(chǔ)系統(tǒng)數(shù)據(jù)的讀寫。同時(shí),由于cStor文件系統(tǒng)支持POSIX接口規(guī)范,對(duì)于目前一般的應(yīng)用不需要做二次開(kāi)發(fā)即可使用。下面詳細(xì)的介紹一下cStor云存儲(chǔ)系統(tǒng)的實(shí)際讀寫過(guò)程。下圖2-3是cStor客戶端向系統(tǒng)中寫數(shù)據(jù)的流程圖。圖2-3cStor客戶端寫數(shù)據(jù)流程其詳細(xì)過(guò)程是:cStor客戶端向元數(shù)據(jù)服務(wù)器發(fā)起數(shù)據(jù)寫請(qǐng)求;元數(shù)據(jù)服務(wù)器根據(jù)其管理的存儲(chǔ)節(jié)點(diǎn)的工作和使用情況,根據(jù)負(fù)載均衡的原理,在相關(guān)存儲(chǔ)節(jié)點(diǎn)上創(chuàng)建一些新的數(shù)據(jù)塊;相關(guān)存儲(chǔ)節(jié)點(diǎn)服務(wù)器創(chuàng)建成功,將結(jié)果返回給元數(shù)據(jù)服務(wù)器;元數(shù)據(jù)服務(wù)器一方面?zhèn)浞莺屯酱嗽獢?shù)據(jù)信息,另一方面將相關(guān)存儲(chǔ)節(jié)點(diǎn)信息返回給客戶端;客戶端根據(jù)得到的存儲(chǔ)節(jié)點(diǎn)信息,向?qū)?yīng)存儲(chǔ)節(jié)點(diǎn)發(fā)出數(shù)據(jù)寫請(qǐng)求,并向存儲(chǔ)節(jié)點(diǎn)發(fā)送數(shù)據(jù);存儲(chǔ)節(jié)點(diǎn)接收數(shù)據(jù)并存儲(chǔ)到相應(yīng)塊,同時(shí)也向其他存儲(chǔ)節(jié)點(diǎn)發(fā)起備份;當(dāng)本地寫以及備份均成功后,存儲(chǔ)節(jié)點(diǎn)將成功信息返回給客戶端;客戶端收到成功信號(hào)后,即完成數(shù)據(jù)的存儲(chǔ)。下圖為cStor客戶端讀數(shù)據(jù)流程圖如下所示:圖2-4cStor客戶端讀數(shù)據(jù)流程總的來(lái)說(shuō),cStor云存儲(chǔ)系統(tǒng)的控制流和數(shù)據(jù)流是分離的,一方面降低了元數(shù)據(jù)服務(wù)的負(fù)擔(dān),使得其處理能力更強(qiáng),另一方面將數(shù)據(jù)讀寫的負(fù)擔(dān)分擔(dān)到各存儲(chǔ)節(jié)點(diǎn),使得系統(tǒng)的整體性能得到了提高,與節(jié)點(diǎn)數(shù)目成正相關(guān)。管理機(jī)制cStor云存儲(chǔ)系統(tǒng)采用的是一種基于網(wǎng)絡(luò)的管理工具,稱之為cStor網(wǎng)管監(jiān)控中心,主要用來(lái)對(duì)cStor云存儲(chǔ)系統(tǒng)進(jìn)行遠(yuǎn)程監(jiān)控和管理,其具體功能包括:提供存儲(chǔ)機(jī)架的虛擬化管理;可以監(jiān)測(cè)到每個(gè)節(jié)點(diǎn)服務(wù)器的運(yùn)行狀態(tài)(包括主備元數(shù)據(jù)服務(wù)器和存儲(chǔ)節(jié)點(diǎn)服務(wù)器的內(nèi)存、CPU、系統(tǒng)盤的利用情況等);磁盤的運(yùn)行狀態(tài)和使用情況監(jiān)控;cStor服務(wù)的啟動(dòng)和關(guān)閉;所有服務(wù)器的重啟、關(guān)閉;卷管理服務(wù)器的設(shè)置和賬戶管理;FTP賬戶的批量添加和刪除等。3.1.4關(guān)鍵技術(shù)負(fù)載自動(dòng)均衡技術(shù)cStor采用中心服務(wù)器模式來(lái)管理整個(gè)云存儲(chǔ)文件系統(tǒng),所有元數(shù)據(jù)均保存在MasterServer上,文件則劃分為多個(gè)chunk存儲(chǔ)在不同的ChunkServer上。MasterServer維護(hù)了一個(gè)統(tǒng)一的命名空間,同時(shí)掌握整個(gè)系統(tǒng)內(nèi)ChunkServer的使用情況,當(dāng)客戶端向元數(shù)據(jù)服務(wù)器發(fā)送數(shù)據(jù)讀寫的請(qǐng)求時(shí),元數(shù)據(jù)服務(wù)器根據(jù)ChunkServer的磁盤使用情況、網(wǎng)絡(luò)負(fù)擔(dān)等情況,選擇負(fù)擔(dān)最輕的ChunkServer對(duì)外提供服務(wù),自動(dòng)均衡負(fù)載負(fù)擔(dān)。另外,當(dāng)某有一個(gè)ChunkServer因?yàn)闄C(jī)器故障或者其他原因造成離線時(shí),MasterServer會(huì)將此機(jī)器自動(dòng)屏蔽掉,不再將此ChunkServer提供給客戶端使用,同時(shí)存儲(chǔ)在此ChunkServer上的數(shù)據(jù)也會(huì)自動(dòng)的備份到其他可用的ChunkServer上,自動(dòng)屏蔽ChunkServer故障對(duì)系統(tǒng)的影響。高速并發(fā)訪問(wèn)技術(shù)客戶端在訪問(wèn)cStor時(shí),首先訪問(wèn)MasterServer節(jié)點(diǎn),獲取將要與之進(jìn)行交互的ChunkServer信息,然后直接訪問(wèn)這些ChunkServer完成數(shù)據(jù)存取。cStor的這種設(shè)計(jì)方法實(shí)現(xiàn)了控制流和數(shù)據(jù)流的分離。Client與MasterServer之間只有控制流,而無(wú)數(shù)據(jù)流,這樣就極大地降低了MasterServer的負(fù)載,使之不成為系統(tǒng)性能的一個(gè)瓶頸。Client與ChunkServer之間直接傳輸數(shù)據(jù)流,同時(shí)由于文件被分成多個(gè)chunk進(jìn)行分布式存儲(chǔ),Client可以同時(shí)訪問(wèn)多個(gè)ChunkServer,從而使得整個(gè)系統(tǒng)的I/O高度并行,系統(tǒng)整體性能得到提高。通常情況下,系統(tǒng)的整體吞吐率與ChunkServer的數(shù)量呈正比。高可靠性保證技術(shù)對(duì)于元數(shù)據(jù),cStor通過(guò)操作日志來(lái)提供容錯(cuò)功能,當(dāng)MasterServer發(fā)生故障時(shí),在磁盤數(shù)據(jù)保存完好的情況下,可以迅速恢復(fù)以上元數(shù)據(jù)。為了防止MasterServer徹底死機(jī)的情況,cStor還提供了MasterServer遠(yuǎn)程的實(shí)時(shí)備份,這樣在當(dāng)前的MasterServer出現(xiàn)故障無(wú)法工作的時(shí)候,另外一臺(tái)備MasterServer可以迅速接替其工作。對(duì)于ChunkServer,cStor采用副本的方式實(shí)現(xiàn)容錯(cuò)。每一個(gè)chunk有多個(gè)存儲(chǔ)副本(默認(rèn)為兩個(gè)),分布存儲(chǔ)在不同的ChunkServer上。副本的分布策略考慮了多種因素,如網(wǎng)絡(luò)的拓?fù)?、機(jī)架的分布、磁盤的利用率等。對(duì)于每一個(gè)ChunkServer,必須將所有的副本全部寫入成功,才視為成功寫入。在其后的過(guò)程中,如果相關(guān)的副本出現(xiàn)丟失或不可恢復(fù)等狀況,MasterServer會(huì)自動(dòng)將該副本復(fù)制到其他ChunkServer,從而確保副本保持一定的個(gè)數(shù)。在有多個(gè)ChunkServer的情況下,任意損失一個(gè)節(jié)點(diǎn),數(shù)據(jù)都不會(huì)丟失,而且隨著ChunkServer數(shù)目的增多,整個(gè)系統(tǒng)的可靠性越大。高可用技術(shù)系統(tǒng)中的所有服務(wù)節(jié)點(diǎn)均是通過(guò)網(wǎng)絡(luò)連接在一起,由于采用了高可靠的容錯(cuò)機(jī)制,系統(tǒng)增減節(jié)點(diǎn)不必停止服務(wù),可在線增減存儲(chǔ)節(jié)點(diǎn),存儲(chǔ)節(jié)點(diǎn)和元數(shù)據(jù)節(jié)點(diǎn)間通過(guò)注冊(cè)管理機(jī)制自適應(yīng)管理,實(shí)現(xiàn)自動(dòng)伸縮。元數(shù)據(jù)服務(wù)器采用主備雙機(jī)熱備技術(shù),主機(jī)故障,備機(jī)自動(dòng)接替其工作,對(duì)外服務(wù)不停止;存儲(chǔ)節(jié)點(diǎn)采用冗余備份機(jī)制,多個(gè)存儲(chǔ)節(jié)點(diǎn)情況下,任意損失一個(gè)節(jié)點(diǎn),數(shù)據(jù)不丟失,服務(wù)不停止。3.1.5產(chǎn)品應(yīng)用模式與部署方案cStor云存儲(chǔ)系統(tǒng)主要是為海量數(shù)據(jù)的集中存儲(chǔ)和處理提供解決方案。針對(duì)不同的應(yīng)用場(chǎng)景,它主要有如下集中應(yīng)用模式,下面分而敘之。企業(yè)典型云存儲(chǔ)應(yīng)用模式隨著社會(huì)信息化程度的不斷提高,越來(lái)越多的企業(yè)對(duì)海量數(shù)據(jù)存儲(chǔ)和處理的需求越來(lái)越迫切。海量數(shù)據(jù)爆炸式增長(zhǎng),傳統(tǒng)存儲(chǔ)模式面臨著擴(kuò)容不方便、系統(tǒng)吞吐量不足、無(wú)法支持多用戶高并發(fā)快速訪問(wèn)等問(wèn)題。如下為傳統(tǒng)存儲(chǔ)模式的示意圖:圖3-1傳統(tǒng)存儲(chǔ)模式傳統(tǒng)存儲(chǔ)都是通過(guò)中心服務(wù)器來(lái)將數(shù)據(jù)轉(zhuǎn)存到磁盤陣列或磁盤柜等存儲(chǔ)介質(zhì)中,這樣的模式很容易成為系統(tǒng)的瓶頸。cStor基于分布式的云存儲(chǔ)架構(gòu),能夠完美的解決傳統(tǒng)存儲(chǔ)模式所遇到擴(kuò)容不方便、系統(tǒng)吞吐量不足、無(wú)法支持多用戶高并發(fā)快速訪問(wèn)等問(wèn)題?;赾Stor云存儲(chǔ)具體解決方案如下:圖3-2cStor云存儲(chǔ)集中存儲(chǔ)模式采用cStor云存儲(chǔ)的典型云存儲(chǔ)模式具有如下特點(diǎn):動(dòng)態(tài)伸縮系統(tǒng)增減節(jié)點(diǎn)不必停止服務(wù),可在線增減存儲(chǔ)節(jié)點(diǎn),存儲(chǔ)節(jié)點(diǎn)和元數(shù)據(jù)節(jié)點(diǎn)間通過(guò)注冊(cè)管理機(jī)制自適應(yīng)管理,實(shí)現(xiàn)自動(dòng)伸縮,并且系統(tǒng)可提供7*24小時(shí)不間斷的存儲(chǔ)服務(wù)。很好的解決了傳統(tǒng)存儲(chǔ)模式擴(kuò)容不方便的問(wèn)題。優(yōu)異性能采用控制流和數(shù)據(jù)流分離的技術(shù),每個(gè)存儲(chǔ)節(jié)點(diǎn)都對(duì)外提供數(shù)據(jù)訪問(wèn)服務(wù),系統(tǒng)的總體性能與存儲(chǔ)節(jié)點(diǎn)的規(guī)模成正比,整個(gè)系統(tǒng)的吞吐量隨著節(jié)點(diǎn)的規(guī)模增加呈線性增長(zhǎng),系統(tǒng)的規(guī)模越大云存儲(chǔ)系統(tǒng)的優(yōu)勢(shì)越明顯。多用戶高并發(fā)快速訪問(wèn)系統(tǒng)自動(dòng)均衡負(fù)載,根據(jù)節(jié)點(diǎn)的空間使用比例將負(fù)載自動(dòng)均衡到不同的存儲(chǔ)服務(wù)器上,同時(shí)將不同的用戶端的流量自動(dòng)分擔(dān)到不同的存儲(chǔ)節(jié)點(diǎn)上,從而支持多用戶高并發(fā)快速訪問(wèn)。大規(guī)模虛擬機(jī)映像文件云存儲(chǔ)應(yīng)用模式目前,虛擬化技術(shù)在企業(yè)中的運(yùn)用是越來(lái)越多,特別是桌面云等云計(jì)算技術(shù)的應(yīng)用,那么存儲(chǔ)這些虛擬機(jī)鏡像也越來(lái)越成為一個(gè)擺在企業(yè)面前的問(wèn)題:在傳統(tǒng)的存儲(chǔ)模式下,系統(tǒng)通過(guò)單節(jié)點(diǎn)存儲(chǔ)服務(wù)器對(duì)外提供虛擬機(jī)映像文件的訪問(wèn),當(dāng)訪問(wèn)的節(jié)點(diǎn)達(dá)到一定數(shù)量的時(shí)候,受訪問(wèn)的服務(wù)器便無(wú)法提供如此高的吞吐率,因此傳統(tǒng)模式不能滿足大規(guī)模的虛擬機(jī)映像文件的存儲(chǔ)需求。為了解決傳統(tǒng)存儲(chǔ)模式的缺陷,我公司提出了基于cStor云存儲(chǔ)的解決方案,如下圖所示:圖3-3大規(guī)模虛擬機(jī)映像文件存儲(chǔ)由于cStor采用控制流和數(shù)據(jù)流分離的技術(shù),用戶訪問(wèn)時(shí)通過(guò)元數(shù)據(jù)管理服務(wù)器獲取文件存儲(chǔ)的信息,然后直接與各個(gè)存儲(chǔ)節(jié)點(diǎn)交互進(jìn)行文件的存取訪問(wèn),避免了元數(shù)據(jù)服務(wù)器超負(fù)載的現(xiàn)象,同時(shí)系統(tǒng)的整體吞吐率隨著存儲(chǔ)節(jié)點(diǎn)的增多呈線性增長(zhǎng),解決了傳統(tǒng)方式的超大數(shù)量用戶訪問(wèn)的瓶頸。廣電媒資系統(tǒng)云存儲(chǔ)應(yīng)用模式隨著視頻技術(shù)的高速發(fā)展,以及高清、新媒體等業(yè)務(wù)的全面展開(kāi),媒資管理系統(tǒng)對(duì)可靠性、存儲(chǔ)容量、訪問(wèn)寬帶等要求不斷提高,除了業(yè)務(wù)與設(shè)備高度耦合造成的設(shè)備共享困難外,廣電媒體IT系統(tǒng)的管理復(fù)雜度也越來(lái)越高。針對(duì)目前的業(yè)務(wù)需求和存儲(chǔ)策略,我們提出了如下的云存儲(chǔ)解決方案:圖3-4廣電媒資系統(tǒng)cStor存儲(chǔ)應(yīng)用模式采用cStor云存儲(chǔ)模式的系統(tǒng),具有如下特點(diǎn):高度可靠針對(duì)小文件采用多個(gè)數(shù)據(jù)塊副本的方式實(shí)現(xiàn)冗余可靠,數(shù)據(jù)在不同的存儲(chǔ)節(jié)點(diǎn)上具有多個(gè)塊副本,任意節(jié)點(diǎn)發(fā)生故障,系統(tǒng)將自動(dòng)復(fù)制數(shù)據(jù)塊副本到新的存儲(chǔ)節(jié)點(diǎn)上,數(shù)據(jù)不丟失,實(shí)現(xiàn)數(shù)據(jù)完整可靠;針對(duì)大文件采用超安存(S3)編解碼算法的方式實(shí)現(xiàn)高度可靠,任意同時(shí)損壞多個(gè)存儲(chǔ)節(jié)點(diǎn),數(shù)據(jù)可通過(guò)超安存算法解碼自動(dòng)恢復(fù)。該特性可適用于對(duì)數(shù)據(jù)安全級(jí)別極高的場(chǎng)合,同時(shí)相對(duì)于副本冗余的可靠性實(shí)現(xiàn)方式大大提高了磁盤空間利用率,不到40%的磁盤冗余即可實(shí)現(xiàn)任意同時(shí)損壞三個(gè)存儲(chǔ)節(jié)點(diǎn)而不丟失數(shù)據(jù)。元數(shù)據(jù)管理節(jié)點(diǎn)采用雙機(jī)鏡像熱備份的高可用方式容錯(cuò),其中一臺(tái)服務(wù)器故障,可無(wú)縫自動(dòng)切換到另一臺(tái)服務(wù)器,服務(wù)不間斷。整個(gè)系統(tǒng)無(wú)單點(diǎn)故障,硬件故障自動(dòng)屏蔽。超大規(guī)??芍蔚娜萘拷咏鼰o(wú)限,理論容量為1024x1024x1024PB(1G個(gè)PB容量)。多用戶高并發(fā)快速訪問(wèn)傳統(tǒng)方式不能滿足同時(shí)上傳和下載的高速并發(fā)訪問(wèn)的要求,cStor云存儲(chǔ)系統(tǒng)能夠自動(dòng)均衡負(fù)載,根據(jù)節(jié)點(diǎn)的空間使用比例將負(fù)載自動(dòng)均衡到不同的存儲(chǔ)服務(wù)器上,同時(shí)將不同的用戶端的流量自動(dòng)分擔(dān)到不同的存儲(chǔ)節(jié)點(diǎn)上,從而支持多用戶高并發(fā)快速訪問(wèn)。智能管理一鍵式安裝,智能化自適應(yīng)管理,簡(jiǎn)單方便的監(jiān)控界面,無(wú)需學(xué)習(xí)即可使用。城市視頻監(jiān)控云存儲(chǔ)應(yīng)用模式隨著城市視頻監(jiān)控布設(shè)的越來(lái)越全面,如果采用1080P的高清視頻監(jiān)控,使用能獲得最高壓縮比的H.264圖像壓縮技術(shù)處理收集的高清視頻,則壓縮輸出碼率最高可達(dá)到6Mbps,也就是每臺(tái)攝像機(jī)每天將大約產(chǎn)生50GB左右的數(shù)據(jù)量,那如果是一個(gè)城市一年的視頻數(shù)據(jù)的話是相當(dāng)驚人的。因此傳統(tǒng)處理方式已無(wú)法實(shí)現(xiàn)如此海量數(shù)據(jù)的存儲(chǔ)與高效處理。針對(duì)這一現(xiàn)象,我們提出了如下的云存儲(chǔ)解決方案:圖3-5云視頻監(jiān)控系統(tǒng)框架 本系統(tǒng)具有如下特點(diǎn):高效處理本方案針對(duì)城市視頻監(jiān)控實(shí)際應(yīng)用特點(diǎn),結(jié)合云計(jì)算、云存儲(chǔ)優(yōu)勢(shì),利用云創(chuàng)存儲(chǔ)自身云計(jì)算與云存儲(chǔ)產(chǎn)品,創(chuàng)新地開(kāi)發(fā)設(shè)計(jì)了城市云視頻監(jiān)控系統(tǒng)平臺(tái),結(jié)合云創(chuàng)cStor海量云存儲(chǔ)系統(tǒng)、cProc高效云處理平臺(tái)、cVideo云視頻監(jiān)控管理系統(tǒng)、cTrans高速云傳輸系統(tǒng)四大系統(tǒng)產(chǎn)品,充分發(fā)揮云存儲(chǔ)與云計(jì)算針對(duì)海量數(shù)據(jù)處理時(shí)的優(yōu)勢(shì),達(dá)到海量視頻監(jiān)控信息高效率存儲(chǔ)與管理的目的。超大規(guī)??芍蔚娜萘拷咏鼰o(wú)限,理論容量為1024x1024x1024PB(1G個(gè)PB容量),有足夠的存儲(chǔ)空間來(lái)存儲(chǔ)城市視頻。動(dòng)態(tài)伸縮系統(tǒng)可以在不停止服務(wù)的情況下,動(dòng)態(tài)加入新的存儲(chǔ)節(jié)點(diǎn),支持超大規(guī)模集群,滿足海量數(shù)據(jù)集中存儲(chǔ)的大容量的要求。公安圖像偵查云存儲(chǔ)應(yīng)用模式近年來(lái),視頻監(jiān)控在安防領(lǐng)域得到了大規(guī)模應(yīng)用,海量的攝像頭完成了部署。視頻監(jiān)控信息在維護(hù)社會(huì)穩(wěn)定,協(xié)助安全防衛(wèi)過(guò)程中發(fā)揮了重要的作用,與此同時(shí),海量視頻數(shù)據(jù)的集中存儲(chǔ)與共享、高度可靠以及多用戶高速并發(fā)訪問(wèn)成為公安圖像偵察應(yīng)用領(lǐng)域的基本要求。 cStor云存儲(chǔ)系統(tǒng)提供了海量數(shù)據(jù)的集中存儲(chǔ)與共享,以及高度可靠的多用戶高速并發(fā)訪問(wèn)解決方案,下圖為公安圖像偵查的云存儲(chǔ)應(yīng)用模式示意圖:圖3-6基于cStor云存儲(chǔ)的公安圖像偵查系統(tǒng) 在本偵查系統(tǒng)中,圖像視頻數(shù)據(jù)通過(guò)專門的數(shù)據(jù)上傳組進(jìn)行上傳,同時(shí)在多個(gè)偵查組可以進(jìn)行數(shù)據(jù)的偵測(cè)(示意圖中的數(shù)據(jù)下載區(qū)),通過(guò)這種模式可以大大的節(jié)省團(tuán)隊(duì)的協(xié)作時(shí)間,提高整體的執(zhí)行效率。 由于采用了分布式的云存儲(chǔ)架構(gòu),各個(gè)偵查組在進(jìn)行數(shù)據(jù)的讀寫時(shí),是直接與個(gè)存儲(chǔ)節(jié)點(diǎn)進(jìn)行數(shù)據(jù)的交互,不存儲(chǔ)單節(jié)點(diǎn)性能瓶頸,而且隨著存儲(chǔ)節(jié)點(diǎn)數(shù)目的增多,系統(tǒng)的整體IO性能呈線性的增加。數(shù)據(jù)災(zāi)備中心云存儲(chǔ)應(yīng)用模式對(duì)于政府、銀行、交通等行業(yè),數(shù)據(jù)尤其重要,如果企業(yè)數(shù)據(jù)丟失,不僅會(huì)影響到業(yè)務(wù)的開(kāi)展,更嚴(yán)重還會(huì)是企業(yè)丟失客戶的信任以及企業(yè)賴以生存的市場(chǎng)。因此成功的容災(zāi)和備災(zāi)將是一個(gè)企業(yè)戰(zhàn)略規(guī)劃的核心部分。為了應(yīng)對(duì)災(zāi)難對(duì)用戶帶來(lái)的威脅,我公司提供了數(shù)據(jù)災(zāi)備中心云存儲(chǔ)系統(tǒng)的解決方案,如下示意圖所示:圖3-7數(shù)據(jù)災(zāi)備中心云存儲(chǔ)應(yīng)用模式各地有本地?cái)?shù)據(jù)存儲(chǔ)中心,重要數(shù)據(jù)則在本地系統(tǒng)空閑(如晚上)時(shí)通過(guò)網(wǎng)絡(luò)上傳至數(shù)據(jù)災(zāi)備中心進(jìn)行集中式備份。同時(shí)數(shù)據(jù)災(zāi)備中心的存儲(chǔ)服務(wù)器也可以部署云處理平臺(tái),在沒(méi)有數(shù)據(jù)備份的空閑時(shí)間段也可以對(duì)外提供云計(jì)算服務(wù)。這種基于云存儲(chǔ)的數(shù)據(jù)災(zāi)備中心,通過(guò)云存儲(chǔ)的分布式架構(gòu),將數(shù)據(jù)分塊存儲(chǔ)在不同的存儲(chǔ)節(jié)點(diǎn)上,提高了數(shù)據(jù)的可靠性,同時(shí)cStor中提供的超安存(S3)技術(shù),不僅提高了磁盤的利用率,還通過(guò)其加密技術(shù)增強(qiáng)的數(shù)據(jù)存儲(chǔ)的安全性。通過(guò)這種專業(yè)的統(tǒng)一災(zāi)備中心的容災(zāi),企業(yè)只需要根據(jù)需求購(gòu)買相應(yīng)容量的存儲(chǔ),不僅大大減少了各個(gè)企業(yè)建立數(shù)據(jù)中心的成本,同時(shí)大大的降低了數(shù)據(jù)丟失的風(fēng)險(xiǎn)。3.2cProc云處理平臺(tái)介紹3.2.1cProc云處理平臺(tái)簡(jiǎn)介 cProc云處理平臺(tái)是搭建在云存儲(chǔ)系統(tǒng)上,對(duì)業(yè)務(wù)層直接提供對(duì)外開(kāi)發(fā)接口和數(shù)據(jù)傳輸接口的分布式數(shù)據(jù)處理平臺(tái)。3.2.2cProc云處理平臺(tái)優(yōu)勢(shì)實(shí)時(shí)性:平臺(tái)在高效率并行分布式軟件的支撐下,可以實(shí)時(shí)完成數(shù)據(jù)處理和分析工作,如數(shù)據(jù)處理、數(shù)據(jù)查詢、和統(tǒng)計(jì)分析等。數(shù)據(jù)處理不會(huì)出現(xiàn)數(shù)據(jù)堆積現(xiàn)象,各類分析和查詢工作基本都在秒級(jí)完成,具有前所未有的高效性。響應(yīng)速度快速:在海量數(shù)據(jù)領(lǐng)域,cProc的響應(yīng)速度遠(yuǎn)遠(yuǎn)快于傳統(tǒng)的數(shù)據(jù)庫(kù)。采用分布式處理的方式,性能與節(jié)點(diǎn)數(shù)成正比,通過(guò)增加節(jié)點(diǎn)的方式,可將性能提升,以達(dá)到滿足需求的處理要求。高可靠性:基于對(duì)云處理可靠性深厚的研究積累,徹底解決了當(dāng)前分布式處理平臺(tái)易出現(xiàn)的單點(diǎn)故障問(wèn)題。任何一個(gè)節(jié)點(diǎn)出現(xiàn)故障,系統(tǒng)將自動(dòng)屏蔽,而且不會(huì)出現(xiàn)丟失數(shù)據(jù)的現(xiàn)象??缮炜s性:在不停機(jī)的情況下,增加節(jié)點(diǎn),平臺(tái)的處理能力自動(dòng)增加;減少節(jié)點(diǎn),平臺(tái)的處理能力自動(dòng)縮減。這樣,可以做到與資源池的無(wú)縫對(duì)接,根據(jù)處理和存儲(chǔ)任務(wù)動(dòng)態(tài)地申請(qǐng)或釋放資源,最大限度地提高資源利用率。高性價(jià)比:采用X86架構(gòu)廉價(jià)處理機(jī)構(gòu)建云處理平臺(tái),用軟件容錯(cuò)替代硬件容錯(cuò),大大節(jié)省成本。在目標(biāo)性能和可靠性條件下,可比傳統(tǒng)的小型機(jī)加商用數(shù)據(jù)庫(kù)方案節(jié)省10倍左右的成本。全業(yè)務(wù)支持:采用NoSQL+關(guān)系數(shù)據(jù)庫(kù)混合模式,絕大部分海量數(shù)據(jù)存放于分布式平臺(tái)并進(jìn)行分布式處理,少量實(shí)時(shí)性要求很高的數(shù)據(jù)存放于關(guān)系數(shù)據(jù)庫(kù),可支撐各種類型的業(yè)務(wù)。不僅支撐查詢、統(tǒng)計(jì)、分析業(yè)務(wù),還可支撐深度數(shù)據(jù)挖掘和商業(yè)智能分析業(yè)務(wù)。3.2.3cProc云處理平臺(tái)技術(shù)架構(gòu) 云存儲(chǔ)層包括公司自主研發(fā)的云儲(chǔ)存系統(tǒng)cStor和apache開(kāi)源云儲(chǔ)存系統(tǒng)HDFS;而在數(shù)據(jù)管理層中,包含數(shù)據(jù)立方、Hbase;數(shù)據(jù)處理層包含JobKeeper和MapReduce;最后的監(jiān)控協(xié)調(diào)層則包括zookeeper和Chukwa來(lái)實(shí)現(xiàn)對(duì)整個(gè)系統(tǒng)的實(shí)時(shí)監(jiān)控和數(shù)據(jù)管理。 下圖為cProc云處理平臺(tái)架構(gòu): 通過(guò)數(shù)據(jù)立方,可以對(duì)元數(shù)據(jù)進(jìn)行數(shù)據(jù)分析、清理、分割。 對(duì)結(jié)構(gòu)化數(shù)據(jù)任意關(guān)鍵字索引,形成一個(gè)多維數(shù)據(jù)模型,數(shù)據(jù)立方的命名也由此而來(lái)。數(shù)據(jù)立方是獨(dú)立于cProc云處理平臺(tái)的技術(shù)架構(gòu),用戶可以選擇性采用數(shù)據(jù)立方,也可以單獨(dú)采用Hbase、Hive等技術(shù)框架,通過(guò)數(shù)據(jù)立方或Hbase,可以將結(jié)構(gòu)化數(shù)據(jù)看成一張無(wú)限大的表,操作這張表跟操作傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)一樣,上層應(yīng)用無(wú)需修改,完全符合用戶原來(lái)操作習(xí)慣。 對(duì)于非結(jié)構(gòu)化數(shù)據(jù),cProc云處理平臺(tái)采用公司自主研發(fā)的超安存算法,對(duì)這些數(shù)據(jù)塊進(jìn)行分割,散亂存儲(chǔ)到云儲(chǔ)存系統(tǒng)上,然后采用分布式并行處理,對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)處理,cProc云處理平臺(tái)的處理性能隨著節(jié)點(diǎn)的增多而成倍數(shù)增長(zhǎng)。 cProc云處理平臺(tái)擁有以下特點(diǎn): 1.對(duì)任意多關(guān)鍵字實(shí)時(shí)索引
2.支持類SQL復(fù)雜并行組合查詢
3.分布式萬(wàn)兆實(shí)時(shí)數(shù)據(jù)流秒級(jí)處理 4.高可靠性,系統(tǒng)無(wú)單點(diǎn),確保意外情況下,系統(tǒng)的正常運(yùn)行 以上特點(diǎn)由云創(chuàng)公司自主研發(fā)的下面幾大功能來(lái)提供保證,分別是數(shù)據(jù)立方,分布式數(shù)據(jù)處理,調(diào)度均衡器、數(shù)據(jù)傳輸接口等。數(shù)據(jù)立方對(duì)數(shù)據(jù)建立高效的索引結(jié)構(gòu)。數(shù)據(jù)立方是云創(chuàng)公司研發(fā)的高效數(shù)據(jù)結(jié)構(gòu),該結(jié)構(gòu)成功解決了海量數(shù)據(jù)的快速索引和查詢問(wèn)題,使得百億條記錄級(jí)的數(shù)據(jù)能夠秒級(jí)處理。分布式數(shù)據(jù)處理是云創(chuàng)公司研發(fā)的處理海量數(shù)據(jù)的處理框架,用于對(duì)大規(guī)模數(shù)據(jù)集的并行處理。處理能力可以通過(guò)增加或減少機(jī)器達(dá)到動(dòng)態(tài)調(diào)整。采用先進(jìn)的容錯(cuò)技術(shù),確保處理任務(wù)的可靠性,即使在異常情況下,如機(jī)器宕機(jī)、斷網(wǎng)的情況下,確保處理任務(wù)的實(shí)時(shí)性和準(zhǔn)確性。調(diào)度均衡器是云創(chuàng)公司研發(fā)的解決單點(diǎn)故障的一項(xiàng)技術(shù),用于解決系統(tǒng)內(nèi)的單點(diǎn)問(wèn)題,確保某機(jī)器的應(yīng)用程序狀態(tài)在宕機(jī)或斷網(wǎng)時(shí),可將狀態(tài)從異常機(jī)器轉(zhuǎn)移到其他機(jī)器上,中間無(wú)數(shù)據(jù)丟失。數(shù)據(jù)傳輸接口是云創(chuàng)公司經(jīng)過(guò)多年積累,專門針對(duì)地面數(shù)據(jù)傳輸研究出高性能可靠文件傳輸協(xié)議,采用并行流水線方式、將傳輸與存儲(chǔ)作聯(lián)合優(yōu)化,并支持多點(diǎn)中繼高效傳輸。經(jīng)過(guò)多項(xiàng)實(shí)地遠(yuǎn)程傳輸試驗(yàn),結(jié)果表明該技術(shù)的傳輸效率在1Gb/s光纖線路上達(dá)到了帶寬的80%左右,處于國(guó)際最高水平。幾大功能相輔相成,高效且可靠地處理海量數(shù)據(jù),確保響應(yīng)迅速,傳輸速度快,處理結(jié)果準(zhǔn)確。3.2.4cProc云處理平臺(tái)規(guī)格規(guī)格說(shuō)明項(xiàng)目?jī)?nèi)容可管理的數(shù)據(jù)總量(★)支持100PB量級(jí)的數(shù)據(jù)管理實(shí)時(shí)索引的數(shù)據(jù)流量(★)支持100GBps以上量級(jí)的數(shù)據(jù)流實(shí)時(shí)索引任意關(guān)鍵字段實(shí)時(shí)創(chuàng)建索引(★)根據(jù)提供的表結(jié)構(gòu)解析元數(shù)據(jù),并根據(jù)提供的任意關(guān)鍵字段實(shí)時(shí)創(chuàng)建索引??梢浦残裕ā铮㎎ava語(yǔ)言實(shí)現(xiàn),具有跨平臺(tái)性,一次編程,任意操作系統(tǒng)都可運(yùn)行。實(shí)時(shí)查詢(★)1小時(shí)范圍查詢:1秒內(nèi)響應(yīng),24小時(shí)范圍查詢:1秒內(nèi)響應(yīng),7*24小時(shí)范圍查詢:1秒內(nèi)響應(yīng)。支持簡(jiǎn)單SQL組合查詢(★)采用和關(guān)系數(shù)據(jù)庫(kù)混合模式,絕大部分海量數(shù)據(jù)存放于分布式平臺(tái)并進(jìn)行分布式處理,少量實(shí)時(shí)性要求很高的數(shù)據(jù)存放于關(guān)系數(shù)據(jù)庫(kù),可支撐各種類型的業(yè)務(wù)。不僅支撐查詢、統(tǒng)計(jì)、分析業(yè)務(wù),還可支撐深度數(shù)據(jù)挖掘和商業(yè)智能分析業(yè)務(wù)。負(fù)載均衡可靠性(★)拔掉或增加一臺(tái)節(jié)點(diǎn)后,仍能均勻地向各處理節(jié)點(diǎn)分發(fā)數(shù)據(jù)。支持并發(fā)查詢(★)20個(gè)查詢都能正常下發(fā)執(zhí)行、且都能正常返回結(jié)果,20個(gè)查詢?nèi)蝿?wù)的總耗時(shí)差距不大,根據(jù)機(jī)器負(fù)載進(jìn)行均衡分配查詢?nèi)蝿?wù)。數(shù)據(jù)準(zhǔn)確性(★)查詢條件相同情況下,每次查詢結(jié)果相同。穩(wěn)定性(★)系統(tǒng)連續(xù)運(yùn)行7*24小時(shí),無(wú)任何故障,所有周期任務(wù)均正常執(zhí)行,且執(zhí)行結(jié)果正確??煽啃裕ā铮](méi)有單點(diǎn)故障,任意節(jié)點(diǎn)宕機(jī),系統(tǒng)工作正常,可以繼續(xù)進(jìn)行數(shù)據(jù)處理和應(yīng)用查詢,不會(huì)影響分布式系統(tǒng)運(yùn)行和查詢結(jié)果的準(zhǔn)確性。擴(kuò)展性(★)既可以在很小規(guī)模機(jī)器上跑,也可以在成千上萬(wàn)臺(tái)的機(jī)器上運(yùn)行,而且經(jīng)過(guò)很簡(jiǎn)單的操作就可以把規(guī)模擴(kuò)展到成千上萬(wàn)臺(tái)服務(wù)器上,而且可靠性隨著加入節(jié)點(diǎn)的增加成線性上升。分布式處理能力(★)集群能增加節(jié)點(diǎn)、并且能正常執(zhí)行查詢?nèi)蝿?wù),在流量沒(méi)變、資源增加的情況下,增加機(jī)器前后,查詢?nèi)蝿?wù)耗時(shí)按比例降低。支持對(duì)外接口(★)支持Web訪問(wèn)和WebServices接口進(jìn)行對(duì)外數(shù)據(jù)交互操作。監(jiān)控功能(★)提供web界面對(duì)分布式文件進(jìn)行監(jiān)控,支持查看、下載索引文件和元數(shù)據(jù)文件。備注:★為必須滿足項(xiàng)。3.2.5關(guān)鍵技術(shù)數(shù)據(jù)立方(DataCube) 我們以B+樹(shù)的結(jié)構(gòu)建立了字段的索引,每個(gè)B+樹(shù)結(jié)構(gòu)的字段索引相當(dāng)于一個(gè)數(shù)據(jù)平面,這樣一個(gè)全局?jǐn)?shù)據(jù)表與其多個(gè)重要字段的索引就組成了一個(gè)類似于立方體的數(shù)據(jù)組織結(jié)構(gòu),我們稱之為“數(shù)據(jù)立方(DataCube)”。如下圖所示: 數(shù)據(jù)立方(DataCube)是一種用于數(shù)據(jù)分析與索引的技術(shù)架構(gòu)。它是針對(duì)大數(shù)據(jù)(bigdata)的處理利器,可以對(duì)元數(shù)據(jù)進(jìn)行任意多關(guān)鍵字實(shí)時(shí)索引。通過(guò)數(shù)據(jù)立方對(duì)元數(shù)據(jù)進(jìn)行分析之后,可以大大加快數(shù)據(jù)的查詢和檢索效率。 數(shù)據(jù)立方的原理:由一個(gè)或多個(gè)管理節(jié)點(diǎn),一個(gè)或多個(gè)處理及存儲(chǔ)節(jié)點(diǎn)(數(shù)據(jù)節(jié)點(diǎn))組成,系統(tǒng)在數(shù)據(jù)建立與查詢時(shí),分布式建立與應(yīng)用數(shù)據(jù)立方索引結(jié)構(gòu),在數(shù)據(jù)建立及存儲(chǔ)時(shí),對(duì)規(guī)范化的數(shù)據(jù)設(shè)定1個(gè)或多個(gè)關(guān)鍵字字段,將不同的關(guān)鍵字字段分別建立索引,每張不同的索引生成一張獨(dú)立的B+樹(shù)結(jié)構(gòu),多個(gè)B+樹(shù)結(jié)構(gòu)垛疊在一起,與全局?jǐn)?shù)據(jù)表形成一個(gè)完整的數(shù)據(jù)立方結(jié)構(gòu)。利用數(shù)據(jù)立方存儲(chǔ)索引結(jié)構(gòu),可方便快捷的在海量數(shù)據(jù)云處理系統(tǒng)中準(zhǔn)確檢索定位數(shù)據(jù)。B+樹(shù)的插入僅在葉結(jié)點(diǎn)上進(jìn)行。每插入一個(gè)(關(guān)鍵碼-指針)索引項(xiàng)后都要判斷結(jié)點(diǎn)中的子樹(shù)棵數(shù)是否超出范圍。當(dāng)插入后結(jié)點(diǎn)中的子樹(shù)棵數(shù)大于m時(shí),需要將葉結(jié)點(diǎn)分裂為兩個(gè)結(jié)點(diǎn)。它們的雙親結(jié)點(diǎn)中應(yīng)同時(shí)包含這兩個(gè)結(jié)點(diǎn)的最大關(guān)鍵碼和結(jié)點(diǎn)地址。此后,問(wèn)題歸于在非葉結(jié)點(diǎn)中的插入了。在非葉結(jié)點(diǎn)中關(guān)鍵碼的插入與葉結(jié)點(diǎn)的插入類似,非葉結(jié)點(diǎn)中的子樹(shù)棵數(shù)的上限為m,超出這個(gè)范圍也要進(jìn)行結(jié)點(diǎn)分裂。在做根結(jié)點(diǎn)分裂時(shí),因?yàn)闆](méi)有雙親結(jié)點(diǎn),就必須創(chuàng)建新的雙親結(jié)點(diǎn),作為樹(shù)的新根。這樣樹(shù)的高度就增加一層了。當(dāng)有新的記錄到來(lái)時(shí),我們要將新的數(shù)據(jù)記錄對(duì)應(yīng)的一條索引記錄插入到所有的字段索引中,這時(shí)要采取一定的寫入策略。當(dāng)新的記錄積累到n1條或經(jīng)過(guò)一定時(shí)間t1時(shí),對(duì)于存儲(chǔ)在MemCache中的字段索引,可以將這些數(shù)據(jù)記錄對(duì)應(yīng)的索引記錄一次性批量寫入;當(dāng)新的記錄積累到n2條或經(jīng)過(guò)一定時(shí)間t2時(shí),可以將這些數(shù)據(jù)記錄對(duì)應(yīng)的索引記錄一次性批量寫入HDFS(固態(tài)磁盤)上的索引文件。對(duì)B+樹(shù)的查找類似于二分查找,對(duì)于m階,葉子節(jié)點(diǎn)中記錄個(gè)數(shù)為n的B+樹(shù)來(lái)說(shuō),其查找的時(shí)間復(fù)雜度為O(logm+(n+1)/2)。因此對(duì)于值匹配和范圍查找來(lái)說(shuō),有很快的速度。此外,由于對(duì)值按照大小順序進(jìn)行了指針鏈接,因此m階B+樹(shù)還可以進(jìn)行對(duì)值進(jìn)行順序查找。 我們對(duì)重要字段建立索引,存儲(chǔ)在HDFS(固態(tài)磁盤)上。將最近常用的字段索引加載到MemCache中,同時(shí)刪除最不常用的字段索引以節(jié)省空間。詳細(xì)來(lái)說(shuō),對(duì)于每次查詢,系統(tǒng)統(tǒng)計(jì)每個(gè)字段索引被調(diào)用的次數(shù),對(duì)于被調(diào)用次數(shù)最多的那些字段索引就被加載到MemCache中,而在MemCache中被調(diào)用次數(shù)最少的某些字段將被刪除。 數(shù)據(jù)立方是凌駕于數(shù)據(jù)存儲(chǔ)層和數(shù)據(jù)庫(kù)系統(tǒng)之上的,通過(guò)數(shù)據(jù)立方解析后,可以大大增加數(shù)據(jù)查詢和檢索等業(yè)務(wù),可以讓系統(tǒng)平臺(tái)具備數(shù)據(jù)實(shí)時(shí)入庫(kù)、實(shí)時(shí)查詢、查詢結(jié)果實(shí)時(shí)傳輸?shù)葍?yōu)勢(shì)。任務(wù)監(jiān)控器(JobKeeper)JobKeeper調(diào)度平臺(tái)是建立于虛擬化資源層之上,統(tǒng)一調(diào)度,統(tǒng)一配置的管理平臺(tái),用于對(duì)集群中任務(wù)實(shí)時(shí)的處理調(diào)度,實(shí)時(shí)結(jié)果集的反饋,集群的負(fù)載均衡,失敗調(diào)度,集中管理,集中配置的平臺(tái)。用來(lái)保證整個(gè)集群的超低人員干預(yù)。同時(shí),提供完善的集群伸縮機(jī)制為整個(gè)服務(wù)提供更高的可靠性。JobKeeper云調(diào)度技術(shù)架構(gòu)圖應(yīng)用層是一組用于管理和結(jié)果反饋的顯示組件。用于顯示任務(wù)的處理情況以及集群中機(jī)器的活動(dòng)情況,同時(shí)其也是一個(gè)上層應(yīng)用和底層服務(wù)的對(duì)接平臺(tái)。是整個(gè)系統(tǒng)面向用戶和開(kāi)發(fā)人員的基礎(chǔ)承載。業(yè)務(wù)層是對(duì)于應(yīng)用層的相關(guān)功能的業(yè)務(wù)化,數(shù)字化處理,用于將應(yīng)用層的需求任務(wù)進(jìn)行規(guī)則化劃分,形成統(tǒng)一的處理化模式。數(shù)據(jù)處理層是獨(dú)立的數(shù)據(jù)處理程序,是對(duì)不同需求數(shù)據(jù)的統(tǒng)一處理方案,他的運(yùn)行與監(jiān)控的工作將由JobKeeper調(diào)度平臺(tái)進(jìn)行統(tǒng)一的配置管理。存儲(chǔ)層是用來(lái)存儲(chǔ)數(shù)據(jù)存儲(chǔ)層的處理結(jié)果集或者其他中間結(jié)果集的單元。虛擬化資源層是將實(shí)體的機(jī)器進(jìn)行虛擬化,形成更大范圍的服務(wù)集群。JobKeeper調(diào)度平臺(tái)是由一組管理節(jié)點(diǎn)(MasterNode)和一組處理節(jié)點(diǎn)(TaskNode)組成,管理節(jié)點(diǎn)組是一組基于Webserver的RPC(RPC采用客戶機(jī)/服務(wù)器模式。請(qǐng)求程序就是一個(gè)客戶機(jī),而服務(wù)提供程序就是一個(gè)服務(wù)器。首先,客戶機(jī)調(diào)用進(jìn)程發(fā)送一個(gè)有進(jìn)程參數(shù)的調(diào)用信息到服務(wù)進(jìn)程,然后等待應(yīng)答信息。在服務(wù)器端,進(jìn)程保持睡眠狀態(tài)直到調(diào)用信息的到達(dá)為止。當(dāng)一個(gè)調(diào)用信息到達(dá),服務(wù)器獲得進(jìn)程參數(shù),計(jì)算結(jié)果,發(fā)送答復(fù)信息,然后等待下一個(gè)調(diào)用信息,最后,客戶端調(diào)用進(jìn)程接收答復(fù)信息,獲得進(jìn)程結(jié)果,然后調(diào)用執(zhí)行繼續(xù)進(jìn)行。)服務(wù)器,負(fù)責(zé)對(duì)處理節(jié)點(diǎn)的系統(tǒng)信息以及任務(wù)處理信息進(jìn)行實(shí)時(shí)的跟蹤和保存,對(duì)應(yīng)的信息鏡像存儲(chǔ)在基于cStor或者NFS服務(wù)的存儲(chǔ)系統(tǒng)上,保證每個(gè)管理節(jié)點(diǎn)中的鏡像信息的實(shí)時(shí)同步。同時(shí)架設(shè)在管理節(jié)點(diǎn)上的ZooKeeper服務(wù)(ZooKeeper是一個(gè)分布式的,開(kāi)放源碼的分布式應(yīng)用程序協(xié)調(diào)服務(wù),包含一個(gè)簡(jiǎn)單的原語(yǔ)集。分布式應(yīng)用可以使用它來(lái)實(shí)現(xiàn)諸如:統(tǒng)一命名服務(wù)、配置管理、分布式鎖服務(wù)、集群管理等功能。)用于對(duì)整個(gè)管理節(jié)點(diǎn)組進(jìn)行統(tǒng)一的配置化管理。處理節(jié)點(diǎn)組通過(guò)RPC的遠(yuǎn)程調(diào)用獲取各自節(jié)點(diǎn)的任務(wù)處理目標(biāo),并實(shí)時(shí)的和處理節(jié)點(diǎn)上的任務(wù)處理目標(biāo)進(jìn)行對(duì)比,控制程序的執(zhí)行和結(jié)束。(注:這里的程序,可以是任何語(yǔ)言任何形式的獨(dú)立程序,但是必須提供執(zhí)行腳本,和運(yùn)行參數(shù)選項(xiàng))處理節(jié)點(diǎn)組會(huì)在一個(gè)設(shè)定的心跳間隔內(nèi)主動(dòng)的和管理節(jié)點(diǎn)組聯(lián)系一次,報(bào)告節(jié)點(diǎn)存活狀態(tài)。如果在若干個(gè)心跳間隔后管理節(jié)點(diǎn)組仍然沒(méi)有獲取到處理節(jié)點(diǎn)心跳報(bào)告,那么該處理節(jié)點(diǎn)將會(huì)被踢出處理節(jié)點(diǎn)組,同時(shí)該節(jié)點(diǎn)處理的所有處理任務(wù)也會(huì)被重新調(diào)度。隨著集群處理數(shù)據(jù)量的不斷增大,處理節(jié)點(diǎn)組提供了簡(jiǎn)單高效的自動(dòng)化部署方案,當(dāng)新機(jī)器加入處理集群后,會(huì)主動(dòng)的與管理節(jié)點(diǎn)組同步心跳信息,從同一配置服務(wù)器ZooKeeper上獲取相關(guān)配置信息,通過(guò)WebServer服務(wù)獲取任務(wù)列表,開(kāi)始執(zhí)行數(shù)據(jù)處理工作。JobKeeper調(diào)度平臺(tái)提供了一套基于Web的管理化界面,可以實(shí)時(shí)的觀察各個(gè)處理節(jié)點(diǎn)的任務(wù)運(yùn)行狀態(tài),以及任務(wù)列表的分配情況,機(jī)器的負(fù)載情況等。用戶在管理系統(tǒng)界面上可以完成所有的工作,如新任務(wù)的添加,任務(wù)的手動(dòng)調(diào)度以及集群日志的查看與分析等。任務(wù)處理節(jié)點(diǎn)和管理節(jié)點(diǎn)之間維護(hù)一個(gè)心跳時(shí)間,實(shí)時(shí)向管理節(jié)點(diǎn)匯報(bào)任務(wù)處理信息,同時(shí),任務(wù)處理節(jié)點(diǎn)在每個(gè)心跳時(shí)間內(nèi)向管理節(jié)點(diǎn)獲取該處理的任務(wù)列表,并和本機(jī)正在處理的任務(wù)列表進(jìn)行比對(duì),完成相關(guān)的任務(wù)調(diào)度工作。若一個(gè)處理節(jié)點(diǎn)在多個(gè)心跳時(shí)間范圍內(nèi)仍然沒(méi)有主動(dòng)的和管理節(jié)點(diǎn)相互聯(lián)系,那么管理節(jié)點(diǎn)將會(huì)根據(jù)各機(jī)器的負(fù)載情況,將失去心跳連接的處理節(jié)點(diǎn)上的任務(wù)進(jìn)行任務(wù)的重新分配和執(zhí)行。3.2.4cProc云處理平臺(tái)成功案例移動(dòng)云信令平臺(tái)案例一、項(xiàng)目背景截至2011年第二季度,全國(guó)手機(jī)用戶量已達(dá)到9.6億,并且隨著3G網(wǎng)絡(luò)的推廣,手機(jī)用戶量還在不斷攀升。與此同時(shí),每天手機(jī)網(wǎng)絡(luò)產(chǎn)生的移動(dòng)信令數(shù)據(jù)量也在上升。目前,每天僅語(yǔ)音業(yè)務(wù)產(chǎn)生的信令數(shù)據(jù)量就高達(dá)幾百TB,每月產(chǎn)生的信令數(shù)據(jù)量高達(dá)數(shù)PB。如果想從這么大量的數(shù)據(jù)中查找所需要的信息,會(huì)是一件非常困難的事情。如此海量的數(shù)據(jù)難以保存在集中式的數(shù)據(jù)存儲(chǔ)系統(tǒng)和常規(guī)的關(guān)系型數(shù)據(jù)庫(kù)中。為了解決目前海量數(shù)據(jù)存儲(chǔ)的困難,提高海量數(shù)據(jù)查詢速度,廣東移動(dòng)開(kāi)展了移動(dòng)信令平臺(tái)項(xiàng)目。移動(dòng)信令平臺(tái)具有數(shù)據(jù)量大,數(shù)據(jù)類型復(fù)雜。同時(shí)為了能夠快速正確分析移動(dòng)網(wǎng)絡(luò)性能并對(duì)網(wǎng)絡(luò)故障進(jìn)行快速定位,系統(tǒng)還要求具有快速的查詢和容錯(cuò)能力,保證系統(tǒng)7*24小時(shí)提供搜索服務(wù)。根據(jù)這些要求信令平臺(tái)需要具備如下功能和特點(diǎn):支持海量數(shù)據(jù)的實(shí)時(shí)入庫(kù)采用大量機(jī)器組成的云平臺(tái),能夠提高對(duì)海量數(shù)據(jù)的快速入庫(kù),入庫(kù)速度高達(dá)千兆每秒。支持海量數(shù)據(jù)的實(shí)時(shí)索引能夠?qū)崟r(shí)監(jiān)控入庫(kù)的新數(shù)據(jù),并對(duì)其建立具有高效查詢速度的索引,達(dá)到高速檢索。支持海量數(shù)據(jù)的快速查詢能夠?qū)⒂脩舻牟樵內(nèi)蝿?wù)分解到平臺(tái)的各個(gè)機(jī)器上,實(shí)現(xiàn)分布式并行計(jì)算,從而高效的利用系統(tǒng)資源,能夠快速響應(yīng)用戶查詢請(qǐng)求。系統(tǒng)具有高度容錯(cuò)性當(dāng)任意一臺(tái)機(jī)器宕機(jī),系統(tǒng)能夠自動(dòng)分配新的機(jī)器接替宕機(jī)機(jī)器的任務(wù),從而實(shí)現(xiàn)系統(tǒng)的高度容錯(cuò),保證了結(jié)果的正確性。系統(tǒng)具有高度可伸縮性平臺(tái)能夠通過(guò)動(dòng)態(tài)的添加機(jī)器,達(dá)到吞吐量和用戶相應(yīng)時(shí)間的線性增長(zhǎng)。二、移動(dòng)云信令平臺(tái)解決方案 信令數(shù)據(jù)的網(wǎng)絡(luò)優(yōu)化是一項(xiàng)技術(shù)難度大、涉及范圍廣、人員素質(zhì)要求較高的工作,并且是一個(gè)長(zhǎng)期的過(guò)程。網(wǎng)絡(luò)容量的不斷發(fā)展,網(wǎng)絡(luò)用戶數(shù)量的不斷增加,網(wǎng)絡(luò)設(shè)備的不斷更新給網(wǎng)絡(luò)優(yōu)化提出了更高的要求。路測(cè)是當(dāng)前實(shí)際網(wǎng)絡(luò)優(yōu)化過(guò)程中最有效的手段,它可以實(shí)現(xiàn)對(duì)測(cè)試過(guò)程中收集的數(shù)據(jù)進(jìn)行分析,找出問(wèn)題所在,不斷對(duì)系統(tǒng)進(jìn)行優(yōu)化,最終達(dá)到系統(tǒng)在大業(yè)務(wù)量時(shí)穩(wěn)定運(yùn)行的目的。但是由于通信業(yè)務(wù)的數(shù)量和復(fù)雜程度的不斷加大,海量的路測(cè)數(shù)據(jù)的處理和分析成為制約路測(cè)技術(shù)的最主要瓶頸?,F(xiàn)在很多行業(yè)都面臨著海量數(shù)據(jù)的存儲(chǔ)和處理,擺在我們面前的是一個(gè)非常嚴(yán)峻的考驗(yàn)。針對(duì)于移動(dòng)行業(yè)信令海量數(shù)據(jù)的特點(diǎn)和要求,提出以下解決方案: 1平臺(tái)解決方案架構(gòu) 在中國(guó)移動(dòng)提供的計(jì)算資源池上,申請(qǐng)若干X86架構(gòu)計(jì)算/存儲(chǔ)節(jié)點(diǎn),虛擬出海量存儲(chǔ)空間、處理能力和數(shù)據(jù)管理能力。同時(shí)研制面向應(yīng)用的分布式數(shù)據(jù)處理軟件,滿足信令合成、索引、查詢、指標(biāo)分析、專題分析、深度數(shù)據(jù)挖掘等應(yīng)用需求。信令共享平臺(tái)是一個(gè)處于信令采集與信令監(jiān)測(cè)應(yīng)用之間的系統(tǒng)。從系統(tǒng)基本組成與構(gòu)架上來(lái)看,該共享平臺(tái)由7個(gè)主要部分組成:信令數(shù)據(jù)合成處理系統(tǒng),信令數(shù)據(jù)訂閱系統(tǒng),實(shí)時(shí)跟蹤系統(tǒng),信令數(shù)據(jù)存儲(chǔ)系統(tǒng),信令數(shù)據(jù)查詢分析應(yīng)用系統(tǒng),網(wǎng)絡(luò)管理系統(tǒng)以及系統(tǒng)管理。cProc云處理平臺(tái)應(yīng)用在信令數(shù)據(jù)查詢分析應(yīng)用系統(tǒng)中。信令共享平臺(tái)的基本組成與構(gòu)架 2海量數(shù)據(jù)入庫(kù)設(shè)計(jì)將大量的合成數(shù)據(jù)存儲(chǔ)到由大量X86架構(gòu)計(jì)算機(jī)構(gòu)成的具有良好可靠性和可擴(kuò)展性的分布式云計(jì)算機(jī)平臺(tái)上,能夠?qū)B級(jí)的信令數(shù)據(jù)進(jìn)行實(shí)時(shí)監(jiān)測(cè)處理,提供實(shí)時(shí)查詢分析等多種業(yè)務(wù)的支持,能夠?qū)?shù)據(jù)建立實(shí)時(shí)的索引,處理速度高達(dá)每秒千兆。整體入庫(kù)采用分布式多點(diǎn)入庫(kù),整體架構(gòu)如下圖cProc能夠?qū)崟r(shí)監(jiān)控新產(chǎn)生的數(shù)據(jù)文件,并對(duì)其建立相應(yīng)的索引文件,獨(dú)有的分布式調(diào)度技術(shù),可以很好的協(xié)調(diào)各個(gè)機(jī)器之間的負(fù)載,保證了整體的性能。同時(shí)入庫(kù)的數(shù)據(jù)需要有備份機(jī)制,那么采用HDFS中的副本管理機(jī)制,可以根據(jù)配置文件,自己設(shè)定副本個(gè)數(shù),而且HDFS可以根據(jù)文件被訪問(wèn)量來(lái)自動(dòng)調(diào)整副本的個(gè)數(shù),以加快文件讀取的性能。通過(guò)該副本管理機(jī)制可以完全解決數(shù)據(jù)備份和容災(zāi),任意節(jié)點(diǎn)宕機(jī)數(shù)據(jù)不會(huì)丟失,查詢功能不會(huì)停止服務(wù)。3信令查詢功能設(shè)計(jì)信令數(shù)據(jù)查詢分析應(yīng)用主要提供包括信令數(shù)據(jù)查詢、指標(biāo)業(yè)務(wù)數(shù)據(jù)查詢、核心網(wǎng)分析、網(wǎng)絡(luò)優(yōu)化分析、終端專題分析查詢、信令專題分析查詢、用戶專題分析查詢等功能,以及相關(guān)的報(bào)表處理等功能。信令查詢處理時(shí),由于信令數(shù)據(jù)量巨大,難以存儲(chǔ)在常規(guī)的關(guān)系數(shù)據(jù)庫(kù)中,而如果直接存儲(chǔ)在HDFS或HBase中又難以保證查詢效率。為此,需要考慮對(duì)信令數(shù)據(jù)進(jìn)行索引處理,并將索引數(shù)據(jù)存儲(chǔ)在HDFS或Hbase中。為了建立信令索引,需要在信令數(shù)據(jù)傳送到云存儲(chǔ)系統(tǒng)中時(shí),進(jìn)行實(shí)時(shí)的索引處理。那么通過(guò)數(shù)據(jù)立方對(duì)元數(shù)據(jù)信息進(jìn)行數(shù)據(jù)分析、清理、分割之后,將索引文件散亂存儲(chǔ)在云存儲(chǔ)系統(tǒng)上,可以大大提高數(shù)據(jù)查詢和檢索的性能。但是由于信令數(shù)據(jù)流量巨大,需要調(diào)度使用多臺(tái)服務(wù)器節(jié)點(diǎn)進(jìn)行并行處理。同樣,5分鐘以上時(shí)間粒度的指標(biāo)統(tǒng)計(jì)數(shù)據(jù)計(jì)算、以及各種專題數(shù)據(jù)的計(jì)算也需要進(jìn)行并行處理。此外,用戶從客戶端發(fā)起以上各種數(shù)據(jù)查詢分析任務(wù)時(shí),也會(huì)產(chǎn)生大量并發(fā)的查詢?nèi)蝿?wù)。以上各種查詢分析計(jì)算任務(wù)的處理將需要考慮在計(jì)算集群上進(jìn)行并行化任務(wù)調(diào)度和負(fù)載均衡處理。這些并行計(jì)算任務(wù)則是交給cProc進(jìn)行并發(fā)分布式處理,負(fù)載均衡處理則將使用Zookeeper基于計(jì)算集群完成統(tǒng)一的控制和實(shí)現(xiàn)。cProc查詢支持標(biāo)準(zhǔn)SQL查詢語(yǔ)句,客戶端通過(guò)提供的接口發(fā)出請(qǐng)求后,cProc能夠?qū)QL進(jìn)行快速的語(yǔ)義分析和語(yǔ)句優(yōu)化,然后將查詢?nèi)蝿?wù)分配到多個(gè)機(jī)器上,并行的快速查找索引文件,對(duì)用戶請(qǐng)求快速響應(yīng)。在查詢過(guò)程中,如果有機(jī)器宕機(jī),cProc功能自動(dòng)將查詢?nèi)蝿?wù)動(dòng)態(tài)的劃分到其他機(jī)器,保證結(jié)果的準(zhǔn)確性。整體查詢結(jié)構(gòu)如下圖 cProc位于系統(tǒng)的業(yè)務(wù)層和存儲(chǔ)層之間,為業(yè)務(wù)層檢索海量數(shù)據(jù)提供了高效穩(wěn)定方便的查詢接口。采用分布式鎖,可以很好的協(xié)調(diào)各個(gè)機(jī)器的負(fù)載均衡。cProc通過(guò)把對(duì)數(shù)據(jù)集的大規(guī)模操作分發(fā)給網(wǎng)絡(luò)上的每個(gè)節(jié)點(diǎn)實(shí)現(xiàn)數(shù)據(jù)處理,每個(gè)節(jié)點(diǎn)會(huì)周期性的把完成的工作和狀態(tài)的更新報(bào)告回來(lái)。隨著節(jié)點(diǎn)的增多,cProc的處理能力將成倍數(shù)增長(zhǎng)。cProc支持100GBps以上量級(jí)的數(shù)據(jù)流實(shí)時(shí)索引,1s內(nèi)響應(yīng)客戶請(qǐng)求,秒級(jí)完成數(shù)據(jù)處理、查詢和分析工作。三、實(shí)施效果 系統(tǒng)采用cProc云處理平臺(tái)解決了客戶以下幾點(diǎn)需求: 平臺(tái)支持海量數(shù)據(jù)的實(shí)時(shí)入庫(kù)、實(shí)時(shí)索引、快速查詢、高度容錯(cuò)性、高度可伸縮性等。1系統(tǒng)查詢界面 用戶通過(guò)前臺(tái)界面選擇查詢的時(shí)間和號(hào)碼以及要查詢的業(yè)務(wù)類型,點(diǎn)擊查詢按鈕,系統(tǒng)能夠在1s內(nèi)返回結(jié)果,大大減少了用戶的等待時(shí)間,具有較高的用戶體驗(yàn)。系統(tǒng)采用C/S模式,界面如下 2系統(tǒng)性能在整個(gè)項(xiàng)目中,信令數(shù)據(jù)采集后經(jīng)過(guò)數(shù)據(jù)立方實(shí)時(shí)索引,并將元數(shù)據(jù)和索引數(shù)據(jù)存儲(chǔ)到云存儲(chǔ)系統(tǒng)上,實(shí)現(xiàn)數(shù)據(jù)冗余。查詢時(shí),通過(guò)cProc云處理平臺(tái)進(jìn)行并行分布式處理,而cProc在查詢和檢索經(jīng)過(guò)數(shù)據(jù)立方分析過(guò)后的數(shù)據(jù)方面具有極大的性能優(yōu)勢(shì)。 云信令平臺(tái)中的數(shù)據(jù)處理結(jié)果:記錄數(shù)(條)號(hào)碼給出響應(yīng)處理時(shí)間1萬(wàn)1585102****0.01s內(nèi)0.052s10萬(wàn)1586203****0.02s內(nèi)0.076s100萬(wàn)1398562****0.04s內(nèi)
0.109s1000萬(wàn)1381547****0.08s內(nèi)0.347s
1億1377009****0.2s內(nèi)0.543s
10億1586917****0.4s內(nèi)0.787s100億1377425****0.7s內(nèi)0.926s 從結(jié)果可以看出:cProc云處理平臺(tái)是一種處理海量數(shù)據(jù)高效分布式云處理平臺(tái),cProc云處理平臺(tái)可以從TB乃至PB級(jí)的數(shù)據(jù)中挖掘出有用的信息,并對(duì)這些海量信息進(jìn)行快捷、高效的處理。cProc云處理平臺(tái)支持100GBps以上量級(jí)的數(shù)據(jù)流實(shí)時(shí)索引,1s內(nèi)響應(yīng)客戶請(qǐng)求,秒級(jí)完成數(shù)據(jù)處理、查詢和分析工作。 四、客戶受益 該項(xiàng)目以高效的性能和可靠性贏得了客戶的高度認(rèn)可,為客戶分析移動(dòng)網(wǎng)絡(luò)性能并對(duì)網(wǎng)絡(luò)故障進(jìn)行準(zhǔn)確定位提供保障。具體體現(xiàn)在:1.提供高速實(shí)時(shí)的海量數(shù)據(jù)入庫(kù)和數(shù)據(jù)檢索功能2.保證7*24不間斷服務(wù),未出現(xiàn)數(shù)據(jù)丟失和檢索結(jié)果不準(zhǔn)確3.整個(gè)系統(tǒng)架構(gòu)具有高度的擴(kuò)展性,方便用戶動(dòng)態(tài)提升系統(tǒng)性能智慧交通云平臺(tái)案例一、項(xiàng)目背景為提升道路交通科學(xué)管理水平,創(chuàng)新社會(huì)管理方式,加快公安信息化發(fā)展,更好地服務(wù)公安機(jī)關(guān)指揮疏導(dǎo)交通、防范交通事故、維護(hù)社會(huì)穩(wěn)定、打擊違法犯罪。實(shí)現(xiàn)對(duì)重點(diǎn)車輛的自動(dòng)比對(duì)和動(dòng)態(tài)管控、對(duì)異常車輛行蹤的自動(dòng)研判預(yù)警、對(duì)特定車輛行車軌跡的自動(dòng)生成、對(duì)重要節(jié)點(diǎn)道路交通信息的遠(yuǎn)程再現(xiàn)、對(duì)基層單位和執(zhí)勤民警的勤務(wù)實(shí)施管理等建設(shè)目標(biāo),為交通管理、治安管控、偵查破案、巡邏防范、反恐處突等各項(xiàng)公安工作提供服務(wù)保障,某市公安局開(kāi)展圖像資源庫(kù)和道路監(jiān)控綜合應(yīng)用系統(tǒng)建置項(xiàng)目?;诮煌ㄐ畔?shù)據(jù)量大和公安對(duì)系統(tǒng)實(shí)時(shí)性及可靠性的要求高,系統(tǒng)需要具備的功能和性能如下:海量歷史交通監(jiān)控?cái)?shù)據(jù)匯總能夠?qū)η|級(jí)的海量歷史交通監(jiān)控?cái)?shù)據(jù)進(jìn)行匯總處理。海量原始交通監(jiān)控?cái)?shù)據(jù)上報(bào)能夠?qū)η|級(jí)的海量上報(bào)交通監(jiān)控?cái)?shù)據(jù)進(jìn)行上報(bào)處理。海量原始數(shù)據(jù)實(shí)時(shí)入庫(kù)、生成索引能夠?qū)α髁砍^(guò)10000條/m的全量原始交通監(jiān)控?cái)?shù)據(jù)流進(jìn)行實(shí)時(shí)處理。海量數(shù)據(jù)存儲(chǔ)、計(jì)算能夠存儲(chǔ)千億級(jí)別的數(shù)據(jù),并完成各種復(fù)雜業(yè)務(wù)應(yīng)用計(jì)算。千億級(jí)數(shù)據(jù)秒級(jí)查詢能力高效索引算法,智能化調(diào)度任務(wù)系統(tǒng),滿足秒級(jí)查詢速度。秒級(jí)實(shí)時(shí)業(yè)務(wù)響應(yīng)高效實(shí)時(shí)數(shù)據(jù)通道,對(duì)于像實(shí)時(shí)監(jiān)控、告警等實(shí)時(shí)業(yè)務(wù),提供秒級(jí)響應(yīng)時(shí)間。二、智慧交通云平臺(tái)解決方案cProc將海量數(shù)據(jù)分解到由大量X86架構(gòu)計(jì)算機(jī)構(gòu)成的低成本云計(jì)算平臺(tái)上進(jìn)行實(shí)時(shí)處理,依靠分布式云處理軟件進(jìn)行容錯(cuò),從而提升智慧交通云平臺(tái)海量數(shù)據(jù)分析的實(shí)時(shí)性和性價(jià)比。 1.系統(tǒng)基本組成與構(gòu)架智慧交通云平臺(tái)是一個(gè)處于交管數(shù)據(jù)采集與交管數(shù)據(jù)監(jiān)測(cè)應(yīng)用之間的系統(tǒng)。從系統(tǒng)基本組成與構(gòu)架上來(lái)看,該共享平臺(tái)由7個(gè)主要部分組成:歷史數(shù)據(jù)匯總處理系統(tǒng),上報(bào)數(shù)據(jù)上報(bào)系統(tǒng),實(shí)時(shí)數(shù)據(jù)入庫(kù)系統(tǒng),交管數(shù)據(jù)存儲(chǔ)系統(tǒng),交管數(shù)據(jù)查詢分析應(yīng)用系統(tǒng),數(shù)據(jù)管理系統(tǒng)以及系統(tǒng)管理。智慧交通云平臺(tái)的基本組成與構(gòu)架在基礎(chǔ)設(shè)施構(gòu)架上,該平臺(tái)將架構(gòu)將構(gòu)建在公安云計(jì)算平臺(tái)之上,利用公安所提供的計(jì)算資源、存儲(chǔ)資源和網(wǎng)絡(luò)資源,作為智慧交通云平臺(tái)的基礎(chǔ)設(shè)施和支撐平臺(tái)。交管數(shù)據(jù)通過(guò)cProc提供的數(shù)據(jù)寫入接口,實(shí)時(shí)寫入數(shù)據(jù)信息到云處理平臺(tái)。通過(guò)提供的查詢接口,可以高效、快速、準(zhǔn)確的返回結(jié)果給客戶端。
2系統(tǒng)總體構(gòu)架與功能模塊基于以上基本的系統(tǒng)組成和功能構(gòu)架,系統(tǒng)的詳細(xì)總體構(gòu)架和功能模塊設(shè)計(jì)如圖所示。智慧交通云平臺(tái)總體構(gòu)架與功
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 銀行貸款進(jìn)貨合同(2篇)
- 2024-2025學(xué)年初中同步測(cè)控優(yōu)化設(shè)計(jì)物理八年級(jí)下冊(cè)配人教版第11章 第4節(jié) 機(jī)械能及其轉(zhuǎn)化含答案
- 荷花 作文 課件
- 西京學(xué)院《中國(guó)文化經(jīng)典選讀》2022-2023學(xué)年第一學(xué)期期末試卷
- 西京學(xué)院《土木工程施工技術(shù)與組織》2022-2023學(xué)年第一學(xué)期期末試卷
- 西京學(xué)院《建筑工程計(jì)量與計(jì)價(jià)》2022-2023學(xué)年第一學(xué)期期末試卷
- 西京學(xué)院《非線性編輯》2022-2023學(xué)年第一學(xué)期期末試卷
- 西京學(xué)院《大數(shù)據(jù)存儲(chǔ)與管理技術(shù)》2023-2024學(xué)年期末試卷
- 西華師范大學(xué)《學(xué)科課程標(biāo)準(zhǔn)與教材研究》2021-2022學(xué)年第一學(xué)期期末試卷
- 西華師范大學(xué)《外國(guó)史學(xué)史》2022-2023學(xué)年第一學(xué)期期末試卷
- 只爭(zhēng)朝夕不負(fù)韶華崗位競(jìng)聘述職報(bào)告
- 配料個(gè)人述職報(bào)告
- 農(nóng)場(chǎng)工作制度與農(nóng)民崗位職責(zé)
- 2024年山東公務(wù)員考試行測(cè)真題及解析【完美打印版】
- 金屬鋅行業(yè)前景分析
- 茶百道選址策略分析報(bào)告
- 做新時(shí)代的青年馬克思主義者講課
- 田賽裁判法與規(guī)則2
- 社區(qū)心肺復(fù)蘇術(shù)普及
- 冬棗植保知識(shí)培訓(xùn)課件
- 校園突發(fā)事件與應(yīng)急管理課件
評(píng)論
0/150
提交評(píng)論