大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路-文檔資料_第1頁(yè)
大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路-文檔資料_第2頁(yè)
大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路-文檔資料_第3頁(yè)
大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路-文檔資料_第4頁(yè)
大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路-文檔資料_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、- -0 0- -大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路大數(shù)據(jù)平臺(tái)架構(gòu)及建設(shè)思路 2022-3-7中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司- -1 1- -三、中國(guó)移動(dòng)大數(shù)據(jù)平臺(tái)建設(shè)思路三、中國(guó)移動(dòng)大數(shù)據(jù)平臺(tái)建設(shè)思路二、主流技術(shù)比較二、主流技術(shù)比較- -2 2- -什么是大數(shù)據(jù)什么是大數(shù)據(jù)“大數(shù)據(jù)”是指其大小超出了典型數(shù)據(jù)庫(kù)軟件的采集、存儲(chǔ)、管理和分析等能力的數(shù)據(jù)集。目前,大數(shù)據(jù)的一般范圍是從幾個(gè)TB到數(shù)個(gè)PB。麥肯錫無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的大量而復(fù)雜的數(shù)據(jù)集合。維基百科數(shù)量大、獲取速度快或形態(tài)多樣的數(shù)據(jù),難以用傳統(tǒng)關(guān)系型數(shù)據(jù)分析方法進(jìn)行有效分析,或者

2、需要大規(guī)模的水平擴(kuò)展才能高效處理。美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)研究院(NIST)體量大、快速和多樣化的信息資產(chǎn),需用高效率和創(chuàng)新型的信息技術(shù)加以處理,以提高發(fā)現(xiàn)洞察、做出決策和優(yōu)化流程的能力。Gartner公司- -3 3- -運(yùn)營(yíng)商對(duì)大數(shù)據(jù)的理解運(yùn)營(yíng)商對(duì)大數(shù)據(jù)的理解 網(wǎng)絡(luò)數(shù)據(jù)、用戶(hù)數(shù)據(jù)、應(yīng)用數(shù)據(jù)的匯聚構(gòu)成了我們的網(wǎng)絡(luò)數(shù)據(jù)、用戶(hù)數(shù)據(jù)、應(yīng)用數(shù)據(jù)的匯聚構(gòu)成了我們的“大數(shù)據(jù)大數(shù)據(jù)”。這些結(jié)構(gòu)化、非結(jié)構(gòu)化。這些結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)的處理和建模形成對(duì)用戶(hù)、服務(wù)、資源、終端等對(duì)象的洞察。這些洞察與市場(chǎng)營(yíng)銷(xiāo)、網(wǎng)的數(shù)據(jù)的處理和建模形成對(duì)用戶(hù)、服務(wù)、資源、終端等對(duì)象的洞察。這些洞察與市場(chǎng)營(yíng)銷(xiāo)、網(wǎng)絡(luò)運(yùn)維等業(yè)務(wù)流程的銜接將會(huì)

3、給公司帶來(lái)新的價(jià)值。絡(luò)運(yùn)維等業(yè)務(wù)流程的銜接將會(huì)給公司帶來(lái)新的價(jià)值。大數(shù)據(jù)具備Volume 海量、 Variety 多樣、 Velocity 快速、Value 價(jià)值的特點(diǎn)。據(jù)Ericsson預(yù)測(cè),到2018年,每個(gè)手機(jī)終端每個(gè)月將產(chǎn)生2G的數(shù)據(jù)。(Ericsson Mobility Report,2013年)改善市場(chǎng)改善市場(chǎng)運(yùn)營(yíng)效率運(yùn)營(yíng)效率結(jié)構(gòu)化數(shù)據(jù)處理非結(jié)構(gòu)化數(shù)據(jù)處理洞察:用戶(hù)/服務(wù)/資源/終端/.提升網(wǎng)絡(luò)提升網(wǎng)絡(luò)運(yùn)維效率運(yùn)維效率改善客戶(hù)改善客戶(hù)滿意度滿意度創(chuàng)新商業(yè)創(chuàng)新商業(yè)模式模式數(shù)據(jù)采集建模分析運(yùn)營(yíng)改進(jìn)傳統(tǒng)商業(yè)智能傳統(tǒng)商業(yè)智能大數(shù)據(jù)大數(shù)據(jù)1大數(shù)據(jù)大數(shù)據(jù)2批處理,事先定義的查詢(xún)和模型非結(jié)構(gòu)化的

4、數(shù)據(jù),包括互聯(lián)網(wǎng)日志、web文本信息,非實(shí)時(shí)或準(zhǔn)實(shí)時(shí)流處理,實(shí)時(shí)的內(nèi)容智能感知,策略執(zhí)行,連續(xù)更新價(jià)值實(shí)時(shí)性采集、建模和應(yīng)用采集、建模和應(yīng)用數(shù)據(jù)處理實(shí)時(shí)性與價(jià)值呈正比數(shù)據(jù)處理實(shí)時(shí)性與價(jià)值呈正比- -4 4- -中國(guó)移動(dòng)數(shù)據(jù)分布中國(guó)移動(dòng)數(shù)據(jù)分布B域域B域數(shù)據(jù)以客戶(hù)關(guān)系、用戶(hù)行為、產(chǎn)品信息等為主,支撐客戶(hù)經(jīng)營(yíng)和產(chǎn)品營(yíng)銷(xiāo)等O域域O域數(shù)據(jù)以設(shè)備數(shù)據(jù)、告警信息和性能信息等為主,支撐網(wǎng)絡(luò)監(jiān)控、網(wǎng)絡(luò)優(yōu)化、用戶(hù)投訴處理等M域域M域數(shù)據(jù)以財(cái)務(wù)、人力資源、供應(yīng)鏈和辦公信息等為主,支撐企業(yè)管理、企業(yè)辦公信息化等DPI數(shù)據(jù)域數(shù)據(jù)域DPI數(shù)據(jù)域以上網(wǎng)日志、內(nèi)容構(gòu)成、用戶(hù)軌跡、網(wǎng)絡(luò)信令等為主,可支撐流量經(jīng)營(yíng)、網(wǎng)絡(luò)運(yùn)維和增

5、值服務(wù)等業(yè)務(wù)平臺(tái)業(yè)務(wù)平臺(tái)九大業(yè)務(wù)基地:基地?cái)?shù)據(jù)以用戶(hù)信息、用戶(hù)行為信息等為主,可支撐個(gè)性化推薦、優(yōu)化產(chǎn)品和服務(wù)等。WAP/短彩信:存儲(chǔ)網(wǎng)絡(luò)日志,可支撐定位網(wǎng)絡(luò)及終端問(wèn)題。- -5 5- -運(yùn)營(yíng)商大數(shù)據(jù)運(yùn)用運(yùn)營(yíng)商大數(shù)據(jù)運(yùn)用p對(duì)內(nèi):對(duì)內(nèi):p客戶(hù)上網(wǎng)數(shù)據(jù)處理、網(wǎng)頁(yè)爬取和網(wǎng)頁(yè)分類(lèi)、分析挖掘客戶(hù)上網(wǎng)行為p詳單查詢(xún)、上網(wǎng)日志查詢(xún)p流量分析、客戶(hù)視圖、精準(zhǔn)營(yíng)銷(xiāo)p網(wǎng)絡(luò)運(yùn)維優(yōu)化p對(duì)外:對(duì)外:p與航空公司合作,建立乘機(jī)客戶(hù)識(shí)別模型,提供大數(shù)據(jù)挖掘、客戶(hù)發(fā)展全流程大數(shù)據(jù)信息服務(wù),提供針對(duì)性的營(yíng)銷(xiāo)方案p與交通運(yùn)輸部、省高速公路合作,開(kāi)展“基于移動(dòng)大數(shù)據(jù)分析在交通行業(yè)中的應(yīng)用”研究項(xiàng)目p利用通信信令實(shí)時(shí)分析景區(qū)人流量,

6、結(jié)合游客的行為數(shù)據(jù)挖掘,為旅游管理部門(mén)、景區(qū)提供數(shù)據(jù)的決策參考p以客戶(hù)授權(quán)為依據(jù),發(fā)揮移動(dòng)客戶(hù)實(shí)名數(shù)據(jù)優(yōu)勢(shì),為互聯(lián)網(wǎng)金融提供客戶(hù)信息驗(yàn)真服務(wù)p與外部客戶(hù)合作在手機(jī)沖浪平臺(tái)實(shí)施移動(dòng)廣告精準(zhǔn)投放目前主要的電信運(yùn)營(yíng)商都已積極探索開(kāi)發(fā)其內(nèi)部大數(shù)據(jù)資源。但從目前的應(yīng)用發(fā)展看,電信運(yùn)目前主要的電信運(yùn)營(yíng)商都已積極探索開(kāi)發(fā)其內(nèi)部大數(shù)據(jù)資源。但從目前的應(yīng)用發(fā)展看,電信運(yùn)營(yíng)商的大數(shù)據(jù)仍主要用于內(nèi)部服務(wù)的,如支持內(nèi)部的客戶(hù)流失分析、營(yíng)銷(xiāo)分析和網(wǎng)絡(luò)優(yōu)化分析營(yíng)商的大數(shù)據(jù)仍主要用于內(nèi)部服務(wù)的,如支持內(nèi)部的客戶(hù)流失分析、營(yíng)銷(xiāo)分析和網(wǎng)絡(luò)優(yōu)化分析等,對(duì)外的應(yīng)用模式尚未成型,部分電信運(yùn)營(yíng)商開(kāi)始嘗試通過(guò)給第三方提供數(shù)據(jù)產(chǎn)品和服務(wù),

7、等,對(duì)外的應(yīng)用模式尚未成型,部分電信運(yùn)營(yíng)商開(kāi)始嘗試通過(guò)給第三方提供數(shù)據(jù)產(chǎn)品和服務(wù),進(jìn)行數(shù)據(jù)的增值。進(jìn)行數(shù)據(jù)的增值。- -6 6- -三、中國(guó)移動(dòng)大數(shù)據(jù)平臺(tái)建設(shè)思路三、中國(guó)移動(dòng)大數(shù)據(jù)平臺(tái)建設(shè)思路一、大數(shù)據(jù)介紹一、大數(shù)據(jù)介紹- -7 7- -大數(shù)據(jù)具備數(shù)據(jù)量大、數(shù)據(jù)類(lèi)型多、數(shù)據(jù)處理速度要求高和價(jià)值密度低的特點(diǎn),傳統(tǒng)分析系統(tǒng)架構(gòu)(RDBMS +小型機(jī)+ 高端陣列模式)下,傳統(tǒng)數(shù)據(jù)庫(kù)無(wú)法支撐海量數(shù)據(jù)(如100TB以上,性能下降)、非結(jié)構(gòu)化數(shù)據(jù),現(xiàn)有IOE的架構(gòu)無(wú)法線性擴(kuò)展且成本高昂。大數(shù)據(jù)處理技術(shù)大數(shù)據(jù)處理技術(shù)大數(shù)據(jù)對(duì)傳統(tǒng)數(shù)據(jù)處理技術(shù)體系提出挑戰(zhàn)大數(shù)據(jù)對(duì)傳統(tǒng)數(shù)據(jù)處理技術(shù)體系提出挑戰(zhàn)大數(shù)據(jù)處理技術(shù)大數(shù)據(jù)

8、處理技術(shù)OldSQL :傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)NewSQL:新型MPP數(shù)據(jù)庫(kù),關(guān)系型數(shù)據(jù)庫(kù)NoSQL:泛指非關(guān)系型的數(shù)據(jù)庫(kù)Hadoop:對(duì)大量數(shù)據(jù)進(jìn)行分布式存儲(chǔ)和處理的軟件框架- -8 8- -大數(shù)據(jù)三大技術(shù)比較大數(shù)據(jù)三大技術(shù)比較面對(duì)海量種類(lèi)繁多的數(shù)據(jù)進(jìn)行實(shí)時(shí)數(shù)據(jù)分析和離線數(shù)據(jù)分析,僅有傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)已不適用,需要針對(duì)不同數(shù)據(jù)場(chǎng)景選擇不同技術(shù)手段。MPP數(shù)據(jù)庫(kù):適合結(jié)構(gòu)化數(shù)據(jù)的深度分析、復(fù)雜查詢(xún)以及多變的自助分析類(lèi)應(yīng)用、數(shù)據(jù)集市等。Hadoop :適合海量數(shù)據(jù)存儲(chǔ)查詢(xún)(詳單存儲(chǔ)和查詢(xún))、批量數(shù)據(jù)ETL、非結(jié)構(gòu)化數(shù)據(jù)分析(日志分析、文本分析)等。傳統(tǒng)數(shù)據(jù)庫(kù):在復(fù)雜關(guān)聯(lián)、匯總、事務(wù)處理方面能力強(qiáng),適合

9、數(shù)據(jù)量小、高可靠、數(shù)據(jù)價(jià)值密度高的應(yīng)用。- -9 9- -中國(guó)移動(dòng)大數(shù)據(jù)目標(biāo)架構(gòu)中國(guó)移動(dòng)大數(shù)據(jù)目標(biāo)架構(gòu)數(shù)據(jù)處理層(數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、數(shù)據(jù)共享)數(shù)據(jù)處理層(數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、數(shù)據(jù)共享)基礎(chǔ)數(shù)據(jù)資源池(HADOOP)Map/Reduce2HIVEHbaseHDFS分析數(shù)據(jù)資源池(MPP)分布式關(guān)系數(shù)據(jù)倉(cāng)庫(kù)SPARKSharkYARN統(tǒng)一調(diào)度流處理資源池分布式內(nèi)存數(shù)據(jù)庫(kù)實(shí)時(shí)行為識(shí)別復(fù)雜事件處理框架實(shí)時(shí)模型計(jì)算任務(wù)調(diào)度資源管理統(tǒng)一作業(yè)數(shù)據(jù)管理元數(shù)據(jù)管理數(shù)據(jù)質(zhì)量管理經(jīng)分?jǐn)?shù)據(jù)模型計(jì)算網(wǎng)絡(luò)數(shù)據(jù)模型計(jì)算管理分析模型計(jì)算數(shù)據(jù)調(diào)度 Hadoop平臺(tái)軟件部署于Hadoop大數(shù)據(jù)處理集群,實(shí)現(xiàn)海量非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)

10、與處理以及結(jié)構(gòu)化數(shù)據(jù)的垂直匯總。在當(dāng)前數(shù)據(jù)種類(lèi)繁多、數(shù)據(jù)處理復(fù)雜的情形下,不適合采用一種的單一的技術(shù)解決全部問(wèn)題,大數(shù)據(jù)在當(dāng)前數(shù)據(jù)種類(lèi)繁多、數(shù)據(jù)處理復(fù)雜的情形下,不適合采用一種的單一的技術(shù)解決全部問(wèn)題,大數(shù)據(jù)平臺(tái)據(jù)需要采用平臺(tái)據(jù)需要采用Hadoop資源池、資源池、MPP數(shù)據(jù)庫(kù)、流處理資源池混搭大數(shù)據(jù)技術(shù)架構(gòu)數(shù)據(jù)庫(kù)、流處理資源池混搭大數(shù)據(jù)技術(shù)架構(gòu)數(shù)據(jù)平臺(tái)基于MPP、Hadoop、流處理等云計(jì)算、大數(shù)據(jù)技術(shù) 流數(shù)據(jù)與復(fù)雜事件處理(CEP)規(guī)則引擎平臺(tái)用于對(duì)數(shù)據(jù)流進(jìn)行實(shí)時(shí)處理,實(shí)現(xiàn)對(duì)高速數(shù)據(jù)流的接入與實(shí)時(shí)處理,實(shí)時(shí)探測(cè)關(guān)鍵事件 MPP數(shù)據(jù)庫(kù)用于結(jié)構(gòu)化數(shù)據(jù)的關(guān)聯(lián)分析。一體機(jī)資源池(DW)OLAP應(yīng)用

11、DW數(shù)據(jù)庫(kù)用于分析處理統(tǒng)計(jì)分析類(lèi)OLAP應(yīng)用- -1010- -二、主流技術(shù)比較二、主流技術(shù)比較一、大數(shù)據(jù)介紹一、大數(shù)據(jù)介紹- -1111- -建設(shè)思路建設(shè)思路由易到難,穩(wěn)步推進(jìn):由易到難,穩(wěn)步推進(jìn):初期以數(shù)據(jù)整合為主,逐步面向內(nèi)外提供數(shù)據(jù)服務(wù)。管控架構(gòu),同步推進(jìn):管控架構(gòu),同步推進(jìn):同步推動(dòng)數(shù)據(jù)標(biāo)準(zhǔn)化和組織機(jī)構(gòu)變革,為大數(shù)據(jù)共享平臺(tái)商用奠定基礎(chǔ)。自主掌控,能力內(nèi)化:自主掌控,能力內(nèi)化:逐步培養(yǎng)自研團(tuán)隊(duì),構(gòu)建研發(fā)運(yùn)營(yíng)一體化能力。- -1212- -中國(guó)移動(dòng)大數(shù)據(jù)平臺(tái)架構(gòu)中國(guó)移動(dòng)大數(shù)據(jù)平臺(tái)架構(gòu)企業(yè)級(jí)省大數(shù)據(jù)平臺(tái)的技術(shù)架構(gòu)包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)與計(jì)算層、開(kāi)發(fā)框架和應(yīng)用中心四層,同時(shí)包括統(tǒng)一運(yùn)維管理

12、為各類(lèi)使用人員提供服務(wù)。在大數(shù)據(jù)技術(shù)架構(gòu)中數(shù)據(jù)的存儲(chǔ)和計(jì)算是緊密相連的。- -1313- -建設(shè)重點(diǎn)建設(shè)重點(diǎn)1與其他分析型平臺(tái)關(guān)系與其他分析型平臺(tái)關(guān)系p大數(shù)據(jù)共享平臺(tái):大數(shù)據(jù)共享平臺(tái):全網(wǎng)XDR數(shù)據(jù)采集、標(biāo)準(zhǔn)化、全量存儲(chǔ)(1個(gè)月)全網(wǎng)網(wǎng)管數(shù)據(jù)采集、標(biāo)準(zhǔn)化、全量存儲(chǔ)大數(shù)據(jù)共享平臺(tái)實(shí)現(xiàn)負(fù)責(zé)xDR數(shù)據(jù)和網(wǎng)管數(shù)據(jù)的統(tǒng)一集中采集和預(yù)處理;提供上層應(yīng)用對(duì)xDR細(xì)粒度數(shù)據(jù)的查詢(xún)響應(yīng)。按應(yīng)用需求進(jìn)行多維度小粒度匯總、數(shù)據(jù)整合、存儲(chǔ)提供明細(xì)數(shù)據(jù)查詢(xún)、輕度匯總數(shù)據(jù)查詢(xún)。p性能管理系統(tǒng):性能管理系統(tǒng):從大數(shù)據(jù)共享平臺(tái)獲取應(yīng)用所需全量小時(shí)匯總數(shù)據(jù)。數(shù)據(jù)緩存層:負(fù)責(zé)對(duì)來(lái)自于大數(shù)據(jù)共享平臺(tái)的數(shù)據(jù)進(jìn)行深入處理和緩存;為應(yīng)用

13、層提供各種匯總數(shù)據(jù)存儲(chǔ)、處理與共享,以及綜合分析與深度挖掘。應(yīng)用層:承載上層各類(lèi)應(yīng)用軟件和第三方應(yīng)用,實(shí)現(xiàn)上層應(yīng)用。- -1414- -第 14 頁(yè)2G3G4GWLANNetworkData acquisitionData parsingData storageApplicationE1 InterfaceSignaling ParsingDPI ProcessingTraffic IdentifyCDR FusionATM InterfaceFE/GE InterfaceData storage and data service for each application systemPerf

14、ormance AnalysisBehavior AnalysisData OperationIndustry Application- -1515- -建設(shè)重點(diǎn)建設(shè)重點(diǎn)2制定數(shù)據(jù)治理規(guī)則制定數(shù)據(jù)治理規(guī)則規(guī)范約束規(guī)范約束構(gòu)建基礎(chǔ)構(gòu)建基礎(chǔ)提升改進(jìn)提升改進(jìn)數(shù)據(jù)評(píng)估數(shù)據(jù)評(píng)估數(shù)據(jù)盤(pán)點(diǎn)數(shù)據(jù)盤(pán)點(diǎn)數(shù)據(jù)治理數(shù)據(jù)治理制定安全流程系統(tǒng)間數(shù)據(jù)流數(shù)據(jù)統(tǒng)一視圖數(shù)據(jù)字典數(shù)據(jù)標(biāo)準(zhǔn)評(píng)估數(shù)據(jù)安全評(píng)估統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)數(shù)據(jù)實(shí)體典型問(wèn)題分析與改進(jìn)建議強(qiáng)化治理組織完善數(shù)據(jù)質(zhì)量數(shù)據(jù)質(zhì)量評(píng)估數(shù)數(shù)據(jù)據(jù)治治理理方方法法- -1616- -建設(shè)重點(diǎn)建設(shè)重點(diǎn)3HADOOP服務(wù)器測(cè)算模型服務(wù)器測(cè)算模型模型搭建:根據(jù)模型搭建:根據(jù)HDFS存儲(chǔ)容量能力計(jì)算

15、,主要分為兩個(gè)方面:存儲(chǔ)容量能力計(jì)算,主要分為兩個(gè)方面:p一是某一體量的數(shù)據(jù)在采用不同的數(shù)據(jù)處理技術(shù)時(shí),它所需要的物理存儲(chǔ)容量、即磁盤(pán)裸容量的理論計(jì)算;p二是針對(duì)配置一定情況下,X86服務(wù)器在承載不同的數(shù)據(jù)處理技術(shù)實(shí)體時(shí),該X86服務(wù)器能夠提供的有效存儲(chǔ)容量。p最終得出某一體量的數(shù)據(jù)在采用不同的數(shù)據(jù)處理技術(shù)時(shí)所需要配置的X86服務(wù)器數(shù)量=物理存儲(chǔ)容量X86服務(wù)器能夠提供的有效存儲(chǔ)容量。HDFS存儲(chǔ)能力需求計(jì)算模型存儲(chǔ)能力需求計(jì)算模型序號(hào)序號(hào)參數(shù)名稱(chēng)參數(shù)名稱(chēng)取值范圍取值范圍取定值(取定值(TB)1原始存儲(chǔ)數(shù)據(jù)量TB1002副本數(shù)333索引率20%30%30%4數(shù)據(jù)壓縮率1/2/3/4/53物理存

16、儲(chǔ)總?cè)萘?1*2*(1+3)/4130序號(hào)序號(hào)參數(shù)名稱(chēng)參數(shù)名稱(chēng)取值范圍取值范圍取定值取定值(TB)1單碟物理容量1TB4TB42有效存儲(chǔ)碟數(shù)量123劃盤(pán)損壞10%20%20%4HDFS生成日志所占空間85單臺(tái)服務(wù)器有效存儲(chǔ)總?cè)萘?1*2*3430.4按此模型共需要13030.4=5臺(tái)X86服務(wù)器。- -1717- -1、HADOOP集群互聯(lián)帶寬需求:集群互聯(lián)帶寬需求:跨機(jī)房:點(diǎn)對(duì)點(diǎn)的帶寬機(jī)房間互聯(lián)帶寬/節(jié)點(diǎn)數(shù)Hadoop集群的NameNode節(jié)點(diǎn)不支持跨機(jī)房部署,DataNode節(jié)點(diǎn)跨機(jī)房部署時(shí),機(jī)房間的互聯(lián)電路為關(guān)鍵電路,承載兩機(jī)房間各數(shù)據(jù)節(jié)點(diǎn)間通信。若互聯(lián)電路故障時(shí),則會(huì)導(dǎo)致集群不可用。D

17、NDNDNDNDNDNNameNode機(jī)房機(jī)房1機(jī)房機(jī)房2機(jī)房間的帶寬量將限制多節(jié)點(diǎn)間的傳輸帶寬,如以機(jī)房間電路10G、300節(jié)點(diǎn)計(jì)算,節(jié)點(diǎn)間帶寬為:10*1024/300 34Mbps結(jié)論:結(jié)論:1、HADOOP集群采用單局點(diǎn)部署,可保證集群正常工作,通信效率高。2、HADOOP集群采用多局點(diǎn)部署,為減少通信延遲,必須保證集群節(jié)點(diǎn)間傳輸帶寬,按本期集群228個(gè)節(jié)點(diǎn)測(cè)算,需要互聯(lián)鏈路300G(有保護(hù)鏈路),傳輸需要投資約1000萬(wàn)元。綜合考慮,建議大數(shù)據(jù)平臺(tái)采用單單局點(diǎn)局點(diǎn)部署。建設(shè)重點(diǎn)建設(shè)重點(diǎn)4HADOOP集群對(duì)局址的選擇集群對(duì)局址的選擇1/2- -1818- -2、HADOOP集群互聯(lián)延遲需求:集群互聯(lián)延遲需求:為保證數(shù)據(jù)節(jié)點(diǎn)間數(shù)據(jù)同步,HADOOP集群內(nèi)節(jié)點(diǎn)間延遲要求小于1毫秒(業(yè)界公認(rèn)指標(biāo)),若延遲大于1毫秒,會(huì)出現(xiàn)數(shù)據(jù)同步出錯(cuò)情形。交互耗時(shí)分類(lèi)單位耗時(shí)(us)數(shù)量耗時(shí)小計(jì)(us)跨緯五路-淮南IDC機(jī)房總耗時(shí)(us)單局點(diǎn)機(jī)房總耗時(shí)(us)端口128961581216尋址304120波分轉(zhuǎn)發(fā)503150光纖傳輸52431215pHADOOP集群?jiǎn)螜C(jī)房部署時(shí)節(jié)點(diǎn)間通信延遲約為216微秒。pHADOOP集群跨機(jī)房部署時(shí)(以緯五路與淮

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論