




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于Flink的異構(gòu)海量數(shù)據(jù)涌傳輸系統(tǒng)技術(shù)創(chuàng)新 變革未來Agenda異構(gòu)數(shù)據(jù)涌傳輸?shù)奶魬?zhàn)基于Flink的解決方案 未來規(guī)劃挑戰(zhàn)MySQLH.ve/HSQLHDFSTableauRed.s/ AbaseKaf/a ?數(shù)據(jù)源種類多傳輸方式多全量增量流式頻繁有新數(shù)據(jù)源出現(xiàn)對(duì)架構(gòu)的可擴(kuò)展性要求高挑戰(zhàn)對(duì)于單/務(wù),數(shù)據(jù)L大,實(shí)現(xiàn)細(xì)節(jié)繁多。SLA(性能穩(wěn)定性等)要A高。MySQL上萬分庫(kù)單庫(kù)干億行PK極端不均勻HDFS10w+文件Protobuf/Parqu et/JSON/CSV/ Binary Hive500TB+Parquet/ORC/ SequeceFile 傳統(tǒng)架構(gòu)etc.技術(shù)棧零散,M * N模
2、式缺乏統(tǒng)的數(shù)據(jù)*理和功能支持框架開發(fā)和運(yùn)維成本高,性能和穩(wěn)定性保證難度大現(xiàn)有開源方案DataX (開源版本)類型系統(tǒng)完善,數(shù)據(jù)源類型支持較完整單機(jī)模式,橫向擴(kuò)展性不足不支持流式傳輸Sqoop關(guān)系型DB到Hadoop導(dǎo)入較為成熟新增數(shù)據(jù)源較為困難基于MR,性能非最優(yōu)缺乏性能和架構(gòu)可擴(kuò)展性強(qiáng),支持流批統(tǒng)一傳輸?shù)目蚣?。Agenda異構(gòu)數(shù)據(jù)涌傳輸?shù)奶魬?zhàn)基于Flink的解決方案 未來規(guī)劃基于Flink的統(tǒng)一傳輸架構(gòu)線上業(yè)務(wù)支撐曰均任務(wù)數(shù) 2w,曰均傳輸數(shù)據(jù)萬億級(jí)別Flink OverviewExactly &nceScalabilityLayered APIHigh PerformanceStream
3、& Batch&peration FocusPlugin Framework技術(shù)棧統(tǒng)所有數(shù)據(jù)對(duì)應(yīng)獨(dú)立的Input/Output插件,M+N模式框架層面提供統(tǒng)基礎(chǔ)功能分布式計(jì)笢Flink類型系統(tǒng)自動(dòng)并行度流量控制臟F據(jù)處理小流量N試Type System所有輸入源數(shù)據(jù)類型先轉(zhuǎn)換為DTS類型,再統(tǒng)一轉(zhuǎn)換為輸出源數(shù)據(jù)類型。對(duì)于每種類型,分別有對(duì)應(yīng)的序列化/反序列化器,用于分布式數(shù)據(jù)傳輸。基礎(chǔ)類型BoolColumnBytesColumnDateColumnDoubleColumnLongColumnStringColumn復(fù)合類型ListColumnTMapColumnK, VAuto Parall
4、elismAuto Parallelism對(duì)Flink架增加了Job預(yù)處理后處理流程,根據(jù)以下指標(biāo)計(jì)算輸入輸出最佳并發(fā)度輸入原/片數(shù)輸入原總行數(shù)輸入原總大小輸入原可承壓輸出原可承壓用戶配置并發(fā)Messenger Framework在框架層面解決 Flink多節(jié)點(diǎn)間 數(shù)據(jù)收集的問題。任務(wù)運(yùn)行指標(biāo)收集臟數(shù)據(jù)收集支持多種目標(biāo)數(shù)據(jù)灑Messenger - MetricsMessenger - Dirty Data用于收集和處理臟數(shù)據(jù),寫入中間數(shù)據(jù)庫(kù)/Kafka等臟數(shù)據(jù)收集少量任務(wù)運(yùn)行日志預(yù)覽增量臟數(shù)據(jù)寫入全量Log日志查詢等任務(wù)質(zhì)量控制控制任務(wù)失敗的臟數(shù)據(jù)閾值支持絕對(duì)行數(shù)閾值支持相對(duì)百分比閾值實(shí)現(xiàn)優(yōu)化Flink相關(guān)改進(jìn)Monitor & Alarm單Job監(jiān)控看板 總讀取寫入進(jìn)/總分片數(shù)當(dāng)前-成分片數(shù)當(dāng)前讀取寫入行數(shù)當(dāng)前讀取寫入大小失敗讀取寫入行數(shù)Monitor & Alarm系統(tǒng)整-監(jiān)控看板 已啟動(dòng)Job數(shù)量正在運(yùn)行Job數(shù)量已成功Job數(shù)量已失敗Job數(shù)量Job運(yùn)行時(shí)間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 亞馬遜雨傘訂購(gòu)合同范本
- 農(nóng)村住房修建合同范例
- 廠區(qū)工人雇傭合同范本
- 企業(yè)采購(gòu)紅酒合同范本
- 吧臺(tái)主理人合同范本
- 品牌供貨合作合同范例
- 前臺(tái)課程顧問合同范本
- 壓手續(xù)不押車合同范本
- 北京二手房服務(wù)合同范本
- 危險(xiǎn)建筑拆除合同范本
- 醫(yī)院陪護(hù)管理制度
- 中國(guó)計(jì)量大學(xué)《微機(jī)原理及其應(yīng)用》2021-2022學(xué)年第一學(xué)期期末試卷
- 《車控操作系統(tǒng)功能軟件架構(gòu)及接口要求》
- 急性心力衰竭的緊急處理與護(hù)理
- 中國(guó)技能大賽-第45屆世界技能大賽全國(guó)選拔賽“水處理技術(shù)”項(xiàng)目技術(shù)工作文件
- 混凝土工安全教育培訓(xùn)試題及答案
- 臨床家庭化產(chǎn)房開展經(jīng)驗(yàn)分享
- 寒區(qū)作戰(zhàn)傷員的護(hù)理
- 安徽省六安市裕安區(qū)六安市獨(dú)山中學(xué)2024-2025學(xué)年高一上學(xué)期11月期中生物試題(含答案)
- 低血糖的護(hù)理查房
- GB/T 44718-2024城市軌道交通無障礙運(yùn)營(yíng)服務(wù)規(guī)范
評(píng)論
0/150
提交評(píng)論