版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
項(xiàng)目三
工業(yè)軟件系統(tǒng)數(shù)據(jù)采集工業(yè)大數(shù)據(jù)采集技術(shù)主講:羅金凱工業(yè)軟件系統(tǒng)數(shù)據(jù)采集概述
Flume概述
Flume架構(gòu)Flume部署分布式采集原理與實(shí)現(xiàn)
采購系統(tǒng)操作日志采集案例CONTENTS工業(yè)軟件系統(tǒng)數(shù)據(jù)采集概述01工業(yè)軟件數(shù)據(jù)采集概述
工業(yè)軟件數(shù)據(jù)采集定義
使用信息化手段采集工業(yè)軟件系統(tǒng)運(yùn)行過程過程的各類數(shù)據(jù),常見的有軟件運(yùn)行數(shù)據(jù)、日志數(shù)據(jù)等。Flume概述02Flume簡(jiǎn)介flume是由cloudera軟件公司產(chǎn)出的可分布式日志收集系統(tǒng)
2009年被捐贈(zèng)了apache軟件基金會(huì),為hadoop相關(guān)組件之一。Flume目前存在兩個(gè)版本:FlumeOG(Originalgeneration)和FlumeNG(Next/Newgeneration),其中FlumeOG對(duì)應(yīng)的是ApacheFlume0.9.x之前的版本,2011年10月重構(gòu)后的版本統(tǒng)稱為FlumeNGFlume官方網(wǎng)站:/Flume基本思想Flume采用了插拔式軟件架構(gòu),所有組件均是可插拔的,用戶可以根據(jù)自己的需求定制每個(gè)組件。Flume特點(diǎn)良好的擴(kuò)展性;Flume的架構(gòu)是完全分布式的,沒有任何中心化組件,使得其非常容易擴(kuò)展高度定制化;采用插拔式架構(gòu),各組件插拔式配置,用戶可以很容易的根據(jù)需求自由定義良好的可靠性;Flume內(nèi)置了事務(wù)支持,能保證發(fā)送的每條數(shù)據(jù)能夠被下一跳收到而不丟失可恢復(fù)性;依賴于其核心組件channel,選擇緩存類型為FileChannel,事件可持久化到本地文件系統(tǒng)中Flume的核心概念Client:Client生產(chǎn)數(shù)據(jù),運(yùn)行在一個(gè)獨(dú)立的線程。Event:一個(gè)數(shù)據(jù)單元,消息頭和消息體組成。(Events可以是日志記錄、avro對(duì)象等。)
FlumeNG組件FlumeAgent主要由三個(gè)組件構(gòu)成,分別是Source、channel、Sink。FlumeNG組件FlumeAgent主要由三個(gè)組件構(gòu)成,分別是Source、channel、Sink。FlumeNG組件Source:采集外圍數(shù)據(jù),通常從Client程序或上一個(gè)Agent接受數(shù)據(jù)并寫入一個(gè)或多個(gè)Channel。(1)與系統(tǒng)集成的Source:Syslog,Netcat(2)自動(dòng)生成事件的Source:Exec(3)監(jiān)聽文件夾下文件變化:SpoolingDirectorySource,TaildirSource(4)用于Agent和Agent之間通信的IPCSource:Avro、ThriftFlumeNG組件ChannelChannel是一個(gè)緩存區(qū),是連接Source和Sink的組件,它緩存Source寫入的Event,直到被Sink發(fā)送出去。FlumeNG組件Channel目前Flume主要提供了以下幾種Channel:MemoryChannel:使用內(nèi)存緩存EventJDBCChannel:使用Derby嵌入式數(shù)據(jù)庫文件緩存EventKafkaChannel:使用Kafka緩存EventFileChannel:使用本地文件系統(tǒng)緩存EventFlumeNG組件SinkSink負(fù)責(zé)從Channel讀取數(shù)據(jù),并發(fā)送給下一個(gè)Agent的Source或者文件存儲(chǔ)系統(tǒng)。FlumeNG組件
Sink目前Flume主要提供了以下幾種Sink:AvroSink:使用AVRO協(xié)議將數(shù)據(jù)寫出給Avro服務(wù)器。ThriftSink:使用Thrift協(xié)議將數(shù)據(jù)寫出給Thrift服務(wù)器。HDFSSink:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度六安住房租賃合同協(xié)議書
- 2024年度新能源發(fā)電項(xiàng)目投資與建設(shè)合同
- 假期《木偶奇遇記》個(gè)人讀后感
- 2024年北京城市副中心建設(shè)項(xiàng)目合同
- 2024年度光伏發(fā)電項(xiàng)目特許權(quán)協(xié)議
- 2024年國際學(xué)校校長(zhǎng)合同模板
- 2024年工程質(zhì)量檢測(cè)服務(wù)協(xié)議
- 噴水壺課件教學(xué)課件
- 2024年債務(wù)重組:房產(chǎn)轉(zhuǎn)讓與債務(wù)清零合同
- 2024乳制品行業(yè)牛奶輸送泵安裝合同
- 購并技巧與案例解析
- 當(dāng)代西方國家議會(huì)制度
- structure-.---中文使用手冊(cè)
- 小學(xué)三年級(jí)縮句、擴(kuò)句復(fù)習(xí)及教案(課堂PPT)
- 平凡之路--樸樹-歌詞
- 斯派克直讀光譜儀操作手冊(cè)(共43頁)
- 梯形練字格A4紙打印版
- 2014年SHE教育培訓(xùn)計(jì)劃
- 二年級(jí)上冊(cè)葉一舵心理健康教案
- 機(jī)場(chǎng)使用手冊(cè)飛行區(qū)場(chǎng)地管理
- 低血糖處理流程
評(píng)論
0/150
提交評(píng)論