《實戰(zhàn)大數(shù)據(jù) Hadoop Spark Flink 從平臺構(gòu)》讀書筆記思維導圖PPT模板下載_第1頁
《實戰(zhàn)大數(shù)據(jù) Hadoop Spark Flink 從平臺構(gòu)》讀書筆記思維導圖PPT模板下載_第2頁
《實戰(zhàn)大數(shù)據(jù) Hadoop Spark Flink 從平臺構(gòu)》讀書筆記思維導圖PPT模板下載_第3頁
《實戰(zhàn)大數(shù)據(jù) Hadoop Spark Flink 從平臺構(gòu)》讀書筆記思維導圖PPT模板下載_第4頁
《實戰(zhàn)大數(shù)據(jù) Hadoop Spark Flink 從平臺構(gòu)》讀書筆記思維導圖PPT模板下載_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

《實戰(zhàn)大數(shù)據(jù)HadoopSparkFlink從平臺構(gòu)》最新版讀書筆記,下載可以直接修改思維導圖PPT模板大數(shù)據(jù)數(shù)據(jù)管理平臺系統(tǒng)離線小結(jié)數(shù)據(jù)庫技術集群實時工程師項目資源用戶開發(fā)分析行為第章本書關鍵字分析思維導圖01第1章大數(shù)據(jù)技術概述第3章基于Hadoop構(gòu)建大數(shù)據(jù)平臺第5章用戶行為離線分析——構(gòu)建日志采集...第2章搭建IDEA開發(fā)環(huán)境及Linux...第4章基于HBase和Kafka構(gòu)建海...第6章基于Spark的用戶行為實時分析目錄030502040607第7章基于Flink的用戶行為實時分析內(nèi)容簡介第8章用戶行為數(shù)據(jù)可視化目錄0908內(nèi)容摘要《實戰(zhàn)大數(shù)據(jù)(Hadoop+Spark+Flink)——從平臺構(gòu)建到交互式數(shù)據(jù)分析(離線/實時)》詳細介紹了大數(shù)據(jù)工程師在實際工作中應該熟練掌握的大數(shù)據(jù)技術。全書共8章,分別是大數(shù)據(jù)技術概述、搭建IDEA開發(fā)環(huán)境及Linux虛擬機、基于Hadoop構(gòu)建大數(shù)據(jù)平臺、基于HBase和Kafka構(gòu)建海量數(shù)據(jù)存儲與交換系統(tǒng)、用戶行為離線分析—構(gòu)建日志采集和分析平臺、基于Spark的用戶行為實時分析、基于Flink的用戶行為實時分析、用戶行為數(shù)據(jù)可視化。本書以一個完整的大數(shù)據(jù)項目為主線,涵蓋Hadoop、Spark、Flink等主流大數(shù)據(jù)技術,按照大數(shù)據(jù)工程師的項目開發(fā)流程,理論與實踐結(jié)合,逐步推進,使讀者在學習大數(shù)據(jù)核心技術的同時,也能掌握開發(fā)大數(shù)據(jù)項目的完整流程,從而獲得大數(shù)據(jù)項目開發(fā)經(jīng)驗?!秾崙?zhàn)大數(shù)據(jù)(Hadoop+Spark+Flink)——從平臺構(gòu)建到交互式數(shù)據(jù)分析(離線/實時)》既可以作為大數(shù)據(jù)工程師的必備開發(fā)手冊,也可以作為高校大數(shù)據(jù)及相關專業(yè)的教材或?qū)嶒炇謨?。?章大數(shù)據(jù)技術概述一般使用Flume、Logstash、Filebeat等工具采集日志文件數(shù)據(jù),使用Sqoop、Canal等工具采集數(shù)據(jù)庫中的數(shù)據(jù)。1.1什么是大數(shù)據(jù)1.2大數(shù)據(jù)平臺架構(gòu)1.3大數(shù)據(jù)工程師的技能樹1.4大數(shù)據(jù)項目需求分析與設計1.5本章小結(jié)12345第1章大數(shù)據(jù)技術概述第2章搭建IDEA開發(fā)環(huán)境及Linux...為了提高集群資源利用率、解決資源共享問題,YARN在這種應用場景下應運而生。2.1搭建IDEA開發(fā)環(huán)境2.3本章小結(jié)2.2搭建Linux虛擬機第2章搭建IDEA開發(fā)環(huán)境及Linux...第3章基于Hadoop構(gòu)建大數(shù)據(jù)平臺YARN是一個通用的資源管理系統(tǒng),對整個集群的資源進行統(tǒng)籌管理,其目標是將短作業(yè)和長服務混合部署到一個集群中,并為它們提供統(tǒng)一的資源管理和調(diào)度功能。3.1Zookeeper分布式協(xié)調(diào)服務3.2HDFS分布式文件系統(tǒng)3.3YARN資源管理系統(tǒng)3.4Hadoop分布式集群的構(gòu)建3.5MapReduce分布式計算框架3.6本章小結(jié)010302040506第3章基于Hadoop構(gòu)建大數(shù)據(jù)平臺第4章基于HBase和Kafka構(gòu)建海...當然Spark和Flink既支持離線處理也支持實時處理,SparkCore和FlinkDataSet支持離線處理,SparkStreaming和FlinkDataStream支持實時處理。4.1構(gòu)建HBase分布式實時數(shù)據(jù)庫4.3本章小結(jié)4.2搭建Kafka分布式消息系統(tǒng)第4章基于HBase和Kafka構(gòu)建海...第5章用戶行為離線分析——構(gòu)建日志采集...大數(shù)據(jù)工程師需要掌握SparkStreaming、FlinkDataStream等大數(shù)據(jù)實時計算技術。5.1搭建Flume日志采集系統(tǒng)5.2使用Flume采集用戶行為數(shù)據(jù)5.3基于Hive的離線大數(shù)據(jù)分析5.4基于Hive的用戶行為數(shù)據(jù)離線分...5.5本章小結(jié)12345第5章用戶行為離線分析——構(gòu)建日志采集...第6章基于Spark的用戶行為實時分析HBase數(shù)據(jù)庫構(gòu)建在HDFS之上,既解決了海量數(shù)據(jù)存儲又能實現(xiàn)數(shù)據(jù)的實時隨機查詢與更新,滿足線上用戶的服務需求其中多租戶、彈性伸縮、動態(tài)分配是資源管理系統(tǒng)要解決的核心問題。6.1Spark快速入門6.2SparkCore的核心功能6.3Spark分布式集群的構(gòu)建6.4基于SparkStreamin...第6章基于Spark的用戶行為實時分析6.5基于SparkSQL的新聞項目...6.7本章小結(jié)6.6基于SparkStructur...第6章基于Spark的用戶行為實時分析第7章基于Flink的用戶行為實時分析大數(shù)據(jù)工程師需要掌握MapReduce、Hive、SparkCore、SparkSQL、FlinkDataSet等大數(shù)據(jù)離線計算技術。7.1Flink快速入門7.2Flink分布式集群的構(gòu)建7.3基于FlinkDataStre...7.4基于FlinkDataSet的...7.5本章小結(jié)12345第7章基于Flink的用戶行為實時分析第8章用戶行為數(shù)據(jù)可視化一種方式是使用冗余硬盤陣列(RAID),另外一種方式是本書稍后會講到的Hadoop分布式文件系統(tǒng)(HadoopDistributedFileSystem,HDFS)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論