



全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
附錄:Hadoop技術(shù)培訓(xùn)大綱(4天)課程模塊課程主題n 主要內(nèi)容n 案例和演示模塊一Hadoop簡(jiǎn)介和生態(tài)系統(tǒng)介紹 傳統(tǒng)大規(guī)模數(shù)據(jù)分析存在的問(wèn)題 Hadoop概述 Hadoop與分布式文件系統(tǒng) Hadoop生態(tài)系統(tǒng) Hadoop的行業(yè)應(yīng)用案例分析 Hadoop在云計(jì)算和大數(shù)據(jù)的位置和關(guān)系 Hadoop版本介紹 Hadoop與Google FS的關(guān)系 Hadoop在國(guó)內(nèi)的使用情況和未來(lái) Hadoop在推薦領(lǐng)域的使用案例介紹模塊二Hadoop安裝和主要配置文件介紹 Hadoop安裝所需軟件介紹 Hadoop單機(jī)安裝 Hadoop偽分布式安裝 Hadoop完全分布式安裝 Hadoop三個(gè)節(jié)點(diǎn)安裝的配置介紹 Hahoop多節(jié)點(diǎn)ssh配置 Hadoop格式化詳解 Hadoop核心配置文件介紹 核心配置文件core-site.xml HDFS配置文件hdfs-site.xml Mapreduce配置文件mapred-site.xml master文件配置詳解 slave文件配置詳解 Hadoop啟動(dòng)和停止方法一start-all.sh詳解stop-all.sh詳解 Hadoop的啟動(dòng)和停止方法二 hadoop-deamon.sh詳解 Hadoop安裝的常見(jiàn)錯(cuò)誤介紹和解決方案 使用自帶的wordcount和pi測(cè)試集群安裝是否成功 使用Streaming來(lái)測(cè)試集群安裝是否成功 Hadoop單機(jī)演示 Hadoop偽分布式演示 Hadoop完全分布式演示 Hadoop兩種啟動(dòng)方式的演示 Hadoop安裝常見(jiàn)錯(cuò)誤的介紹和演示 Hadoop自帶的wordcount和pi演示 Hadoop Streaming的案例演示模塊三Hadoop組件介紹 Hadoop NameNode 介紹 Hadoop SecondaryNameNode 介紹 Hadoop DataNode 介紹 Hadoop JobTracker 介紹 Hadoop TaskTracker 介紹模塊五Hadoop的HDFS模塊 HDFS架構(gòu)介紹 HDFS原理介紹 NameNode功能詳解 DataNode功能詳解 SecondaryNameNode功能詳解 HSFD的fsimage和editslog詳解 HDFS的block詳解 HDFS的block的備份策略 Hadoop的機(jī)架感知配置 HDFS的shell命令介紹 HDFS的thrift server服務(wù)介紹 HDFS的API接口介紹 HDFS的權(quán)限詳解 Hadoop的客服端接入案例 Hadoop的shell命令演示 Hadoop的API接口演示 Hadoop的客服端接入案例模塊六MapReducer入門和高級(jí) Mapreduce原理 MapReduce流程 剖析一個(gè)MapReduce程序 Mapper和Reducer抽象類詳解 Mapreduce的最小驅(qū)動(dòng)類 MapReduce自帶的類型 自定義Writables和WritableComparables Mapreduce的輸入InputFormats MapReduce的輸出OutputFormats 自定義InputFormat 自定義InputSPlits 自定義RecorderReader Combiner詳解 Partitioner詳解 DistributeFileSystem詳解 Hadoop Tools工具介紹 Counter計(jì)數(shù)器詳解 自定義Counter計(jì)數(shù)器 MapReduce的優(yōu)化 Map和Reduce的個(gè)數(shù)設(shè)置 Hadoop小文件優(yōu)化 任務(wù)調(diào)度 默認(rèn)的任務(wù)調(diào)度 公平任務(wù)調(diào)度 能力任務(wù)調(diào)度 使用 Hadoop MapReduce Streaming 編程 MapReduce的單元測(cè)試 MapReduce實(shí)現(xiàn)海量數(shù)據(jù)比較大小案例 自定義Hadoop類型案例 自定義Partitioner案例 實(shí)現(xiàn)在內(nèi)存隨機(jī)生成100個(gè)數(shù),分成兩個(gè)Map來(lái)比較大小 自定義inputFormat和InputSplit和RecorderReader來(lái)實(shí)現(xiàn)MapReduce讀取Redis里面的數(shù)據(jù)。 多文件輸出和自動(dòng)定義MapReduce的輸出名 MapReduce實(shí)現(xiàn)Join算法案例 MapReduce實(shí)現(xiàn)海量文檔相似度算法 自定義Counter案例實(shí)現(xiàn) MapReduce實(shí)現(xiàn)Pangrank算法。 MapReduce單元測(cè)試:Map的單元測(cè)試測(cè)試、reduce單元測(cè)試和MapReduce整體的單元測(cè)試實(shí)戰(zhàn)。 某公司使用MapReduce分析日志案例(10T數(shù)據(jù)以上) 配置公平調(diào)度器案例實(shí)戰(zhàn)模塊七Hive和pig的使用 Hive和Pig基礎(chǔ) Hive、Impala和presto的比較 Hive的作用和原理說(shuō)明 Hadoop倉(cāng)庫(kù)和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的協(xié)作關(guān)系 Hadoop/Hive倉(cāng)庫(kù)數(shù)據(jù)數(shù)據(jù)流 Hive 部署和安裝 Hive Cli 的基本用法 Hive的server啟動(dòng) HQL基本語(yǔ)法 Hive的加載數(shù)據(jù)本地加載和HDFS加載 Hive的partition詳解 Hive的存儲(chǔ)方式詳解 RCFILE、TEXTFILE和SEQUEUEFILE Hive的UDF和UDAF Hive的transform詳解 Hive的JDBC連接 使用JDBC 連接Hive進(jìn)行查詢和分析 使用正則表達(dá)式加載數(shù)據(jù) 編寫(xiě)UDF函數(shù) 編寫(xiě)UDAF自定義函數(shù) Partition使用實(shí)戰(zhàn) Transform使用實(shí)戰(zhàn) 某些大型公司使用hive分析日志案例詳解和實(shí)戰(zhàn)。模塊八Hbase使用 Hbase原理 Hmaster詳解 RegionServer詳解 Zookeeper介紹 Hbase安裝 Hbase邏輯視圖介紹 Hbase物理視圖介紹 Hbase的二級(jí)索引介紹 Hbase 的DDL和DML Hbase表的設(shè)計(jì)案例 Hbase的import功能介紹 MapReduce操作Hbase Hbase的 thrift Server介紹 Hbase 的API介紹 Hbase案例分析 Hbase安裝實(shí)戰(zhàn) MapReduce操作Hbase實(shí)戰(zhàn) Hbase的API實(shí)戰(zhàn) Hbase表結(jié)構(gòu)設(shè)計(jì)實(shí)戰(zhàn)模塊九Hadoop集群配置介紹和維護(hù) Hadoop集群的部署要點(diǎn) NameNode和SecondaryNameNode和JobTracker機(jī)器的配置要求 dataNode與tasktracker機(jī)器的配置要求 Hadoop集群管理的工具介紹 Ganglia和nig
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全護(hù)理試題及答案
- 地?zé)崮芄┡诒狈睫r(nóng)村地區(qū)的應(yīng)用現(xiàn)狀與2025年發(fā)展前景報(bào)告001
- 民間艾灸達(dá)人培訓(xùn)課件
- 乙型腦炎的培訓(xùn)課件
- 員工職業(yè)道德提升課件
- 中國(guó)利率市場(chǎng)化課件
- 制取氧氣說(shuō)課課件
- 江蘇省蘇州市吳中學(xué)、吳江、相城區(qū)2025屆英語(yǔ)七年級(jí)第二學(xué)期期末檢測(cè)試題含答案
- 年度員工活動(dòng)計(jì)劃方案
- 山東省德州市德城區(qū)2025年八下英語(yǔ)期末經(jīng)典試題含答案
- 精神科火災(zāi)演練腳本
- 汽輪發(fā)電機(jī)組設(shè)備運(yùn)行記錄日?qǐng)?bào)表(正面) A2
- 15J403-1-樓梯欄桿欄板(一)
- 2024年婦幼健康“三基”培訓(xùn)考試復(fù)習(xí)題庫(kù)-下(多選、判斷題)
- 子癇的搶救和護(hù)理
- 2025年高考政治一輪復(fù)習(xí):統(tǒng)編版必修3《政治與法治》必背考點(diǎn)知識(shí)講義
- 民政統(tǒng)計(jì)信息管理系統(tǒng)培訓(xùn)手冊(cè)街鄉(xiāng)鎮(zhèn)
- 中職英語(yǔ)新課標(biāo)詞匯表
- 2024秋期國(guó)家開(kāi)放大學(xué)《國(guó)際法》一平臺(tái)在線形考(形考任務(wù)1至5)試題及答案
- 天翼云從業(yè)者認(rèn)證考試題庫(kù)及答案
- T-CEC 153-2018并網(wǎng)型微電網(wǎng)的負(fù)荷管理技術(shù)導(dǎo)則
評(píng)論
0/150
提交評(píng)論