《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案

上傳人：非*** IP屬地：河北上傳時間：2024-07-16 格式：PDF 頁數(shù)：39 大?。?.62MB 積分：12 舉報 版權(quán)申訴

《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案_第2頁

《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案_第3頁

《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案_第4頁

《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案_第5頁

已閱讀5頁，還剩34頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

教案首頁（第1次課）

（以2課時為單元）

課序授課日期授課班次授課教師批準(zhǔn)人

《大數(shù)據(jù)技術(shù)原理及應(yīng)用》是學(xué)習(xí)大數(shù)據(jù)技術(shù)的入門課程，是計算機科學(xué)與

技術(shù)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、人工智能等專業(yè)的一門學(xué)科基礎(chǔ)與專業(yè)核心課程。

該課程著重講述大數(shù)據(jù)技術(shù)的知識體系，闡明其基本原理，引導(dǎo)學(xué)生進(jìn)行初級實

踐和了解相關(guān)應(yīng)用，培養(yǎng)學(xué)生運用大數(shù)據(jù)平臺搭建、大數(shù)據(jù)收集與預(yù)處理、大數(shù)

據(jù)遷移、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)處理與分析、數(shù)據(jù)可視化等方法和技術(shù)工具

完成大數(shù)據(jù)應(yīng)用的能力，在整個大數(shù)據(jù)課程體系中起著承前啟后重要作用。該課

課程描述程由理論教學(xué)和實驗教學(xué)兩個部分組成，其先修課程包括面向?qū)ο蟪绦蛟O(shè)計、

Python語言程序設(shè)計、操作系統(tǒng)、數(shù)據(jù)庫原理等，后續(xù)課程包括數(shù)據(jù)采集與預(yù)處

理、大數(shù)據(jù)存儲與管理技術(shù)、數(shù)據(jù)挖掘、大數(shù)據(jù)開發(fā)技術(shù)、大數(shù)據(jù)高級編程、數(shù)

據(jù)可視化技術(shù)等。

總學(xué)時理論教學(xué)實踐教學(xué)周學(xué)時學(xué)分

483216單4雙23

《大數(shù)據(jù)技術(shù)原理及應(yīng)用》圍繞“構(gòu)建知識體系、闡明基本原理、引導(dǎo)初級

實踐、了解相關(guān)應(yīng)用”的指導(dǎo)思想，著重講述大數(shù)據(jù)技術(shù)的基本原理、基本方法、

技術(shù)工具和相關(guān)應(yīng)用，幫助學(xué)生構(gòu)建完整的大數(shù)據(jù)技術(shù)知識體系，使學(xué)生了解大

數(shù)據(jù)技術(shù)在行業(yè)領(lǐng)域中的最新發(fā)展趨勢和前沿知識，熟悉大數(shù)據(jù)應(yīng)用的整個生命

周期，能夠熟練使用Hadoop、Spark等主流大數(shù)據(jù)平臺及其生態(tài)系統(tǒng)中的技術(shù)工

具完成基本的大數(shù)據(jù)應(yīng)用閉環(huán)操作，達(dá)到知行合一、以用促學(xué)的目的。

知識目標(biāo)：

1.理解大數(shù)據(jù)基本概念，了解大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)、人工智能的關(guān)系，

課程教學(xué)了解當(dāng)前大數(shù)據(jù)的崗位及需求、學(xué)習(xí)路線；

目標(biāo)2.認(rèn)識大數(shù)據(jù)處理平臺Hadoop,熟練掌握全分布模式Hadoop集群的部署基

本過程；

3.理解分布式文件系統(tǒng)HDFS的體系架構(gòu)、文件存儲機制和數(shù)據(jù)讀寫過程，

熟練掌握HDFSWebUI的使用、HDFSShell常用命令的使用和HDFS編程；

4.理解分布式計算框架MapReduce的編程思想和作業(yè)執(zhí)行流程，掌握

MapReduce簡單編程，了解當(dāng)前其他主流的大數(shù)據(jù)計算框架如Spark、Storm、FIink

等；

5.理解YARN體系架構(gòu)和工作原理，掌握YARNWebUI、YARNShell的基本

使用，了解ResourceManager高可用機制的原理與配置，了解HDFSNameNode

高可用機制、HDFSNameNodeFederation,HDFSSnapshots;

6.理解分布式協(xié)調(diào)框架ZooKeeper的執(zhí)行原理和應(yīng)用場景，掌握ZooKeeper

集群的部署和ZooKeeperShell常用命令的使用；

7.理解NoSQL數(shù)據(jù)庫與關(guān)系數(shù)據(jù)庫的區(qū)別、分布式數(shù)據(jù)庫HBase的數(shù)據(jù)模

型、體系架構(gòu)和運行機制，熟練掌握HBase集群的部署、HBaseShell常用命令

的使用；

8.理解Hive的體系架構(gòu)和執(zhí)行流程，掌握Hive的部署和連接方式，熟練

掌握Hive基本操作包括HiveDDL、HiveDML的書寫和HiveShell命令的使用；

9.理解數(shù)據(jù)遷移框架Sqoop、日志采集系統(tǒng)Flume、分布式發(fā)布/訂閱消息

系統(tǒng)Kafka的作用、架構(gòu)和工作原理，掌握Sqoop、Flume、Kafka的部署和使用；

課程教學(xué)

10.了解數(shù)據(jù)可視化的概念、作用和過程，理解常用的數(shù)據(jù)可視化圖形，了

目標(biāo)

解當(dāng)前主流的數(shù)據(jù)可視化工具。

能力目標(biāo)：培養(yǎng)學(xué)生學(xué)以致用，能夠綜合利用Hadoop大數(shù)據(jù)平臺及其生態(tài)中

各個工具解決實際大數(shù)據(jù)應(yīng)用方面的基本問題，提高學(xué)生閱讀外文科技文獻(xiàn)能

力，增強學(xué)生發(fā)現(xiàn)問題、分析問題、解決問題能力，與學(xué)科競賽和項目緊密結(jié)合，

穩(wěn)步培養(yǎng)和提高學(xué)生的動手實踐能力、自主創(chuàng)新能力、團(tuán)隊協(xié)作能力、寫作表達(dá)

能力。

情感目標(biāo)：通過對我國大數(shù)據(jù)技術(shù)、傳統(tǒng)優(yōu)秀文化的介紹，增強學(xué)生的民族

自豪感，提升學(xué)生的愛國主義精神，增強文化自信；將專業(yè)知識與服務(wù)社會相結(jié)

合，培養(yǎng)學(xué)生的社會責(zé)任感，樹立正確三觀，使學(xué)生更為深刻的理解專業(yè)內(nèi)涵，

提高學(xué)習(xí)內(nèi)驅(qū)力，培養(yǎng)科學(xué)素養(yǎng)，內(nèi)化為道德準(zhǔn)則、科學(xué)思維和行為規(guī)范。

課題第1講開學(xué)第一課&大數(shù)據(jù)樓述

教材：

[1]徐魯輝.Hadoop大數(shù)據(jù)原理與應(yīng)用[M].西安：西安電子科技大學(xué)出版

社，2020年3月.

參考資料：

[2]徐魯輝.Hadoop大數(shù)據(jù)原理與應(yīng)用實驗教程[M].西安：西安電子科技

大學(xué)出版社,2020年1月.

[3]林子雨.大數(shù)據(jù)技術(shù)原理與應(yīng)用（第2版）[M].北京：人民郵電出版社，

授課教材2017年1月.

參考資料[4]呂林濤.大數(shù)據(jù)技術(shù)及其應(yīng)用[M].北京：科學(xué)出版社，2019年5月.

[5]維克托?邁爾-舍恩伯格，肯尼思?庫克耶.盛楊燕等譯.大數(shù)據(jù)時

代：生活、工作與思維的大變革[M].杭州：浙江人民出版社，2013年1月.

[6]TomWhite.Hadoop:TheDefinitiveGuide（4thEdition）[M].

0'ReillyMedia,April2015.

[7]TomWhite,著.王海，譯.Hadoop權(quán)威指南（第4版）[M].北京：清華

大學(xué)出版社，2017年7月.

[8]BiIIChambers,MateiZaharia.Spark：TheDefinitiveGuide[M].

O'ReillyMedia,February2018.

[9]BiIIChambers,MateiZaharia,著.張巖峰，譯.Spark權(quán)威指南[M].

北京：中國電力出版社，2020年4月.

[10]LarsGeorge.HBase:TheDefinitiveGuide[M].O'ReillyMedia,

September2011.

[11]LarsGeorge,著.代志遠(yuǎn)，譯.HBase權(quán)威指南[M].北京：人民郵電出

版社，2013.

[12]EdwardCaprioIo,DeanWampIer,JasonRuthergIen.Programming

Hive[M].0,ReillyMedia,September2012.

[13]EdwardCaprioIo,DeanWampIer,JasonRutherglen,著.曹坤，

譯.Hive編程指南[M].北京：人民郵電出版社,2013.

[14]蔡斌.Hadoop技術(shù)內(nèi)幕：深入解析HadoopCommon和HDFS架構(gòu)設(shè)計與

實現(xiàn)原理[M].北京：機械工業(yè)出版社，2013年5月.

[15]董西成.Hadoop技術(shù)內(nèi)幕：深入解析MapReduce架構(gòu)設(shè)計與實現(xiàn)原理

[M].北京：機械工業(yè)出版社，2013年5月.

[16]董西成.Hadoop技術(shù)內(nèi)幕：深入解析YARN架構(gòu)設(shè)計與實現(xiàn)原理[M].

北京：機械工業(yè)出版社，2014年1月.

[17]ApacheHadoopProject,https://hadoop.apache.org.

[18]ApacheSparkProject,https：//spark,apache,org.

[19]TheHadoopEcosystemTabIe.

https://hadoopecosystemtabIe.github.io

[20]高校大數(shù)據(jù)課程公共服務(wù)平臺.

http://dbIab.xmu.edu.cn/post/bigdata-teaching-pIatform.

[21]林子雨.中國大學(xué)M00C《大數(shù)據(jù)技術(shù)原理與應(yīng)用》.

https://www.icourse163.org/course/XMU-1002335004.

其它教學(xué)

學(xué)堂云：大數(shù)據(jù)技術(shù)原理及應(yīng)用

資源

開學(xué)第一課

1.明確該課程的教學(xué)目標(biāo)。

2.明確該課程的教學(xué)進(jìn)度、教材、參考資料、上機軟件。

3.明確該課程的考核方式。

4.熟悉學(xué)堂云、雨課堂的使用方法。

目的要求第1章大數(shù)據(jù)概述

1.理解大數(shù)據(jù)的概念（重點），了解大數(shù)據(jù)的內(nèi)涵。

2.理解大數(shù)據(jù)的4V特征：Volume（海量化）、Variety（多樣化）、Value（價值

密度低）、Velocity（快速化）。（重點）

3.了解大數(shù)據(jù)處理關(guān)鍵技術(shù)：數(shù)據(jù)采集與預(yù)處理、數(shù)據(jù)存儲與管理、數(shù)據(jù)處理與

分析、數(shù)據(jù)可視化。（難點）

4.了解大數(shù)據(jù)產(chǎn)業(yè)。

5.理解大物云智5G技術(shù)，掌握大物云智5G之間的關(guān)系。（重點難點）

6.了解大數(shù)據(jù)的崗位。

7.了解大數(shù)據(jù)的學(xué)習(xí)路線。

開學(xué)第一課

1.自我介紹。

2.課程地位、先修及后續(xù)課程。

3.教學(xué)目標(biāo)及知識圖譜。

4.課時分配（理論+實驗）及進(jìn)度、教材、參考資料、上機軟件。

5.考核方式：平時+實臉+期末。

6.學(xué)堂云、雨課堂的使用方法。

教學(xué)內(nèi)容第1章大數(shù)據(jù)概述

1.1大數(shù)據(jù)內(nèi)涵（重點）

1.2大數(shù)據(jù)特征（重點）

1.3大數(shù)據(jù)關(guān)鍵技術(shù)（難點）

1.4大數(shù)據(jù)產(chǎn)業(yè)

1.5大數(shù)據(jù)與物聯(lián)網(wǎng)、云計算、人工智能、5G的關(guān)系（重點，難點）

1.6大數(shù)據(jù)崗位介紹

1.7大數(shù)據(jù)學(xué)習(xí)路線

重點：大數(shù)據(jù)概念，大數(shù)據(jù)特征，大物云智5G之間的關(guān)系。

重點難點

難點：大數(shù)據(jù)關(guān)鍵技術(shù)，大物云智5G之間的關(guān)系。

教學(xué)方法

講授法，討論法，任務(wù)驅(qū)動法

手段

開學(xué)第一課

1.進(jìn)行自我介紹。

2.進(jìn)行頭腦風(fēng)暴，提問問題，引入為何學(xué)習(xí)此課程。

3.闡述課程地位、先修及后續(xù)課程。

4.明確該課程教學(xué)目標(biāo)，了解該課程知識思維導(dǎo)圖。

5.介紹該課程的課時分配及進(jìn)度、教材、參考資料、上機軟件。

教學(xué)步驟6.公布考核方式：平時考核30%（在線考勤、課堂表現(xiàn)、作業(yè)、在線測試）+實

驗考核20%（實臉態(tài)度、實驗報告）+期末考核（筆試或大作業(yè)）。

7.介紹學(xué)堂云、雨課堂的使用方法。

8.完成在線測試，對先修課程的知識和技能進(jìn)行綜合測試。

第1章大數(shù)據(jù)概述

1.提問問題引入“大數(shù)據(jù)”。2.精講本節(jié)內(nèi)容。3.進(jìn)行本節(jié)小結(jié)。

4.布置課后作業(yè)。

1.當(dāng)今IT界的熱門技術(shù)有哪些？

復(fù)習(xí)提問

2.你平時用的哪些應(yīng)用使用到了云計算和大數(shù)據(jù)技術(shù)？

1.章節(jié)測試

完成線上測試“章節(jié)測試1-大數(shù)據(jù)概述”。

2.預(yù)習(xí)作業(yè)

預(yù)習(xí)“初識Hadoop”。

作業(yè)

3.思考題

(1)根據(jù)自己的專業(yè)領(lǐng)域和研究興趣，調(diào)研大數(shù)據(jù)技術(shù)在自己所屬領(lǐng)域中的應(yīng)用

現(xiàn)狀？

(2)調(diào)查分析大數(shù)據(jù)從業(yè)人員常用方法、技術(shù)與工具。

教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)

時間分配(以分鐘計算))10701532

教案首頁（第2次課）

（以2課時為單元）

課序授課日期授課班次授課教師批準(zhǔn)人

課題第2講初識Hadoop

1.理解Hadoop是什么（重點），了解Hadoop的發(fā)展簡史、特點、版本。

2.理解Hadoop生態(tài)系統(tǒng)組成及各組件基本功能。（重點）

3.理解Hadoop體系架構(gòu)。（重點）

4.了解Hadoop在國內(nèi)外應(yīng)用現(xiàn)狀。

5.理解部署Hadoop集群所需系統(tǒng)環(huán)境、Hadoop運行模式，熟練掌握在Linux

目的要求

下部署全分布模式Hadoop過程：規(guī)劃集群、準(zhǔn)備機器及軟件環(huán)境（配置靜態(tài)

IP、修改主機名、編輯域名映射、安裝和配置Java、安裝和配置SSH免密登

錄）、安裝不口酉已置Hadoop集群（hadoop-env.sh>yarn-env.sh、mapred-env.sh^

core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml、sIaves）>

關(guān)閉防火墻、格式化文件系統(tǒng)、啟動和驗證Hadoop、關(guān)閉Hadoopo（重點難點）

第2章初識Hadoop

2.1Hadoop概,述（重點）

2.2Hadoop生態(tài)系統(tǒng)（重點）

教學(xué)內(nèi)容

2.3Hadoop體系架構(gòu)（重點）

2.4Hadoop應(yīng)用現(xiàn)狀

2.5部署和運行Hadoop（重點，難點）

重點:Hadoop是什么,Hadoop生態(tài)系統(tǒng)，Hadoop體系架構(gòu)，部署和運行Hadoop。

重點難點

難點：部署和運行Hadoopo

教學(xué)方法

講授法，討論法，演示法，案例法

手段

第2章初識Hadoop

1.復(fù)習(xí)提問，講評章節(jié)測試1,導(dǎo)入本節(jié)內(nèi)容。

教學(xué)步驟2.精講本節(jié)內(nèi)容。

3.進(jìn)行本節(jié)小結(jié)。

4.布置課后作業(yè)。

1.根據(jù)你的理解，何為大數(shù)據(jù)？

復(fù)習(xí)提問2.大數(shù)據(jù)有哪些特征？

3.大數(shù)據(jù)關(guān)鍵技術(shù)有哪些？

1.章節(jié)測試

作業(yè)

完成線上測試“章節(jié)測試2-初識Hadoopo

2.思考題

(1)準(zhǔn)備Hadoop系統(tǒng)環(huán)境時，安裝SSH是必須的，但是配置SSH免密登錄并

作業(yè)不是必須的，試述為何還要配置SSH免密登錄。

(2)配置Hadoop是部署Hadoop過程中較為繁瑣的步臊，試述配置Hadoop偽

分布模式和全分布式模式的異同。

預(yù)習(xí)線上資源“實臉指導(dǎo)書-實臉1部署全分布模式Hadoop集群”，了解實臉

預(yù)習(xí)內(nèi)容

目的和實驗內(nèi)容，準(zhǔn)備實驗環(huán)境。

教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)

時間分配

10701532

(以分鐘計算)

實驗教學(xué)教案首頁（第3次課）

（以2課時為單元）

課序：3實驗日期:實驗教師：****批準(zhǔn)人:****

一、實驗名稱

實驗1部署全分布模式Hadoop集群

二、實驗?zāi)康?、要?/p>

1.熟練掌握Linux基本命令。

2.掌握靜態(tài)IP地址的配置、主機名和域名映射的修改。

3.掌握Linux環(huán)境下Java的安裝、環(huán)境變量的配置、Java基本命令的使用。

4.理解為何需要配置SSH免密登錄，掌握Linux環(huán)境下SSH的安裝、免密登錄的配

置。

5.熟練掌握在Linux環(huán)境下如何部署全分布模式Hadoop集群。

三、實驗重點、難點

重點：配置全分布模式Hadoop集群。

難點:配置SSH免密登錄。

四、實驗器材、設(shè)備

本實驗所需的軟硬件環(huán)境包括PC、VMwareWorkstationPro、CentOS安裝包、Oracle

JDK安裝包、Hadoop安裝包。

教學(xué)設(shè)計：

一、復(fù)習(xí)提問，回顧部署和運行Hadoop的關(guān)鍵點。教師講述本次實驗的先修技能、實

驗步驟和實驗重點難點。

二、采用實驗法教學(xué)，學(xué)生按照本次實驗的實驗指導(dǎo)書進(jìn)行實驗，教師指導(dǎo)。實驗步驟

如下：

1?酬?掌握

2.熟練簟提Java基本命令

先修技能3.理解SSH安全通信協(xié)議

4.理解Hadoop艇礎(chǔ)知識：運行環(huán)境、運行模式、生態(tài)系統(tǒng)、體系

架構(gòu)、配M文件等

集群架內(nèi)規(guī)劃：主節(jié)點、從節(jié)點、IPi也址、運行服務(wù)、軟硬件配置

1,規(guī)劃部善--------------------------------------------------------------

-------------軟件選擇：虛擬機工具、Linux攆作系統(tǒng)、Java、SSH、Hadoop

2,準(zhǔn)母機卷

配置一

修改主機€

3.準(zhǔn)省軟件環(huán)境,編場域名映射

,安裝和配置Java

f安裝和配置SSH免堂登錄

4,下新安裝Hadoop

Wrj4hddoop.sh:添1?HADOOP_HOME到系統(tǒng)處PATH

配Mhadoop-env.sh:JAVA_HOME,HADOOP_SSH_OPTS,

HADOOP_PID_DIR^

SKmapred-env.sh:JAVAHOME,

HADOOP_MAPRED_PID_DIR^

gBHyarn-env.sh:JAVA_HOME.YARN_PID_DIR^

￡Kcore-site.xml:fs.defaultFS,io.file.buffer.size,

?5.配置全分布便式Hadoop集群hadoop.tmp.di售

部署全分布模式

實驗步驟fiiRhdfs-sitejcml:.dir,

Hadoop集群dfs.datanode.data.dir.node.checkpointdir,

dfs.replication等

配芭mapred-site*ml:等

gBMyarn-4ite.xml:yarn.re$ourcemanager.hostname,

yam-nodemanager.aux-services等

SBslaves

6.關(guān)閉防火墻

7.格式化文件系統(tǒng)

start-dfs.sh

start-yanxsh

啟動Hadoopmr-jobhistory-daemon.shstarthistoryserver

8.啟動和驗證Hadoop方法1：jps查看進(jìn)程

蹈EHadoop方法2:WebUliS看界面

方法3:向Hadoopffe^提交MapReduce應(yīng)用?J?JWordCount

mr-jobhistory-daemon.shstophistoryserver

stop-yam.sh

9.關(guān)閉Hadoopstop-dfs.sh

圖實驗1部署全分布模式Hadoop集群知識地圖

1.規(guī)劃部署。

2.準(zhǔn)備機器。

3.準(zhǔn)備軟件環(huán)境：配置靜態(tài)IP；修改主機名；編輯域名映射；安裝和配置Java；安裝

和配置SSH免密登錄。

4.獲取和安裝Hadoop。

5.配置全分布模式Hadoop集群。

6.關(guān)閉防火墻。

7.格式化文件系統(tǒng)。

8.啟動和驗證Hadoop。

9.關(guān)閉Hadoopo

三、布置課后作業(yè)

1.完成本次實驗的電子版《實驗報告》，并與本周日前上傳至平臺。

2.預(yù)習(xí)“HDFS體系架構(gòu)和文件存儲機制”。

教案首頁（第4次課）

（以2課時為單元）

課序授課日期授課班次授課教師批準(zhǔn)人

課題第3講HDFS體系架構(gòu)和文件存儲機制

1.了解大數(shù)據(jù)存儲對文件系統(tǒng)的挑戰(zhàn)，理解HDFS文件系統(tǒng)特點。

2,理解HDFS體系架構(gòu)，掌握NameNode與DataNode的作用與關(guān)系，掌握HDFS

目的要求元數(shù)據(jù)文件的組成。（重點）

3.理解HDFS文件存儲機制：塊，副本策略。（重點）

4.掌握HDFS數(shù)據(jù)讀寫過程及涉及到的關(guān)鍵類。（重點）

第3章分布式文件系統(tǒng)HDFS

3.1HDFS簡介

教學(xué)內(nèi)容3.2HDFS體系架構(gòu)（重點）

3.3HDFS文件存儲機制（重點）

3.4HDFS數(shù)據(jù)讀寫過程（重點）

重點：HDFS體系架構(gòu)，HDFS文件存儲機制，HDFS數(shù)據(jù)讀寫過程。

重點難點

難點：無。

教學(xué)方法

講授法，討論法，演示法，案例法

手段

第3章分布式文件系統(tǒng)HDFS

1.復(fù)習(xí)提問，講評章節(jié)測試2和實驗1,導(dǎo)入本節(jié)內(nèi)容。

教學(xué)步驟2.精講本節(jié)內(nèi)容。

3.進(jìn)行本節(jié)小結(jié)。

4.布置課后作業(yè)。

復(fù)習(xí)提問簡述部署全分布模式Hadoop集群的基本步驟。

作業(yè)無

預(yù)習(xí)內(nèi)容預(yù)習(xí)“實戰(zhàn)HDFS“、"HDFS高可靠性機制

教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)

時間分配

10701532

（以分鐘計算）

教案首頁（第5次課）

（以2課時為單元）

課序授課日期授課班次授課教師批準(zhǔn)人

課題第4講實戰(zhàn)HDFS

1.掌握HDFSWebUI的使用，熟練掌握HDFSShelI常用命令使用和HDFS

JavaAPI編程。（重點，難點）

目的要求

2.了解HDFS高可靠性機制：元數(shù)據(jù)備份、SecondaryNameNode>BackupNode

備份、HDFSNameNodeHA^HDFSNameNodeFederation、HDFSSnapshotso

第3章分布式文件系統(tǒng)HDFS

3.5實戰(zhàn)HDFS（重點,難點）

3.5.1HDFSWebUI

教學(xué)內(nèi)容

3.5.2HDFSShelI

3.5.3HDFSJavaAPI編程

3.6HDFS高可靠性機制（了解）

重點：HDFS體系架構(gòu)，HDFS文件存儲機制，HDFS數(shù)據(jù)讀寫過程。

重點難點

難點：無。

教學(xué)方法

講授法，討論法，演示法，案例法

手段

第3章分布式文件系統(tǒng)HDFS

教學(xué)步驟1.復(fù)習(xí)提問，導(dǎo)入本節(jié)內(nèi)容。

2.精講本節(jié)內(nèi)容。3.進(jìn)行本節(jié)小結(jié)。4.布置課后作業(yè)。

1.簡述HDFS是什么。2.簡述HDFS體系架構(gòu)。3.簡述HDFS文件存儲機制。

復(fù)習(xí)提問

4.簡述HDFS數(shù)據(jù)讀寫過程。

1.章節(jié)測試

完成線上測試“章節(jié)測試3-分布式文件系統(tǒng)HDFS”。

作業(yè)2.思考題

（1）簡述HDFS元數(shù)據(jù)的更新和備份過程Checkpoint。

（2）簡述備份節(jié)點和SecondaryNameNode的區(qū)別是什么？

預(yù)習(xí)線上資源“實驗指導(dǎo)書-實驗2實戰(zhàn)HDFS”，了解實驗?zāi)康暮蛯嵞槂?nèi)容，

預(yù)習(xí)內(nèi)容

準(zhǔn)備實驗環(huán)境。

教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)

時間分配

5751532

（以分鐘計算）

實驗教學(xué)教案首頁（第3次課）

（以2課時為單元）

課序：6實驗日期:實驗教師：****批準(zhǔn)人:****

一、實驗名稱

實驗2實戰(zhàn)HDFS

二、實驗?zāi)康摹⒁?/p>

1.理解HDFS體系架構(gòu)。

2.理解HDFS文件存儲原理和數(shù)據(jù)讀寫過程。

3.熟練掌握HDFSWebUI界面的使用。

4.熟練掌握HDFSShell常用命令的使用。

5.熟練掌握HDFS項目開發(fā)環(huán)境的搭建。

6.掌握使用HDFSJavaAPI編寫HDFS文件操作程序。

三、實驗重點、難點

重點：使用HDFSWebUI、HDFSSheikHDFSJavaAPI編程。

難點：使用HDFSJavaAPI編程。

四、實驗器材、設(shè)備

本實驗所需的軟件環(huán)境包括全分布模式Hadoop集群、Eclipse。

教學(xué)設(shè)計：

一、復(fù)習(xí)提問，回顧使用HDFSWebUI、HDFSSheikHDFSJavaAPI編程的關(guān)鍵點。

教師講述本次實驗的先修技能、實驗步驟和實驗重點難點。

二、采用實驗法教學(xué)，學(xué)生按照本次實驗的實驗指導(dǎo)書進(jìn)行實驗，教師指導(dǎo)。實驗步驟

如下:

1熟練掌握Linux基本命令

2.掌握J(rèn)ava編程

3.熟練掌握全分布模式Hadoop集群的使用

先修技能

4.理解HDFS基礎(chǔ)知識：功能、體系架構(gòu)、文件存儲原理HDFS接

口等

1啟動Hadoop集群

會2.使用HDFSShell

★3.蝴HDFSWebUI

4.搭建HDFS開發(fā)環(huán)境Eclipse

在Eelipse中創(chuàng)建Java項目

—

實戰(zhàn)HDFS實驗步驟在項目中添加所需JAR包

F*5.使用HDFSJavaAPI編程的目中新建包

戶編寫Java程序

編譯運行程序

6.關(guān)閉Hadoop集群

★童點：使用HDFSWeb5、HDFSShell.HDFSJavaAPI編程

實驗重點難點，難點：使用HDFSJavaAPI編程

rHDFSNameNodeHA高可用環(huán)境搭建

拓展訓(xùn)練-----------------------------

圖實驗2實戰(zhàn)HDFS知識地圖

1.啟動全分布模式Hadoop集群，守護(hù)進(jìn)程包括NameNode、DalaNode、

SecondaryNameNode、ResourceManager,NodeManager和JobHistoryServer(>

2.查看HDFSWeb界面。

3.練習(xí)HDFSShell文件系統(tǒng)命令和系統(tǒng)管理命令。

4.在Hadoop集群主節(jié)點上搭建HDFS開發(fā)環(huán)境Eclipse?

5.使用HDFSJavaAPI編寫HDFS文件操作程序，實現(xiàn)上傳本地文件到HDFS的功能，

采用本地執(zhí)行和集群執(zhí)行的兩種執(zhí)行方式測試，觀察結(jié)果。

6.使用HDFSJavaAPI編寫HDFS文件操作程序，實現(xiàn)查看上傳文件在HDFS集群中

位置的功能，采用本地執(zhí)行和集群執(zhí)行的兩種執(zhí)行方式測試，觀察結(jié)果。

7.關(guān)閉全分布模式Hadoop集群。

三、布置課后作業(yè)

1.完成本次實驗的電子版《實驗報告》，并與本周日前上傳至平臺。

2.預(yù)習(xí)“MapReduce概述和作業(yè)執(zhí)行流程”。

教案首頁（第7次課）

（以2課時為單元）

課序授課日期授課班次授課教師批準(zhǔn)人

課題第5講MapReduce概述及作業(yè)執(zhí)行流程

1.理解MapReduce編程思想。（重點）

2.掌握MapReduce應(yīng)用程序WordCount中Mapper類、Reducer類、main。方

法的編寫（重點、難點），并熟練掌握向Hadoop集群提交MR作業(yè)和查看結(jié)果

目的要求的方法（重點）。

3.理解MapReduce作業(yè)執(zhí)行流程的五個階段，理解MapReduce2.0作業(yè)執(zhí)行

時體系架構(gòu)。（重點）

4.理解Shuffle機制。（難點）

第4章分布式計算框架MapReduce

4.1MapReduce簡介（重點）

分而治之：鍵值對〈key,vaIue>

4.2第一個MapReduce案例:WordCount（重點）

教學(xué)內(nèi)容

Mapper類、Reducer類、main。方法的編寫

4.3MapReduce作業(yè)執(zhí)行流程（重點）

InputFormat,Map,ShuffIe,Reduce,OutputFormat

4.5Shuffle機制（難點）

重點：MapReduce編程思想；WordCount中Mapper類、Reducer類、main（）方

法的編寫；MapReduce作業(yè)執(zhí)行流程。

重點難點

難點：WordCount中Mapper類、Reducer類、main。方法的編寫；Shuffle機

制。

教學(xué)方法

講授法，演示法，案例法

手段

1.復(fù)習(xí)提問，講評章節(jié)測試3和實驗2,導(dǎo)入本節(jié)內(nèi)容。2.精講教學(xué)內(nèi)容。

教學(xué)步驟

3.進(jìn)行本節(jié)小結(jié)。4.布置課后作業(yè)。

復(fù)習(xí)提問簡述HDFS的體系架構(gòu)和接口。

作業(yè)自行編寫MapReduce程序WordCountDIY,并提交Hadoop集群運行。

預(yù)習(xí)內(nèi)容預(yù)習(xí)“MapReduce數(shù)據(jù)類型與格式”、“在MapReduce中自定義組件”。

教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)

時間分配

10701532

（以分鐘計算）

教案首頁（第8次課）

（以2課時為單元）

課序授課日期授課班次授課教師批準(zhǔn)人

課題第6講MapReduce數(shù)據(jù)類型和自定義組件

1.掌握MapReduce數(shù)據(jù)類型（重點），理解序列化和反序列化（難點）。

目的要求2.了解自定義輸入組件、自定義排序組件、自定義分區(qū)組件、自定義輸出組

件的編寫。（難點）

第4章分布式計算框架MapReduce

4.4MapReduce數(shù)據(jù)類型與格式

序列化，反序列化

IntWritable,LongWritable,FloatWritabIe,DoubleWritabIe,ByteWritabIe

BooIeanWritabIe,Text,NuIIWritabIe

4.6在MapReduce中自定義組件

輸入組件：org.apache,hadoop.mapreduce.InputFormat,RecordReader,重

教學(xué)內(nèi)容

寫createRecordReader()

排序組件：自定義類實現(xiàn)ComparabIe或WritabIeComparabIe,重寫

compareToO

分區(qū)組件：org.apache.hadoop.mapreduce.Partitioner,重寫

getPartition()

輸出組件：org.apache.hadoop.mapreduce.OutputFormat,RecordWriter,重

寫getRecordWriter()

重點:MapReduce數(shù)據(jù)類型。

重點難點

難點：序列化和反序列化；MapReduce自定義組件編寫。

教學(xué)方法

講授法，演示法，案例法

手段

1.復(fù)習(xí)提問，導(dǎo)入本節(jié)內(nèi)容。

教學(xué)步驟

2.精講教學(xué)內(nèi)容。3.進(jìn)行本節(jié)小結(jié)。4.布置課后作業(yè)。

復(fù)習(xí)提問簡述MapReduce作業(yè)執(zhí)行流程。

作業(yè)重讀MapReduce示例程序WordCount,深入理解其中的數(shù)據(jù)類型。

預(yù)習(xí)內(nèi)容預(yù)習(xí)“實戰(zhàn)MapReduce”、“其它主流計算框架

教學(xué)環(huán)節(jié)復(fù)習(xí)提問新課講解課堂討論每課小結(jié)布置作業(yè)

時間分配

5701555

（以分鐘計算）

實驗教學(xué)教案首頁（第9次課）

（以2課時為單元）

課序：9實驗日期:實驗教師：****批準(zhǔn)人:****

一、實驗名稱

實驗3MapReduce編程（1）

二、實驗?zāi)康摹⒁?/p>

1.理解MapReduce編程思想。

2.理解MapReduce作業(yè)執(zhí)行流程。

3.理解MR-App編寫步驟，掌握使用MapReduceJavaAPI進(jìn)行MapReduce基本編程，

熟練掌握如何在Hadoop集群上

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案

文檔簡介

溫馨提示

最新文檔

評論

《Hadoop大數(shù)據(jù)原理與應(yīng)用》教學(xué)教案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔