您现在的位置是:课程

大数据hadoop入门教程

2023-01-10 21:19课程 人已围观

课程咨询、获取课件、技术交流直接加入博学谷在线学习:631731828


课程简介

本课程是大数据学科的入门教程,将会为您讲述hadoop的具体内容,对大数据感兴趣的你一定不要错过哦!

Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。Hadoop中的分布式计算框架,使的分布式编程更简单,能够很好的处理存储在hdfs上的海量数据。
 

适合人群

1.想要转行大数据开发的在职程序员

2.想了解大数据处理的所有人员
 

课程亮点

1.从hadoop基本使用、运行原理、实战案例 全方位讲解

2.从概念讲起,没有接触过hadoop的学员也能很好理解

3.课程内容精炼,学习效率高
 

主讲内容

第一章 Apache Hadoop简介

01.Hadoop介绍

02.Hadoop发展简史

03.Hadoop特性优点&国内外应用

第二章 Apache Hadoop—集群搭建

01.集群搭建--发行版本&集群简介

02.集群搭建--服务器环境准备

03.集群搭建--JDK环境安装

04.集群搭建--安装包目录结构

05.集群搭建--配置文件修改上

06.集群搭建--配置文件修改下

07.集群搭建--配置文件注意事项

08.集群搭建--namenode格式化

09.集群搭建--启动方式

10.集群搭建--集群ui&初体验

第三章 Apache Hadoop—HDFS

01.HDFS--介绍&模拟实现思路

02.HDFS--设计目标

03.HDFS--重要特性

04.HDFS--shell客户端

05.HDFS--shell常用命令介绍

06.HDFS基本原理--NameNode概述

07.HDFS基本原理--DataNode概述

08.HDFS工作机制--概述

09.HDFS工作机制--写数据流程--上

10.HDFS工作机制--写数据流程--下

11.HDFS工作机制--读数据流程

12.HDFS应用开发--JAVA api环境&对象

13.HDFS应用开发--创建目录&客户端身份设置

14.HDFS应用开发--下载文件&本地hadoop环境配置

15.HDFS应用开发--其他api&Stream操作

16.案例:shell定时采集数据至hdfs--需求分析

17.案例:shell定时采集数据至hdfs--实现

第四章 Hadoop MapReduce

01.理解MapReduce思想

02.MapReduce计算模拟实现思路

03.MapReduce设计构思

04.MapReduce框架结构&编程规范

05.WordCount案例--Mapper编写:mr数据类型

06.WordCount案例--Mapper编写:map方法

07.WordCount案例--Reducer编写:类型确定&如何调用

08.WordCount案例--Reducer编写:reduce方法编程

09.WordCount案例--运行主类Job编程

10.程序运行模型--集群运行模式

11.程序运行模型--本地运行模式

12.MapReduce的输入和输出

第五章 MapReduce数据分区&分区规则及编程案例

01.理解MapReduce思想

02.MapReduce计算模拟实现思路

03.MapReduce设计构思

04.MapReduce框架结构&编程规范

05.WordCount案例--Mapper编写:mr数据类型

06.WordCount案例--Mapper编写:map方法

07.WordCount案例--Reducer编写:类型确定&如何调用

08.WordCount案例--Reducer编写:reduce方法编程

09.WordCount案例--运行主类Job编程

10.程序运行模型--集群运行模式

11.程序运行模型--本地运行模式

12.MapReduce的输入和输出

第六章 Apache Flume概述及案例讲解

01.概述&运行机制

02.安装部署&netcat-logger

03.案例--采集目录至HDFS

04.案例--spooldir使用注意事项

05.案例--采集文件至HDFS

06.高级功能--load balance

07.高级功能--failover

08.实战案例--采集日志汇总&拦截器使用

09.扩展了解--自定义拦截器思路
 

学完收获

1.快速了解hadoop

2.学会hadoop集群中的文件存储功能.分布式编程框架

3.了解离线大数据处理的基本流程

-->

站点信息

  • 文章统计篇文章