您现在的位置是:房产观察 > 百科 > 课程 >
大数据hadoop入门教程
2023-01-10 21:19课程 人已围观
课程咨询、获取课件、技术交流直接加入博学谷在线学习:631731828
课程简介
本课程是大数据学科的入门教程,将会为您讲述hadoop的具体内容,对大数据感兴趣的你一定不要错过哦!
Hadoop实现了一个分布式文件系统,简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的硬件上;而且它提供高吞吐量来访问应用程序的数据,适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求,可以以流的形式访问文件系统中的数据。Hadoop中的分布式计算框架,使的分布式编程更简单,能够很好的处理存储在hdfs上的海量数据。
适合人群
1.想要转行大数据开发的在职程序员
2.想了解大数据处理的所有人员
课程亮点
1.从hadoop基本使用、运行原理、实战案例 全方位讲解
2.从概念讲起,没有接触过hadoop的学员也能很好理解
3.课程内容精炼,学习效率高
主讲内容
第一章 Apache Hadoop简介
01.Hadoop介绍
02.Hadoop发展简史
03.Hadoop特性优点&国内外应用
第二章 Apache Hadoop—集群搭建
01.集群搭建--发行版本&集群简介
02.集群搭建--服务器环境准备
03.集群搭建--JDK环境安装
04.集群搭建--安装包目录结构
05.集群搭建--配置文件修改上
06.集群搭建--配置文件修改下
07.集群搭建--配置文件注意事项
08.集群搭建--namenode格式化
09.集群搭建--启动方式
10.集群搭建--集群ui&初体验
第三章 Apache Hadoop—HDFS
01.HDFS--介绍&模拟实现思路
02.HDFS--设计目标
03.HDFS--重要特性
04.HDFS--shell客户端
05.HDFS--shell常用命令介绍
06.HDFS基本原理--NameNode概述
07.HDFS基本原理--DataNode概述
08.HDFS工作机制--概述
09.HDFS工作机制--写数据流程--上
10.HDFS工作机制--写数据流程--下
11.HDFS工作机制--读数据流程
12.HDFS应用开发--JAVA api环境&对象
13.HDFS应用开发--创建目录&客户端身份设置
14.HDFS应用开发--下载文件&本地hadoop环境配置
15.HDFS应用开发--其他api&Stream操作
16.案例:shell定时采集数据至hdfs--需求分析
17.案例:shell定时采集数据至hdfs--实现
第四章 Hadoop MapReduce
01.理解MapReduce思想
02.MapReduce计算模拟实现思路
03.MapReduce设计构思
04.MapReduce框架结构&编程规范
05.WordCount案例--Mapper编写:mr数据类型
06.WordCount案例--Mapper编写:map方法
07.WordCount案例--Reducer编写:类型确定&如何调用
08.WordCount案例--Reducer编写:reduce方法编程
09.WordCount案例--运行主类Job编程
10.程序运行模型--集群运行模式
11.程序运行模型--本地运行模式
12.MapReduce的输入和输出
第五章 MapReduce数据分区&分区规则及编程案例
01.理解MapReduce思想
02.MapReduce计算模拟实现思路
03.MapReduce设计构思
04.MapReduce框架结构&编程规范
05.WordCount案例--Mapper编写:mr数据类型
06.WordCount案例--Mapper编写:map方法
07.WordCount案例--Reducer编写:类型确定&如何调用
08.WordCount案例--Reducer编写:reduce方法编程
09.WordCount案例--运行主类Job编程
10.程序运行模型--集群运行模式
11.程序运行模型--本地运行模式
12.MapReduce的输入和输出
第六章 Apache Flume概述及案例讲解
01.概述&运行机制
02.安装部署&netcat-logger
03.案例--采集目录至HDFS
04.案例--spooldir使用注意事项
05.案例--采集文件至HDFS
06.高级功能--load balance
07.高级功能--failover
08.实战案例--采集日志汇总&拦截器使用
09.扩展了解--自定义拦截器思路
学完收获
1.快速了解hadoop
2.学会hadoop集群中的文件存储功能.分布式编程框架
3.了解离线大数据处理的基本流程