您现在的位置是:课程

大数据核心:Spark 核心技术【大数据离线处理领域的王者】

2023-06-29 21:15课程 人已围观

Spark 是现在非常流行、使用范围最广泛的大数据分布式计算技术,是做大数据开发必备的一项技能。

 

本课程主要是由浅入深的讲解 Spark 核心知识点,内容如下:

一、Spark 集群和开发环境的搭建

二、站在 high level 上理解 Spark

三、讲解 Spark RDD 的分布式计算原理和特点,以及常用的 API

四、项目实战:会话切割

五、阶段实战:TopN、数据倾斜等问题的解决

六、正确提交 Spark 应用,重点讲解 Spark On Yarn

七、Spark 中的应用、任务的调度机制(面试必问)

-->

站点信息

  • 文章统计篇文章