您现在的位置是:课程
大数据核心:Spark 核心技术【大数据离线处理领域的王者】
2023-06-29 21:15课程 人已围观
Spark 是现在非常流行、使用范围最广泛的大数据分布式计算技术,是做大数据开发必备的一项技能。
本课程主要是由浅入深的讲解 Spark 核心知识点,内容如下:
一、Spark 集群和开发环境的搭建
二、站在 high level 上理解 Spark
三、讲解 Spark RDD 的分布式计算原理和特点,以及常用的 API
四、项目实战:会话切割
五、阶段实战:TopN、数据倾斜等问题的解决
六、正确提交 Spark 应用,重点讲解 Spark On Yarn
七、Spark 中的应用、任务的调度机制(面试必问)