Spark核心概念简介

        一个Spark应用都由驱动器程序发起集群上的各种并发操作,一个驱动器程序一般包含多个执行器节点,驱动器程序通过一个SaprkContext对象访问saprk。RDD(弹性分布式数据集)----分布式的元素集合,RDD支持两种操作:转化操作、行动操作,如map、reduce函数。

Spark学习之路---Spark核心概念_Spark RDD