Spark源码阅读思路

  • 下载源码
  • 导入源码到IDEA
  • 源码阅读的两条线
  • 线路1-建立连接-申请资源
  • 线路2-构建DAG-划分Stage-提交Task流程
  • Driver中寻找入口
  • SparkContext
  • RDD
  • SparkContext
  • DAGScheduler
  • EventLoop
  • DAGSchedulerEventProcessLoop
  • DAGScheduler
  • TaskScheduler
  • TaskSchedulerImpl
  • CoarseGrainedSchedulerBackend
  • CoarseGrainedExecutorBackend


下载源码

http://spark.apache.org/downloads.html

如何下载spark源码 spark源码看什么书_源码阅读

导入源码到IDEA

  • 1.下载源码/或使用资料中的添加好注释的源码压缩包并解压
  • 2.导入到IDAE中
  • 3.选择pom.xml
  • 4.一路下一步直到finish
  • 5.等待下载依赖解析项目看到如下目录结构即可
  • 注意:时间会比较长,耐心等待,如果最后还是报红,不用管,因为我们只去阅读,不去运行

源码阅读的两条线

如何下载spark源码 spark源码看什么书_源码阅读_02

线路1-建立连接-申请资源

如何下载spark源码 spark源码看什么书_如何下载spark源码_03

线路2-构建DAG-划分Stage-提交Task流程

Driver中寻找入口

如何下载spark源码 spark源码看什么书_github_04

SparkContext

如何下载spark源码 spark源码看什么书_源码阅读_05

RDD

如何下载spark源码 spark源码看什么书_spark_06

SparkContext

如何下载spark源码 spark源码看什么书_apache_07

DAGScheduler

如何下载spark源码 spark源码看什么书_github_08


如何下载spark源码 spark源码看什么书_如何下载spark源码_09

EventLoop

如何下载spark源码 spark源码看什么书_github_10

DAGSchedulerEventProcessLoop

如何下载spark源码 spark源码看什么书_spark_11

DAGScheduler

如何下载spark源码 spark源码看什么书_apache_12


如何下载spark源码 spark源码看什么书_如何下载spark源码_13


如何下载spark源码 spark源码看什么书_apache_14


如何下载spark源码 spark源码看什么书_apache_15


如何下载spark源码 spark源码看什么书_如何下载spark源码_16


如何下载spark源码 spark源码看什么书_源码阅读_17


如何下载spark源码 spark源码看什么书_源码阅读_18


如何下载spark源码 spark源码看什么书_spark_19


如何下载spark源码 spark源码看什么书_apache_20

TaskScheduler

如何下载spark源码 spark源码看什么书_源码阅读_21


如何下载spark源码 spark源码看什么书_github_22

TaskSchedulerImpl

如何下载spark源码 spark源码看什么书_apache_23

CoarseGrainedSchedulerBackend

如何下载spark源码 spark源码看什么书_apache_24


如何下载spark源码 spark源码看什么书_spark_25


如何下载spark源码 spark源码看什么书_如何下载spark源码_26


如何下载spark源码 spark源码看什么书_apache_27


如何下载spark源码 spark源码看什么书_spark_28


如何下载spark源码 spark源码看什么书_apache_29

CoarseGrainedExecutorBackend

如何下载spark源码 spark源码看什么书_源码阅读_30


如何下载spark源码 spark源码看什么书_如何下载spark源码_31