1.Spark examples中自带的三个例子实践
在《深入理解Spark核心思想和源码分析》这本书的10.9有讲到
LiveJournalPageRank.scala,里面的数据下载比较慢,而且本地跑会比较慢,故之后有时间学习
2.《Spark高级数据分析》这本书中第7章用GraphX分析伴生网络
3.王家林老师的两本书,还没买
KeepLearningAI 博主文章分类:spark ©著作权
文章标签 Spark组件之GraphX学习20-- scala 数据分析 数据 文章分类 运维
1.Spark examples中自带的三个例子实践
在《深入理解Spark核心思想和源码分析》这本书的10.9有讲到
LiveJournalPageRank.scala,里面的数据下载比较慢,而且本地跑会比较慢,故之后有时间学习
2.《Spark高级数据分析》这本书中第7章用GraphX分析伴生网络
3.王家林老师的两本书,还没买
C++入门知识详解,包括C++的命名空间域,输入输出,函数重载,引用等。
更多代码请见:https://github.com/xubo245/SparkLearning1解释2.代码:/** * @author xubo * ref http://spark.apache.org/docs/1.5.2/g60503 */package
更多代码请见:https://github.com/xubo245/SparkLearning1解释connectedCompone
更多代码请见
更多代码请见:https://github.com/xubo245/SparkLearning1解释原理在参考【3】中讲的
1.理解:HdfsWordCount 是从hdfs的文件读入流文件,即制定文件目录,每个一段时间
更多代码请见:https://github.com/xubo245/SparkLearning1.理解WindowsWo
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M