1.
准备文本文件
从文件创建RDD lines=sc.textFile()
筛选出含某个单词的行 lines.filter()
lambda 参数:条件表达式
2.
生成单词的列表
从列表创建RDD words=sc.parallelize()
筛选出长度大于2 的单词 words.filter()
1.
准备文本文件
从文件创建RDD lines=sc.textFile()
筛选出含某个单词的行 lines.filter()
lambda 参数:条件表达式
2.
生成单词的列表
从列表创建RDD words=sc.parallelize()
筛选出长度大于2 的单词 words.filter()
上一篇:累加
RDD(弹性分布式数据集)RDD是Spark中最基本的数据抽象,其实就是分布式的元素集合。RDD有三
Spark core编程题
Spark-RDD编程
x
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M