一、filter,map,flatmap练习:
1.读文本文件生成RDD lines
2.将一行一行的文本分割成单词 words
3.全部转换为小写
4.去掉长度小于3的单词
5.去掉停用词
二、groupByKey练习
6.练习一的生成单词键值对
7.对单词进行分组
8.查看分组结果
一、filter,map,flatmap练习:
1.读文本文件生成RDD lines
2.将一行一行的文本分割成单词 words
3.全部转换为小写
4.去掉长度小于3的单词
5.去掉停用词
二、groupByKey练习
6.练习一的生成单词键值对
7.对单词进行分组
8.查看分组结果
Spark core编程题
Spark-RDD编程
RDD(弹性分布式数据集)RDD是Spark中最基本的数据抽象,其实就是分布式的元素集合。RDD有三
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M