spark保存数据到redis spark保存为csv

转载

clghxq 2023-05-25 12:39:17

在spark-sql中进行数据分析之后，对数据进行导出，会被导出到hdfs

首先进入spark本地模式

/export/server/spark/bin/spark-shell

数据存储到dataframe

val df = spark.sql("SELECT * FROM table_name WHERE condition")

df.write.format("csv").option("header", "true").save("path_to_file")

其中，format("csv")表示输出文件格式为csv，option("header", "true")表示在输出文件中包含表头，save("path_to_file")指定输出文件的路径。但是该方法数据不在一个文件中。

下面这个会将数据存到一个文件中

val df = spark.sql("SELECT * FROM my_database.my_table WHERE ...")
df.coalesce(1).write.csv("/path/to/output/csv")

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客