spark insert overwrite spark insert overwrite 数据没了

转载

jowvid 2023-06-30 18:43:32

文章标签 spark hive sql 文章分类 Spark 大数据

简单记录一下，防止踩坑。

hive.exec.dynamic.partition=true

hive.exec.dynamic.partition.mode=nonstrict

开启这两个参数，进行动态插入分区表：

insert overwrite table tablename partition(part_col)

1.这种方式在2.3之前，只会修改查询结果的分区，没什么问题。

2.但是如果在2.3之后，spark会增加一个

spark.sql.sources.partitionOverwriteMode参数，这个参数有两个值，默认

static，可修改为

dynamic。问题就出在这里，如果不更改这个参数，使用默认的static，在动态插入时，不管插入的分区是否存在，都会导致所有的分区被覆盖，数据无法找回。

3.可以在hive中使用show create table查看

spark.sql.create.version来确认表的版本。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客