需求:在平台设计中我们常常需要后端触发任务,由spark进行数据接入到hive表中,而spark运行并不完全稳定,如何保证失败重新导入时主表数据的一致性呢?

解决方案:

大数据平台-spark数据接入到hive保证数据幂等性方案_大数据