想写个博客:为什么删除存储在Hadoop上的hive数据后,MySQL里存储的元数据信息仍然存在,hive的shell窗口里查看也仍然存在

为什么删除存储在Hadoop上的hive数据后,MySQL里存储的元数据信息仍然存在,hive的shell窗口里查看也仍然存在

答:根本删除不掉,这个表的结构信息仍然存在。当你在启动hive后的shell窗口里再次插入数据的时候,再去浏览器查看hdfs文件系统,你就会发现,你又可以看到原先好像删除的表信息了。多试几遍,用Hadoop命令直接删除文件系统上的hive仓库里的表信息,你就会发现:

hdfs存储空间清理 hdfs删除后空间为啥没变化_hadoop写入mysql更新采访

确确实实,你把hdfs文件系统上的hive仓库里的这个表删除了,但是,mysql里的元数据信息你没有删,所以,当你去hive命令行里查这个表的时候,它任然是存在的,所以这个时候hdfs上已经没有这个东西了,所以你不能直接这样装载数据,而且确实这个表的所有数据已经被清楚了,只有MySQL里有这个表的元数据信息,这个时候,你只能通过在hive命令行里往这个表里加数据或者更改表信息。然后你在hive命令行操作的时候,mysql的元数据信息会被映射回来。根据映射回来的表结构,你可以再插入数据。因为,MySQL的元数据信息是指向hdfs的hive数仓的,所以,当你再次插入信息的时候,数据就会按照MySQL的元素据信息,再次存储到hdfs上。

hdfs文件系统里删除hive数仓里的表:

hdfs存储空间清理 hdfs删除后空间为啥没变化_元数据_02

元数据仍然在:

hdfs存储空间清理 hdfs删除后空间为啥没变化_hive_03

表数据确实被清除:

hdfs存储空间清理 hdfs删除后空间为啥没变化_元数据_04

再次插入数据:

hdfs存储空间清理 hdfs删除后空间为啥没变化_hive_05

会按照元数据的表结构信息,插入成功

查看hdfs文件系统,被删除的表再次出现:

hdfs存储空间清理 hdfs删除后空间为啥没变化_数据_06

这个时候就能继续使用hdfs命令往hive数据仓库里的这张表里装载数据了

想写个博客为什么删除存储在Hadoop上的hive数据后MySQL里存储的相关教程