hbase 集群迁移到hive 集群怎么操作 hbase跨集群数据迁移

转载

mob64ca13f8b166 2023-09-07 10:12:18

文章标签 数据元数据数据目录 文章分类 Hbase 数据库

云湖湖导读：

HBase是一个结构化数据的分布式存储系统，在Hadoop之上提供了类似于Bigtable的能力。笔者做为资深HBase研发人员，面对不同的业务场景有不同的实用技巧，今天我们将基于HBase集群恢复与迁移展开分享：

1、HBase 2.X版本的元数据修复及一种数据迁移方式

2、一种全量+增量数据的迁移方法

HBase 2.X版本的元数据修复及一种数据迁移方式

1.1

背景

在HBase 1.x中，经常会遇到元数据不一致的情况，这个时候使用HBCK的命令，可以快速修复元数据，让集群恢复正常。

另外HBase数据迁移时，大家经常使用到一种迁移方式是：拷贝HBase的数据目录/hbase/data/default到新的集群，然后在新集群执行HBCK的命令让元数据重建，这种拷贝数据目录然后恢复元数据的方式是一种快速直接的手段。

HBase升级到2.X版本之后，hbase hbck中的一些修复命令已经不再支持，包括，所以在HBase遇到集群故障，无法通过HBCK快速把元数据修复，通过HBase数据目录迁移的方式也就使用不了。

在HBase 2.X的客户端执行hbase hbck时，常用的fixMeta命令已经不再支持。

hbase 集群迁移到hive 集群怎么操作 hbase跨集群数据迁移_数据目录

1.2

hck-1无法使用

HBase 2.X版本加强了可靠性，因为使用了 procedure，由于之前的hbck(hbck-1)是会直接去向region server或者hdfs发送请求进行修复，而在HBase 2.0版本上集群内部操作全部都被挪到了procedure v2(下文都称为procedure)上进行处理。

因为所有的命令都是经过master来协调处理，所以在修复时也需要通过master进行修复。否则反而可能导致更严重的不一致问题。所以hbck-1在HBase 2.x版本是不适用的。

1.3

HBase2.X版本中元数据的恢复方法

修改配置hbase.assignment.skip.empty.regions=false；

如果是普通的hbase:meta系统表中的元数据不正确，在修改完此参数重启HBase后就已经能恢复。

当第一步骤完成后还不能修复，就要使用下面的命令了。

例如启动后发现，hbase shell能list出数据，但是表无法put或者scan，这时候hbase:meta表里的t1表记录其实是不正确的；

hbaseorg.apache.hadoop.hbase.util.hbck.OfflineMetaRepair -fix

这个命令需要停止HBase然后执行。

当表的数据目录存在(/hbase/data/default/

执行完成后，启动HBase。

启动完成后，查看hbase:meta表的用户表记录，可以看到t1表的元数据都生成了。

hbase 集群迁移到hive 集群怎么操作 hbase跨集群数据迁移_元数据_02

1.4

新集群清理及数据迁移

看完上面的元数据恢复，应该就知道接下来的这种HBase数据迁移方式的原理：通过拷贝数据目录，让HBase元数据与业务数据目录重新建立关系，达到业务正常读写。

下面例子只考虑用户使用default命名空间

拷贝旧集群的HBase数据目录到新集群，将旧集群的/hbase/data/default目录拷贝到了hdfs上的/mydata/目录；

如果新集群数据不需要清理，则跳过此步骤。

停止HBase；

清除HBase在数据存储目录，hdfs dfs -rm -r /hbase；

清除HBase在zk的节点，使用ZK客户端工具zkCli.sh –server :2181 进入后执行deleteall /hbase；

启动HBase,让目录结构自动生成；

保持HBase集群停止状态，拷贝旧机器数据目录到新集群HBase的数据目录中；

hdfs dfs -cp /mydata/default/* /hbase/data/default/

执行hbase修复命令hbase org.apache.hadoop.hbase.util.hbck.OfflineMetaRepair –fix；

设置hbase.assignment.skip.empty.regions=false并启动HBase；

运行完上述步骤，在新的集群就能对迁移过来的HBase进行业务访问了。

一种全量+增量数据的迁移方法

2.1

背景

在HBase使用过程中，使用的HBase集群经常会因为某些原因需要数据迁移。大多数情况下，可以跟用户协商用离线的方式进行迁移，迁移离线数据的方式就比较容易了，将整个hbase的data存储目录进行搬迁就行，但是当集群数据量比较多的时候，文件拷贝的时间很长，对客户的业务影响时间也比较长，往往在客户给的时间窗口无法完成，本文给出一种迁移思路，可以利用HBase自身的功能，对集群进行迁移，减少集群业务中断时间。

2.2

简介

大家都知道HBase有snapshot快照的功能，利用快照可以记录某个时间点表的数据将其保存快照，在需要的时候可以将表数据恢复到打快照时间时的样子。我们利用hbase的snapshot可以导出某个时间点的全量数据。

因为用户的业务还在不停的写入表中，除了迁移快照时间点之前的全量数据，我们还需要将快照时间点后源源不断的增量数据也迁移走，这里如果能采用双写的方式，将数据写入两个集群就好了，但是用户的业务不会这样做，如果这样做还得保证双写的事务一致性。于是可以利用HBase的replication功能，replication功能本身就是保留了源集群的WAL日志记录，去回放写入到目的集群，这样一来用户业务端->原始集群->目的集群便是个串形的数据流，且由HBase来保证数据的正确性。

所以这个迁移的方法就是利用snapshot迁移全量数据，利用replication迁移增量数据。

2.3

迁移步骤

hbase 集群迁移到hive 集群怎么操作 hbase跨集群数据迁移_数据_03