1. Hive整合HBase原理
Hive与HBase整合的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠Hive安装包
lib/hive-hbase-handler-0.13.0.jar工具类,它负责Hbase和Hive进行通信的。
Hive和HBase通信原理如下图:
2. Hive的安装
假设这里已经完成hive的安装,下面需要考虑相关的jar包
(1)考虑jar包
#删除$HIVA_HOME/lib目录下的的Zookeeper的jar包
rm -rf $HIVE_HOME/lib/zookeeper*
#拷贝生产环境下的Zookeeper的jar包到$HIVA_HOME/lib目录下
cp $ZOOKEEPER_HOME/zookeeper-3.4.6.jar $HIVA_HOME/lib
3、创建HBase表,将数据添加到HBase表中
4、创建HBase表映射的Hive表
5、在Hive下访问Hbase的表
(1) 编写Mapreduce,读取每行数据然后保存HBase
(2) 让Hive操作HBase表的数据
(3) Hive统计分析HBase表的数据,分析用户访客行为
3、查看hbase中的数据
3.1 全表查看
scan 'UserVisitInfo'
3.2 根据rowkey查看
4、统计hive分析hbase表的数据
4.1 创建HBase表,将数据添加到HBase表中
UserVisitInfo
4.2 创建HBase表映射的Hive表
(1) 创建表
4.3 使用Hive统计分析