Apache HBase简介:
Apache HBase™是Hadoop数据库,这是一个分布式,可扩展的大数据存储。
当您需要随机,实时读取/写入您的大数据时使用Apache HBase™。该项目的目标是托管非常大的表 - 数十亿行X百万列 - 在商品硬件集群上。Apache HBase是一个开源的,分布式的,版本化的非关系数据库,其模型是在Chang等人的Google的BigTable: 结构化数据的分布式存储系统之后建立的。就像Bigtable利用Google文件系统提供的分布式数据存储一样,Apache HBase在Hadoop和HDFS之上提供了类似Bigtable的功能。
HBase特征:
- 线性和模块化的可扩展性。
- 严格一致的读取和写入。
- 自动和可配置的表分片
- 区域服务器之间的自动故障转移支持。
- 方便的基类,用于使用Apache HBase表来支持Hadoop MapReduce作业。
- 易于使用Java API进行客户端访问。
- 阻止缓存和布隆过滤器进行实时查询。
- 通过服务器端过滤器查询谓词下推
- Thrift网关和支持XML,Protobuf和二进制数据编码选项的REST-ful Web服务
- 基于可扩展jruby(JIRB)外壳
- 支持通过Hadoop指标子系统将度量标准导出到文件或Ganglia; 或通过JMX
下载安装版本选择
个人开发个生产环境中使用的是 :hbase-1.2.0-cdh5.7.0(版本可以自由选择,个人版本仅供参考)
1. 使用xhell上传到我们的centos中
2.解压
tar -zxvf hbase-1.2.0-cdh5.7.0.tar.gz
3.配置Hbase的环境
进入解压好的Hbase-1.2.0-cdh5.7.0/conf目录下
vim hbase-env.sh
1.配置HBase的java环境
2.配置HBase的日志目录
3.配置使用自带的Zookeeper,还是自己提供的zookeeper(我使用的是自己安装的zookeeper,配置为false)
然后就是vim hbase-site.xml
1.配置是hbase存储在hadoop的hdfs的位置
2.Hbase的运行模式。false是单机模式,true是分布式模式。若为false,Hbase和Zookeeper会运行在同一个JVM里面。
默认: false
3:使用我们自己配置的zookeeper的地址
hadoop是我的hostname,如果你也是在同一台机器上安装的话也可以使用hostname.
regionservers 是配置分布式的从节点地址 我们单节点不用配置
然后回到我们的bin目录下
1.保证zookeeper的进程已经启动
2.hadoop已经启动
HMaster和HRegionServer是Hbase的二个子进程,如果没有起来或者缺少的话去我们配置的logs查看错误信息。
进程启动ok,可以验证ui界面
ip+60010端口
好了,安装到此结束,希望小伙伴都可以安装ok。