Apache HBase简介:


Apache HBase™是Hadoop数据库,这是一个分布式,可扩展的大数据存储。

当您需要随机,实时读取/写入您的大数据时使用Apache HBase™。该项目的目标是托管非常大的表 - 数十亿行X百万列 - 在商品硬件集群上。Apache HBase是一个开源的,分布式的,版本化的非关系数据库,其模型是在Chang等人的Google的BigTable: 结构化数据的分布式存储系统之后建立的。就像Bigtable利用Google文件系统提供的分布式数据存储一样,Apache HBase在Hadoop和HDFS之上提供了类似Bigtable的功能。


HBase特征:

  • 线性和模块化的可扩展性。
  • 严格一致的读取和写入。
  • 自动和可配置的表分片
  • 区域服务器之间的自动故障转移支持。
  • 方便的基类,用于使用Apache HBase表来支持Hadoop MapReduce作业。
  • 易于使用Java API进行客户端访问。
  • 阻止缓存和布隆过滤器进行实时查询。
  • 通过服务器端过滤器查询谓词下推
  • Thrift网关和支持XML,Protobuf和二进制数据编码选项的REST-ful Web服务
  • 基于可扩展jruby(JIRB)外壳
  • 支持通过Hadoop指标子系统将度量标准导出到文件或Ganglia; 或通过JMX


下载安装版本选择

个人开发个生产环境中使用的是 :hbase-1.2.0-cdh5.7.0(版本可以自由选择,个人版本仅供参考)

1. 使用xhell上传到我们的centos中

2.解压

tar -zxvf  hbase-1.2.0-cdh5.7.0.tar.gz

3.配置Hbase的环境

hbase中namenode节点 hbase单节点部署_zookeeper

进入解压好的Hbase-1.2.0-cdh5.7.0/conf目录下

hbase中namenode节点 hbase单节点部署_zookeeper_02

vim hbase-env.sh

1.配置HBase的java环境

hbase中namenode节点 hbase单节点部署_Apache_03

2.配置HBase的日志目录

hbase中namenode节点 hbase单节点部署_zookeeper_04

3.配置使用自带的Zookeeper,还是自己提供的zookeeper(我使用的是自己安装的zookeeper,配置为false)

hbase中namenode节点 hbase单节点部署_Hadoop_05


然后就是vim hbase-site.xml

hbase中namenode节点 hbase单节点部署_hbase中namenode节点_06

1.配置是hbase存储在hadoop的hdfs的位置

2.Hbase的运行模式。false是单机模式,true是分布式模式。若为false,Hbase和Zookeeper会运行在同一个JVM里面。

默认: false

3:使用我们自己配置的zookeeper的地址

hadoop是我的hostname,如果你也是在同一台机器上安装的话也可以使用hostname.


regionservers 是配置分布式的从节点地址 我们单节点不用配置


然后回到我们的bin目录下

1.保证zookeeper的进程已经启动

2.hadoop已经启动

hbase中namenode节点 hbase单节点部署_zookeeper_07



HMaster和HRegionServer是Hbase的二个子进程,如果没有起来或者缺少的话去我们配置的logs查看错误信息。

hbase中namenode节点 hbase单节点部署_Hadoop_08

进程启动ok,可以验证ui界面 

ip+60010端口

hbase中namenode节点 hbase单节点部署_hbase中namenode节点_09

好了,安装到此结束,希望小伙伴都可以安装ok。