hbase是如何根据行键进行分片的

转载

网猴儿 2024-09-13 20:33:18

HBase - Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可以在廉价的PC SERVER上搭建大规模结构化数据存储的集群。

HBase利用Hadoop HDFS 作为其文件存储系统，利用Hadoop Mapreduce来处理HBase中的海量数据，利用Zookeeper作为协调工具。

可以单独运行，也可以与mapreduce关联使用，且必须依赖zookeeper

hbase是如何根据行键进行分片的_Hadoop

hbase是如何根据行键进行分片的_hbase是如何根据行键进行分片的_02

hbase是如何根据行键进行分片的_zookeeper_03

hbase是如何根据行键进行分片的_hbase是如何根据行键进行分片的_04

hbase是如何根据行键进行分片的_hbase是如何根据行键进行分片的_05

行键具有唯一性；

列没有必要提前写好

没有写数据的区域不会占据物理空间

hbase是如何根据行键进行分片的_hbase_06

行键：

字符串、整数、二进制串甚至串行化的结构都可以作为行键

表按照行键的“逐字节排序”顺序对行进行有序化处理

列族：

表中至少有一个列族

“族：标签”其中，族和标签都可为任意形式的串

物理上将通“族”数据存储在一起

hbase是如何根据行键进行分片的_hbase是如何根据行键进行分片的_07

hbase是如何根据行键进行分片的_zookeeper_08

hbase是如何根据行键进行分片的_hbase是如何根据行键进行分片的_09

角色	作用
client	包含访问hbase的接口，client维护者一些cache来加快对hbase的访问，比如region的位置信息
zookeeper	保证任何时候，集群中只有一个runningmaster；存贮所有region的寻址入口；实时监控region server的状态，将其上下线信息实时通知给master；存储hbase的schema，包括元数据包括有哪些table
master	可以启动多个master，通过zookeeper的master election机制保证总有一个master运行；为regionserver分配region；负责region server的负载均衡；发现失效的region server 并重新分配其上的region
region server	维护master分配给它region，处理region的IO请求；负责切分运行过程中变得过大的region