hbase 3 级寻址

原创

mob64ca12f49f4b 2024-07-08 03:25:53 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12f49f4b的原创作品，请联系作者获取转载授权，否则将追究法律责任

HBase 3级寻址

HBase是一个开源的、分布式的、面向列的NoSQL数据库系统，它构建在Hadoop之上。在HBase中，数据是以行键（Row Key）的形式存储的，可以通过行键快速检索数据。HBase的存储模型采用了“三级寻址”的设计，这种设计提高了数据的访问效率。

三级寻址

HBase的“三级寻址”是指在HBase中，数据的物理存储是以块（Block）的形式存储的。每个块的大小是固定的，通常为64KB。在HBase中，数据是按照块的形式存储在HDFS（Hadoop分布式文件系统）上的。当需要访问某个数据时，HBase首先通过行键计算出该数据所在的块的位置，然后根据块的位置，再找到块内的偏移位置，最终找到具体的数据。

代码示例

下面是一个简单的Java代码示例，演示了如何在HBase中通过行键获取数据：

Configuration config = HBaseConfiguration.create();
Connection connection = ConnectionFactory.createConnection(config);
TableName tableName = TableName.valueOf("my_table");
Table table = connection.getTable(tableName);

Get get = new Get(Bytes.toBytes("row_key"));
Result result = table.get(get);

for(Cell cell : result.rawCells()) {
    byte[] family = CellUtil.cloneFamily(cell);
    byte[] qualifier = CellUtil.cloneQualifier(cell);
    byte[] value = CellUtil.cloneValue(cell);
    System.out.println("Family: " + Bytes.toString(family) + ", Qualifier: " + Bytes.toString(qualifier) +
            ", Value: " + Bytes.toString(value));
}

table.close();
connection.close();

在上面的代码中，首先创建了一个HBase的配置对象，然后通过ConnectionFactory创建了一个连接对象。接着指定了要访问的表名，并通过行键创建了一个Get对象。通过getTable方法获取表对象，然后通过get方法获取数据，并遍历结果集，打印出数据的行键、列族、列限定符和值。

旅行图

下面使用mermaid语法中的journey标识出旅行图：

journey
    title HBase数据访问之旅
    section 获取数据
        HBase用户 -> HBase: 发起数据请求
        HBase -> HDFS: 查询数据块位置
        HDFS -> HBase: 返回数据块位置
        HBase -> HDFS: 读取数据块
        HDFS -> HBase: 返回数据块
        HBase -> 用户: 返回数据

类图

下面使用mermaid语法中的classDiagram标识出类图：

classDiagram
    class Configuration
    class Connection
    class TableName
    class Table
    class Get
    class Result
    class Cell
    Configuration <|-- Connection
    Connection "1" *-- "1" TableName
    Connection *-- Table
    Table "1" *-- "1" Get
    Table *-- Result
    Result "1" *-- "1" Cell