hbase shell修改数据 hbase可以修改数据吗

关注 mob6454cc667b1d

文章目录

Hbase简介
hbase中的数据怎么实现修改
合并时机：
大合并和小合并
合并region操作 (shell)
拆分

hbase shell修改数据 hbase可以修改数据吗

转载

mob6454cc667b1d 2023-09-01 10:56:52

文章标签 hbase shell修改数据 hbase 大数据数据 hdfs 文章分类 Hbase 数据库

Hbase简介

HBase 是一个构建在 Hadoop 文件系统之上的面向列的数据库管理系统。

Hbase 的表具有以下特点：

容量大：一个表可以有数十亿行，上百万列；
面向列：数据是按照列存储，每一列都单独存放，数据即索引，在查询时可以只访问指定列的数据，有效地降低了
	   系统的 I/O 负担；
稀疏性：空 (null) 列并不占用存储空间，表可以设计的非常稀疏 ；
数据多版本：每个单元中的数据可以有多个版本，按照时间戳排序，新的数据在最上面；
存储类型：所有数据的底层存储格式都是字节数组 (byte[])。

hbase中的数据怎么实现修改

hbase中的数据存储在hdfs中，而hdfs中的数据是不支持修改的，那hbase中的修改数据、delete等操作是怎么实现的呢？

hbase shell修改数据 hbase可以修改数据吗_hbase shell修改数据

如上图，客户端进行删除操作时，会往hdfs中的hfile文件中追加数据，数据中会记录用户的操作delete，为墓碑标记(标记着数据要删除)，在下次获取该数据时，会发现有两个该数据，其中一条有墓碑标记，则不会返回客户端数据。

之后会将原来的数据和用户删除后生成的记录合并生成一个新的hfile文件。和hdfs不支持数据修改的是不相违背的，hbase实现修改是向文件后进行追加，再进行合并完成修改。

合并时机：

1、有大量的更新数据操作

hbase shell修改数据 hbase可以修改数据吗_hdfs_02

2、有大量的小文件（列族太多，内存小）

3、TTL(有过期数据)

大合并和小合并

大合并是合并region，region在HDFS中对应一个文件夹，region的合并会涉及整个文件夹下的大量Hfile文件的合并，非常耗费资源；小合并是合并Hfile文件，将一个文件夹下的多个Hfile文件合并为一个Hfile文件

合并region操作 (shell)

merge_region ‘region_name’,‘region_name’

拆分

随着数据的增加，一个region管理的数据会越来越多，如果出现大量的查询此region数据的请求，那么这个region所在的RegionServer会出现并发热点问题，则需要拆分region。

缺点：拆分后要解决热点问题，实现负载均衡，就需要将拆分后的region移动到其他RegionServer上，拆分后的region会在Hdfs生成新的文件夹，其中会有很多的hfile文件，移动region和hdfs交互，会占用大量的IO资源。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：java 序列化技术 java序列化机制

下一篇：hadoop spark大数据巨量分析 hadoop能做大数据分析

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册