hbase为何查询速度快 hbase查询速度快吗

关注柳随风

文章目录

序言
HBASE
HIVE
HBASE与HIVE的应用情况
HBASE作为实施查询，HIVE用于数据清洗
Hive集成Hbase

hbase为何查询速度快 hbase查询速度快吗

转载

柳随风 2023-10-19 12:10:34

文章标签 hbase为何查询速度快 Hbase与Hive Hive 数据 SQL 文章分类 Hbase 数据库

序言

大数据绕不开这2个东西。

Hbase是大数据技术的实时查询数据库（相对于传统数据库，速度和效率肯定要低，但是它是基于大数据的）。
Hive是数据仓库，查询效率更低，因为它的查询都是基于全表扫描（目前已知的是可以把表进行分区，这样不用进行全表扫描，以进行优化），同时造成Hive慢的原因是，它提供的类SQL类工具可以把，任务拆解成MapReduce任务，在不同的HDFS进行计算，然后收集（MapReduce是一种计算框架，目前Flink也宣称可以帮助Hive进行任务拆解和运算cuiyaonan2000@163.com）

HBASE

随机实时查询，如日志明细、交易清单、轨迹行为等。

增加或者更新行，查看一个范围内的cell，获取指定的行，删除指定的行、列或者是列的版本。

每一行的历史数据可以被删除，然后通过Hbase compactions就可以释放出空间)。虽然HBase包括表格，但是schema仅仅被表格和列簇所要求，列不需要schema。Hbase的表格包括增加/计数功能。

适合用来进行大数据的实时查询，例如 Facebook 用 HBase 进行消息和实时的分析。

HIVE

可以将sql语句转换为MapReduce任务进行运行。运行Hive查询会花费很长时间，因为它会默认遍历表中所有的数据。

即离线批量数据进行查询），例如，用来计算趋势或者网站的日志。Hive 不应该用来进行实时的查询（Hive 的设计目的，也不是支持实时的查询）

HBASE与HIVE的应用情况

HBASE作为实施查询，HIVE用于数据清洗

通过ETL工具将数据源抽取到HDFS存储；
通过Hive清洗、处理和计算原始数据；
HIve清洗处理后的结果，如果是面向海量数据随机查询场景的可存入Hbase
数据应用从HBase查询数据；

hbase为何查询速度快 hbase查询速度快吗_数据

Hive集成Hbase

HBase 本身只提供了 Java 的 API 接口，并不直接支持 SQL 的语句查询。Hive 则可以直接使用 HQL（一种类SQL 语言）。

如果想要在 HBase 上使用 SQL，则需要联合使用 Apache Phonenix，或者联合使用 Hive 和HBase。

如果集成使用 Hive 查询 HBase 的数据，则无法绕过 MapReduce，那么实时性还是有一定的损失。

Phoenix 加 HBase 的组合则不经过 MapReduce 的框架，因此当使用 Phoneix 加 HBase 的组成，实时性上会优于 Hive 加 HBase 的组合。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：IOS 开发设置文件共享 apple文件共享

下一篇：vscode android打包apk vs code 打包

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册