hive架构简述 hive架构组成

转载

mob6454cc7b3ae8 2023-07-14 16:18:56

Hive整体架构：

用户接口：包括CLI，client（jdbc）和web ui

元数据存储：mysql或者derby

解释器、编译器、优化器、执行器

hadoop：用hdfs存储，用mapreduce计算

CLI：shell命令行

client：在client模式下，用户可以通过jdbc或者odbc连接Hive，需要启动Hive Server2/Hive server务（图中的Thrift server）。

Web UI：通过浏览器访问Hive

系统目录(catalog)用于保存Hive中所存储的表的元数据（metadata）信息的服务。metastore包含Database 、Table、Partition （每个分区都有自己的列（columns），SerDe和存储空间（storage））。

Complier：Driver掉用Complier将HiveSQL字符串转化为执行计划（plan），执行计划只有元数据操作和HDFS操作组成。元数据操作只包含DDL语句，HDFS语句只包含LOAD语句。对于插入和查询，执行计划由mapreduce中的DAG组成。

optimizer：优化器，选择最优的执行计划。一般由两种：经验优化器和语义优化器。

Executor：执行器，执行优化的mapredue。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯