认识 HiveHive 是基于 Hadoop 构建一套数据仓库分析系统,它提供了丰富 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中数据, 可以将结构化数据文件映射为一张数据库表,并提供完整 SQL 查询功能,可以将 SQL 语句转换为 MapReduce 任务进行运行,通过自己 SQL 去 查询分析需要内容,这套 SQL 简称 Hive SQL,使不熟悉 MapRed
写一下Hive源码中执行SQLSELECT语句简单执行流程,手头没有具体环境进调试模式,只根据源码写写大概处理流程。总体上从beeline脚本执行,调用了类Beeline.java,将终端命令读入后通过rpc发送给driver处理。driver调用SemanticAnalyzer将SQL语句编译为可以执行tasks,然后给每个task创建一个线程执行,在task中调用Tez等并行框架处
转载 2023-05-30 16:34:21
1348阅读
本节结构采用宏观着眼,微观入手,从整体到细节方式剖析 Hive SQL 底层原理。第一节先介绍 Hive 底层整体执行流程,然后第二节介绍执行流程中 SQL 编译成 MapReduce 过程,第三节剖析 SQL 编译成 MapReduce 具体实现原理。Hive 底层执行架构我们先来看下 Hive 底层执行架构图, Hive 主要组件与 Hadoop 交互过程:Hive底层执行架构
目录0-前言1-查看SQL执行计划1.1-explain用法2-explain使用场景2.1-join 语句会过滤 null 值吗?2.2-group by 分组语句会进行排序吗?2.3-哪条sql执行效率高呢?3-explain dependency用法3.1-识别看似等价代码3.2-识别SQL读取数据范围差别4-explain authorization 用法5-总结 0-前言
目前工作需要在公司平台上通过hive导出数据,定时任务权限没有开放给我,所以只能每天手动导,手动导数时又要天天手工改日期,很麻烦,所以想要where子句能够每天自动有对应日期。以上是前提,有太多槽点,请忽略。 首先,要思考是日期字段数据类型,以及hive是否也有隐式转换     参考这篇文章        
转载 2023-09-18 21:28:17
145阅读
# Hive 批量执行SQL脚本实现流程 ## 引言 在Hive中,我们可以使用SQL语句来操作和管理大规模数据。有时候,我们需要批量执行一系列SQL脚本,以便快速地处理数据。本文将介绍如何使用Hive来批量执行SQL脚本,并提供详细代码示例和解释。 ## 步骤概览 下面是实现Hive批量执行SQL脚本步骤概览: | 步骤 | 描述 | | --- | --- | | 步骤一 | 创
原创 9月前
216阅读
# 如何执行本地SQL脚本 ## 简介 在Hive执行本地SQL脚本是非常常见需求。本文将指导你如何在Hive中实现这一功能。我们将使用Hive命令行接口和Shell脚本来完成任务。 ## 步骤概览 下表展示了执行本地SQL脚本整个流程。在接下来内容中,我们将逐步解释每个步骤。 | 步骤 | 描述 | | ---- | ---- | | 步骤 1 | 创建一个本地SQL脚本文件 |
原创 8月前
162阅读
# 实现Hive并行执行SQL脚本 作为一名经验丰富开发者,我将向你介绍如何实现Hive并行执行SQL脚本。下面将展示整个流程步骤,并提供每一步需要做什么以及相关代码注释。 ## 流程步骤 | 步骤 | 描述 | | --- | --- | | 1 | 创建一个包含所有要执行SQL脚本目录 | | 2 | 使用Hive`beeline`命令行工具连接到Hive服务器 | | 3
原创 2023-07-31 17:22:56
352阅读
# 使用 Hive Beeline 执行 SQL 脚本 ## 流程概述 下面是使用 Hive Beeline 执行 SQL 脚本整体流程: | 步骤 | 描述 | | --- | --- | | 1 | 连接到 Hive 服务器 | | 2 | 设置数据库 | | 3 | 执行 SQL 脚本 | | 4 | 断开与 Hive 服务器连接 | 接下来,我们将逐步介绍每个步骤需要做什么以及
原创 11月前
382阅读
HiveUDAF与UDTF函数hive UDF函数说明1、用户定义函数 UDF (一进一出) 2、用户定义聚集函数 UDAF (多进一出) 3、用户定义表生成函数UDTF (一进多出)UDF函数作用于单个数据行,并且产生一个数据行作为输出,大多数函数都属于UDF,比如数学函数、日期函数、字符函数等。 UDAF函数作用于多个输入行,并且产生一个输出数据行。比如group by后count、
转载 2023-07-21 16:24:00
189阅读
1.“-e”不进入hive交互窗口执行sql语句$ bin/hive -e "select id from student;"2.“-f”执行脚本sql语句 (1)在/opt/module/datas目录下创建hivef.sql文件[hadoop@master datas]$ touch hivef.sql 文件中写入正确sql语句 select *from student; (2)执行文件
转载 2023-07-31 09:35:52
118阅读
spark sql整合hive在spark sql中使用hive元数据spark sql是使用spark进行计算hive使用MR进行计算1、在hivehive-site.xml修改一行配置,增加了这一行配置之后,以后在使用hive之前都需要先启动元数据服务cd /usr/local/soft/hive-1.2.1/conf/<property> <name>hiv
# Hive执行SQL脚本传入参数 在Hive中,我们可以通过执行SQL脚本来操作数据,但有时候我们需要传入参数来动态地执行脚本。本文将介绍如何在Hive执行SQL脚本并传入参数,以及代码示例和流程图作为辅助。 ## 为什么需要传入参数 在实际数据处理中,我们经常需要根据不同条件或需求来执行不同SQL脚本,这时就需要传入参数来实现动态执行。通过传入参数,我们可以提高代码灵活性和复
原创 5月前
253阅读
# Hive SQL 重复执行一段 SQL 脚本实现方法 作为一名经验丰富开发者,我经常被问到如何实现在 Hive 中重复执行一段 SQL 脚本。今天,我将通过这篇文章,详细地向刚入行小白们介绍这一过程。 ## 1. 准备工作 在开始之前,我们需要确保已经安装了 Hive,并且能够正常连接到 Hive 服务器。此外,我们还需要准备好要执行 SQL 脚本。 ## 2. 流程概述 下
原创 1月前
16阅读
hive 2.1 hive执行sql有两种方式:执行hive命令,又细分为hive -e,hive -f,hive交互式;执行beeline命令,beeline会连接远程thrift server;下面分别看这些场景下sql是怎样被执行:1 hive命令启动命令启动hive客户端命令$HIVE_HOME/bin/hive等价于$HIVE_HOME/bin/hive --service
转载 2023-08-31 20:20:20
891阅读
hivef:hive 执行 sql 文件 hivef:hive 执行 sql 文件#!/bin/bash yesterday=`date -d -1days '+%Y-%m-%d'` today=`date '+%Y-%m-%d'` tomarrow=`date -d 1days '+%Y-%m-%d'` #echo "从外部只传递两个参数时,第一个
转载 2023-06-06 22:13:33
402阅读
背景Hive 有丰富内置函数,方便数据处理和数据分析。但是有些时候无法满足需求,这时就需要自定义函数(User-Defined Functions , UDF)来扩展 Hive 函数库,实现用户想要功能。 UDF 开发编写 UDF 函数需要下面两个步骤:继承 org.apache.hadoop.hive.ql.exec.UDF实现 evaluate 函数,这个函数必须要有返回值,不能设置为vo
转载 2023-07-17 22:39:09
97阅读
一、前言二、SQL执行计划2.1 explain 用法2.2 explain 使用场景  案例一:join 语句会过滤 null 值吗?  案例二:group by 分组语句会进行排序吗?  案例三:哪条sql执行效率高呢?  案例四:定位产生数据倾斜代码段2.3 explain dependency用法  案例一:识别看似等价代码&
一、hive简介hive是基于Hadoop一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中大规模数据机制。hive可以将结构化数据文件映射为一张数据库表,并提供完整SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己SQL查询分析需要内容,这套SQL简称Hive SQL。二、hive sqlsql区别其实不同
转载 2023-07-04 14:57:02
171阅读
Hive介绍Hive概述Hive是基于Hadoop一个数据仓库工具。可以键结构化数据文件映射为一张表,并提供完整sql查询功能,可以将sql语句转换为MapReduce任务进行。其优点是学习成本低,可以通过类SQL语句快速实现MapReduce统计,不必开发专门MapReduce应用,十分适合数据仓库统计分析。 Hive是建立在Hadoop上数据仓库基础构架。它提供了一系列工具,可以
转载 2023-09-08 12:37:30
196阅读
  • 1
  • 2
  • 3
  • 4
  • 5