目录什么是 Hive?Hive 本质Hive 架构原理Hive安装部署(重要)安装 Hive启动并使用 Hive安装MySQL配置 Hive 元数据存储到 MySQLDDL(Data Definition Language)数据定义创建数据库查询数据库展示所有数据库查看数据库信息修改数据库删除数据库切换当前数据库表(table)创建表普通建表Create Table As Select(CTAS
转载 2023-10-09 10:46:16
107阅读
 基本数据类型... 3查看所有函数... 3搜索函数... 3搜索表... 4查看函数使用方法... 4关键字补全... 4显示表头... 4SET环境变量... 5查看建表语句、数据文件置... 5执行外部命令... 6NVL. 6CONCAT. 7IF. 7CASE. 8TRIM.. 9SUBSTRING.. 10LENGTH.. 11UPPER. 11非空判断... 11LPAD
转载 2023-07-04 21:46:34
84阅读
1、hive简介hive是基于Hadoop的一个数据仓库工具,用于分析数据的。可以将结构化数据文件映射为一张数据库表,并提供类SQL查询功能注:hive-SQL or HQL or类SQL 和标准SQL还是有一点点区别的本质是SQL转换为MapReduce程序 用途:用来做离线数据分析,比直接用MapReduce开发效率更高为什么说hive是基于Hadoop的呢? 作为数据仓库软件,应该要具备存储
转载 2023-08-12 18:18:05
144阅读
引语大数据开发之路漫漫其修远兮,吾将上下而求索。很多入门大数据的小伙伴,可能第一个接触到的,就是一只可爱的“小象”,也就是我们的大数据领域的数据仓库工具hive。这只小象给我们提供了方便类SQL查询语言HQL来操纵数据,使得我们一开始不用编写复杂的代码,就可以轻松的探索数据。Hive对于熟悉传统数据库的同学来说,算是很友好的一个入门工具。 原理在大数据生态中,hive一般作为数据仓库来使
大数据开发-hive(入门篇)一、环境准备安装好对应版本的hadoop集群安装mysql服务二、知识要点1. Hive是什么1.1 hive的概念Hive:由Facebook开源,用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将Hive SQL转化成MapReduce程序1.2 Hive与数据库的
转载 2023-09-15 09:10:07
46阅读
HIVE是什么 来自度娘百科的解释:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
转载 2023-09-15 21:56:59
62阅读
1.1、Hive简介什么是HiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚至更进一步可以说hive就是一个MapReduce的客户端为什么使用Hive直接使用had
转载 2023-09-13 14:40:40
60阅读
一、Hive概述        Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据表,并提供类似于SQL(HiveSQL)的操作功能。在Hive中,本质上是将SQL转换成为MapReduce程序。二、1、建表语句CREATE TABLE `app.app_test`( `data_dt` string COMMENT '时
转载 2023-08-19 00:04:03
98阅读
大数据开发之Apache Hive1.概述Apache Hive 是一款建立在hadoop生态之上的开源数据仓库系统,可以把储存在Hadoop文件中结构化,半结构化得到数据文件映射成一张数据库表,然后基于数据库表提供一种类似SQL的查询模型,也叫Hive 查询语言 ,简称HQL;然后是Hive 的核心就是把HQL转化成MapReduce 程序,然后把转化后的 MapReduce 程序提交到Hado
转载 2023-11-02 08:52:15
65阅读
这次来讲讲Hive小白常见的坑。首先成功搭建Hadoop集群 一、Hivehive的版本号要求是很高的。对以后的spark on hivehive on spark 都有关系 所以请严格参照cloudera的CDH版本对照表,大神无视啦~~~并不是越新就肯定越好,具体看公司上层的决定最好能所有集群同步一个版本。1 hive是什么?简单点来说,hive就是建立在hadoop生
转载 2024-03-08 12:37:57
38阅读
Hive进行UDAF开发,相对要比UDF复杂一些,不过也不是很难。 请看一个例子package org.hrj.hive.udf;import org.apache.hadoop.hive.ql.exec.UDAFEvaluator;import org.apache.hadoop.hive.serde2.io.DoubleWritable; public class UDAFSum_Sampl
原创 2010-09-01 17:07:19
4850阅读
修改Log4J属性可以修改$HIVE_HOME/conf目录下的Log4J配置文件来配置日志。也可以临时改变日志配置而无需拷贝和修改Log4J文件。在Hive Shell启动时可以通过hiveconf参数制定log4j.properties文件中的任意属性。...
原创 2022-04-22 15:45:36
208阅读
hive中UDF的使用
原创 2021-07-12 16:45:59
1699阅读
## Spring Hive开发简介 在大数据时代,Apache Hive作为一个数据仓库工具,允许对存储在Hadoop中的大数据进行查询和分析。结合Spring框架,可以通过Spring Hive实现更高效的数据处理。本文将介绍如何在Spring项目中使用Hive,包括核心概念、设置步骤和代码示例。 ### 1. Hive基础概念 Hive是构建在Hadoop之上的数据分析工具,它将复杂的
原创 2024-08-17 04:57:32
28阅读
# Hive开发流程详解 Hive是一个建立在Hadoop之上的数据仓库工具,可以方便地进行数据的存储、查询和分析。在实际开发过程中,我们可以按照一定的流程进行Hive开发,以保证数据处理的高效性和准确性。本文将介绍Hive开发的流程,并结合代码示例进行详细说明。 ## Hive开发流程 Hive开发流程通常包括以下几个步骤: 1. 创建Hive表 2. 加载数据到Hive表 3. 编写H
原创 2024-05-02 06:07:48
42阅读
# Hive开发 IDEA ## 简介 Hive是一个基于Hadoop的数据仓库架构,它提供了类似于SQL的查询语言HiveQL,可以让用户将数据存储在Hadoop分布式文件系统(HDFS)上,并进行高效的查询和分析。本文将介绍如何在IDEA中进行Hive开发,并提供一些代码示例来帮助读者入门。 ## 准备工作 在开始Hive开发之前,需要确保已经安装了Java和Hive。可以从官方网站[
原创 2023-07-23 04:06:32
123阅读
## Hive UDF开发入门 在Hive中,用户定义函数(User-Defined Function,简称UDF)是一种非常有用的功能。通过编写自己的UDF,我们可以扩展Hive的功能,实现更加灵活和定制化的数据处理。 ### 1. 什么是Hive UDF? Hive是一个基于Hadoop的数据仓库工具,用于处理大规模结构化数据。Hive使用类似于SQL的查询语言HiveQL来操作数据。H
原创 2023-07-23 04:15:16
208阅读
    Hive进行UDF开发十分简单,此处所说UDF为Temporary的function,所以需要hive版本在0.4.0以上才可以。     Hive的UDF开发只需要重构UDF类的evaluate函数即可。例:package com.hrj.hive.udf;import org.apache.hadoop.hive.ql.ex
原创 2010-09-01 17:04:23
6671阅读
转载请注明出处:https://blog.csdn.net/l1028386804/article/details/88524593修改Log4J属性可以修改$HIVE_HOME/conf目录下的Log4J配置文件来配置日志。也可以临时改变日志配置而无需拷贝和修改Log4J文件。在Hive Shell启动时可以通过hiveconf参数制定log4j.properties文件中的任意属性。...
原创 2019-03-13 09:23:07
102阅读
Hive中自定义聚合函数udaf的使用
原创 2021-07-12 16:45:56
610阅读
  • 1
  • 2
  • 3
  • 4
  • 5